Перейти к содержанию

gpt-oss-120b

В этой статье

Информация

gpt-oss-120b — это крупномасштабная модель с открытыми весами от OpenAI, разработанная для высокопроизводительных задач, требующих глубоких рассуждений, многошагового планирования и сложного взаимодействия с инструментами. Модель насчитывает 120 миллиардов параметров, из которых активируются около 21 миллиарда за один проход, что обеспечивает баланс между вычислительной мощностью и эффективностью. Благодаря продвинутым методам квантования и оптимизации, gpt-oss-120b может быть развернута на серверном оборудовании с 70 ГБ видеопамяти и выше и поддерживает масштабируемое локальное или гибридное развертывание.

Основные возможности gpt-oss-120b

  • Масштабируемая архитектура с условной активацией: модель содержит 120 миллиардов параметров, но за счёт механизма разреженной активации (sparse activation) задействует лишь ~21 миллиард параметров на запрос, что значительно снижает требования к памяти и вычислительным ресурсам без ущерба для качества.
  • Продвинутые агентские функции: gpt-oss-120b поддерживает расширенный набор инструментов — включая выполнение кода, веб-поиск в реальном времени, вызов API и генерацию строго структурированных выходных данных (JSON, XML и др.). Это делает её идеальной основой для автономных агентов и сложных автоматизированных систем.
  • Адаптивные рассуждения: модель реализует гибкую систему уровней рассуждений — от быстрого прямого ответа до многоэтапной цепочки размышлений (chain-of-thought) и деревьев решений. Пользователь может управлять «глубиной мышления» в зависимости от сложности задачи.
  • Высокая производительность на бенчмарках: gpt-oss-120b демонстрирует результаты, сопоставимые с проприетарными моделями уровня o3 и o4, особенно в задачах, требующих логики, математики, программирования и междисциплинарного синтеза знаний.
  • Широкая мультилингвальная поддержка: модель обучена на данных более чем на 50 языках и способна эффективно работать в многоязычных и мультикультурных контекстах. Для наилучших результатов рекомендуется явно задавать язык и культурные рамки в промпте.
  • Эффективное квантование и совместимость: поддержка форматов MXFP4 и INT4 позволяет значительно сократить объём памяти и ускорить вывод без существенной потери качества. Модель совместима с популярными фреймворками, такими как vLLM, GGUF и Hugging Face Transformers.

Особенности сборки

ID Совместимые ОС VPS BM VGPU GPU Мин. ЦПУ (Ядер) Мин. ОЗУ (Гб) Мин. HDD/SDD (Гб) Доступно
415 Ubuntu 22.04 - - + + 16 128 240 Нет

Технические характеристики сборки:

  • Ubuntu 22.04 с обновлением ядра до 6 версии;
  • Nvidia драйверы последней версии;
  • CUDA Toolkit;
  • Ollama для управления моделями;
  • OpenWebUI для веб-интерфейса.

Особенности установки:

  • Время на установку 35-45 минут вместе с OS;
  • Сервер Ollama загружает и запускает модель gpt-oss-120b в память GPU/RAM;
  • Open WebUI развертывается как веб-приложение, подключенное к серверу Ollama;
  • Пользователи взаимодействуют с моделью через веб-интерфейс Open WebUI для программирования и агентных задач;
  • Все вычисления и обработка кода происходят локально на сервере;
  • Администраторы могут настраивать модель для специфических задач разработки через инструменты OpenWebUI;
  • Поддержка различных уровней квантования для оптимизации использования памяти.

Начало работы после развертывания gpt-oss-120b

После оплаты заказа на указанную при регистрации электронную почту придет уведомление о готовности сервера к работе. В нем будет указан IP-адрес VPS, а также логин и пароль для подключения к серверу и ссылка для доступа к панели OpenWebUI. Управление оборудованием клиенты нашей компании осуществляют в панели управления серверами и APIInvapi.

  • Данные для авторизации для доступа к операционной системе сервера (например по SSH) придут к вам в присланном e-mail.

  • Ссылка для доступа к панели управления Ollama c Open WebUI с веб-интерфейсом: в теге webpanel во вкладке Информация >> Тэги панели управления Invapi. Точная ссылка вида https://gpt-oss<Server_ID_from_Invapi>.hostkey.in приходит в письме, отправляемом при сдаче сервера.

После перехода по ссылке из тега webpanel будет открыто окно авторизации Get started with Open WebUI, где вам необходимо создать имя, электронную почту и пароль администратора чат бота, а затем нажать на кнопку Create Admin Account:

После успешной регистрации откроется главный интерфейс Open WebUI с доступом к Gpt-oss-20b:

Внимание

После регистрации первого пользователя, система автоматически присваивает ему роль администратора. Для обеспечения безопасности и контроля над процессом регистрации, все последующие заявки на регистрацию нужно одобрять в интерфейсе OpenWebUI из аккаунта администратора

Примечание

Подробное описание особенностей работы с панелью управления Ollama c Open WebUI можно найти в статье AI-чат-бот на собственном сервере

Примечание

Для оптимальной работы с моделью gpt-oss-120b рекомендуется использовать GPU с объемом видеопамяти не менее 70 ГБ для модели 120B. Для эффективной обработки длинных контекстов кода и сложных агентных задач рекомендуем использовать GPU с объемом видеопамяти от 80 Гб. Подробная информация по основным настройкам Ollama и Open WebUI содержится в документации разработчиков Ollama и в документации разработчиков Open WebUI.

Рекомендации по использованию

Для максимальной эффективности модели gpt-oss 20B рекомендуется:

  • Использовать модель для задач, требующих рассуждений, включая обработку цепочки мыслей (chain-of-thought) . Модель поддерживает настройку уровня рассуждений: низкий, средний и высокий, которые настраиваются через системный промпт.
  • Задействовать встроенные агентные возможности модели, такие как вызов функций, выполнение кода на Python и структурированные выводы .
  • Использовать модель для многоэтапных задач разработки, опираясь на ее агентные способности .
  • Интегрировать модель с существующими инструментами разработки через API, учитывая, что она поддерживает донастройку и работает в формате ответов OpenAI Harmony . Модель предназначена для эффективного развертывания с низкими задержками, в том числе локально .

Заказ сервера с gpt-oss-120b с помощью API

Для установки данного ПО с использованием API следуйте этой инструкции.

question_mark
Я могу вам чем-то помочь?
question_mark
ИИ Помощник ×