gpt-oss-120b¶

В этой статье

Основные возможности gpt-oss-120b

Особенности сборки

Начало работы после развертывания gpt-oss-120b

Заказ сервера с gpt-oss-120b с помощью API

Информация

gpt-oss-120b — это крупномасштабная модель с открытыми весами от OpenAI, разработанная для высокопроизводительных задач, требующих глубоких рассуждений, многошагового планирования и сложного взаимодействия с инструментами. Модель насчитывает 120 миллиардов параметров, из которых активируются около 21 миллиарда за один проход, что обеспечивает баланс между вычислительной мощностью и эффективностью. Благодаря продвинутым методам квантования и оптимизации, gpt-oss-120b может быть развернута на серверном оборудовании с 70 ГБ видеопамяти и выше и поддерживает масштабируемое локальное или гибридное развертывание.

Основные возможности gpt-oss-120b¶

Масштабируемая архитектура с условной активацией: модель содержит 120 миллиардов параметров, но за счёт механизма разреженной активации (sparse activation) задействует лишь ~21 миллиард параметров на запрос, что значительно снижает требования к памяти и вычислительным ресурсам без ущерба для качества.
Продвинутые агентские функции: gpt-oss-120b поддерживает расширенный набор инструментов — включая выполнение кода, веб-поиск в реальном времени, вызов API и генерацию строго структурированных выходных данных (JSON, XML и др.). Это делает её идеальной основой для автономных агентов и сложных автоматизированных систем.
Адаптивные рассуждения: модель реализует гибкую систему уровней рассуждений — от быстрого прямого ответа до многоэтапной цепочки размышлений (chain-of-thought) и деревьев решений. Пользователь может управлять «глубиной мышления» в зависимости от сложности задачи.
Высокая производительность на бенчмарках: gpt-oss-120b демонстрирует результаты, сопоставимые с проприетарными моделями уровня o3 и o4, особенно в задачах, требующих логики, математики, программирования и междисциплинарного синтеза знаний.
Широкая мультилингвальная поддержка: модель обучена на данных более чем на 50 языках и способна эффективно работать в многоязычных и мультикультурных контекстах. Для наилучших результатов рекомендуется явно задавать язык и культурные рамки в промпте.
Эффективное квантование и совместимость: поддержка форматов MXFP4 и INT4 позволяет значительно сократить объём памяти и ускорить вывод без существенной потери качества. Модель совместима с популярными фреймворками, такими как vLLM, GGUF и Hugging Face Transformers.

Особенности сборки¶

ID	Имя ПО	ОС	VPS	BM	VGPU	GPU	Мин. ЦПУ (Ядер)	Мин. ОЗУ (Гб)	Мин. HDD/SDD (Гб)	Свой домен	Доступно
415	gpt-oss:120b	Ubuntu 22.04	-	-	+	+	16	128	240	Нет	ЗАКАЗАТЬ

Информацию по особенностям сборки данного ПО можно посмотреть по ссылке

Примечание

Если не указано иное, по умолчанию мы устанавливаем последнюю релиз версию программного обеспечения с сайта разработчика или репозиториев операционной системы.

Начало работы после развертывания gpt-oss-120b¶

После оплаты заказа на указанную при регистрации электронную почту придет уведомление о готовности сервера к работе. В нем будет указан IP-адрес VPS, а также логин и пароль для подключения к серверу и ссылка для доступа к панели OpenWebUI. Управление оборудованием клиенты нашей компании осуществляют в панели управления серверами и API — Invapi.

Данные для авторизации для доступа к операционной системе сервера (например по SSH) придут к вам в присланном e-mail.
Ссылка для доступа к панели управления Ollama c Open WebUI с веб-интерфейсом: в теге webpanel во вкладке Информация >> Тэги панели управления Invapi. Точная ссылка вида https://gpt-oss<Server_ID_from_Invapi>.hostkey.in приходит в письме, отправляемом при сдаче сервера.

После перехода по ссылке из тега webpanel будет открыто окно авторизации Get started with Open WebUI, где вам необходимо создать имя, электронную почту и пароль администратора чат бота, а затем нажать на кнопку ~~Create Admin Account~~:

После успешной регистрации откроется главный интерфейс Open WebUI с доступом к Gpt-oss-20b:

Внимание

После регистрации первого пользователя, система автоматически присваивает ему роль администратора. Для обеспечения безопасности и контроля над процессом регистрации, все последующие заявки на регистрацию нужно одобрять в интерфейсе OpenWebUI из аккаунта администратора

Примечание

Подробное описание особенностей работы с панелью управления Ollama c Open WebUI можно найти в статье ИИ чат-бот на собственном сервере

Примечание

Для оптимальной работы с моделью gpt-oss-120b рекомендуется использовать GPU с объемом видеопамяти не менее 70 ГБ для модели 120B. Для эффективной обработки длинных контекстов кода и сложных агентных задач рекомендуем использовать GPU с объемом видеопамяти от 80 Гб. Подробная информация по основным настройкам Ollama и Open WebUI содержится в документации разработчиков Ollama и в документации разработчиков Open WebUI.

Рекомендации по использованию

Для максимальной эффективности модели gpt-oss 20B рекомендуется:

Использовать модель для задач, требующих рассуждений, включая обработку цепочки мыслей (chain-of-thought) . Модель поддерживает настройку уровня рассуждений: низкий, средний и высокий, которые настраиваются через системный промпт.
Задействовать встроенные агентные возможности модели, такие как вызов функций, выполнение кода на Python и структурированные выводы .
Использовать модель для многоэтапных задач разработки, опираясь на ее агентные способности .
Интегрировать модель с существующими инструментами разработки через API, учитывая, что она поддерживает донастройку и работает в формате ответов OpenAI Harmony . Модель предназначена для эффективного развертывания с низкими задержками, в том числе локально .

Заказ сервера с gpt-oss-120b с помощью API¶

Для установки данного ПО с использованием API следуйте этой инструкции.