gpt-oss-120b¶
В этой статье
Информация
gpt-oss-120b — это крупномасштабная модель с открытыми весами от OpenAI, разработанная для высокопроизводительных задач, требующих глубоких рассуждений, многошагового планирования и сложного взаимодействия с инструментами. Модель насчитывает 120 миллиардов параметров, из которых активируются около 21 миллиарда за один проход, что обеспечивает баланс между вычислительной мощностью и эффективностью. Благодаря продвинутым методам квантования и оптимизации, gpt-oss-120b может быть развернута на серверном оборудовании с 70 ГБ видеопамяти и выше и поддерживает масштабируемое локальное или гибридное развертывание.
Основные возможности gpt-oss-120b¶
- Масштабируемая архитектура с условной активацией: модель содержит 120 миллиардов параметров, но за счёт механизма разреженной активации (sparse activation) задействует лишь ~21 миллиард параметров на запрос, что значительно снижает требования к памяти и вычислительным ресурсам без ущерба для качества.
- Продвинутые агентские функции: gpt-oss-120b поддерживает расширенный набор инструментов — включая выполнение кода, веб-поиск в реальном времени, вызов API и генерацию строго структурированных выходных данных (JSON, XML и др.). Это делает её идеальной основой для автономных агентов и сложных автоматизированных систем.
- Адаптивные рассуждения: модель реализует гибкую систему уровней рассуждений — от быстрого прямого ответа до многоэтапной цепочки размышлений (chain-of-thought) и деревьев решений. Пользователь может управлять «глубиной мышления» в зависимости от сложности задачи.
- Высокая производительность на бенчмарках: gpt-oss-120b демонстрирует результаты, сопоставимые с проприетарными моделями уровня o3 и o4, особенно в задачах, требующих логики, математики, программирования и междисциплинарного синтеза знаний.
- Широкая мультилингвальная поддержка: модель обучена на данных более чем на 50 языках и способна эффективно работать в многоязычных и мультикультурных контекстах. Для наилучших результатов рекомендуется явно задавать язык и культурные рамки в промпте.
- Эффективное квантование и совместимость: поддержка форматов MXFP4 и INT4 позволяет значительно сократить объём памяти и ускорить вывод без существенной потери качества. Модель совместима с популярными фреймворками, такими как vLLM, GGUF и Hugging Face Transformers.
Особенности сборки¶
ID | Совместимые ОС | VPS | BM | VGPU | GPU | Мин. ЦПУ (Ядер) | Мин. ОЗУ (Гб) | Мин. HDD/SDD (Гб) | Доступно |
---|---|---|---|---|---|---|---|---|---|
415 | Ubuntu 22.04 | - | - | + | + | 16 | 128 | 240 | Нет |
Технические характеристики сборки:
- Ubuntu 22.04 с обновлением ядра до 6 версии;
- Nvidia драйверы последней версии;
- CUDA Toolkit;
- Ollama для управления моделями;
- OpenWebUI для веб-интерфейса.
Особенности установки:
- Время на установку 35-45 минут вместе с OS;
- Сервер Ollama загружает и запускает модель gpt-oss-120b в память GPU/RAM;
- Open WebUI развертывается как веб-приложение, подключенное к серверу Ollama;
- Пользователи взаимодействуют с моделью через веб-интерфейс Open WebUI для программирования и агентных задач;
- Все вычисления и обработка кода происходят локально на сервере;
- Администраторы могут настраивать модель для специфических задач разработки через инструменты OpenWebUI;
- Поддержка различных уровней квантования для оптимизации использования памяти.
Начало работы после развертывания gpt-oss-120b¶
После оплаты заказа на указанную при регистрации электронную почту придет уведомление о готовности сервера к работе. В нем будет указан IP-адрес VPS, а также логин и пароль для подключения к серверу и ссылка для доступа к панели OpenWebUI. Управление оборудованием клиенты нашей компании осуществляют в панели управления серверами и API — Invapi.
-
Данные для авторизации для доступа к операционной системе сервера (например по SSH) придут к вам в присланном e-mail.
-
Ссылка для доступа к панели управления Ollama c Open WebUI с веб-интерфейсом: в теге webpanel во вкладке Информация >> Тэги панели управления Invapi. Точная ссылка вида
https://gpt-oss<Server_ID_from_Invapi>.hostkey.in
приходит в письме, отправляемом при сдаче сервера.
После перехода по ссылке из тега webpanel будет открыто окно авторизации Get started with Open WebUI, где вам необходимо создать имя, электронную почту и пароль администратора чат бота, а затем нажать на кнопку Create Admin Account:
После успешной регистрации откроется главный интерфейс Open WebUI с доступом к Gpt-oss-20b:
Внимание
После регистрации первого пользователя, система автоматически присваивает ему роль администратора. Для обеспечения безопасности и контроля над процессом регистрации, все последующие заявки на регистрацию нужно одобрять в интерфейсе OpenWebUI из аккаунта администратора
Примечание
Подробное описание особенностей работы с панелью управления Ollama c Open WebUI можно найти в статье AI-чат-бот на собственном сервере
Примечание
Для оптимальной работы с моделью gpt-oss-120b рекомендуется использовать GPU с объемом видеопамяти не менее 70 ГБ для модели 120B. Для эффективной обработки длинных контекстов кода и сложных агентных задач рекомендуем использовать GPU с объемом видеопамяти от 80 Гб. Подробная информация по основным настройкам Ollama и Open WebUI содержится в документации разработчиков Ollama и в документации разработчиков Open WebUI.
Рекомендации по использованию
Для максимальной эффективности модели gpt-oss 20B рекомендуется:
- Использовать модель для задач, требующих рассуждений, включая обработку цепочки мыслей (chain-of-thought) . Модель поддерживает настройку уровня рассуждений: низкий, средний и высокий, которые настраиваются через системный промпт.
- Задействовать встроенные агентные возможности модели, такие как вызов функций, выполнение кода на Python и структурированные выводы .
- Использовать модель для многоэтапных задач разработки, опираясь на ее агентные способности .
- Интегрировать модель с существующими инструментами разработки через API, учитывая, что она поддерживает донастройку и работает в формате ответов OpenAI Harmony . Модель предназначена для эффективного развертывания с низкими задержками, в том числе локально .
Заказ сервера с gpt-oss-120b с помощью API¶
Для установки данного ПО с использованием API следуйте этой инструкции.