gpt-oss-20b¶
В этой статье
Информация
gpt-oss-20b — это средняя по размеру модель с открытыми весами от OpenAI, разработанная для эффективной работы с низкой задержкой, в локальных установках или в специализированных сценариях использования . Модель имеет 20 миллиардов параметров, из которых активны 3,6 миллиарда, что позволяет ей работать на оборудовании с ограниченными ресурсами, например, на устройствах с 16 ГБ памяти. Модель можно развернуть локально, включая работу на потребительском оборудовании.
Основные возможности gpt-oss-20b¶
- Оптимизированная архитектура: модель gpt-oss-20b обладает 20 миллиардами общих параметров и активирует всего 3,6 миллиарда, обеспечивая высокую производительность при эффективном использовании ресурсов.
- Расширенные агентские функции: модель обладает встроенными возможностями для вызова функций, просмотра веб-страниц, выполнения кода на Python и генерации структурированных выходных данных . Она отлично справляется с решением задач и вызовом инструментов.
- Рассуждения и настройка их интенсивности: функционально модель является надежным решателем задач, поддерживающим такие методы, как цепочка размышлений (chain-of-thought) . Она предлагает три настраиваемых уровня интенсивности рассуждений.
- Производительность и совместимость: модель gpt-oss-20b показывает результаты, сопоставимые с OpenAI o3-mini, на распространенных бенчмарках. Благодаря оптимизации, она может работать на периферийных устройствах (edge devices) с 16 ГБ памяти.
- Мультилингвальная поддержка. Модель обладает многоязычным функционалом. Для достижения оптимальных результатов рекомендуется явно указывать целевой язык и культурный контекст взаимодействия.
- Квантование данных. Поддержка формата MXFP4 обеспечивает эффективную работу модели на оборудовании с ограниченными ресурсами, повышая общую производительность системы.
Особенности сборки¶
ID | Совместимые ОС | VPS | BM | VGPU | GPU | Мин. ЦПУ (Ядер) | Мин. ОЗУ (Гб) | Мин. HDD/SDD (Гб) | Доступно |
---|---|---|---|---|---|---|---|---|---|
345 | Ubuntu 22.04 | - | - | + | + | 8 | 60 | 15 | Да |
Технические характеристики сборки:
- Ubuntu 22.04 с обновлением ядра до 6 версии;
- Nvidia драйверы последней версии;
- CUDA Toolkit;
- Ollama для управления моделями;
- OpenWebUI для веб-интерфейса.
Особенности установки:
- Время на установку 25-45 минут вместе с OS;
- Сервер Ollama загружает и запускает модель gpt-oss-20b в память GPU/RAM;
- Open WebUI развертывается как веб-приложение, подключенное к серверу Ollama;
- Пользователи взаимодействуют с моделью через веб-интерфейс Open WebUI для программирования и агентных задач;
- Все вычисления и обработка кода происходят локально на сервере;
- Администраторы могут настраивать модель для специфических задач разработки через инструменты OpenWebUI;
- Поддержка различных уровней квантования для оптимизации использования памяти.
Начало работы после развертывания gpt-oss-20b¶
После оплаты заказа на указанную при регистрации электронную почту придет уведомление о готовности сервера к работе. В нем будет указан IP-адрес VPS, а также логин и пароль для подключения к серверу и ссылка для доступа к панели OpenWebUI. Управление оборудованием клиенты нашей компании осуществляют в панели управления серверами и API — Invapi.
-
Данные для авторизации для доступа к операционной системе сервера (например по SSH) придут к вам в присланном e-mail.
-
Ссылка для доступа к панели управления Ollama c Open WebUI с веб-интерфейсом: в теге webpanel во вкладке Информация >> Тэги панели управления Invapi. Точная ссылка вида
https://gpt-oss<Server_ID_from_Invapi>.hostkey.in
приходит в письме, отправляемом при сдаче сервера.
После перехода по ссылке из тега webpanel будет открыто окно авторизации Get started with Open WebUI, где вам необходимо создать имя, электронную почту и пароль администратора чат бота, а затем нажать на кнопку Create Admin Account:
После успешной регистрации откроется главный интерфейс Open WebUI с доступом к Gpt-oss-20b:
Внимание
После регистрации первого пользователя, система автоматически присваивает ему роль администратора. Для обеспечения безопасности и контроля над процессом регистрации, все последующие заявки на регистрацию нужно одобрять в интерфейсе OpenWebUI из аккаунта администратора
Примечание
Подробное описание особенностей работы с панелью управления Ollama c Open WebUI можно найти в статье AI-чат-бот на собственном сервере
Примечание
Для оптимальной работы с моделью gpt-oss-20b рекомендуется использовать GPU с объемом видеопамяти не менее 16 ГБ для модели 20B. Для эффективной обработки длинных контекстов кода и сложных агентных задач рекомендуем использовать GPU с объемом видеопамяти от 24 Гб. Подробная информация по основным настройкам Ollama и Open WebUI содержится в документации разработчиков Ollama и в документации разработчиков Open WebUI.
Рекомендации по использованию
Для максимальной эффективности модели gpt-oss 20B рекомендуется:
- Использовать модель для задач, требующих рассуждений, включая обработку цепочки мыслей (chain-of-thought) . Модель поддерживает настройку уровня рассуждений: низкий, средний и высокий, которые настраиваются через системный промпт.
- Задействовать встроенные агентные возможности модели, такие как вызов функций, выполнение кода на Python и структурированные выводы .
- Использовать модель для многоэтапных задач разработки, опираясь на ее агентные способности .
- Интегрировать модель с существующими инструментами разработки через API, учитывая, что она поддерживает донастройку и работает в формате ответов OpenAI Harmony . Модель предназначена для эффективного развертывания с низкими задержками, в том числе локально .
Заказ сервера с gpt-oss-20b с помощью API¶
Для установки данного ПО с использованием API следуйте этой инструкции.