gpt-oss-20b¶
Информация
gpt-oss-20b — это средняя по размеру модель с открытыми весами от OpenAI, разработанная для эффективной работы с низкой задержкой, в локальных установках или в специализированных сценариях использования . Модель имеет 20 миллиардов параметров, из которых активны 3,6 миллиарда, что позволяет ей работать на оборудовании с ограниченными ресурсами, например, на устройствах с 16 ГБ памяти. Модель можно развернуть локально, включая работу на потребительском оборудовании.
Основные возможности gpt-oss-20b¶
- Оптимизированная архитектура: модель gpt-oss-20b обладает 20 миллиардами общих параметров и активирует всего 3,6 миллиарда, обеспечивая высокую производительность при эффективном использовании ресурсов.
- Расширенные агентские функции: модель обладает встроенными возможностями для вызова функций, просмотра веб-страниц, выполнения кода на Python и генерации структурированных выходных данных . Она отлично справляется с решением задач и вызовом инструментов.
- Рассуждения и настройка их интенсивности: функционально модель является надежным решателем задач, поддерживающим такие методы, как цепочка размышлений (chain-of-thought) . Она предлагает три настраиваемых уровня интенсивности рассуждений.
- Производительность и совместимость: модель gpt-oss-20b показывает результаты, сопоставимые с OpenAI o3-mini, на распространенных бенчмарках. Благодаря оптимизации, она может работать на периферийных устройствах (edge devices) с 16 ГБ памяти.
- Мультилингвальная поддержка. Модель обладает многоязычным функционалом. Для достижения оптимальных результатов рекомендуется явно указывать целевой язык и культурный контекст взаимодействия.
- Квантование данных. Поддержка формата MXFP4 обеспечивает эффективную работу модели на оборудовании с ограниченными ресурсами, повышая общую производительность системы.
Особенности сборки¶
ID | Совместимые ОС | VPS | BM | VGPU | GPU | Мин. ЦПУ (Ядер) | Мин. ОЗУ (Гб) | Мин. HDD/SDD (Гб) | Доступно |
---|---|---|---|---|---|---|---|---|---|
340 | Ubuntu 22.04 | - | - | + | + | 8 | 60 | - | Да |
Технические характеристики сборки:
- Ubuntu 22.04 с обновлением ядра до 6 версии;
- Nvidia драйверы последней версии;
- CUDA Toolkit;
- Ollama для управления моделями;
- OpenWebUI для веб-интерфейса.
Особенности установки:
- Время на установку 25-45 минут вместе с OS;
- Сервер Ollama загружает и запускает модель gpt-oss-20b в память GPU/RAM;
- Open WebUI развертывается как веб-приложение, подключенное к серверу Ollama;
- Пользователи взаимодействуют с моделью через веб-интерфейс Open WebUI для программирования и агентных задач;
- Все вычисления и обработка кода происходят локально на сервере;
- Администраторы могут настраивать модель для специфических задач разработки через инструменты OpenWebUI;
- Поддержка различных уровней квантования для оптимизации использования памяти.
Начало работы после развертывания gpt-oss-20b¶
После оплаты заказа на указанную при регистрации электронную почту придет уведомление о готовности сервера к работе. В нем будет указан IP-адрес VPS, а также логин и пароль для подключения к серверу и ссылка для доступа к панели OpenWebUI. Управление оборудованием клиенты нашей компании осуществляют в панели управления серверами и API — Invapi.
-
Данные для авторизации для доступа к операционной системе сервера (например по SSH) придут к вам в присланном e-mail.
-
Ссылка для доступа к панели управления Ollama c Open WebUI с веб-интерфейсом: в теге webpanel во вкладке Информация >> Тэги панели управления Invapi. Точная ссылка вида
https://????<Server_ID_from_Invapi>.hostkey.in
приходит в письме, отправляемом при сдаче сервера.
При первом переходе по ссылке из тега webpanel откроется приветственная страница. Нажмите кнопку Get started для начала настройки.
На странице "Get started with Open WebUI" заполните регистрационную форму администратора:
- **Name**: введите имя администратора;
- **Email**: укажите email администратора;
- **Password**: создайте надежный пароль.
После ввода данных нажмите кнопку Create Admin Account.
После успешной регистрации откроется главный интерфейс Open WebUI с доступом к Gpt-oss-20b:
Примечание
Подробное описание особенностей работы с панелью управления Ollama c Open WebUI можно найти в статье AI-чат-бот на собственном сервере
Примечание
Для оптимальной работы с моделью gpt-oss-20b рекомендуется использовать GPU с объемом видеопамяти не менее 16 ГБ для модели 20B. Для эффективной обработки длинных контекстов кода и сложных агентных задач рекомендуем использовать GPU с объемом видеопамяти от 24 Гб. Подробная информация по основным настройкам Ollama и Open WebUI содержится в документации разработчиков Ollama и в документации разработчиков Open WebUI.
Рекомендации по использованию
Для максимальной эффективности модели gpt-oss 20B рекомендуется:
- Использовать модель для задач, требующих рассуждений, включая обработку цепочки мыслей (chain-of-thought) . Модель поддерживает настройку уровня рассуждений: низкий, средний и высокий, которые настраиваются через системный промпт.
- Задействовать встроенные агентные возможности модели, такие как вызов функций, выполнение кода на Python и структурированные выводы .
- Использовать модель для многоэтапных задач разработки, опираясь на ее агентные способности .
- Интегрировать модель с существующими инструментами разработки через API, учитывая, что она поддерживает донастройку и работает в формате ответов OpenAI Harmony . Модель предназначена для эффективного развертывания с низкими задержками, в том числе локально .
Заказ сервера с Gpt-oss-20b с помощью API¶
Для установки данного ПО с использованием API следуйте этой инструкции.