Llama-3.3-70B¶
В этой статье
Информация
Llama-3.3-70B - высокопроизводительная языковая модель с 70 миллиардами параметров для локального развертывания через Ollama. Модель требует мощных вычислительных ресурсов с минимум 53 ГБ видеопамяти (NVIDIA A100/H100 или несколько потребительских GPU). Развертывание на Ubuntu 22.04 поддерживает распределенные вычисления и интеграцию с Open Web UI, обеспечивая полный контроль над данными и оптимизацию производительности.
Основные возможности Llama-3.3-70B¶
- Высокопроизводительная архитектура: модель обладает 70 миллиардами параметров и оптимизирована для обработки сложнейших задач с непревзойденной точностью через современные технологии распределенных вычислений;
- Интеграция с Open Web UI: современный веб-интерфейс доступен через порт 8080, обеспечивая полный контроль над данными, вычислительными ресурсами и процессами обработки;
- Распределенные вычисления: продвинутая поддержка многокарточных конфигураций с автоматическим распределением нагрузки между несколькими GPU;
- Масштабируемость: возможность горизонтального масштабирования путем добавления дополнительных GPU для повышения производительности;
- Производительность: использование технологии LLAMA_FLASH_ATTENTION для оптимизации вычислений и ускорения обработки запросов;
- Отказоустойчивость: система автоматического восстановления сервисов при сбоях обеспечивает непрерывность работы.
- Примеры использования:
- Клиентская поддержка: автоматизация ответов на вопросы пользователей;
- Образование: создание обучающих материалов, помощь в решении задач;
- Маркетинг: генерация рекламных текстов, анализ отзывов;
- Разработка ПО: создание и документирование кода.
Особенности сборки¶
| ID | Имя ПО | ОС | VPS | BM | VGPU | GPU | Мин. ЦПУ (Ядер) | Мин. ОЗУ (Гб) | Мин. HDD/SDD (Гб) | Свой домен | Доступно |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 253 | Llama-3.3-70B | Ubuntu 22.04 | - | - | + | + | 4 | 64 | - | Нет | ЗАКАЗАТЬ |
Информацию по особенностям сборки данного ПО можно посмотреть по ссылке
Примечание
Если не указано иное, по умолчанию мы устанавливаем последнюю релиз версию программного обеспечения с сайта разработчика или репозиториев операционной системы.
Начало работы после развертывания Llama-3.3-70B¶
После оплаты заказа на указанную при регистрации электронную почту придет уведомление о готовности сервера к работе. В нем будет указан IP-адрес VPS, а также логин и пароль для подключения к серверу и ссылка для доступа к панели OpenWebUI. Управление оборудованием клиенты нашей компании осуществляют в панели управления серверами и API — Invapi.
-
Данные для авторизации для доступа к операционной системе сервера (например по SSH) придут к вам в присланном e-mail.
-
Ссылка для доступа к панели управления Ollama c Open WebUI с веб-интерфейсом: в теге webpanel во вкладке Информация >> Тэги панели управления Invapi. Точная ссылка вида
https://llama<Server_ID_from_Invapi>.hostkey.inприходит в письме, отправляемом при сдаче сервера.
После перехода по ссылке из тега webpanel будет открыто окно авторизации Get started with Open WebUI, где вам необходимо создать имя, электронную почту и пароль администратора чат бота, а затем нажать на кнопку Create Admin Account:

Внимание
После регистрации первого пользователя, система автоматически присваивает ему роль администратора. Для обеспечения безопасности и контроля над процессом регистрации, все последующие заявки на регистрацию нужно одобрять в интерфейсе OpenWebUI из аккаунта администратора
Примечание
Подробное описание особенностей работы с панелью управления Ollama c Open WebUI можно найти в статье ИИ чат-бот на собственном сервере
Примечание
Для оптимальной работы рекомендуется использовать GPU с объемом видеопамяти больше минимального требования в 16 ГБ, что обеспечит запас для обработки больших контекстов и параллельных запросов. Подробная информация по основным настройкам Ollama и Open WebUI содержится в документации разработчиков Ollama и в документации разработчиков Open WebUI.
Заказ сервера с Llama-3.3-70B с помощью API¶
Для установки данного ПО с использованием API следуйте этой инструкции.