Арендуйте GPU Tesla сервер с мощными графическими картами NVIDIA. Доступны как выделенные серверы, так и виртуальные машины с выделенными графическими картами, которые зарезервированы под одного клиента. Вы можете установить популярные фреймворки для машинного обучения и тренировок нейронных сетей таких как TensorFlow, Caffe, Torch, MXNet, Keras и другие. Также вы можете установить свое программное окружение через IPMI.
Выделенные серверы собраны на базе платформы ESC4000 G4S.
Арендуйте выделенные серверы с предустановленными приложениями.
Tesla - исторический бренд NVIDIA для серверных GPU, предназначенных для дата-центров. С 2020 года NVIDIA перестала использовать название Tesla, но линейка продолжается: A100 (Ampere), H100 (Hopper), H200. Все они- наследники Tesla, созданные для круглосуточной работы в серверах.
Три главных отличия: HBM-память (в разы выше bandwidth), ECC (коррекция ошибок для точности вычислений) и NVLink (быстрый interconnect для multi-GPU). Плюс пассивное охлаждение и сертификация для 24/7 работы.
Для моделей до 30B параметров- A100 80 ГБ. Для 70B+- H100, желательно в конфигурации 4–8 GPU с NVLink. Для моделей, которым не хватает 80 ГБ VRAM- H200 (141 ГБ).
T4 создана для инференса, не для обучения. 16 ГБ VRAM и невысокая вычислительная мощность ограничивают обучение небольшими моделями. Для обучения лучше A100 или H100.
Да. HOSTKEY собирает кластеры из серверов с A100/H100 под заказ- для распределенного обучения крупных моделей. Серверы объединяются высокоскоростной сетью.
HOSTKEY предлагает серверы с серверными GPU NVIDIA в России, Нидерландах, Финляндии, Германии, Исландии, Франции, США и Турции.
Тестовые серверы предоставляются только компаниям. Рассматриваем заявки, в которых указан корпоративный e-mail
Вы можете воспользоваться онлайн конфигуратором в котором есть все комплектующие и цены или связаться с нашим отделом продаж. Менеджеры HOSTKEY помогут решить вашу проблему и подберут оборудование, которое оптимально по параметрам цена-производительность.
Вы можете выбрать подходящий ЦОД в Нидерландах, Германии, Финляндии, США или России.
Мы размещаем оборудование в центрах обработки данных различных категорий, в том числе в ЦОДах с подтвержденной сертификаций TIER III, что особенно актуально для важных проектов.
Вы можете воспользоваться пробным периодом для тестирования сервера. Для этого необходимо оплатить сервер на 1 месяц. Если сервер вам не подойдёт, вы имеете возможность отменить услугу в любое время. В таком случае средства, за вычетом использованных, вернутся на ваш баланс. Они могут быть использованы для оплаты других услуг HOSTKEY. Обратите внимание: если вы арендуете сервер с программным обеспечением, которое предполагает покупку лицензии, включая Windows, то такие серверы предоставляются с почасовой оплатой - минимальный срок аренды 1 месяц.
Физические и юридические лица могут произвести оплату безналичным расчетом на основании выставленного счета. Счет может быть выставлен самостоятельно через интерфейс Личного кабинета или подготовлен нашими менеджерами по Вашему запросу. Мы принимаем платежи по банковским картам Visa и MasterCard, которые выпущены российскими банками, в том числе и по картам МИР. Произвести оплату можно с помощью электронной платежной системы ЮMoney и через интернет банки.
Также доступна оплата наличными через терминалы, банкоматы Сбербанка и салоны мобильной связи. Ознакомиться с полным перечнем точек приема платежей.
HOSTKEY возвращает деньги при условии неисправности сервера. Прочитайте подробную информацию о возврате средств.
Клиенты, серверы которых используют безлимитное подключение принимают на себя обязательство справедливого использования канала. Для соединения на скорости 1 Гбит/с с безлимитным трафиком запрещается использовать 70% пропускной способности порта больше, чем в течение 3 часов в день.
Подпишитесь на нашу рассылку
и первыми воспользуйтесь скидками и ограниченными специальными предложениями
Серия Tesla- исторический бренд NVIDIA для серверных GPU, созданных специально для дата-центров. Пассивное охлаждение, ECC-память, круглосуточная работа под нагрузкой, сертификация для серверных корпусов- все то, чего нет у потребительских GeForce. С 2020 года NVIDIA отказалась от бренда Tesla (чтобы не путать с автомобилями), но линейка продолжается под названиями A-серии, H-серии и Blackwell. В HOSTKEY можно арендовать выделенные серверы с GPU линейки Tesla и ее наследниками- от T4 для инференса до H200 для обучения крупнейших моделей.
Бренд Tesla объединял несколько поколений серверных ускорителей. Каждое следующее поколение приносило кратный рост производительности в AI-задачах.
Карта для инференса. 16 ГБ GDDR6, 2 560 CUDA-ядер, 320 тензорных ядер, TDP всего 70 Вт. T4 не предназначена для обучения крупных моделей- она создана для продакшн-деплоя: запуск обученных моделей с минимальным энергопотреблением. Благодаря низкому TDP в один сервер помещается несколько T4 без проблем с охлаждением.
Первая серверная карта NVIDIA с тензорными ядрами. 32 ГБ HBM2 (или 16 ГБ в младшей версии), 5 120 CUDA-ядер, 640 тензорных ядер, bandwidth 900 ГБ/с. NVLink первого поколения. V100 определила стандарт для обучения нейросетей: с нее начался массовый переход от CPU-обучения к GPU.
80 ГБ HBM2e, 6 912 CUDA-ядер, 432 тензорных ядра третьего поколения, bandwidth 2 039 ГБ/с. Поддержка TF32- нового формата данных, который ускоряет обучение без потери точности. Multi-Instance GPU (MIG) позволяет разделить одну A100 на до 7 изолированных инстансов- каждый со своей долей VRAM и вычислительных ресурсов. NVLink третьего поколения (600 ГБ/с).
80 ГБ HBM2e, 14 592 CUDA-ядра, 456 тензорных ядер четвертого поколения с Transformer Engine. Bandwidth 3 352 ГБ/с. NVLink четвертого поколения (900 ГБ/с). Transformer Engine- ключевое нововведение: автоматическое переключение между FP8 и FP16 при обучении трансформеров, что ускоряет обучение LLM в 2–3 раза по сравнению с A100.
Тот же чип Hopper, но с 141 ГБ HBM3e и bandwidth 4.8 ТБ/с. Для моделей, которым не хватает 80 ГБ на H100. Особенно заметен прирост на инференсе крупных LLM, где ограничением становится объем и скорость памяти.
Зачем платить за Tesla/A100/H100, если RTX 4090 стоит дешевле и имеет больше CUDA-ядер?
Память. Серверные карты используют HBM (High Bandwidth Memory)- память с пропускной способностью 2–4.8 ТБ/с. У RTX 4090- GDDR6X с bandwidth ~1 ТБ/с. Для обучения крупных моделей, где данные постоянно перемещаются между памятью и вычислительными блоками, bandwidth критичнее количества ядер.
ECC. Серверные GPU поддерживают коррекцию ошибок в памяти. Для обучения, которое длится часами и днями, одна случайная ошибка в памяти может испортить результат. На потребительских картах ECC нет (кроме RTX PRO 6000).
NVLink. Высокоскоростной interconnect между GPU (до 900 ГБ/с на H100). Потребительские карты работают через PCIe (64 ГБ/с). Для распределенного обучения с tensor parallelism NVLink дает многократный выигрыш.
Пассивное охлаждение. Серверные GPU рассчитаны на серверные корпуса с направленным воздушным потоком. Нет вентиляторов на самой карте- тише, надежнее, плотнее.
Сертификация. Серверные GPU сертифицированы для непрерывной работы 24/7 под полной нагрузкой. Потребительские карты формально не предназначены для этого (хотя на практике работают).
Модели с десятками и сотнями миллиардов параметров. A100 и H100 с NVLink- для распределенного обучения на 4–8 GPU. H200- когда 80 ГБ VRAM на H100 не хватает. Кластеры из десятков H100- для обучения моделей масштаба GPT.
T4- для массового инференса с минимальным энергопотреблением. A100 с MIG- для обслуживания нескольких моделей на одной карте. H100 с FP8 через Transformer Engine- для инференса крупных LLM с минимальной задержкой.
Молекулярная динамика, климатическое моделирование, вычислительная гидродинамика (CFD). Серверные GPU предлагают высокую производительность в FP64 (двойная точность)- формат, критичный для научных расчетов. V100 и A100 лидируют в FP64 среди GPU.
Анализ медицинских изображений (КТ, МРТ), геномика, drug discovery. ECC-память гарантирует точность результатов. A100 и H100 используются в исследовательских центрах по всему миру.
|
T4 |
V100 |
A100 80 ГБ |
H100 |
H200 |
|
|
VRAM |
16 ГБ GDDR6 |
32 ГБ HBM2 |
80 ГБ HBM2e |
80 ГБ HBM2e |
141 ГБ HBM3e |
|
Bandwidth |
320 ГБ/с |
900 ГБ/с |
2 039 ГБ/с |
3 352 ГБ/с |
4 800 ГБ/с |
|
NVLink |
Нет |
Да |
Да |
Да |
Да |
|
TDP |
70 Вт |
300 Вт |
400 Вт |
700 Вт (SXM) |
700 Вт (SXM) |
|
Лучше для |
Инференс |
Обучение средних моделей |
Обучение LLM до 70B |
Обучение LLM 70B+ |
Крупнейшие модели, длинные контексты |
Для инференса небольших моделей T4- самый экономичный вариант. Для обучения серьезных моделей- A100 или H100, в зависимости от бюджета и требований к скорости. H200- когда каждый гигабайт VRAM на счету.
HOSTKEY предлагает выделенные серверы с серверными GPU NVIDIA в дата-центрах России, Европы и США.
Что входит:
Как заказать:
Арендуйте выделенный сервер с серверными GPU NVIDIA в HOSTKEY. От T4 для инференса до H200 для обучения крупнейших моделей. Россия, Европа, США. Почасовая и помесячная оплата.