Серверы
  • Готовые серверы
  • Конфигуратор
  • Серверы с 1CPU
  • Серверы с 2CPU
  • 4 поколение AMD EPYC и Intel Xeоn
  • Серверы с AMD Ryzen и Intel Core i9
  • Серверы для хранения данных
  • Cерверы с портом 10 Гбит/c
  • GPU
  • Распродажа
  • VPS
    GPU
  • Выделенные серверы с GPU
  • Виртуальные серверы с GPU
  • Распродажа
    Маркетплейс
    Colocation
  • Размещение серверов в дата-центре в Москве
  • Размещение серверов в дата-центре в Амстердаме
  • Обслуживание серверов в других ЦОД
  • Кластеры
    Прокат
    Услуги
  • Аренда сетевого оборудования
  • Защита от DDoS атак
  • IPV4 и IPV6 адреса
  • Администрирование серверов
  • Уровни технической поддержки
  • Мониторинг сервера
  • Программное обеспечение
  • BYOIP
  • USB диск
  • IP-KVM
  • Трафик
  • Коммутация серверов
  • Поставки оборудования за рубежом
  • О нас
  • Работа в HOSTKEY
  • Панель управления серверами и API
  • Дата-центры
  • Сеть
  • Тест скорости
  • Специальные предложения
  • Отдел продаж
  • Для реселлеров
  • Партнерская программа
  • Гранты для специалистов по Data Science
  • Гранты для научных проектов и стартапов
  • Документация и Частые вопросы
  • Новости
  • Блог
  • Оплата
  • Документы
  • Сообщите о нарушении
  • Looking Glass
  • 02.02.2023

    Какие видеокарты выгоднее для бизнеса — RTX 4090 или серверная RTX A5000?

    server one
    HOSTKEY
    Арендуйте выделенный GPU сервер индивидуальной конфигурации с мощной GPU картой NVIDIA RTX 4090. Также доступны готовые выделенные и виртуальные GPU серверы с профессиональными графическими картами NVIDIA RTX A5000 / A4000 в надежных дата-центрах класса TIER III в Москве и Нидерландах. Принимаем оплату за услуги HOSTKEY в Нидерландах в рублях на счет российской компании. Оплата с помощью банковских карт, в том числе и картой МИР, банковского перевода и электронных денег.

    В этой статье мы сравним новинку от компании Nvidia — GeForce RTX 4090 — с различными профессиональными картами от этого производителя и попытаемся ответить на вопрос «Выгодно ли использовать новую видеокарту в рабочих процессах или все-таки лучше использовать серверные видеокарты?».

    Профессиональные и игровые GPU-карты имеют ряд значительных отличий, определяемых целью использования:

    • Сфера применения. Серверные видеокарты применяются в ML-разработке, рендеринге и моделировании сложных объектов, научных исследованиях, кинопроизводстве и т. д. Игровые видеокарты предназначены для индивидуального использования.
    • Охлаждение. Система охлаждения профессиональных карт выдувает горячий воздух из сервера или рабочей станции. Турбина охлаждения у них предназначена для постоянной работы. Игровые карты выдувают воздух вверх карты, они должны использоваться в специальных корпусах с хорошей системой вентиляции. Вентиляторы игровых карт не предназначены для длительной работы и выходят из строя при длительной постоянной эксплуатации.
    • Производительность и энергоэффективность. Профессиональные GPU позволяют производить больше вычислений при меньшем энергопотреблении. Эта особенность во многом определяет высокую стоимость серверных видеокарт.
    • Особенности производства. Контроль качества при изготовлении профессиональных карт строже, нежели при создании игровых.
    • Разъемы. Профессиональные карты не снабжены разъемами (HDMI, DVI) для вывода видео — есть только DisplayPort.
    • Дополнительный функционал. Не все серверные GPU могут быть использованы для игр.

    Обзор технологии GeForce RTX 4090

    Графический процессор GeForce RTX 4090 был выпущен в конце 2022 года и стал продолжением линейки десктопных ускорителей от компании NVIDIA, что вызвало большой интерес у игроков по всему миру.

    Ключевыми особенностями карты являются:

    • Как и во всей линейке GeForce RTX 40, используются новые графические процессоры AD10x (в 4090 — AD102) на основе архитектуры Ada Lovelace и с применением технологического процесса 4N (TSMC).
    • Повышена производительность операций трассировки лучей и машинного вычисления на тензорных ядрах.
    • Технологический процесс 4N позволяет повысить энергоэффективность на несколько процентов.
    • Размер карты (304 на 137 мм, 3 слота) осложняет ее монтаж как в настольных ПК, так и в серверах.
    • Игровая система охлаждения, что зачастую делает невозможным использование 4090 в GPU-серверах.
    • По сравнению с 3090, в AD102 на 70% больше CUDA-ядер.
    • Технология NVIDIA DLSS 3 использует алгоритмы анализа векторов движения и OFA.
    • Платформа NVIDIA Reflex с низкой задержкой позволяет повысить качество игры профессиональных геймеров.
    • Кодировщик NVEnc 8-го поколения с поддержкой кодирования AV1.
    • Приложение NVIDIA Broadcast.
    • NVIDIA Studio.

    Технические характеристики видеокарт NVIDIA RTX A4000, NVIDIA RTX A5000, NVIDIA RTX 3090 и NVIDIA RTX 4090

    RTX A4000 RTX A5000 RTX 3090 RTX 4090
    Архи­­­тек­тура Ampere Ampere Ampere Ada Lovelace
    Тех­­­про­­­цесс 8 нм 8 нм 8 нм 4N
    Графи­­­чес­­­кий про­­­цес­­­сор GA104 GA102 GA102 AD102
    Коли­­­че­­­ство тран­­­зис­­­то­­­ров (млрд.) 17,4 28,3 28,3 76,3
    Такто­­­вая час­­­то­­­та (ГГц) 0,74 1.17 1,39 2,23
    Такто­­­вая час­­­то­­­та с уско­­­ре­­­ни­­­ем (ГГц) 1.56 1.70 1.70 2,52
    Memory fre­­quen­­cy (МГц) 1,750 2,000 1,219 1,325
    Про­­пуск­­ная спо­­соб­­ность па­­мя­­ти (Гб/с) 448 768 936.2 1008
    Память GPU (Гб) 16 ГБ 24 24 24
    Тип памяти GDDR6 GDDR6 GDDR6X GDDR6X
    Cache memory (Мб) 4 6 6 72
    Память ECC есть есть нет нет
    Ядра CUDA 6 144 8192 10496 16384
    Тен­­зор­­ные ядра 192 256 328 512
    Ядра RT 48 64 82 128
    Коли­­чест­­во текс­­тур­­ных мо­­ду­­лей 192 256 328 512
    Мак­си­маль­ная мощ­ность (Вт) 140 230 350 450
    Вычисли­тель­ная произ­води­тель­ность FP16 (half) (тера­флопс) 19.2 27.8 35.6 82.6
    Вычисли­тель­ная произ­води­тель­ность FP32 (float) (тера­флопс) 19.2 27.8 35.6 до 82,6
    Вычисли­тель­ная произ­води­тель­ность FP64 (dou­ble) 599 гига­флопс 867.8 гига­флопс 556 гига­флопс 1.3 тера­флопс
    Теоре­тичес­кая макси­маль­ная ско­рость закраски (гига­пиксе­лей/с) 149.8 162.7 189.8 444
    Теоре­тичес­кая ско­рость выборки текстур (гига­тексе­лей/с) 149.8 433.9 566 1290
    Интер­фейс PCI-E 4.0 x16 PCI-E 4.0 x16 PCI-E 4.0 x16 PCI-E 4.0 x16
    NVIDIA DLSS нет нет есть 3
    Nvlink нет Двух­плат­ная низко­профиль­ная кон­фигура­ция (мосты на 2 и 3 слота) нет нет
    Поддерж­ка CUDA 8.6 8.6 8.6 8.9
    Поддерж­ка VULKAN 1.3 1.3 1.2 1.3
    DirectX 12 Ulti­mate 12 Ulti­mate 12 Ulti­mate 12 Ulti­mate
    Shader Model 6.6 6.6 6.7 6.7
    OpenGL 4.6 4.6 4.6 4.6
    OpenCL 3.0 3.0 3.0 3.0
    Поддержка ПО Virtual GPU (vGPU) NVIDIA Virtual PC (vPC) и Vir­tual Appli­cations (vApps), NVIDIA RTX vWS, NVIDIA Vir­tual Com­pute Ser­ver
    Цена (руб.) 111 917 216 000 116 990 от 138 000

    Новая архитектура, пропускная способность памяти и количество тензорных ядер, технология DLSS 3 и другие характеристики GeForce RTX 4090 определяют широкий спектр применения графического процессора — не только гейминг, но и работа с искусственным интеллектом, сложными вычислениями.

    Тестирование HOSTKEY

    Описание тестовой среды
    • Процессор AMD Ryzen 9 5900 X 12-Core Processor (3.80 GHz)
    • 32 GB DDR4-3200 ECC DDR4 SDRAM 1600 МГц
    • Microsoft Windows 10 Professional 64-разрядная

    Tест V-Ray GPU CUDA

    Tест V-Ray GPU RTX

    Blender Benchmark

    В этом тесте и в LuxMark мы сравним только карты RTX A5000 и RTX 4090, поскольку они наиболее интересны в контексте этой статьи.

    LuxMark

    Мы измерили относительную производительность GPU при рендеринге. Показатели GeForce RTX 4090 в тестах выглядят впечатляюще и превосходят практически вдвое не только результаты RTX 3090, но и профессиональные GPU. Тест V-Ray GPU RTX демонстрирует работу GPU с трассировкой лучей — показатели RTX 4090 также в два раза превосходят результаты RTX 3090.

    «Собаки против кошек»

    Для сравнения производительности GPU для нейросетей мы используем набор данных «Собаки против кошек» — тест анализирует содержимое фотографии и различает, изображена на фото кошка или собака. Все необходимые исходные данные находятся здесь. Мы запускали этот тест на разных GPU и в различных облачных сервисах, получили следующие результаты:

    Полный цикл обучения (мин.)

    Полный цикл обучения тестовой нейросети занял от 31 до 60 минут. Результат GeForce RTX 4090 составил 31 минуту и превзошел показатели всех остальных GPU. Наиболее заметна разница в результатах карт RTX 3090 и RTX 4090 — новое поколение ГПУ от NVIDIA справилось с расчетами почти вдвое быстрее предыдущего.

    Тесты показали, что ближайшим конкурентом карты 4090 является A5000. Осталось сравнить эти карты по соотношению цена-качество. Во всех проведенных тестах новая карта от Nvidia показала результат, превышающий показатель RTX A5000 примерно вдвое. В то же время стоимость RTX 4090 значительно ниже: 138 тысяч рублей (минимальная цена) против 216 тысяч. Казалось бы, выбор очевиден — но есть нюансы. GPU A5000 потребляет значительно меньше энергии и может быть выгодным решением для задач с постоянной высокой нагрузкой на GPU на длинной дистанции. RTX A5000 поддерживает технологию NVLink, что полезно при обучении нейронных сетей. GPU A5000 не имеют ограничений на использование NVENC/NVDEC при задачах параллельного транскодирования видео. При покупке специализированной лицензии профессиональные GPU класса A5000 могут быть виртуализированны и доступны в сервере как несколько виртуальных GPU меньшей мощности. Еще одна проблема — запрет Nvidia на использование драйверов для своих игровых карт в дата-центрах и в удаленном режиме вне офиса.

    Хотя на промофото NVidia много 4090 с большими вентиляторами и формате 3 юнита, в реальности эту конфигурацию практически невозможно купить. На складах есть только игровые карты большого размера на 4 юнита и повышенной высоты с выдувом вверх и вниз карты. Такие карты не могут быть использованы в серверах и большинстве рабочих станцией.

    Заключение

    Переход на новую архитектуру Ada Lovelace позволил значительно увеличить производительность GeForce RTX 4090. Улучшенные тензорные ядра и ядра RT значительно повышают качество и расширяют возможности трассировки лучей в реальном времени. Объем памяти в 24 Гб позволяет обрабатывать большие массивы данных.

    GeForce RTX 4090 в первую очередь предназначена для гейминга и прекрасно подходит для решения различных типов вычислительных задач: ИИ, анализ данных, машинное обучение. Новая архитектура значительно превосходит предыдущее поколение графических процессоров от NVIDIA. Важным ограничением в профессиональном использовании этой видеокарты — высокое энергопотребление и отсутствие возможности объединить несколько карт при помощи Nvlink.

    Альтернативой приобретению видеокарты является аренда сервера с GPU. Наши расчеты показывают, что месячная аренда карт GeForce RTX 4090 и RTX A5000 сопоставима по цене. Соответственно, при необходимости выполнения профессиональных задач аренда карты GeForce RTX 4090 может быть выгодна за счет ее высокой производительности.

    Арендуйте выделенные и виртуальные GPU серверы с профессиональными графическими картами NVIDIA RTX A5000 / A4000 в надежных дата-центрах класса TIER III в Москве и Нидерландах. Принимаем оплату за услуги HOSTKEY в Нидерландах в рублях на счет российской компании. Оплата с помощью банковских карт, в том числе и картой МИР, банковского перевода и электронных денег.

    Другие статьи

    17.04.2024

    Как выбрать правильный сервер c подходящими для ваших нейросетей CPU/GPU

    Рассказываем о наиболее важных компонентах, которые влияют на выбор сервера для искусственного интеллекта

    05.04.2024

    VPS, хостинг сайтов или конструктор? Где разместить сайт бизнесу?

    Давайте сравним размещение сайта на VPS, хостингах сайтов (общих хостингах) и в популярных конструкторах сайтов.

    21.03.2024

    Есть ли жизнь после Microsoft Teams и OneDrive?

    Ищем альтернативу облачным сервисам Microsoft. Чем заменить Microsoft Teams, OneDrive, Excel, Microsoft 365 и Azure

    07.03.2024

    Как AI помогает побороть монополию в спортивной рекламе и при чем тут GPU и выделенные серверы

    ИИ и AR-технологии позволяют адаптировать рекламу на спортивных соревнованиях под разные аудитории в реальном времени, используя облачные GPU-решения.

    14.02.2024

    От xWiki к static-HTML. Как мы документацию «переезжали»

    Выбор платформы для создания портала с внешней и внутренней документацией. Перенос документов с cWiki на Material for MkDocs

    HOSTKEY Выделенные серверы в Европе, России и США Готовые решения и индивидуальные конфигурации серверов на базе процессоров AMD, Intel, карт GPU, Бесплатной защитой от DDoS-атак и безлимитный соединением на скорости 1 Гбит/с 30
    4.3 48 48
    Upload