Перейти к содержанию

TensorFlow

В этой статье

Информация

TensorFlow - это открытая программная библиотека для машинного обучения и искусственного интеллекта, разработанная компанией Google. Она предоставляет гибкую и масштабируемую экосистему инструментов, библиотек и ресурсов сообщества, которые позволяют исследователям и разработчикам создавать и развертывать приложения с поддержкой машинного обучения. Архитектура TensorFlow основана на вычислительных графах, которые представляют собой совокупность узлов (операций) и ребер (потоков данных). Вычисления выполняются в сессиях, которые управляют потоком данных и распределением ресурсов.

TensorFlow. Основные возможности

  • Готовая к использованию среда: предустановленная последняя стабильная версия TensorFlow. Оптимизированные драйверы NVIDIA и настройки CUDA. Поддержка создания и управления множеством виртуальных сред Python.
  • Поддержка различных типов моделей машинного обучения: возможность создавать и обучать широкий спектр моделей, включая нейронные сети, линейную регрессию, логистическую регрессию и многие другие. Это универсальный инструмент для решения разнообразных задач машинного обучения.
  • Масштабируемость: позволяет обучать модели на больших объемах данных. Эта библиотека может эффективно использовать вычислительные ресурсы, распределяя нагрузку между несколькими процессорами или графическими процессорами.
  • Гибкость: TensorFlow предоставляет гибкий программный интерфейс, позволяющий разработчикам создавать модели машинного обучения с учетом своих конкретных потребностей. Он поддерживает различные уровни абстракции, от низкоуровневого управления вычислениями до высокоуровневых API для быстрого прототипирования.
  • Инструменты визуализации: наличие инструментов визуализации структуры моделей, графов вычислений и данных. Этот функционал помогает лучше понимать и отлаживать модели, а также облегчает интерпретацию результатов.
  • Поддержка распределенных вычислений: возможность распределять вычисления между несколькими устройствами, такими как ЦП и ГПУ, а также между несколькими машинами в кластере. Это обеспечивает ускорение обучения и вывода моделей за счет параллельных вычислений.
  • Интеграция с другими библиотеками: TensorFlow можно легко интегрировать с другими популярными библиотеками для машинного обучения, такими как Keras, scikit-learn и многими другими.
  • Обширное сообщество и обучающие ресурсы: активное сообщество пользователей и разработчиков, работающих с TensorFlow, а также множество обучающих ресурсов, таких как документация, учебные курсы, туториалы и примеры кода.

Приватный сервер с TensorFlow предназначен для исследователей, разработчиков и компаний, которым требуется безопасная и производительная вычислительная среда для разработки и обучения моделей машинного обучения с использованием TensorFlow. Он обеспечивает полный контроль над ресурсами и конфиденциальность данных, а также ускоряет процесс обучения моделей за счет использования современных GPU NVIDIA.

Особенности сборки

  • Возможна установка на Ubuntu 22.04;
  • Время на установку 15-30 минут вместе с OS;
  • Установка Python, TensorFlow, CUDA, драйверов NVIDIA;
  • Домашняя директория пользователя user - home/user
  • Системные требования: профессиональная видеокарта (NVIDIA RTX A4000/A5000, NVIDIA H100), не менее 16 ГБ оперативной памяти.

Начало работы после развертывания TensorFlow

После оплаты заказа на указанную при регистрации электронную почту придет уведомление о готовности сервера к работе. В нем будет указан IP-адрес VPS, а также логин и пароль для подключения. Управление оборудованием клиенты нашей компании осуществляют в панели управления серверами и APIInvapi.

Данные для авторизации, которые можно найти или во вкладке Info >> Tags панели управления сервером или в присланном e-mail:

  • Логин: root - для администратора, user - для работы с TensorFlow;
  • Пароль: для администратора - приходит в письме на вашу электронную почту при сдаче сервера, для пользователя user расположен в файле /root/user_credentials;

Подключение и первоначальные настройки

После получения доступа к серверу необходимо установить соединение с ним по протоколу SSH с правами суперпользователя (root):

ssh root@<server_ip>
Затем выполнить команду:

nano /root/user_credentials
После выполнения команды будет открыт текстовый файл, содержащий учетные данные пользователя user. Необходимо скопировать пароль для пользователя user.

Затем завершить сессию root и вновь подключиться к серверу по SSH от имени пользователя user, используя скопированный пароль.

После перехода в учетную записьuserнеобходимо активировать виртуальное окружение venv командой:

. tensorflow.sh

Теперь вы можете приступить к работе в интерпретаторе Python, запустив его командой:

python
Интерпретатор готов к вводу команд и выполнению кода.

Для проверки работы библиотеки и поддержка GPU можно набрать в консоли Python следующую программу:

import tensorflow as tf
print(tf.reduce_sum(tf.random.normal([1000, 1000])))
Первая строка импортирует библиотеку TensorFlow, а вторая создает тензор случайных чисел размера 1000x1000 из нормального распределения, вычисляет сумму его элементов и выводит результат. Пример вывода:

Также можно использовать скрипт тренировки tensorflow-2-simple-examples. Предварительно необходимо создать файл и скопировать в него текст скрипта. Пример вывода:

Примечание

Подробная информация по основным настройкам TensorFlow содержится в документации разработчиков.

Заказ сервера с TensorFlow с помощью API

Для заказа сервера с нужным ПО с помощью API используйте данную инструкцию.