Skip to content

Software requirements and Docker container (in Russian)

Yury Kashnitsky edited this page Jan 5, 2022 · 4 revisions

Актуальная версия на англ. – тут на сайте mlcourse.ai

Pip и Anaconda

В курсе используются тетрадки Jupyter, библиотеки Pandas, Sklearn, Xgboost, Vowpal Wabbit и некоторые другие. Большинство пакетов можно поставить через питоновский установщик pip, но проще установить Anaconda с python3 – там будет уже куча нужных библиотек. Дополнительно для курса понадобятся разве что Xgboost, Vowpal Wabbit. Плюс по желанию (скорее всего для соревнований) LightGBM и CatBoost.

Azure ML & Kaggle kernels

Здорово, удобно – Jupyter-ноутбуки прямо в браузере с установленной Anaconda, на первые 7 занятий точно хватит. Правда, загружать-выгружать данные может быть мучительно. Скорее всего захочется все же Anaconda локально поставить.

Инструкция по установке Docker-контейнера

Все перечисленное можно не устанавливать, а использовать Docker-контейнер (требования: около 4 Гб места на диске, 4 Гб RAM). Введение в Docker. Рекомендуется тем, кто использует Windows, c *NIX проще самостоятельно установить необходимое (см. Dockerfile).

Инструкция:

  • скачать данный репозиторий
  • на Windows скорее всего придется включить в BIOS виртуализацию, если раньше не использовали виртуальные машины или Docker
  • установить Docker
  • перейти в командной строке/терминале в скачанный каталог mlcourse_open
  • выполнить python run_docker_jupyter.py. Первый раз это займет 5-10 минут (в зависимости от скорости соединения) - docker-образ скачается с hub.docker
  • при желании можно добавить установку дополнительных библиотек в Dockerfile, собрать локально образ Docker: docker build -t <tag_name> . и выполнить python run_docker_jupyter.py -t <tag_name>
  • открыть localhost:4545
  • далее можно выполнить тетрадку check_docker.ipynb и убедиться, что нужные библиотеки подключаются

Контейнеры Docker, как правило, занимают много места на диске.

  • docker ps – посмотреть весь список контейнеров
  • docker stop $(docker ps -a -q) – остановить все контейнеры
  • docker rm $(docker ps -a -q) – удалить все контейнеры
  • docker images - посмотреть весь список образов
  • docker rmi <image_id> – удалить ненужный образ

Доступная и понятная документация Docker с примерами