-
-
Notifications
You must be signed in to change notification settings - Fork 5.7k
Software requirements and Docker container (in Russian)
Актуальная версия на англ. – тут на сайте mlcourse.ai
В курсе используются тетрадки Jupyter
, библиотеки Pandas
, Sklearn
, Xgboost
, Vowpal Wabbit
и некоторые другие. Большинство пакетов можно поставить через питоновский установщик pip
, но проще установить Anaconda
с python3 – там будет уже куча нужных библиотек. Дополнительно для курса понадобятся разве что Xgboost
, Vowpal Wabbit
. Плюс по желанию (скорее всего для соревнований) LightGBM
и CatBoost
.
Здорово, удобно – Jupyter-ноутбуки прямо в браузере с установленной Anaconda, на первые 7 занятий точно хватит. Правда, загружать-выгружать данные может быть мучительно. Скорее всего захочется все же Anaconda локально поставить.
Все перечисленное можно не устанавливать, а использовать Docker-контейнер (требования: около 4 Гб места на диске, 4 Гб RAM). Введение в Docker. Рекомендуется тем, кто использует Windows, c *NIX проще самостоятельно установить необходимое (см. Dockerfile).
Инструкция:
- скачать данный репозиторий
- на Windows скорее всего придется включить в BIOS виртуализацию, если раньше не использовали виртуальные машины или Docker
- установить Docker
- перейти в командной строке/терминале в скачанный каталог mlcourse_open
- выполнить
python run_docker_jupyter.py
. Первый раз это займет 5-10 минут (в зависимости от скорости соединения) - docker-образ скачается с hub.docker - при желании можно добавить установку дополнительных библиотек в Dockerfile, собрать локально образ Docker:
docker build -t <tag_name> .
и выполнитьpython run_docker_jupyter.py -t <tag_name>
- открыть localhost:4545
- далее можно выполнить тетрадку check_docker.ipynb и убедиться, что нужные библиотеки подключаются
Контейнеры Docker, как правило, занимают много места на диске.
- docker ps – посмотреть весь список контейнеров
- docker stop $(docker ps -a -q) – остановить все контейнеры
- docker rm $(docker ps -a -q) – удалить все контейнеры
- docker images - посмотреть весь список образов
- docker rmi <image_id> – удалить ненужный образ
Доступная и понятная документация Docker с примерами