Este respoitório foi baseado (neste repositório)[https://github.com/sequenceiq/hadoop-docker]
Para gerar a imagem localmente sem precisar baixa-la do servidor basta executar o comando:
docker build -t aquelatecnologia/hadoop:2.9.2 .
Feito isso pode-se testar usando o comando
docker run -it aquelatecnologia/hadoop:2.9.2 /etc/bootstrap.sh -bash
Para usar o docker-compose basta executar o seguinte comando:
docker-compose up
Para testar o hadoop, basta executar o seguinte comando dentro do container:
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar grep input output 'dfs[a-z.]+'
# verificar a saída
$HADOOP_HOME/bin/hdfs dfs -cat output/*