翻译于 2014/06/27 08:28
几周前我们发布了一个Apache Hadoop 2.3的Docker镜像——在非常短的时间内它已经成为了Dcocker登记册 最流行的Docker镜像.
随着Hadoop2.3Docker镜像 的成功,用户在Hadoop发布周期内给予了反馈和新的功能需求, 我们发布了一个人Apache Hadoop 2.4镜像 – 它同样是官方Docker登记册上的一个值得信赖的自动构建.
请注意除了这个Hadoop镜像之外,我们也发布并维护者一个伪分布式的以及分布式的配备了Apache Ambari的Hadoop Docker镜像. 因为它们配备了Ambari,你可以选择进行修改,使用集群图添加或者移除Hadoop组件.
如果你想直接从Docker文件进行尝试你可以这样做来构建它的镜像:
docker build -t sequenceiq/hadoop-docker .
因为在Docker的自动构建仓库中发布了官方的Docker镜像-你可以在启动容器时pull或引用这个镜像。
docker pull sequenceiq/hadoop-docker:2.4.0
使用你刚才构建或pull的Docker镜像:
docker run -i -t sequenceiq/hadoop-docker /etc/bootstrap.sh -bash
你可以运行股票例子中的一个:
cd $HADOOP_PREFIX # run the mapreduce bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.0.jar grep input output 'dfs[a-z.]+' # check the output bin/hdfs dfs -cat output/*
Hadoop的构建是一个很不容易的工作-需要很多相应版本的库,protobuf等,并且需要一些时间-我们已经简化了这些工作,在我们的Bintray 仓库中构建并发布了一个64位版本的hadoop本地lib,尽情享用吧。
评论删除后,数据将无法恢复
评论(0)