+
 新版
2015-06-05 18:35
spark怎么就成大数据核心了1
2015-06-05 10:29
现在各开源大数据项目的计算核心都开始支持spark或者向spark迁移,比如hive,mahout,皆缘之spark有一套RDD API,让大数据开发者摆脱Map-Reduce的束缚,让开发者开发的轻松,运行效率也提高一、两个数量级。目前还有一个Tez项目试图挽救Map-Reduce,不过也不能阻止spark成为大数据计算核心项目的步伐。
2015-06-05 10:14

引用来自“二的基本算合格”的评论

Storm被Spark压制的厉害啊,刚正面有点虚~~怎么办呢~~

引用来自“仪山湖”的评论

确实压制的很厉害,spark项目源之伯克利分校AMP Lab。spark的RDD是通用分布式计算的一个高度抽象和实现,基本接近于自然描述语言,该项目已经衍生出shark,MLLib,Spark Stream,graphx四个大的子项目。现在spark是apache中最活跃的一个开源项目,有一百多家顶级IT公司参与其中。AMP Lab的中的原创人马已经成立创业公司databricks,被硅谷的投资者认定为最有发展潜力的数据创业公司,超过cloudera、hortonworks.
目前的确HDFS存储+Spark计算,是一个比较稳妥的方案~~Storm再观望一下吧,Clojure还指望它翻身呢~~
2015-06-05 09:46

引用来自“二的基本算合格”的评论

Storm被Spark压制的厉害啊,刚正面有点虚~~怎么办呢~~
确实压制的很厉害,spark项目源之伯克利分校AMP Lab。spark的RDD是通用分布式计算的一个高度抽象和实现,基本接近于自然描述语言,该项目已经衍生出shark,MLLib,Spark Stream,graphx四个大的子项目。现在spark是apache中最活跃的一个开源项目,有一百多家顶级IT公司参与其中。AMP Lab的中的原创人马已经成立创业公司databricks,被硅谷的投资者认定为最有发展潜力的数据创业公司,超过cloudera、hortonworks.
2015-06-05 09:04
前两年玩过,目前感觉spark的新闻更多。。。
2015-06-05 08:50
Storm被Spark压制的厉害啊,刚正面有点虚~~怎么办呢~~
回复 @
{{emojiItem.symbol}}
返回顶部
顶部