Spark 0.7.0 发布,开源集群计算环境

GDP_搞地皮
 GDP_搞地皮
发布于 2013年03月31日
收藏 17

Spark 团队很高兴的宣布 0.7.0 版本发布,这是一个新的主要版本,带来很多新特性,值得关注的有:Python API for Sparkalpha of Spark Streaming. 同时包含很多改进,下载地址: source package (4 MB tar.gz) or prebuilt package (60 MB tar.gz).

Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。

Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架。与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Spark 0.7.0 发布,开源集群计算环境
加载中

最新评论(1

stormcc
stormcc
Python API for Spark ----期待了这么久了
返回顶部
顶部