分布式流处理框架 Apache Samza 迎来 1.0 版本

王练
 王练
发布于 2018年11月29日
收藏 10

Apache Samza 1.0 已发布,新版本为现有的工具库添加了各种功能,并对文档、代码片段、示例等进行了改进。Apache Samza 是一个分布式流处理框架,专用于实时数据的处理,目前已经在几个大公司实际生产中使用,如 LinkedIn、VMWare、Slack、Redfin 等。

更新亮点:

  • 高级 API 更稳定

  • Beam Runner 支持改进

  • Joining Streams and Tables(Table API 为开发人员提供了对本地和远程数据源的统一访问,同时提供了速率限制和缓存等功能)

  • 新增一个测试框架,允许使用内存中的输入和输出来测试 Samza 应用,无需再设置其他服务,如 Kafka、YARN 或 Zookeeper

  • 支持 Log4J2

  • Kafka 升级至 v0.11.1.62

  • SamzaSQL 现在提供一个 shell 来输入 SQL 查询

  • 支持 Side-inputs

  • 网站、文档和示例改进

更多细节可查阅发行说明:

https://blogs.apache.org/samza/entry/announcing-the-release-of-samza

下载地址:

https://dist.apache.org/repos/dist/release/samza/1.0.0/

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:分布式流处理框架 Apache Samza 迎来 1.0 版本
加载中
返回顶部
顶部