StreamX v1.1.1 发布,Flink 开发脚手架、流批一体平台

来源: 投稿
作者: benjobs
2021-07-14

Make Flink|Spark easier!!!

    

 

        大数据技术如今发展的如火如荼,已呈现百花齐放欣欣向荣的景象,实时处理流域 Apache Spark 和 Apache Flink 更是一个伟大的进步,尤其是Apache Flink被普遍认为是下一代大数据流计算引擎, 我们在使用 Flink 时发现从编程模型, 启动配置到运维管理都有很多可以抽象共用的地方, 我们将一些好的经验固化下来并结合业内的最佳实践, 通过不断努力终于诞生了今天的框架 —— StreamX, 项目的初衷是 —— 让 Flink 开发更简单, 使用StreamX开发,可以极大降低学习成本和开发门槛, 让开发者只用关心最核心的业务,StreamX 规范了项目的配置,鼓励函数式编程,定义了最佳的编程方式,提供了一系列开箱即用的Connectors,标准化了配置、开发、测试、部署、监控、运维的整个过程, 提供scalajava两套api, 其最终目的是打造一个一站式大数据平台,流批一体的解决方案.

        StreamX 遵循 Apache-2.0 开源协议,将会是个长期更新的活跃项目,欢迎大家提交PRIssue。喜欢请给个 Star。您的支持是我们最大的动力, 该项目从开源以来受到不少朋友的关注和认可,表示感谢,已陆续有来自金融,在线教育,数据分析,车联网,智能广告,地产等公司的朋友在使用或二开,也不乏来自一线大厂的朋友在研究使用,继本次小版本升级之后,会大力推进k8s部署的支持,元数据的打通和实时数仓的支持.欢迎更多的开发者加入一块贡献,只有坚持做下去,并且做好才有意义,如果眼下还是一团薪薪之火,大家的热情一定可以让她烈焰燎原起来.

更新日志
​​​​​1. kerberos 自动续期bug修复  
2. 参数配置优先级相关bug修复(flink-conf.yaml中参数优先级比页面任务级别优先级大)
3. 标准apache flink任务在编辑时mainClass不回显的bug修复
4.  邮件发送参数设置相关bug修复
5. parallelism和slot参数设置不生效bug修复
6. 项目在下载maven 依赖时发生错误导致任务名称全被修改的bug修复
7. 用户登录返回前端的用户登录信息带有"盐",优化修复 (issue/240)
8. 修复启动脚本中可能存在的找不到jdk环境的bug (issue/238)
9. 新增消息推送,构建失败,任务失败消息推送到前端

功能列表

  • 开发脚手架

    [] 简化八股文编程步骤,更便捷的api,全新的编程体验                     [重要特性]
    [] DataStream和flink SQL一致的编程体检                                      [重要特性]
    [] 约定优于配置,封装配置信息和env环境信息                                 [重要特性]
    [] 常用connector二次封装,开箱即用                                                [重要特性]
    [] DataStream和flink Sql方法扩展,更丝滑的操作支持                    [重要特性]

  • 系统管理

    [] 用户管理, 新增,修改,删除,多租户支持
    [] 角色管理, 新增,修改,删除
    [] 菜单管理, 新增,修改,删除, 给角色分配权限,到按钮级别的权限控制

  • 项目管理

    [] 项目创建,删除(目前只支持git)                                                      [重要特性]
    [] 项目编译,实时查看编译日志                                                         [重要特性]
    [] 项目列表过滤查询,分页

  • 作业管理

    [] 作业启动,停止,重启,删除,火焰图(非flink内置)                   [重要特性]
    [] 停止时自动savePoint,启动时从savePoint恢复                             [重要特性]
    [] 自动记录每次任务checkpoint的路径信息,启动时自动恢复         [重要特性]
    [] 可视化 Flink SQL 编辑器,格式化,语法校验,保存                     [重要特性]
    [] flinkSQL 任务多版本的支持                                                            [重要特性]
    [] application 部署模式                                                                       [重要特性]
    [] 多版本flink的支持(flink 1.11.x,1.12.x,1.13.0)                                   [重要特性]
    [] 任务历史版本备份于和回滚                                                            [重要特性]
    [] 任务依赖管理,支持标准maven pom坐标的依赖和手动上传jar    [重要特性]
    [] 任务实时状态显示与实际任务保持一致                                         [重要特性]
    [] 任务监控,失败告警,发送邮件通知,自动重启                                  [重要特性]
    [] 针对checkpoint连续失败的处理(邮件告警|重启)                          [重要特性]
    [] kerberos的认证支持                                                                        [重要特性]
    [] 作业创建,删除,编辑,更新,保存,常规参数配置。
    [] 任务启动失败的日志在线查看
    [] yarn pre job 部署模式
    [] 作业列表的查看,过滤,分页。

Notebook:
    [] 实验性功能,在线作业编写运行

Next version:
    [] 本地上传jar任务的支持
    [] 操作接口开放(rest请求可以控制任务启动|停止|savePoint等)
    [] 其他反馈的bug修复

大版本功能:

    [] 容器化部署(docker), k8s 部署模式
    [] SQL 的在线开发增强,智能提示,数据采样, 测试, 运行
    [] 元数据支持
    [] 定时任务集成(针对批作业定时调度)
    [] 单点部署故障解决,HA高可用

重要特性

  1. 开发脚手架
  2. 多版本Flink支持(多版本无缝支持1.11.x,1.12.x,1.13.x)
  3. 一系列开箱即用的connectors
  4. 支持项目编译功能(maven 编译)
  5. 在线参数配置
  6. 支持 Applicaion 模式, Yarn-Per-Job 模式启动
  7. 快捷的日常操作(任务启动,停止,savepoint,从savepoint恢复)
  8. 支持火焰图
  9. 支持 notebook (在线任务开发)
  10. 项目配置和依赖版本化管理
  11. 在线管理依赖(maven pom)和自定义jar
  12. Flink SQL WebIDE
  13. 支持 Catalog、Hive
  14. 任务失败告警和重试重启

软件架构

项目地址

官网:http://www.streamxhub.com

Github: streamxhub/streamx: Make Flink|Spark easier!!! (github.com)

Gitee: benjobs/StreamX (gitee.com)

快速上手

展开阅读全文
25 收藏
分享
加载中
最新评论 (3)
流批
2021-07-14 11:54
0
回复
举报
to0
zan
2021-07-14 10:26
0
回复
举报
666666666666666666666
2021-07-14 10:22
0
回复
举报
更多评论
3 评论
25 收藏
分享
返回顶部
顶部