开源大数据流水线系统 PiFlow V1.1 发布

来源: 投稿
作者: NatureZhou
2021-09-06

piflow-logo2.png

PiFlow是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。本次版本更新如下特性:

  1. 新增交互式编程功能,支持在线编写代码并进行调试;
  2. 新增全局参数功能,支持定义全局参数,并在流水线中全局可用;
  3. 优化后端代码,统一持久化框架MyBatis;
  4. 修复已知Bug;

GitHub地址: https://github.com/cas-bigdatalab/piflow
Gitee地址: https://gitee.com/opensci/piflow

1)交互式编程

2)全局变量

 

展开阅读全文
27 收藏
分享
加载中
最新评论 (3)
这个不错
2021-09-07 22:15
0
回复
举报
这个要试一下
2021-09-07 00:26
0
回复
举报
mark
2021-09-06 23:31
0
回复
举报
更多评论
3 评论
27 收藏
分享
返回顶部
顶部