开源大数据流水线系统 PiFlow V1.0 发布

来源: 投稿
作者: judy_0131
2021-05-13

PiFlow是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。本次版本更新如下特性:

  1. 增加了运行单个数据处理组件、当前及以下数据处理组件功能;
  2. 增加了测试数据管理功能;
  3. 增加了数据处理组件显隐功能;
  4. 增加了表格组件,支持数据下载;
  5. 增加了Sql编辑器;
  6. 针对页面友好性进行了优化;

GitHub地址: https://github.com/cas-bigdatalab/piflow

1)运行单个数据处理组件

2)测试数据管理

3)数据处理组件显隐

4)表格组件

5)Sql编辑器

 

联系方式:18612673095(微信号)

展开阅读全文
18 收藏
分享
加载中
更多评论
0 评论
18 收藏
分享
返回顶部
顶部