Tablesaw 这个东西用来做数据分析怎么样

红薯官方 发布于 2016/08/28 16:39
阅读 791
收藏 0

Tablesaw - “大数据”

谈到大数据,我们想到的总是Hodoop加上集群部署,但有没有一种更小巧的方式,能让我们在单机上方便地实现大数据的那些功能呢?Tablesaw给我们提供了一种基于内存的高性能大数据解决方案。你可以使用它的API方便地从RDBMS或是CSV中导入数据,然后利用Tablesaw提供的接口对数据进行排序、筛选、分组、map/reduce等操作。

根据文档给出的说明,你将可以在22秒内将500,000,000行(每行4个字段)的数据文件加载到10G的内存中。而查询速度更是达到仅需1-2ms。


还不知道数据分析该怎么做,是抽取转换然后再存储吗

加载中
0
红薯官方
红薯官方

UserGuide

https://jtablesaw.wordpress.com/an-introduction/

0
红薯官方
红薯官方

Example:

https://jtablesaw.wordpress.com/2016/07/30/new-plot-types-in-tablesaw/

返回顶部
顶部