Presto 0.180 已发布,Presto 是 Facebook 开源的数据查询引擎,可对250PB以上的数据进行快速地交互式分析,查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。
Presto 可以查询包括 Hive、Cassandra 甚至是一些商业的数据存储产品。单个 Presto 查询可合并来自多个数据源的数据进行统一分析。
更新内容:
添加对 “INSERT” 的支持
添加对使用 Kerberos 进行身份验证的支持
添加对使用 SOCKS 或 HTTP 代理执行查询的支持
允许在每个连接的基础上配置 SSL / TLS 和 Kerberos 属性
下载地址:
引用来自“eechen”的评论
Linux单机用EXT4文件系统配上TB容量的硬盘组RAID就能应付TB级别数据的存储.GB级硬盘就能存储亿级别的数据:
http://www.cnblogs.com/nnhy/p/BigData.html
4亿条数据,磁盘占用26.5G,内存占用150M.
SQLite点查询(使用索引),耗时20毫秒.
所以说,PB级别才是大数据,但谁动不动就有PB级的大数据?靠吹?
引用来自“开源中国首席屌炸天”的评论
这个 @eechen 就是个笑话,天天要喊着吊打,结果现在挂在树上惨遭吊打,屁都不敢放一个,又一个神棍被拉下神坛 --via FalconChen . 有链接有真相: https://www.oschina.net/question/253880_2236467引用来自“eechen”的评论
Linux单机用EXT4文件系统配上TB容量的硬盘组RAID就能应付TB级别数据的存储.GB级硬盘就能存储亿级别的数据:
http://www.cnblogs.com/nnhy/p/BigData.html
4亿条数据,磁盘占用26.5G,内存占用150M.
SQLite点查询(使用索引),耗时20毫秒.
所以说,PB级别才是大数据,但谁动不动就有PB级的大数据?靠吹?
GB级硬盘就能存储亿级别的数据:
http://www.cnblogs.com/nnhy/p/BigData.html
4亿条数据,磁盘占用26.5G,内存占用150M.
SQLite点查询(使用索引),耗时20毫秒.
所以说,PB级别才是大数据,但谁动不动就有PB级的大数据?靠吹?