Apache DataSketches 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
Apache DataSketches 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
Apache DataSketches 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
Apache DataSketches 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
Apache DataSketches 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !
授权协议 Apache-2.0
开发语言 Java 查看源码 »
操作系统 跨平台
软件类型 开源软件
所属分类 大数据数据处理
开源组织 Apache
地区 不详
投 递 者 Alias_Travis
适用人群 未知
收录时间 2021-02-05

软件简介

Apache DataSketches 是开源的高性能大数据流算法库,主要针对大规模计算环境。Apache DataSketches 的专用流算法库(也被称为 sketches)包含小型数据结构,并可大规模处理数据。对于那些想要生成精确结果,但又无法承受大量时间和计算资源消耗的查询,sketches 是一个理想的选择。而对于那些能够接受近似结果的客户,sketches 也是附带实时分析交互式查询的唯一可行选择。

特性:

  • 快速:sketches 算法可一次处理适用于实时和批处理的数据。围绕 sketches 设计系统可以简化系统的体系结构,并减少所需的总体计算资源。
  • 大数据:该库专门为必须处理海量数据的生产系统而设计的。该库包括适用于 Apache Hive、Apache Pig 和PostgreSQL(C ++)。具有跨语言(Java,C ++,Python)和平台的特性。
  • 分析:内置的 Theta Sketch 集运算符(Union,Intersection,Difference)生成 sketches,从而启用基数的完整集表达式,例如(A∪B)∩(C∪D)\( E∪F)。这种功能以及可预测的准确性为快速查询提供了前所未有的分析能力。
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
02/05 08:44

Apache 软件基金会将 DataSketches 提升为顶级项目

紧跟着 Apache Superset 和 Apache ECharts 的步伐,Apache 软件基金会(ASF)近日宣布将 Apache DataSketches 提升为顶级项目(Top-Level Project,TLP)。 Apache DataSketches 是开源的高性能大数据流算法库,主要针对大规模计算环境,目前有非常多的企业均在使用,例如:尼尔森、Permutive、Splice Machine 和 Verizon 等。该项目于 2012 年起源于 Yahoo,并于 2015 年开源,随后于 2019 年 3 月进入 Apache 孵化器。 Apac...

2
17
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
2020/09/09 17:12

datasketches-辅助Hive计算分位数

### 1. 将下面三个jar包添加进hive的hive.aux.jars.path目录里面 ```xml org.apache.datasketches datasketches-hive 1.1.0-incubating org.apache.datasketches datasketches-java 1.3.0-incubating org.apache.datasketches datasketches-memory 1.2.0-incubating ``` ### 2. 打开hive客户端,执行添加jar包命令,将3个jar包添加进去 ```shell add jar xxx.jar ``` ### 3. 创建函数,以求double类型的四分位数为例 - 创建函数...

0
0
发表了博客
2018/02/23 11:49

apache

#apache ##apache介绍   apache是个开源的网页服务器,也是个模块化的服务器。   apache可以支持SSL技术,支持多个虚拟主机。   apache是以进程为基础的架构,进程要比线程消耗更多的系统开支,不太适合多处理器环境,因此在一个apache web 站点扩容时,通常是增加服务器或扩充集群节点而不是增加处理器。 ##apache的特性   1.支持HTTP/1.1通信协议   2.拥有简单而强有力的基于文件的配置过程   3.支持通用网关接口   4.支持基于IP和基...

0
0
2018/05/04 13:32

Apache

1.常见命令 1.1 sudo apachectl -v  //一般来说Mac系统都会自带Apache环境,此命令的用处是查看当前系统的Apache版本 1.2 sudo apachectl -k start //启动Apache 此步骤过后就可以查看Apche是否已经启动了,在safari地址栏中输入”http://localhost“或”127.0.0.1“,如果网页中出现”ItWork!“则表示已经启动。 1.2 sudo apachectl -k stop //停止Apache 1.3 sudo apachectl -k restart //重启Apache...

0
0
发表了博客
2012/07/11 10:47

apache

Apache是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。同时Apache音译为阿帕奇,是北美印第安人的一个部落,叫阿帕奇族,在美国的西南部。也是一个基金会的名称、一种武装直升机等等。 http://baike.baidu.com/view/28283.htm

0
1
发表了博客
2020/09/03 19:41

Apache Windows下Apache安装步骤

1.apache官网下载Apache HTTP Server服务器 我相信有些朋友刚用apache服务器时,都希望从官网上下载,而面对着官网上众多的项目和镜像以及目录,也许有点茫然。下面是具体步骤: ①、打开apache官网http://httpd.apache.org/ (或百度"download apache")。 ②、点击Download,出现以下界面 。 ③、选择Windows版下载,点击链接。 ④、在新的界面中,会发现VC9和VC11字样,通过阅读相关内容得知,VC9是指用VS2008编译的代码,而...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
0 评论
11 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部