Apache Gravitino - 开源统一元数据服务
Apache Gravitino 是一个高性能、地理分布、联合的元数据湖,它直接管理不同来源、类型和地区的元数据,为用户提供数据和 AI 资产的统一元数据访问。 Gravitino 旨在提供几个...
Apache Gravitino 是一个高性能、地理分布、联合的元数据湖,它直接管理不同来源、类型和地区的元数据,为用户提供数据和 AI 资产的统一元数据访问。 Gravitino 旨在提供几个...
OSS Browser 是阿里云开发的图形化管理工具。它提供了类似于 Windows 资源管理器的功能。使用 OSS Browser,您可以轻松查看、上传、下载和管理项目。 本工具使用开源框架 ...
PDCache 是一个轻量级,高可靠性,强一致性,基于 java 内部 Reference 工具的数据缓存工具,用于在程序内部缓存可丢失型的数据。也可用 Map 实现的根据 id 保存的数据或可...
Apache Iceberg 是一种新的表格格式,用于存储和分析大型的、移动缓慢的表格数据。它的工作方式类似于 SQL 表,它旨在改进内置在 Hive、Presto 和 Spark 中的事实上的...
IoTDB是针对时间序列数据收集、存储与分析一体化的数据管理引擎。它具有体量轻、性能高、易使用的特点,完美对接Hadoop与Spark生态,适用于工业物联网应用中海量时间序列数据高速写入和复杂分...
Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/...
Hudi 是 Uber 在 2016 年以“Hoodie”为代号开发,旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题。2019 年 1 月,U...
Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData提供了一种新的融合数据存储方案,以...
Crate Data 是一个开源的大规模的可伸缩的数据存储系统,无需任何系统管理需求。提供强大的搜索功能。用于存储各种表格数据、非结构化数据和二进制对象。并可通过 SQL 进行检索。易于安装和使...
腾讯分布式数据仓库项目,在Hadoop和hive的基础上开发的腾讯内部最大的离线数据处理平台。TDW支持Oracle功能兼容的SQL语法,支持PB级的存储和TB级的计算等。 这个项目主要的应用场...
Tajo 是一个分布式数据仓库系统,基于 Hadoop 实现,特点是低延迟、高可伸缩,提供专用查询和 ETL 工具 特点: 可伸缩性和低延迟 完全分布式的 SQL 查询处理,基于存储雨 HDFS...
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是G...
Hadoop 是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(...
没有更多内容
加载失败,请刷新页面
没有更多内容