Talend 宣布支持 Hadoop - 开源中国社区
Float_left Icon_close
Talend 宣布支持 Hadoop
ychenETL 2010年07月01日

Talend 宣布支持 Hadoop

ychenETL ychenETL 发布于2010年07月01日 收藏 1 评论 0

阿里云高性能云服务器,2折起! >>> >>>  

本周早些时候宣布Talend 本地支持Hadoop,并已经可以使用。这是什么意思呢?

从技术角度来看,这意味着Talend的解决方案现在不仅包括了连接到Hadoop的基础数据,如HDFS(Hadoop分布式文件系统源)和Hive数据库的能力,还可以在Hive内部原生运行数据转换。您不必把您的数据放在Hadoop的系统以外来处理转换。这是带给用户的一大益处。

人们可以把它看成是Hadoop的“ELT”。和ELT允许你运行你在数据库引擎中运行数据集成作业一样,Talend Integration Suite在Hadoop的内部架构中运行您数据集成的逻辑。这通过生成原生的Hadoop的代码来完成。(也许我们应该称之为EHT)。

从使用的角度来看,这意味着,拥有大量复杂数据的组织现在能够充分利用Hadoop的架构了。在此之前,Hadoop没有数据集成的可选项。你将不得不从Hadoop中提取数据,在数据集成引擎中转换,再重新插入到Hadoop。这不仅要付出性能代价,也非常缺乏效率 - 毕竟,Hadoop的MapReduce架构是特别适合于复杂的数据转换运行的。

从创新的角度看,此功能再次凸显了推动开放源码(或者说也是开源推动的)的独特的创新动力。据我所知,Talend是第一家推出适合Hadoop的数据集成解决方案的供应商。当然,许多其它机构也有同类宣传。说是“in the summer”或“到今年年底”可用。但至今音信全无,除了Talend。

 

关于 Talend:http://cn.talend.com/index.php

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Talend 宣布支持 Hadoop
分享
评论(0)
最新评论
顶部