关于hadoop的一点看法 - 两个凡是

宏哥 发布于 2016/12/05 16:36
阅读 1K+
收藏 1

传统RDMBS不适合流式数据的处理

现代的流式数据处理早已到准实时的水平了

所有的这类数据处理, hadoop无疑是最落后的, 时差过大

hadoop的价值仅限于 分布式文件的流式读取, 没有任何业务逻辑处理能力

只剩下一个作业调度

实际上,, haddoop和大数据没有什么关系, 只是一个文件系统和作业调度

拿hadoop说事, 无外乎一些懒汉, 投机取巧

hadoop容易获得罢了

加载中
1
王涛
王涛

于是回归到PostgreSql

你直接说hadoop不如PG不就行了,还打那么多字

你这一秒钟几十万上下的,打这么多字,怎么也损失了好几个亿了

放牛娃1988
放牛娃1988
回复 @快速开发师 : 你的意思是说我儿子只配跟门外汉交流?放屁,我儿子是专家。
快速开发师
快速开发师
对于我这样一个门外汉来说,他这样说我更容易理解,未尝不可
1
脸大的都是胖纸
脸大的都是胖纸
哈哈~~我曰。请先去了解大数据生态再来说...你咋啥都能二个凡是 我也是醉了~~
1
放牛娃1988
放牛娃1988
儿啊,你又调皮了
快速开发师
快速开发师
你这个名字够狠
0
554330833a
554330833a
那用什么处理?
0
Grrrr
Grrrr

楼主对hadoop的了解还停留在1版本上。现在2版本是YARN构架,是一个资源分配,调度系统。计算模型也不限于map-reduce,正是因为这个开放性的特点,更多的计算模式被引入了进来,玩法也更多了,离线(map-reduce),准实时(hive),实时(spark)都有对应产品,而且也得到了业界的认可。所以现在提到hadoop,并不是分布式文件的流读取,离线map-reduce。而是整个hadoop生态圈。


0
银杏卡卡
银杏卡卡
你先了解一下hadoop和spark吧,并不是你说的那么简单。绝大部分情况,大数据的实时性都不是太高,不然你能想到每秒几个G的数据,或者一下就能分析出用户的某种行为?
0
宏哥
宏哥

引用来自“BoXuan”的评论

你先了解一下hadoop和spark吧,并不是你说的那么简单。绝大部分情况,大数据的实时性都不是太高,不然你能想到每秒几个G的数据,或者一下就能分析出用户的某种行为?
去了解一下streaming 吧 主流的公司 都不用Hadoop 包括阿里
宏哥
宏哥
回复 @BoXuan : 可以滚得远点了
银杏卡卡
银杏卡卡
还有你说的streaming这只是一种数据传输方式,底层实现应该也就是socket tcp实现,难道有什么其它神奇之处?
银杏卡卡
银杏卡卡
阿里首先用的hadoop,后面才用的spark,目前开源界处理大数据的基本就这两款,spark作为后起之秀,肯定在某些方面优于hadoop的,不过你说的hadoop没有主流公司用,我就不敢苟同了,多查查资料,不要可能就是你自己说的“懒人”才好
0
宏哥
宏哥

回复 @BoXuan :  你用菊花说话的吗? 

https://www.aliyun.com/product/odps

你们这些嘴里hadoop的,没有一个不是乱七八糟

宏哥
宏哥
回复 @BoXuan : 你可以滚了,我已经给出阿里的解决方案了。
银杏卡卡
银杏卡卡
我看过一个阿里技术大佬有关spark的文章,他们是hadoop和spark都用的。回复你这个的重点是要说明你能不要说脏话吗?人品能不能上升一点?
0
中山野鬼
中山野鬼
哈,hadoop都玩出生态了。不过确实可以。但hadoop的生态和大数据没毛线关系吧。喜欢聊大数据的,我倒是很愿意探讨一下。不过希望确实是在讨论大数据的实际问题。
0
eechen_
eechen_
每天被人骂SB,是怎样的体验?
返回顶部
顶部