2014 年大数据市场趋势十大预测

oschina
 oschina
发布于 2013年12月25日
收藏 45

大数据市场预测-ctocio-

大数据是2013年热度最高的技术词汇,这一年大数据市场也实现了高速增长,越来越多的企业开始拥抱大数据解决方案,而随着生态系统的日益成熟,Hadoop也不再是天才技术人员的玩具,而是数据科学家和业务人员手中挖掘数据商业价值的强大“矿机”。

如果说2013年只是大数据市场的热身赛和预选赛,那么2014年大数据市场将迎来世界杯盛宴,近日CIO杂志给出了2014年大数据市场十大预测,IT经理网编译整理如下:

预测一、大数据腾云。2014年大数据将从概念走向实用,并与云计算服务整合。例如云计算服务商Gainsight已经开始采用大数据分析技术向其SaaS客户提供“客户成功管理”服务。Gainsight认为2014年所有的云计算服务提供商的后台基础设施都将提供大数据分析功能。

预测二、Hadoop从实验到生产。云计算并非大数据的唯一归宿。战略分析平台提供商Alteryx认为,2014年Hadoop将摆脱廉价数据仓库的形象,成为企业数据处理的通用计算架构。这意味着分析依然是大数据的第一应用。

预测三、越来越多的企业意识到消费者数据分析的重要性。

预测四、营销领域的大数据分析将成为热点。2014年营销大数据将迎来大发展,重点领域包括广告、促销和用户行为分析。关键创新将围绕世界杯和冬奥会展开。

预测五、业务分析师比大数据科学家重要。更具Alteryx的预测,掌握大数据分析技术的业务部门分析人员将比大数据科学家对企业更加重要。这意味着2014年数据科学家的高工资难以持续。

预测六、物联网将进化为互联物网(Web of Things)IEEE专家协会认为2014年物联网将让位于 互联物网,所谓Web of Things,将利用移动设备和传感器来观察并监控环境,并加强现实世界物体之间,现实物体与web对象之间的协同。(编者按,也就是所谓的智能物联网, 传感器作为节点,而不是末梢连入)而Web of things将产生海量的大数据。

预测七、R将取代传统SAS方案成为主流分析技术。基于R编程语言的分析在2014年将成为主流,而传统分析工具如SAS何SPSS将逐渐边缘化。超过200万用户和300万分析师都在寻找新的方案,R的时代即将到来。

预测八、Hadoop将驱动实时互动应用。实时SQL-on-Hadoop数据库提供商Splice Machine首席执行官Monte Zweben认为,2014年将有大量互动应用,包括web应用、移动应用、社交应用将建筑在Hadoop平台之上。

预测九、Hadoop将大举进入企业市场。2014年Hadoop技术将进化得更加安全、支持更加高级的运营管理和资源管理,将会出现更多企业需要的功能,并成为Hadoop平台的标准化组件。

预测十、2014年将有一家NoSQL数据库公司成功上市。大数据与云安全方案提供商Gazzang的首席执行官Larry Warnock认为,2014年至少会有一家Hadoop或NoSQL提供商上市。根据Wikibon的报告,2012年NoSQL软件和服务市场规模为2.86亿美元,2017年将增长至18.25亿美元。市场高速增长的驱动力来自云计算和大数据时代企业对灵活可扩展的廉价数据管理方案(包括分析和交易)的需求。

文章来自IT经理网

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:2014 年大数据市场趋势十大预测
加载中

最新评论(18

果果果
果果果

引用来自“haorizi”的评论

引用来自“果果果”的评论

引用来自“haorizi”的评论

R这么牛?有用过的吗

统计专业的都学R

比sas、spss强在哪?spss图形界面挺好的。

我信息与计算科学的,只会点matlab
中山野鬼
中山野鬼

引用来自“蔡小峰”的评论

@中山野鬼
大师,我过去 曾经 以及将来都很仰慕你。
1. 存储:我们的hdfs数据存放是冗余存放(安全性),3份互为备份。
(传输过来存储影响的是磁盘速度,一份数据在一台机器存一份与在三台机器存三份速度没多大区别,冗余存储是解决数据的安全性)
2. 数据一致性: (如何保证一致hadoop内部原理,我也不太懂) 只是某些数据如果没存储成功、或者丢失,会再存储一份。
3. 同步性: 数据是捂了一段时间再计算,确认了存储完毕再进行分析计算的。(暂时没实现实时分析)
4. 运算: 我们的数据没有逻辑因果关联;
是计算迁移。
不同类型的数据是均匀分布在不同的节点,计算不会出现负载过重;
某些节点计算拖后腿,更多可能是机器磁盘读写 或者 网口 等硬件问题 -> 解决硬件问题。

5. 关键数据存储,还是 将分析出的数据存储到oracle。


其实无论什么冗余方案,只有考虑不周全的地方,没有谁对谁错的,关键性能和合理性,需要和实际系统所对应的业务特性关联。
系统我们可以大体分三层。一层是物理功能层,如cpu的进程调度,io的驱动,网络的tcp/ip以下的层级。这部分完成的是围绕物理计算设备的功能的实现工作。这块要动,除非是针对特定类型的业务目标。例如我们 不用cpu而用gpu去处理图像。
中间一层是平台组织层,主要是架构,框架,等等,不围绕具体业务,但是不同支撑了平台的结构和运行。例如hadoop,包括oracle干的很多你不 需要关心的事情。
最上面是业务层。这个和具体的业务有关。针对不同具体的业务,一定是要特定设计的。
oracle和hadoop不一样的地方,前者是针对关系性数据的设计原理和绝大多数实际业务特点做了很多优化。hadoop,无非就是拿了些概念层面的原理,做了些组建的堆叠。当然实际有很多工作,不是我上下嘴皮一翻就搞定的。可惜的是,hadoop尝试做了很多底层的事情,而又妄图影响业务层的实现方法。
这就是不靠谱的地方。
蔡小峰
蔡小峰
@中山野鬼
大师,我过去 曾经 以及将来都很仰慕你。
1. 存储:我们的hdfs数据存放是冗余存放(安全性),3份互为备份。
(传输过来存储影响的是磁盘速度,一份数据在一台机器存一份与在三台机器存三份速度没多大区别,冗余存储是解决数据的安全性)
2. 数据一致性: (如何保证一致hadoop内部原理,我也不太懂) 只是某些数据如果没存储成功、或者丢失,会再存储一份。
3. 同步性: 数据是捂了一段时间再计算,确认了存储完毕再进行分析计算的。(暂时没实现实时分析)
4. 运算: 我们的数据没有逻辑因果关联;
是计算迁移。
不同类型的数据是均匀分布在不同的节点,计算不会出现负载过重;
某些节点计算拖后腿,更多可能是机器磁盘读写 或者 网口 等硬件问题 -> 解决硬件问题。

5. 关键数据存储,还是 将分析出的数据存储到oracle。


中山野鬼
中山野鬼

引用来自“蔡小峰”的评论

引用来自“中山野鬼”的评论

引用来自“蔡小峰”的评论

引用来自“中山野鬼”的评论

哈,过5年后看吧。不是不相信这些美好的预期,而是怀疑仅是这些的实用价值。。

Hadoop 解决了Oracle的瓶颈、

哈,能否说具体点,解决了oralce的什么瓶劲?怎么解决的?

海量数据处理的三个主要因素:大容量数据、多格式数据和速度

1. io 速度瓶颈:数据存储是分布式存放在HDFS(在不同机器存储多份 互为备份),
这样的避免了 oracle的缓存 锁等问题。
2. 运算: 运算的时候,主节点会把任务划给多台机器一起运算,oracle 集群有无此功能不了解。
3. 存储: oracle 存储 TB zb 级别的数据有压力, 而 hbase 里面的数据很方便线性扩展,不会因为数据量扩大产生问题
4.分析 :解决了分布式运算问题(MapReduce ):将不同的任务划分给不同的机器来一起统计。

Hbase 与 oracle 差别:
http://otn.itpub.net/28912557/viewspace-776770/

哈,你试过吗?
hdfs,分布式存储,读取是容易的,同步呢?是冗余存放还是分区存放。如果冗余存放,冗余存放中数据一致性、同步性中的计算费用你是否考虑过?我不需要你对我讲解这些知识,hdfs我学习过。哈。只是问你这些是否真的测试过?
运算,我向请教你,如果存在逻辑因果关联的,如何实现并发?如果无因果关联的,那么逻辑运算和数据分布之间如何做到均衡?在确定分布式并发计算后,是计算迁移还是数据迁移,如果是计算迁移,导致单节点计算负载过重怎么处理?
至于后面你说的两样,哈,先把前面处理好再说。
很多人说我水平不行,根本不懂,哈,没关系,真正懂的人,听我的问题,能好好琢磨清楚里面隐藏的问题就够了。
蔡小峰
蔡小峰

引用来自“中山野鬼”的评论

引用来自“蔡小峰”的评论

引用来自“中山野鬼”的评论

哈,过5年后看吧。不是不相信这些美好的预期,而是怀疑仅是这些的实用价值。。

Hadoop 解决了Oracle的瓶颈、

哈,能否说具体点,解决了oralce的什么瓶劲?怎么解决的?

海量数据处理的三个主要因素:大容量数据、多格式数据和速度

1. io 速度瓶颈:数据存储是分布式存放在HDFS(在不同机器存储多份 互为备份),
这样的避免了 oracle的缓存 锁等问题。
2. 运算: 运算的时候,主节点会把任务划给多台机器一起运算,oracle 集群有无此功能不了解。
3. 存储: oracle 存储 TB zb 级别的数据有压力, 而 hbase 里面的数据很方便线性扩展,不会因为数据量扩大产生问题
4.分析 :解决了分布式运算问题(MapReduce ):将不同的任务划分给不同的机器来一起统计。

Hbase 与 oracle 差别:
http://otn.itpub.net/28912557/viewspace-776770/
中山野鬼
中山野鬼

引用来自“蔡小峰”的评论

引用来自“中山野鬼”的评论

哈,过5年后看吧。不是不相信这些美好的预期,而是怀疑仅是这些的实用价值。。

Hadoop 解决了Oracle的瓶颈、

哈,能否说具体点,解决了oralce的什么瓶劲?怎么解决的?
蔡小峰
蔡小峰

引用来自“中山野鬼”的评论

哈,过5年后看吧。不是不相信这些美好的预期,而是怀疑仅是这些的实用价值。。

Hadoop 解决了Oracle的瓶颈、
中山野鬼
中山野鬼
哈,过5年后看吧。不是不相信这些美好的预期,而是怀疑仅是这些的实用价值。。
abcijkxyz
abcijkxyz
http://www.venice-days.com/public/foto/0041.jpg
haorizi
haorizi

引用来自“果果果”的评论

引用来自“haorizi”的评论

R这么牛?有用过的吗

统计专业的都学R

比sas、spss强在哪?spss图形界面挺好的。
返回顶部
顶部