大数据之父:数据过度解读就是滥用数据

oschina
 oschina
发布于 2015年09月28日
收藏 24

大数据之父:数据过度解读就是滥用数据

26日,全球第一本关于大数据的著作《大数据时代》的作者、被誉为“大数据时代的预言家”、 “大数据之父”的牛津大学教授维克托·迈尔·舍恩伯格受邀做客中山大学“黄埔大讲堂”,开讲“大数据能做什么”。他表示,在解释数据的过程中要非常小心, 如果解释得过度了,实际上就是滥用数据。

舍恩伯格现任牛津大学网络学院互联网治理与监管专业教授。他说,美国航空业在营销、旅客体验等领域,仍然有大量的需求没有得到满足,这其中也就蕴含了大数据技术应用的大量机会。近年,谷歌公司购买了美国航空业的大量数据,试图通过将数据与移动整合到一起,了解客户的需求,为航空公司构建一个有用的差旅助手。其中美国政府规定,谷歌公司即使购 买了数据也不能对其进行垄断,其他方也有权使用这些数据。政府应当在数据垄断的问题中担当起重要角色,以此来实现更加公平、合理地使用大数据技术。

他警惕地分析说,在解释数据的过程中要非常小心,如果解释得过度了,实际上就是滥用数据。比如在美国做汽车分析,显示橙色车维修的成本是最低的。“大家可能 在想,为什么橙色的车维修率低?是因为橙色的车夜晚看得更清楚?还是开车的人更小心?”在数据分析的过程中,“要找的是相关关系,而不是因果关系。”

舍恩伯格总结说,人类要通过数据去进行学习,进行创新,但是也要想有时候可能数据本身跟现实是有一定距离的。所以,人类可能对于现实了解不多,还有很多要学习,要坚信大数据是最重要的。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:大数据之父:数据过度解读就是滥用数据
加载中

最新评论(11

haitaosoft
haitaosoft

引用来自“haitaosoft”的评论

【要找的是相关关系,而不是因果关系】
因果关系 难道不是 相关关系?而且是非常重要的关系了。
问题是 不要把果当成了因

引用来自“amrino”的评论

相关和因果相差很大,有相关关系不一定有因果关系,有因果关系必定有相关关系。要证明有因果关系需要很强的论证过程,证明过程复杂。相关关系证明很简单,只要存在数学上的相关关系就好。比如鸡叫太阳就会升起来,鸡叫和太阳升起来之间是相关关系,但是没有因果关系,不是因为鸡叫太阳才升起来。太阳升起来是因为地球的自转,这个证明过程人类花了多长时间我也不需要说了。

引用来自“haitaosoft”的评论

对于商业应用来说,为了达到预期目标,就要找到它的因,再从因入手。
所以,找到因果关系,是 大数据的 最有效的利用。

引用来自“amrino”的评论

证明因果很难,目前大家都在谈大数据,但是还没有看到真正的把大数据利用到让人叹为观止的地步。商业应用的目前预期是相关,得到因果关系需要很长世间,等到你得到了因果,说不准时机都过了。而且证明因果,不需要大数据也可以,在大数据之前难道人们不都是通过小的数据来找到了很多因果关系的吗?
不是专门找因果关系。而是从得到的相关关系里,根据业务模型尽量找出因果关系,并因此按重要性排序加以利用。轻视果(可以作为观察验证的辅助手段),重视因(直接提高效益的切入点)。
银行业、金融业,20年前就在利用大数据了,只是那时候不叫 大数据 而已。。。。
amrino
amrino

引用来自“haitaosoft”的评论

【要找的是相关关系,而不是因果关系】
因果关系 难道不是 相关关系?而且是非常重要的关系了。
问题是 不要把果当成了因

引用来自“amrino”的评论

相关和因果相差很大,有相关关系不一定有因果关系,有因果关系必定有相关关系。要证明有因果关系需要很强的论证过程,证明过程复杂。相关关系证明很简单,只要存在数学上的相关关系就好。比如鸡叫太阳就会升起来,鸡叫和太阳升起来之间是相关关系,但是没有因果关系,不是因为鸡叫太阳才升起来。太阳升起来是因为地球的自转,这个证明过程人类花了多长时间我也不需要说了。

引用来自“haitaosoft”的评论

对于商业应用来说,为了达到预期目标,就要找到它的因,再从因入手。
所以,找到因果关系,是 大数据的 最有效的利用。
证明因果很难,目前大家都在谈大数据,但是还没有看到真正的把大数据利用到让人叹为观止的地步。商业应用的目前预期是相关,得到因果关系需要很长世间,等到你得到了因果,说不准时机都过了。而且证明因果,不需要大数据也可以,在大数据之前难道人们不都是通过小的数据来找到了很多因果关系的吗?
eechen
eechen
“过度解读”应该指的是别有用心、心怀叵测地利用数据吧,美国政府给Google垄断数据,Google为美国政府提供NSA棱镜监控需要的数据,在政商一体化的美国,这种交易习以为常吧,很可惜,美国人手中的那张选票,并不能把这种交易给投下去,NSA依旧屹立不倒。
梦函
梦函

引用来自“haitaosoft”的评论

【要找的是相关关系,而不是因果关系】
因果关系 难道不是 相关关系?而且是非常重要的关系了。
问题是 不要把果当成了因

引用来自“amrino”的评论

相关和因果相差很大,有相关关系不一定有因果关系,有因果关系必定有相关关系。要证明有因果关系需要很强的论证过程,证明过程复杂。相关关系证明很简单,只要存在数学上的相关关系就好。比如鸡叫太阳就会升起来,鸡叫和太阳升起来之间是相关关系,但是没有因果关系,不是因为鸡叫太阳才升起来。太阳升起来是因为地球的自转,这个证明过程人类花了多长时间我也不需要说了。
这个解释得赞!
haitaosoft
haitaosoft

引用来自“haitaosoft”的评论

【要找的是相关关系,而不是因果关系】
因果关系 难道不是 相关关系?而且是非常重要的关系了。
问题是 不要把果当成了因

引用来自“amrino”的评论

相关和因果相差很大,有相关关系不一定有因果关系,有因果关系必定有相关关系。要证明有因果关系需要很强的论证过程,证明过程复杂。相关关系证明很简单,只要存在数学上的相关关系就好。比如鸡叫太阳就会升起来,鸡叫和太阳升起来之间是相关关系,但是没有因果关系,不是因为鸡叫太阳才升起来。太阳升起来是因为地球的自转,这个证明过程人类花了多长时间我也不需要说了。
对于商业应用来说,为了达到预期目标,就要找到它的因,再从因入手。
所以,找到因果关系,是 大数据的 最有效的利用。
Liuxd
Liuxd
大数据之父?谁给封的?这名称好nb啊。

历史数据能够解读出什么东西来,深入挖掘几乎会到哲学的层面上去。没人可以说结论是就是什么。就像没人能肯定宇宙大爆炸一定发生过,夸克是最小粒子一样。不过如果只限定到商业层面,那其实就没那么复杂了。盯着收益曲线去调整准没错。
eastasiasnow
eastasiasnow

引用来自“haitaosoft”的评论

【要找的是相关关系,而不是因果关系】
因果关系 难道不是 相关关系?而且是非常重要的关系了。
问题是 不要把果当成了因

引用来自“amrino”的评论

相关和因果相差很大,有相关关系不一定有因果关系,有因果关系必定有相关关系。要证明有因果关系需要很强的论证过程,证明过程复杂。相关关系证明很简单,只要存在数学上的相关关系就好。比如鸡叫太阳就会升起来,鸡叫和太阳升起来之间是相关关系,但是没有因果关系,不是因为鸡叫太阳才升起来。太阳升起来是因为地球的自转,这个证明过程人类花了多长时间我也不需要说了。
解释一目了然啊
loki_lan
loki_lan
“数据过度解读就是滥用数据”,错,应该是过于真实而太吓人
amrino
amrino

引用来自“haitaosoft”的评论

【要找的是相关关系,而不是因果关系】
因果关系 难道不是 相关关系?而且是非常重要的关系了。
问题是 不要把果当成了因
相关和因果相差很大,有相关关系不一定有因果关系,有因果关系必定有相关关系。要证明有因果关系需要很强的论证过程,证明过程复杂。相关关系证明很简单,只要存在数学上的相关关系就好。比如鸡叫太阳就会升起来,鸡叫和太阳升起来之间是相关关系,但是没有因果关系,不是因为鸡叫太阳才升起来。太阳升起来是因为地球的自转,这个证明过程人类花了多长时间我也不需要说了。
返回顶部
顶部