OSCHINA 本期高手问答(2017 年 6 月 21 日 — 6 月 27 日)我们请来了@ethan888 吕兆星为大家解答关于企业大数据方面的问题。
吕兆星,资深大数据技术专家,精通基于大数据的分布式数据挖掘、存储与计算技术,及其生态体系架构;精通垂直搜索技术、机器学习、文本情感倾向性挖掘、网络爬虫、全文索引体系架构。曾任软通动力集团大数据研究院总架构师、HiveCloud 创始人,萝卜网 CTO,国美在线大数据中心高级架构师等。
对于很多企业而言,大数据的重要性不言而喻,但是如何构建、实施和应用大数据系统却是一个复杂工程。
大数据不仅是一个技术名词,更是当下企业资产、核心竞争力、完整产业链和先进生产力的代名词。因此,大数据应该是作为一个整合概念和体系被认知,而非独立的方法论、技术论甚至应用论。处于飞速变革时代的中国,在大数据产业链各个环节的企事业单位受限于自身产业属性、盈利模式、利益趋向、认知、能力等,无法完整地展示出大数据的知识图谱与价值图谱。
因此,本期高手问答邀请了资深的大数据专家,和大家共同分享企业的大数据实践经验,走进大数据的世界。
为了鼓励踊跃提问,@华章 会在问答结束后从提问者中抽取 5 名幸运会员赠予《企业大数据系统构建实战:技术、架构、实施与应用》一书。
OSChina 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。
下面欢迎大家就企业大数据方面问题向@ethan888 吕兆星提问,请直接回帖提问。
@ethan888 该书是适合初级入门的? 还是进阶的
@ethan888 大数据的服务组件是融合到企业运行系统之中还是之外?如何让大数据分析与企业决策结合的更紧密?
@ethan888老师您好,想请问一下,目前企业内生产环境中spark应用多不多呢
@ethan888 对于系统的数据库设计,从一开始就如何为后期的大数据使用做必要的准备,在设计时就应注意什么关键的点?
@ethan888 现在市面上为什么ToC的多,ToB的搞不起来,主要还是一个企业内部各种系统,ERP、OA、WMS、TMS,还有其他各种小工具,有什么好的方法进行整合么?或者是通过什么方式将他的各个系统的数据进行集成,进行分析。
@ethan888 因为我是甲方内部的,所以对于内部系统数据分析系统的打造非常关心,特别是内部系统经常会有各种脏数据或者是期初数据,如果每次都需要洗数据那就比较麻烦。
@ethan888 对于大数据有个问题,类似hbase这种nosql,当数据量特别大的时候,分页查询也特别慢(phoenix),有什么方法优化吗