【写书评赠书活动】《数据科学:R 语言实现》

局长 发布于 2017/06/23 16:16
阅读 941
收藏 8

赠书活动来啦!本次书评活动由机械工业出版社提供书籍奖品,最后会由@局长 挑选 3 位优秀书评用户赠送本书。

图书介绍:

本书首先介绍如何创建R函数来避免不必要的代码重复。你会学到如何使用R程序包,在各种数据源上准备数据、处理数据和执行高级ETL操作。数据操作的一个例子是介绍如何使用dplyr和data.table程序包有效地处理大型数据结构。还有一章关注ggplot2,介绍如何创建高级图形,进行数据展示。你也会学到如何使用ggvis程序包构建交互式报告。

本书也会介绍如何使用数据挖掘技术发现经常一起购买的产品。后面的章节还给出了财务数据的时间序列分析结果。还有一些章节会深入介绍机器学习技术,包括数据分类、回归、聚类和降维。我可以保证,本书会让你觉得,数据科学学习原来如此简单。

作者介绍:

丘祐玮(David Chiu),Largit Data公司创始人,资深数据科学家,之前曾就职于趋势科技公司,主要负责为商务智能及客户关系管理系统构建大型数据处理平台。他专注于在数据分析中使用Spark和Hadoop技术来实现海量数据挖掘。同时,他还是一位资深讲师,在各类Python、 R、Hadoop及相关会议上多次发表演讲。此外,David还撰写了《机器学习与R语言实战》

活动介绍: 

  • 活动时间:2017-06-23 — 2017-06-28 为期五天
  • 活动形式:写书评得好书,大家可以通过写书评来参加抽奖。写下你对这本书的读后感(不少于 40 字)都可以参加抽奖。书评是自己读过样章后的切身感受,切忌虚夸;书评内容可谈论本书内容、特色、阅读感受或者建议等
  • 活动奖励:活动结束后抽取 3 名书评用户进行赠书

注意事项及细则:

  1. 活动结束后由@局长 选出 3 名优秀书评用户。
  2. 活动结束后公布获奖名单,由出版社统一邮寄。

样章试读:http://pan.baidu.com/s/1c1Whzfq

加载中
0
局长
局长

【写书评赠书活动】《数据科学:R 语言实现》

@jasonwu24@久永@WFFGER

恭喜以上三位用户获得《数据科学:R 语言实现》图书一本 

请私信@局长 告知快递信息(格式:姓名+电话+地址),谢谢

1
jasonwu24
jasonwu24

首先,说点题外话。关于“有监督学习”和“无监督学习”的叫法实在不敢苟同。什么叫“监督”,应该是在别人或别的什么设备的看管之下做事情才叫监督。而在机器学习领域,根据我们的知识,却完全不是这么回事吧?它是指在已知的一些数据的情况下,去根据这些已知的数据去推导出一些结论或模式,来指导那些新的数据。关于这一点, 王星先生在他的《大数据分析:方法与应用》 一书中,就没有这样翻译supervised/unsupervised learning ,而是采用“无指导的学习”这样的叫法。虽不是特别确切,我觉得是比较合适的。本身强调的就是“指导”的含义,读过研的同学应该知道supervisor是“导师”的意思,重点在“指导”,而不是“监督”你。

-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-

再来说说这本书。本书没有像《R in Action》那样上来就从R的变量类型、定义等特别基础的东西讲起,而是重点选择R的函数,R获取外部数据,R语言的数据预处理技术来进行讲解(没办法, 试读样章 只有3章内容)。

在函数介绍部分,讲的特别细致,应该说把R语言关于函数的内容都讲的非常清新了,当然这也要求你有一定的R语言基础或者其他语言的基础。比如使用命名参数的同时,还可以使用if-else条件语句,这种技巧是别的书中不会介绍的。以及对于环境、词法域的介绍,对于闭包的讲解,都能够深入浅出。

第2章数据的抽取、转换和加载,介绍了从CSV/TXT/EXCEL/DB等抽取数据的方法,与其他地方的介绍几本一致,比较亮点的地方在于网络爬虫的介绍,当然facebook、twitter的网站你是访问不了了,可以换成sina等。

第3章数据预处理技术,介绍了数据挖掘前对数据进行数据进行格式化处理或去重等技术。

总体而言,这是一本实战性比较强的书,介绍了大量的R语言技能,如果打分的话,我给8+(10分制)。一本不错的书,值得拥有!

 

0
手握华为赛神仙
手握华为赛神仙
赠书给看过的人……都看完了还要这书干啥……
久永
久永
不一定啊,有的只是了解,还没深入呢。 比如,将这本书给我,说不定下面项目就用 R 语言呢~
局长
局长
试读样章写书评,底下有样章的链接。
0
hell0cat
hell0cat

有计划出Julia的书吗?R太奇怪了,运算速度太慢,比Julia低几个量级,甚至比Ruby也要慢一个量级,本来以为处理大数据是优势,谁知道一个4万行的CSV,我的iMac 16G内存竟不能跑!

阿睦瓦
阿睦瓦
才4万行?难道不是几毫秒就处理完了?
魔力猫
魔力猫
我觉得你写的代码有BUG的可能性更大。
Andy
Andy
应该不是R的问题
小马-过河
小马-过河
你确定4万行不够跑
0
小紫羽
小紫羽
样章试读,可以。
0
梦朝思夕
梦朝思夕

无论对于学习预测分析学还是解决实际环境中的问题,R语言都是一个优秀的平台。它是一个开源项目,有一个持续快速增长的用户社区。但是与的竞争的语言还是很多的比如python等。从编程的角度来说,R语言在中国的使用范围还是存在不足的,尤其是在数据领域。

但是不论使用什么语言开发,【数据科学】都是现代数据管理,机器学习的基础与核心。

0
轩辕剑
轩辕剑

R这个稀有语言很少接触

0
桔子
桔子
r语言是非常棒的数据科学语言,值得每一位数据工作者,甚至每一个码农学习一下
0
shitalpig
shitalpig
r语言是什么,不给个pdf
局长
局长
帖子最后放了书的样章链接。
0
Andy
Andy

这是一本实践指导书,有常见的应用场景,常规的处理手段,最佳实践流程。适合掌握了基本语言,想进一步应用的同学。

返回顶部
顶部