OSChina 第 35 期高手问答 —— R语言

红薯 发布于 2013/05/19 07:33
阅读 4K+
收藏 8

OSCHINA 本期高手问答我们请来了 @雁起平沙 为大家解答关于 R编程语言以及统计学方面的问题。

@雁起平沙 (陈堰平)是《R语言编程艺术》一书的译者,毕业于中国人民大学统计学院,现任国家金融信息中心指数研究院研发部负责人,从事指数编制、指数化投资、金融衍生品方面的工作,对金融数据分析有多年的研究。统计之都(http://cos.name)的管理员,中国R语言会议理事会成员,《R语言编程艺术》的主要译者,博客地址 http://yanping.me

本次高手问答华章赞助5本图书,将在问答结束后随机挑选5名参与人,幸运者可随意从下面三本图书中挑选。

OSChina 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。

下面欢迎大家就R语言和数据统计方面的问题向 @雁起平沙 提问,请直接回帖提问。

加载中
1
八木
八木
@雁起平沙 :您好,我是从事期货行业的,对于R语言不是很了解,想问一下R语言获取数据和处理方面的优势。以及应该怎样入手学习R语言。
帖子列表
帖子列表
回复 @雁起平沙 : 谢谢
陈堰平
陈堰平
R可以读取数据库的数据,也可以读取网上的数据。R的优势是灵活。关于如何入门,可以先从最基础的资料学起,比如《R语言导论》,然后找一些数据练习,然后结合自己的工作,边用边学,遇到不懂的,可以上统计之都(http://cos.name/cn)找答案
0
周翼翼
周翼翼

@雁起平沙 :  按我的理解, R是一种比较专业的工具, 这个世界上应该不会有R语言工程师才对, 最多有会用R语言的xx分析师. 所以, 我认为R对于coding做为第一工作内容的同类来说, 最可能使用到的可能是画一个CPU占用率随时间变化的曲线图....

我的问题是,  给出一堆正常的CPU占用率数据, 能不能用R统计出一个基本的CPU占用率使用模型, 然后输入一组特定的数据, 计算出这组数据是否符合这个模型?

陈堰平
陈堰平
(1)没有R语言工程师,因为R语言可以用到各种跟数据打交道的行业,有数据科学工程师 (2)你的意思是,决定CPU占用率的,只有时间这一个变量吗?可以,具体模型是什么样子的,没看到数据,不好说
0
MtrS
MtrS

@雁起平沙 :  平沙 你好,我曾在Mcm使用R  语言作了K-means 聚类分析,来处理我们的数据,当时只是由于 R 语言较好导入  excel 数据 ,一个符号 <-

作为业余统计爱好者,如何更好的进入统计领域,来达到专业化的水平?阅读+ 实践?该做哪些方面的阅读(哪些书籍),我的R 语言只是了解,R 语言中有没有模块化的数据结构?在通常的数据分析时,有没有常规的模型?你认为在工作中是建模重要还是如何将数据展示给你的用户(图形化)?



0
帖子列表
帖子列表
@雁起平沙 :您好,对于非统计学专业的门外汉来说,您建议怎样学R语言
陈堰平
陈堰平
那就看最新的吧
e
esteem
统计学:从数据到结论 我看出到第四版了,看最新的吗?
陈堰平
陈堰平
如果没统计学基础,我推荐你先读《R语言编程艺术》的前七章,然后边用边学,统计学也要学学,推荐读吴喜之老师的《统计学:从数据到结论》
0
南湖船老大
南湖船老大
@雁起平沙 :我觉得学R语言最大的障碍还是专业障碍,比如数学、统计学,语言那是其次的
陈堰平
陈堰平
是的 R是门用于统计和数据分析的语言
0
少年包工头
少年包工头
@雁起平沙 :还不现身,更待何时?
少年包工头
少年包工头
回复 @红薯 : Oh.
红薯
红薯
别急,明天晚上才会来,很忙的
0
中山野鬼
中山野鬼
@雁起平沙 :浮点精度和计算效率何如?别和matlab一样,做作模型可以,做规模计算,就over了。
陈堰平
陈堰平
关于效率的问题,请看http://t.cn/zTmusmN
中山野鬼
中山野鬼
回复 @expl0rer : 那看来只适合做模型用了。。。
random_walk
random_walk
速度往往没有matlab快,高精度可以用Rmpfr包
0
ddatsh
陈堰平
陈堰平
当然认识啊,统计之都那么多人,就我跟他见的次数最多,哈哈哈
刘静
刘静
代答:认识 :-)
0
Injection
Injection
@雁起平沙 :对于非数学专业的,有哪些配套的数学书籍可以帮助学习R语言
陈堰平
陈堰平
回复 @Injection : 关于数据挖掘的有 R and Data mining,有本书讲机器学习的是用R,英文名是Machine Learning for Hackers,中文版已经出了,叫《机器学习:实用案例解析》。请关注@统计之都 微博,经常会分享学习经验
Injection
Injection
回复 @雁起平沙 : 计算机专业,本科,想通过自学将来从事机器学习相关的工作,目前在学习机器学习算法.很难找到适合非数学专业的本科生的数学书籍,公式推导的过程符号非常多且很多是未见过的.所以希望找到适合非数学专业计算机专业的人和R语言配套的数学书籍.
陈堰平
陈堰平
那要看你是什么专业背景 有什么样的基础 在什么场景用R和统计 知道这样先验信息才好推荐 统计学我可以先推荐些入门的书 比如吴喜之老师的《统计学:从数据到结论》
0
_A_J
_A_J
@雁起平沙 :请用R编程实现本次“ 随机挑选5名参与人” 这个功能
_A_J
_A_J
@红薯 等会儿就用这个抽奖哈
陈堰平
陈堰平
假设有N个人,选五人就是 sample(1:N,5)
返回顶部
顶部