Python数据分析与机器学习实战

感谢分享 发布于 2017/02/07 13:54
阅读 1K+
收藏 0

Python数据分析与机器学习实战相关的资料?

加载中
0
mickelfeng
mickelfeng

Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:

1.scikit-learn

scikit-learn 是一个基于SciPy和Numpy的开源机器学习模块,包括分类、回归、聚类系列算法,主要算法有SVM、逻辑回归、朴素贝叶斯、Kmeans、DBSCAN等,目前由INRI 资助,偶尔Google也资助一点。

项目主页:

https://pypi.python.org/pypi/scikit-learn/

http://scikit-learn.org/

https://github.com/scikit-learn/scikit-learn

2.NLTK

NLTK(Natural Language Toolkit)是Python的自然语言处理模块,包括一系列的字符处理和语言统计模型。NLTK 常用于学术研究和教学,应用的领域有语言学、认知科学、人工智能、信息检索、机器学习等。 NLTK提供超过50个语料库和词典资源,文本处理库包括分类、分词、词干提取、解析、语义推理。可稳定运行在Windows, Mac OS X和Linux平台上. 

项目主页:

http://sourceforge.net/projects/nltk/

https://pypi.python.org/pypi/nltk/

http://nltk.org/

0
忙碌的小二
忙碌的小二

Python数据分析与机器学习实战
课程观看地址:http://www.xuetuwuyou.com/course/167
课程出自学途无忧网:http://www.xuetuwuyou.com


    课程风格通俗易懂,真实案例实战。精心挑选真实的数据集为案例,通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习。旨在帮助同学们快速上手如何使用python库来完整机器学习案例。

课程目标
 零基础快速掌握python数据分析与机器学习算法; 快速入门python最流行的数据分析库numpy,pandas,matplotlib; 从原理上进行推导较为繁琐的机器学习算法,以算法流程为主结合实际案例实现完整的算法代码; 使用scikit-learn机器学习库完成快速建立模型,评估以及预测; 结合Kaggle经典案例,从数据预处理开始一步步完成整个项目,对如何应用python库完成实际的项目形成完整的经验与概念。

适合人群:
 数据分析,机器学习,数据挖掘领域研究者。Python语言使用者。

课程目录:
第1 章 : Python环境配置
课时1:使用Anaconda安装python环境 
课时2:Eclipse配置python插件
课时3:课程简介 
第2 章 : Python科学计算库-Numpy
课时4:Numpy库简介 
课时5:Array数组 
课时6:数组操作 
课时7:矩阵基本操作 
课时8:矩阵的创建与初始化 
课时9:常用函数案例演示 
课时10:排序与索引 
课时11:习题实例 
第3 章 : python数据分析处理库-Pandas
课时12:Pandas库简介 
课时13:数据读取与显示 
课时14:数据样本行列选取 
课时15:数值计算与排序
课时16:数据预处理与透视表 
课时17:自定义函数方法 
课时18:核心数据结构Series详解 
课时19:数据索引变换 
第4 章 : Python数据可视化库-Matplotlib
课时20:Matplotlib简介 
课时21:画出第一个简易折线图 
课时22:打造一个完整的折线图
课时23:条形图实战 
课时24:直方图与四分图 
课时25:基于真实数据集的可视化分析
课时26:可视化图表细节 
第5 章 : Python机器学习案例实战
课时27:初识机器学习
课时28:使用python库分析汽车油耗效率
课时29:使用scikit-learn库建立回归模型 
课时30:使用逻辑回归改进模型效果 
课时31:模型效果衡量标准 
课时32:ROC指标与测试集的价值 
课时33:交叉验证
课时34:多类别问题代码 
课时35:梯度下降原理 
课时36:实现简易梯度下降算法
课时37:SVD奇异值分解原理 
课时38:SVD推荐系统应用实例 
课时39:K近邻算法原理 
课时40:K近邻算法代码实现 
课时41:K近邻实例 
第6 章 : 决策树与随机森林
课时42:决策树算法原理 
课时43:基于ID3算法进行特征选择 
课时44:构建决策树 
课时45:使用scikit-learn库建立决策树
课时46:分类回归树CART
课时47:分类回归树代码实现 
课时48:随机森林模型 
课时49:随机森林特征重要性 
第7 章 : 聚类模型
课时50:无监督聚类问题
课时51:聚类结果与离群点分析 
课时52:K-means聚类案例对NBA球员进行评估 
课时53:K-MEANS原理 
课时54:K-MEANS聚类算法实现 
第8 章 : 支持向量机
课时55:支持向量机算法原理 
课时56:支持向量机对偶问题 
课时57:核变换解决低维不可分问题 
课时58:soft-margin支持向量机
课时59:SMO算法求解支持向量机
第9 章 : 神经网络模型
课时60:初识神经网络
课时61:神经网络强大的非线性 
课时62:深入神经网络细节 
课时63:代码实现简易神经网络 
课时64:深度学习-递归神经网络 
课时65:神经网络打造二进制加法器 
第10 章 : 贝叶斯模型
课时66:贝叶斯原理 
课时67:基于贝叶斯的垃圾邮件分类 
课时68:使用贝叶斯算法打造拼写检查器 
课时69:K近邻算法实现 
第11 章 : Adaboost算法
课时70:Adaboost算法原理
课时71:Adaboost实例 
课时72:Adaboost实现代码 
课时73:Adaboost训练模型
第12 章 : 机器学习项目实战-泰坦尼克获救预测
免费 课时74:船员数据分析 
免费 课时75:数据预处理 
课时76:使用回归算法进行预测
课时77:使用随机森林改进模型 
课时78:随机森林特征重要性分析 
第13 章 : 机器学习项目实战-贷款申请最大化利润
课时79:数据清洗过滤无用特征 
课时80:数据预处理 
课时81:获得最大利润的条件与做法 
课时82:预测结果并解决样本不均衡问题 
第14 章 : 机器学习项目实战-用户流失预警
课时83:数据背景介绍 
课时84:数据预处理 
课时85:尝试多种分类器效果 
课时86:结果衡量指标的意义 
课时87:应用阈值得出结果
第15 章 : 机器学习项目实战-HTTP日志聚类分析
课时88:建立特征工程 
课时89:特征数据预处理
课时90:应用聚类算法得出异常IP点

返回顶部
顶部