通用型的机器学习工具包 Sklearn-pandas

MIT
Python
跨平台
2017-02-22
两味真火

Sklearn-pandas既可以视为一个通用型的机器学习工具包,也可是视为一些特定算法的实现。它在具体的机器学习任务中主要充当支持者的角色。

这里所谓支持者的角色,按照其官网的解释即是说:Sklearn-pandas在Scikit-Learn和pandas之间提供了一个互通的桥梁(这一点从项目的名称也能看出)。Scikit-Learn上文已经提过,这里pandas是指一个开源的基于Python实现的数据分析工具。

具体的说,Sklearn-pandas的桥梁作用主要体现在以下两个方面:

  1. 提供将DataFrame列映射到transformations的方法,这些列此后还可以重新组合成特征(features);

  2. 以pandas DataFrame为输入,为scikit-learn旧版本的管道交叉验证(cross-validate a pipeline)提供兼容性支持。

Sklearn-pandas的版本更新活跃,也是一个非常值得关注的开源项目。

加载中

评论(0)

暂无评论

暂无资讯

暂无问答

libsvm与dataframe格式相互转换

python、sklearn

2017/12/11 14:56
222
0
Python批量进行One-hot

封装的代码如下,文件名为my_one_hot_encoder.py import pandas as pd from sklearn.preprocessing import OneHotEncoder, LabelEncoder class One_hot_encoder: def __init__(self, df, col...

2018/06/03 21:06
67
0
数据挖掘 介绍与相关准备

数据挖掘简介 数据挖掘过程: 定义目标 获取数据(爬虫、统计网站) 数据探索 数据预处理(数据清洗、数据集成、数据变换、数据规约(精简)) 挖掘建模(分类、聚类、关联、预测) 模型评价...

2018/04/13 22:06
22
0
ApacheCN 学习资源汇总 2018.12

【主页】 apachecn.org 【Github】@ApacheCN 暂时下线: 社区 暂时下线: cwiki 知识库 自媒体平台 微博:@ApacheCN 知乎:@ApacheCN CSDN 简书 OSChina 博客园 我们不是 Apache 的官方组织/机...

2018/12/28 10:14
4
0
ApacheCN 学习资源汇总 2019.1

【主页】 apachecn.org 【Github】@ApacheCN 暂时下线: 社区 暂时下线: cwiki 知识库 自媒体平台 微博:@ApacheCN 知乎:@ApacheCN CSDN 简书 OSChina 博客园 我们不是 Apache 的官方组织/机...

02/13 22:36
0
0
机器学习库:Scikit-learn

## Scikit-learn 的安装:目前稳定版本0.18版本 - **Scikit-learn**库需要**Numpy,matplotlib,pandas,scipy**等库的支持。 所以,首先,我们要先安装好这些库。 > 在已有的虚拟环境中,使...

2018/04/25 01:21
11
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部