分布式梯度增强库 XGBoost

分布式梯度增强库 XGBoost

Apache
C/C++ Scala 查看源码»
跨平台
2017-06-02
局长

XGBoost是"极端梯度提升"(eXtreme Gradient Boosting)的简称。XGBoost 源于梯度提升框架,但是更加高效,秘诀就在于算法能并行计算、近似建树、对稀疏数据的有效处理以及内存使用优化,这使得 XGBoost 至少比现有梯度提升实现有至少 10 倍的速度提升。

XGBoost 支持在多台机器上进行分布式训练,包括 AWS,GCE,Azure 和 Yarn 集群。可以与 Flink,Spark 和其他云数据流系统集成。

XGBoost 可以处理回归、分类和排序等多种任务。由于它在预测性能上的强大且训练速度快,XGBoost 已屡屡斩获 Kaggle 各大竞赛的冠军宝座。

的码云指数为
超过 的项目
加载中

评论(3)

徐长龙
徐长龙
好给力
开源小肚兜
开源小肚兜
非常不错的东西
改着名儿玩
改着名儿玩
没有看懂

暂无资讯

暂无问答

xgboost-kaggle

https://www.kaggle.com/dansbecker/xgboost This tutorial is part of the Learn Machine Learning series. In this step, you will learn how to build and optimize models with the powe...

2018/08/19 11:06
69
0
LightGBM and XGBoost Explained

The gradient boosting decision tree (GBDT) is one of the best performing classes of algorithms in machine learning competitions. One implementation of the gradient boosting deci...

2018/08/05 12:39
58
0
XGBoost在进行pyinstaller打包后的问题解决

安装xgboost(版本0.81)后,在PyCharm中使用,没有任何问题,但进行pyinstaller(版本3.4)打包后,运行会提示以下问题: 找不到xgboost.dll文件,这个问题很奇怪,明明在开发软件中没有问题...

01/06 16:11
3
0
RF、GBDT、XGBoost面试级整理

由于本文是基于面试整理,因此不会过多的关注公式和推导,如果希望详细了解算法内容,敬请期待后文。      RF、GBDT和XGBoost都属于集成学习(Ensemble Learning),集成学习的目的是通过...

2018/07/30 21:20
66
0
待整理代码

1、批量操作pd.get_dummies 2、NaiveBayes、LR、XGBoost单机&多进程核心代码 ##终于明白为什么,转换预测数据会有失败的,因为部分取值存在缺失,无法判断 https://stackoverflow.com/questi...

2018/09/02 20:05
7
0
Avoid Overfitting By Early Stopping With XGBoost

Overfitting is a problem with sophisticated non-linear learning algorithms like gradient boosting. In this post you will discover how you can use early stopping to limit overfit...

2018/08/06 22:05
38
0
模型的保存、加载,预测报告的打印

sklearn模型的保存和加载 以xgboost为例,模型保存 from sklearn.model_selection import train_test_split from sklearn import metrics from sklearn.feature_extraction.text import Cou...

2018/07/02 17:31
120
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部