GBDT 算法实现框架 LightGBM

MIT
C/C++ Python 查看源码»
跨平台
微软
2017-01-06
王练

LightGBM(Light Gradient Boosting Machine) 是微软开源的一个实现 GBDT 算法的框架,支持高效率的并行训练。

GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。GBDT 在工业界应用广泛,通常被用于点击率预测,搜索排序等任务。GBDT 也是各种数据挖掘竞赛的致命武器,据统计 Kaggle 上的比赛有一半以上的冠军方案都是基于 GBDT。

LightGBM 提出的主要原因是为了解决 GBDT 在海量数据遇到的问题,让 GBDT 可以更好更快地用于工业实践。其具有以下优点:

  • 更快的训练速度

  • 更低的内存消耗

  • 更好的准确率

  • 分布式支持,可以快速处理海量数据

的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

LightGBM and XGBoost Explained

The gradient boosting decision tree (GBDT) is one of the best performing classes of algorithms in machine learning competitions. One implementation of the gradient boosting deci...

2018/08/05 12:39
101
0
【集成学习】lightgbm调参案例

lightgbm使用leaf_wise tree生长策略,leaf_wise_tree的优点是收敛速度快,缺点是容易过拟合。 # lightgbm关键参数 # lightgbm调参方法cv 代码github地址 1 # -*- coding: utf-8 -*- 2 """ ...

2018/08/05 18:00
273
0
LightGBM 算法原理

LightGBM 的动机 GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合...

前天 14:21
1
0
How LightGBM handles missing values?

https://www.kaggle.com/c/home-credit-default-risk/discussion/57918 How LightGBM handles missing values? posted in Home Credit Default Risk 2 months ago 8 Hi everyone Can anyone ...

2018/08/05 12:44
203
0
lightgbm研究

##lgb与lgb.sklearn参数对比 https://blog.csdn.net/weiyongle1996/article/details/78446244 ###较XGBoost对比 https://zhuanlan.zhihu.com/p/25308051 ###lightGBM调参顺序 https://lightg...

2018/11/06 10:50
27
0
LightGBM学习

官方文档 https://lightgbm.readthedocs.io/en/latest/Python-API.html http://lightgbm.apachecn.org/cn/latest/index.html 开源|LightGBM基本原理,以及调用形式 https://blog.csdn.net/HH...

2018/09/15 17:33
15
0
LightGBM 调参方法(北京赛车平台出租具体操作)

鄙人调参新手北京赛车平台出租 QQ2952777280【话仙源码论坛】hxforum.com【木瓜源码论坛】papayabbs.com,最近用lightGBM有点猛,无奈在各大博客之间找不到具体的调参方法,于是将自己的调参...

2018/07/17 15:01
3
0
XGBoost与LightGBM对比

http://www.aboutyun.com/thread-24339-1-1.html https://blog.csdn.net/bbbeoy/article/details/79590981 ###XGBoost的优势 https://blog.csdn.net/jasonzhangoo/article/details/73061060 ...

2018/09/13 11:37
43
0
很让人青睐的12个数据科学Python库

来源:AI科技大本营(ID:rgznai100) 1.Pandas 官网:https://pandas.pydata.org/ Pandas 是一个 Python 库,提供高级的数据结构和各种各样的分析工具。这个软件包的主要特点是能够将相当复...

03/26 21:32
0
0
Machine Learning Kaggle Competition Part Two

Machine Learning Kaggle Competition Part Two: Improving Feature engineering, feature selection, and model evaluation Like most problems in life, there are several potential appr...

2018/08/05 16:41
19
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部