「LightGBM」の版間の差分
ページ「LightGBM」の翻訳により作成 |
(相違点なし)
|
2021年6月15日 (火) 01:49時点における版
作者 | Guolin Ke[1] / Microsoft Research |
---|---|
開発元 | Microsoft and LightGBM Contributors[2] |
初版 | 2016年 |
最新版 |
v3.2.1[3]
/ 2021年4月12日 |
リポジトリ |
github |
プログラミング 言語 | C++, Python, R, C |
対応OS | Windows, macOS, Linux |
種別 | Machine learning, Gradient boosting framework |
ライセンス | MIT License |
公式サイト |
lightgbm |
LightGBMは、Light Gradient Boosting Machine の略で、機械学習用のフリーかつオープンソースの分散型勾配ブースティングフレームワークであり、マイクロソフトが開発した[4] [5]。決定木アルゴリズムをベースにしており、ランク付け、分類、その他の機械学習タスクに使用される。パフォーマンスとスケーラビリティに重点を置いて開発されている。
概要
LightGBM フレームワークは、GBT、GBDT、GBRT 、GBM、MART[6] [7]、RF など、さまざまなアルゴリズムをサポートしている[8]。LightGBM は、スパース最適化、並列学習、複数の損失関数、正則化、バギング、早期停止など、 XGBoost の利点を多く備えているが、ツリーの構造が大きく異なる。多くの実装ではツリーをレベル(行)ごとに成長させるが[9]、LightGBM ではツリーをリーフ(葉)ごとに育て、損失が最も減少すると思われるリーフを選択する[10]。また、LightGBM では、XGBoost その他の実装で採用されているソートベースの決定木アルゴリズム(ソートされた特徴量に基づいて最適な分割点を探索するアルゴリズム[11])ではなく、高度に最適化されたヒストグラムベースの決定木学習アルゴリズムを実装しており、効率性とメモリ消費の両面で大きなメリットがある[12]。LightGBM アルゴリズムは、GOSS(Gradient-Based One-Side Sampling)とEFB(Exclusive Feature Bundling)という 2 つの新しい技術を採用しており、高い精度を維持しながらアルゴリズムを高速に実行することができる[13]。
LightGBMは、Linux、Windows、macOS で動作し、C++、Python[14]、R、C# をサポートしている[15]。ソースコードは MIT Licenseでライセンスされており、GitHubで公開されている[16]。
GOSS
Gradient-Based One-Side Sampling(GOSS)は、GBDT のデータインスタンスにネイティブウェイトがないことを利用した手法。異なる勾配を持つデータインスタンスは、情報利得の計算において異なる役割を果たすため、より大きな勾配を持つインスタンスが情報利得に大きく貢献することになる。そのため、GOSS は情報の精度を保つために、勾配の大きいインスタンスを残し、勾配の小さいインスタンスを無作為に削除する[13]。
EFB
Exclusive Feature Bundling(EFB)は、有効な特徴量の数を削減するための、ほぼロスレスな手法である。スパースな特徴量空間では、多くの特徴量はほぼ排他的であり、同時にゼロ以外の値を取ることはほとんどない。ワンホットエンコードされた特徴量は、排他的な特徴量の典型例である。EFB では、これらの特徴量を束ねて次元を下げることで、高い精度を維持しつつ効率化を図っている。このように、排他的な特徴を 1 つの特徴量として束ねたものを EFB と呼ぶ[13]。
関連項目
- 機械学習
- ML.NET
- データビニング
- 勾配ブースティング
- XGBoost
- scikit-learn
参考文献
参考文献
- Guolin Ke, Qi Meng, Thomas Finely, Taifeng Wang, Wei Chen, Weidong Ma, Qiwei Ye, Tie-Yan Liu (2017). LightGBM: A Highly Efficient Gradient Boosting Decision Tree .
- Quinto, Butch (2020). Next-Generation Machine Learning with Spark – Covers XGBoost, LightGBM, Spark NLP, Distributed Deep Learning with Keras, and More. Apress. ISBN 978-1-4842-5668-8
外部リンク
- ^ “Guolin Ke”. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ “microsoft/LightGBM”. GitHub. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ “Releases · microsoft/LightGBM”. GitHub. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ Brownlee (2020年3月31日). “Gradient Boosting with Scikit-Learn, XGBoost, LightGBM, and CatBoost”. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ Kopitar, Leon; Kocbek, Primoz; Cilar, Leona; Sheikh, Aziz; Stiglic, Gregor (July 20, 2020). “Early detection of type 2 diabetes mellitus using machine learning-based prediction models”. Scientific Reports 10 (1): 11981. Bibcode: 2020NatSR..1011981K. doi:10.1038/s41598-020-68771-z. PMC 7371679. PMID 32686721 .
- ^ “Understanding LightGBM Parameters (and How to Tune Them)”. neptune.ai (2020年5月6日). Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ “An Overview of LightGBM”. avanwyk (2018年5月16日). Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ “Parameters — LightGBM 3.0.0.99 documentation”. lightgbm.readthedocs.io. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ The Gradient Boosters IV: LightGBM – Deep & Shallow
- ^ XGBoost, LightGBM, and Other Kaggle Competition Favorites | by Andre Ye | Sep, 2020 | Towards Data Science
- ^ Manish, Mehta; Rakesh, Agrawal; Jorma, Rissanen (Nov 24, 2020). “SLIQ: A fast scalable classifier for data mining.”. International Conference on Extending Database Technology .
- ^ “Features — LightGBM 3.1.0.99 documentation”. lightgbm.readthedocs.io. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ a b c Ke, Guolin; Meng, Qi; Finley, Thomas; Wang, Taifeng; Chen, Wei; Ma, Weidong; Ye, Qiwei; Liu, Tie-Yan (2017). “LightGBM: A Highly Efficient Gradient Boosting Decision Tree” (英語). Advances in Neural Information Processing Systems 30 .
- ^ “lightgbm: LightGBM Python Package”. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ “Microsoft.ML.Trainers.LightGbm Namespace”. docs.microsoft.com. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
- ^ “microsoft/LightGBM” (2020年10月6日). Template:Cite webの呼び出しエラー:引数 accessdate は必須です。