İçeriğimizde XGBoost teriminin anlamına yer vermekte ve XGBoost’a ilişkin temel bilgilere değinmekteyiz. İşte detaylar…
XGBoost terimi Extreme Gradient Boosting açılımına sahiptir. Gradient Boosted Trees yani gradyan artırılmış ağaçlar algoritmasının açık kaynaklı bir uygulaması olarak karşımıza çıkmaktadır. Linux, MacOS, Windows üzerinde çalışmaktadır. Proje açıklamasından Ölçeklenebilir, Taşınabilir ve Dağıtılmış Gradiend Boosting Kütüphanesi sağlanmasını hedefler.
Gerek tahmin gücü gerekse kullanım açısından sağladığı kolaylık nedeniyle Kaggle yazışmalarının son derece popüler makine öğrenmesi algoritması olarak karşımıza çıkan XGBoost, genel itibariyle sınıflandırma ve regresyon işlemlerine yönelik kullanılan denetimli öğrenme algoritması olarak öne çıkar.
Çok sayıda yaprağı yer alan köklü bir ağaca benzediğinden Karar Ağaçları ismini alan makine öğrenmesi algoritması, en kolay yorumlanabilir aksine öğrenmesi algoritması olarak karşımıza çıkmakta, özellikle doğru tekniklerle kullanıldığında etkisini göstermektedir.
XGBoost, karar ağaçlarının “zayıf” tahminleyicileri şeklinde kullanılmakta olan bir gradyan artırma algoritması olarak karşımıza çıkmaktadır. Optimum performans ve bunun yanı sıra hıza odaklanmaktadır. Yapılandırılmış tablo verilerinde son derece iyi bir performansa göstermektedir fakat görüntü, ses gibi yapılandırılmamış olan verilerle uğraşanlar için XGBoost yerine sinir ağları daha iyi bir tercih olacaktır.
XGBoost’u makine öğrenimine ilişkin yarışmaları kazanan pek çok takım tercih etmiş, özellikle 2010’lu yılların ortalarında büyük bir popülerlik kazanmıştı.