Doğrusal Regresyon Hakkında Bilinmesi Gerekenler

Bu içerikte Doğrusal Regresyon teriminin ne anlama geldiğine yer vermekte, doğrusal regresyona ilişkin bilinmesi gerekenleri derlemekteyiz.

Doğrusal regresyon genellikle makine öğrenimi eğitimleri ile başlamaktadır. Makine öğrenimi algoritmalarının temel mantığını sağlam bir şekilde oluşturmak hususunda doğrusal regresyonun önemli bir yere sahip olduğunu belirtmek gerekmektedir.

Temel amacı modeldeki bağımlı ve bağımsız değişken arasındaki ilişkiyi açıklamak olan doğrusal fonksiyonu bulmak olan doğrusal regresyonun formülü Yİ ifadesi ile bağımlı değişkeni ifade etmektedir. Bazı kaynaklarda hedef değişken olarak da gösterilebilen ifadede X ile temsil edilen bağımsız değişkenlerin katsayılar ile çarpılması sonucunda bir değere ulaşılmaya çalışılır.

Doğrusal regresyonda B0 ifadesi sabit katsayıyı vermektedir. Basit doğrusal regresyon hususunda tek bir değişken üzerinden hesaplama yapıldığından B1 üzerindeki bağımsız değişkenin önündeki katsayı temsil edilir. Öte yandan ε ifadesi ise gerçek veri ile tahmin edilen verinin arasındaki farkı temsil etmekte olan işarettir.

Algoritma ismi verilen bilgisayar programlama, makine öğreniminde büyük veri kümelerini analiz etmekte ve doğrusal regresyon denklemini hesaplamak için verilerden geriye dönük bir şekilde çalışmaktadır.

Doğrusal Regresyon Türleri

Değişkenlik

Değişiklik büyük veri kümelerinde doğal bir şekilde meydana geldiğinden bağımlı değişkenin ölçeğinin değiştirilmesi mantıklı kabul edilir. Artıkların x’in her değeri ise ortalamadan sabit değişikliğe veyahut standart sapmaya sahip olduğunu varsayan değer eş değişkenliktir

Doğrusal İlişki

Bağımlı ve bağımsız değişkenler arasında doğrusal bir ilişki bulunması gerekmekte olup, ilişkinin belirlenmesi için veri bilimcileri, düz bir çizgi boyunca düşüp düşmediğini gözlemlemek için saçılım grafiğinden yararlanmaktadır.

Artık Bağımsızlık

Tahmin doğruluğunu ölçebilmek için veri bilimcileri tarafından kullanılan artık bağımsızlık, gözlemlenen veriler ile tahmin edilen değer arasındaki farktır. Artık bağımsızlığın belirlenmesi için Durbin-Watson testi gibi testler kullanılmaktadır.

Normallik

Grafik oluşturma tekniklerinden Q-Q grafikleri, artıkların normal bir şekilde dağıtılıp dağıtılmadığını tespit etmektedir. Artıklar normalleştirilmemişse verileri rastgele aykırı değerler veyahut tipik olmayan değerler için test etmek mümkün olur. Aykırı sayıları kaldırmak veyahut doğrusal olmayan dönüşümler gerçekleştirmek problemi giderebilir.

Cevap bırakın