- Published on
Ordinary Least Squares(En Küçük Kareler Yöntemi, OLS) ve Maliyet Fonksiyonu Nedir? [Detaylı ve Anlaşılır Örneklerle]
- Authors
- Name
- Alperen Önal
Bu yazı, Lineer Regresyon Nedir? yazısının devamıdır. Lütfen bu konunun daha anlaşılır olması için önceki yazıyı anlamış olalım.
Makine Öğrenmesi ve Optimizasyon
- Makine öğrenmesi optimizasyonunda temel amacımızın tahminin doğruluğunu arttırmak olduğunu biliyoruz. Lineer regresyonda'da bu doğruluk oranlarını test etmek için Mean Squared Error (MSE), Mean Absolute Error (MAE) gibi yöntemleri kullandığımızı öğrenmiştik.
- Optimizasyonu, modelimize en uygun parametreleri seçerek yani, hata değerlerini(MSE, MAE vs.) düşürerek gerçekleştiriyoruz.
- Bu hata değerlerini düşürebilmek için de çeşitli yöntemler var. Bu yazımızda Lineer Regresyon üzerinden anlatımını gerçekleştireceğiz.
- Modelimizin optimizasyonunu sağlamak için ve en doğru parametreleri belirleyebilmek için aşağıdaki kavramları ayrıntılı olarak inceleyeceğiz.
- Cost Function(Maliyet Fonksiyonu)
- Ordinary Least Squares(En Küçük Kareler Yöntemi)
- Gradient Descent(Gradyan İnişi) --->(Bir sonraki yazımızda göreceğiz)
1. Cost Function(Maliyet Fonksiyonu) Nedir?
Cost Function, optimizasyonun temel taşıdır.
Cost Function, bir makine öğrenmesi modelinin tahminlerinin ne kadar yanlış olduğunu ölçmek için kullanılan matematiksel bir fonksiyondur.
Modelin performansını değerlendirmek, optimizasyon sırasında hatayı düşürmek için araç olarak kullanırız.
⚠️ Cost Function, modelin doğruluk oranını doğrudan arttırmaz, modelin doğruluk oranını incelemek için kullanırız. Başka bir deyişle, bize modelin doğruluk oranını gösterir. Biz de bu doğruluk oranlarını analiz ederek modelimiz için en doğru parametreleri seçmeye çalışırız.
Cost function'un formülü, kullanılan makine öğrenmesi modeline ve hata ölçüm yöntemine göre değişir. Örneğin, bu yazımızda lineer regresyon modelinde ve MSE hata ölçümü yöntemini kullanarak anlatımını gerçekleştireceğiz.
Genellikle, lineer regresyon gibi en temel makine öğrenmesi modelleri için kullanılan en yaygın maliyet fonksiyonu MSE hata ölçümü yöntemi üzerine kuruludur.
Cost function, ile ifade edilir.(Cost Function = )
Veya birden fazla değişken olduğu durumlarda, gösterimi ile genelleyebileceğiniz gibi ayrıca, ile de gösterimini yapabilirsiniz.
: Parametrelerin() başarımını ölçer.
MSE hata ölçümü yöntemininin formülünü bir önceki yazımızdan hatırlayacak olursak:
Eğer MSE formülümüze bir de ifadesini ekleyecek olursak, bu cost function'a dönecektir:
Neden ifadesini formülümüze ekledik? Eklemesek olmaz mıydı?
- Tabii ki, MSE formülünü direkt olarak maliyet fonksiyonu olarak tanımlayabilirdiniz. Ancak bir sonraki yazımızda göreceğimiz Gradient Descent yönteminde türev işlemi alma aşamasında bize matematiksel kolaylık sağlaması için konulmuş ve böyle kabul görmüş.
Terminoloji:
- : Cost function, parametrelerin() başarımını ölçer.
- m: Eğitim veri setindeki örnek sayısı.
- : Modelin i-inci tahmini ( )
- : i-inci noktadaki gerçek değer.
- : i-inci tahmin ve gerçek değer arasındaki hatanın karesi.
Cost Function(Maliyet Fonksiyonu) Nasıl Çalışır?
- Modelin tahminleri (h(x)) gerçek değerlerden (y) uzaksa:
- Maliyet fonksiyonun değeri büyük olur.
- Modelin tahminleri gerçek değerlere yaklaştıkça:
- Maliyet fonksiyonun değeri küçük olur.
- Hedef:
- , eşitliğine olabildiğince yaklaşabilmek için gerekli olan değerini, değerlerini elde edebilmek.
Cost Function(Maliyet Fonksiyonu) Nasıl Minimize Edilir?
Maliyet fonksiyonunu minimize etmek için çeşitli fonksiyonlar kullanabiliriz. Bu yazıda yaygın olan 2 fonksiyonu göreceğiz.
- Ordinary Least Squares(En Küçük Kareler Yöntemi)
- Gradient Descent(Gradyan İnişi)
2. Ordinary Least Squares(En Küçük Kareler Yöntemi, OLS) Nedir?
- OLS'nin amacı, bir bağımlı değişken (y) ile bir veya daha fazla bağımsız değişken () arasındaki ilişkiyi modelleyen bir lineer regresyon hipotezi/fonksiyonu () için en iyi parametreleri bulmaktır.
Ordinary Least Squares(OLS) Kapalı Form İle Parametrelerin Bulunması
: Bir vektördür/matristir ve doğrusal regresyon modelinin tüm katsayılarını (, , , ..., ) içerir.
X: Özellik(feature) matrisidir. 0. Sütun komple 1 yapılır
Y: Bir sütun vektörüdür/matrisidir ve yalnızca bağımlı değişken değerlerini içerir.
Şekil 2.'deki veris setindeki katsayıları başka bir deyişle parametreleri() bulmak için bir örnek yapalım:
- Soru: Şekil 2.'deki veriseti için kapalı form yöntemini kullanarak parametreleri bulun ve modelin hipotez(tahmin) fonksiyonunu oluşturun. Ardından yaşı 22, kilosu 73 olan birisi için tahminde bulunun.
- Çözüm(numpy ile siz de deneyebilirsiniz.):
...
- CEVAP:
(Veri setinin az olmasından dolayı tahmin, boyumun yanından geçemedi😅. Neyse, biz cevabı bulduk 🤓.)
- Bu yazımızda OLS ve Maliyet fonksiyonu kavramlarını öğrendik ve kapalı form çözümüyle bir veri setinin katsayılarını hesaplayarak hipotez fonksiyonunu bulduk.
- Bir sonraki yazımız, Gradient Descent üzerine olacak. Bu yazıyı fazla uzatmamak adına ayrı olarak yazma kararı aldım. Zaman ayırdığınız için teşekkürler. Gradient Descent'e konusunda görüşmek üzere 👋👋👋🤙