Bilim adamları, ekonomistler veya istatistikçiler teoriye dayalı tahminlerde bulunduklarında ve ardından gerçek verileri topladıklarında, tahmin edilen ve ölçülen değerler arasındaki farkı ölçmek için bir yola ihtiyaç duyarlar. Genellikle, karesi alınan ve veri noktası sayısı eksi 2'ye bölünen bireysel veri noktalarının varyasyonlarının toplamı olan ortalama kare hatasına (MSE) dayanırlar. Veriler bir grafik üzerinde görüntülendiğinde, MSE'yi dikey eksen veri noktalarındaki varyasyonları toplayarak belirlersiniz. Bir x-y grafiğinde bu, y değerleri olacaktır.
Neden Varyasyonların Karesi?
Tahmin edilen ve gözlenen değerler arasındaki varyasyonu çarpmanın iki arzu edilen etkisi vardır. Birincisi, tüm değerlerin pozitif olduğundan emin olmaktır. Bir veya daha fazla değer negatifse, tüm değerlerin toplamı gerçekçi olamayacak kadar küçük olabilir ve tahmin edilen ve gözlenen değerler arasındaki gerçek varyasyonun zayıf bir temsili olabilir. Kare almanın ikinci avantajı, MSE için büyük bir değerin büyük veri varyasyonlarını ifade etmesini sağlayan daha büyük farklılıklara daha fazla ağırlık vermektir.
Örnek Hesaplama Stok Algoritması
Belirli bir hisse senedinin fiyatlarını günlük olarak tahmin eden bir algoritmanız olduğunu varsayalım. Pazartesi günü, hisse senedi fiyatının 5,50 dolar, Salı günü 6,00 dolar, Çarşamba 6,00 dolar, Perşembe 7,50 dolar ve Cuma günü 8,00 dolar olacağını tahmin ediyor. Pazartesi gününü 1. Gün olarak kabul ederseniz, şöyle görünen bir dizi veri noktanız vardır: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) ve (5, 8.00). Gerçek fiyatlar aşağıdaki gibidir: Pazartesi 4,75$ (1,4,75); Salı 5,35$ (2, 5,35); Çarşamba $6,25 (3, 6,25); Perşembe $7,25 (4, 7,25); ve Cuma: 8,50 dolar (5, 8,50).
Bu noktaların y değerleri arasındaki varyasyonlar sırasıyla 0.75, 0.65, -0.25, 0.25 ve -0.50'dir, burada negatif işaret, gözlemlenenden daha küçük bir tahmin değeri gösterir. MSE'yi hesaplamak için önce eksi işaretlerini ortadan kaldıran ve 0,5625, 0,4225, 0,0625, 0,0625 ve 0,25 veren her bir varyasyon değerinin karesini alırsınız. Bu değerleri toplamak 1,36'yı verir ve ölçüm sayısı eksi 2 olan 3'e bölmek MSE'yi verir, bu da 0,45 olur.
MSE ve RMSE
MSE için daha küçük değerler, tahmin edilen ve gözlemlenen sonuçlar arasında daha yakın bir anlaşmayı ve 0.0'lık bir MSE, mükemmel anlaşmayı gösterir. Bununla birlikte, varyasyon değerlerinin karesinin alındığını hatırlamak önemlidir. Veri noktalarıyla aynı birimlerde olan bir hata ölçümü gerektiğinde, istatistikçiler hatanın ortalama karesini (RMSE) alır. Bunu ortalama kare hatasının karekökünü alarak elde ederler. Yukarıdaki örnek için, RSME 0,671 veya yaklaşık 67 sent olacaktır.