Kun sovitetaan suora viiva tietojoukkoon, saatat olla kiinnostunut määrittämään, kuinka hyvin tuloksena oleva viiva sopii dataan. Yksi tapa tehdä tämä on laske neliöiden summa virhe (SSE). Tämä arvo mittaa sitä, kuinka parhaiten sopiva viiva arvioi tietojoukon. SSE on tärkeä kokeellisten tietojen analysoinnissa, ja se määritetään vain muutamalla lyhyellä vaiheella.
Etsi linja, joka parhaiten sopii tietojen mallintamiseen regressiota käyttämällä. Parhaimman sovituksen linjalla on muoto y = ax + b, jossa a ja b ovat parametreja, jotka sinun on määritettävä. Löydät nämä parametrit yksinkertaisen lineaarisen regressioanalyysin avulla. Oletetaan esimerkiksi, että parhaiten sopivan linjan muoto on y = 0,8x + 7.
Määritä yhtälön avulla jokaisen y-arvon arvo, jonka ennustaa parhaiten sopiva viiva. Voit tehdä tämän korvaamalla kukin x-arvo viivan yhtälöön. Esimerkiksi, jos x on yhtä suuri kuin 1, korvaamalla se yhtälöön y = 0,8x + 7 saadaan y-arvoksi 7,8.
Määritä parhaiten sopivan yhtälön riviltä ennustettujen arvojen keskiarvo. Voit tehdä tämän laskemalla yhteen yhtälöistä ennustetut y-arvot ja jakamalla saatu luku arvojen määrällä. Esimerkiksi, jos arvot ovat 7,8, 8,6 ja 9,4, näiden arvojen yhteenlaskeminen antaa 25,8 ja jakamalla tämä luku arvojen lukumäärällä, tässä tapauksessa 3, saadaan 8,6.
Vähennä kukin yksittäisistä arvoista keskiarvosta ja neliö saatu tulos. Esimerkissämme, jos vähennämme arvon 7,8 keskiarvosta 8,6, tuloksena oleva luku on 0,8. Tämän arvon neliöiminen antaa 0,64.
Lasketaan yhteen kaikki vaiheesta 4 saadut neliöarvot. Jos sovellat vaiheen 4 ohjeita kaikkiin esimerkkimme kolmeen arvoon, löydät arvot 0,64, 0 ja 0,64. Näiden arvojen yhteenveto antaa 1,28. Tämä on neliövirheen summa.