Kaip apskaičiuoti MSE

Kai mokslininkai, ekonomistai ar statistikai daro prognozes remdamiesi teorija ir tada renka realius duomenis, jiems reikia būdo išmatuoti numatomų ir išmatuotų verčių skirtumus. Paprastai jie remiasi vidutine kvadratine paklaida (MSE), kuri yra atskirų duomenų taškų variantų kvadratu suma ir padalyta iš duomenų taškų skaičiaus atėmus 2. Kai duomenys rodomi diagramoje, MSE nustatote susumuodami vertikalių ašių duomenų taškų svyravimus. X-y grafike tai būtų y reikšmės.

Kodėl kvadratas variacijos?

Padauginus numatytų ir pastebėtų verčių skirtumus, yra du pageidaujami efektai. Pirmasis yra užtikrinti, kad visos vertės būtų teigiamos. Jei viena ar daugiau reikšmių buvo neigiamos, visų verčių suma gali būti nerealiai maža ir blogai atspindėti tikrąjį numatytų ir stebimų verčių skirtumą. Antrasis kvadrato pranašumas yra suteikti daugiau svorio didesniems skirtumams, o tai užtikrina, kad didelė MSE vertė reiškia didelius duomenų pokyčius.

Skaičiavimo atsargų algoritmo pavyzdys

Tarkime, kad turite algoritmą, kuris kasdien numato tam tikrų akcijų kainas. Pirmadienį ji prognozuoja, kad akcijų kaina bus 5,50 USD, antradienį - 6,00 USD, trečiadienį - 6,00 USD, ketvirtadienį - 7,50 USD ir penktadienį - 8,00 USD. Pirmadienį laikant 1 diena, turite duomenų taškų rinkinį, kuris rodomas taip: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) ir (5, 8.00). Faktinės kainos yra šios: pirmadienis - 4,75 USD (1, 4,75); Antradienis 5,35 USD (2, 5,35); Trečiadienis 6,25 USD (3, 6,25); Ketvirtadienis 7,25 USD (4, 7,25); ir penktadienį: 8,50 USD (5, 8,50).

instagram story viewer

Šių taškų y reikšmių svyravimai yra atitinkamai 0,75, 0,65, -0,25, 0,25 ir -0,50, kur neigiamas ženklas rodo numatomą vertę, mažesnę už stebėtąją. Norėdami apskaičiuoti MSE, pirmiausia kvadratuokite kiekvieno varianto vertę, kuri pašalina minuso ženklus ir duoda 0,5625, 0,4225, 0,0625, 0,0625 ir 0,25. Susumavus šias reikšmes gaunama 1,36 ir padalijus iš matavimų skaičiaus, atėmus 2, kuris yra 3, gaunama MSE, kuri pasirodo esanti 0,45.

MSE ir RMSE

Mažesnės MSE vertės rodo glaudesnį numatytų ir pastebėtų rezultatų sutapimą, o MSE 0,0 rodo tobulą sutarimą. Tačiau svarbu nepamiršti, kad variantų vertės yra kvadratinės. Kai reikia išmatuoti paklaidą, kuri yra tose pačiose vienetėse kaip ir duomenų taškai, statistikai imasi kvadratinės vidutinės paklaidos (RMSE). Jie tai gauna paėmę vidutinės kvadratinės paklaidos kvadratinę šaknį. Ankstesniame pavyzdyje RSME būtų 0,671 arba apie 67 centus.

Teachs.ru
  • Dalintis
instagram viewer