Hvordan beregne MSE

Når forskere, økonomer eller statistikere spår basert på teori og deretter samler reelle data, trenger de en måte å måle variasjonen mellom forutsagte og målte verdier. De er vanligvis avhengige av den gjennomsnittlige kvadratfeilen (MSE), som er summen av variasjonene til de enkelte datapunktene i kvadrat og delt med antall datapunkter minus 2. Når dataene vises på en graf, bestemmer du MSE ved å summere variasjonene i datapunktene for den vertikale aksen. På en x-y-graf vil det være y-verdiene.

Hvorfor kvadrat variasjonene?

Å multiplisere variasjonen mellom forutsagte og observerte verdier har to ønskelige effekter. Den første er å sikre at alle verdier er positive. Hvis en eller flere verdier var negative, kunne summen av alle verdiene være urealistisk liten og en dårlig representasjon av den faktiske variasjonen mellom forutsagte og observerte verdier. Den andre fordelen med kvadrering er å gi større vekt på større forskjeller, noe som sikrer at en stor verdi for MSE betyr store datavariasjoner.

instagram story viewer

Eksempel på beregning av lageralgoritme

Anta at du har en algoritme som forutsier prisene på en bestemt aksje på daglig basis. På mandag spår det aksjekursen til $ 5,50, på tirsdag til $ 6,00, onsdag $ 6,00, torsdag $ 7,50 og fredag ​​$ 8,00. Med tanke på mandag som dag 1, har du et sett med datapunkter som ser slik ut: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) og (5, 8.00). De faktiske prisene er som følger: Mandag $ 4,75 (1, 4,75); Tirsdag $ 5,35 (2, 5,35); Onsdag $ 6,25 (3, 6,25); Torsdag $ 7,25 (4, 7,25); og fredag: $ 8,50 (5, 8,50).

Variasjonene mellom y-verdiene til disse punktene er henholdsvis 0,75, 0,65, -0,25, 0,25 og -0,50, hvor det negative tegnet indikerer en beregnet verdi mindre enn den observerte. For å beregne MSE kvadrerer du først hver variasjonsverdi, som eliminerer minustegnene og gir 0,5625, 0,4225, 0,0625, 0,0625 og 0,25. Å summere disse verdiene gir 1,36 og dividere med antall målinger minus 2, som er 3, gir MSE, som viser seg å være 0,45.

MSE og RMSE

Mindre verdier for MSE indikerer nærmere samsvar mellom forutsagte og observerte resultater, og en MSE på 0,0 indikerer perfekt samsvar. Det er imidlertid viktig å huske at variasjonsverdiene er kvadratiske. Når det kreves en feilmåling som er i de samme enhetene som datapunktene, tar statistikere roten gjennomsnittlig kvadratfeil (RMSE). De oppnår dette ved å ta kvadratroten av den gjennomsnittlige kvadratfeilen. For eksemplet ovenfor ville RSME være 0,671 eller omtrent 67 cent.

Teachs.ru
  • Dele
instagram viewer