Kako izračunati MSE

Ko znanstveniki, ekonomisti ali statistiki naredijo napovedi na podlagi teorije in nato zberejo resnične podatke, potrebujejo način, kako izmeriti razlike med napovedanimi in izmerjenimi vrednostmi. Običajno se zanašajo na povprečno kvadratno napako (MSE), ki je vsota variacij posameznih podatkovnih točk na kvadrat in deljena s številom podatkovnih točk minus 2. Ko so podatki prikazani na grafu, določite MSE s seštevanjem sprememb v podatkovnih točkah navpične osi. Na grafu x-y bi to bile vrednosti y.

Zakaj spremeniti kvadrat?

Množenje variacije med napovedanimi in opaženimi vrednostmi ima dva zaželena učinka. Prvi je zagotoviti pozitivne vrednosti vseh vrednot. Če je bila ena ali več vrednosti negativnih, je lahko vsota vseh vrednosti nerealno majhna in slabo predstavlja dejansko spremembo med napovedanimi in opaženimi vrednostmi. Druga prednost kvadriranja je, da večjim razlikam damo večjo težo, kar zagotavlja, da velika vrednost za MSE pomeni velike razlike v podatkih.

Algoritem zalog za izračun vzorcev

Recimo, da imate algoritem, ki dnevno predvideva cene določene delnice. V ponedeljek napoveduje tečaj delnic 5,50 USD, v torek 6,00 USD, sredo 6,00 USD, četrtek 7,50 USD in petek 8,00 USD. Če upoštevamo ponedeljek kot 1. dan, imate nabor podatkovnih točk, ki so videti takole: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) in (5, 8.00). Dejanske cene so naslednje: ponedeljek 4,75 USD (1, 4,75); Torek 5,35 USD (2, 5,35); Sreda 6,25 USD (3, 6,25); Četrtek 7,25 USD (4, 7,25); in petek: 8,50 USD (5, 8,50).

Razlike med vrednostmi y teh točk so 0,75, 0,65, -0,25, 0,25 in -0,50, pri čemer negativni predznak pomeni napovedano vrednost, manjšo od opazovane. Za izračun MSE najprej vsako vrednost spremembe spremenite v kvadrat, ki odpravi znake minus in daje 0,5625, 0,4225, 0,0625, 0,0625 in 0,25. Če te vrednosti seštejemo, dobimo 1,36 in delimo s številom meritev minus 2, kar je 3, in dobimo MSE, ki se izkaže za 0,45.

MSE in RMSE

Manjše vrednosti za MSE kažejo na tesnejše soglasje med napovedanimi in opaženimi rezultati, MSE 0,0 pa popolno strinjanje. Pomembno pa je vedeti, da so vrednosti variacije na kvadrat. Kadar je potrebno merjenje napak, ki je v enakih enotah kot podatkovne točke, statistiki vzamejo napako korenovka (RMSE). To dobijo tako, da vzamejo kvadratni koren srednje kvadratne napake. Za zgornji primer bi RSME znašal 0,671 ali približno 67 centov.

  • Deliti
instagram viewer