Vad är luckor, kluster och outliers i matematik?

Näringsliv, myndigheter och akademiska aktiviteter kräver nästan alltid insamling och analys av data. Ett av sätten att representera numeriska data är genom grafer, histogram och diagram. Dessa visualiseringstekniker gör det möjligt för människor att få bättre inblick i problem och utforma lösningar. Gap, kluster och avvikelser är kännetecken för datamängder som påverkar matematisk analys och är lätt synliga på visuella representationer.

Hål i data

Mellanrum avser områden som saknas i en datamängd. Till exempel, om ett vetenskapligt experiment samlar temperaturdata inom området 50 grader Fahrenheit till 100 grader Fahrenheit, men inget mellan 70 och 80 grader, som skulle representera ett gap i datan uppsättning. En linjediagram för denna datamängd skulle ha "x" -markeringar för temperaturer mellan 50 och 70 och igen mellan 80 och 100, men det skulle inte finnas något mellan 70 och 80. Forskare kan gräva djupare och utforska varför vissa datapunkter inte dyker upp i ett samlat urval.

Isolerade grupper

Kluster är isolerade grupper av datapunkter. Linjediagram, som är ett av sätten att representera datamängder, är linjer med "x" -markeringar placerade ovanför specifika siffror för att avbilda deras frekvens av förekomst i datamängden. Ett kluster avbildas som en samling av dessa "x" -märken i ett litet intervall eller datamängd. Till exempel, om tentapoängen för en klass på 10 elever är 74, 75, 80, 72, 74, 75, 76, 86, 88 och 73, kommer de flesta "x" -markeringarna på en linjediagram att vara i 72- till-76 poängintervall. Detta skulle representera ett datakluster. Observera att frekvensen för 74 och 75 är två, men för alla andra poäng är den en.

Vid extremerna

Outliers är extrema värden - datapunkter som ligger betydligt utanför andra värden i en datamängd. En avvikare måste vara betydligt mindre än eller större än majoriteten av siffrorna i en datamängd. Definitionen av "extrem" beror på omständigheterna och samförståndet mellan de analytiker som är inblandade i forskningen. Outliers kan vara dåliga datapunkter, även kända som buller, eller de kan innehålla värdefull information om fenomenet som undersöks och själva datainsamlingsmetoden. Till exempel, om klassresultat mestadels ligger i intervallet 70 till 80, men ett par poäng ligger i de låga 50-talet, kan de representera avvikare.

Sätta ihop allting

Brister, avvikelser och kluster i datamängder kan påverka resultaten av matematisk analys. Gap och kluster kan representera fel i datainsamlingsmetoden. Om en telefonundersökning till exempel bara avfrågar vissa riktnummer, till exempel låginkomstkomplex eller avancerade förorter bostadsområden, och inte ett brett tvärsnitt av befolkningen, är chansen att det kommer luckor och kluster i uppgifterna. Outliers kan vrida medel- eller medelvärdet för en datamängd. Till exempel är medel- eller medelvärdet för en datamängd bestående av fyra siffror - 50, 55, 65 och 90 - 65. Utan outlier 90 är emellertid medelvärdet cirka 57.

  • Dela med sig
instagram viewer