Mitä ovat matematiikan aukot, klusterit ja poikkeamat?

Liiketoiminta, hallinto ja akateeminen toiminta edellyttävät melkein aina tietojen keräämistä ja analysointia. Yksi tapa esittää numeerista tietoa on kaavioiden, histogrammien ja kaavioiden avulla. Näiden visualisointitekniikoiden avulla ihmiset voivat saada paremman käsityksen ongelmista ja suunnitella ratkaisuja. Puut, klusterit ja poikkeamat ovat tietojoukkojen ominaisuuksia, jotka vaikuttavat matemaattiseen analyysiin ja ovat helposti näkyvissä visuaalisissa esityksissä.

Reiät tiedoissa

Puutteet viittaavat tietojoukon puuttuviin alueisiin. Esimerkiksi, jos tieteellinen koe kerää lämpötilatietoja välillä 50 astetta Fahrenheit 100 asteeseen Fahrenheit, mutta ei mitään 70-80 astetta, mikä merkitsisi aukkoa tiedoissa aseta. Tämän tietojoukon viivakaaviossa olisi "x" -merkit lämpötiloissa välillä 50 ja 70 ja taas välillä 80 ja 100, mutta välillä 70 ja 80 ei olisi mitään. Tutkijat voivat kaivaa syvemmälle ja tutkia, miksi tietyt datapisteet eivät näy kerätyssä näytteessä.

Eristetyt ryhmät

Klusterit ovat eristettyjä datapisteiden ryhmiä. Viivakäyrät, jotka ovat yksi tapa esittää tietojoukkoja, ovat viivoja, joissa "x" -merkit on asetettu tiettyjen numeroiden yläpuolelle kuvaamaan niiden esiintymistiheyttä tietojoukossa. Ryhmä kuvataan näiden "x" -merkkien kokoelmana pienessä aikavälissä tai datajoukossa. Esimerkiksi, jos 10 oppilaan luokan tenttitulokset ovat 74, 75, 80, 72, 74, 75, 76, 86, 88 ja 73, viivan kaavion eniten "x" -merkkejä olisi 72- pisteiden väli - 76. Tämä edustaisi tietoryhmää. Huomaa, että 74: n ja 75: n taajuus on kaksi, mutta kaikille muille pisteille se on yksi.

Äärimmäisissä

Poikkeamat ovat ääriarvoja - datapisteitä, jotka ovat merkittävästi tietojoukon muiden arvojen ulkopuolella. Poikkeaman on oltava merkittävästi pienempi tai suurempi kuin suurin osa tietojoukon numeroista. "Äärimmäisen" määritelmä riippuu olosuhteista ja tutkimukseen osallistuvien analyytikoiden yksimielisyydestä. Poikkeamat voivat olla huonoja datapisteitä, joita kutsutaan myös meluksi, tai ne voivat sisältää arvokasta tietoa tutkittavasta ilmiöstä ja itse tiedonkeruumenetelmistä. Esimerkiksi jos luokkien tulokset ovat enimmäkseen välillä 70-80, mutta pari pistettä on matalilla 50-luvulla, ne saattavat edustaa poikkeavuuksia.

Yhdistämällä kaikki yhdessä

Aukot, poikkeamat ja klusterit tietojoukoissa voivat vaikuttaa matemaattisen analyysin tuloksiin. Puut ja klusterit saattavat edustaa virheitä tiedonkeruumenetelmissä. Esimerkiksi, jos puhelintutkimuksessa kysytään vain tiettyjä suuntanumeroita, kuten matalan tulotason asuntokomplekseja tai huippuluokan esikaupunkialueita asuinalueilla eikä laajalla väestönosalla, on todennäköistä, että tiedoissa on aukkoja ja klustereita. Poikkeukselliset voivat vääristää tietojoukon keskiarvoa tai keskiarvoa. Esimerkiksi neljästä numerosta 50, 55, 65 ja 90 koostuvan tietojoukon keskiarvo tai keskiarvo on 65. Ilman 90: ää, keskiarvo on kuitenkin noin 57.

  • Jaa
instagram viewer