Le tabelle di frequenza possono essere utili per descrivere il numero di occorrenze di un particolare tipo di dato all'interno di un set di dati. Le tabelle di frequenza, chiamate anche distribuzioni di frequenza, sono uno degli strumenti più basilari per la visualizzazione di statistiche descrittive. Le tabelle di frequenza sono ampiamente utilizzate come riferimento immediato nella distribuzione dei dati; sono facili da interpretare e possono visualizzare insiemi di dati di grandi dimensioni in modo abbastanza conciso. Le tabelle di frequenza possono aiutare a identificare tendenze ovvie all'interno di un set di dati e possono essere utilizzate per confrontare i dati tra set di dati dello stesso tipo. Tuttavia, le tabelle di frequenza non sono appropriate per ogni applicazione. Possono oscurare valori estremi (più di X o meno di Y) e non si prestano ad analisi dell'inclinazione e della curtosi dei dati.
Visualizzazione rapida dei dati
Le tabelle di frequenza possono rivelare rapidamente valori anomali e persino tendenze significative all'interno di un set di dati con non molto più di un'ispezione superficiale. Ad esempio, un insegnante potrebbe visualizzare i voti degli studenti per un semestre su una tabella di frequenza per dare una rapida occhiata a come sta andando la sua classe nel complesso. Il numero nella colonna della frequenza rappresenterebbe il numero di studenti che ricevono quel voto; per una classe di 25 studenti, la distribuzione della frequenza dei voti ricevuti in lettere potrebbe essere simile a questa: Frequenza dei voti A...7 B...13 C...3 D...2
Visualizzazione dell'abbondanza relativa
Le tabelle di frequenza possono aiutare i ricercatori a esaminare l'abbondanza relativa di ogni particolare dato target all'interno del loro campione. L'abbondanza relativa rappresenta quanto del set di dati è composto dai dati di destinazione. L'abbondanza relativa è spesso rappresentata come un istogramma di frequenza, ma può essere facilmente visualizzata in una tabella di frequenza. Considera la stessa distribuzione di frequenza dei voti intermedi. L'abbondanza relativa è semplicemente la percentuale degli studenti che hanno ottenuto un determinato voto e può essere utile per concettualizzare i dati senza pensarci troppo. Ad esempio, con la colonna aggiunta che mostra la percentuale di occorrenza di ciascun voto, puoi facilmente vedi che più della metà della classe ha segnato una B, senza dover esaminare i dati in modo molto dettagliato.
Grado Frequenza Abbondanza relativa (% frequenza) A...7...28% B...13...52% C...3...12% D...2...8%
Potrebbe essere necessario classificare i set di dati complessi in intervalli
Uno svantaggio è che è difficile comprendere set di dati complessi visualizzati su una tabella di frequenza. I set di dati di grandi dimensioni possono essere suddivisi in classi di intervallo per una facile visualizzazione utilizzando una tabella di frequenza. Ad esempio, se chiedessi alle prossime 100 persone di vedere quale fosse la loro età, probabilmente otterresti una vasta gamma di risposte che vanno da tre a novantatré. Anziché includere righe per ogni età nella tabella delle frequenze, puoi classificare i dati in intervalli, ad esempio 0 - 10 anni, 11 - 20 anni, 21 - 30 anni e così via. Questo può anche essere indicato come una distribuzione di frequenza raggruppata.
Le tabelle di frequenza possono oscurare l'inclinazione e la curtosi
A meno che non vengano visualizzati su un istogramma, l'asimmetria e la curtosi dei dati potrebbero non essere immediatamente evidenti in una tabella di frequenza. L'asimmetria ti dice in quale direzione tendono i tuoi dati. Se i voti fossero visualizzati lungo l'asse X di un grafico che mostra la frequenza dei voti di medio termine per i nostri 25 studenti sopra, la distribuzione sarebbe distorta verso A e B. Kurtosis ti parla del picco centrale dei tuoi dati: se rientrerebbe in una distribuzione normale, che è una bella curva a campana liscia, o se sarebbe alto e affilato. Se si rappresenta graficamente i voti di medio termine nel nostro esempio, si troverà un picco alto in B con un netto calo nella distribuzione dei voti più bassi.