Como calcular o intervalo interquartil

O intervalo interquartil, freqüentemente abreviado como IQR, representa o intervalo do 25º ao 75º percentil, ou 50% do meio, de qualquer conjunto de dados. O intervalo interquartil pode ser usado para determinar qual seria o intervalo médio de desempenho em um teste: você pode usá-lo para ver onde a pontuação da maioria das pessoas em um determinado teste cai, ou determina quanto dinheiro o funcionário médio de uma empresa ganha com cada mês. O intervalo interquartil pode ser uma ferramenta mais eficaz de análise de dados do que a média ou mediana de um conjunto de dados, porque permite identificar o intervalo de dispersão em vez de apenas um único número.

TL; DR (muito longo; Não li)

O intervalo interquartil (IQR) representa os 50% intermediários de um conjunto de dados. Para calculá-lo, primeiro ordene seus pontos de dados do menor para o maior e, em seguida, determine seu primeiro e terceiro quartil posições usando as fórmulas (N + 1) / 4 e 3 * (N + 1) / 4 respectivamente, onde N é o número de pontos nos dados definir. Finalmente, subtraia o primeiro quartil do terceiro quartil para determinar o intervalo interquartil para o conjunto de dados.

instagram story viewer

Pontos de dados do pedido

O cálculo do intervalo interquartil é uma tarefa simples, mas antes de calcular você precisará organizar os vários pontos de seu conjunto de dados. Para fazer isso, comece ordenando seus pontos de dados do menor ao maior. Por exemplo, se seus pontos de dados fossem 10, 19, 8, 4, 9, 12, 15, 11 e 20, você os reorganizaria assim: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Depois que seus pontos de dados forem ordenados dessa forma, você pode seguir para a próxima etapa.

Determine a posição do primeiro quartil

Em seguida, determine a posição do primeiro quartil usando a seguinte fórmula: (N + 1) / 4, onde N é o número de pontos no conjunto de dados. Se o primeiro quartil ficar entre dois números, considere a média dos dois números como sua pontuação do primeiro quartil. No exemplo acima, como há nove pontos de dados, você adicionaria 1 a 9 para obter 10 e, a seguir, dividiria por 4 para obter 2,5. Desde o o primeiro quartil fica entre o segundo e o terceiro valor, você tomaria a média de 8 e 9 para obter uma posição do primeiro quartil de 8.5.

Determine a posição do terceiro quartil

Depois de determinar seu primeiro quartil, determine a posição do terceiro quartil usando a seguinte fórmula: 3 * (N + 1) / 4 onde N é novamente o número de pontos no conjunto de dados. Da mesma forma, se o terceiro quartil ficar entre dois números, simplesmente tire a média como faria ao calcular a pontuação do primeiro quartil. No exemplo acima, como há nove pontos de dados, você adicionaria 1 a 9 para obter 10, multiplicaria por 3 para obter 30 e dividiria por 4 para obter 7,5. Como o primeiro quartil fica entre o sétimo e o oitavo valor, você pegaria a média de 15 e 19 para obter uma pontuação de 17 no terceiro quartil.

Calcular intervalo interquartil

Depois de determinar o primeiro e o terceiro quartis, calcule o intervalo interquartil subtraindo o valor do primeiro quartil do valor do terceiro quartil. Para terminar o exemplo usado ao longo deste artigo, você subtrairia 8,5 de 17 para descobrir que o intervalo interquartil do conjunto de dados é igual a 8,5.

Vantagens e desvantagens do IQR

O intervalo interquartil tem a vantagem de ser capaz de identificar e eliminar outliers em ambas as extremidades de um conjunto de dados. IQR também é uma boa medida de variação em casos de distribuição de dados distorcida, e este método de cálculo de IQR pode funcionar para conjuntos de dados agrupados, desde que você use uma distribuição de frequência cumulativa para organizar seus dados pontos. A fórmula do intervalo interquartil para dados agrupados é a mesma que para dados não agrupados, com IQR sendo igual ao valor do primeiro quartil subtraído do valor do terceiro quartil. No entanto, tem várias desvantagens em comparação com o desvio padrão: menos sensibilidade a algumas pontuações extremas e uma estabilidade de amostragem que não é tão forte quanto o desvio padrão.

Teachs.ru
  • Compartilhar
instagram viewer