Dados, especialmente dados numéricos, são uma ferramenta poderosa se você souber o que fazer com eles; os gráficos são uma forma de apresentar dados ou informações de maneira organizada, desde que o tipo de dados com os quais você está trabalhando se prestem ao tipo de análise de que você precisa.
Freqüentemente, estatísticos, instrutores e outros ficam curiosos sobre a distribuição dos dados. Por exemplo, se os dados são um conjunto de resultados de testes de química, você pode estar curioso sobre a diferença entre os as pontuações mais baixas e mais altas ou sobre a fração de participantes que ocupam as várias "vagas" entre essas extremos.
As distribuições de frequência são uma ferramenta poderosa para cientistas, especialmente (mas não apenas) quando os dados tendem a se agrupar em torno de uma média ou média entre os lados direito e esquerdo do gráfico. Esta é a familiar "curva em forma de sino" de distribuído normalmente dados.
O que é uma distribuição de freqüência?
UMA distribuição de frequência
é uma tabela que inclui intervalos de pontos de dados, chamados classes, e o número total de entradas em cada classe. A frequência f de cada classe é apenas o número de pontos de dados que ela possui. Os pontos limitantes de cada classe são chamados de limite inferior da classe e limite da classe superior, e o largura da classe é a distância entre os limites inferior (ou superior) de classes sucessivas. Isto é não a diferença entre os limites superior e inferior do mesmo aula.O alcance é a diferença entre o menor e o maior valor da tabela ou do gráfico correspondente.
Ao criar uma distribuição de frequência agrupada, você começa com o princípio de que usará entre cinco e 20 classes. Essas classes devem ter a mesma largura, ou amplitude ou valor numérico, para que a distribuição seja válida. Depois de determinar a largura da classe (detalhado abaixo), você escolhe um ponto de partida igual ou inferior ao valor mais baixo de todo o conjunto.
Diretrizes Gerais para Determinar Classes
Conforme observado, escolha entre cinco e 20 classes; você normalmente usaria mais classes para um número maior de pontos de dados, uma faixa mais ampla ou ambos. Além disso, siga estas diretrizes:
- A largura da classe deve ser um número ímpar. Isso garantirá que os pontos médios da classe sejam números inteiros em vez de números decimais.
- Cada valor de dados deve cair em exatamente uma classe. Nenhum é ignorado e nenhum pode ser incluído em mais de uma classe.
- As classes devem ser contínuas, o que significa que você deve incluir até aquelas classes que não possuem entradas. (As exceções são feitas nos extremos; se você ficar com uma primeira classe vazia ou uma última classe vazia, exclua-a).
- Conforme declarado, as classes devem ser iguais em largura. A primeira e a última classes são novamente exceções, pois podem ser, por exemplo, qualquer valor abaixo de um certo número na extremidade inferior ou qualquer valor acima de um certo número na extremidade superior,
Em uma distribuição de frequência construída corretamente, o ponto de partida mais o número de classes vezes a largura da classe deve ser sempre maior que o valor máximo.
Exemplos de largura de classe
Um professor fez com que os alunos monitorassem suas interações sociais por uma semana. O número de interações sociais durante a semana é mostrado na seguinte distribuição de frequência agrupada. Qual é o ponto médio da classe para cada classe?
Frequência de classe (f)
- 0–7: 7
- 8–14: 37
- 15–21: 32
- 22–28: 21
- 29–35: 3
Total 100
A largura da classe foi escolhida neste caso para ser sete. Dado um intervalo de 35 e a necessidade de um número ímpar para a largura da classe, você obtém cinco classes com um intervalo de sete. Os pontos médios são 4, 11, 18, 25 e 32.