O que são lacunas, clusters e outliers em matemática?

As atividades empresariais, governamentais e acadêmicas quase sempre exigem a coleta e análise de dados. Uma das maneiras de representar dados numéricos é por meio de gráficos, histogramas e tabelas. Essas técnicas de visualização permitem que as pessoas tenham uma visão melhor dos problemas e encontrem soluções. Lacunas, clusters e outliers são características de conjuntos de dados que influenciam a análise matemática e são facilmente visíveis em representações visuais.

Furos nos dados

As lacunas referem-se a áreas ausentes em um conjunto de dados. Por exemplo, se um experimento científico coleta dados de temperatura na faixa de 50 graus Fahrenheit a 100 graus Fahrenheit, mas nada entre 70 e 80 graus, que representaria uma lacuna nos dados definir. Um gráfico de linha desse conjunto de dados teria marcas "x" para temperaturas entre 50 e 70 e novamente entre 80 e 100, mas não haveria nada entre 70 e 80. Os pesquisadores podem cavar mais fundo e explorar por que certos pontos de dados não aparecem em uma amostra coletada.

Grupos Isolados

Os clusters são grupos isolados de pontos de dados. Os gráficos de linha, que são uma das maneiras de representar conjuntos de dados, são linhas com marcas "x" colocadas acima de números específicos para representar sua frequência de ocorrência no conjunto de dados. Um cluster é representado como uma coleção dessas marcas "x" em um pequeno intervalo ou subconjunto de dados. Por exemplo, se as notas do exame para uma classe de 10 alunos forem 74, 75, 80, 72, 74, 75, 76, 86, 88 e 73, a maioria das marcas de "x" em um gráfico de linha estaria no 72- a-76 intervalo de pontuação. Isso representaria um cluster de dados. Observe que a frequência de 74 e 75 é dois, mas para todas as outras pontuações, é um.

Nos extremos

Outliers são valores extremos - pontos de dados que ficam significativamente fora de outros valores em um conjunto de dados. Um outlier deve ser significativamente menor ou maior do que a maioria dos números em um conjunto de dados. A definição de "extremo" depende da circunstância e do consenso dos analistas envolvidos na pesquisa. Outliers podem ser pontos de dados ruins, também conhecidos como ruído, ou podem conter informações valiosas sobre o fenômeno que está sendo investigado e a própria metodologia de coleta de dados. Por exemplo, se as pontuações das turmas estão principalmente na faixa de 70 a 80, mas algumas pontuações estão abaixo dos 50, isso pode representar valores discrepantes.

Juntando tudo

Lacunas, outliers e clusters em conjuntos de dados podem impactar os resultados da análise matemática. Lacunas e clusters podem representar erros na metodologia de coleta de dados. Por exemplo, se uma pesquisa por telefone pesquisa apenas determinados códigos de área, como complexos residenciais de baixa renda ou subúrbios de luxo áreas residenciais, e não uma ampla seção transversal da população, é provável que haja lacunas e aglomerados nos dados. Valores discrepantes podem distorcer a média ou o valor médio de um conjunto de dados. Por exemplo, a média ou valor médio de um conjunto de dados que consiste em quatro números - 50, 55, 65 e 90 - é 65. Sem o valor atípico de 90, no entanto, a média é de cerca de 57.

  • Compartilhar
instagram viewer