Las actividades empresariales, gubernamentales y académicas casi siempre requieren la recopilación y el análisis de datos. Una de las formas de representar datos numéricos es mediante gráficos, histogramas y cuadros. Estas técnicas de visualización permiten a las personas conocer mejor los problemas e idear soluciones. Las lagunas, las agrupaciones y los valores atípicos son características de los conjuntos de datos que influyen en el análisis matemático y son fácilmente visibles en las representaciones visuales.
Agujeros en los datos
Las lagunas se refieren a áreas faltantes en un conjunto de datos. Por ejemplo, si un experimento científico recopila datos de temperatura en el rango de 50 grados Fahrenheit a 100 grados Fahrenheit, pero nada entre 70 y 80 grados, eso representaría una brecha en los datos colocar. Una gráfica lineal de este conjunto de datos tendría marcas "x" para temperaturas entre 50 y 70 y nuevamente entre 80 y 100, pero no habría nada entre 70 y 80. Los investigadores pueden profundizar y explorar por qué ciertos puntos de datos no aparecen en una muestra recopilada.
Grupos aislados
Los clústeres son grupos aislados de puntos de datos. Los gráficos de líneas, que son una de las formas de representar conjuntos de datos, son líneas con marcas "x" colocadas sobre números específicos para representar su frecuencia de aparición en el conjunto de datos. Un grupo se representa como una colección de estas marcas "x" en un pequeño intervalo o subconjunto de datos. Por ejemplo, si los puntajes del examen para una clase de 10 estudiantes son 74, 75, 80, 72, 74, 75, 76, 86, 88 y 73, la mayor cantidad de marcas "x" en una gráfica de línea estaría en el 72- intervalo de puntuación a-76. Esto representaría un grupo de datos. Tenga en cuenta que la frecuencia para 74 y 75 es dos, pero para todas las demás puntuaciones, es uno.
En los extremos
Los valores atípicos son valores extremos: puntos de datos que se encuentran significativamente fuera de otros valores en un conjunto de datos. Un valor atípico debe ser significativamente menor o mayor que la mayoría de los números en un conjunto de datos. La definición de "extremo" depende de las circunstancias y del consenso de los analistas involucrados en la investigación. Los valores atípicos pueden ser puntos de datos incorrectos, también conocidos como ruido, o pueden contener información valiosa sobre el fenómeno que se investiga y la metodología de recopilación de datos en sí. Por ejemplo, si los puntajes de la clase se encuentran principalmente en el rango de 70 a 80, pero un par de puntajes están en los 50 bajos, esos pueden representar valores atípicos.
Poniendolo todo junto
Las lagunas, valores atípicos y agrupaciones en conjuntos de datos pueden afectar los resultados del análisis matemático. Las lagunas y las agrupaciones pueden representar errores en la metodología de recopilación de datos. Por ejemplo, si una encuesta telefónica sondea solo ciertos códigos de área, como complejos de viviendas para personas de bajos ingresos o suburbios de alto nivel áreas residenciales, y no una muestra representativa amplia de la población, es probable que haya brechas y conglomerados en los datos. Los valores atípicos pueden sesgar el valor medio o promedio de un conjunto de datos. Por ejemplo, el valor medio o promedio de un conjunto de datos que consta de cuatro números (50, 55, 65 y 90) es 65. Sin embargo, sin el valor atípico 90, la media es de aproximadamente 57.