¿Que es un diagrama de dispersion?
En estadística, los diagramas de dispersión son unos gráficos en el que los puntos de datos se trazan en dos ejes, generalmente el eje x y el eje y, para mostrar cuánto afecta una variable a otra. Los puntos de datos generalmente se representan como puntos en el gráfico. Una correlación es una medida estadística de la relación entre dos variables. Las correlaciones pueden ser positivas o negativas, lo que significa que a medida que aumenta una variable, la otra aumenta o disminuye. El siguiente diagrama de dispersión muestra la relación entre dos variables
Gráfico de dispersión ejemplo:
La dispersión se puede observar en los puntos verdes en la grafica
Indice
Objetivo del Diagrama de Dispersión
El objetivo de un diagrama de dispersión es mostrar la relación entre dos variables. Las variables se trazan en un gráfico y la relación se muestra por la forma en que se distribuyen los puntos. Si los puntos están muy juntos, entonces existe una fuerte relación entre las variables. Si los puntos están muy separados, entonces existe una relación débil entre las variables.
Diagrama de dispersión ejemplo
Para el siguiente ejemplo usaremos los siguientes datos en excel:
Como realizar un diagrama de dispersión paso a paso.
1. Decide qué variable irá en el eje x y cuál en el eje y. En la mayoría de los casos, no importa qué variable sea cuál, pero a veces puede marcar la diferencia. Por ejemplo, si estuviera observando la relación entre la altura y el peso, desearía colocar la altura en el eje x porque las personas generalmente son más altas que anchas.
2. Trace sus puntos de datos en un gráfico. Cada punto de datos debe estar representado por un punto.
3. Mira tus datos para ver si hay una relación entre las dos variables. Una relación positiva significa que a medida que aumenta una variable, también lo hace la otra; una relación negativa significa que cuando una variable aumenta, la otra disminuye; ninguna relación significa que no hay un patrón claro entre las dos variables.
Como hacer un diagrama de dispersión en Excel
Insertar video short
Como hacer un diagrama de dispersión en Minitab
Insertar video short
Diferentes tipos de diagramas de dispersion
a) Grafico de dispersion Simple: Crear un gráfico que muestra los valores de los datos en las coordenadas x y y.
b) Grafico de dispersion con Grupos: Crear una gráfica de dispersión que diseñe los datos de los pares de variables para mostrar los valores y colocarlos en sus coordenadas para dividirlo en grupos - asociados a diferentes colores.
c) Grafico de dispersion con Regresión: Se agrega una línea de regresión, creando una gráfica de dispersión que muestre los valores de datos de un par de variables en sus coordenadas (x, Y)
d) Grafico de dispersion con Regresión y grupos: Crear una gráfica de dispersión que muestre los valores de datos de los pares de variables en sus coordenadas (x, y), divididos en grupos. Incluir una línea ajustada de regresión para cada grupo. Los grupos están representados por diferentes colores
e) Grafico de dispersion con Línea de conexión: Crear una gráfica de dispersión conectado con una línea que muestre los valores de datos de un par de variables en sus coordenadas (x, y). Con esta misma se puede mostrar la forma cómo los valores de datos cambian con el tiempo.
f) Grafico de dispersion con Línea de conexión y grupos: Sirve para comparar más de dos grupos a través del tiempo.
Correlación
Cuando dos variables están relacionadas, decimos que tienen una correlación. La fuerza de la correlación se mide por lo que se llama el coeficiente de correlación. El coeficiente de correlación es un número entre -1 y 1 que indica qué tan fuerte es la relación entre dos variables. Una correlación positiva significa que cuando una variable aumenta, la otra variable aumenta. Una correlación negativa significa que cuando una variable aumenta, la otra disminuye.
Una correlación positiva perfecta tiene un valor de 1, lo que significa que a medida que aumenta una variable también lo hace la otra y ambas siempre aumentan o disminuyen juntas. Una correlación negativa perfecta tiene un valor de -1, lo que significa que a medida que una variable aumenta, la otra disminuye y siempre se mueven en direcciones opuestas. Si las dos variables no están relacionadas, el coeficiente será 0.
Cuanto más ceDiagrama de dispersión para qué sirve? - Diagrama de Dispersiónrca esté el coeficiente de 1 o -1 (ya sea positivo o negativo), más fuerte será la relación entre las variables. Entonces, un coeficiente de 0.8 indicaría una relación positiva fuerte mientras que un coeficiente de -0.5 indicaría una relación negativa moderada
a) Para correlación lineal. La correlación de Pearson es el método más común, mide la relación lineal entre dos variables continuas.
b) Para correlación No lineal. Habría que utilizar la correlación del orden de los rangos de Spearman.
Como hacer una correlación en Minitab
Insertar video short
¿Cómo analizar los datos en una gráfica de dispersión con correlación?
Paso 1.- Revisar si los datos caen dentro de una de las siguientes formas, o patrones:
Paso 2: Correr correlación, si la correlación está cerca de 1, podemos concluir que las dos variables X y Y están fuertemente asociadas por lo tanto podemos influir en la salida esperada.
Paso 3: Realizar una regresión lineal. (Ver el tema completo de regresión lineal)
Diagrama de dispersion ventajas y desventajas
Cuando se trata de diagramas de dispersión, hay ventajas y desventajas que deben considerarse antes de tomar cualquier decisión. En el lado positivo, los diagramas de dispersión se pueden usar para mostrar las relaciones entre dos variables continuas. Esto es útil para identificar tendencias y patrones que pueden no ser evidentes de inmediato. Además, los diagramas de dispersión se pueden usar para detectar valores atípicos y puntos de datos inusuales. En el lado negativo, los diagramas de dispersión pueden ser difíciles de interpretar, especialmente cuando hay muchos puntos de datos. Además, puede ser difícil notar la diferencia entre una relación fuerte y una débil con solo mirar la trama. Finalmente, si las variables que se grafican no son realmente continuas (por ejemplo, si son categorías), es posible que un diagrama de dispersión no sea la mejor opción.
Relación con otras herramientas
Es parte de las 7 herramientas de calidad
Se hace antes de una regresión lineal.
Atraves de la hoja de verificación podemos obtener los datos del diagrama de dispersion.
Conclusión
Es importante recordar que correlación no implica causalidad. Una alta correlación entre dos variables puede ser el resultado de una tercera variable no medida. En otras palabras, el hecho de que dos cosas estén relacionadas no significa que una sea la causa de la otra.
A pesar de esto, los diagramas de dispersión y las correlaciones siguen siendo herramientas útiles para explorar datos. Pueden ayudarnos a detectar tendencias y relaciones que de otro modo no notaríamos. Y, al entender cómo interpretarlos, podemos usarlos para comprender mejor el mundo que nos rodea.