ĀæQue es un diagrama de dispersion?
En estadĆstica, los diagramas de dispersiĆ³n son unos grĆ”ficos en el que los puntos de datos se trazan en dos ejes, generalmente el eje x y el eje y, para mostrar cuĆ”nto afecta una variable a otra. Los puntos de datos generalmente se representan como puntos en el grĆ”fico. Una correlaciĆ³n es una medida estadĆstica de la relaciĆ³n entre dos variables. Las correlaciones pueden ser positivas o negativas, lo que significa que a medida que aumenta una variable, la otra aumenta o disminuye. El siguiente diagrama de dispersiĆ³n muestra la relaciĆ³n entre dos variables
GrĆ”fico de dispersiĆ³n ejemplo:

La dispersiĆ³n se puede observar en los puntos verdes en la grafica
Indice
Objetivo del Diagrama de DispersiĆ³n
El objetivo de un diagrama de dispersiĆ³n es mostrar la relaciĆ³n entre dos variables. Las variables se trazan en un grĆ”fico y la relaciĆ³n se muestra por la forma en que se distribuyen los puntos. Si los puntos estĆ”n muy juntos, entonces existe una fuerte relaciĆ³n entre las variables. Si los puntos estĆ”n muy separados, entonces existe una relaciĆ³n dĆ©bil entre las variables.
Diagrama de dispersiĆ³n ejemplo
Para el siguiente ejemplo usaremos los siguientes datos en excel:
Como realizar un diagrama de dispersiĆ³n paso a paso.
1. Decide quĆ© variable irĆ” en el eje x y cuĆ”l en el eje y. En la mayorĆa de los casos, no importa quĆ© variable sea cuĆ”l, pero a veces puede marcar la diferencia. Por ejemplo, si estuviera observando la relaciĆ³n entre la altura y el peso, desearĆa colocar la altura en el eje x porque las personas generalmente son mĆ”s altas que anchas.
2. Trace sus puntos de datos en un grƔfico. Cada punto de datos debe estar representado por un punto.
3. Mira tus datos para ver si hay una relaciĆ³n entre las dos variables. Una relaciĆ³n positiva significa que a medida que aumenta una variable, tambiĆ©n lo hace la otra; una relaciĆ³n negativa significa que cuando una variable aumenta, la otra disminuye; ninguna relaciĆ³n significa que no hay un patrĆ³n claro entre las dos variables.
Como hacer un diagrama de dispersiĆ³n en Excel
Insertar video short
Como hacer un diagrama de dispersiĆ³n en Minitab
Insertar video short
Diferentes tipos de diagramas de dispersion
a) Grafico de dispersion Simple: Crear un grƔfico que muestra los valores de los datos en las coordenadas x y y.
b) Grafico de dispersion con Grupos: Crear una grĆ”fica de dispersiĆ³n que diseƱe los datos de los pares de variables para mostrar los valores y colocarlos en sus coordenadas para dividirlo en grupos - asociados a diferentes colores.
c) Grafico de dispersion con RegresiĆ³n: Se agrega una lĆnea de regresiĆ³n, creando una grĆ”fica de dispersiĆ³n que muestre los valores de datos de un par de variables en sus coordenadas (x, Y)
d) Grafico de dispersion con RegresiĆ³n y grupos: Crear una grĆ”fica de dispersiĆ³n que muestre los valores de datos de los pares de variables en sus coordenadas (x, y), divididos en grupos. Incluir una lĆnea ajustada de regresiĆ³n para cada grupo. Los grupos estĆ”n representados por diferentes colores
e) Grafico de dispersion con LĆnea de conexiĆ³n: Crear una grĆ”fica de dispersiĆ³n conectado con una lĆnea que muestre los valores de datos de un par de variables en sus coordenadas (x, y). Con esta misma se puede mostrar la forma cĆ³mo los valores de datos cambian con el tiempo.
f) Grafico de dispersion con LĆnea de conexiĆ³n y grupos: Sirve para comparar mĆ”s de dos grupos a travĆ©s del tiempo.

CorrelaciĆ³n
Cuando dos variables estĆ”n relacionadas, decimos que tienen una correlaciĆ³n. La fuerza de la correlaciĆ³n se mide por lo que se llama el coeficiente de correlaciĆ³n. El coeficiente de correlaciĆ³n es un nĆŗmero entre -1 y 1 que indica quĆ© tan fuerte es la relaciĆ³n entre dos variables. Una correlaciĆ³n positiva significa que cuando una variable aumenta, la otra variable aumenta. Una correlaciĆ³n negativa significa que cuando una variable aumenta, la otra disminuye.
Una correlaciĆ³n positiva perfecta tiene un valor de 1, lo que significa que a medida que aumenta una variable tambiĆ©n lo hace la otra y ambas siempre aumentan o disminuyen juntas. Una correlaciĆ³n negativa perfecta tiene un valor de -1, lo que significa que a medida que una variable aumenta, la otra disminuye y siempre se mueven en direcciones opuestas. Si las dos variables no estĆ”n relacionadas, el coeficiente serĆ” 0.
Cuanto mĆ”s ceDiagrama de dispersiĆ³n para quĆ© sirve? - Diagrama de DispersiĆ³nrca estĆ© el coeficiente de 1 o -1 (ya sea positivo o negativo), mĆ”s fuerte serĆ” la relaciĆ³n entre las variables. Entonces, un coeficiente de 0.8 indicarĆa una relaciĆ³n positiva fuerte mientras que un coeficiente de -0.5 indicarĆa una relaciĆ³n negativa moderada
a) Para correlaciĆ³n lineal. La correlaciĆ³n de Pearson es el mĆ©todo mĆ”s comĆŗn, mide la relaciĆ³n lineal entre dos variables continuas.
b) Para correlaciĆ³n No lineal. HabrĆa que utilizar la correlaciĆ³n del orden de los rangos de Spearman.
Como hacer una correlaciĆ³n en Minitab
Insertar video short
ĀæCĆ³mo analizar los datos en una grĆ”fica de dispersiĆ³n con correlaciĆ³n?
Paso 1.- Revisar si los datos caen dentro de una de las siguientes formas, o patrones:

Paso 2: Correr correlaciĆ³n, si la correlaciĆ³n estĆ” cerca de 1, podemos concluir que las dos variables X y Y estĆ”n fuertemente asociadas por lo tanto podemos influir en la salida esperada.
Paso 3: Realizar una regresiĆ³n lineal. (Ver el tema completo de regresiĆ³n lineal)
Diagrama de dispersion ventajas y desventajas
Cuando se trata de diagramas de dispersiĆ³n, hay ventajas y desventajas que deben considerarse antes de tomar cualquier decisiĆ³n. En el lado positivo, los diagramas de dispersiĆ³n se pueden usar para mostrar las relaciones entre dos variables continuas. Esto es Ćŗtil para identificar tendencias y patrones que pueden no ser evidentes de inmediato. AdemĆ”s, los diagramas de dispersiĆ³n se pueden usar para detectar valores atĆpicos y puntos de datos inusuales. En el lado negativo, los diagramas de dispersiĆ³n pueden ser difĆciles de interpretar, especialmente cuando hay muchos puntos de datos. AdemĆ”s, puede ser difĆcil notar la diferencia entre una relaciĆ³n fuerte y una dĆ©bil con solo mirar la trama. Finalmente, si las variables que se grafican no son realmente continuas (por ejemplo, si son categorĆas), es posible que un diagrama de dispersiĆ³n no sea la mejor opciĆ³n.
RelaciĆ³n con otras herramientas
Es parte de las 7 herramientas de calidad
Se hace antes de una regresiĆ³n lineal.
Atraves de la hoja de verificaciĆ³n podemos obtener los datos del diagrama de dispersion.
ConclusiĆ³n
Es importante recordar que correlaciĆ³n no implica causalidad. Una alta correlaciĆ³n entre dos variables puede ser el resultado de una tercera variable no medida. En otras palabras, el hecho de que dos cosas estĆ©n relacionadas no significa que una sea la causa de la otra.
A pesar de esto, los diagramas de dispersiĆ³n y las correlaciones siguen siendo herramientas Ćŗtiles para explorar datos. Pueden ayudarnos a detectar tendencias y relaciones que de otro modo no notarĆamos. Y, al entender cĆ³mo interpretarlos, podemos usarlos para comprender mejor el mundo que nos rodea.