A la hora de analizar datos, las medidas estadísticas ayudan a comprender las tendencias subyacentes. Una de las medidas estadísticas más comunes es correlación. Se utiliza para medir el grado de relación, o dependencia, de dos variables.
La medida de correlación se denomina coeficiente de correlación. Si tiene dos conjuntos de datos variables, puede calcular el coeficiente de correlación producto-momento de Pearson (r) utilizando el Función CORREL en Google Sheets.
Nota: Si buscas más funciones, tenemos una enorme guía de Más de 100 funciones y fórmulas para Google Sheets y Excel Básico
Medición de la correlación en Google Sheets
El coeficiente de correlación producto-momento de Pearson (también denominado r de Pearson, o simplemente r) mide la fuerza de la lineal asociación entre dos variables.
El coeficiente de correlación r tiene un valor comprendido entre -1 y 1.
- Cuando r = 1, indica que las dos variables están en una relación lineal perfecta. En este caso, si x aumenta, y aumentará en la misma proporción.
- Cuando r = 0, sugiere que no existe correlación entre las variables.
- Un valor de -1 implica que las variables están en una relación negativa perfectamente correlacionada. Esto significa que si x aumenta, el valor de y disminuye proporcionalmente, y viceversa.
Los tres gráficos siguientes le ayudarán a comprender mejor la correlación.
Correlación positiva
Estos datos correlacionados positivamente tienen un coeficiente de correlación de aproximadamente 0,9, cercano al máximo de 1. Si la correlación fuera realmente 1, entonces los datos estarían en una línea perfectamente recta.
Correlación negativa
Los datos correlacionados negativamente tienen un coeficiente de aproximadamente -0,9, lo que significa que los datos están bien correlacionados, pero en una relación negativa. Así que en este caso, y disminuye a medida que x aumenta.
Tanto en las correlaciones positivas como en las negativas, es posible trazar una “línea de mejor ajuste” a través de los puntos de datos. Esta línea daría una representación bastante exacta de los datos.
Sin correlación
En el gráfico siguiente, puede ver datos no correlacionados con un coeficiente de correlación de aproximadamente 0,04. Esto indica que no existe una relación significativa entre las variables x e y. Esto indica que no existe una relación significativa entre las variables x e y.
Sería muy difícil trazar cualquier tipo de línea de mejor ajuste a través de estos puntos de datos.
Si desea obtener más información sobre el coeficiente de correlación producto-momento de Pearson y cómo calcularlo, aquí está el enlace.
Sintaxis
=CORREL(datos_y, datos_x)
- datos_y - es el rango de valores o una referencia al rango de celdas que contienen los datos dependientes.
- datos_x - es el rango de valores o una referencia al rango de celdas que contienen los datos independientes.
Como puede ver, hay dos opciones para introducir el conjunto de datos. Puede utilizar un intervalo de referencia o introducir los datos directamente en la función.
Por lo general, utilizar un intervalo de referencia es una mejor opción. Esto se debe a que es probable que los datos ya estén en la hoja de cálculo. Utilizar un intervalo de referencia significa que no tendrás que volver a escribirlos en la propia función.
Si decide escribir el conjunto de datos directamente en la fórmula, asegúrese de encerrar los datos x e y entre llaves {}. Si haces referencia a los datos de un rango de celdas, no necesitas utilizar llaves.
Cómo utilizar la función de correlación en Google Sheets
En la sintaxis, puede ver que necesita dos conjuntos de datos (x e y) para que la función CORREL devuelva un valor.
A continuación te mostraré algunos ejemplos prácticos en Google Sheets.
Correlación mediante paréntesis
Los parámetros de la función CORREL aceptan los valores de entrada de dos formas diferentes.
Puede optar por introducir los conjuntos de datos numéricos directos utilizando llaves que indican rangos.
Como puede ver, esto es lo que he hecho en el ejemplo de la fila 2. Aquí he escrito la fórmula =Correl({8,4,8,1,8,7,2,0,9},{14,20,6,12,3}).
Correlación mediante referencias de alcance
Como alternativa, puede utilizar simplemente referencias de rango. Puede verlo en el ejemplo de la fila 3, donde he escrito =Correl(A2:A11,B2:B11).
En ambos ejemplos, se obtiene un coeficiente de correlación positivo y cercano a 1. Aunque las interpretaciones varían en función de la aplicación y la naturaleza de los datos, el primer coeficiente de correlación de 0,91 indica que los datos están estrechamente correlacionados. Por tanto, cuando x cambios, y cambia de forma muy similar.
El segundo coeficiente de correlación de 0,75 indica que los datos están menos correlacionados que los del primer conjunto de datos, pero siguen estando bastante correlacionados.
Relación positiva
Ahora verás cómo se comporta la función si los datos x e y tienen una relación lineal (y = 10x + 5).
En la siguiente imagen, he añadido datos que se ajustan a esta relación. Como se trata de una dependencia directa, la función devuelve 1 para el coeficiente de correlación.
Recuerde que un valor de 1 indica que los datos están perfectamente correlacionados.
Relación negativa
¿Qué ocurre cuando pruebo una ecuación con pendiente negativa (y = -5x+10)?
En este caso, el coeficiente de correlación debería ser -1, porque se trata de una dependencia negativa. Por tanto, cuando x aumenta, y disminuye proporcionalmente.
En la siguiente instantánea se puede ver que, efectivamente, es así.
Hasta aquí la guía de Sheetgo sobre cómo calcular una correlación en Google Sheets. ¡Gracias por leer! ¿Buscas más consejos avanzados sobre Google Sheets? Echa un vistazo a nuestros otros puestos, tales como la forma de importar datos de Google Sheets de una hoja a otra o cómo utilizar QUERY con Importrange.
¿Te ha gustado este post?
Compártelo con tus colegas, amigos y otros usuarios de hojas de cálculo a través de los botones de redes sociales de la izquierda.
Nota del editor: Esta es una versión revisada de un post anterior que se ha actualizado para mayor precisión y exhaustividad.

