Quando se realiza uma análise de dados, as medidas estatísticas ajudam a entender as tendências subjacentes. Uma das métricas estatísticas mais comuns é correlação. É usado para medir a extensão da relação, ou dependência, de duas variáveis.
A medida de correlação é chamada de coeficiente de correlação. Se você tiver dois conjuntos de dados variáveis, poderá calcular o coeficiente de correlação produto-momento de Pearson (r) usando o Função CORREL no Planilhas Google.
Observação: Se você estiver procurando por mais funções, temos um guia enorme de Mais de 100 funções e fórmulas para o Planilhas Google e noções básicas de Excel
Medição da correlação no Planilhas Google
O coeficiente de correlação produto-momento de Pearson (também conhecido como r de Pearson ou simplesmente r) mede a força da correlação entre os dois fatores. linear associação entre duas variáveis.
O coeficiente de correlação r tem um valor entre -1 e 1.
- Quando r = 1, isso indica que as duas variáveis estão em uma relação linear perfeita. Nesse caso, se x aumentar, y aumentará na mesma proporção.
- Quando r = 0, isso sugere que não há correlação entre as variáveis.
- Um valor de -1 implica que as variáveis estão em uma relação negativa perfeitamente correlacionada. Isso significa que, se x aumenta, o valor de y diminui em uma quantidade proporcional, e vice-versa.
Os três gráficos abaixo o ajudarão a entender melhor a correlação.
Correlação positiva
Esses dados correlacionados positivamente têm um coeficiente de correlação de cerca de 0,9, próximo ao máximo de 1. Se a correlação fosse realmente 1, os dados estariam em uma linha perfeitamente reta.
Correlação negativa
Os dados correlacionados negativamente têm um coeficiente de aproximadamente -0,9, o que significa que os dados estão bem correlacionados, mas em uma relação negativa. Portanto, nesse caso, y diminui à medida que x aumenta.
Tanto nas correlações positivas quanto nas negativas, é possível desenhar uma “linha de melhor ajuste” através dos pontos de dados. Essa linha forneceria uma representação bastante precisa dos dados.
Nenhuma correlação
No gráfico abaixo, você pode ver dados não correlacionados com um coeficiente de correlação de aproximadamente 0,04. Isso indica que não há relação significativa entre as variáveis x e y.
Seria difícil desenhar qualquer tipo de linha de melhor ajuste através desses pontos de dados!
Se você quiser saber mais sobre o coeficiente de correlação do momento do produto de Pearson e como calculá-lo, Aqui está o link.
Sintaxe
=CORREL(data_y, data_x)
- dados_y - é o intervalo de valores ou uma referência ao intervalo de células que contém os dados dependentes.
- dados_x - é o intervalo de valores ou uma referência ao intervalo de células que contém os dados independentes.
Como você pode ver, há duas opções para inserir o conjunto de dados. Você pode usar um intervalo de referência ou inserir os dados diretamente na função.
Em geral, usar um intervalo de referência é uma opção melhor. Isso ocorre porque seus dados provavelmente já estão na planilha. Usar um intervalo de referência significa que você não precisará digitá-los novamente na própria função.
Se você optar por digitar o conjunto de dados diretamente na fórmula, certifique-se de colocar os dados x e y entre colchetes {}. Se estiver fazendo referência aos dados em um intervalo de células, não será necessário usar colchetes.
Como usar a função de correlação no Planilhas Google
Na sintaxe, você pode ver que precisa de dois conjuntos de dados (x e y) para que a função CORREL retorne um valor.
Agora, mostrarei alguns exemplos práticos no Google Sheets.
Correlação usando colchetes
Os parâmetros da função CORREL aceitam os valores de entrada de duas maneiras diferentes.
Você pode optar por inserir os conjuntos de dados numéricos diretos usando chaves que indicam intervalos.
Como você pode ver, foi isso que fiz no exemplo da linha 2. Aqui, digitei a fórmula =Correl({8.4,8,1.8,7.2,0.9},{14,20,6,12,3}).
Correlação usando referências de faixa
Como alternativa, você pode simplesmente usar referências de intervalo. Você pode ver isso no exemplo da linha 3, onde digitei =Correl(A2:A11,B2:B11).
Em ambos os exemplos, você obtém um coeficiente de correlação que é positivo e próximo de 1. Embora as interpretações variem de acordo com o aplicativo e a natureza dos dados, o primeiro coeficiente de correlação de 0,91 indica que os dados estão estreitamente correlacionados. Portanto, quando x mudanças, y muda de maneira muito semelhante.
O segundo coeficiente de correlação de 0,75 indica que os dados são menos correlacionados do que o primeiro conjunto de dados, mas ainda assim bastante correlacionados.
Relacionamento positivo
Agora, você verá como a função se comporta se os dados x e y estiverem em uma relação linear (y = 10x + 5).
Na imagem a seguir, adicionei dados que se encaixam nessa relação. Como essa é uma dependência direta, a função retorna 1 para o coeficiente de correlação.
Lembre-se de que um valor de 1 indica que os dados estão perfeitamente correlacionados.
Relacionamento negativo
O que acontece quando tento uma equação com uma inclinação negativa (y = -5x+10)?
Nesse caso, o coeficiente de correlação deve ser -1, porque essa é uma dependência negativa. Portanto, quando x aumentos, y diminui em uma quantidade proporcional.
Você pode ver no instantâneo abaixo que esse é realmente o caso.
Esse é o guia do Sheetgo sobre como calcular uma correlação no Planilhas Google - obrigado pela leitura! Procurando dicas mais avançadas sobre o Planilhas Google? Confira nossas outras postagens, como importar dados do Google Sheets de uma planilha para outra ou como usar QUERY com Importrange.
Você gostou desta postagem?
Compartilhe-o com seus colegas, amigos e outros usuários de planilhas por meio dos botões de mídia social à esquerda.
Nota do editor: Esta é uma versão revisada de uma postagem anterior que foi atualizada para maior precisão e abrangência.

