Introdução
Você já ouviu falar em desvio padrão, mas não sabe exatamente o que é, para que serve ou como calculá-lo? Não se preocupe! Neste artigo, vamos desmistificar esse conceito importante da estatística descritiva de maneira clara e prática.
O desvio padrão é um cálculo essencial para qualquer analista de dados, pois ajuda a entender o quão dispersos estão os dados de um conjunto. Vamos juntos explorar como ele funciona e como calculá-lo passo a passo no Excel.
O Problema: Como medir a variabilidade dos dados?
Imagine que você está analisando os resultados de um conjunto de dados e precisa saber o quão próximos ou distantes os valores estão de um objetivo específico. Por exemplo, se você estivesse jogando dardos, seu objetivo seria acertar o centro do alvo. Mas como medir o quanto cada tiro se desvia do alvo?
É aqui que entra o conceito de desvio padrão: ele fornece uma única medida numérica que resume a dispersão dos dados em relação à média do conjunto.
Exemplo Prático: Alvo e Tiros
Imagine um alvo onde o ponto central vale 10. Cada tiro acerta em um ponto diferente: 6, 7, 8, 9, etc. Para medir o quão longe cada tiro está do centro, calculamos a diferença entre o valor do tiro e o alvo.
Esse cálculo revela o quanto cada tiro “desviou” do objetivo.
Por exemplo: considerando a imagem acima, você disparou 7 tiros e acertou os seguintes pontos:
Tiro 1: 8 pontos
Tiro 2: 7 pontos
Tiro 3: 8 pontos
Tiro 4: 6 pontos
Tiro 5: 9 pontos
Tiro 6: 8 pontos
Tiro 7: 6 pontos
Se considerarmos que o objetivo era acertar no meio (10 pontos), cada tiro teve um desvio do alvo, que é a diferença entre o alvo e o tiro disparado.
Tiro 1: 2 pontos de desvio
Tiro 2: 3 pontos de desvio
Tiro 3: 2 pontos de desvio
Tiro 4: 4 pontos de desvio
Tiro 5: 1 ponto de desvio
Tiro 6: 2 pontos de desvio
Tiro 7: 4 pontos de desvio
Se tirarmos a média dos 7 desvios calculados, o resultado seria um desvio médio 2,57 pontos. Podemos dizer que em média, cada tiro se desviou em 2,57 pontos do alvo.
O desvio padrão funciona da mesma forma, porém o alvo é a média do conjunto.
Solução: Como calcular o desvio padrão no Excel
Agora que você entendeu o problema, vamos aprender a calcular o desvio padrão usando o Excel.
📁BAIXE O MATERIAL UTILIZADO NESTE TUTORIAL
Passo 1: Calculando a média
- Liste os valores do conjunto na coluna B (B8 até B18).
- Nomeando o conjunto para facilitar o cálculo:
- Selecione o intervalo de valores (neste caso, de B8 a B18).
- Clique na Caixa de Nome (no canto superior esquerdo, acima da coluna A, na barra de fórmulas).
- Digite “conjunto” e pressione Enter.
- Isso cria um nome para o intervalo de valores, permitindo que você utilize fórmulas de maneira mais simples em vez de especificar o intervalo manualmente.
- Na célula C2 digite a fórmula =MÉDIA(conjunto)para calcular a média de todos os valores no conjunto. Isso calcula o valor médio de todos os números no conjunto de dados.
O resultado da fórmula será usado como base para medir o quão distante (ou próximo) cada valor é da média.
Passo 2: Calculando a distância de cada valor em relação à média do conjunto
Por que medir a distância?
Aqui queremos saber o quanto cada ponto está acima ou abaixo da média do conjunto. Essa “distância” nos ajuda a avaliar a variabilidade dos dados, ou seja, como eles se espalham em relação a média.
- Na coluna C, insira a fórmula =B8-$C$2 (sendo $C$2 a célula onde está a média calculada).
- Copie a fórmula para as demais células.
Passo 3: Quadrado dos desvios
Por que elevar ao quadrado?
Como estamos calculando o desvio em relação a média do próprio conjunto, se tirarmos a média desses desvios o valor será zero.
Isso acontece pois os desvios podem ser negativos ou positivos. E na média os valores se anulam.
Para evitar isso, elevamos os desvios da média ao quadrado, transformando todos os valores em números positivos.
Para eliminar valores negativos, elevamos cada desvio ao quadrado.
- Na coluna D , insira a fórmula =C8^2.
- Copie a fórmula para as demais células da coluna D para aplicar o cálculo a todos os valores.
Passo 4: Calculando a variância
A variância nos dá uma visão geral da dispersão dos dados pois ela é a média dos desvios ao quadrado.
- Use uma fórmula =MÉDIA(D8:D18)para calcular a média dos valores ao quadrado (coluna D).
- É importante ficar atento, pois a variância é uma medida de dispersão que está ao quadrado (por exemplo, se a unidade original for cm, a variância estará em cm²).
⭐Dica: Usando a função VAR.P para simplificar:
Uma maneira mais rápida de calcular a variância no Excel é usar a fórmula =VAR.P(conjunto).
- Essa fórmula calcula diretamente a variância populacional, que é o caso mais comum em análises de dados .
Passo 5: Calculando o Desvio Padrão
Já que a variância é uma métrica ao quadrado, para obter uma métrica na mesma unidade de medida, basta tirar a raiz quadrada da variância. Isso que chamamos de desvio padrão.
- Use uma fórmula =RAIZ(C4)para calcular a raiz quadrada da variância obtida no passo anterior.
- O que isso faz? Remove o “quadrado” da variância, trazendo a medida de volta à unidade original (por exemplo, cm ao invés de cm²).
- O resultado é o desvio padrão do conjunto de dados.
⭐Dica: Usando a função DESVIPAD.P para simplificar:
Uma maneira mais rápida de calcular o desvio padrão no Excel é usar a fórmula =DESVIPAD.P(conjunto).
- Essa fórmula permite que você calcule diretamente o desvio padrão populacional, tornando o processo mais rápido, especialmente em grandes volumes de dados.
Entendendo a Fórmula do Desvio Padrão e Variância
Vamos entender as fórmulas matemáticas do desvio padrão e da variância:
- Variância: A variância é calculada subtraindo o valor médio de cada elemento do conjunto de dados, elevando essa diferença ao quadrado e somando todos esses quadrados. Depois, divide essa soma pelo número total de elementos do conjunto.
- Desvio Padrão: O desvio padrão é simplesmente a raiz quadrada da variância. Ele nos dá uma medida direta da dispersão dos dados em torno da média, mantendo as mesmas unidades de medida do conjunto original.
Cenário Extremo: Nenhuma variabilidade
Se todos os valores do conjunto forem iguais, o desvio padrão será zero, indicando que não há nenhuma variabilidade no conjunto.
Conclusão
Agora você sabe que o desvio padrão é uma ferramenta importante para avaliar a variabilidade de um conjunto de dados. Ele ajuda a entender o quão dispersos ou concentrados estão os dados em relação à média do conjunto.
Quer aprofundar ainda mais seu conhecimento em análise de dados? Continue acompanhando os tutoriais da Cubo Três!
Gostou deste conteúdo? Confira mais no nosso YouTube!
Se você quer aprender mais técnicas práticas de Power BI e dominar a análise de dados, inscreva-se no canal da Cubo Três no YouTube! Lá você encontra tutoriais completos, passo a passo e gratuitos para elevar suas habilidades.
👉 Acesse nosso canal e confira agora!
Quer se aprofundar ainda mais? Conheça a nossa Formação em Power BI
Na Escola de Dados da Cubo Três, você terá acesso a cursos completos, do básico ao avançado, para transformar sua carreira na área de dados. Aprenda com especialistas e conquiste novas oportunidades profissionais!
Sem comentários! Seja o primeiro.