Desvio padrão: o que é esta medida e para que serve? - Psicologia - 2023


psychology

Contente

O termo desvio padrão ou desvio padrão refere-se a uma medida que é usada para quantificar a variação ou distribuição de dados numéricos em uma variável aleatória, população estatística, conjunto de dados ou distribuição de uma probabilidade.

O mundo da pesquisa e da estatística pode parecer complexo e estranho para a população em geral, pois parece que os cálculos matemáticos acontecem sob nossos olhos sem que possamos compreender seus mecanismos subjacentes. Nada está mais longe da realidade.

Nesta oportunidade vamos relacionar de forma simples mas exaustiva o contexto, o fundamento e a aplicação de um termo tão essencial como o desvio padrão no domínio da estatística.

  • Artigo relacionado: "Psicologia e estatística: a importância das probabilidades na ciência do comportamento"

Qual é o desvio padrão?

A estatística é um ramo da matemática responsável por registrar a variabilidade, bem como o processo aleatório que a gera seguindo as leis da probabilidade. Isso logo se dirá, mas dentro dos processos estatísticos estão as respostas para tudo o que hoje consideramos "dogmas" no mundo da natureza e da física.


Por exemplo, digamos que quando você joga uma moeda três vezes no ar, duas delas dão cara e uma coroa. Simples coincidência, certo? Por outro lado, se jogarmos a mesma moeda 700 vezes e 660 delas caírem em sua cabeça, talvez haja um fator que promova esse fenômeno além da aleatoriedade (imagine, por exemplo, que você só tem tempo para dar um número limitado de gira no ar, o que quase sempre o faz cair da mesma maneira). Assim, observar padrões além da mera coincidência nos leva a pensar sobre os motivos subjacentes para a tendência.

O que queremos mostrar com este exemplo bizarro é que estatística é uma ferramenta essencial para qualquer processo científico, porque a partir dela podemos distinguir realidades resultantes do acaso de eventos regidos por leis naturais.

Assim, podemos lançar uma definição apressada do desvio padrão e dizer que é um produto de medida estatística da raiz quadrada de sua variância. É como começar a casa do telhado, pois para quem não se dedica inteiramente ao mundo dos números, essa definição e não saber nada sobre o termo pouco difere. Então, vamos separar um momento para dissecar o mundo dos padrões estatísticos básicos.


Medidas de posição e variabilidade

As medidas de posição são indicadores usados ​​para indicar qual porcentagem de dados em uma distribuição de frequência excede essas expressões, cujo valor representa o valor dos dados encontrados no centro da distribuição de frequência. Não se desespere, porque nós os definimos rapidamente:

  • Média: a média numérica da amostra.
  • Mediana: representa o valor da variável de posição central em um conjunto de dados ordenado.

De forma rudimentar, poderíamos dizer que as medidas de posição estão focadas em dividir o conjunto de dados em partes percentuais iguais, ou seja, "chegar ao meio".

Por outro lado, as medidas de variabilidade são responsáveis ​​por determinar o grau de proximidade ou distância dos valores de uma distribuição de sua localização média (isto é, em comparação com a média). Estes são os seguintes:

  • Intervalo: mede a amplitude dos dados, ou seja, do valor mínimo ao máximo.
  • Variância: a expectativa (média da série de dados) do quadrado do desvio dessa variável em relação à sua média.
  • Desvio padrão: índice numérico da dispersão do conjunto de dados.

Claro, estamos nos movendo em termos relativamente complexos para alguém que não se dedica totalmente ao mundo da matemática. Não queremos entrar em outras medidas de variabilidade, pois sabendo que quanto maiores os produtos numéricos desses parâmetros, menos homogeneizado será o conjunto de dados.


  • Você pode se interessar: "Psicometria: o que é e pelo que é responsável?"

"A média do atípico"

Uma vez que tenhamos estabelecido nosso conhecimento das medidas de variabilidade e sua importância na análise dos dados, é hora de redirecionar nossa atenção para o desvio padrão.

Sem entrar em conceitos complexos (e talvez pecar para simplificar demais as coisas), podemos dizer que Esta medida é o produto do cálculo da média dos "outliers". Vamos dar um exemplo para esclarecer esta definição:

Temos uma amostra de seis cadelas grávidas da mesma raça e idade que acabaram de dar à luz suas ninhadas simultaneamente. Três delas deram à luz 2 filhotes cada, enquanto outras três deram à luz 4 filhotes por fêmea. Naturalmente, o valor médio da prole é de 3 filhotes por fêmea (a soma de todos os filhotes dividida pelo número total de fêmeas).

Qual seria o desvio padrão neste exemplo? Primeiro, teríamos que subtrair a média dos valores obtidos e elevar ao quadrado esta figura (já que não queremos números negativos), por exemplo: 4-3 = 1 ou 2-3 = (-1, quadrado, 1 )

A variância seria calculada como a média dos desvios do valor médio (neste caso, 3). Aqui estaríamos antes da variância e, portanto, temos que tirar a raiz quadrada desse valor para transformá-lo na mesma escala numérica da média. Depois disso, obteríamos o desvio padrão.

Então, qual seria o desvio padrão do nosso exemplo? Bem, um cachorrinho. Estima-se que a média das ninhadas seja de três filhotes, mas está dentro da normalidade a mãe dar à luz um filhote a menos ou a mais por ninhada.

Talvez este exemplo possa parecer um pouco confuso no que diz respeito à variância e ao desvio (uma vez que a raiz quadrada de 1 é 1), mas se a variância fosse 4 nele, o resultado do desvio padrão seria 2 (lembre-se, seu quadrado raiz).

O que queríamos mostrar com este exemplo é que variância e desvio padrão são medidas estatísticas que buscam obter a média de valores diferentes da média. Lembre-se: quanto maior o desvio padrão, maior a dispersão da população.

Voltando ao exemplo anterior, se todas as cadelas são da mesma raça e têm pesos semelhantes, é normal que o desvio seja de um filhote por ninhada. Mas, por exemplo, se pegarmos um rato e um elefante, é claro que o desvio em termos do número de descendentes atingiria valores muito maiores que um. Novamente, quanto menos os dois grupos de amostra tiverem em comum, maiores serão os desvios esperados.

Ainda assim, uma coisa é certa: usando esse parâmetro, estamos calculando a variância nos dados de uma amostra, mas de forma alguma isso precisa ser representativo de uma população inteira. Neste exemplo, pegamos seis cadelas, mas e se monitorássemos sete e o sétimo tivesse uma ninhada de 9 filhotes?

Claro, o padrão do desvio mudaria. Por este motivo, leve em consideração o tamanho da amostra é essencial ao interpretar qualquer conjunto de dados. Quanto mais números individuais são coletados e quanto mais vezes um experimento é repetido, mais perto estamos de postular uma verdade geral.

Conclusões

Como vimos, o desvio padrão é uma medida de dispersão de dados. Quanto maior a dispersão, maior será este valor, porque se estivéssemos diante de um conjunto de resultados completamente homogêneos (ou seja, que todos fossem iguais à média), esse parâmetro seria igual a 0.

Este valor é de enorme importância nas estatísticas, pois nem tudo se resume a encontrar pontes comuns entre figuras e eventos, mas também é essencial registrar a variabilidade entre os grupos amostrais para nos fazermos mais perguntas e obtermos mais conhecimentos a longo prazo. .