Graus de liberdade: como calculá-los, tipos, exemplos - Ciência - 2023


science

Contente

ograus de liberdade em estatística, são o número de componentes independentes de um vetor aleatório. Se o vetor tiver n componentes e há p equações lineares que relacionam seus componentes, então o grau de liberdade é n-p.

O conceito de graus de liberdade também aparece na mecânica teórica, onde aproximadamente são equivalentes à dimensão do espaço onde a partícula se move, menos o número de ligações.

Este artigo irá discutir o conceito de graus de liberdade aplicado à estatística, mas um exemplo mecânico é mais fácil de visualizar na forma geométrica.

Tipos de graus de liberdade

Dependendo do contexto em que é aplicado, a forma de calcular o número de graus de liberdade pode variar, mas a ideia subjacente é sempre a mesma: dimensões totais menos número de restrições.


Em uma caixa mecânica

Vamos considerar uma partícula oscilante amarrada a uma corda (um pêndulo) que se move no plano vertical x-y (2 dimensões). No entanto, a partícula é forçada a se mover na circunferência de raio igual ao comprimento da corda.

Uma vez que a partícula só pode se mover nessa curva, o número de graus de liberdade pt 1. Isso pode ser visto na figura 1.

A maneira de calcular o número de graus de liberdade é tomando a diferença do número de dimensões menos o número de restrições:

graus de liberdade: = 2 (dimensões) - 1 (ligadura) = 1

Outra explicação que nos permite chegar ao resultado é a seguinte:

-Sabemos que a posição em duas dimensões é representada por um ponto de coordenadas (x, y).

-Mas desde que o ponto deve cumprir a equação da circunferência (x2 + e2 = L2) para um dado valor da variável x, a variável y é determinada pela referida equação ou restrição.


Desta forma, apenas uma das variáveis ​​é independente e o sistema tem um (1) grau de liberdade.

Em um conjunto de valores aleatórios

Para ilustrar o que o conceito significa, suponha que o vetor

x = (x1, x2,…, Xn)

O que representa a amostra de n valores aleatórios normalmente distribuídos. Neste caso, o vetor aleatório x ter n componentes independentes e, portanto, é dito que x tern graus de liberdade.

Agora vamos construir o vetor r De resíduos

r = (x1, x2,…., Xn)

Onde representa a média da amostra, que é calculada da seguinte forma:

= (x1 + x2 +…. + Xn) / n

Então a soma

(x1) + (x2) +…. + (Xn) = (x1 + x2 +…. + Xn) - n= 0


É uma equação que representa uma restrição (ou ligação) nos elementos do vetor r dos resíduos, uma vez que se n-1 componentes do vetor são conhecidos r, a equação de restrição determina o componente desconhecido.


Portanto, o vetor r de dimensão n com a restrição:

∑ (xEu – ) = 0

Ter (n - 1) graus de liberdade.

Novamente, é aplicado que o cálculo do número de graus de liberdade é:

graus de liberdade: = n (dimensões) - 1 (restrições) = n-1

Exemplos

Variância e graus de liberdade

A variância s2 é definido como a média do quadrado dos desvios (ou resíduos) da amostra de n dados:

s2 = (rr) / (n-1)

Onde r é o vetor dos resíduos r = (x1 - , x2 - ,…., Xn - ) e a ponta grossa () é o operador de produto escalar. Alternativamente, a fórmula de variância pode ser escrita da seguinte forma:

s2 = ∑ (xEu)2 / (n-1)

Em qualquer caso, deve-se notar que ao calcular a média do quadrado dos resíduos, ela é dividida por (n-1) e não por n, pois conforme discutido na seção anterior, o número de graus de liberdade do vetor r é (n-1).


Se para o cálculo da variância foram divididos por n em vez de (n-1), o resultado teria um viés que é muito significativo para valores de n abaixo de 50.

Na literatura, a fórmula da variância também aparece com o divisor n ao invés de (n-1), quando se trata da variância de uma população.

Mas o conjunto da variável aleatória dos resíduos, representado pelo vetor r, Embora tenha dimensão n, possui apenas (n-1) graus de liberdade. No entanto, se o número de dados for grande o suficiente (n> 500), as duas fórmulas convergem para o mesmo resultado.


Calculadoras e planilhas fornecem as duas versões da variância e do desvio padrão (que é a raiz quadrada da variância).

Nossa recomendação, diante da análise aqui apresentada, é sempre escolher a versão com (n-1) toda vez que for necessário calcular a variância ou desvio padrão, para evitar resultados enviesados.


Na distribuição do Chi quadrado

Algumas distribuições de probabilidade em variável aleatória contínua dependem de um parâmetro chamado grau de liberdade, é o caso da distribuição Chi quadrado (χ2).

O nome desse parâmetro vem precisamente dos graus de liberdade do vetor aleatório subjacente ao qual essa distribuição se aplica.

Suponha que temos g populações, das quais as amostras de tamanho n são retiradas:

X1 = (x11, x12,… ..X1n)

X2 = (x21, x22,… ..X2n)


….

Xj = (xj1, xj2,… ..Xjn)

….

Xg = (xg1, xg2,… ..Xgn)

Uma população j o que tem média e desvio padrão Sj,segue a distribuição normal N (, Sj ).

A variável padronizada ou normalizada zjEu é definido como:

zjEu = (xjEu) / Sj.

E o vetor Zj é definido assim:

Zj = (zj1, zj2,…, ZjEu,…, Zjn) e segue a distribuição normal padronizada N (0,1).

Portanto, a variável:

Q= ((z1^ 2 + z21^ 2 +…. + zg1^ 2),…., (Z1n^ 2 + z2n^ 2 +…. + zgn^2) )


segue a distribuição χ2(g) chamado de distribuição do qui quadrado com grau de liberdade g.


No teste de hipótese (com exemplo resolvido)

Quando você deseja fazer um teste de hipótese com base em um determinado conjunto de dados aleatórios, você precisa saber o número de graus de liberdade g a fim de aplicar o teste Qui quadrado.

A título de exemplo, serão analisados ​​os dados coletados sobre as preferências de sorvete de chocolate ou morango entre homens e mulheres em uma determinada sorveteria. A frequência com que homens e mulheres escolhem morango ou chocolate está resumida na Figura 2.

Em primeiro lugar, é calculada a tabela de frequências esperadas, que é preparada multiplicando o total de linhas por elecolunas totais, dividido por dados totais. O resultado é mostrado na figura a seguir:


Em seguida, passamos a calcular o Qui quadrado (a partir dos dados) usando a seguinte fórmula:

χ2 = ∑ (Fou - Fe)2 / Fe

Onde Fou são as frequências observadas (Figura 2) e Fe são as frequências esperadas (Figura 3). O somatório abrange todas as linhas e colunas, que em nosso exemplo fornecem quatro termos.

Depois de fazer as operações, você obtém:

χ2 = 0,2043.

Agora é necessário comparar com o quadrado do Chi teórico, que depende do número de graus de liberdade g.

No nosso caso, esse número é determinado da seguinte forma:

g = (# linhas - 1) (# colunas - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.

Acontece que o número de graus de liberdade g neste exemplo é 1.

Se desejar verificar ou rejeitar a hipótese nula (H0: não há correlação entre GOSTO e GÊNERO) com nível de significância de 1%, o valor do Qui-quadrado teórico é calculado com grau de liberdade g = 1.


O valor que compõe a frequência acumulada é (1 - 0,01) = 0,99, ou seja, é pesquisado 99%. Este valor (que pode ser obtido nas tabelas) é 6.636.

À medida que o Chi teórico supera o calculado, a hipótese nula é verificada.

Ou seja, com os dados coletados,Não observado relação entre as variáveis ​​SABOR e GÊNERO.

Referências

  1. Minitab. Quais são os graus de liberdade? Recuperado de: support.minitab.com.
  2. Moore, David. (2009) Estatísticas aplicadas básicas. Editor Antoni Bosch.
  3. Leigh, Jennifer. Como calcular graus de liberdade em modelos estatísticos. Recuperado de: geniolandia.com
  4. Wikipedia. Grau de liberdade (estatísticas). Recuperado de: es.wikipedia.com
  5. Wikipedia. Grau de liberdade (físico). Recuperado de: es.wikipedia.com