Qui-quadrado (χ²): distribuição, como calculá-lo, exemplos - Ciência - 2023


science
Qui-quadrado (χ²): distribuição, como calculá-lo, exemplos - Ciência
Qui-quadrado (χ²): distribuição, como calculá-lo, exemplos - Ciência

Contente

A prova Chi ao quadrado ou qui-quadrado2, onde χ é a letra grega chamada "chi") é usado para determinar o comportamento de uma determinada variável e também quando você deseja saber se duas ou mais variáveis ​​são estatisticamente independentes.

Para verificar o comportamento de uma variável, o teste a ser realizado é chamado teste de chi quadrado de ajuste. Para descobrir se duas ou mais variáveis ​​são estatisticamente independentes, o teste é chamadoChi quadrado da independência, também chamado contingência.

Esses testes fazem parte da teoria estatística da decisão, na qual uma população é estudada e as decisões sobre ela são tomadas, analisando uma ou mais amostras dela retiradas. Isso requer fazer certas suposições sobre as variáveis, chamadas hipótese, que pode ou não ser verdade.


Existem alguns testes para contrastar essas conjecturas e determinar quais são válidas, dentro de uma certa margem de confiança, incluindo o teste do qui-quadrado, que pode ser aplicado para comparar duas ou mais populações.

Como veremos, dois tipos de hipótese são geralmente levantados sobre algum parâmetro populacional em duas amostras: a hipótese nula, chamada Hou (as amostras são independentes), e a hipótese alternativa, denotada como H1, (as amostras são correlacionadas) que é o oposto disso.

Quando o teste do qui-quadrado é usado?

O teste do qui quadrado é aplicado a variáveis ​​que descrevem qualidades, como sexo, estado civil, grupo sanguíneo, cor dos olhos e preferências de vários tipos.

O teste é planejado quando você deseja:

- Verifique se uma distribuição é apropriada para descrever uma variável, que é chamadaqualidade de ajuste. Por meio do teste do qui-quadrado, é possível saber se existem diferenças significativas entre a distribuição teórica selecionada e a distribuição de frequência observada.


-Saber se duas variáveis ​​X e Y são independentes de um ponto de vista estatístico. Isso é conhecido como teste de independência.

Por ser aplicado a variáveis ​​qualitativas ou categóricas, o teste do qui-quadrado é amplamente utilizado em ciências sociais, administração e medicina.

Condições para aplicá-lo

Existem dois requisitos importantes para aplicá-lo corretamente:

-Os dados devem ser agrupados em frequências.

-A amostra tem que ser grande o suficiente para que a distribuição do qui-quadrado seja válida, caso contrário seu valor é superestimado e leva à rejeição da hipótese nula quando não deveria ser o caso.

A regra geral é que se uma frequência com um valor menor que 5 aparecer nos dados agrupados, ela não é usada. Se houver mais de uma frequência menor que 5, elas devem ser combinadas em uma para obter uma frequência com valor numérico maior que 5.

Distribuição do qui quadrado

χ2 é uma distribuição contínua de probabilidades. Na verdade, existem curvas diferentes, dependendo de um parâmetro k chamado graus de liberdade da variável aleatória.


Suas propriedades são:

-A área sob a curva é igual a 1.

-Os valores de χ2 eles são positivos.

-A distribuição é assimétrica, ou seja, possui viés.

Graus de liberdade

Conforme os graus de liberdade aumentam, a distribuição do qui-quadrado tende ao normal, como pode ser visto na figura.

Para uma determinada distribuição, os graus de liberdade são determinados através do tabela de contingência, que é a tabela onde são registradas as frequências observadas das variáveis.

Se uma mesa tem F linhas e c colunas, o valor de k isto é:

k = (f - 1) ⋅ (c - 1)

Formulação de hipóteses

Quando o teste qui-quadrado é adequado, as seguintes hipóteses são formuladas:

-Hou: a variável X tem distribuição de probabilidade f (x) com os parâmetros específicos y1, Y2…, Yp

-H1: X tem outra distribuição de probabilidade.

A distribuição de probabilidade assumida na hipótese nula pode ser, por exemplo, a distribuição normal conhecida, e os parâmetros seriam a média μ e o desvio padrão σ.

Além disso, a hipótese nula é avaliada com um certo nível de significância, ou seja, uma medida do erro que seria cometido ao rejeitá-la como verdadeira.

Normalmente, este nível é definido em 1%, 5% ou 10% e, quanto menor for, mais confiável será o resultado do teste.

E se for utilizado o teste de contingência do qui-quadrado, que, como já dissemos, serve para verificar a independência entre duas variáveis ​​X e Y, as hipóteses são:

-Hou: as variáveis ​​X e Y são independentes.

-H1: X e Y são dependentes.

Novamente, é necessário especificar um nível de significância para saber a medida do erro ao tomar a decisão.

Como a estatística qui-quadrado é calculada?

A estatística do qui quadrado é calculada da seguinte forma:


A soma é realizada da primeira classe i = 1 para a última, que é i = k.

Mais longe:

Fou é uma frequência observada (vem dos dados obtidos).

Fe é a frequência esperada ou teórica (precisa ser calculada a partir dos dados).

Para aceitar ou rejeitar a hipótese nula, calculamos χ2 para os dados observados e comparados a um valor chamado qui quadrado crítico, que depende dos graus de liberdade k e o nível de significância α:

χ2crítico =  χ2k, α

Se, por exemplo, quisermos realizar o teste com nível de significância de 1%, então α = 0,01, se for com 5% então α = 0,05 e assim sucessivamente. Definimos p, o parâmetro da distribuição, como:


p = 1 - α

Esses valores de qui-quadrado críticos são determinados por tabelas que contêm o valor acumulado da área. Por exemplo, para k = 1, que representa 1 grau de liberdade e α = 0,05, que é equivalente a p = 1- 0,05 = 0,95, o valor de χ2 é 3.841.

Critérios de aceitação Hou

O critério para aceitar Hou isto é:

-Sim χ2 < χ2crítico H é aceitoou, caso contrário, é rejeitado (ver figura 1).

Exemplo de cálculo

Na aplicação a seguir, o teste do qui quadrado será usado como um teste de independência.

Suponha que os pesquisadores queiram saber se a preferência por café preto está relacionada ao sexo da pessoa e especifique a resposta com um nível de significância de α = 0,05.


Para isso, está disponível uma amostra de 100 pessoas entrevistadas e suas respostas:

Passo 1

Estabeleça as hipóteses:

-Hou: gênero e preferência por café preto são independentes.
-H1: o gosto pelo café preto está relacionado ao gênero da pessoa.

Passo 2

Calcule as frequências esperadas para a distribuição, para as quais são necessários os totais somados na última linha e na coluna da direita da tabela. Cada célula na caixa vermelha tem um valor esperado Fe, que é calculado multiplicando o total de sua linha F pelo total de sua coluna C, dividido pelo total da amostra N:

Fe = (F x C) / N

Os resultados são os seguintes para cada célula:

-C1: (36 x 47) / 100 = 16,92
-C2: (64 x 47) / 100 = 30,08
-C3: (36 x 53) / 100 = 19,08
-C4: (64 x 53) / 100 = 33,92

etapa 3

Em seguida, a estatística qui-quadrado deve ser calculada para esta distribuição, de acordo com a fórmula fornecida:

Passo 4

Determine χ2crítico, sabendo que os dados registrados estão em f = 2 linhas ec = 2 colunas, portanto, o número de graus de liberdade é:

k = (2-1) ⋅ (2-1) = 1.

O que significa que devemos olhar na tabela mostrada acima para o valor de χ2k, α = χ21; 0.05 , o qual é:

χ2crítico = 3.841

Etapa 5

Compare os valores e decida:

χ2 = 2.9005

χ2crítico = 3.841

Desde χ2 < χ2crítico Aceita-se a hipótese nula e conclui-se que a preferência pelo café preto não está relacionada ao sexo da pessoa, com nível de significância de 5%.

Referências

  1. Teste de Qui Quadrado para Independência. Recuperado de: saylordotorg.github.io.
  2. Med Wave. Estatística aplicada às ciências da saúde: o teste do qui-quadrado. Recuperado de: medwave.cl.
  3. Probabilidades e estatísticas. Teste de adequação do qui-quadrado. Recuperado de: probayestadistica.com.
  4. Triola, M. 2012. Elementary Statistics. 11º. Edição. Addison Wesley.
  5. UNAM. Teste do qui quadrado. Recuperado de: asesorias.cuautitlan2.unam.mx.