Quase-variância: fórmula e equações, exemplos, exercício - Ciência - 2023


science
Quase-variância: fórmula e equações, exemplos, exercício - Ciência
Quase-variância: fórmula e equações, exemplos, exercício - Ciência

Contente

oquase-variância, quase variância ou variância imparcial é uma medida estatística da dispersão dos dados de um amostra com respeito à média. A amostra, por sua vez, consiste em uma série de dados retirados de um universo maior, denominado população.

É denotado de várias maneiras, aqui foi escolhido sc2 e para calculá-lo a seguinte fórmula é seguida:

Onde:

-sc2 = a quase-variância ou variância da amostra (variância da amostra)

-xEu = cada um dos dados da amostra

-n = número de observações

-X = a média da amostra

Dado que a unidade da quase-variância da amostra é o quadrado da unidade de onde vem a amostra, ao interpretar os resultados prefere-se trabalhar com o quase desvio padrão ou desvio padrão da amostra.


Isso é denotado como sce é obtido pela extração da raiz quadrada da quase-variância:

sc = √ sc2 

A quase-variância é semelhante à variância s2, com a única diferença de que o denominador disso é n-1, enquanto na variância é dividido apenas por n. É evidente que quando n é muito grande, os valores de ambos tendem a ser os mesmos.

Quando você conhece o valor da quase-variância, pode saber imediatamente o valor da variância.

Exemplos de quase-variância

Muitas vezes você deseja conhecer as características de qualquer população: pessoas, animais, plantas e, em geral, qualquer tipo de objeto. Mas analisar toda a população pode não ser uma tarefa fácil, especialmente se o número de elementos for muito grande.

Em seguida, são colhidas amostras, na esperança de que seu comportamento reflita o da população e, assim, possamos fazer inferências sobre ela, graças às quais os recursos são otimizados. Isso é conhecido como inferência estatística.


Aqui estão alguns exemplos em que a quase-variância e o desvio quase-padrão associado servem como um indicador estatístico, indicando a que distância os resultados obtidos estão da média.

1.- O diretor de marketing de uma empresa fabricante de baterias automotivas precisa estimar, em meses, a vida média de uma bateria.

Para fazer isso, ele seleciona aleatoriamente uma amostra de 100 baterias compradas dessa marca. A empresa mantém um registro dos detalhes dos compradores e pode entrevistá-los para saber quanto tempo as baterias duram.

2.- A gestão académica de uma instituição universitária necessita de estimar as matrículas do ano seguinte, analisando o número de alunos que se espera que sejam aprovados nas disciplinas que estudam.

Por exemplo, em cada uma das seções atualmente cursando Física I, a administração pode selecionar uma amostra de alunos e analisar seu desempenho nessa cadeira. Desta forma, você pode inferir quantos alunos farão Física II no próximo período.


3.- Um grupo de astrônomos concentra sua atenção em uma parte do céu, onde se observa um certo número de estrelas com certas características: tamanho, massa e temperatura por exemplo.

É de se perguntar se estrelas em outra região semelhante terão as mesmas características, até mesmo estrelas em outras galáxias, como as vizinhas Nuvens de Magalhães ou Andrômeda.

Por que dividir por n-1?

A quasivariância é dividida por n-1 em vez de fazer entre n e é porque a quase-variância é um estimador imparcial, como dito no início.

Acontece que de uma mesma população é possível extrair muitas amostras. A variância de cada uma dessas amostras também pode ser calculada, mas a média dessas variâncias não chega a ser igual à variância da população.

Na verdade, a média das variâncias da amostra tende a subestimar a variância da população, a menos que você use n-1 no denominador. Pode-se verificar que o valor esperado da quase-variância E (sc2) é precisamente s2.

Por esta razão, diz-se que a quasivariada é não viesada e é um melhor estimador da variância populacional s2.

Maneira alternativa de calcular quasivariância

É facilmente mostrado que a quase-variância também pode ser calculada da seguinte forma:

sc2 = [∑x2 / (n-1)] - [∑nX2 / (n-1)]

A pontuação padrão

Tendo o desvio da amostra, podemos dizer quantos desvios padrão um determinado valor x tem, acima ou abaixo da média.

Para isso, a seguinte expressão adimensional é usada:

Pontuação padrão = (x - X) / sc

Exercício resolvido

Calcule a quase-variância e o quase-desvio padrão dos dados a seguir, que consistem em pagamentos mensais em $ feitos por uma seguradora a uma clínica privada.

863  903  957  1041  1138  1204  1354  1624  1698  1745  1802  1883

a) Use a definição de quase-variância dada no início e também verifique o resultado usando a forma alternativa fornecida na seção anterior.

b) Calcule a pontuação padrão da segunda parte dos dados, lendo de cima para baixo.

Solução para

O problema pode ser resolvido manualmente com o auxílio de uma calculadora simples ou científica, para a qual é necessário proceder em ordem. E para isso, nada melhor do que organizar os dados em uma tabela como a mostrada abaixo:

Graças à tabela, a informação está organizada e as quantidades que vão ser necessárias nas fórmulas encontram-se no final das respectivas colunas, prontas a serem utilizadas de imediato. As somas são indicadas em negrito.

A coluna média se repete sempre, mas vale a pena porque é conveniente ter o valor em vista, para preencher cada linha da tabela.

Por fim, é aplicada a equação para a quasivariada dada no início, apenas os valores são substituídos e quanto ao somatório, já a temos calculada:

sc2 = 1.593.770 / (12-1) = 1.593.770 / 11 = 144.888,2

Este é o valor da quase-variância e suas unidades são "dólares ao quadrado", o que não faz muito sentido prático, então o desvio quase padrão da amostra é calculado, que não é mais do que a raiz quadrada da quase-variância:

sc = (144.888,2) $ = 380,64 $

É imediatamente confirmado que este valor também é obtido com a forma alternativa de quase-variância. A soma necessária está no final da última coluna à esquerda:

sc2 = [∑x2 / (n-)] - [∑nX2 / (n-1)] = [23.496.182 / 11] - [12 x 13512/ 11]

= 2.136.016,55 - 1.991.128,36 = $ 144.888 ao quadrado

É o mesmo valor obtido com a fórmula dada no início.

Solução b

O segundo valor de cima para baixo é 903, sua pontuação padrão é

Pontuação padrão de 903 = (x - X) / sc = (903 – 1351)/380.64 = -1.177

Referências

  1. Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
  2. Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
  3. Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
  4. Medidas de dispersão. Recuperado de: thales.cica.es.
  5. Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.