Amostragem aleatória: metodologia, vantagens, desvantagens, exemplos - Ciência - 2023
science
Contente
- O tamanho da amostra
- Caso 1: o tamanho da população é desconhecido
- Níveis de confiança e seus valores Z correspondentes
- Caso 2: o tamanho da população é conhecido
- Exemplos
- Pesquisas e questionários
- Controle de qualidade
- Vantagem
- Desvantagens
- Exercício resolvido
- Solução
- Referências
o amostragem aleatória é a forma de selecionar uma amostra estatisticamente representativa de uma determinada população. Parte do princípio de que todos os elementos da amostra devem ter a mesma probabilidade de serem selecionados.
Um sorteio é um exemplo de amostragem aleatória, em que cada membro da população participante recebe um número. Para escolher os números correspondentes aos prêmios do sorteio (a amostra) é utilizada alguma técnica aleatória, por exemplo, extrair de uma caixa de correio os números que foram registrados em cartões idênticos.
Na amostragem aleatória, é fundamental escolher o tamanho da amostra de forma adequada, pois uma amostra não representativa da população pode levar a conclusões equivocadas, devido às oscilações estatísticas.
O tamanho da amostra
Existem fórmulas para determinar o tamanho adequado de uma amostra. O fator mais importante a considerar é se o tamanho da população é conhecido ou não. Vejamos as fórmulas para determinar o tamanho da amostra:
Caso 1: o tamanho da população é desconhecido
Quando o tamanho da população N é desconhecido, é possível selecionar uma amostra de tamanho n adequado para determinar se uma determinada hipótese é verdadeira ou falsa.
Para isso, a seguinte fórmula é usada:
n = (Z2 p q) / (E2)
Onde:
-p é a probabilidade de que a hipótese seja verdadeira.
-q é a probabilidade de que não seja, portanto q = 1 - p.
-E é a margem de erro relativa, por exemplo, um erro de 5% tem uma margem de E = 0,05.
-Z tem a ver com o nível de confiança exigido pelo estudo.
Em uma distribuição normal padronizada (ou normalizada), um nível de confiança de 90% tem Z = 1.645, porque a probabilidade de que o resultado esteja entre -1.645σ e + 1.645σ é 90%, onde σ é o desvio padrão .
Níveis de confiança e seus valores Z correspondentes
1.- nível de confiança de 50% corresponde a Z = 0,675.
2.- Nível de confiança de 68,3% corresponde a Z = 1.
3.- O nível de confiança de 90% é equivalente a Z = 1.645.
4.- nível de confiança de 95% corresponde a Z = 1,96
5.- nível de confiança de 95,5% corresponde a Z = 2.
6.- O nível de confiança de 99,7% é equivalente a Z = 3.
Um exemplo onde esta fórmula pode ser aplicada seria em um estudo para determinar o peso médio de seixos em uma praia.
Obviamente, não é possível estudar e pesar todos os seixos da praia, por isso é aconselhável extrair uma amostra o mais aleatória possível e com o número adequado de elementos.
Caso 2: o tamanho da população é conhecido
Quando o número N de elementos que compõem uma determinada população (ou universo) é conhecido, se quisermos selecionar por amostragem aleatória simples uma amostra estatisticamente significativa de tamanho n, esta é a fórmula:
n = (Z2p q N) / (N E2 + Z2p q)
Onde:
-Z é o coeficiente associado ao nível de confiança.
-p é a probabilidade de sucesso da hipótese.
-q é a probabilidade de falha na hipótese, p + q = 1.
-N é o tamanho da população total.
-E é o erro relativo do resultado do estudo.
Exemplos
A metodologia para extrair as amostras depende muito do tipo de estudo que precisa ser feito. Portanto, a amostragem aleatória tem um número infinito de aplicações:
Pesquisas e questionários
Por exemplo, nas pesquisas por telefone, as pessoas a serem consultadas são escolhidas por meio de um gerador de números aleatórios, aplicável à região em estudo.
Se quiser aplicar um questionário aos colaboradores de uma grande empresa, pode recorrer à seleção dos respondentes através do seu número de funcionário, ou número do bilhete de identidade.
O referido número também deve ser escolhido aleatoriamente, usando, por exemplo, um gerador de números aleatórios.
Controle de qualidade
No caso de o estudo ser sobre peças fabricadas por máquina, as peças devem ser escolhidas aleatoriamente, mas a partir de lotes fabricados em horários diferentes do dia, ou em dias ou semanas diferentes.
Vantagem
Amostragem aleatória simples:
- Permite reduzir os custos de um estudo estatístico, uma vez que não é necessário estudar a população total para obter resultados estatisticamente fiáveis, com os níveis de confiança pretendidos e o nível de erro requerido no estudo.
- Evitar vieses: como a escolha dos elementos a serem estudados é totalmente aleatória, o estudo reflete fielmente as características da população, embora apenas parte dela tenha sido estudada.
Desvantagens
- O método não é adequado nos casos em que se deseja conhecer as preferências em diferentes grupos ou estratos populacionais.
Neste caso, é preferível determinar previamente os grupos ou segmentos nos quais o estudo deve ser realizado. Definidos os estratos ou grupos, então se é conveniente para cada um deles aplicar a amostragem aleatória.
- É altamente improvável que se obtenha informação sobre setores minoritários, dos quais às vezes é necessário conhecer suas características.
Por exemplo, se se trata de fazer campanha sobre um produto caro, é necessário conhecer as preferências dos setores minoritários mais ricos.
Exercício resolvido
Queremos estudar a preferência da população por determinada bebida de cola, mas não há nenhum estudo anterior nessa população, cujo tamanho é desconhecido.
Por outro lado, a amostra deve ser representativa com nível de confiança mínimo de 90% e as conclusões devem ter erro percentual de 2%.
-Como determinar o tamanho n da amostra?
-Qual seria o tamanho da amostra se a margem de erro fosse flexibilizada para 5%?
Solução
Uma vez que o tamanho da população é desconhecido, a fórmula fornecida acima é usada para determinar o tamanho da amostra:
n = (Z2p q) / (E2)
Assumimos que há a mesma probabilidade de preferência (p) para nossa marca de refrigerante e de nenhuma preferência (q), então p = q = 0,5.
Por outro lado, como o resultado do estudo deve ter um erro percentual menor que 2%, o erro relativo E será de 0,02.
Por último, um valor Z = 1.645 produz um nível de confiança de 90%.
Resumindo, temos os seguintes valores:
Z = 1.645
p = 0,5
q = 0,5
E = 0,02
Com esses dados, o tamanho mínimo da amostra é calculado:
n = (1.6452 0,5 0,5)/(0,022) = 1691,3
Isso significa que o estudo com a margem de erro exigida e com o nível de confiança escolhido, deve ter uma amostra de respondentes de pelo menos 1.692 indivíduos, escolhidos por amostragem aleatória simples.
Se você passar de uma margem de erro de 2% para 5%, o novo tamanho da amostra é:
n = (1.6452 0,5 0,5)/(0,052) = 271
O que é um número significativamente menor de indivíduos. Em conclusão, o tamanho da amostra é muito sensível à margem de erro desejada no estudo.
Referências
- Berenson, M. 1985. Statistics for Management and Economics, Concepts and Applications. Editorial Interamericana.
- Estatisticas. Amostragem aleatória. Retirado de: encyclopediaeconomica.com.
- Estatisticas. Amostragem. Recuperado de: Estadistica.mat.uson.mx.
- Explorável. Amostragem aleatória. Recuperado de: explorable.com.
- Moore, D. 2005. Estatísticas Básicas Aplicadas. 2ª Edição.
- Netquest. Amostragem aleatória. Recuperado de: netquest.com.
- Wikipedia. Amostragem estatística. Recuperado de: en.wikipedia.org