Regra de Sturges: Explicação, aplicativos e exemplos - Ciência - 2023


science
Regra de Sturges: Explicação, aplicativos e exemplos - Ciência
Regra de Sturges: Explicação, aplicativos e exemplos - Ciência

Contente

o regra de Sturges é um critério usado para determinar o número de classes ou intervalos necessários para representar graficamente um conjunto de dados estatísticos. Essa regra foi enunciada em 1926 pelo matemático alemão Herbert Sturges.

Sturges propôs um método simples, baseado no número de amostras x, que nos permitiria encontrar o número de classes e sua amplitude de alcance. A regra de Sturges é amplamente utilizada, especialmente na área de estatística, especificamente para construir histogramas de frequência.

Explicação

A regra de Sturges é um método empírico amplamente utilizado em estatística descritiva para determinar o número de classes que devem existir em um histograma de frequência, a fim de classificar um conjunto de dados que representa uma amostra ou população.


Basicamente, esta regra determina a largura dos recipientes gráficos, dos histogramas de frequência.

Para estabelecer sua regra, Herbert Sturges considerou um diagrama de frequência ideal, consistindo em K intervalos, onde o i-ésimo intervalo contém um certo número de amostras (i = 0, ... k - 1), representado como:

Esse número de amostras é dado pelo número de maneiras pelas quais um subconjunto de um conjunto pode ser extraído; ou seja, pelo coeficiente binomial, expresso da seguinte forma:


Para simplificar a expressão, ele aplicou as propriedades dos logaritmos a ambas as partes da equação:


Assim, Sturges estabeleceu que o número ótimo de intervalos k é dado pela expressão:

Também pode ser expresso como:

Nesta expressão:

- k é o número de classes.

- N é o número total de observações na amostra.

- Log é o logaritmo comum da base 10.

Por exemplo, para construir um histograma de frequência que expressa uma amostra aleatória da altura de 142 crianças, o número de intervalos ou classes que a distribuição terá é:


k = 1 + 3.322 * registro10 (N)

k = 1 + 3.322* log (142)

k = 1 + 3.322* 2,1523

k = 8,14 ≈ 8

Assim, a distribuição será em 8 intervalos.


O número de intervalos deve ser sempre representado por números inteiros. Nos casos em que o valor é decimal, uma aproximação deve ser feita para o número inteiro mais próximo.

Formulários

A regra de Sturges é aplicada principalmente em estatística, pois permite que uma distribuição de frequência seja feita através do cálculo do número de classes (k), bem como do comprimento de cada uma delas, também conhecido como amplitude.

A amplitude é a diferença do limite superior e inferior da classe, dividida pelo número de classes, e é expressa:

Existem muitas regras básicas que permitem fazer uma distribuição de frequência. No entanto, a regra de Sturges é comumente usada porque se aproxima do número de classes, que geralmente varia de 5 a 15.


Assim, considera um valor que representa adequadamente uma amostra ou população; ou seja, a aproximação não representa agrupamentos extremos, nem funciona com um número excessivo de classes que não permitem que a amostra seja resumida.

Exemplo

Um histograma de frequência precisa ser feito de acordo com os dados fornecidos, que correspondem às idades obtidas em uma pesquisa com homens que se exercitam em uma academia local.

Para determinar os intervalos, deve-se saber o tamanho da amostra ou o número de observações; neste caso, são 30.

Então a regra de Sturges se aplica:

k = 1 + 3.322 * registro10 (N)

k = 1 + 3.322* log (30)

k = 1 + 3.322* 1,4771

k = 5,90 ≈ 6 intervalos.

A partir do número de intervalos, pode-se calcular a amplitude que estes terão; ou seja, a largura de cada barra representada no histograma de frequência:

O limite inferior é considerado o menor valor dos dados, e o limite superior é o maior valor. A diferença entre os limites superior e inferior é chamada de intervalo ou intervalo da variável (R).

Da tabela, temos que o limite superior é 46 e o ​​limite inferior é 13; desta forma, a amplitude de cada aula será:

Os intervalos serão compostos por um limite superior e um limite inferior. Para determinar esses intervalos, iniciamos contando a partir do limite inferior, acrescentando a este a amplitude determinada pela regra (6), da seguinte forma:

Em seguida, a frequência absoluta é calculada para determinar o número de homens correspondente a cada intervalo; neste caso é:

- Intervalo 1: 13 - 18 = 9

- Intervalo 2: 19 - 24 = 9

- Intervalo 3: 25 - 30 = 5

- Intervalo 4: 31 - 36 = 2

- Intervalo 5: 37 - 42 = 2

- Intervalo 6: 43 - 48 = 3

Ao somar a frequência absoluta de cada classe, esta deve ser igual ao número total da amostra; neste caso, 30.

Posteriormente, a frequência relativa de cada intervalo é calculada, dividindo sua frequência absoluta pelo número total de observações:

- Intervalo 1: fi = 9 ÷ 30 = 0,30

- Intervalo 2: fi = 9 ÷ 30 = 0,30

- Intervalo 3: fi = 5 ÷ 30 = 0,1666

- Intervalo 4: fi = 2 ÷ 30 = 0,0666

- Intervalo 5: fi = 2 ÷ 30 = 0,0666

- Intervalo 4: fi = 3 ÷ 30 = 0,10

Aí você pode fazer uma tabela que reflete os dados, e também o diagrama da frequência relativa em relação aos intervalos obtidos, como pode ser visto nas seguintes imagens:

Desta forma, a regra de Sturges permite determinar o número de classes ou intervalos em que uma amostra pode ser dividida, de forma a resumir uma amostra de dados através da elaboração de tabelas e gráficos.

Referências

  1. Alfonso Urquía, M. V. (2013). Modelagem e simulação de eventos discretos. UNED,.
  2. Altman Naomi, M. K. (2015). "Regressão Linear Simples." Métodos da natureza.
  3. Antúnez, R. J. (2014). Estatísticas em educação. UNIDADE Digital.
  4. Fox, J. (1997.). Análise de regressão aplicada, modelos lineares e métodos relacionados. Publicações SAGE.
  5. Humberto Llinás Solano, C. R. (2005). Estatísticas descritivas e distribuições de probabilidade. Northern University.
  6. Panteleeva, O. V. (2005). Fundamentos de Probabilidade e Estatística.
  7. O. Kuehl, M. O. (2001). Projeto de experimentos: princípios estatísticos de projeto e análise de pesquisa. Editores da Thomson.