Medidas de tendência central para dados agrupados: fórmulas, exercícios - Ciência - 2023


science
Medidas de tendência central para dados agrupados: fórmulas, exercícios - Ciência
Medidas de tendência central para dados agrupados: fórmulas, exercícios - Ciência

Contente

As medidas de tendênciacentralindicam o valor em torno do qual estão os dados de uma distribuição. A mais conhecida é a média ou média aritmética, que consiste em somar todos os valores e dividir o resultado pelo número total de dados.

No entanto, se a distribuição consiste em um grande número de valores e eles não são apresentados de forma ordenada, não é fácil realizar os cálculos necessários para extrair as informações valiosas que eles contêm.

É por isso que eles são agrupados em classes ou categorias, para desenvolver um distribuição defrequências. Fazendo essa ordenação prévia dos dados, fica mais fácil calcular as medidas de tendência central, entre as quais:

-Metade

-Mediana

-Moda

-Média geométrica


-Halmonic Harmônico

Fórmulas

Aqui estão as fórmulas para as medidas de tendência central para os dados agrupados:

Média aritmética

A média é a mais utilizada para caracterizar dados quantitativos (valores numéricos), embora seja bastante sensível aos valores extremos da distribuição. É calculado por:

Com:

-X: média ou média aritmética

-FEu: frequência de aula

-mEu: a marca da classe

-g: número de aulas

-n: dados totais

Mediana

Para calculá-lo, é necessário encontrar o intervalo que contém a observação n / 2 e interpolar para determinar o valor numérico dessa observação, utilizando a seguinte fórmula:


Onde:

-c: largura do intervalo ao qual pertence a mediana

-BM: borda inferior do referido intervalo

-Fm: número de observações contidas no intervalo

-n / 2: dados totais divididos por 2.

-FBM: número de observações antes do intervalo que contém a mediana.

Portanto, a mediana é uma medida de posição, ou seja, divide o conjunto de dados em duas partes. Eles também podem ser definidos quartis, decis Y percentis, que dividem a distribuição em quatro, dez e cem partes, respectivamente.

moda

Nos dados agrupados, a classe ou categoria que contém a maioria das observações é pesquisada. Esta é a classe modal. Uma distribuição pode ter dois ou mais modos, caso em que é chamada bimodal Y multimodal, respectivamente.


Você também pode calcular o modo em dados agrupados seguindo a equação:

Com:

-EU1: limite inferior da classe onde o modo se encontra

1: Subtraia entre a frequência da classe modal e a frequência da classe que a precede.

2: Subtraia entre a frequência da classe modal e a frequência da classe que se segue.

-c: largura do intervalo contendo o modo

Média harmônica

A média harmônica é denotada por H. Quando você tem um conjunto de n valores x1, x2, x3…, A média harmônica é o inverso ou recíproco da média aritmética dos inversos dos valores.

É mais fácil ver através da fórmula:

E ao ter os dados agrupados, a expressão passa a ser:

Onde:

-H: média harmônica

-FEu: frequência de aula

-mEu: marca de classe

-g: número de aulas

-N = f1 + f2 + f3 + …

Média geométrica

Se eles têm n números positivos x1, x2, x3…, Sua média geométrica G é calculada pela enésima raiz do produto de todos os números:


No caso de dados agrupados, pode-se mostrar que o logaritmo decimal da média geométrica log G é dado por:

Onde:

-G: média geométrica

-FEu: frequência de aula

-mEu: a marca da classe

-g: número de aulas

-N = f1 + f2 + f3 + …

Relação entre H, G e X

É sempre verdade que:

H ≤ G ≤ X

Definições mais usadas

As seguintes definições são necessárias para encontrar os valores descritos nas fórmulas acima:


Frequência

A frequência é definida como o número de vezes que um dado é repetido.

Classificação

É a diferença entre o maior e o menor valor, presente na distribuição.

Número de aulas

Para saber em quantas classes agrupamos os dados, usamos alguns critérios, por exemplo o seguinte:

Limites

Os valores extremos de cada classe ou intervalo são chamados limites e cada classe pode ter limites bem definidos, caso em que tem um limite inferior e um limite superior. Ou pode ter limites abertos, quando é dada uma faixa, por exemplo de valores maiores ou menores que um determinado número.


Marca de classe

Ele simplesmente consiste no ponto médio do intervalo e é calculado pela média do limite superior e do limite inferior.


Largura do intervalo

Os dados podem ser agrupados em classes de tamanho igual ou diferente, ou seja, largura ou largura. A primeira opção é a mais utilizada, pois torna os cálculos muito mais fáceis, embora em alguns casos seja obrigatório que as classes tenham larguras diferentes.

A largura c do intervalo pode ser determinado pela seguinte fórmula:

c = Faixa / Nc

Ondec é o número de classes.

Exercício resolvido

Abaixo temos uma série de medidas de velocidade em km / h, feitas com radar, que correspondem a 50 carros que passaram por uma rua de uma determinada cidade:

Solução

Os dados apresentados não estão organizados, portanto, o primeiro passo é agrupá-los em classes.


Etapas para agrupar os dados e construir a tabela

Passo 1

Encontre o intervalo R:

R = (52 - 16) km / h = 36 km / h

Passo 2

Selecione o número de classes Nc, de acordo com os critérios dados. Como existem 50 dados, podemos escolher Nc = 6.

etapa 3

Calcular largura c do intervalo:

c = Faixa / Nc = 36 / 6 = 6

Passo 4

Forme classes e dados de grupo da seguinte maneira: para a primeira classe, um valor ligeiramente inferior ao valor mais baixo presente na tabela é escolhido como o limite inferior, então o valor de c = 6, calculado anteriormente, é adicionado a este valor, e assim, você obtém o limite superior da primeira classe.

Procedemos da mesma maneira para construir o resto das classes, conforme mostrado na tabela a seguir:


Cada frequência corresponde a uma cor da figura 2, desta forma é garantido que nenhum valor escapa da contagem.

Cálculo da média

X = (5 x 18,5 +25 x 25,0 + 10 x 31,5 + 6 x 38,0 + 2 x 44,5 + 2 x 51,0) ÷ 50 = 29,03 km / h

Cálculo da mediana

A mediana está na classe 2 da tabela, pois os primeiros 30 dados da distribuição estão lá.

-Largura do intervalo ao qual pertence a mediana: c = 6

- Fronteira inferior do intervalo onde a mediana é: BM = 22,0 km / h

- Número de observações que o intervalo f contémm =25

-Dados totais divididos por 2: 50/2 = 25

- Número de observações que existem antes do intervalo contendo a mediana: fBM = 5

E a operação é:

Mediana = 22,0 + [(25-5) ÷ 25] × 6 = 26,80 km / h

Cálculo de moda

A moda também está na classe 2:

- Largura do intervalo: c = 6

-Limite inferior da classe onde se encontra o modo: L1 = 22.0

-Subtração entre a frequência da classe modal e a frequência da classe que a precede: Δ1 =25-5= 20

-Subtração entre a frequência da classe modal e a frequência da classe que se segue: Δ2 = 25 – 10 = 15

Com esses dados, a operação é:

Modo = 22,0 + [20 ÷ (20 + 15)] x6 = 25,4 km / h

Cálculo da média geométrica

N = f1 + f2 + f3 + … = 50

log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =

log G = 1,44916053

G = 28,13 km / h

Cálculo da média harmônica

1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366

H = 27,32 km / h

Resumo das medidas de tendência central

As unidades das variáveis ​​são km / h:

-Médio: 29,03

-Mediano: 26,80

-Moda: 25,40

-Média geométrica: 28,13

-Halmonic Harmônico: 27,32

Referências

  1. Berenson, M. 1985. Statistics for management and economics. Interamericana S.A.
  2. Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
  3. Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
  4. Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
  5. Spiegel, M. 2009. Estatísticas. Schaum series. 4º Edição. McGraw Hill.
  6. Tratamento de dados agrupados. Recuperado de: itchihuahua.edu.mx.
  7. Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.