Medidas de tendência central para dados agrupados: fórmulas, exercícios - Ciência - 2023
science
Contente
- Fórmulas
- Média aritmética
- Mediana
- moda
- Média harmônica
- Média geométrica
- Relação entre H, G e X
- Definições mais usadas
- Frequência
- Classificação
- Número de aulas
- Limites
- Marca de classe
- Largura do intervalo
- Exercício resolvido
- Solução
- Etapas para agrupar os dados e construir a tabela
- Passo 1
- Passo 2
- etapa 3
- Passo 4
- Cálculo da média
- Cálculo da mediana
- Cálculo de moda
- Cálculo da média geométrica
- Cálculo da média harmônica
- Resumo das medidas de tendência central
- Referências
As medidas de tendênciacentralindicam o valor em torno do qual estão os dados de uma distribuição. A mais conhecida é a média ou média aritmética, que consiste em somar todos os valores e dividir o resultado pelo número total de dados.
No entanto, se a distribuição consiste em um grande número de valores e eles não são apresentados de forma ordenada, não é fácil realizar os cálculos necessários para extrair as informações valiosas que eles contêm.
É por isso que eles são agrupados em classes ou categorias, para desenvolver um distribuição defrequências. Fazendo essa ordenação prévia dos dados, fica mais fácil calcular as medidas de tendência central, entre as quais:
-Metade
-Mediana
-Moda
-Média geométrica
-Halmonic Harmônico
Fórmulas
Aqui estão as fórmulas para as medidas de tendência central para os dados agrupados:
Média aritmética
A média é a mais utilizada para caracterizar dados quantitativos (valores numéricos), embora seja bastante sensível aos valores extremos da distribuição. É calculado por:
Com:
-X: média ou média aritmética
-FEu: frequência de aula
-mEu: a marca da classe
-g: número de aulas
-n: dados totais
Mediana
Para calculá-lo, é necessário encontrar o intervalo que contém a observação n / 2 e interpolar para determinar o valor numérico dessa observação, utilizando a seguinte fórmula:
Onde:
-c: largura do intervalo ao qual pertence a mediana
-BM: borda inferior do referido intervalo
-Fm: número de observações contidas no intervalo
-n / 2: dados totais divididos por 2.
-FBM: número de observações antes do intervalo que contém a mediana.
Portanto, a mediana é uma medida de posição, ou seja, divide o conjunto de dados em duas partes. Eles também podem ser definidos quartis, decis Y percentis, que dividem a distribuição em quatro, dez e cem partes, respectivamente.
moda
Nos dados agrupados, a classe ou categoria que contém a maioria das observações é pesquisada. Esta é a classe modal. Uma distribuição pode ter dois ou mais modos, caso em que é chamada bimodal Y multimodal, respectivamente.
Você também pode calcular o modo em dados agrupados seguindo a equação:
Com:
-EU1: limite inferior da classe onde o modo se encontra
-Δ1: Subtraia entre a frequência da classe modal e a frequência da classe que a precede.
-Δ2: Subtraia entre a frequência da classe modal e a frequência da classe que se segue.
-c: largura do intervalo contendo o modo
Média harmônica
A média harmônica é denotada por H. Quando você tem um conjunto de n valores x1, x2, x3…, A média harmônica é o inverso ou recíproco da média aritmética dos inversos dos valores.
É mais fácil ver através da fórmula:
E ao ter os dados agrupados, a expressão passa a ser:
Onde:
-H: média harmônica
-FEu: frequência de aula
-mEu: marca de classe
-g: número de aulas
-N = f1 + f2 + f3 + …
Média geométrica
Se eles têm n números positivos x1, x2, x3…, Sua média geométrica G é calculada pela enésima raiz do produto de todos os números:
No caso de dados agrupados, pode-se mostrar que o logaritmo decimal da média geométrica log G é dado por:
Onde:
-G: média geométrica
-FEu: frequência de aula
-mEu: a marca da classe
-g: número de aulas
-N = f1 + f2 + f3 + …
Relação entre H, G e X
É sempre verdade que:
H ≤ G ≤ X
Definições mais usadas
As seguintes definições são necessárias para encontrar os valores descritos nas fórmulas acima:
Frequência
A frequência é definida como o número de vezes que um dado é repetido.
Classificação
É a diferença entre o maior e o menor valor, presente na distribuição.
Número de aulas
Para saber em quantas classes agrupamos os dados, usamos alguns critérios, por exemplo o seguinte:
Limites
Os valores extremos de cada classe ou intervalo são chamados limites e cada classe pode ter limites bem definidos, caso em que tem um limite inferior e um limite superior. Ou pode ter limites abertos, quando é dada uma faixa, por exemplo de valores maiores ou menores que um determinado número.
Marca de classe
Ele simplesmente consiste no ponto médio do intervalo e é calculado pela média do limite superior e do limite inferior.
Largura do intervalo
Os dados podem ser agrupados em classes de tamanho igual ou diferente, ou seja, largura ou largura. A primeira opção é a mais utilizada, pois torna os cálculos muito mais fáceis, embora em alguns casos seja obrigatório que as classes tenham larguras diferentes.
A largura c do intervalo pode ser determinado pela seguinte fórmula:
c = Faixa / Nc
Ondec é o número de classes.
Exercício resolvido
Abaixo temos uma série de medidas de velocidade em km / h, feitas com radar, que correspondem a 50 carros que passaram por uma rua de uma determinada cidade:
Solução
Os dados apresentados não estão organizados, portanto, o primeiro passo é agrupá-los em classes.
Etapas para agrupar os dados e construir a tabela
Passo 1
Encontre o intervalo R:
R = (52 - 16) km / h = 36 km / h
Passo 2
Selecione o número de classes Nc, de acordo com os critérios dados. Como existem 50 dados, podemos escolher Nc = 6.
etapa 3
Calcular largura c do intervalo:
c = Faixa / Nc = 36 / 6 = 6
Passo 4
Forme classes e dados de grupo da seguinte maneira: para a primeira classe, um valor ligeiramente inferior ao valor mais baixo presente na tabela é escolhido como o limite inferior, então o valor de c = 6, calculado anteriormente, é adicionado a este valor, e assim, você obtém o limite superior da primeira classe.
Procedemos da mesma maneira para construir o resto das classes, conforme mostrado na tabela a seguir:
Cada frequência corresponde a uma cor da figura 2, desta forma é garantido que nenhum valor escapa da contagem.
Cálculo da média
X = (5 x 18,5 +25 x 25,0 + 10 x 31,5 + 6 x 38,0 + 2 x 44,5 + 2 x 51,0) ÷ 50 = 29,03 km / h
Cálculo da mediana
A mediana está na classe 2 da tabela, pois os primeiros 30 dados da distribuição estão lá.
-Largura do intervalo ao qual pertence a mediana: c = 6
- Fronteira inferior do intervalo onde a mediana é: BM = 22,0 km / h
- Número de observações que o intervalo f contémm =25
-Dados totais divididos por 2: 50/2 = 25
- Número de observações que existem antes do intervalo contendo a mediana: fBM = 5
E a operação é:
Mediana = 22,0 + [(25-5) ÷ 25] × 6 = 26,80 km / h
Cálculo de moda
A moda também está na classe 2:
- Largura do intervalo: c = 6
-Limite inferior da classe onde se encontra o modo: L1 = 22.0
-Subtração entre a frequência da classe modal e a frequência da classe que a precede: Δ1 =25-5= 20
-Subtração entre a frequência da classe modal e a frequência da classe que se segue: Δ2 = 25 – 10 = 15
Com esses dados, a operação é:
Modo = 22,0 + [20 ÷ (20 + 15)] x6 = 25,4 km / h
Cálculo da média geométrica
N = f1 + f2 + f3 + … = 50
log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =
log G = 1,44916053
G = 28,13 km / h
Cálculo da média harmônica
1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366
H = 27,32 km / h
Resumo das medidas de tendência central
As unidades das variáveis são km / h:
-Médio: 29,03
-Mediano: 26,80
-Moda: 25,40
-Média geométrica: 28,13
-Halmonic Harmônico: 27,32
Referências
- Berenson, M. 1985. Statistics for management and economics. Interamericana S.A.
- Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
- Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
- Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
- Spiegel, M. 2009. Estatísticas. Schaum series. 4º Edição. McGraw Hill.
- Tratamento de dados agrupados. Recuperado de: itchihuahua.edu.mx.
- Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.