Variável categórica: características e exemplos - Ciência - 2023


science
Variável categórica: características e exemplos - Ciência
Variável categórica: características e exemplos - Ciência

Contente

o variável categórica É aquele usado em estatística para atribuir uma característica ou propriedade não numérica ou qualitativa a algum objeto, indivíduo, entidade, condição ou procedimento. É possível definir todos os tipos de variáveis ​​categóricas de acordo com cada necessidade.

Exemplos de variáveis ​​categóricas são: cor, sexo, grupo sanguíneo, estado civil, tipo de material, forma de pagamento ou tipo de conta bancária, e são muito utilizadas no dia a dia.

As acima são as variáveis, mas seus valores possíveis são qualitativos, ou seja, de qualidade ou característica e não de medida numérica. Por exemplo, os valores possíveis para a variável sexo estão: masculino , hembra.

Quando esta variável é armazenada em um programa de computador, ela pode ser declarada como uma variável de texto e os únicos valores aceitos serão aqueles já nomeados: Masculino , Fêmea.


Porém a mesma variável sexo pode ser declarado e armazenado como um inteiro se um Masculino é atribuído 1Fêmea o valor é atribuído 2. É por esse motivo que as variáveis ​​categóricas às vezes são chamadas de tipo enumerado.

A principal característica das variáveis ​​categóricas é que, ao contrário de outras variáveis, como variáveis ​​contínuas e discretas, não é possível fazer aritmética com elas. Porém, estatísticas podem ser feitas com eles, como será visto mais tarde.

Exemplos

Observe os seguintes exemplos de variáveis ​​categóricas e seus valores possíveis:

Grupo sanguineo,Faixa de valores: A, B, AB, O

Estado civil,Valores categóricos: Solteiro (PARA), Casado (B), Viúvo (C), Divorciado (D).

Tipo de material,Categorias ou valores: 1 = Madeira, 2 = Metal, 3 = Plástico

-Forma de pagamento,Valores ou categorias: (1) Dinheiro, (2) Débito, (3) Transferência, (4) Crédito


Nos exemplos anteriores, um número foi associado a cada categoria de uma forma completamente arbitrária.

Pode-se então pensar que esta associação numérica arbitrária o torna igual a um variável quantitativa discreta, mas não é, uma vez que as operações aritméticas não podem ser feitas com esses números.

Para ilustrar a ideia, na variável Forma de pagamento, a operação de soma não faz sentido:

 (1) Dinheiro + (2) Débito nunca será igual (3) Transferência

Classificação de variáveis ​​categóricas

A classificação é baseada no fato de eles terem ou não uma hierarquia implícita ou se o número de resultados possíveis é superior a dois ou dois.

Uma variável categórica com apenas um resultado possível não é uma variável, é uma constante categórica.

Categorias nominais

Quando não podem ser representados por um número ou ter qualquer ordem. Por exemplo, a variável: Type_of_Material, ttem valores nominais (Madeira, Metal, Plástico), eles não têm hierarquia ou ordem, mesmo quando um número arbitrário é atribuído a cada resposta ou categoria.


Ordinal categórico

Variável:Rendimento acadêmico

Valores nominais: Alto, Médio, Baixo

Embora os valores dessa variável não sejam numéricos, eles têm uma ordem ou hierarquia implícita.

Categorias binárias

Estas são variáveis ​​nominais com duas respostas possíveis, por exemplo:

-Variável: Resposta

- Valores nominais: Verdadeiro, Falso

Observe que a variável Resposta não tem uma hierarquia implícita e tem apenas dois resultados possíveis, portanto, é uma variável categórica binária.

Alguns autores chamam este tipo variável binária, e não o considere pertencer ao variáveis ​​categóricas que se restringem àqueles com mais de três categorias possíveis.

Estatísticas com variáveis ​​categóricas

As estatísticas podem ser feitas com variáveis ​​categóricas, apesar de não serem variáveis ​​numéricas ou quantitativas. Por exemplo, para saber a tendência ou o valor mais provável de uma variável categórica, tomamos Moda.

Moda é, neste caso, o resultado ou valor mais repetido de uma variável categórica. Para variáveis ​​categóricas, não é possível calcular a média ou a mediana.

A média não pode ser calculada porque você não pode fazer aritmética com variáveis ​​categóricas. Nem a mediana, pois as variáveis ​​quantitativas ou categóricas não possuem uma ordem ou hierarquia, de modo que não é possível determinar um valor central.

Representação gráfica de variáveis ​​categóricas

Dada uma determinada variável categórica, pode ser encontrada a frequência ou o número de vezes com que um resultado dessa variável é repetido. Se isso for feito para cada resultado, um gráfico pode ser feito da frequência em relação a cada categoria ou resultado.

Aqui estão alguns exemplos de como variáveis ​​categóricas podem ser representadas graficamente.

Exercícios resolvidos

Exercício 1

Uma empresa possui registros dos dados de 170 funcionários. Uma das variáveis ​​que estão nesses registros é: Estado civil. Esta variável possui quatro categorias ou valores possíveis:

Solteiro (PARA), Casado (B), Viúvo (C), Divorciado (D).

Embora seja uma variável não numérica, é possível saber quantos dos registros totais estão em uma determinada categoria e ser representados na forma de um gráfico de barras, conforme mostrado na figura a seguir:

Exemplo 2

Uma loja de calçados acompanha suas vendas. Entre as variáveis ​​que gerenciam seus registros está a cor do calçado de cada modelo. A variável:

Color_Shoe_Model_AW3

É categórico em tipo e tem cinco categorias ou valores possíveis. Para cada categoria desta variável soma-se o número de vendas e estabelece-se o percentual delas. Os resultados são apresentados no gráfico da seguinte figura:

Pode-se então dizer que o modelo de calçado AW3 que está em moda, o que é vendido com mais frequência é o Branco,seguido de perto por Preto

Pode-se dizer também que com uma probabilidade de 70% o próximo calçado deste modelo a ser vendido será Branco ou Preto.

Esta informação pode ser útil para a loja na hora de fazer novos pedidos, ou pode até aplicar descontos nas cores menos vendidas devido ao excesso de estoque.

Exemplo 3

Para uma determinada população de doadores de sangue, você deseja representar o número de pessoas que pertencem a um determinado grupo sanguíneo. Uma forma gráfica de visualizar os resultados é por meio de um pictograma, que tem ao fundo uma tabela.

A primeira coluna representa a variável grupo sanguineo e seus possíveis resultados ou categorias. A segunda coluna apresenta a representação de forma icônica ou pictórica do número de pessoas em cada categoria. Em nosso exemplo, uma gota vermelha é usada como ícone, cada um representando 10 pessoas.

Referências

  1. Khan Academy. Analisando dados categóricos. Recuperado de: khanacademy.org
  2. Fórmulas do universo. Variável qualitativa. Recuperado de: univesoformulas.com
  3. Minitab. Quais são variáveis ​​categóricas, discretas e contínuas. Recuperado de: support.minitab.com
  4. Tutorial do Excel. Caracterização de variáveis. Recuperado de: help.xlslat.com.
  5. Wikipedia. Variável estatística. Recuperado de wikipedia.com
  6. Wikipedia. Variável categórica. Recuperado de wikipedia.com
  7. Wikipedia. Variável categórica. Recuperado de wikipedia.com