Bioestatistica #2 - Frequências





Frequência é um dos conceitos mais importantes na análise estatística, significa a quantidade de vezes que algo ocorreu ou foi observado.

Por exemplo, se em um grupo de bolas coloridas existem 3 bolas azuis, então a frequência de bolas azuis neste grupo é três.



Frequências são usadas para organizar o analisar dados. Se está trabalhando com uma variável dividida em categorias, você pode verificar e comparar a frequência de cada categoria. Ou, se for uma variável numérica, você pode dividir faixas de resultados e verificar a frequência de cada faixa (e com isso obter a sua distribuição).

Existem dois tipos principais de frequência, a absoluta e a relativa.

A absoluta pode ser simbolizada pela letra “f” minúscula ou pela letra “n”. Ela é o próprio número da frequência, o valor bruto.

A relativa pode ser chamada pelas letras “fr” ou pelo símbolo de porcentagem (%). Ela é a relação entre esse valor absoluto com o tamanho do grupo, e é obtida dividindo o “n” pela quantidade total do grupo ou de observações (que é o mesmo que obter sua porcentagem).

Então, voltando ao exemplo da caixa com bolas coloridas, se é composto por um total de 12 bolas, e 3 são azuis, então a frequência absoluta de bolas azuis é 3, e a sua frequência relativa é 25%. E o mesmo pode ser calculado para as outras cores de bolas.

É importante saber quando direcionar sua análise em um ou no outro, para focar sua atenção e a do leitor ao que mais importa.

Valores absolutos servem para chamar atenção ao total, ao seu tamanho, sua grandeza. Enquanto os relativos mostram a sua importância dentro do grupo, se representa uma grande parcela ou pequena.

Porém é sempre importante observar e relatar as duas, absoluta e relativa, porque analisar apenas uma pode levar a grandes erros de interpretação.

Por exemplo, se, ao estudar uma população, percebe-se que existem 27 pessoas com hipertensão arterial. Então, isso é muito? É pouco? É preciso ver a frequência relativa!
Se o tamanho dessa população for de 30 indivíduos, então parece que existem muitos hipertensos, cerca de 90%. Mas se forem 27 dentro de um grupo de 3.000 indivíduos, então já é uma frequência bem pequena, apenas 0,9%.

Ou ainda, caso esteja sendo estudando o número de casos de dengue em diferentes bairros de uma cidade, e percebe-se que de um ano para o outo ouve um aumento de 50% no número de casos em um bairro, parece que é uma situação alarmante! Mas, será?
Se no ano anterior ouve, digamos, apenas 2 casos, um aumento de 50% significa que o aumento absoluto foi de apenas 1 caso, ou seja, passou de 2 para 3. O que epidemiologicamente não chega a chamar atenção, considerando a população de um bairro.


Existe ainda outra forma de frequência, a frequência acumulada, que é quando se soma as frequências a medida que se progride, as frequências “vão se acumulando”. Note que ela só pode ser usada quando existem uma ordem, seja com variáveis numéricas, ou com categorias ordinais. Pode servir para se encontrar percentis de interesse, por exemplo.




A análise de variáveis qualitativas envolve basicamente comparar as frequências de cada categoria de diferentes formas.

Porém quando se trabalha com variáveis quantitativas a coisa fica um pouco mais complicada. Neste caso o que se faz é dividir faixas de valores e observar a frequência de cada faixa, para ver em quais faixas os resultados estão mais ou menos concentrados. Isso se chama descrever a distribuição dos resultados, e a forma clássica de descrever uma distribuição é com um tipo de gráfico chamado histograma.

O histograma é um gráfico de barras, em que cada barra indica a frequência de uma faixa de valores. Com ele é fácil verificar em quais faixas da há maior ou menor frequência de valores.

Porém um histograma traz muita informação, muito mais do que se usualmente precisa. Ao analisar um único grupo parece ser simples, mas imagine quando se quer comparar vários grupos. A visualização acaba ficando poluída e gera muita complicação.

Por isso na análise de variáveis quantitativas se usa medidas que traduzem sua distribuição, simplificam sua visualização e facilitam as comparações. Elas são chamadas de medidas de posição e dispersão, como a média, a mediana, a moda ou o desvio padrão.

Mas agora já estou entrando em outro tópico, então isso vai ficar para a próxima. Até mais!

Comentários