Bioestatistica #3 - Posição e Dispersão



Quando se analisa variáveis quantitativas, é preciso descrever a distribuição da variável. Isto é, dividir faixar de valores e, pela frequência de cada faixa, observar onde os resultados estão concentrados e dispersos.

A forma clássica de se descrever uma distribuição é usando um tipo de gráfico chamado histograma. Porém analisar cada faixa de valores, mesmo com um histograma, dá muito trabalho, e quando se quer comparar vários grupos a coisa fica bem mais complicada.

Por isso se usa medidas que descrevem a distribuição de forma simples, facilitando a análise. Elas são chamadas medidas de Posição e Dispersão.


Medidas de posição, também chamadas de medias de tendência central, indicam uma posição que centraliza a distribuição. As mais utilizadas são a Média, a Mediana, e a Moda.

Medidas de dispersão são valores que indicam se o grupo está muito disperso ou concentrado. As mais importantes são a Amplitude, a Variância e o Desvio Padrão.

Cada media tem característica e funções próprias, e algumas inclusive só podem ser usadas em situações específicas.

A média é soma de todos os resultados dividida pela sua quantidade. Ela representa um ponto de equilíbrio dos valores, e, quando usada corretamente, mostra onde os resultados estão concentrados.

A mediana é o valor que divide o grupo em duas metades. Quer dizer que metade dos resultados vão ser menores que a mediana, e a outra metade vai ser maior.

A moda é o resultado, ou faixa de resultados, que tem maior frequência. A distribuição pode ter mais de uma moda, ou nenhuma. Algumas distribuições têm o que se chama de “máximas locais”, que são picos de frequência local, mas que não são a maior do grupo. Esses picos locais também podem ser chamados de modas.

A amplitude é a diferença entre o maior e o menor valor do grupo. Se o grupo é muito disperso, a amplitude deve ser grande, se o grupo é muito concentrado, ela vai ser pequena. Outra forma de representar a amplitude é mostrando quais são esses valores (o maior e o menor), indicando então quais são os limites do grupo.

A variância é uma medida que indica o quão disperso é o grupo em relação à sua média. Porém ela não costuma ser utilizada, porque quando calculada, sua unidade é o quadrado da unidade original, e ter uma medida que varia exponencialmente complica a análise. A solução para isso é tirar a sua raiz quadrada, e a raiz quadrada da variância é o Desvio padrão.

O desvio padrão é o indicador de dispersão usado junto com a média. Quanto maior o desvio padrão, mas disperso é o grupo, e vice-versa.


A mediana pode ser usada em qualquer situação, mas sua maior utilidade é quando a distribuição é assimétrica, e pode ser acompanhada da amplitude ou os limites do grupo. Ela separa o grupo ao meio, então 50% dos resultados são menores que ela, e os outros 50% são maiores. Quer dizer que se a mediana for mais próxima de um dos limites, essa faixa está mais concentrada que a oposta. Ela é muitas vezes utilizada junto com quatis, que são um tipo de separatrizes (tema de outro vídeo).

A moda é um bom indicador quando o grupo tem uma distribuição assimétrica, e principalmente quando tem vários picos de frequência, pois as outras medidas não conseguem representa-los. Além disso, a moda também pode ser utilizada com variáveis qualitativas, indicando a categoria, ou categorias, de maior frequência.

A média deve sempre ser acompanhada do desvio padrão, e eles só podem ser usados quando o grupo segue um tipo específico, porém muito comum, de distribuição, chamada de Distribuição normal. Esse tipo de distribuição é caracterizado por uma curva simétrica, que tem seu traçado definido pela média e o desvio padrão. Por isso, quando o grupo segue uma distribuição normal esta é a melhor forma de representa-lo.

A média indica a posição do pico da curva, enquanto o desvio padrão indica o quão dispersa é em relação à média, de forma que cerca de 68% dos resultados vão estar a 1 desvio padrão de distância da média, para mais ou para menos.

A distribuição normal tem um papel muito importante na estatística, é preciso compreender bem do que se trata. Por isso, ela vai ser o próximo tema.

Obrigado, e até mais!

Comentários