Bioestatistica #3 - Posição e Dispersão
Quando se analisa variáveis quantitativas, é preciso descrever
a distribuição da variável. Isto é, dividir faixar de valores e, pela
frequência de cada faixa, observar onde os resultados estão concentrados e dispersos.
A forma clássica de se descrever uma distribuição é usando
um tipo de gráfico chamado histograma. Porém analisar cada faixa de valores,
mesmo com um histograma, dá muito trabalho, e quando se quer comparar vários
grupos a coisa fica bem mais complicada.
Por isso se usa medidas que descrevem a distribuição de
forma simples, facilitando a análise. Elas são chamadas medidas de Posição e
Dispersão.
Medidas de posição,
também chamadas de medias de tendência central, indicam uma posição que centraliza
a distribuição. As mais utilizadas são a Média, a Mediana, e
a Moda.
Medidas de dispersão
são valores que indicam se o grupo está muito disperso ou concentrado. As
mais importantes são a Amplitude, a Variância e o Desvio
Padrão.
Cada media tem característica e funções próprias, e algumas
inclusive só podem ser usadas em situações específicas.
A média é soma de todos os resultados dividida pela sua quantidade. Ela
representa um ponto de equilíbrio dos valores, e, quando usada corretamente,
mostra onde os resultados estão concentrados.
A mediana é o valor que divide o grupo em duas metades. Quer dizer
que metade dos resultados vão ser menores que a mediana, e a outra metade
vai ser maior.
A moda é o resultado, ou faixa de resultados, que tem maior
frequência. A distribuição pode ter mais de uma moda, ou nenhuma. Algumas
distribuições têm o que se chama de “máximas locais”, que são picos de
frequência local, mas que não são a maior do grupo. Esses picos locais também
podem ser chamados de modas.
A amplitude é a diferença entre o maior e o menor valor do grupo. Se
o grupo é muito disperso, a amplitude deve ser grande, se o grupo é muito concentrado,
ela vai ser pequena. Outra forma de representar a amplitude é mostrando quais
são esses valores (o maior e o menor), indicando então quais são os limites do
grupo.
A variância é uma medida que indica o quão disperso é o grupo em
relação à sua média. Porém ela não costuma ser utilizada, porque quando
calculada, sua unidade é o quadrado da unidade original, e ter uma
medida que varia exponencialmente complica a análise. A solução para isso é
tirar a sua raiz quadrada, e a raiz quadrada da variância é o Desvio padrão.
O desvio padrão é o indicador de dispersão usado junto com a média. Quanto
maior o desvio padrão, mas disperso é o grupo, e vice-versa.
A mediana pode ser usada em qualquer situação, mas sua maior
utilidade é quando a distribuição é assimétrica, e pode ser acompanhada da
amplitude ou os limites do grupo. Ela separa o grupo ao meio, então 50% dos
resultados são menores que ela, e os outros 50% são maiores. Quer dizer que se
a mediana for mais próxima de um dos limites, essa faixa está mais concentrada
que a oposta. Ela é muitas vezes utilizada junto com quatis, que são um
tipo de separatrizes (tema de outro vídeo).
A moda é um bom indicador quando o grupo tem uma
distribuição assimétrica, e principalmente quando tem vários picos de
frequência, pois as outras medidas não conseguem representa-los. Além disso, a
moda também pode ser utilizada com variáveis qualitativas, indicando a
categoria, ou categorias, de maior frequência.
A média deve sempre ser acompanhada do desvio padrão, e eles
só podem ser usados quando o grupo segue um tipo específico, porém muito comum,
de distribuição, chamada de Distribuição
normal. Esse tipo de distribuição é caracterizado por uma curva simétrica,
que tem seu traçado definido pela média e o desvio padrão. Por isso, quando o
grupo segue uma distribuição normal esta é a melhor forma de representa-lo.
A média indica a posição do pico da curva, enquanto o desvio
padrão indica o quão dispersa é em relação à média, de forma que cerca de 68%
dos resultados vão estar a 1 desvio padrão de distância da média, para mais ou
para menos.
A distribuição normal tem um papel muito importante na
estatística, é preciso compreender bem do que se trata. Por isso, ela vai ser o
próximo tema.
Obrigado, e até mais!
Comentários
Postar um comentário