Quartis e Separatrizes - Bioestatística #5




Separatrizes dividem um grupo de resultados em faixas com a mesma quantidade de valores.

O quartil é um tipo de separatriz, que divide o grupo em quatro. Então se tivermos um grupo de 20 resultados, cada quartil vai ter 5.  Os limites de cada quartil são chamados de Q1, Q2, Q3 e Q4. E assim temos quatro faixas com a mesma frequência.


Tente visualizar dessa forma, os resultados são colocados em ordem, do menor para o maior, em uma reta, que vai de 0 a 100%. Nesta reta, 0% representa o menor valor, porque nenhum outro é menor que ele, e 100% o maior, porque todos os outros são menores que ele (similar à frequência acumulada).

Para dividir o grupo em quatro partes com a mesma quantidade, cada parte deve ter 25% dos valores. Os limites vão estar em 25%, que é o Q1, em 50% que é o Q2, em 75%, que é o Q3, e 100% que é o Q4.




Dessa mesma forma, poderia se dividir o grupo em quintis, 5 grupos, cada um com 20% da frequência total, ou decis, 10 grupos, cada um com 10% dos valores.



Outra forma de separatriz são os percentis, que dividem o grupo em sua respectiva faixa. Por exemplo, o percentil de 80% é o valor que é maior que 80% e menor que 20% dos resultados. Então pode-se dizer que o Q1 é o mesmo que o percentil de 25%, e assim por diante.


O percentil 50%, que é o Q2, divide o grupo em duas metades, uma menor que ele e outra maior. Se isso te soa familiar, é porque você está lembrando da mediana. E é isso mesmo, o percentil 50%, o Q2 e a mediana são a mesma coisa.



Os cálculos para encontrar os quartis ou percentis na verdade não são muito complicados. Porem existem formas diferentes de se fazer a conta, que dão resultados diferentes, e não existe um consenso entre os estatísticos sobre a melhor forma....

De qualquer modo, como essa aula não é para estudantes de estatística, eu não vou ensinar a fazer a conta “a mão”, mas vou mostrar como se encontra percentis usando o Excel, que é um programa acessível à maioria.

- Primeiro, coloque seu grupo de resultados em uma coluna qualquer.
- Escolha a célula que preferir, e use a seguinte função:

          =PERCENTIL.EXC(grupo; percentil)

*após o “(“, clique e arraste para selecionar seu grupo inteiro.
*depois coloque um “;”, e defina o percentil que desejar.
*se quiser o percentil de 75%, que é o Q3, será 0,75, por exemplo.

**essa função só funciona no Excel 2010 ou mais recente.
**não recomendo usar a função antiga “=PERCENTIL” ou “PERCENTIL.INC”.


***A função com o “.EXC” é mais precisa, porém dá erro ("#NÚM!") quando se procura percentis extremos (P0 ou P100).
***Para encontrar o maior e o menor valor do grupo, basta usar as funções “=MAIOR(grupo; 1)” ou “=MENOR(grupo; 1)

Agora use este grupo de valores e tente encontrar os quatis:

66
60
64
65
69
47
63
77
57
72
83
67
66
61
54


As separatrizes podem ser usadas de várias formas. O mais comum, é usar os quartis para descrever a distribuição de um grupo. Isso é feito com um gráfico chamado box plot, ou gráfico de caixas.


Cada parte desse gráfico representa um quartil. O traço inferior, sai do Q1 e vai até o menor valor. A divisória no meio é a mediana. E o traço superior sai do Q3 e vai até o maior valor.

Cada faixa do gráfico tem a mesma quantidade de resultados, ¼ do total em cada. Isso quer dizer que em uma faixa menor, eles vão estar mais concentrados, e em faixas maiores vão estar mais dispersos.

A faixa entre o Q1 e Q3 se chama intervalo interquartílico, para saber seu valor, basta calcular a diferença entre Q1 e Q3.

O box plot é um gráfico muito usado quando o grupo não segue uma distribuição normal, porque representa bem qualquer tipo de distribuição.

Percentis podem ser usados para encontrar percentuais de interesse.

Se quiser saber o percentual de alunos que tirou nota abaixo de 7,0 pontos em uma prova, é só procurar o percentil correspondente a essa nota. Ou, se for para separar do resto os 10% que tiraram as maiores notas, é só procurar o percentil de 90%.

Também pode se usar as separatrizes para dividir o grupo em subgrupos.
Por exemplo, você pode encontrar os de idade, e fazer comparações entre cada quartil para busca de diferenças entre os mais jovens e mais velhos.

O intervalo interquartílico pode ser usado para identificar outliers.
Outliers são resultados isolados que diferem totalmente do padrão do resto do grupo, e por isso podem interferir em seus resultados. E uma das várias formas de identifica-los é usando o intervalo interquartil.

É definido um limite de 1,5*intervalo interquartil de distância do Q1 e do Q3, e todos os resultados além desse limite são considerados outliers.

Porém a é importante saber que exclusão ou não de outliers do grupo é uma questão bem controversa.


O outliers são um tipo são um tipo de erro, mas isso não quer dizer que algo deu errado no trabalho, nem que tenha havido um engano. Na estatística, “erro” tem um significado diferente. Então esse será o próximo tema.

Obrigado, e até mais!

Comentários

  1. Não acredito! Tinha tudo escrito. E eu copiando e desenhando as suas aulas. Ainda bem que descobri no começo. Obrigada

    ResponderExcluir

Postar um comentário