Quartis e Separatrizes - Bioestatística #5
Separatrizes
dividem um grupo de resultados em faixas com a mesma quantidade de valores.
O quartil é um
tipo de separatriz, que divide o grupo em quatro. Então se tivermos um
grupo de 20 resultados, cada quartil vai ter 5.
Os limites de cada quartil são chamados de Q1, Q2, Q3 e Q4. E assim
temos quatro faixas com a mesma frequência.
Tente visualizar dessa forma, os resultados são colocados
em ordem, do menor para o maior, em uma reta, que vai de 0 a 100%.
Nesta reta, 0% representa o menor valor, porque nenhum outro é menor que
ele, e 100% o maior, porque todos os outros são menores que ele (similar
à frequência acumulada).
Para dividir o grupo em quatro partes com a mesma
quantidade, cada parte deve ter 25% dos valores. Os limites vão estar em 25%,
que é o Q1, em 50% que é o Q2, em 75%, que é o Q3, e 100% que é o Q4.
Dessa mesma forma, poderia se dividir o grupo em quintis, 5 grupos, cada um com 20%
da frequência total, ou decis, 10
grupos, cada um com 10% dos valores.
Outra forma de separatriz são os percentis, que dividem o grupo em sua respectiva faixa. Por
exemplo, o percentil de 80% é o valor que é maior que 80% e menor que 20% dos
resultados. Então pode-se dizer que o Q1 é o mesmo que o percentil de 25%, e
assim por diante.
O percentil 50%, que é o Q2, divide o grupo em duas metades,
uma menor que ele e outra maior. Se isso te soa familiar, é porque você está
lembrando da mediana. E é isso mesmo, o percentil 50%, o Q2 e a mediana são
a mesma coisa.
Os cálculos para encontrar os quartis ou percentis na
verdade não são muito complicados. Porem existem formas diferentes de se fazer
a conta, que dão resultados diferentes, e não existe um consenso entre os
estatísticos sobre a melhor forma....
De qualquer modo, como essa aula não é para estudantes de
estatística, eu não vou ensinar a fazer a conta “a mão”, mas vou mostrar como
se encontra percentis usando o Excel, que é um programa acessível à maioria.
- Primeiro, coloque seu grupo de
resultados em uma coluna qualquer.
- Escolha a célula que preferir,
e use a seguinte função:
=PERCENTIL.EXC(grupo; percentil)
*após o “(“, clique e arraste
para selecionar seu grupo inteiro.
*depois coloque um “;”, e defina
o percentil que desejar.
*se quiser o percentil de 75%, que
é o Q3, será 0,75, por exemplo.
**essa função só funciona no Excel 2010 ou mais recente.
**não
recomendo usar a função antiga “=PERCENTIL” ou “PERCENTIL.INC”.
***A função com o “.EXC” é mais precisa, porém dá erro ("#NÚM!")
quando se procura percentis extremos (P0 ou P100).
***Para encontrar o maior e o
menor valor do grupo, basta usar as funções “=MAIOR(grupo; 1)” ou
“=MENOR(grupo; 1)”
Agora use este grupo de valores e tente encontrar os quatis:
66
|
60
|
64
|
65
|
69
|
47
|
63
|
77
|
57
|
72
|
83
|
67
|
66
|
61
|
54
|
As separatrizes podem ser usadas de várias formas. O mais
comum, é usar os quartis para descrever a distribuição de um grupo. Isso
é feito com um gráfico chamado box
plot, ou gráfico de caixas.
Cada parte desse gráfico
representa um quartil. O traço inferior, sai do Q1 e vai até o menor valor. A
divisória no meio é a mediana. E o traço superior sai do Q3 e vai até o maior
valor.
Cada faixa do gráfico tem a
mesma quantidade de resultados, ¼ do total em cada. Isso quer dizer que em
uma faixa menor, eles vão estar mais concentrados, e em faixas maiores vão
estar mais dispersos.
A faixa entre o Q1 e Q3 se chama intervalo
interquartílico, para saber seu valor, basta calcular a diferença entre Q1
e Q3.
O box plot é um gráfico muito
usado quando o grupo não segue uma distribuição normal, porque representa bem
qualquer tipo de distribuição.
Percentis podem ser usados para encontrar percentuais de
interesse.
Se quiser saber o percentual de
alunos que tirou nota abaixo de 7,0 pontos em uma prova, é só procurar o
percentil correspondente a essa nota. Ou, se for para separar do resto os 10%
que tiraram as maiores notas, é só procurar o percentil de 90%.
Também pode se usar as separatrizes para dividir o grupo
em subgrupos.
Por exemplo, você pode encontrar
os de idade, e fazer comparações entre cada quartil para busca de diferenças
entre os mais jovens e mais velhos.
O intervalo interquartílico pode ser usado para identificar
outliers.
Outliers são resultados isolados que diferem totalmente do padrão
do resto do grupo, e por isso podem interferir em seus resultados. E uma das
várias formas de identifica-los é usando o intervalo interquartil.
É definido um limite de 1,5*intervalo
interquartil de distância do Q1 e do Q3, e todos os resultados além desse
limite são considerados outliers.
Porém a é importante saber que exclusão
ou não de outliers do grupo é uma
questão bem controversa.
O outliers são um
tipo são um tipo de erro, mas isso não quer dizer que algo deu errado no
trabalho, nem que tenha havido um engano. Na estatística, “erro” tem um
significado diferente. Então esse será o próximo tema.
Obrigado, e até mais!
Não acredito! Tinha tudo escrito. E eu copiando e desenhando as suas aulas. Ainda bem que descobri no começo. Obrigada
ResponderExcluir