Erros Aleatórios e Sistemáticos - Bioestatística #6





Sempre que se tenta medir qualquer coisa, existe um erro, seja usando um termômetro, uma balança, um questionário, lendo um prontuário, executando um exame físico, ou apenas observando.

Mas não quer dizer que “houve um engano” ou que “algo deu errado”. Na estatística o erro significa a diferença entre o valor real e o resultado, e essa diferença sempre vai existir, seja grande ou pequena.

Porém o tamanho dessa diferença é desconhecido, por que não se conhece o valor real do que está sendo medido (se fosse conhecido não seria necessário medir). Então esse erro pode ou não comprometer seus resultados e interpretações. E por isso é fundamental entender suas causas e características, para o planejamento da pesquisa e interpretação dos resultados.

Existem basicamente dois tipos de erros, o erro aleatório e o erro sistemático.

Os erros aleatórios interferem em cada medida individualmente (de forma aleatória). Quer dizer que a cada nova medida o resultado é deslocado em uma direção e com intensidade diferentes, então o resultado vai variar em torno do valor real.



Já os erros sistemáticos fazem com que todos os resultados sejam deslocados em conjunto, gerando um tendenciosidade (viés). Agora a variação dos resultados não ocorre ao redor do valor real.


Erros aleatórios são causados por fatores que não podem ser eliminados, talvez controlados, mas nunca eliminados. São fatores de causa desconhecida, que mudam constantemente ou que são probabilísticos por natureza. É como jogar um dado, uma moeda, ou selecionar uma amostra aleatória de uma população. 
 


Apesar de não ser possível eliminar suas casas, é possível minimizar sua interferência ao usar um equipamento mais preciso ou uma amostra maior. Além disso, seu tamanho pode ser estimado através de medidas de precisão, como o intervalo de confiança ou uma margem de erro, que estimam uma probabilidade do valor real estar em uma determinada faixa ao redor do resultado.


Erros sistemáticos costumam tem uma causa identificável: um problema no equipamento, interferência do ambiente ou amostra não aleatória. É como jogar um dado viciado, que tende a cair mais para um lado do que para os demais, causando uma tendenciosidade.


São muitas vezes causados por fatores relacionados ao próprio método usado, e podem ser evitados. Pode-se verificar se os equipamentos estão em boas condições, controlar variáveis ambientais, cegar um ensaio clínico, ou mesmo garantir que a amostra vai ser selecionada de forma aleatória.

Mas note que nem sempre é possível eliminar sua causa, pois pode fazer parte da própria natureza do experimento. Imagine um estudo sobre os efeitos de uma técnica cirúrgica, não há como cegar o cirurgião, ele precisa saber qual procedimento irá realizar, e também não há como ter um grupo placebo.

Quando os resultados estão sobre o efeito de tendenciosidade (vieses) não há como estimar o tamanho do erro com medidas de precisão, pois os resultados não estão variando em tordo do valor real. Logo, o tamanho do erro é completamente desconhecido! Em algumas situações isso pode não ter muita importância, em outras pode comprometer toda a validade da pesquisa. Mas não há nada em específico que diga o tamanho do problema, é uma questão de interpretação (sua e de quem for ler e avaliar seu trabalho).


Terminar a pesquisa e só então perceber que seus dados estão sobre efeito de vieses, ou que tem uma margem de erro enorme, é uma situação muito complicada. Não dá para superestimar a importância fazer um bom planejamento.

Uma fonte bastante comum de erros, tanto aleatórios como sistemáticos, costuma ser no uso amostras de população. O tamanho da amostra, e os métodos de seleção, costumam causar vários problemas em pesquisas.

Então, da próxima vez vou falar sobre amostras e populações.
Obrigado e até mais!


Comentários