Cean | Centro de Estudos "Ayres Netto"

CEAN - Projetos > Destaques
Destaques

< Voltar

Estatística sem Dor

Análise estatística – dos dados às conclusões


“Chamar o especialista em estatística depois que o experimento foi feito pode ser o mesmo que pedir para ele fazer um exame post-mortem. Talvez ele consiga dizer de que foi que o experimento morreu.”
Sir Ronald Aylmer Fisher.

Tal citação mostra a importância do cientista em conhecer a estatística e caminhar junto para a análise do trabalho. Ela começou a integrar os trabalhos posteriormente, no começo do século passado, onde inicialmente não era bem aceita e atualmente se tornou indispensável. A “estatística” e, consequentemente, sua análise, se inicia com uma pesquisa.

Pesquisa

Primeira grande questão: lógica da pesquisa. Esta se resume em 3 tópicos:

  1. Hipótese: depende da natureza da pergunta. É uma resposta a uma pergunta, mas que ainda não foi testada. Não é necessária em toda pesquisa, por exemplo: em uma pesquisa onde se busca a prevalência de uma doença em determinada população, não há necessidade de uma hipótese. E quando a hipótese não é levantada, estuda-se apenas uma variável descritiva (respondendo assim, perguntas como: “como é?”, “qual é?”,“o que é?”). Quando levantada a hipótese, estuda-se as relações entre variáveis, associações que apresentem ou não interferência.

    HIPÓTESE Não → Descritiva
    Sim Associação SEM interferência
    Associação COM interferência

    A estatística diz “como é” e testa a associação, mas não explicita se é com ou sem interferência. Por exemplo: um trabalho mostrou associação de pessoas que tinham cuidado com a saúde bucal, apresentavam menos problemas cardíacos. A associação entre cuidado com saúde bucal foi vista, entretanto não se conseguiu provar se havia ou não interferência.

  2. Associação: estuda a relação entre variáveis. Sabe-se que tem a associação, mas não sabe um é a causa do outro. Por exemplo: quando uma variável determina outras duas, sabe-se que existe associação entre elas, mas não significa que um efeito interfere no outro.

  3. Interferência: mecanismo nem sempre linear. É uma sequência de eventos que liga uma variável à outra. Variáveis podem ser dependentes ou independentes. Este terceiro ponto não é respondido pela estatística, que, como já dito anteriormente, diz “como é” e testa a hipótese, mas não diz se tem interferência.


Como a estatística pode ajudar?

Mostrar que existe associação e dizer o que é.
Tipos de análise estatística:

  • Análise visual descritiva: descrita pelo observador, possui menor aceitação devido à sua subjetividade. Visto que, para o cientista não vale a experiência individual, é necessário diminuir o subjetivo.

  • Análise de teste de hipótese: é uma comparação;
    comparação entre média e um valor fixo;
    Comparação entre médias;
    Correlação entre variáveis;
    Comparação entre freqüências (nº absoluto x nº absoluto);
    Correlação entre valores.

  • Hipótese:
    Paramétrica: trabalha com média.
    Não paramétrica: trabalha com mediana.


Como descrever?

Medidas de tendência central

  1. Média.

  2. Mediana: ponto que divide o valor central. Para calcular: escolha um conjunto de dados, ordene do menor ao maior valor. O valor central é = mediana. Se houver dois valores centrais (n = par), calcular a média entre eles.

  3. Moda: o que apresenta maior freqüência.


Distribuição dos dados


  1. Distribuição normal ou em sino: pode ser utilizado em qualquer variável. Média, mediana e moda estão no mesmo ponto ou muito próximas, geralmente é o ponto mais alto da curva no gráfico.

  2. Distribuição não normal: média, mediana e moda não se igualam. A curva não é regular. Nesses casos a mediana representa melhor que a média.


Medidas de Variabilidade


  • Desvio padrão: indica a “média” da distância dos valores em relação a média. Média sem variabilidade é uma medida sem significado.
    • Lembrando que o grau de liberdade é a raiz quadrada de “n-1” e o erro padrão da média é igual ao desvio padrão dividido pela raiz quadrada de “n”.


Estudo da Mediana


  • Quartil: indica a distribuição percentual dos dados.

  • Diz respeito à diferença de variabilidade entre as amostras, ou seja, em quanto a variabilidade em torno da média de dois grupos são diferentes ou semelhantes:

    Homocedasticidade: não há variação significativa entre uma amostra e outra. Teste prático:

    F= > variância (desvio padrão elevado ao quadrado)
    < variância

    Se, F<4, são homocedasticas
    Se, F>4, fazer correção no G.L.

    Heterocedasticidade: uma amostra varia mais do que a outra.


Como testar uma hipótese?


Hipótese é uma resposta a uma pergunta, mas que ainda não foi testada.

Modus Tollens


Exemplo:
Hipótese conseqüência 1: se correta, corrobora com a hipótese.
conseqüência 2: se estiver correta, também corrobora.
conseqüência 3: se não correta, não corrobora, nega a hipótese.


O valor de P


  • É a probabilidade da conclusão científica ter sido válida.

  • Varia de 0 a 1 (x 100 = 100%), se multiplicada por “100” vira percentual.

  • Aceita-se nível máximo de erro até 5%.

  • Indica a probabilidade do erro tipo 1 ocorrer:
    • Erro tipo 1: dizer que há efeito, quando ele não existe;
    • Erro tipo 2: dizer que não há efeito, quando ele existe;

  • Se há valor crítico, então não há uma tendência.

  • Se não há valor crítico, então se discorre sobre os valores de “p” obtido.

  • Se p=0,050 é um valor crítico.


Testes Robustos


  • São testes mais rígidos ou menos rígidos, dependendo do número de efeitos que se quer mostrar.

  • Um teste menos robusto mostra mais efeitos, assim como o mais robusto mostra menos efeitos.


Qual é o seu delineamento?


  • Caso haja dependência em algum momento, considera variável dependente.

  • Em cada tempo que se analisa os dados, considera-se como se fossem amostras diferentes, apesar de ser a mesma amostra.

  • Dado importante: quantas amostras estão se comparando.


Qual grupo estatístico usar?


  • Em geral, variável contínua tem distribuição normal.

  • Variável discreta (número inteiro), geralmente tem distribuição não normal.

  • Lembrando-se que pode existir transformação de distribuição não normal em normal.

  • Há dependência entre amostras? Sendo no mesmo indivíduo há dependência.


Escolha do teste


1º) Dividir se hipótese é paramétrica ou não.
2º) Comparar 2 ou mais de 2 médias ou medianas.
3º) Analisar se há dependência ou não (análise de variância).

T-dependente: paramétrico, compara duas amostras, dependente.
T-independente: compara duas amostras, paramétrico, independente.
Análise de variância: analisa mais de duas amostras, com ou sem dependência. Seria como vários testes “T” que acumulam os erros.


Aula escrita: Taryn Sayuri ,Gildiane de Melo Rangel, Adrienne Pratti Lucarelli, LiLian de Paiva Rodrigues

< Voltar