Dúvidas webnario do dia 08/12

Ver o tópico anterior Ver o tópico seguinte Ir em baixo

Dúvidas webnario do dia 08/12

Mensagem por Juliano Moraes em Seg Dez 05, 2016 12:01 pm

Olá pessoal e prof° Marcos,

Após essas 3 semanas intensas de aula e muita informação, trago aqui meu conjunto de dúvidas para o próximo webnario. Se os colegas quiserem sintam-se a vontade para responder também.

Como foi um módulo longo, tive muitas dúvidas, mas as principais são essas:

1 - Sobre normalidade e variâncias: Os dois níveis (ou no caso de uma regressão, as duas variáveis) precisam ser normais
ou se um não for normal já basta? Uma anova de 4 níveis por exemplo, se somente 1 nível não for normal já quebra os pressupostos?
A mesma pergunta pra variância. E no caso de 2 fatores?

2 - Sobre simetria: Na verdade o pressuposto da normalidade diz que os dados tem que ser normais, ou simétricos?
Por exemplo uma distribuição não normal, porém simétrica, bimodal ou de outro tipo, quebra o pressuposto?

3 - Sobre caudalidade: Ficou muito confuso na minha cabeça essa questão. Eu entendi o princípio dela de maneira rasa,
mas gostaria se possível que fosse explicada um pouco mais profundamente. Pois se eu coleto meus dados, faço um boxplot simples
(exploratório) e vejo que um dos níveis tem média superior, eu iria fazer o teste puxando pra caudalidade dele. Sendo assim,
pra mim ficou meio óbvio que é só fazer uma exploratória, ver qual lado da cauda está puxado, e fazer o teste com essa cauda.
Mas sei que tem mais coisa por trás. Pensando, cheguei na conclusão que tem a ver com a H0, mas não consegui saber o porque exatamente.


4 - Eu fiz um gráfico de dispersão com a função stripchart(), que ficou assim ("Score" e "Tipo" podem ser quaisquer outras variáveis):
stripchart(Score~Tipo, v=T, las=1, pch=16, at=c(1.3,1.7))
 abline(h=mean(Score), lty=2, lwd=1)  
   points(medias, col="red", pch="-", cex=3)

O problema é que o argumento "at" não funcionou na função points, e as marcas da média ficaram afastadas. Também, como aumenta-se a
largura do traço (já que a grossura é cex)?

5 - Para ANOVA com variâncias distintas, qual teste devemos usar? Kruskal-Wallys? Existem outros?

6 - Marcos, você colocou as fórmulas de "t" do pareado e do não pareado, mas se não me engano elas são as mesmas.
Pois não dá na mesma eu tirar a média de um, de outro, subtraí-los, ou tirar a diferença de cada par e tirar a média dessas diferenças?
Matematicamente o resultado é o mesmo. O erro padrão sim é diferente acredito, não?

7 - Sobre o Qui Quadrado, quando ele tem mais de 2 níveis, como descobrimos quais deles são significativos entre si? Existe algo análogo
a um Tukey pra ele?

8 - Regressão múltipla: Sobre as questões do + e *. Quando faço uma regressão linear simples, ele me volta o output dela, ok.
Quando faço uma regressão múltipla com o sinal de +, o output me volta o resultado da regressão descontando os resíduos, ou seja,
controlando a outra variável, é isso? E quando faço a regressão com o sinal de *, o resultado é individual é outro, porque?
E como fazemos os gráficos de parciais mostrando a causalidade da variável controlando outra?

Não sei se irá dar tempo de tirar todas elas no webnario, mas agradeço se elas forem sanadas por aqui mesmo se possível.

Abraços a tod@s!

Juliano Moraes

Mensagens : 4
Data de inscrição : 26/10/2016
Localização : São Paulo

Ver perfil do usuário

Voltar ao Topo Ir em baixo

Re: Dúvidas webnario do dia 08/12

Mensagem por Prof. Marcos em Qui Dez 15, 2016 10:19 am

Opa, demorei mas voltei aqui.

Pessoal, para quem não acompanhou, a maior parte das dúvidas do Juliano foram respondidas no webnário do dia 08-12, e a esta altura a gravação já está lá no portal. Eu vou comentar rapidamente algumas das dúvidas, e mais adiante vou partir para responder a dúvida 8, que eu deixei em aberto para responder por aqui, beleza?

Bora lá!

1 -
Então, nos modelos lineares (regressão, anova e seus parentes), o pressuposto é sempre da normalidade dos resíduos. Então basta verificá-los no objeto resultado$residuals.
Todos os modelo lineares do R geram o $residuals, então o procedimento vai ser sempre igual.
No caso das variâncias, o pressuposto é que elas são homogêneas, ou seja, equivalentes. Então o teste é um só na anova, não importa o número de fatores. Mas basta um dos níveis ter uma variância diferentona para o pressuposto ir por água abaixo...


2 -
O pressuposto, a rigor, é de normalidade. A simetria é uma das características importantes da distribuição normal, e uma que afeta muito a performance do teste se for violada. Os dados podem fugir um pouco da normalidade por diferentes "caminhos", e a simetria é normalmente considerada importante.


3 -
A questão é quase filosófica, eu diria. Tem a ver com a natureza básica dos testes estatísticos, e de como esperamos que eles funcionem na prática. Verificar a caudalidade de maneira visual seria violar a lógica básica do significado do nível de significância, então podemos dizer que é uma prática que iria contra as "regras do jogo". Este tipo de procedimento não tem um efeito real, isto é, os dados continuam os mesmos e tudo mais, mas viola a própria lógica de como os testes funcionam, ok?

Pessoal, estou na correria aqui, hehehe. Vou voltando e respondendo aos poucos cada questão, certo?

Abração!
avatar
Prof. Marcos

Mensagens : 164
Data de inscrição : 23/12/2015
Idade : 36
Localização : Maceió, AL

Ver perfil do usuário https://cantinhodor.wordpress.com/

Voltar ao Topo Ir em baixo

Ver o tópico anterior Ver o tópico seguinte Voltar ao Topo

- Tópicos similares

 
Permissão deste fórum:
Você não pode responder aos tópicos neste fórum