Dúvida - Regressão linear com dados não paramétricos
2 participantes
Página 1 de 1
Dúvida - Regressão linear com dados não paramétricos
Boa tarde pessoal,
Estou precisando fazer uma regressão linear simples, no entanto minha variável resposta não tem distribuição normal, nem fazendo a transformação para log...Qual seria a alternativa para estes dados? Existe? Não estou encontrando a aula que fala disso, pois nas aulas de regressão trata de dados que atendem os pressupostos...
Agradeço!
Estou precisando fazer uma regressão linear simples, no entanto minha variável resposta não tem distribuição normal, nem fazendo a transformação para log...Qual seria a alternativa para estes dados? Existe? Não estou encontrando a aula que fala disso, pois nas aulas de regressão trata de dados que atendem os pressupostos...
Agradeço!
sibenedet- Mensagens : 6
Data de inscrição : 05/01/2016
Re: Dúvida - Regressão linear com dados não paramétricos
Olá!
Então, vamos lá.
Você conferiu os resíduos da regressão? Lembre-se de que em todos os modelos lineares (como regressão e anova), o pressuposto é de que os resíduos sigam a distribuição normal. Você não precisa se preocupar com a normalidade dos dados brutos, certo?
Agora, é bem comum que com dados brutos com desvios muito grandes da normalidade os resíduos acabem sedo problemáticos também...
Então, se os resíduos estiverem ruins e a transformação não ajudar, há dois caminhos básicos a serem seguidos (que são explorados no curso). O primeiro seria partir para testes não paramétricos. No caso, a coisa mais próxima de uma regressão seria uma correlação não paramétrica, como a correlação de spearman.
No R, é simples:
Note que na correlação a relação de causa e efeito não existe no teste, então não usamos o '~' para relacionar as variáveis, e elas podem vir em qualquer ordem.
Já o outro caminho seria partir para os GLMs, e tentar encontrar uma distribuição de erros que seja bem compatível com os seus dados. Existem algumas relações bem conhecidas, como usar poisson para dados de abundância ou binomial negativa para dados de abundância com variação muito grande entre o menor e os maiores valores.
Se quiser seguir este caminho, dê uma espiada no bônus sobre os GLMs.
Então, vamos lá.
Você conferiu os resíduos da regressão? Lembre-se de que em todos os modelos lineares (como regressão e anova), o pressuposto é de que os resíduos sigam a distribuição normal. Você não precisa se preocupar com a normalidade dos dados brutos, certo?
Agora, é bem comum que com dados brutos com desvios muito grandes da normalidade os resíduos acabem sedo problemáticos também...
Então, se os resíduos estiverem ruins e a transformação não ajudar, há dois caminhos básicos a serem seguidos (que são explorados no curso). O primeiro seria partir para testes não paramétricos. No caso, a coisa mais próxima de uma regressão seria uma correlação não paramétrica, como a correlação de spearman.
No R, é simples:
- Código:
cor.test(var1, var2, method="spearman")
Note que na correlação a relação de causa e efeito não existe no teste, então não usamos o '~' para relacionar as variáveis, e elas podem vir em qualquer ordem.
Já o outro caminho seria partir para os GLMs, e tentar encontrar uma distribuição de erros que seja bem compatível com os seus dados. Existem algumas relações bem conhecidas, como usar poisson para dados de abundância ou binomial negativa para dados de abundância com variação muito grande entre o menor e os maiores valores.
Se quiser seguir este caminho, dê uma espiada no bônus sobre os GLMs.
Re: Dúvida - Regressão linear com dados não paramétricos
Grata Marcos! É isso mesmo, me expressei mal são os resíduos que não seguem distribuição normal. Já estou acessando as aulas de GLMs, mas não consigo baixar o pacote RT4Bio, parece que está indisponível para a versao do R 3.2.1, eu uso o R Studio....
sibenedet- Mensagens : 6
Data de inscrição : 05/01/2016
Re: Dúvida - Regressão linear com dados não paramétricos
sibenedet escreveu:Grata Marcos! É isso mesmo, me expressei mal são os resíduos que não seguem distribuição normal. Já estou acessando as aulas de GLMs, mas não consigo baixar o pacote RT4Bio, parece que está indisponível para a versao do R 3.2.1, eu uso o R Studio....
Vi o seu outro tópico, e vou responder por lá, ok? Deve ter uma maneira automatizada de baixar o pacote, vou investigar e depois te respondo lá.
Tópicos semelhantes
» Apresentaçaõ de dados paramétricos e não paramétricos
» Dúvida sobre dados binários
» Dúvida Turma 4.1Como visualizo a série de dados num gráfico feito no R. ?
» Transformacao dos dados, Log, Arcoseno, raiz quadrada & Re transformação de dados-Back-transformation
» Mais de uma variável explicativa no modelo de regressão logística
» Dúvida sobre dados binários
» Dúvida Turma 4.1Como visualizo a série de dados num gráfico feito no R. ?
» Transformacao dos dados, Log, Arcoseno, raiz quadrada & Re transformação de dados-Back-transformation
» Mais de uma variável explicativa no modelo de regressão logística
Página 1 de 1
Permissões neste sub-fórum
Não podes responder a tópicos
|
|