Escolha distribuição GLM
2 participantes
Página 1 de 1
Escolha distribuição GLM
Oi, pessoal. Boa noite.
Estou tentando rodar um glm no R, mas estou enfrentando alguns problemas.
Tenho a variável "ndvi" como resposta e porcentagem de floresta, densidade de borda (dada em metros), precipitação e tipo de solo como variáveis preditoras.
Como o NDVI vai de 0.1 a 1 estou usando a distribuição binomial...só que ela não rodou (não entendi porque) então rodei uma quasibinomial...O mais estranho é que com o mesmo conjunto de dados rodei em outras distribuições e o modelo não só rodou como também deu significativo como na quasibinomial. Queria saber se isso é comum, se não, o que preciso fazer? minha experiência com estatística é muito modesta. Lembrando que eu não transformei as variáveis.
Outra coisa, tentei plotar os dados e não fica no gráfico de maneira correta:
Alguém poderia me tirar essas dúvidas?
Um abraço,
Jakelyne.
Estou tentando rodar um glm no R, mas estou enfrentando alguns problemas.
Tenho a variável "ndvi" como resposta e porcentagem de floresta, densidade de borda (dada em metros), precipitação e tipo de solo como variáveis preditoras.
Como o NDVI vai de 0.1 a 1 estou usando a distribuição binomial...só que ela não rodou (não entendi porque) então rodei uma quasibinomial...O mais estranho é que com o mesmo conjunto de dados rodei em outras distribuições e o modelo não só rodou como também deu significativo como na quasibinomial. Queria saber se isso é comum, se não, o que preciso fazer? minha experiência com estatística é muito modesta. Lembrando que eu não transformei as variáveis.
Outra coisa, tentei plotar os dados e não fica no gráfico de maneira correta:
Alguém poderia me tirar essas dúvidas?
Um abraço,
Jakelyne.
Jakelyne- Mensagens : 7
Data de inscrição : 20/02/2017
Re: Escolha distribuição GLM
Olá, Jakelyne, tudo bem?
Não tenho muita experiência com a distribuição binomial, exceto nos casos mais simples (como numa regressão logística). Mas tenho a impressão que a confusão pode ter sido conceitual: a distribuição binomial é discreta, e a sua variável resposta, apesar de variar entre zero e um, é contínua, já que você pode ter diversos valores entre 0 e 1. Acho que o problema está aí, ok?
Abraços!
Não tenho muita experiência com a distribuição binomial, exceto nos casos mais simples (como numa regressão logística). Mas tenho a impressão que a confusão pode ter sido conceitual: a distribuição binomial é discreta, e a sua variável resposta, apesar de variar entre zero e um, é contínua, já que você pode ter diversos valores entre 0 e 1. Acho que o problema está aí, ok?
Abraços!
Re: Escolha distribuição GLM
Oi, Marcos. Tudo certo.
Agora estou com outras dúvidas
1) tenho que fazer seleção de modelos, em cada um com uma variável resposta. Nas variáveis explicativas a maioria é quantitativa, entretanto também tenho uma variável categórica com alguns NA's, e quando vou rodar fica dando erro.
2) Se na variável categórica eu colocar número e trocar o NA por 0 isso pode dar algum erro?
3) tô tentando aprender a fazer seleção de modelos com algumas pessoas, entretanto, algumas testam a normalidade e homocedasticidade, já outras seguem direto pra fazer a seleção dos modelos, qual a maneira mais correta?
Grata,
Jakelyne.
Agora estou com outras dúvidas
1) tenho que fazer seleção de modelos, em cada um com uma variável resposta. Nas variáveis explicativas a maioria é quantitativa, entretanto também tenho uma variável categórica com alguns NA's, e quando vou rodar fica dando erro.
2) Se na variável categórica eu colocar número e trocar o NA por 0 isso pode dar algum erro?
3) tô tentando aprender a fazer seleção de modelos com algumas pessoas, entretanto, algumas testam a normalidade e homocedasticidade, já outras seguem direto pra fazer a seleção dos modelos, qual a maneira mais correta?
Grata,
Jakelyne.
Jakelyne- Mensagens : 7
Data de inscrição : 20/02/2017
Re: Escolha distribuição GLM
Vamos lá!
1 - Alguns modelos estatísticos permitem dados ausentes, outros não, de forma que nem sempre um modelo irá rodar se eles existirem. A alternativa é rodar sem as linhas com dados ausentes. A maioria das funções do R aceitam um argumento chamado na.rm=T, que ignora todas as linhas que contém NAs.
2 - Isso muda tudo, jamais faça isso. Zero significa zero, NA significa uma medida que não foi feita, então se trocar os zeros por NAs você está atribuindo valores, o que não faz sentido prático. O resultado, então, não será válido.
3 - A seleção de modelos faz sentido quando você usa modelos que previamente acha que podem funcionar com os dados. Se você tem um modelo com problemas de pressupostos, então ele não deveria ser usado, com ou sem seleção de modelos, ok? Sempre lide com os pressupostos primeiro.
1 - Alguns modelos estatísticos permitem dados ausentes, outros não, de forma que nem sempre um modelo irá rodar se eles existirem. A alternativa é rodar sem as linhas com dados ausentes. A maioria das funções do R aceitam um argumento chamado na.rm=T, que ignora todas as linhas que contém NAs.
2 - Isso muda tudo, jamais faça isso. Zero significa zero, NA significa uma medida que não foi feita, então se trocar os zeros por NAs você está atribuindo valores, o que não faz sentido prático. O resultado, então, não será válido.
3 - A seleção de modelos faz sentido quando você usa modelos que previamente acha que podem funcionar com os dados. Se você tem um modelo com problemas de pressupostos, então ele não deveria ser usado, com ou sem seleção de modelos, ok? Sempre lide com os pressupostos primeiro.
Re: Escolha distribuição GLM
Entendi Marcos, valeu.
Jakelyne- Mensagens : 7
Data de inscrição : 20/02/2017
Re: Escolha distribuição GLM
Pessoal, uma dúvida. Estou tentando rodar um glm, mas me veio a questão: ele aceita variáveis contínuas e categóricas? Tenho três variáveis explicativas quantitativas e uma categórica. Me disseram que u modelo misto seria mais apropriado. Alguém me sugere algo?
Jakelyne- Mensagens : 7
Data de inscrição : 20/02/2017
Re: Escolha distribuição GLM
Oi, Jakelyne!
Bem atrasado aqui na resposta, desculpe... Estou aproveitando o embalo da nova edição, e vou aproveitar para ver perguntas que ficaram pra trás entre uma edição e outra. Espero que ainda seja de alguma ajuda.
No caso das variáveis explicativas, não há nenhuma restrição neste sentido, sei modelo pode ter variáveis explicativas e categóricas - especialmente se cada uma delas forem realmente variáveis explicativas do modelo. Você pode precisar passar a pensar em modelos mistos cada tenha variáveis que não são parte da dua explicação mas que precisam ser levadas em consideração no modelo por terem alguma influência possível na variável resposta.
Bem atrasado aqui na resposta, desculpe... Estou aproveitando o embalo da nova edição, e vou aproveitar para ver perguntas que ficaram pra trás entre uma edição e outra. Espero que ainda seja de alguma ajuda.
No caso das variáveis explicativas, não há nenhuma restrição neste sentido, sei modelo pode ter variáveis explicativas e categóricas - especialmente se cada uma delas forem realmente variáveis explicativas do modelo. Você pode precisar passar a pensar em modelos mistos cada tenha variáveis que não são parte da dua explicação mas que precisam ser levadas em consideração no modelo por terem alguma influência possível na variável resposta.
Re: Escolha distribuição GLM
Obrigada Marcos, boa sorte na nova edição.
Jakelyne- Mensagens : 7
Data de inscrição : 20/02/2017
Tópicos semelhantes
» Escolhendo a Distribuição GLM
» Distribuição de espécie e Dados do GBIF
» Modelagem de distribuição (Pontos de ocorrência)
» Método de escolha e avaliação de modelos
» Ajuda - Escolha do teste estatístico
» Distribuição de espécie e Dados do GBIF
» Modelagem de distribuição (Pontos de ocorrência)
» Método de escolha e avaliação de modelos
» Ajuda - Escolha do teste estatístico
Página 1 de 1
Permissões neste sub-fórum
Não podes responder a tópicos
|
|