Dúvidas PCA
2 participantes
Página 1 de 1
Dúvidas PCA
Oi Prof Marcos, tudo bem?
Sei que vamos estudar PCA em breve no curso, mas queria saber se você pode me ajudar, pois preciso fazer essa análise urgente. Eu tenho dados de habitat de parcelas que fiz em locais onde registrei ou não (presença e ausência) uma espécie de ave, quero saber quais variáves podem influenciar a presença.
Eu sei que existem diversos pacotes no R que fazem essa análise, mas estava seguindo os passos desse tutorial: r-bloggers.com/computing-and-visualizing-pca-in-r/). Vi não só nesse, mas em muitos outros que é comum fazer a logaritimização dos dados antes de rodar a PCA, o problema é que eu parei nesse passo, porque depois que eu transformei os dados alguns retornaram como -infi, um exemplo de variável em que isso aconteceu foi número de palmeiras na parcelas, em alguns casos foi 0 e aí depois de transformados os dados eu tenho esses valores na minha planilha e o erro é esse: Error in svd(x, nu = 0) : infinite or missing values in 'x'. Você sabe como eu posso contornar isso?
Mais um dúvida, no exemplo do tutorial o autor usa a variável categórica "espécie"para visualizar os PCs, no meu caso essa variável seria a presença ou ausência da espécie de ave?
Muito obrigada,
Fernanda.
Sei que vamos estudar PCA em breve no curso, mas queria saber se você pode me ajudar, pois preciso fazer essa análise urgente. Eu tenho dados de habitat de parcelas que fiz em locais onde registrei ou não (presença e ausência) uma espécie de ave, quero saber quais variáves podem influenciar a presença.
Eu sei que existem diversos pacotes no R que fazem essa análise, mas estava seguindo os passos desse tutorial: r-bloggers.com/computing-and-visualizing-pca-in-r/). Vi não só nesse, mas em muitos outros que é comum fazer a logaritimização dos dados antes de rodar a PCA, o problema é que eu parei nesse passo, porque depois que eu transformei os dados alguns retornaram como -infi, um exemplo de variável em que isso aconteceu foi número de palmeiras na parcelas, em alguns casos foi 0 e aí depois de transformados os dados eu tenho esses valores na minha planilha e o erro é esse: Error in svd(x, nu = 0) : infinite or missing values in 'x'. Você sabe como eu posso contornar isso?
Mais um dúvida, no exemplo do tutorial o autor usa a variável categórica "espécie"para visualizar os PCs, no meu caso essa variável seria a presença ou ausência da espécie de ave?
Muito obrigada,
Fernanda.
Fernanda- Mensagens : 4
Data de inscrição : 09/02/2016
Re: Dúvidas PCA
Oi, Fernanda, tudo bem?
Então, transformar os dados por log antes da PCA não é uma necessidade, ok? Isso depende da natureza dos dados e do que você quer obter com eles. Transformar os dados antes de uma análise multivariada é comum, mas não é obrigatório, e só deve ser feito se realmente for necessário, certo? Pense um pouco para ter certeza se precisa da transformação.
De qualquer forma, o erro deve estar acontecendo com os valores que são iguais a zero, pois não existe log de zero. Em casos assim, basta somar 1 antes de transformar, mais ou menos assim:
log10(variável + 1)
Assim os valores que eram zero vão se tornar 1, e log de 1 é zero.
Finalmente, no caso da sua variável, entendo que sim, as categorias seriam a ausência e a presença da ave que você tem interesse.
Então, transformar os dados por log antes da PCA não é uma necessidade, ok? Isso depende da natureza dos dados e do que você quer obter com eles. Transformar os dados antes de uma análise multivariada é comum, mas não é obrigatório, e só deve ser feito se realmente for necessário, certo? Pense um pouco para ter certeza se precisa da transformação.
De qualquer forma, o erro deve estar acontecendo com os valores que são iguais a zero, pois não existe log de zero. Em casos assim, basta somar 1 antes de transformar, mais ou menos assim:
log10(variável + 1)
Assim os valores que eram zero vão se tornar 1, e log de 1 é zero.
Finalmente, no caso da sua variável, entendo que sim, as categorias seriam a ausência e a presença da ave que você tem interesse.
Re: Dúvidas PCA
Oi Marcos, obrigada pela resposta. Eu tive que transformar algumas das minhas variáveis e até aí tudo certo. Eu estou rodando a PCA com 18 variáveis e quando faço o biplot não aparece o nome das minhas variáves nas setas. Isso é porque são muitas variáveis? Dei uma olhada no help da função biplot, mas não encontrei um argumento que eu pudesse usar para forçar que os nomes apareçam, existe um jeito de fazer isso?
Fernanda- Mensagens : 4
Data de inscrição : 09/02/2016
Re: Dúvidas PCA
Oi, Fernanda.
Cole aqui os comandos que você está usando, para que eu possa ver se há alguma etapa com problemas, ok? Os nomes deveriam aparecer normalmente, então pode ser algum pequeno erro de execução, vamos ver.
Cole aqui os comandos que você está usando, para que eu possa ver se há alguma etapa com problemas, ok? Os nomes deveriam aparecer normalmente, então pode ser algum pequeno erro de execução, vamos ver.
Tópicos semelhantes
» Dúvidas GLM
» Dúvidas webnario do dia 08/12
» TRABALHANDO COM O R NO MAC
» Dúvidas Qui-quadrado
» Duvidas Gerais
» Dúvidas webnario do dia 08/12
» TRABALHANDO COM O R NO MAC
» Dúvidas Qui-quadrado
» Duvidas Gerais
Página 1 de 1
Permissões neste sub-fórum
Não podes responder a tópicos
|
|