Dúvidas em relação a Análise de Correspondência Canônica
3 participantes
Página 1 de 1
Dúvidas em relação a Análise de Correspondência Canônica
Boa tarde.
Surgiu uma dúvida ao formatar os dados para realizar a análise de correspondência canônica.
Os dados são referentes a variáveis ambientais para tentar relacionar estas a ocorrência de quatro espécies de aves.
Dentre essas variáveis ambientais, no momento da coleta de dados algumas foram quantitativas (número de arvores,...) e outras foram categóricas (por exemplo, presença de clareira: ausente, até 10% e mais que 10%).
O R Studio não aceita essas categóricas e apresenta erro (Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) : contrasts can be applied only to factors with 2 or more levels).
Minha dúvida é, qual a melhor maneira de contornar esse problema. Substituir as categorias por números (ausente por 0, até 10% por 1 e mais que 10% por 2) ou acrescentar colunas separadas (Clareira ausente, Clareira até 10% e Clareira mais que 10%) e colocar 0 e 1 como se fosse ausência e presença?
E aproveitando o tópico, teriam sugestões de literatura que ajudem a interpretar melhor o gráfico da CCA? Como não tenho muita experiência, tenho receio de deixar passar alguma informação importante já que ela não fornece valores da influência de cada variável nas espécies amostradas.
.
Muito obrigado.
Surgiu uma dúvida ao formatar os dados para realizar a análise de correspondência canônica.
Os dados são referentes a variáveis ambientais para tentar relacionar estas a ocorrência de quatro espécies de aves.
Dentre essas variáveis ambientais, no momento da coleta de dados algumas foram quantitativas (número de arvores,...) e outras foram categóricas (por exemplo, presença de clareira: ausente, até 10% e mais que 10%).
O R Studio não aceita essas categóricas e apresenta erro (Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) : contrasts can be applied only to factors with 2 or more levels).
Minha dúvida é, qual a melhor maneira de contornar esse problema. Substituir as categorias por números (ausente por 0, até 10% por 1 e mais que 10% por 2) ou acrescentar colunas separadas (Clareira ausente, Clareira até 10% e Clareira mais que 10%) e colocar 0 e 1 como se fosse ausência e presença?
E aproveitando o tópico, teriam sugestões de literatura que ajudem a interpretar melhor o gráfico da CCA? Como não tenho muita experiência, tenho receio de deixar passar alguma informação importante já que ela não fornece valores da influência de cada variável nas espécies amostradas.
.
Muito obrigado.
rafaelmartos- Mensagens : 10
Data de inscrição : 22/05/2019
Idade : 32
Localização : Pirajuí/SP
Re: Dúvidas em relação a Análise de Correspondência Canônica
Oi, Rafael!
Acho que podemos voltar um passo e olhar para os dados, pois a mensagem de erro sugere que o R teve algum problema ao ler suas variáveis categóricas. Pode ser algo que está acontecendo na cca, mas pode ser anterior, algo que está acontecendo com os dados.
Cole um summary() dos dados aqui, e vamos ver se dá alguma pista. Depois continuamos passo a passo, ok?
Para aprender multivariada, eu recomendo fortemente o Numerical Ecology with R, que além de já trazer tudo de forma prática para o R é muito didático.
Acho que podemos voltar um passo e olhar para os dados, pois a mensagem de erro sugere que o R teve algum problema ao ler suas variáveis categóricas. Pode ser algo que está acontecendo na cca, mas pode ser anterior, algo que está acontecendo com os dados.
Cole um summary() dos dados aqui, e vamos ver se dá alguma pista. Depois continuamos passo a passo, ok?
Para aprender multivariada, eu recomendo fortemente o Numerical Ecology with R, que além de já trazer tudo de forma prática para o R é muito didático.
Re: Dúvidas em relação a Análise de Correspondência Canônica
Oi prof. Marcos, boa noite.
Segue o summary dos dados:
> summary(dados)
Pontos lado AMD CAV ACA CLA
:12 Direita1 : 1 19,04 :4 Min. :0.00000 Min. :0.000 >10% : 4
Ponto_1 : 1 Direita10: 1 24,58 :4 1st Qu.:0.00000 1st Qu.:1.000 ate_10%:10
Ponto_10: 1 Direita11: 1 12,9 :2 Median :0.00000 Median :1.000 ausente:10
Ponto_11: 1 Direita12: 1 15,14 :2 Mean :0.04167 Mean :1.583
Ponto_12: 1 Direita2 : 1 19,46 :2 3rd Qu.:0.00000 3rd Qu.:2.250
Ponto_2 : 1 Direita3 : 1 19,54 :2 Max. :1.00000 Max. :4.000
(Other) : 7 (Other) :18 (Other):8
TREP ARB SER PER1 PER2 PER3
>10% :12 >10% : 5 >10%:24 Min. :0.000 Min. :0.000 Min. :0.00000
ate_10%:10 ate_10%:12 1st Qu.:2.000 1st Qu.:0.000 1st Qu.:0.00000
ausente: 2 ausente: 7 Median :3.000 Median :1.000 Median :0.00000
Mean :3.042 Mean :1.167 Mean :0.04167
3rd Qu.:4.000 3rd Qu.:2.000 3rd Qu.:0.00000
Max. :7.000 Max. :3.000 Max. :1.00000
PER4 S_virgata P_koeniswaldiana M_choliba M_atricapilla
Min. :0.00000 Min. :0.0000 Min. :0.0 Min. :0.00 Min. :0.0000
1st Qu.:0.00000 1st Qu.:0.0000 1st Qu.:0.0 1st Qu.:0.00 1st Qu.:0.0000
Median :0.00000 Median :1.0000 Median :0.5 Median :0.00 Median :0.0000
Mean :0.04167 Mean :0.6667 Mean :0.5 Mean :0.25 Mean :0.4167
3rd Qu.:0.00000 3rd Qu.:1.0000 3rd Qu.:1.0 3rd Qu.:0.25 3rd Qu.:1.0000
Max. :1.00000 Max. :1.0000 Max. :1.0 Max. :1.00 Max. :1.0000
>
Segue o summary dos dados:
> summary(dados)
Pontos lado AMD CAV ACA CLA
:12 Direita1 : 1 19,04 :4 Min. :0.00000 Min. :0.000 >10% : 4
Ponto_1 : 1 Direita10: 1 24,58 :4 1st Qu.:0.00000 1st Qu.:1.000 ate_10%:10
Ponto_10: 1 Direita11: 1 12,9 :2 Median :0.00000 Median :1.000 ausente:10
Ponto_11: 1 Direita12: 1 15,14 :2 Mean :0.04167 Mean :1.583
Ponto_12: 1 Direita2 : 1 19,46 :2 3rd Qu.:0.00000 3rd Qu.:2.250
Ponto_2 : 1 Direita3 : 1 19,54 :2 Max. :1.00000 Max. :4.000
(Other) : 7 (Other) :18 (Other):8
TREP ARB SER PER1 PER2 PER3
>10% :12 >10% : 5 >10%:24 Min. :0.000 Min. :0.000 Min. :0.00000
ate_10%:10 ate_10%:12 1st Qu.:2.000 1st Qu.:0.000 1st Qu.:0.00000
ausente: 2 ausente: 7 Median :3.000 Median :1.000 Median :0.00000
Mean :3.042 Mean :1.167 Mean :0.04167
3rd Qu.:4.000 3rd Qu.:2.000 3rd Qu.:0.00000
Max. :7.000 Max. :3.000 Max. :1.00000
PER4 S_virgata P_koeniswaldiana M_choliba M_atricapilla
Min. :0.00000 Min. :0.0000 Min. :0.0 Min. :0.00 Min. :0.0000
1st Qu.:0.00000 1st Qu.:0.0000 1st Qu.:0.0 1st Qu.:0.00 1st Qu.:0.0000
Median :0.00000 Median :1.0000 Median :0.5 Median :0.00 Median :0.0000
Mean :0.04167 Mean :0.6667 Mean :0.5 Mean :0.25 Mean :0.4167
3rd Qu.:0.00000 3rd Qu.:1.0000 3rd Qu.:1.0 3rd Qu.:0.25 3rd Qu.:1.0000
Max. :1.00000 Max. :1.0000 Max. :1.0 Max. :1.00 Max. :1.0000
>
rafaelmartos- Mensagens : 10
Data de inscrição : 22/05/2019
Idade : 32
Localização : Pirajuí/SP
Re: Dúvidas em relação a Análise de Correspondência Canônica
Oi, Rafel!
A variável SER está entrando na análise? Porque ela é um fator, mas tem um único nível. Atente para o final da mensagem de erro: "contrasts can be applied only to factors with 2 or more levels".
Desconfio que deva ser isso. Se puder, rode a análise sem ela, e depois diga se era isso mesmo, ok?
A variável SER está entrando na análise? Porque ela é um fator, mas tem um único nível. Atente para o final da mensagem de erro: "contrasts can be applied only to factors with 2 or more levels".
Desconfio que deva ser isso. Se puder, rode a análise sem ela, e depois diga se era isso mesmo, ok?
Re: Dúvidas em relação a Análise de Correspondência Canônica
Oi prof. Marcos.
Retirei a variável SER e agora deu certo.
Como ela apresenta o mesmo valor para todos locais, o que eu faço? Excluo ela da análise ou substituo por algo?
E agora surgiram duas novas dúvidas:
1. No gráfico da CCA o nome de algumas variáveis e de alguns pontos amostrais ficaram sobrepostos. Tem como concertar isso? Pois alguns só dá para saber o que é olhando os valores dados na análise.
2. A análise gerou apenas até a CCA3 e não até a CCA4 conforme explicado no exemplo da aula. É normal? Penso que seja por não ter necessidade de ter uma quarta CCA já que a proporção explicada pela CCA3 é alta:
> summary(resultado.cca)
Call:
cca(X = bio, Y = amb)
Partitioning of scaled Chi-square:
Inertia Proportion
Total 1.08472 1.00000
Constrained 0.99563 0.91787
Unconstrained 0.08909 0.08213
Eigenvalues, and their contribution to the scaled Chi-square
Importance of components:
CCA1 CCA2 CCA3 CA1 CA2
Eigenvalue 0.4455 0.4238 0.1264 0.08032 0.008774
Proportion Explained 0.4107 0.3907 0.1165 0.07405 0.008088
Cumulative Proportion 0.4107 0.8014 0.9179 0.99191 1.000000
Accumulated constrained eigenvalues
Importance of components:
CCA1 CCA2 CCA3
Eigenvalue 0.4455 0.4238 0.1264
Proportion Explained 0.4474 0.4256 0.1269
Cumulative Proportion 0.4474 0.8731 1.0000
Scaling 2 for species and site scores
* Species are scaled proportional to eigenvalues
* Sites are unscaled: weighted dispersion equal on all dimensions
<
Retirei a variável SER e agora deu certo.
Como ela apresenta o mesmo valor para todos locais, o que eu faço? Excluo ela da análise ou substituo por algo?
E agora surgiram duas novas dúvidas:
1. No gráfico da CCA o nome de algumas variáveis e de alguns pontos amostrais ficaram sobrepostos. Tem como concertar isso? Pois alguns só dá para saber o que é olhando os valores dados na análise.
2. A análise gerou apenas até a CCA3 e não até a CCA4 conforme explicado no exemplo da aula. É normal? Penso que seja por não ter necessidade de ter uma quarta CCA já que a proporção explicada pela CCA3 é alta:
> summary(resultado.cca)
Call:
cca(X = bio, Y = amb)
Partitioning of scaled Chi-square:
Inertia Proportion
Total 1.08472 1.00000
Constrained 0.99563 0.91787
Unconstrained 0.08909 0.08213
Eigenvalues, and their contribution to the scaled Chi-square
Importance of components:
CCA1 CCA2 CCA3 CA1 CA2
Eigenvalue 0.4455 0.4238 0.1264 0.08032 0.008774
Proportion Explained 0.4107 0.3907 0.1165 0.07405 0.008088
Cumulative Proportion 0.4107 0.8014 0.9179 0.99191 1.000000
Accumulated constrained eigenvalues
Importance of components:
CCA1 CCA2 CCA3
Eigenvalue 0.4455 0.4238 0.1264
Proportion Explained 0.4474 0.4256 0.1269
Cumulative Proportion 0.4474 0.8731 1.0000
Scaling 2 for species and site scores
* Species are scaled proportional to eigenvalues
* Sites are unscaled: weighted dispersion equal on all dimensions
<
rafaelmartos- Mensagens : 10
Data de inscrição : 22/05/2019
Idade : 32
Localização : Pirajuí/SP
Re: Dúvidas em relação a Análise de Correspondência Canônica
Opa, que bom que deu certo!
Sim, se a variável apresenta o mesmo valor para todos os locais ela pode ser retirada da análise, pois é irrelevante dentro deste contexto (num contexto mais amplo, ela pode ser importante, seja como um parâmetro descritivo da sua amostra ou como algo que pode ser usado em uma análise futura com mais dados).
Depois retorno aqui para continuar a responder, ok?
Sim, se a variável apresenta o mesmo valor para todos os locais ela pode ser retirada da análise, pois é irrelevante dentro deste contexto (num contexto mais amplo, ela pode ser importante, seja como um parâmetro descritivo da sua amostra ou como algo que pode ser usado em uma análise futura com mais dados).
Depois retorno aqui para continuar a responder, ok?
Valeria Andrade- Mensagens : 94
Data de inscrição : 12/03/2018
Re: Dúvidas em relação a Análise de Correspondência Canônica
Prof. Marcos escreveu:Opa, que bom que deu certo!
Sim, se a variável apresenta o mesmo valor para todos os locais ela pode ser retirada da análise, pois é irrelevante dentro deste contexto (num contexto mais amplo, ela pode ser importante, seja como um parâmetro descritivo da sua amostra ou como algo que pode ser usado em uma análise futura com mais dados).
Depois retorno aqui para continuar a responder, ok?
Obrigado professor, fico no aguardo.
rafaelmartos- Mensagens : 10
Data de inscrição : 22/05/2019
Idade : 32
Localização : Pirajuí/SP
Valeria Andrade- Mensagens : 94
Data de inscrição : 12/03/2018
Tópicos semelhantes
» Analise de contraste GLM
» Análise de dados longitudinais com medidas inequidistantes
» Dúvida na análise de Autocorrelação espacial e mantel parcial no R
» script da Analise dos dados de manuscrito:literature patterns about humpback whale em html
» Warning message: In sqrt(VS) : NaNs produzidos - análise modificada de Mann Kendall
» Análise de dados longitudinais com medidas inequidistantes
» Dúvida na análise de Autocorrelação espacial e mantel parcial no R
» script da Analise dos dados de manuscrito:literature patterns about humpback whale em html
» Warning message: In sqrt(VS) : NaNs produzidos - análise modificada de Mann Kendall
Página 1 de 1
Permissões neste sub-fórum
Não podes responder a tópicos