Estimativa de dados ausentes
2 participantes
Página 1 de 1
Estimativa de dados ausentes
Boa noite! Fiz estimativa de dados ausentes pelo pacote Mice. Exportei em csv. Gostaria de inserir os dados estimados na tabela original e não estou conseguindo.
Yasmin Canalli- Mensagens : 15
Data de inscrição : 30/03/2020
Re: Estimativa de dados ausentes
Oi, Yasmin!
Você pode dar mais detalhes? Chegou a tentar usar algum comando e deu erro? Se sim, qual o erro?
Uma forma básica de se adicionar colunas é o uso da função cbind. Segue um exemplo simples, que você pode executar no R para ver como funciona:
Você pode dar mais detalhes? Chegou a tentar usar algum comando e deu erro? Se sim, qual o erro?
Uma forma básica de se adicionar colunas é o uso da função cbind. Segue um exemplo simples, que você pode executar no R para ver como funciona:
- Código:
#Dados:
data(iris)
#Conferindo os dados:
summary(iris)
#Criando um objeto com o log dos comprimentos das sépalas:
log.sep<-log10(iris$Sepal.Width)
#Adicionando a variável criada como uma coluna em uma nova tabela:
iris.nova<-cbind(iris, log.sep)
#Conferindo a tabela nova:
summary(iris.nova)
Re: Estimativa de dados ausentes
Olá! Estou usando o seguinte script. Não está dando erro, mas não consigo juntar os dados imputados e os dados medidos para depois fazer uma CCA. Na parte da imputação eu consigo para cada variável uma tabela com 5 colunas e muitas linhas.
Tenho 6 transectos (25 parcelas em cada um) e vou todo mês. Estou enviando uma tabela com alguns dados como exemplo. Consegui fazer a CCA retirando os dados ausentes.
Já assisti a aula de GGPLOT2. Estou tentando deixar cada transecto com uma cor e em outro gráfico separar por estações, mas também não consegui. Comecei a me aventurar agora na ecologia kkkk.
require(mice)
imputacao <- abiotico
summary(imputacao)
md.pattern(imputacao)
imp <- mice(imputacao)
imp
imp$imp$Rainfall
imp$imp$Ind.Num.
imp$imp$Flower
imp$imp$pH
imp$imp$Humidity
imp$imp$Wat.Temp
imp$imp$Med.Transp.
imp$imp$Depth
imp$imp$Wind.speed
imp$imp$Photoperiod
df<-imp$imp$Flower
write.csv(df,"Flor.csv")
df<-imp$imp$Rainfall
write.csv(df,"Chuva.csv")
df<-imp$imp$Ind.Num.
write.csv(df,"Indivíduos.csv")
df<-imp$imp$ph
write.csv(df,"pH.csv")
df<-imp$imp$Humidity
write.csv(df,"Umidade.csv")
df<-imp$imp$Wat.Temp
write.csv(df,"Temperaturaagua.csv")
df<-imp$imp$Med.Transp.
write.csv(df,"Transparência.csv")
df<-imp$imp$Depth
write.csv(df,"Profundidade.csv")
df<-imp$imp$Wind.speed
write.csv(df,"Vento.csv")
df<-imp$imp$Photoperiod
write.csv(df,"Fotoperíodo.csv")
#CCA Veja no resultado que aparecem 3 partes. A primeira mostra a InZrcia (a varia?<o nos dados) e a propor?<o da inZrcia que Z explicada pelos dados ambientais (Constrained). A segunda parte mostra os autovalores dos eixos constrained (considerando as vari???veis ambientais) e a terceira mostra os autovalores dos eixos unconstrained (sem considerar as vari???veis ambientais). Vamos salvar os resultados da cca para ver outras op?>es.
library(MASS)
library (vegan)
setwd(choose.dir())
amb<-read.table("abiotico.csv",header=T, dec="," )
amb
abiotico<- amb[,2:8]
abiotico
abiotico.std<-decostand(abiotico,"standardize")
abiotico.std
vida<-read.table("biotico.csv",header=T, dec=",")
vida
vida1<- vida[,2:17]
vida1
bio.hell<-decostand(vida1, "hellinger")
bio.hell
cca(bio.hell,abiotico.std)
resu.cca<-cca(bio.hell, abiotico.std)
resu.cca
summary(resu.cca)
plot(resu.cca)
plot(resu.cca, display=c("lc")) # apenas os scores dos locais
plot(resu.cca, display=c("lc","cn")) # scores dos locais e centroide das var amb.
plot(resu.cca, display=c("sp")) # apenas os scores das espŽcies
plot(resu.cca, display=c("sp","cn")) # scores das espŽcies e centr—ide das var amb.
plot(resu.cca, display=c("lc"),type="n")
text(resu.cca, display=c("cn"))
anova(resu.cca) #Para testar se o modelo da cca Ž significativo podemos usar a fun‹o anova.
Tenho 6 transectos (25 parcelas em cada um) e vou todo mês. Estou enviando uma tabela com alguns dados como exemplo. Consegui fazer a CCA retirando os dados ausentes.
Já assisti a aula de GGPLOT2. Estou tentando deixar cada transecto com uma cor e em outro gráfico separar por estações, mas também não consegui. Comecei a me aventurar agora na ecologia kkkk.
require(mice)
imputacao <- abiotico
summary(imputacao)
md.pattern(imputacao)
imp <- mice(imputacao)
imp
imp$imp$Rainfall
imp$imp$Ind.Num.
imp$imp$Flower
imp$imp$pH
imp$imp$Humidity
imp$imp$Wat.Temp
imp$imp$Med.Transp.
imp$imp$Depth
imp$imp$Wind.speed
imp$imp$Photoperiod
df<-imp$imp$Flower
write.csv(df,"Flor.csv")
df<-imp$imp$Rainfall
write.csv(df,"Chuva.csv")
df<-imp$imp$Ind.Num.
write.csv(df,"Indivíduos.csv")
df<-imp$imp$ph
write.csv(df,"pH.csv")
df<-imp$imp$Humidity
write.csv(df,"Umidade.csv")
df<-imp$imp$Wat.Temp
write.csv(df,"Temperaturaagua.csv")
df<-imp$imp$Med.Transp.
write.csv(df,"Transparência.csv")
df<-imp$imp$Depth
write.csv(df,"Profundidade.csv")
df<-imp$imp$Wind.speed
write.csv(df,"Vento.csv")
df<-imp$imp$Photoperiod
write.csv(df,"Fotoperíodo.csv")
#CCA Veja no resultado que aparecem 3 partes. A primeira mostra a InZrcia (a varia?<o nos dados) e a propor?<o da inZrcia que Z explicada pelos dados ambientais (Constrained). A segunda parte mostra os autovalores dos eixos constrained (considerando as vari???veis ambientais) e a terceira mostra os autovalores dos eixos unconstrained (sem considerar as vari???veis ambientais). Vamos salvar os resultados da cca para ver outras op?>es.
library(MASS)
library (vegan)
setwd(choose.dir())
amb<-read.table("abiotico.csv",header=T, dec="," )
amb
abiotico<- amb[,2:8]
abiotico
abiotico.std<-decostand(abiotico,"standardize")
abiotico.std
vida<-read.table("biotico.csv",header=T, dec=",")
vida
vida1<- vida[,2:17]
vida1
bio.hell<-decostand(vida1, "hellinger")
bio.hell
cca(bio.hell,abiotico.std)
resu.cca<-cca(bio.hell, abiotico.std)
resu.cca
summary(resu.cca)
plot(resu.cca)
plot(resu.cca, display=c("lc")) # apenas os scores dos locais
plot(resu.cca, display=c("lc","cn")) # scores dos locais e centroide das var amb.
plot(resu.cca, display=c("sp")) # apenas os scores das espŽcies
plot(resu.cca, display=c("sp","cn")) # scores das espŽcies e centr—ide das var amb.
plot(resu.cca, display=c("lc"),type="n")
text(resu.cca, display=c("cn"))
anova(resu.cca) #Para testar se o modelo da cca Ž significativo podemos usar a fun‹o anova.
Yasmin Canalli- Mensagens : 15
Data de inscrição : 30/03/2020
Re: Estimativa de dados ausentes
Olá de novo, Yasmin.
Então, vamos lá. Dei uma olhada no help da função mice, e na verdade não é muito complicado. Você pode usar a função complete() para gerar a tabela completa, com os dados originais + os dados estimados pelo pacote (os tais dados "imputados"). Então no lugar de salvar as informações de cada variável como você fez, o processo é bem mais simples, algo mais ou menos assim:
Perceba que dependendo de como você for usar os dados, você nem precisa salvar em uma nova tabela, ok? Acho que na realidade você vai precisar apenas do objeto, o que eu chamei de "dados.completos", e usá-lo na sua CCA.
Então, vamos lá. Dei uma olhada no help da função mice, e na verdade não é muito complicado. Você pode usar a função complete() para gerar a tabela completa, com os dados originais + os dados estimados pelo pacote (os tais dados "imputados"). Então no lugar de salvar as informações de cada variável como você fez, o processo é bem mais simples, algo mais ou menos assim:
- Código:
#Salvando os dados completos em um novo objeto:
dados.completos<-complete(imp)
#Se quiser, você pode conferir o novo objeto, para observar como os dados ficaram:
dados.completos
#E se quiser salvar em arquivo, você pode salvar como csv:
write.csv(dados.completos, "dados_completos.csv")
Perceba que dependendo de como você for usar os dados, você nem precisa salvar em uma nova tabela, ok? Acho que na realidade você vai precisar apenas do objeto, o que eu chamei de "dados.completos", e usá-lo na sua CCA.
Re: Estimativa de dados ausentes
Que maravilha! Funcionou, só não sei o motivo que todas as vírgulas sumiram. Obrigada pela resposta, sem dúvidas aprenderei muito!
Yasmin Canalli- Mensagens : 15
Data de inscrição : 30/03/2020
Re: Estimativa de dados ausentes
Por nada!
Sobre o comentário que você fez sobre as vírgulas: fique sempre atenta para as configurações do computador para separadores decimais e separadores de milhar. Aqui no Brasil nossos computadores são normalmente configurados para usar "." como um separador de milhar, e "," como separador decimal. Mas a notação usada universalmente (e usada pelo R) é do ponto como separador decimal.
Para dados que estão em uma planilha e vão para o R, dependendo do formato de entrada, você sempre pode adicionar o argumento dec="," - assim você "avisa" o R que o separador decimal nos dados originais é uma vírgula. Mas daí pra frente o R continua usando ponto, que é o seu padrão.
Mas quando os dados saem do R e são abertos de novo em uma planilha, pode sim acontecer alguma confusão. Então uma possibilidade é mudar a configuração do seu computador ou do seu gerenciador de planilhas, para mudar o padrão reconhecido, ok?
Sobre o comentário que você fez sobre as vírgulas: fique sempre atenta para as configurações do computador para separadores decimais e separadores de milhar. Aqui no Brasil nossos computadores são normalmente configurados para usar "." como um separador de milhar, e "," como separador decimal. Mas a notação usada universalmente (e usada pelo R) é do ponto como separador decimal.
Para dados que estão em uma planilha e vão para o R, dependendo do formato de entrada, você sempre pode adicionar o argumento dec="," - assim você "avisa" o R que o separador decimal nos dados originais é uma vírgula. Mas daí pra frente o R continua usando ponto, que é o seu padrão.
Mas quando os dados saem do R e são abertos de novo em uma planilha, pode sim acontecer alguma confusão. Então uma possibilidade é mudar a configuração do seu computador ou do seu gerenciador de planilhas, para mudar o padrão reconhecido, ok?
Tópicos semelhantes
» Cálculo de estimativa da de número de amostras (delineamento)
» Transformacao dos dados, Log, Arcoseno, raiz quadrada & Re transformação de dados-Back-transformation
» Dados Populacionais
» Problemas ao ler dados em CSV
» dados moleculares
» Transformacao dos dados, Log, Arcoseno, raiz quadrada & Re transformação de dados-Back-transformation
» Dados Populacionais
» Problemas ao ler dados em CSV
» dados moleculares
Página 1 de 1
Permissões neste sub-fórum
Não podes responder a tópicos
|
|