Como trabalhar com dados aninhados?

Ver o tópico anterior Ver o tópico seguinte Ir em baixo

Como trabalhar com dados aninhados?

Mensagem por Heide Vanessa em Sex Dez 09, 2016 7:45 pm

Professor Marcos como falamos durante o webinário de 8/12 aqui vão minhas dúvidas e questionamentos.
Trabalho com solos, avaliei comunidades bacterianas do ciclo do N e medi parâmetros químicos relacionados ao N (C, NO3, NH4, NT e glomalina). Eu gostaria de verificar quanto as variáveis ambientais influenciam a riqueza de espécies.

Os dados foram coletado da seguinte maneira:

3 áreas (1 de estudo, 2 de referência - um controle positivo e um controle negativo).

Cada área foi dividida em 3 blocos, cada bloco dividido em 3 parcelas e cada parcela possuía 3 zonas de inundação.
De cada parcela coletamos uma amostra de solo por zona que foram mixadas para forma uma amostra composta daquela zona.
                                                 Riqueza
Area Bloco   Zona   C ....   Glom   AOA   AOB

ES     B1      Z1      17.91  10.20   23     20
ES     B1      Z2      25.91  08.20   20     23
ES     B1      Z3      18.0   25.6      1      1
ES     B2      Z1      25.1   25.8      0      3
ES     B2      Z2
ES     B2      Z3
ES     B3      Z1
ES     B3      Z2
ES     B3      Z3
O mesmo foi feito para as outras duas áreas.
Em determinadas espécies nem todas as amostras registaram indivíduos.

Usando dicas do Goteli e ajuda de um amigo, eu fiz ANOVA agregando (ex. ES B1; ES B2; Es B3 cada um seria a média de 3 amostra de zona) os dados e fui capaz de verificar a diferença entre as médias. Mas e sobre a influências das variáveis ambientais, sendo os dados aninhados não achei que correlação estaria de acordo para dados neste estado. Tenho muitas dúvidas de como explorar estes dados a partir daqui.

Outra coisa que aconteceu é que em determinadas espécies nem todas as amostras registaram indivíduos.

Abro a discussão também para os demais colegas do fórum, caso tenham sugestões estas seriam bem vindas.

Obrigada.

Heide Vanessa

Mensagens : 3
Data de inscrição : 26/10/2016

Ver perfil do usuário

Voltar ao Topo Ir em baixo

Re: Como trabalhar com dados aninhados?

Mensagem por Prof. Marcos em Qua Dez 28, 2016 9:34 am

Olá, Heide, tudo bem?

Desculpe a demora.

Então, vamos lá. Trabalhar dados aninhados é relativamente simples em uma anova (existe um tipo de anova para isso, a anova aninhada). Em situações simples a fórmula da anova aninhada fica mais ou menos assim:
resultado<-aov(resposta~explicativa + Error(bloco))

A coisa fica mais complicada no seu caso porque temos uma situação hierárquica com vários níveis: se entendi bem você quer comparar as 3 áreas, e dentro de cada uma há subdivisões (blocos, parcelas e zonas).

Acho que a saída de agregar os dados é uma boa para a sua primeira questão, pois de outra forma você teria que construir um modelo estatístico bem complicado, e não sei se valeria à pena. Aí te aí tudo bem.

Mas a coisa começa a complicar quando você quer medir o efeito das variáveis ambientais nos dados, certo?
Bom, neste caso a primeira pergunta é: você tem uma medida dessas variáveis para cada linha dos seus dados? Ou seja, os dados ambientais também estão medidos dentro da mesma hierarquia dos demais dados?

Foi partir do pressuposto que sim, e começar a pensar aqui, e nós vamos nos falando para pensar em soluções.

Eu começaria, antes de pensar na análise final, explorando um pouco dos dados, tanto os da comunidade quanto os dados ambientais, para se ter uma ideia do quanto eles mostram mesmo dependência dentro de toda esta hierarquia. Isto pode ser um passo interessante, pois se você notar que alguns destes fatores de aninhamento dos dados não os afeta de maneria direta, poderia ter um argumento para ignorar aquele fator específico.

Você poderia, por exemplo, organizar os dados ambientais em PCA e os dados das comunidades em NMDS, e começar com uma exploração visual mesmo disso. Será que os dados de dentro de um mesmo bloco se parecem mais do que dados de blocos diferentes? Na sequência, será que dados das mesmas parcelas se parecem mais? E por aí vai.
Além da questão visual e exploratória, é sempre possível verificar a significância disso com a função adonis().

Acho que seria um começo interessante. Se uma exploração destas mostrar claramente que na verdade algum (ou alguns) dos níveis hierárquicos não afeta a estrutura dos dados, você poderia cortar aquele nível das análises, o que começa a simplificar as coisas. Caso contrário, aí temos que continuar pensando (ou seja, se todos os níveis importarem na estrutura dos dados).

Vamos nos falando, certo?
avatar
Prof. Marcos

Mensagens : 164
Data de inscrição : 23/12/2015
Idade : 36
Localização : Maceió, AL

Ver perfil do usuário https://cantinhodor.wordpress.com/

Voltar ao Topo Ir em baixo

Re: Como trabalhar com dados aninhados?

Mensagem por Heide Vanessa em Qua Dez 28, 2016 12:22 pm

Olá Professor Marcos.
Bem quanto aos níveis por eu ter coletado amostras mistas, o nível e parcela acabou sendo ignorado e ficamos apenas com zonas por bloco. No seguinte esquema:
Area Bloco Zona
ES Z1
B1 Z2
Z3
O que se repete para os blocos 2 e 3. Essa estrutura de coleta foi realizada em todas as áreas (ES, PS e DS) e para todos os tipos de dados (ambientais e de comunidade).
Concordo que agregar me ajudou nas comparações entre as áreas.
E respondendo a sua questão, sim eu tenho medidas das variáveis ambientais do mesmo jeito que os dados de espécies.
Farei o que foi sugerido para exploração dos dados.
Vamos nos falando.
Obrigada.

Heide Vanessa

Mensagens : 3
Data de inscrição : 26/10/2016

Ver perfil do usuário

Voltar ao Topo Ir em baixo

Re: Como trabalhar com dados aninhados?

Mensagem por Conteúdo patrocinado


Conteúdo patrocinado


Voltar ao Topo Ir em baixo

Ver o tópico anterior Ver o tópico seguinte Voltar ao Topo

- Tópicos similares

 
Permissão deste fórum:
Você não pode responder aos tópicos neste fórum