Governo Federal

Dados do Trabalhos de Conclusão

UNIVERSIDADE FEDERAL DO PARANÁ
MÉTODOS NUMÉRICOS EM ENGENHARIA (40001016030P0)
USO DO MÉTODO DE MONTE CARLO PARA AVALIAR A SIGNIFICÂNCIA DO COEFICIENTE DE CORRELAÇÃO ENTRE DADOS AUTODEPENDENTES
KARINA BROTTO REBULI
DISSERTAÇÃO
26/06/2015

Em estatística espacial quando se trabalha com mais de uma variável, faz-se necessário verificar a correlação entre elas, o que é usualmente mensurado por algum coeficiente de correlação. Entretanto, a distribuição amostral desses coeficientes pode ser afetada pelo fato de as amostras serem autodependentes. A distribuição amostral do coeficiente de correlação de Pearson torna-se mais dispersa em dados autocorrelacionados, o que resulta em menor significância da sua estimativa amostral do que a obtida para dados internamente independentes. No presente trabalho foram analisados cinco métodos para avaliar a significância do coeficiente de correlação de Pearson em dados com autodependência espacial: os métodos analíticos de Clifford (CLIFFORD; RICHARDSON; HEMON, 1989) e de Dutilleul (DUTILLEUL, 1993) e os métodos MMC não paramétrico com permutação dos dados, proposto por Viladomat et al. (2014), bem como outros dois métodos MMC aqui propostos, um também com permutações e o outro baseado em simulações do modelo espacial dos dados. Os testes MMC por permutação das observações para avaliar a significância do coeficiente de correlação de dados autodependentes têm o desafio de manter ou restaurar a correlação interna dos dados, que é quebrada quando eles são permutados. Os MMC aqui analisados restauraram o padrão espacial dos dados convolucionando os dados permutados. Os métodos foram avaliados através da análise de um conjunto de dados reais como estudo de caso e com estudos de simulação, com o objetivo de avaliar os custos computacionais, suas eficácias e as eficiências dos métodos. O método de Dutilleul mostrou-se bastante conservador. O de Clifford apresentou taxas de erro tipo I parecidas com os MMC, mas poder de teste um pouco menor. Os testes MMC apresentaram taxas de erro tipo I e poder de teste parecidos. O MMC baseado em simulações do modelo das variáveis foi o de menor custo computacional e com um bom balanço entre as taxas de erro tipo I e o poder do teste. Foi implementado um pacote do software R com funções das metodologias MMC analisadas, para variáveis de processos espaciais aleatórios estacionários de primeira e segunda ordem.

dados autodependentes. significância do coeficiente de correlação. MMC. geoestatística. variograma empírico. modelos estocásticos espaciais
In spatial statistics, when working with more than one variable, it’s necessary to know the correlation between them, what is usually measured by some correlation coefficient. However, the sampling distribuition of these coefficients may be affected by sample autodependence. The Pearson correlation coefficient sampling distribution becomes more dispersed in autocorrelated data, which results in lower significance of its sample estimative than that obtained for internally independent data. This study analysed five methods for assessing the correlation coefficient significance on spatial autodependent data. Two analytical methods, one proposed by Clifford, Richardson e Hemon (1989) and other by Dutilleul (1993). And three Monte Carlo Methods (MMC), a non parametric based on permutation, proposed by Viladomat et al. (2014), and two parametric here proposed, one based on permutation and another based on simulations from data spatial model. MMC tests using permutation on autodependent data has the challenge of to keep or to restore the internal correlation, which is broken on permutation. The MMC using permutation analyzed in thi study restore the spatial autodependence by convolution. All methods were evaluated with a real dataset and with simulations studies, with the aim of assess their computational costs, efficacies and efficiencies. The Dutilleul method was to much conservative. The Clifford one had type I error rates similar to MMC methods, but a bit smaller test power. All MMC methods had similar type I error rates and test powers. The model based MMC had the smaller computational cost and a good balance between type I error rates and test power. A software R package was developed to implement the three MMC analyzed methodologies, to be used on variables of first and secondary stationary spatial processes.
autodependent data. correlation coefficient significance. MMC. geostatistics. empirical variogram. spatial models
01
212
PORTUGUES
UNIVERSIDADE FEDERAL DO PARANÁ

Contexto

PROGRAMAÇÃO MATEMÁTICA
ABORDAGEM DE PROBLEMAS DE OTIMIZAÇÃO E DE ANÁLISE NUMÉRICA
-

Banca Examinadora

PAULO JUSTINIANO RIBEIRO JUNIOR
Sim
Nome Categoria
NELSON LUIS DA COSTA DIAS Docente
ERICA CASTILHO RODRIGUES Participante Externo

Vínculo

-
-
-
Não