Governo Federal

Dados do Trabalhos de Conclusão

UNIVERSIDADE FEDERAL DO PARANÁ
MÉTODOS NUMÉRICOS EM ENGENHARIA (40001016030P0)
ANÁLISE DISCRIMINANTE LINEAR DE FISHER COMBINADA COM ALGORITMO K-SEGMENTOS
ZAUDIR DAL CORTIVO
TESE
04/12/2015

A classificação de dados amostrais em categorias tem aplicações em diversas áreas da ciência e existem várias técnicas que podem ser aplicadas para esse fim, como a Análise Discriminante Linear de Fisher (FDA) e a Análise Discriminante Local de Fisher (LFDA). A eficiência de classificação dos dados é relevante para qualquer técnica. Diferentes técnicas ou apenas modificações de métodos já existentes têm sido devolvidas no meio científico, com o objetivo de oferecer métodos mais eficientes para a classificação amostral de dados. Em geral, as metodologias para análise discriminante são eficientes em algumas situações e em outras não. As técnicas FDA e LFDA podem ser menos eficientes quando a dispersão nas classes é alta ou quando os dados estão dispersos em forma linear ou não linear. Para essas situações, o uso apenas dos centroides para associar uma nova observação amostral à classe cujo centroide é mais próximo pode não ser o método mais eficaz. A proposta deste trabalho é efetuar modificação nas técnicas FDA e LFDA substituindo os centroides por uma linha poligonal gerada pelo algoritmo ksegmentos. Esse método consiste em ajustar para cada classe, definida a priori, uma linha poligonal e uma nova observação é classificada na classe cuja distância ortogonal à linha poligonal é a menor. Experimentalmente, o algoritmo é aplicado para diversos conjuntos de dados amostrais e os resultados são comparados com a taxa aparente de erro. Os resultados experimentais obtidos com aplicação da técnica k-segmentos, mostraram-se mais eficientes que o uso dos centroides, tanto para FDA como para LFDA. Os testes realizados apresentaram ganhos significativos na percentagem de observações amostrais classificadas corretamente, principalmente quando os escorres tem dispersão linear ou não linear. Outra vantagem é que ele não utiliza apenas um ponto central, como os centroides, mas diversos pontos que 'passam' no meio dos escorres de cada classe, o que pode possibilitar melhor eficiência de classificação.

Análise Discriminante de Fisher. Curvas Principais. Algoritmo ksegmentos. Análise Discriminante Local de Fisher
The classification of sample data has applications in several areas of science and there are various techniques that can be applied to this order, as Fisher's Linear discriminant analysis (FDA) and the Local Fisher discriminant analysis (LFDA). The efficieny of data classification is relevant to any technique. Different techniques or just modifications of existing methods, have been returned in the scientific world, with the aim of offering more efficient methods for the sampling of data classification. In General, the methodologies for discriminant analysis are effective in some situations and not others. The FDA and LFDA techniques can be less efficient when the dispersion in the classes is high or when the data are dispersed in linear or nonlinear form. For these situations the use of only the centróides to associate a new sample observation to class whose centroid is closest may not be the most efficient method. The purpose of this work is to make modification in FDA and replacing the LFDA centróides by a polygonal line generated by the algorithm k-segments. This method consists in adjusting to each class, defined a priori, a polygonal line, and a new observation is classified in class whose orthogonal distance the polygonal line is the smallest. Experimentally, the algorithm is applied to several sets of sample data and the results are compared with the apparent rate of error. The experimental results obtained with application of k-segments, were more efficient than the use of centroides, both for FDA and for LFDA. The tests showed significant gains in the percentage of sample observations classificadadas correctly, especially when the escores have linear or non-linear dispersion. Another advantage is that it not only uses a central point, like the centroids, but several points to ' pass ' in the middle of the scores of each class, which can enable better efficiency.
Fisher Discriminant Analysis. Principal Curves. Algorithm k-segments. Local Fisher Discriminant analysis
01
163
PORTUGUES
UNIVERSIDADE FEDERAL DO PARANÁ

Contexto

PROGRAMAÇÃO MATEMÁTICA
MÉTODOS ESTATÍSTICOS APLICADOS À ENGENHARIA
ESTATÍSTICA APLICADA E CONFIABILIDADE EM SISTEMAS DE ENGENHARIA

Banca Examinadora

JAIR MENDES MARQUES
Não
Nome Categoria
INACIO ANDRUSKI GUIMARAES Participante Externo
SACHIKO ARAKI LIRA Docente
ANSELMO CHAVES NETO Docente

Vínculo

CLT
Instituição de Ensino e Pesquisa
Ensino e Pesquisa
Sim