Plataforma Sucupira

Instituição de Ensino Superior:

UNIVERSIDADE FEDERAL DE VIÇOSA

Programa:

ZOOTECNIA (32002017011P9)

Título:

NEW INSIGHTS ON GENETIC MODELING OF GROWTH AND REPRODUCTIVE TRAITS IN TROPICAL CROSSBRED AND NELLORE CATTLE

Autor:

TALITA ESTEFANI ZUNINO SANTANA

Tipo de Trabalho de Conclusão:

DISSERTAÇÃO

Data Defesa:

19/07/2019

Resumo:

Nas avaliações genéticas de animais de produção modelos lineares infinitesimais são frequentemente assumidos, os quais não consideram efeitos de origem não-aditiva e não-linear o que pode reduzir a capacidade preditiva, principalmente em populações de animais cruzados. Neste contexto, há um crescente interesse em métodos de predição que permitem acesso a esses efeitos, sobretudo, sem assumir pressupostos estatísticos. Para predizer valores genéticos em populações cruzadas, o ponto-chave é utilizar métodos que permitem avaliar efeitos não-aditivos (heterose, complementaridade e perdas epistáticas). No entanto, esses efeitos são altamente correlacionados (o que implica em uma condição estatística desfavorável) e frequentemente assumidos como igualmente relevantes. Neste sentido, implementou-se um modelo de seleção de variáveis (BayesB) para estimar efeitos não-aditivos, bem como obter valores genéticos para peso à desmama em uma população com 16.126 bovinos de corte correspondentes a vinte e seis composições de cruzas. O BayesB provou ser um método poderoso para reduzir os problemas de estimativa provenientes de covariáveis não-aditivas, e efeitos comumente assumidos como importantes (efeitos genéticos não-aditivos maternos e ambos efeitos aditivos da raça não são relevantes) foram estatisticamente irrelevantes, o que contrapõe as predefinições empíricas assumidas em vários estudos. Além dos benefícios estatísticos promovidos pela redução de dimensionalidade, o modelo BayesB pode reduzir a demanda computacional e o tempo de processamento por permitir estimar efeitos não-aditivos e predizer valores genéticos em uma única etapa, ou seja, sem analises adicionais como é atualmente realizado. Isto torna o modelo BayesB muito atrativo para aplicação em programas de melhoramento genético de bovinos de corte cruzados. Por outro lado, no campo da seleção genômica ampla, novos métodos estatísticos vêm sendo propostos para minimizar os efeitos colaterais (alta dimensionalidade e multicolinearidade) advindos da estimativa simultânea de SNPs. No entanto, os estudos aplicados à classificação genômica com aprendizado de máquina são poucos. Neste sentido, os métodos de redes neurais artificiais (RNA) têm tido grande visibilidade, no entanto, cenários com maiores conjuntos de dados genômicos analisados por algoritmos de aprendizado de máquina (ML), como RNA, implicam em um dispendioso processamento computacional. Por esta razão, buscando algoritmos ML mais simples para análise de dados genômicos, foram utilizados os métodos AdaBoost - ADA, Bernoulli Naïve Bayes - NB, Decision Tree - DT, Nearest Neighbors - KN, Multilayer Perceptron MLP, e Support Vector Machine para Classification (SVC) para a classificação genômica de stayability em bovinos Nelore. Neste estudo foi realizada seleção de SNPs para ajustar diferentes conjuntos dados genômicos proveniente dos touros (mil, três mil e cinco mil marcadores), a fim de avaliar o impacto da estrutura de dados na classificação das filhas. Além disso, foi incluído ruído biológico nos fenótipos a fim de desafiar os algoritmos de aprendizado. Nesse sentido, verificou-se que os métodos de ML mais simples, como Naïve Bayes, são superiores à métodos mais elaborados para resolver questões complexas de classificação.

Palavras-Chave:

Bovinos de corte;Teoria bayesiana de decisão estatística;Genômica - Modelos matemáticos;Aprendizado do computador

Abstract:

In genetic evaluations of farm animals, infinitesimal linear models are frequently assumed, which do not consider source of non-additive and nonlinear effects, it might reduce the predictive ability, mainly in populations of crossbred animals. In this context, there have been increasing interest in prediction methods that allow access these effects, above all, without assume statistical presuppositions. For predict breeding values in crossbred populations the key point use methods that allow assess non-additive effects (heterosis, complementarity and epistatic losses). However, these effects are highly correlated and frequently assumed as equally relevant. In the sense, a variable selection model (BayesB) was implemented to estimate non-additive effects as well as obtain breeding values for weaning weight in a population with 16,126 beef cattle corresponding to twenty-six crosses compositions. The BayesB proved to be a powerful method to reduce the estimation problems coming from non-additives covariates, and effects frequently assumed as important (maternal non-additive genetic effects and both breed additive effects are not relevant) were statistical reset, opposing the empirical presets assumed in several studies. In addition to benefits statistical promoted by dimensionality reduction, the BayesB model might reduce computational demand and processing time given that enable estimate non-additive effects and predict breeding values in single step, in other words, without additional analysis as it is currently done. It makes the BayesB model very attractive for application in breeding programs of crossbred beef cattle. On the other hand, in the genome-wide selection field, new statistical methods have been proposed in order to minimize the side effects (high-dimensionality and multicollinearity) coming from simultaneous estimation of SNPs. However, the studies applied to genomic classification with machine learning are few. In the sense, the artificial neural network (ANN) methods have been highlighted, however, scenarios with larger genomic data set analyzed by machine learning (ML) algorithms, as ANN, imply in an expensive computational processing. For this reason, searching ML algorithms simplest, was proposed a study of genome-enabled classification by several machine learning frameworks for stayability trait in Nellore cattle. In this study, was performed SNPs selection to fitting three sires' genomic data set (one, three and five thousand markers), in order to evaluate the impact of structure data set in the classification of daughters. Moreover, was included biological noise in phenotypes in other to challenge to learning algorithms. In this sense, was verify that ML frameworks simplest, as Naïve Bayes, are better to elaborate methods to solve complex issue of classification.

Keyword:

Beef cattle;Bayesian statistical decision theory;Genomics - Mathematical models;Computer learning

Volume:

Páginas:

53

Idioma:

INGLES

Biblioteca Depositária:

UNIVERSIDADE FEDERAL DE VIÇOSA

Autorização de divulgação:

O trabalho possui divulgação autorizada

Área de Concentração:

5.04.02.00-5 GENÉTICA E MELHORAMENTO DOS ANIMAIS DOMÉSTICOS

Linha de Pesquisa:

AVALIAÇÃO GENÉTICA ANIMAL

Projeto de Pesquisa:

COMPARAÇÃO DE MÉTODOS ESTATÍSTICOS APLICADOS NA SELEÇÃO GENÔMICA AMPLA EM MELHORAMENTO ANIMAL

Orientador:

FABYANO FONSECA E SILVA

Categoria:

DOCENTE - PERMANENTE

O orientador principal compôs a banca do discente?

Sim


Nome	Categoria
LUIZ OTAVIO CAMPOS DA SILVA	Participante Externo
RENATO DOMICIANO SILVA ROSADO	Participante Externo
FABYANO FONSECA E SILVA	Docente - PERMANENTE

Tipo de Vínculo Empregatício:

-

Tipo de Instituição:

-

Expectativa de Atuação:

-

Mesma Área de Atuação:

Não

Plataforma Sucupira

Dados do Trabalhos de Conclusão

Contexto

Banca Examinadora

Vínculo