Nas avaliações genéticas de animais de produção modelos lineares
infinitesimais são frequentemente assumidos, os quais não consideram
efeitos de origem não-aditiva e não-linear o que pode reduzir a capacidade
preditiva, principalmente em populações de animais cruzados. Neste
contexto, há um crescente interesse em métodos de predição que permitem
acesso a esses efeitos, sobretudo, sem assumir pressupostos estatísticos.
Para predizer valores genéticos em populações cruzadas, o ponto-chave é
utilizar métodos que permitem avaliar efeitos não-aditivos (heterose,
complementaridade e perdas epistáticas). No entanto, esses efeitos são
altamente correlacionados (o que implica em uma condição estatística
desfavorável) e frequentemente assumidos como igualmente relevantes.
Neste sentido, implementou-se um modelo de seleção de variáveis (BayesB)
para estimar efeitos não-aditivos, bem como obter valores genéticos para
peso à desmama em uma população com 16.126 bovinos de corte
correspondentes a vinte e seis composições de cruzas. O BayesB provou ser
um método poderoso para reduzir os problemas de estimativa provenientes
de covariáveis não-aditivas, e efeitos comumente assumidos como
importantes (efeitos genéticos não-aditivos maternos e ambos efeitos aditivos
da raça não são relevantes) foram estatisticamente irrelevantes, o que
contrapõe as predefinições empíricas assumidas em vários estudos. Além dos
benefícios estatísticos promovidos pela redução de dimensionalidade, o
modelo BayesB pode reduzir a demanda computacional e o tempo de
processamento por permitir estimar efeitos não-aditivos e predizer valores
genéticos em uma única etapa, ou seja, sem analises adicionais como é
atualmente realizado. Isto torna o modelo BayesB muito atrativo para
aplicação em programas de melhoramento genético de bovinos de corte
cruzados. Por outro lado, no campo da seleção genômica ampla, novos
métodos estatísticos vêm sendo propostos para minimizar os efeitos
colaterais (alta dimensionalidade e multicolinearidade) advindos da estimativa
simultânea de SNPs. No entanto, os estudos aplicados à classificação
genômica com aprendizado de máquina são poucos. Neste sentido, os
métodos de redes neurais artificiais (RNA) têm tido grande visibilidade, no
entanto, cenários com maiores conjuntos de dados genômicos analisados por
algoritmos de aprendizado de máquina (ML), como RNA, implicam em um
dispendioso processamento computacional. Por esta razão, buscando
algoritmos ML mais simples para análise de dados genômicos, foram
utilizados os métodos AdaBoost - ADA, Bernoulli Naïve Bayes - NB, Decision
Tree - DT, Nearest Neighbors - KN, Multilayer Perceptron MLP, e Support
Vector Machine para Classification (SVC) para a classificação genômica de
stayability em bovinos Nelore. Neste estudo foi realizada seleção de SNPs
para ajustar diferentes conjuntos dados genômicos proveniente dos touros
(mil, três mil e cinco mil marcadores), a fim de avaliar o impacto da estrutura
de dados na classificação das filhas. Além disso, foi incluído ruído biológico
nos fenótipos a fim de desafiar os algoritmos de aprendizado. Nesse sentido,
verificou-se que os métodos de ML mais simples, como Naïve Bayes, são
superiores à métodos mais elaborados para resolver questões complexas de
classificação.