No Melhoramento Animal existe um histórico de utilizar dados fenotípicos dos melhores
animais de uma geração para produzir a próxima geração. Entretanto, é sabido que a
herdabilidade das características de interesse depende de uma base genética e podem ser
explicadas através do DNA. Na genética quantitativa é usado o modelo básico que diz que o
fenótipo é a soma do genótipo (composição genética do indivíduo) e do ambiente, entretanto,
genótipos diferentes podem desempenhar resultados superiores ou inferiores dependendo do
ambiente em que estão inseridos, com isso, houve a necessidade de incluir o fator interação
entre o genótipo e o ambiente. Com o desenvolvimento tecnológico, o sequenciamento de
nova geração (NGS) tem trazido avanços no entendimento de características complexas no
melhoramento animal, com o sequenciamento completo do genoma dos animais domésticos
foi possível melhor entender como variantes causais e estruturais tem influenciado o
fenótipo. Com o uso do NGS é possível quantificar o mRNA que está sendo expresso de um
determinado gene que influencia determinada característica (transcriptoma – RNA-Seq),
descobrir alterações epigenéticas (ChIP-Seq) e, então, conhecer melhor os mecanismos
moleculares que modulam a característica e tecido em questão; aumentar a densidade de
marcadores de nucleotídeos simples (SNP) com o sequenciamento do genoma completo
(WGS) e então, descobrir associações genômicas mais significativas e mais precisas. Com o
advento do NGS veio a necessidade de o desenvolvimento poder computacional e novas
ferramentas capazes de analisar e armazenar a quantidade de dados gerada. Em função disso,
o desenvolvimento de softwares capazes de realizar o controle de qualidade, mapeamento
das sequencias contra o genoma de referencia e, quantificar os transcritos (no caso de RNASeq)
tem se tornado necessário e, lidar com esse tipo de análise pode ser difícil para aqueles
que não tem familiaridade com sistemas computacionais. Visto isso foi desenvolvido um
pipeline de uso amigável para analisar dados de RNA-Seq, realizando controle de qualidade,
mapeamento e contagem de sequencias. O BAQCOM (Bioinformatics Analysis of Quality
Control and Mapping) tem se mostrado eficiente e rápido. Utilizando dados de RNA-Seq
objetivou-se conhecer o perfil global de expressão gênica envolvido em Condronecrose
Bacteriana com Osteomielite em frangos (BCO), que é desenvolvida nas placas de
crescimento ósseo do fêmur e tíbia e colonizada por bactérias oportunistas. Utilizando
amostras de tíbia de seis frangos de linhagem comercial (três afetados por BCO e três sadios),
foram encontrados 192 genes diferencialmente expressos (FDR < 0.05) divididos em 63
upregulados e 129 downregulados. 26 genes e sete fatores de transcrição foram encontrados
downregulados explicando BCO em tíbia, podendo concluir que a BCO em frangos pode ser
causada pela baixa expressão de genes relacionados ao crescimento ósseo e, que, a
proliferação bacteriana parece ser um processo secundário. Outro cenário para o uso de NGS
é o mapeamento fino de região de QTL (quantitative Traits Loci). Uma região de QTL no
cromossomo 5 associada com espessura de toucinho foi encontrada em quatro linhagens
comercial de suínos (sintético baseado em large-white, Pietrain, Landrace e Large-White).
Espessura de toucinho é importante para eficiência alimentar e qualidade de carne, além de
ser reservatório energético. Embora Genome Wide Association Study (GWAS) tem sido
amplamente usada associada à fenótipos, ainda há a necessidade de reduzir a região de
associação se o objetivo é achar mutações causais. Por essa razão objetivou-se reduzir esta
região de QTL usando dados de WGS, RNA-Seq e ChIP-Seq. A partir do SNP mais
significativo do GWAS (leadSNP – SSC5:66103958), os haplótipos foram postos em fase e
selecionados haplótipos de tamanho 41 SNPs (20 < leadSNP > 20). Foi selecionado o
haplótipo mais frequente entre as linhagens utilizadas, então foi possível identificar uma
região de 5 SNPs (2 < leadSNP > 2) presente em todas as linhagens. A partir desta região foi
realizado o mapeamento fino, primeiro foi utilizado WGS e foi identificado três variantes
candidatas (SSC5:66097445, SSC5:66099282 e SSC5c66103958). Nesta região entre
SSC5:66097445-66103958 foram encontradas marcas epigenéticas H3K27me3 e H3K4me3
utilizado dados de ChIP-Seq de macrófagos alveolar de suínos, indicando regulação de
expressão gênica durante período de desenvolvimento pre-natal. Em função disso foram
utilizados RNA-Seq de embriões e fetos, onde foi possível encontrar alta expressão do gene
CCND2, que está relacionado ao desenvolvimento e diferenciação de tecido adiposo, sendo
um forte candidato a gene causal para espessura de toucinho. É possível, também, concluir
que nesta região pode ter elementos regulatórios envolvidos na expressão do gene CCND2
no desenvolvimento embrionário e que, o impacto epigenético durante a vida embrionária
pode impactar a produção de características na vida adulta. Nessa tese foi usado dados de
sequenciamento, genotipagem, fenótipo, transcriptoma e ChIP-Seq, integrando todos para
estreitar regiões de interesse no genoma, assim, resultando e propondo ferramentas para
melhorar o melhoramento animal no futuro.