O Gir Leiteiro resulta da seleção fenotípica de animais da raça
zebuína Gir com maior aptidão para produção de leite. Esses animais possuem
tolerância ao calor, às doenças e aos parasitas tropicais. Essas características
adaptativas tornam o Gir Leiteiro um recurso genético importante para a produção
de leite nos trópicos. O estudo e caracterização de variantes estruturais (SV) do
DNA desses indivíduos relacionadas a características adaptativas, de sanidade e
produtivas são de interesse para o melhoramento genético da raça. Um exemplo de
variações estruturais estudadas é a variação no número de cópias (CNV), que
compreende deleção ou duplicação de um segmento de DNA em relação ao
genoma referência. Esse tipo de SV envolve muitos pares de bases, sendo capaz de
alterar a expressão gênica e de ocasionar alterações fenotípicas. Os objetivos deste
trabalho foram: (1) detectar CNV no genoma de bovinos Gir Leiteiro; (2) identificar
regiões de CNV (CNVR) de alta confiabilidade; (3) determinar as regiões genômicas
em que ocorrem as CNV que coincidem com regiões de interesse, tais como genes
e “Quantitative trait loci” (QTL) previamente relacionados às características de
sanidade, reprodução e produção de leite; (4) categorizar funcionalmente os genes
sobrepostos às CNV e identificar as vias biológicas enriquecidas. Após o controle de
qualidade, dados de intensidade de sinal de genotipagem de SNP (polimorfismo de
nucleotídeo único) provenientes do ensaio Bovine HD SNPChip de 545 indivíduos e
dados oriundos de sequenciamento de genoma completo de 38 touros foram
utilizados para a detecção de CNV. Ao total, 547 animais foram utilizados, dos quais
36 possuíam informação de painel de SNP e sequenciamento. Para a identificação
das CNV nos dados de genotipagem foi utilizado o modelo oculto de Markov por
meio do programa PennCNV e, nos dados de sequenciamento, foram utilizadas as
metodologias de “Read Depth”, por meio do programa CNVnator e, “Split-Read” e
“Read Pair”, pelo programa DELLY. O genoma referência ARS_UCD1.2 foi utilizado
para o alinhamento das amostras de sequenciamento e para o mapa de SNP. Dois
conjuntos de regiões de CNV (CNVR) de alta confiança foram definidos, contendo
variantes encontradas nos dados de painéis de SNP e de sequenciamento. Esses
conjuntos foram relativos às CNVR presentes em, no mínimo, 5% da população
estudada (CNVR_POP) e aos indivíduos representativos da população Gir Leiteiro
(CNVR_ANI). No conjunto CNVR_POP, foram encontradas dez CNVR, que
representam 1,04 Mb do genoma bovino. No conjunto CNVR_ANI, foram
encontradas 45 CNVR, que somadas representam mais de 4,4 Mb do genoma
bovino. Os dois conjuntos de CNVR de alta confiança foram unidos para análise
funcional resultando em 48 CNVR únicas e de alta confiança. Essas se
sobrepuseram a 69 genes, incluindo FILIP1, SENP6, CA5A, BANP, HERC2, RHOU,
GBP2, GBP4, GBP6, BLA-DQB, ENSBTAG00000037605 e genes de receptores
olfativos. Na análise de enriquecimento, dois termos de Gene Ontology (GO)
(FDR<0,05) e 17 termos da plataforma Medical Subject Headings (MeSH) (pajustado<
0,05) foram enriquecidos significativamente. Nas CNVR únicas e de alta
confiança foram encontrados 44 “Quantitative trait loci” (QTL) significativamente
associados (p<0,05) a produção (29,54%), reprodução (22,73%), conformação
(18,18%), sanidade (13,64%), leite (13,63%), e carne e carcaça (2,27%). As CNVR
iv
presentes no conjunto CNVR_POP podem ser consideradas como regiões de
polimorfismos no número de cópia, pois estão presentes em mais de 1% da
população estudada. Em adição, esse conjunto pode ser utilizado como critério de
escolha de CNV a serem validadas, como por exemplo, por PCR. Este estudo
poderá auxiliar na escolha de SNP que estejam sobrepostos às CNV para o
desenvolvimento de painéis de genotipagem para o Gir leiteiro. Ainda, a inclusão de
CNVR na avaliação genômica poderá trazer benefícios para o processo de seleção
e deve ser verificada. Nossos resultados abrangem a identificação e caracterização
de 48 CNVR de alta confiança no genoma de bovinos Gir Leiteiro, o que contribui
para a elaboração de um mapa de SV na raça Gir e para o melhor entendimento do
genoma dos zebuínos. As CNVR identificadas neste estudo podem afetar
potencialmente genes que estão envolvidos no processo evolutivo e no controle
fenotípico de característica de interesse para a cadeia produtiva leiteira, como
imunidade, lactação, reprodução, reconhecimento de estímulos e sanidade.