【背景】
鸡是生产蛋白质效率最高的动物之一,为人类提供了超过30%的肉制品,在全球粮食安全中发挥着重要作用。虽然世界上有数百个家养鸡品种,但其肉类产量低,无法满足人类的需求。快速生长的白羽肉鸡被培育出来,通过对生产性状的集约化选择,鸡的生产力不断提高。此外,白羽肉鸡的饲料转化率是牛的10倍,但其碳排放量仅为牛的1/10。这与肉鸡的高产肉量密切相关。然而,通过集约化选择培育出的纯种肉鸡肉制品的遗传基础尚未得到充分研究。
2023年3月发表在Journal of Advanced Research上的题为“Large-scale genomic and transcriptomic analyses elucidate the genetic basis of high meat yield in chickens”的论文,对3个纯种肉鸡(n=748)和6个地方品种/系(n=114)进行了全基因组重测序,并从NCBI数据库获得了12个鸡品种(n=199)的测序数据。此外,还对两个鸡品种(n=129)两个发育阶段的六种组织进行了转录组测序。随后采用基因组关联分析结合cis-eQTL定位和Mendel随机化方法进行了分析。
【样本类型】
3个纯种肉鸡(n=748),6个地方品种/系(n=114)
【技术方法】
全基因组测序,转录组测序,全基因组关联分析,cis-eQTL定位和Mendel随机化方法。
【图形摘要】
【研究结果】
全基因组测序和变异
本研究共获得了862只鸡的全基因组序列,共7.7 Tb原始数据,平均深度为9.2倍,其余199只鸡的其他序列来自SRA数据库。采用严格的变异过滤后,在21个鸡品种/品系中共检测到17622141个高质量SNP。保留的SNP分布在整个基因组中,平均密度为每60个碱基1个SNP。经标注后,GGA16上的新SNP与已知SNP的比例最高,其中21.74%的SNP未被包含在dbSNP中(图1B)。B系是长势快速的纯种肉鸡,羽毛呈白色,携带所有变异SNP 8,663,580个,平均密度为每114个碱基中有1个SNP。其中只有4.7%的SNP被鉴定为新的变异。所有品种的大多数SNP都位于内含子和基因间区域。近几十年来,在纯种肉鸡身上进行了对特定性状的密集选择,导致遗传多样性的减少,包括纯种肉鸡SNP数量和核苷酸多样性的降低(图1C-D)。图中只展示了纯种肉鸡、野生祖先和一些典型的生长缓慢的地方品种鸡。
图1 21个鸡品种/系基因组信息统计
系统发育和数量统计学分析
本研究对这些品种间的遗传关系进行了综合分析。首先,作者基于SNP对21个鸡品种/品系进行PCA(图2A)。进一步进行了遗传共起源分析,通过改变推测的祖先群体数量将所有鸡划分为不同的群体(K=2-10,图2B)。结果发现,品种B在基因上接近康沃尔鸡品种,并且两者都与BRp品种、本地鸡品种和GGS品种分离。以GGS为外群,基于配对遗传距离构建邻接树(图2C)。结果显示,快速生长的纯种肉鸡与GGS的遗传距离很遥远,这证明了对快速生长的纯种肉鸡具有更强的选择力,这与纯种肉鸡连锁不平衡衰减的结果相一致(图2D)。然而,纯种肉鸡(594-720 kb)的连续纯合片段长度略低于本地肉鸡(509-1012 kb)和野生祖先(1198 kb)(图2E)。纯种肉鸡(257,16.2%)的ROH数和平均基因组覆盖率均高于本地鸡(103,7.0%)和GGS(图2E)。
图2 种群遗传多样性与数量统计学历史推断
驯化和人工选择后的遗传负荷
驯化会导致有害突变在鸡和其他家畜中积累。表1计算了每个基因组中有害的和同义的SNP的数量和频率。结果显示,在全基因组中,纯种肉鸡和地方鸡的有害SNP(dSNP)分别比GGS多15.63%和24.05%。虽然3组间同义SNP的数量存在显著差异,但肉鸡和地方鸡的dSNP与同义SNP的比例和dSNP的频率高于GGS。总之,由于驯化和定向育种,在地方鸡和肉鸡中发现了快速积累的dSNP。接下来,通过比较杂合子和纯合子dSNP的水平,发现肉鸡和地方鸡品种中分别有56.75%和69.85%的dSNP保持杂合子状态,而GGS中的dSNP(50.90%)。与当地鸡品种相比,纯种肉鸡携带更多的纯合子(肉鸡与当地鸡544),杂合子较少(肉鸡与当地鸡1427,1885),纯合和杂合dsnp的比例与当地鸡品种之间表现出相似的趋势(表1)。这些结果表明,dSNP主要是在杂合状态下积累的,部分有害的SNP由于集约化养殖而消除。纯种肉鸡的基因组特征
为了推断现代肉鸡选择性扫描的基因组位点,使用了基于XP-CLR和ZLSBL测试的等位基因频率分化。结合这四种方法定义候选发散区域(四种方法中至少需要两个信号),窗口大小为40 kb,步长为20 kb(图3A-B)。通过结合不同方法的结果,在纯种肉鸡群体中鉴定出包含163个蛋白质编码基因和58个lncRNAs的391个窗口列表(图3A-B),58个lncRNAs被注释为新基因。将育种相关的选择性扫描与已知的QTL进行比较,发现选择的ZLSBL分数和XP-CLR值较高但多样性降低的区域涉及与肉类生产、免疫和肉质相关的QTL(图3C),反映了人类对肉类生产的需求以及育种方案下鸡抗病能力的变化。在肉鸡中,在GGA18上观察到一个导联信号,该信号注释了肌球蛋白重链(MYH)基因家族成员(图3A-B, D)。MYH1A、MYH1B、MYH1C等是肌球蛋白的组成成分和快肌纤维的标记物,参与骨骼肌的发育过程。此外,发现3个SNP在纯种肉鸡、地方鸡和GGS之间存在明显差异(图3E)。例如,在纯种肉鸡中固定SNP rs740451868突变等位基因,而在其他动物中固定野生等位基因(图3F)。除MYH基因家族外,肌肉发育相关基因IGF-1、INSR和SOX6被检测到包含前1%的显著分化区域。还发现了一份包含顶级选择性扫窗的基因列表,这些基因在功能上对肉鸡的驯化和定向育种是合理的。例如,TACR3和SLC26A8参与精子发生和运动;CPAMD8和INHBA与眼睛发育有关;GLI3参与了鸡的色素沉着。基于表型或生理过程,GO术语被分为几类,包括心脏发育过程(如GO:0008016、GO:0060047和GO:0060421)、肌肉功能(如GO:0051155、GO:0014834和GO:0006941)、生殖(如GO:0022412、GO:0046545、GO:0007292)、骨骼发育(GO:0060348)和感官(GO:1904058、GO:0021618)。图3 纯种肉鸡选择性扫窗的检测
纯种肉鸡和地方鸡多组织多阶段假定选择基因(PSGs)的转录图谱
为了进一步评估肉鸡B品种和BJY鸡组织中PSGs的表达丰度,研究者对6种组织进行了RNA测序,并计算了每个检测到的基因的计数值(图4A)。基于这两个品种的整个转录组图谱,提出了组织特异性的簇。具体来说,具有相似生理功能的组织更容易聚集在一起。在6个组织中共鉴定出163个PSG中的83个DEG(图4B)。而其他基因似乎在其他组织或发育阶段发挥作用。通过富集分析,作者发现肉鸡B品种和BJY鸡之间的紧密连接通路和肌凝蛋白功能有显著差异。这些功能和基因在B品种中明显占优势。参与这些功能的基因(MYH1A、MYH1B和MYH1C)主要与肌肉发育有关,尤其是胸肌。此外,作者还检测到大多数假定选择的lncRNA不表达,只有9个lncRNA在6个组织中表达,但没有发现显著差异。
接着,研究者对163个PSG中的组织特异性基因(TSG)进行分析,在两个阶段分别发现了18个和22个基因(图4C)。对于这些TSG,超过50%的基因在肌肉组织中高表达,包括TMEM38A和GGA18上的MYH基因家族成员。此外,TPM4、FTCD、DRAM1、TMEM26也分别在心、肝、肺中特异性表达。与组织特异性表达谱一致的是,与BJY鸡相比,MYH基因家族中的一些基因(MYH1B、MYH1C、MYH1G)在D1和D42中在B品种的胸肌中高表达(图4C)。FTCD和BTBD11在肝脏中表达水平较低,并在肉鸡中特异性表达(图4C)。此外,发现COL6A2在腹部脂肪中高表达,但在肝脏中有差异表达。此外,作者还发现SOX6基因在B品种胸肌中的表达高于BJY鸡。综上所述,B品种各器官与BJY鸡有明显差异,可以推断,在转录水平上,肉鸡与本地鸡种的肌肉存在主要差异。MYH基因家族中的基因(MYH1A、MYH1B、MYH1C等)被确定为调节肌肉发育的功能靶点。随后,研究者通过加权基因共表达分析网络(WGCNA)筛选出15620个基因。根据整个转录组谱,共收集到20个模块(图4D-E),除灰色模块外,每个模块包含64-5513个基因。为了获得组织特异性模块,以相关系数r>0.5或r<-0.5,P<1.0-10为标准,评价20个模块与6个组织的相关性。其中鉴定出10个组织特异性模块(图4E)。例如,暗蓝绿色和绿黄色模块与胸肌高度相关。根据GO注释,研究者发现基因在组织特异性模块中的功能富集与组织功能一致。例如,胸肌特异性模块中的基因在调节成肌细胞分化和骨骼肌细胞分化以及糖酵解过程和糖异生中富集(图4F)。白色和黄色模块对应肝脏,这些模块中的基因与氧化还原酶活性、氧化还原过程以及脂肪酸代谢有关。此外,根据GS>0.2和MM>0.8的标准,近23%参与组织特异性模块的基因被确定为与这6个组织相关的核心基因。例如,核心基因的一个子集,包括MYH1A、MYH1C和MYH1D,被发现在胸肌中具有高相关性和特异性表达,这强调了MYH基因家族成员在胸肌中的作用。图4 纯种肉鸡B系和地方品种BJY鸡推定选择基因(PSGs)转录组图谱
GWAS与BrW和BrP的精细映射
BrW和BrP都是鸡育种的关键性状。纯种肉鸡B品种经过数代基因组选择,两种性状也发生了显著变化。因此,研究者使用GWAS方法在B品种中检测与它们相关的遗传标记,结果发现位于GGA5上的一个580 kb的区域(10.81-11.39 Mb)显示出两个胸肌性状的显著峰值(图5A-B)。根据Q-Q图中基因组膨胀因子(0.989 ~ 0.992)的计算结果,未发现群体分层现象。BrW和BrP分别有18个和36个SNPs超过提示阈值。对于两个性状GWAS结果中领先的SNP,基因型遗传变异占比分别为13.61%和9.57%。在该区域内,还发现了INSC、SOX6和4个非编码RNA。随后,研究者根据B品种与地方鸡种和GGS的比较,进行选择性分析,缩小候选区域(图5C),结果发现了一个30kb的区域有明显的选择性特征。为了验证这一结果,作者还对3只快速生长纯种肉鸡、本地鸡和GGS进行了相同的分析。在快速生长的纯种肉鸡中,存在着相似的选择性特征,即富集杂合度降低,核苷酸多态性降低,群体分化更高,而在本地鸡和GGS并非如此。因此,缩小的30 kb区域是一个有效的候选发散区,影响了胸肌性状。研究者在该区域内共检测到133个SNP,其中17个SNP与BrW或BrP相关,并确定了三个主要的单倍型(图5D)。携带单倍型II的鸡胸肌的表型更为突出。单倍型I和单倍型III之间只有一个碱基不同(图5D),单倍型I和单倍型III之间没有表型差异。这种SNP可能不是一个因果变异,没有进一步考虑。因此,作者分析并确定了两种主要的单倍型(rHap I和rHap II)(图5D)。同样,具有不同单倍型的鸡之间也存在显著的表型差异(图5E-F)。此外,还确定了其他20个品种的单倍型状态(图5G);仅检测到速生纯种肉鸡携带单倍型II,其余18个肉鸡品种均未发现该单倍型(图5G)。所有证据表明,单倍型II可能是肌胸肉性状的遗传因素。
图5 纯种肉鸡B系BrW和BrP的GWAS和精细定位
SOX6基因是BrW和BrP的潜在致病基因
为了确定有效基因,研究者首先对胸肌中的候选基因进行了RT-PCR检测。从比较结果来看,根据不同的单倍型,只有SOX6在mRNA和蛋白水平上有差异表达(图6A)。虽然INSC基因没有差异表达,但这四种lncRNA在胸肌肉样本中没有表达。为了最大化挖掘致病基因的可能性,作者检测了候选区域周围基因的表达。然而,在两个精制单倍型样品之间没有发现DEG。此外,作者还确定了不同发育阶段的表达变化,发现SOX6随生长发育过程呈上升趋势,其他基因表达波动较小(图6B)。因此,SOX6被鉴定为可能影响BrW和BrP的功能基因。为了进一步验证,研究者首先进行了基于SOX6周围SNP的cis-eQTL分析。结果发现尽管它们并不有助于缩小区域或单倍型,但是对SOX6表达有显著影响(图6C)。接下来,作者通过SMR来估计SOX6对胸肌性状的影响。SMR共发现14个合格的SNPs,敏感性分析证实不存在异质性(图6D),且SOX6和胸肌性状之间的关联不受任何单个SNP的驱动。然后,SOX6对BrW和BrP均有显著的正向作用(图6E),证明了SOX6是影响胸肌性状的功能基因。虽然已经证实SOX6的表达水平与B品种的BrW和BrP表型之间存在一定的关联,但还需要在其他品种中验证这种关联。研究者比较了当地品种JXY鸡、JL鸡和纯种肉鸡B品种的基因表达和表型变化(图6F-G)。和预期一致,SOX6表达量越低,胸肌尺寸越小,且SOX6表达量与3个品种BrW和BrP呈正相关(图6G-I)。此外,B品种中SOX6的蛋白水平持续升高,这与mRNA的测量结果一致。GWAS表明SOX6可能是调控木质化鸡胸肉(WS)和白条纹鸡胸肉(WB)的潜在致病基因。因此,研究者对WB和WS进行评分,并将其与SOX6相关联,以研究其调控模式。在B品种中,SOX6与WB和WS呈正相关(图6J-K)。CF和肌病之间的关系已在之前的报告和本研究中得到证实,并发现SOX6对CF性状有加速作用。此外,胸肌损失也与SOX6相关。因此,研究者发现SOX6对胸肌病和肉质相关性状具有至关重要的影响。
图6 SOX6基因在不同类型品种中的表达及表型相关性分析
【小结】
本研究构建了一个包含与肌肉发育相关的多个组织和阶段的基因组变异和转录组变异的大规模图谱,为探索肉鸡生产性状的遗传基础提供了充分和有价值的信息。根据基因组和转录组学证据,胸肌是纯种肉鸡与当地鸡或GGS的主要差异。PSGs、TSGs和DEGs有助于更好地理解不同类型鸡的进化差异。SOX6-MYH1s和BrW、BrP及肌病的致病基因SOX6将有助于针对鸡的高肉产量进行选择。