IF=8.7 | T2T康乃馨基因组揭示了相同基因在不同单倍型基因组中的表达差异

2024年1月 Horticulture Research杂志在线发表了一篇题为“The haplotype-resolved telomere-to-telomere carnation (Dianthus caryophyllus) genome reveals the correlation between genome ar...


2024年1月 Horticulture Research杂志在线发表了一篇题为“The haplotype-resolved telomere-to-telomere carnation (Dianthus caryophyllus) genome reveals the correlation between genome architecture and gene expression”的基因组组装+基因表达水平相关性分析的文章

研究背景

康乃馨(Dianthus caryophyllus)是一种极具商业价值的花卉,因其丰富的颜色和形态以及出色的储藏和瓶插寿命而受到市场的青睐。为了满足市场对新品种的需求,需要加快康乃馨的育种进程。因此,全面了解康乃馨对于指导育种方向至关重要。

研究结果

1. 单倍型T2T基因组组装

基因组组装:作者采用‘Baltico’的新鲜叶片进行了4种测序,将ul ONT、HiFi、和Hi-C数据投入到hifiasm这个软件中进行初步的组装。删除细胞器基因组和一些可能存在的污染情况。用3D-DNA和 JUICER借助hi-c数据将基因组挂载到染色体水平,之后发现两个单倍型分别存在14个gaps,然后用ONT测序数据对目前的基因组进行补洞,把gap给填充了。最后再使用pilon这个软件抛光填充后的基因组也就是无gap的‘Baltico’基因组。

基因注释:从同源预测、从头预测和转录组预测三个方面开展的注释,两个单倍型分别注释到41,669和40,486个基因。

基因组评估:填充gap后,两个单倍型基因组大小增加;有胚植物和双子叶植物数据库的BUSCO评估完整值都得到提升(97%以上),LAI达到了23以上,与二代测序数据的QV分别为 44.916 和 49.470;作者还把组装结果和康乃馨的遗传图谱进行了对应,找到遗传标记在物理图谱的位置。发现两个单倍型和遗传图谱的相关性非常高,侧面说明了组装的可靠性。

attachments-2024-04-8H4Zfta4661cbc63a80c4.png


2. 两个单倍型与“Scarlet Queen”基因组的比较

两个单倍型的比较:共鉴定得到584,486个SNP和1两个单倍型与SQ基因组的比较:把两个单倍型都比对到SQ基因组上,发现都存在很强的共线性。两个单倍型的共线性分别为80.78%和78.4%。但是这两个单倍型的共线性区域是有所差别的,比如在 Chr2中,SQ 和 Hap2 之间的共线性区域很大,而和 Hap1 之间的共线性区域百分比只有 65。Chr3中情况正好相反。而两个单倍型组装和SQ之间存在1980个以上的结构变异,说明不同品种之间存在着巨大的差异。

attachments-2024-04-ZTYAwCNw661cbc53a294c.png

两个单倍型与SQ基因组的比较:把两个单倍型都比对到SQ基因组上,发现都存在很强的共线性。两个单倍型的共线性分别为80.78%和78.4%。但是这两个单倍型的共线性区域是有所差别的,比如在 Chr2中,SQ 和 Hap2 之间的共线性区域很大,而和 Hap1 之间的共线性区域百分比只有 65。Chr3中情况正好相反。而两个单倍型组装和SQ之间存在1980个以上的结构变异,说明不同品种之间存在着巨大的差异。


重复区域预测:新组装的两个单倍型每条染色体都可以检测到端粒,比而SQ基因组缺少九个端粒。利用高阶重复特征区域识别着丝粒,仅发现10和13两条染色体存在着丝粒。
在三个基因组上,NLR(核苷酸结合位点富含亮氨酸重复序列 )受体数目、分布都存在差异,但是他们占比最多的都是CC-NBARC-LRR这个类型。不同单倍型的分布模式具有可比性,可以检测到细微差异。
attachments-2024-04-hKg0cSkx661cbc1c6c3d8.png

3. 不同单倍型之间的等位基因特异性表达分析
ASE:allele-specific expression
将RNA测序数据比对到两个单倍型上,这些基因的表达存在三种情况:分别是在两种单倍型的表达是均衡的、在一个单倍型中存在表达,而另一种单倍型不存在表达、以及在两个单倍型都表达,但是一个表达很多,一个表达很少。仅在一个单倍型表达的基因是单等位基因。在两个单倍型中一共检测到了10,256个等位基因,其中有2,907、2,779和2,487个等位基因分别在根、花和叶中表现出不平衡表达。在三种组织中有4284个等位基因共表达。

在花、叶和根中,单等位基因表达的Ka/Ks值高于双等位基因表达的等位基因的Ka/Ks值,表明大多数双表达等位基因在进化上是保守的。

在三个组织中的双表达等位基因主要富集在与“RNA结合”、“结构分子活性”和“核糖体结构成分”相关的term上;而表现出不平衡表达的等位基因,在催化活性”、“转运蛋白活性”和“跨膜转运蛋白活性”上显着富集。

attachments-2024-04-ksU3QwxP661cbc0b416bc.png

4. 基因结构和表达的相关性分析
作者就基因结构与表达水平的相关性进行了研究,此前有研究表示,外显子、基因和内含子的长度以及 TE 插入可能会影响基因表达水平。以花叶根三个组织中的基因表达率进行了柱状图的绘制,纵坐标是表达的基因在全部基因的占比,发现在两个单倍型里长度较长的基因(无论基因、CDS 或内含子)表达率显著高于比较短的基因。又用以10为底FPKM作为表达量,绘制小提琴图,可以看到,除了Hap1叶和两种单倍型的根组织基因表达水平不受到CDS长度影响,其余的组合都受到长度影响。同时统计含有不同外显子的基因表达比例,横坐标是外显子的数目。随着外显子数目的增加,基因表达率也在上升,但是基因表达水平变化不是非常大。对含有不同数目外显子的基因进行富集发现具有功能偏好性。除了长度和外显子数目,作者还统计了TE插入的位置和表达水平影响。发现不管在哪个单倍型中,TE都更倾向于插入到基因侧翼区域,主要集中在基因上游。而插入到基因中的TE大多数位于内含子中。F图可以看到存在TE插入相关的基因的表达率显着降低。
attachments-2024-04-oghIOpvg661cbbc9a4e22.png


  • 发表于 2024-04-15 13:34
  • 阅读 ( 1036 )
  • 分类:文献解读

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
Ti Amo
Ti Amo

48 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章