欢迎光临狗万体育客户端! 设为首页 - 加入收藏 
体育投注狗万
 
体育投注狗万
通知公告
农院狗万体育平台网址
农业政策与信息
学术交流
 
Science重磅|历时13年六倍体小麦基因组图谱终完成(详细解读)

2018年8月17日Science杂志在线刊发题为“Shifting the limits in wheat research and breeding using a fully annotated reference genome”的研究论文,相比于2014年7月发布的草图序列,该版本序列组装指标明显提升,基因组序列由原先的10.2Gb上升到14.5Gb,Scaffold N50提升到22.8Mb。该研究论文是在国际小麦基因组测序联盟(International Wheat Genome Sequencing Consortium,IWGSC)协作下完成的,西北农林科技大学旱区作物逆境生物学国家重点实验室的宋卫宁教授团队作为中国唯一参与并承担实质性研究工作的团队,完成了其中7DL染色体物理图谱构建及序列图谱破译工作。

一、国际小麦基因组测序联盟

    IWGSC在68个国家有2400个成员,是一个由小麦种植者、植物科学家、公共和私人育种家在2005年成立的一个国际合作联盟。IWGSC的愿景是获得面包小麦的高质量基因组序列,它是加速品种改良发展的基础。

    为了实现此愿景,联盟采用来自捷克的Jaroslav Doležel教授高精湛的流式细胞仪分离技术,将普通小麦中国春(Chinese Spring)的21条染色体进行了分离。除了3B染色体之外,其余染色体均分为长臂(L)和短臂(S),并构建了相应的BAC文库,后续的物理图谱构建和BAC测序则由IWGSC的各成员国分担,我们国家西北农林科技大学主要是负责7DL物理图谱构建与BAC测序。

二、IWGSC的四个关键里程碑

    面包小麦是世界上种植面积最大的小麦栽培作物,覆盖世界小麦种植区域的95%以上。获取它的基因组序列对于基因的改良是至关重要的。IWGSC采用分步走的策略,以确保小麦育种和小麦产业能够与小麦基因组基础研究并行并立即获得显著产出。IWGSC在进行小麦基因组组装过程中四个里程碑:

1)利用21个面包小麦染色体的基因组survey序列,实现对小麦基因的每条染色体的定位;

2)开发物理地图,为测序提供资源;

3)建立每个染色体一个参考序列;

4)通过整合基于染色体的基因组资源与IWGSC组装的全基因组序列,获得金标准的小麦参考基因组序列。

第一个里程碑是2014年7月发表在《科学》杂志上的以染色体为基础的基因组草图序列。所有染色体的物理图谱(里程碑2)在2015年底完成。在2016年1月底,全基因组鸟枪法获得每个染色体(IWGSC WGAV0.4-里程碑3)参考序列,这是在2016年6月前已经公布的。通过整合基于染色体图谱和序列资源与全基因组组装(IWGSC RefSeq v1.0)获得一个高质量的被注释的参考基因组序列,已在2017年1月公布,但限制使用。在2018年7月,所有IWGSC参考序列资源被公开提供,任何科研工作者均可以使用。

小麦相关数据主要位于URGI网站上:https://wheat-urgi.versailles.inra.fr/

三、基因组测序材料-中国春品种

    普通小麦是由祖先野生的一粒小麦(乌拉尔图小麦,含AA基因组)与拟斯卑尔托山羊草(Aegilops speltoides,含BB基因组)杂交形成四倍体野生二粒小麦(Triticum turgidum,含有AABB基因组)。在大约8000以前,亚洲西部肥沃新月地带,野生粗山羊草双二倍体(2n = 14; DD)和四倍体小麦 (2n = 4x = 28; AABB)自发杂交进而产生了六倍体小麦(T. aestivum; 2n = 6x = 42; AABBDD)。六倍体小麦的各祖先种均已完成测序,相关文献见下文。

    此次六倍体小麦测序品种选择了中国春,顾名思义,其来源肯定是中国呀。那么为什么全世界会选择它作为测序材料呢

    因为它有非常重要的遗传价值。中国春是种植在四川成都平原的一个地方品种,最早是通过传教士传入西方的,起初被称作为Chinese White,后来被改为Chinese Spring,即中国春。早在20世纪初,学者就发现中国春与黑麦非常容易杂交,并且利用中国春材料可以制造出单体、单端体、双端体、缺体、三体、缺体一四体等一系列非整倍体材料,推动了小麦遗传学研究领域的发展。后来研究者们又以人工的方式使中国春突变得到能够诱导部分同源染色体配对的基因突变体phlb,并被广泛地应用于远缘杂交进行小麦外源基因转移。因此中国春系列材料成了众所周知的小麦遗传学和外源基因转移等研究的工具和对照材料(摘自:刘登才, 郑有良, & 兰秀锦. (2003). 小麦中国春遗传背景的育种改良. 中国农业科学, 36(11), 1383-1389.),而选择它作为基因组测序材料,也是必然的。

四、文章解读

研究背景

    小麦是作为世界各地最为广泛种植的谷物之一,提供了19%人类能量消耗,相较于其他作物,小麦是唯一一个尚未完成全基因组测序的物种。究其原因,小麦基因组体量庞大,是人类基因组的5倍,是水稻基因组的40倍,作为典型的异源多倍体基因组,小麦基因组由三套相似而又不同的基因组整合在一起,最终形成一个极为复杂的六倍体基因组,同时其重复序列高,给研究工作带来巨大障碍。

研究结果

1研究以小麦模式品系CSChinese Spring中国春为材料,整合现有的各种数据资源,包括遗传图谱,以及单染色体BAC序列信息等。重新修正基因组大小,推测为为15.4~15.8Gb;利用DeNovoMAGIC2(来自NRgene公司)软件进行短片段组装,然后利用Hi-C技术和高密度遗传图谱(POPSEQ)进行染色体挂载。错误的组装的序列利用CSSchromosome survey sequence)、Hi-CPOPSEQ进行识别和断开纠正。另外还测了大量的8-16foldBAC,这些对于连接scaffold组成超大scaffold起了重要作用。 最终拼装获得了1,601super-scaffold,大小为~14.5 GBscaffold N5022.8 Mb 的小麦基因组序列。研究中对ABD三套异源染色体组进行了严格区分,其中97%的序列被定位到ABD亚基因组上,只有大约481Mb的序列没有挂载到染色体。

文章对获得的基因组进行了较为严格的评估。

    1)遗传图评估,利用ABD的遗传图和染色体进行共线性评估,其中平均相关系数在0.98

    2)利用了7832genetic position4745GBS数据得到的遗传标记跟染色体上位置的对应分析,其中相关系数在0.9860.987

    31.24百万个neighbor insertion siteISBPs)其中97%BAC和基因组直接存在共线性(误差2Kb内)

    4)从CSS或者ISBP中获的编码或者非编码的基因序列,在基因组中出现的比例分别为99%97%

可以说这是迄今为止完成度最高且质量值最好的小麦基因组序列。

2研究整合了21条小麦染色体参考序列、物理图谱及多种公共资源数据,获得了超过470万个分子标记,该数据将极大的推动后续的分子育种水平上的应用。

3、利用Hi-C染色质构象捕获技术及CSS数据,首次对小麦着丝粒区间大小进行了估算,大小估值为4.9MB。整个基因组重复序列含量为85%,三套亚基因组之间无明显差异。

4、在完整拼装的染色体序列基础上,注释并获得了共107,891个小麦基因,较此前公开的小麦基因组注释信息,这是最为完整和全面的小麦基因组注释版本。注释流程部分分别采用了TriAnnotMIPS/PGSB两套流程,然后利用Mikado进行整合。其中得到了107,891个高可信度的基因,此外还有161,537个低可信度的基因。BUSCO评估有3complete copy的占比达到了90%,至少一个complete copy的占到了99%,证明基因组与基因预测的完整性很高。

此外通过探究了同源基因的亚基因组的分布模式及动态演化规律,结果发现三套染色体组之间的同源基因比例基本持平,鉴于D基因组进入小麦的时间较为落后,其同源基因含量水平相对较高,且假基因数量较少。同时小麦中未发现因植物多倍化过程中基因的缺失将导致基因组间的分歧显现,小麦基因组中的基因丢失及基因的位移是与其杂交事件发生的先后顺序的时间跨度成正比的。

5、该研究整合了850个转录组数据,探究了小麦不同生长发育时期及生态环境下的表达谱模式,通过共表达网络模块分析及GO term富集分析,揭示了一系列开花时间相关的上下游基因。

6、研究对小麦特有的扩张的基因家族进行了功能富集分析,结果发现扩张的基因显著富集在籽粒产量,生物非生物胁迫逆境胁迫相应,花粉育性等类组之下,这与人工育种中倾向与选择适应不同气候环境并具高产量的小麦品种的倾向相关联。

7研究对响应非生物胁迫及抗虫性的SSt1 QTL基因进行剖析,以此为例探究了该小麦基因组在实际生产过程中的应用价值。

小麦染色体基因组测序和注释的全面完成,可以大大加快研究小麦育种研究的步伐,有利于培育高产、抗旱、抗盐、抗病虫的小麦新品种,更好全球气候变化及人口膨胀带来的食品短缺的挑战,为小麦基因组改良工作奠定了基础。

数据资源

IWGSC RefSeq v1.0参考基因组、注释信息及其余该文章相关数据均可从https://wheat-urgi.versailles.inra.fr/Seq-Repository 下载获得,测序原始数据存于SRA下登录号为SRP114784,全染色体/染色体臂BAC文库数据信息位于https://cnrgv.toulouse.inra.fr/en/Library/Wheat

 

五、小麦基因组主要已发表文献

小编总结目前二倍体、四倍体和六倍体小麦的组装情况

1. Brenchley, R., Spannagl, M., Pfeifer, M., Barker, G. L., D'Amore, R., & Allen, A. M., et al. (2012). Analysis of the bread wheat genome using whole-genome shotgun sequencing. Nature, 491(7426), 705-710.

2. Jia, J., Zhao, S., Kong, X., Li, Y., Zhao, G., He, W., ... & Jing, R. (2013). Aegilops tauschii draft genome sequence reveals a gene repertoire for wheat adaptation. Nature, 496(7443), 91.

3. Ling, H. Q., Zhao, S., Liu, D., Wang, J., Sun, H., Zhang, C., ... & Gao, C. (2013). Draft genome of the wheat A-genome progenitor Triticum urartu.Nature, 496(7443), 87.

4. International Wheat Genome Sequencing Consortium. (2014). A chromosome-based draft sequence of the hexaploid bread wheat (Triticum aestivum) genome. Science, 345(6194), 1251788.

5. Choulet, F., Alberti, A., Theil, S., Glover, N., Barbe, V., & Daron, J., et al. (2014). Structural and functional partitioning of bread wheat chromosome 3b. Science, 345(6194), 1249721.

6. Chapman, J. A., Mascher, M., Buluç, A., Barry, K., Georganas, E., Session, A., ... & Schmutz, J. (2015). A whole-genome shotgun approach for assembling and anchoring the hexaploid bread wheat genome. Genome biology, 16(1), 26.

7. Zimin, A. V., Puiu, D., Hall, R., Kingan, S., Clavijo, B. J., & Salzberg, S. L. (2017). The first near-complete assembly of the hexaploid bread wheat genome, Triticum aestivum. Gigascience.

8. Clavijo, B. J., Venturini, L., Schudoma, C., Accinelli, G. G., Kaithakottil, G., Wright, J., ... & Lipscombe, J. (2017). An improved assembly and annotation of the allohexaploid wheat genome identifies complete families of agronomic genes and provides genomic evidence for chromosomal translocations.Genome research.

9. Zimin, A. V., Puiu, D., Luo, M. C., Zhu, T., Koren, S., Marçais, G., ... & Salzberg, S. L. (2017). Hybrid assembly of the large and highly repetitive genome of Aegilops tauschii, a progenitor of bread wheat, with the MaSuRCA mega-reads algorithm. Genome research.

10. Avni, R., Nave, M., Barad, O., Baruch, K., Twardziok, S. O., Gundlach, H., ... & Jordan, K. W. (2017). Wild emmer genome architecture and diversity elucidate wheat evolution and domestication. Science, 357(6346), 93-97.

11. Luo, M. C., Gu, Y. Q., Puiu, D., Wang, H., Twardziok, S. O., Deal, K. R., ... & McGuire, P. E. (2017). Genome sequence of the progenitor of the wheat D genome Aegilops tauschii. Nature, 551(7681).

12. Zhao, G., Zou, C., Li, K., Wang, K., Li, T., Gao, L., ... & Jiang, W. (2017). The Aegilops tauschii genome reveals multiple impacts of transposons. Nature plants, 3(12), 946.

 11.Ling, H. Q., Ma, B., Shi, X., Liu, H., Dong, L., Sun, H., ... & Yu, Y. (2018). Genome sequence of the progenitor of wheat A subgenome Triticum urartu.Nature, 557(7705), 424.

六、作者介绍

1. 宋卫宁

  

宋卫宁,博士,教授,博士生导师。 1982级7月湖南农业大学植保系植物保护专业毕业,1987年8月获澳大利亚阿德莱德大学微生物生理专业硕士学位,1994年12月获阿德莱德大学麦类基因组学博士学位, 1992年-1997年任澳大利亚昆士兰农业生物技术中心及南十字大学植物遗传资源保存中心分子生物学家,1997年-2002年任澳大利亚昆士兰州政府莱丝里研究中心分子生物学实验室负责人,2002年6月-2006年1月任以色列海法大学进化研究所高级研究员,2006年2月全职回西北农林科技大学体育投注狗万工作。先后主持和参加科研项目20余项,围绕小麦基因组物理图谱构建及测序、小麦起源、驯化及进化、植物抗逆的分子生物学基础及野生麦类优异种质资源挖掘及基因发掘等领域开展研究工作。目前主持国家自然科学基金国际合作项目“优异抗旱小麦种质的筛选、相关基因挖掘及育种利用(31561143005)”,国家自然科学基金面上项目“恶性入侵植物紫茎泽兰种群遗传特性与入侵机制研究(31471825)”和“大麦盐胁迫相关miRNA的鉴定与功能分析(31271705)”,十三五国家重点研发项目子课题“小麦重要基因单倍型分析(2016YFD0100302)”和“小麦重要性状的功能基因组与调控网络(2016YFD0101004)”,农业部948项目“国际干旱地区农业研究中心优异抗旱耐盐小麦种质资源的引进与利用(2010-S1)”等。参与编著Taylor & Francis CRC 出版社和Springer Science出版社初步的英文教材4部。

2. 聂小军

西北农林科技大学硕士生导师, 2007级7月西北农林科技大学体育投注狗万农学专业毕业,2013年6月,获西北农林科技大学作物遗传育种博士学位。博士期间主要参与了小麦基因组7DL的分析以及紫茎泽兰基因组分析工作。2013年7月,留校任教工作。研究方向为植物基因组学,植物抗逆种质与基因发掘。

3. 童维

西北农林科技大学硕士生导师。2000年毕业于华中师范大学,同年到北京华大基因研究中心生物信息部工作,参加了1%人类基因组、水稻基因组等重大研究项目。于2013年1月获得中科院北京基因组研究所的博士学位(生物信息学方向)。研究方向生物信息学,植物系统生物学。

发布时间:2018/08/18 浏览次数:
 
 

Copyright © 2014-2015  狗万体育客户端 版权所有 地址:山东省烟台市芝罘区红旗中路186号 邮编:264025 鲁ICP备号:09096634   技术支持:源通网络