《自然·方法学》上发表了第三代测序数据组装算法Wtdbg,将基因组分析速度提升5倍

来源:医生在线 时间:2019/12/23 16:39 阅读:673
分享
  自基因组学技术问世以来,测序与分析一直是基因组学技术中较主要的两个环节。实际上,与繁重的测序工作相比,基因组的分析也同样复杂,需要耗费大量时间。
  然而,随着近年来基因组学技术发展突飞猛进,这种状况正在逐步改变。

  日前,中国农业科学院深圳农业基因组研究所阮珏团队在《自然·方法学》上发表了第三代测序数据组装算法Wtdbg,极大提高三代测序数据的分析效率,与今年4月发表在《自然·生物技术》上的Flye算法相比,分析速度提升了5倍,并首 次将测序数据分析时间降低到少于测序数据产出时间。




  “如今,完成一个人的全基因组测序是普通家庭都可以负担起费用的‘平常’事情了。以三代测序为例,完成个人全基因组测序仅需1天时间、费用低于5万元。”论文作者、中国农业科学院深圳农业基因组研究所研究员阮珏这样说。
  在测序技术日新月异的同时,分析技术也在共同成长。以人类基因组组装为例,在2014年需要消耗50万个CPU小时,且只能在超大计算机集群上进行。因而,以全基因组组装方式对群体进行测序分析已经成为生物医学研究的趋势。
  Wtdbg算法的开发得益于一个新的组装图理论——模糊布鲁因图的提出。模糊布鲁因图借鉴了德布鲁因图的思想,将测序数据切分为固定长度的短串,再从短串构建出的图上恢复出全基因组序列。
  2013年起,阮珏和美国哈佛医学院的博士李恒在德布鲁因图基础上,设计出一个新的组装图理论——模糊布鲁因图。通过重新对短串进行定义,它能够容忍高噪音数据,并随后对生成组装图和恢复基因组序列做了大量相应的重构,使其兼具高 效率和高容错的优点。
  不断进化的新算法
  近年来,生物信息学领域的科学家们致力于改变这种数据产出速度远高于数据分析速度的尴尬状况,不断开发出更高 效的组装分析算法。
  2013年,阮珏与李恒合作开始了测序数据分析方法如组装算法的开发,力求推动测序数据的分析速度更快、分析质量更高。2016年,他们的研究结束,并将研究成果Wtdbg对所有人免费开放使用。3年来,这项成果不仅被几十篇学术论文引用,还被国内多家基因测序分析公司作为主要组装分析工具,并且在2019年世界大学生超算竞赛中作为性能测试赛题。
  “我们收到大量反馈,不现有助修订算法软件中的漏洞,还带来了新想法和思路。算法需要不断在实践中完善,只有通过更多实际应用,我们才能更有效调整改进这套算法。目前的算法与2016年相比已经是2.0版本,而更高版本的算法于今年初也开始了研究。

医生在线肿瘤频道温馨提醒:文章描述内容可能并不符合您的实际病情,建议您可直接咨询 在线客服 或免费咨询热线:400-082-1008

相关文章

如何选择肿瘤癌症基因检测方案? 肿瘤基因测试范围从简单到复杂。简单的测试只检测一种基因中的一种类型的突变。比如仅在BRAF位置c.1799处寻找特定T到A置换突变的试验。复杂的测试可以同时检测所有主要类型的基因改变,包括替换,重复,插入,缺失,插入,基因拷贝数变异和结构变体,包括倒位和易位。[详细] 用于基因治疗的病毒或有致癌风险 就在基因治疗似乎终于实现了它的承诺之际,一项研究唤起了人们对病毒载体的长期担忧——很多努力正是依赖于病毒载体将治疗基因导入患者体内。这种“载体”是腺相关病毒(AAV)的一个精简版本,人们认为它是安全的,因其几乎不会将携带的人类DNA编织到细胞染色体中,而这有可能激 活致癌基因。[详细] NEJM重磅:长期随访发现基因治疗有效治疗血友病A 腺相关病毒(AAV)介导的基因疗法因其通过分别递送编码功能因子VIII或IX因子蛋白的互补DNA来治疗许多单基因疾病(包括A型和B型血友病)的潜力而得到越来越多的认可。 迄今为止,使用AAV血清型5载体(AAV5)治疗血友病A,单次AAV介导的研究治疗已显示出1年的临床改善。[详细] 109种基因变异,会让人患上精神疾病 根据中国疾病预防控制局公布的数据显示,截止2017年底,我国各类精神疾病患者达2亿多人,总患病率高达17.5%。严重精神障碍患者超过1600多万人,发病率超过1%,且呈逐年上升趋势。[详细] Bio Rxiv:科学家利用“基因剪刀”CRISPR技术创造了新一代的基因猪 如果猪可以将器官捐献给人类,那么每年将有多少器官衰竭患者因此获救?据《科学》网站报道,12月19日发表于Bio Rxiv一项研究指出,科学家利用“基因剪刀”CRISPR技术创造了新一代的基因猪,称它的体内组织已经具备安全移植到人类体内所需特征。[详细] 研究遗传性癌症易感基因-TruSight Hereditary Cancer Panel 用于研究遗传性癌症易感基因的全新panel——TruSight™ Hereditary Cancer Panel with Nextera™ Flex for Enrichment现已发布!TruSight Hereditary Cancer Panel是我们与遗传性癌症领域专家合作开发的产品,用户仅需两天即可识别与遗传性癌症相关的变异。[详细] 《自然·方法学》上发表了第三代测序数据组装算法Wtdbg,将基因组分析速度提升5倍 自基因组学技术问世以来,测序与分析一直是基因组学技术中最主要的两个环节。实际上,与繁重的测序工作相比,基因组的分析也同样复杂,需要耗费大量时间。[详细] PacBio第三代测序技术迎来创新性升级,准确度可与二代测序相媲美 以PacBio、OxfordNanopore为代表的第三代测序技术因测序读长较长,对于基因组中复杂区域尤其是复杂结构变异的研究具有得天独厚的优势,因此,该技术近些年备受科学界的青睐。然而,相较二代测序技术,三代测序的“高错误率问题”一直是阻碍其发展的主要问题之一。[详细] 基因检测—防治癌症重要帮手 世界卫生组织曾发布报告称,癌症已经成为人类的重要致死原因之一。防治癌症成为一项迫在眉睫的社会功课,医学界和科学界都在探索有效的途径。中国抗癌协会委员会委员、浙江省肿瘤医院主任医师郑晓表示,肿瘤本质上是由基因突变导致的疾病,对付恶性肿瘤,基因检测这项新兴高科技的作用逐渐显露出来,在预防和治疗上都有效果。[详细] 乳腺癌的基因检测 1)了解自身是否有遗传性的致病基因通过基因检测,高危险人群可知道自己是不是带有疾病基因,以便及早发现和及早预防,并做好饮食保健与生活习惯的调整,以避免疾病的发生[详细]
手机端查看更多优质内容
咨询客服 2 客服
点击咨询客服
电话 电话
400-082-1008
置顶 置顶