《自然·方法学》上发表了第三代测序数据组装算法Wtdbg,将基因组分析速度提升5倍

来源:医生在线 时间:2019/12/23 16:39 阅读:1235
分享
  自基因组学技术问世以来,测序与分析一直是基因组学技术中较主要的两个环节。实际上,与繁重的测序工作相比,基因组的分析也同样复杂,需要耗费大量时间。
  然而,随着近年来基因组学技术发展突飞猛进,这种状况正在逐步改变。

  日前,中国农业科学院深圳农业基因组研究所阮珏团队在《自然·方法学》上发表了第三代测序数据组装算法Wtdbg,极大提高三代测序数据的分析效率,与今年4月发表在《自然·生物技术》上的Flye算法相比,分析速度提升了5倍,并首 次将测序数据分析时间降低到少于测序数据产出时间。




  “如今,完成一个人的全基因组测序是普通家庭都可以负担起费用的‘平常’事情了。以三代测序为例,完成个人全基因组测序仅需1天时间、费用低于5万元。”论文作者、中国农业科学院深圳农业基因组研究所研究员阮珏这样说。
  在测序技术日新月异的同时,分析技术也在共同成长。以人类基因组组装为例,在2014年需要消耗50万个CPU小时,且只能在超大计算机集群上进行。因而,以全基因组组装方式对群体进行测序分析已经成为生物医学研究的趋势。
  Wtdbg算法的开发得益于一个新的组装图理论——模糊布鲁因图的提出。模糊布鲁因图借鉴了德布鲁因图的思想,将测序数据切分为固定长度的短串,再从短串构建出的图上恢复出全基因组序列。
  2013年起,阮珏和美国哈佛医学院的博士李恒在德布鲁因图基础上,设计出一个新的组装图理论——模糊布鲁因图。通过重新对短串进行定义,它能够容忍高噪音数据,并随后对生成组装图和恢复基因组序列做了大量相应的重构,使其兼具高 效率和高容错的优点。
  不断进化的新算法
  近年来,生物信息学领域的科学家们致力于改变这种数据产出速度远高于数据分析速度的尴尬状况,不断开发出更高 效的组装分析算法。
  2013年,阮珏与李恒合作开始了测序数据分析方法如组装算法的开发,力求推动测序数据的分析速度更快、分析质量更高。2016年,他们的研究结束,并将研究成果Wtdbg对所有人免费开放使用。3年来,这项成果不仅被几十篇学术论文引用,还被国内多家基因测序分析公司作为主要组装分析工具,并且在2019年世界大学生超算竞赛中作为性能测试赛题。
  “我们收到大量反馈,不现有助修订算法软件中的漏洞,还带来了新想法和思路。算法需要不断在实践中完善,只有通过更多实际应用,我们才能更有效调整改进这套算法。目前的算法与2016年相比已经是2.0版本,而更高版本的算法于今年初也开始了研究。

医生在线肿瘤频道温馨提醒:文章描述内容可能并不符合您的实际病情,建议您可直接咨询 在线客服 或免费咨询热线:400-082-1008

相关文章

如何选择肿瘤癌症基因检测方案? 肿瘤基因测试范围从简单到复杂。简单的测试只检测一种基因中的一种类型的突变。比如仅在BRAF位置c.1799处寻找特定T到A置换突变的试验。复杂的测试可以同时检测所有主要类型的基因改变,包括替换,重复,插入,缺失,插入,基因拷贝数变异和结构变体,包括倒位和易位。[详细] 用于基因治疗的病毒或有致癌风险 就在基因治疗似乎终于实现了它的承诺之际,一项研究唤起了人们对病毒载体的长期担忧——很多努力正是依赖于病毒载体将治疗基因导入患者体内。这种“载体”是腺相关病毒(AAV)的一个精简版本,人们认为它是安全的,因其几乎不会将携带的人类DNA编织到细胞染色体中,而这有可能激 活致癌基因。[详细] NEJM重磅:长期随访发现基因治疗有效治疗血友病A 腺相关病毒(AAV)介导的基因疗法因其通过分别递送编码功能因子VIII或IX因子蛋白的互补DNA来治疗许多单基因疾病(包括A型和B型血友病)的潜力而得到越来越多的认可。 迄今为止,使用AAV血清型5载体(AAV5)治疗血友病A,单次AAV介导的研究治疗已显示出1年的临床改善。[详细] 109种基因变异,会让人患上精神疾病 根据中国疾病预防控制局公布的数据显示,截止2017年底,我国各类精神疾病患者达2亿多人,总患病率高达17.5%。严重精神障碍患者超过1600多万人,发病率超过1%,且呈逐年上升趋势。[详细] Bio Rxiv:科学家利用“基因剪刀”CRISPR技术创造了新一代的基因猪 如果猪可以将器官捐献给人类,那么每年将有多少器官衰竭患者因此获救?据《科学》网站报道,12月19日发表于Bio Rxiv一项研究指出,科学家利用“基因剪刀”CRISPR技术创造了新一代的基因猪,称它的体内组织已经具备安全移植到人类体内所需特征。[详细] 研究遗传性癌症易感基因-TruSight Hereditary Cancer Panel 用于研究遗传性癌症易感基因的全新panel——TruSight™ Hereditary Cancer Panel with Nextera™ Flex for Enrichment现已发布!TruSight Hereditary Cancer Panel是我们与遗传性癌症领域专家合作开发的产品,用户仅需两天即可识别与遗传性癌症相关的变异。[详细] 《自然·方法学》上发表了第三代测序数据组装算法Wtdbg,将基因组分析速度提升5倍 自基因组学技术问世以来,测序与分析一直是基因组学技术中最主要的两个环节。实际上,与繁重的测序工作相比,基因组的分析也同样复杂,需要耗费大量时间。[详细] PacBio第三代测序技术迎来创新性升级,准确度可与二代测序相媲美 以PacBio、OxfordNanopore为代表的第三代测序技术因测序读长较长,对于基因组中复杂区域尤其是复杂结构变异的研究具有得天独厚的优势,因此,该技术近些年备受科学界的青睐。然而,相较二代测序技术,三代测序的“高错误率问题”一直是阻碍其发展的主要问题之一。[详细] 基因检测到底是怎样一个技术 基因检测到底是怎样一个技术?很多想做基因检测的人都非常关心目前联合基因所用的基因检测技术是怎样的,我们就这个问题来详细介绍一下。基因检测目前所用主要的检测手段为:基因芯片、基因分型技术(SNP)、基因测序:[详细] 基因检测能预知哪些肿瘤疾病 基因检测目前受到很多人的追捧,越来越多的人会选择基因体检。基因体检可以帮我们提前预知疾病,专家会根据报告提出合理的建议。基因检测能预知哪些肿瘤疾病?,那到底哪些疾病目前是可以被提前检测到的呢?关于基因检测大家又了解多少呢?[详细]
手机端查看更多优质内容
电话 电话
400-082-1008
微信 微信
微信
公众号 公众号
公众号
置顶 置顶
Baidu
map