生物信息分析一体机

方案概述

生物信息分析一体机是一个专业的临床基因组数据分析、解读与数据管理平台。该平台通过集成领先的基因组数据分析解读软件以及大量常见生物医疗疾病数据库,为NGS临床诊断提供了快速、方便、准确的分析及解读服务。

应用背景

目前二代测序机中的原始测序数据上传到计算集群,进行质控过滤,通过BWA-GATK 软件把短序列和参考基因组进行比对、变异检测,随后需要专业生物信息分析师通过分析平台,分析工具,专业数据库,对变异文件进行注释、分类,整个操作过程耗时较长,并要求相关工作人员具备专业IT 基础。

配备生物信息分析一体机,二代测序机中的原始测序数据上传到生物信息分析一体机引擎后,通过一体机,一站式解决对原始测序数据的质控过滤、序列比对、变异检测、注释、分类,另外还可生成相应的报告。用户可以根据自己的需求修改分析程,整个操作过程可视化水平高,用户无需IT 基础。


系统功能



生物信息分析一体机引擎是一种系统软件,用于管理基因数据和分析流程,管理用户和工作空间,安排分析流程的执行以及编排硬件。

ELSA 是一种高性能二代测序基因组数据比对及分析软件,用于对二代测序数据进行辅助分析,已针对多核CPU 架构进行优化。ELSA 支持不同类型的测序数据,包括WGS、WES、扩增子测序、靶向测序。

database.bio 数据库:基因组注释解读软件,用于解读人类基因变异。数据存储库管理器支持构建和管理解读用数据存储库,配备了度身打造的加载程序,能将各种外部生物数据库加载到该存储库;变异解读引擎支持注释、确定优先顺序和可视化功能,能提供个体遗传特征的深入信息。

MGB:高性能基因组浏览器软件,用于对多个基因组的基因数据进行可视化处理。MGB 占用内存低,能快速加载基因组。

方案特色

快速:特有的变异分析软件专门为临床高深度测序数据优化,可快速为癌症和遗传病的分析提供分析结果

准确:集成众多常见高引用的医疗数据库,以及本地分析结果,为分析解读提供精准结果。使用美国国家标准技术研究所的数据进行评价,得到结果:敏感度:99.36% 特异性:99.33%

灵活:系统通过配置变异致病性分类规则、所用来注释和解读的医疗数据库、测序时候使用的引物和接头序列等来支持不同的临床应用分析

易用:开箱即用,友好的Web 交互界面,用户以交互协作方式对分析研究成果进行可视化分析

高效:单节点即可满足MiSeq 或NextSeq 测序仪数据吞吐量的分析需求

可扩展:可扩展为多个节点来满足如HiSeqX 测序仪较大数据吞吐量需求

自定义分析流程:用户可以根据自己的需求很方便的通过流程编辑器修改分析流程

兼容性强:支持客户化部署用户特有分析流程

典型案例


诺禾致源生物信息分析


DNA 测序技术的显著提高和测序成本的降低带来精准医疗行业的飞速发展。由于中国人基因组数据库(CGDB)没有足够多的数据支持,中国人群体精准医疗行业的发展受到阻碍,其中数据的可用性是一个关键性问题。北京诺禾致源生物信息科技有限公司致力于成为全球领先的基因组学解决方案提供者,专注于开发高通量测序实验技术以及生物信息学在生命科学研究和人类健康领域的应用,诺禾致源为该项目提供所有可用数据,约 150000 人。

在诺禾致源,现在有5 个节点(安装了SSD)是用来运行生物信息分析一体机中ELSA 软件的,已实现连续几周,每周100 个WGS 的处理量。为确保CGDB 的数据在分析上有一致性,现在已经通过运行ELSA 算法处理完成约500 个WGS检测。该项目的目标是在2017 年内检测2000 个WGS 及3000 个WES,并有望再增加。


相关案例Related cases