生命科学领域集群存储

方案概述

随着高通量测序实验及生物信息学在人类健康领域的应用,数据呈现出快速的增长,其业务场景特有的多任务分析流程力求自动化实现数据大量的迭代运算和反复读写,对存储系统提出了新的挑战。有效的存取大规模生物数据,将对匹配业务的开展和完成起到提高效率的作用。

应用背景

生命科学从细胞的发现到生物工程、基因工程的发展及应用,研究变得更加趋于系统化、规模化、数字化。突出表现之一便是一大批生物基因组测序的完成,催生了生物信息学的迅速发展。

高通量测序实验技术以及生物信息学在生命科学研究和人类健康领域的应用,将生物信息转化为数字信息,这些数据来自于大量的生物样本、科研中间数据和实验结果,数据类型以文件为主,通过多次的、多工作组的科学计算。这些数字信息如同开采金矿一样,等待被挖掘出价值。因此,海量生物数据的存储、读取、挖掘处理面临着机遇与挑战。

系统功能



  • 集群存储支持多维度扩展,按需建设
  • 容量与IO 负载均衡到节点,聚合带宽,适合高通量并发访问需求
  • 统一虚拟存储池,为不同计算环境或应用展现相同的空间视图
  • Docker 化部署,应用程序及分析工具和存储共生
  • 支持计算任务offload 到集群存储,开放性强
  • 集群独立高速内部通道,快速数据分发及均衡分布
  • 兼容主流HDD、OS、访问协议,通用性好

方案特色


荣之联Xtore 分布式集群存储系统,帮助客户解决数据空间和数据持久化。提供弹性的、并发的PB 级统一存储资源池,满足计算集群几十个至上百个节点并发读写、数据共享。其可扩展特性,易于实现非结构化数据快速增长下的逐步扩容。Xtore 整合生产、科研、仪器的存储需求,达成数据在分析流程各环节中流动,支持流程自动化的实现。

Xtore 系统,支持容器化部署,可将客户部分计算分流到存储系统,优化数据流向、降低网络负荷,切实提高生产效率。

客户价值

  • 根据业务的需求动态扩展存储规模,降低一次性设备采购投入
  • 聚合带宽,并发访问,满足几十至上百个计算集群的同时访问
  • 实效性,实验数据上传后即可进入多任务分析流程,缩短计算周期,提高时效性和生产科研效率
  • 基于以太网高速互连,支持标准访问协议,完全与计算平台兼容
  • 存储系统容器化,与应用共生,合理匹配与利用计算存储资源
  • 内置数据特征引擎,通过与数据管理对接,进一步提升复杂数据的处理能力

典型案例

北京吉因加科技有限公司(Gene+)以基因科技为核心,从事医学健康领域的科学研究、应用开发和产业服务,是一家集科研、临床检测和健康服务于一体的基因科技公司。


公司专注于肿瘤基因检测领域,按照国际临床基因检测实验室标准搭建,目前已形成基于高通量基因测序技术与生物信息分析的ctDNA 精准检测体系,实现了对肿瘤无创、准确、动态的基因分析,为临床提供精准用药、疗效监测、术后复发监测、风险预测和早期检测等服务。



  • 利用Xtore 分布式集群存储系统,解决业务系统原始数据、过程数据和结果数据的存放和读取问题
  • 融合应用容器和存储系统,允许生物分析计算将非计算密集型任务卸载给存储控制器
  • 存储系统与生物计算调度的紧密融合,让存储系统感知应用特征,调度合适的存储资源
  • 存储系统同时兼顾可靠性、可用性和访问带宽,不间断持续提供存储服务

相关案例