看过电影《蜘蛛侠》都会记住一句台词,“能力越大,责任越大”。男主角因为基因突变由弱小变强大。虽然是虚构的故事,但是人们对于身体的深度发掘,确实一直在进行。当今科技的发展,人们通过基因的研究,虽说没有向科幻片表现的那么神奇,但是通过基因检查第一时间查找人类的一些疾病,目前取得了巨大的进展。
基因测序要求超级硬件做后盾
但是基因组需要几十亿个标记,如果每秒列出一个数字,需要花96年才可以数到30亿。但是基因检查需要对着30亿标记进行至少上30次以上的检测。这样算下下来几千年都检测不出。这就需要计算能力超强的高性能计算集群,来帮助专家来研究解决各种病因的基因检查。正是应了那句台词“能力越大,责任越大”。
翻译基因组研究院(TGen)就是针对神经母细胞瘤试验的下一代基因组测序技术,这些测序技术产生了大量的数据,为了及时处理这些信息,TGen需要构建一个新的HPC集群。
戴尔为TGen带来的蜕变
为了克服这些挑战,TGen采用了DellPowerEdgeM710HD刀片服务器集群。刀片服务器运行CentOSLinux,它们被安置在三个DellM1000e模块化刀片服务器盘柜中。DellForce10C300和S481010-Gigabit交换机为集群的800个核心提供连接。“我们选择DellForce10交换机是因为它们的每端口成本和无阻塞性能,”Lowey说。“从我们原有的CiscoCLI迁移到DellForce10网络设备可以说一点也不麻烦。”
对于数据存储,TGen构建了一个多层次解决方案,它结合了DellFluidData架构中的多种技术。“我们将拥有基于Dell的文件系统,支持高速的并行文件访问,”Lowey解释说。“DellCompellent存储将支持更多传统应用程序,如MicrosoftSQLServer数据库和实验室的文件共享。最后,我们期望利用DellDXObjectStoragePlatform进行数据归档。我们对DellDX平台感到很兴奋,因为每TB的成本使得我们可以经济实惠地存储大量的数据,将数据量扩展到PB级,并且,平台将元数据与数据本身一起存储,这样的方式将使我们能够利用高级工具来挖掘我们庞大的数据集。
此性能提高对患者可能是生死攸关的。“我们采取分而治之的方法来处理数据,”Corneveaux说。“我们可能会将1个TB分割成1,000个不同的作业,让它们在Dell集群上分开运行,最后将它们全部重新合并在一起。将处理一个基因组的时间缩短了几天,甚至几周。我们在和可能5岁前就会死亡的患者打交道,所以几天也极为重要。如果我们能够帮助医生将正确的药物开给患者,我们就可以帮助让这种疾病好转。如果没有我们在这里已经建立的架构,这将是完全不可能的。”
此外,HPC集群让TGen能够应对新的数据分析挑战。“我们现在可以解决更大的问题,”TGen的神经基因组学助理教授MattHuentelman说。“对于患有恶性癌症的病人来说,更重要的是,我们可以克服具有高时效要求的问题。在过去,要求即时结果的问题是禁地。我们有一条用于分析数据的路径,但我们知道结果不可能及时返回来给予帮助。现在我们可以深入探究当天就需要回答的问题。”
蜘蛛侠变身:一个管理员管理800个服务器核心
总而言之,集群的最高性能是八万亿次浮点运算。“我们处理患者数据的能力提高了12倍,”Lowey说。
TGen使用在基于VMware的虚拟平台上运行的DellOpenManage来管理Dell刀片服务器。“对我们的多台刀片服务器实现单点管理,这大大简化了管理工作,”Lowey说。“一个人就可以轻松管理我们的800个核心,而在此之前,我们将需要至少两个人来做同样的工作。”
能力越大责任越大携手拯救生命
现在,Dell正在帮助TGen解决长距离通信的挑战。“我们在研究项目中与来自世界各地的组织的许多不同专业人才合作,”Suh说。“除了患者以外,我们还与临床医生、病理学家和从患者身上收集样本的其他人合作。生物学家解剖样本。基因学家对样本应用最新的基因组学技术,而生物信息学家则破译数据。在设计临床研究框架时,我们与生物统计学家、计算机科学家和软件工程师合作。我们需要一个高吞吐量的环境,所有这些人都可以用它来协同工作。”
TGen和Dell正在开发一个基于云的协作系统来促进这种互动。“该项目的目标是实现长期对象存储、站点之间的快速数据传输,以及从患者到生物信息科学家、试验管理人员的透明,”知识计算架构师PrestonLee说。
“Dell与我们并肩合作来交付解决方案,”Mousses说。“有一个愿意挽起袖子帮助我们解决一些最棘手的IT问题的合作伙伴在身边,是非常难能可贵的。”
Lowey补充说:“Dell的工程师和架构师已经反复证明了他们是一群最聪明的技术人才。不管我有什么问题,每当我致电Dell时,我都相信自己会得到一个满意的答复。当我们提出问题时,Dell支持服务人员总是会迅速而有效地予以答复,
并且Dell卓越的HPC技术和整体方案正在帮助我们构建一个十分高效且易于管理的系统。”
小结
可以看到,戴尔端到端解决方案不仅让基因组研究院如虎添翼。同时因为戴尔本身基因的不断强大,也让戴尔在帮助用户实现价值的能力越来越强。正是印证了那句话“能力越大、责任越大”。
好文章,需要你的鼓励
Journey发布三款LOC8智能追踪配件:内置FindMy技术的笔记本电脑保护套、高端皮革钥匙收纳器和通用追踪器Finder Fob 2。笔记本套售价119-129美元,支持14寸和16寸设备;钥匙收纳器售价109美元,可容纳6把钥匙并内置多功能工具;Finder Fob 2售价29美元,可充电且重量与AirTag相当,适用于各种物品追踪。
Meta研究团队推出MetaEmbed技术,通过创新的"元标记"设计解决了AI搜索中速度与精度难以兼得的问题。该技术将内容分层组织成多个智能向量,用户可根据需求灵活选择搜索精度。在大规模测试中,MetaEmbed显著超越现有方法,为多模态内容检索提供了新的解决方案。
韩国政府投入5300亿韩元支持五家本土公司开发大型基础AI模型,包括LG AI研究院、SK电信、Naver Cloud、NC AI和Upstage。这些公司分别推出了Exaone 4.0、A.X、HyperCLOVA X和Solar Pro 2等针对韩语和本土文化优化的模型。韩国希望通过减少对外国AI技术的依赖,加强国家安全并在AI时代保持数据控制权,与全球AI巨头展开竞争。
阿里巴巴达摩院联合南洋理工大学的研究团队发现,当前AI模型在几何推理中频繁出错的根本原因是视觉感知能力不足。他们提出了分阶段训练框架,先强化AI的基础视觉感知能力,再进行复杂推理训练。实验显示,这种方法使3B参数模型在几何推理任务上准确率提升9.7%,接近GPT-4o的表现水平,为AI视觉理解能力提升提供了新思路。