Linpack测试性能达3.743PFlops,峰值性能达7.035PFlops。
在近日公布的2020中国高性能计算机性能排行榜Top 100中,北京超级云计算中心无疑是最令人瞩目的那一个。
这是因为榜单的前2位已经五年没有发生更迭,还是熟悉的两个——“神威太湖之光”和“天河二号A”,而榜单的第3位,也就是北京超级云计算中心,则是异军突起的新面孔。
今天,我们就来深扒北京超级云计算中心背后的故事。
“王谢堂前燕
飞入寻常百姓家”
在大家的印象里,超算往往都是大家伙、重武器,是用于研究核能聚变、宇宙、气候等国家级课题的“国之重器”。其实,在“国民经济主战场”,更多的应用是无法企及国之重器这样的高度的,这就要求超算不能只是“王谢堂前燕”,还要“飞入寻常百姓家”。
简单来说,目前超算行业正在形成三类市场:
第一类,尖端超算,需要国家集中力量办大事,打造最尖端的超算中心;
第二类,通用超算,需要性价比高的解决方案,超级云计算中心的模式对推动超算商业化具有重大的作用;
第三类,行业超算,需要根据业务需求设计上云流程,提供行业定制。
而北京超级云计算中心(A分区),就属于不折不扣的、服务千行百业的通用超算。通过“云化”的超算服务模式,服务于对算力不同需求的科研用户,同时也为国家超算提供给了重要的算力补充。
据了解,北京超级云计算中心成立于2011年,依托中国科学院计算机网络信息中心建立,由北京北龙超级云计算有限责任公司负责运营,是怀柔科学城北京市人民政府与中国科学院共同建设的重点项目。本次夺得第3名的北京超级云计算中心A分区,是中心现有资源池的一部分。为满足不同用户对计算的使用和资源存储需求,中心还有T分区、M分区、IO分区以及科技云9分区等。
成立9年的超算中心
冲击超算榜单靠的是什么?
榜单发布人、中国科学院计算技术研究所研究员张云泉介绍,2020年共计提交73台新系统,根据TOP100排行规则,排重合并后新增机器上榜47台,这也意味着,2019年榜单中的100台系统仅剩余53台,淘汰率接近50%,竞争程度之激烈可见一斑。
那么,一家成立9年的超算中心,靠的什么一举斩获2020中国HPC榜单第三呢?
显然,这和技术的升级迭代脱离不了关系。
2019年8月,AMD发布了全球首颗7nm制程工艺,代号为“罗马”的第二代AMD EPYC霄龙系列处理器。在架构方面,新一代AMD Infinity架构突破了x86性能和计算能力,获得了同类产品最高的I/O和内存带宽,在多种工作负载下最高能够将总体拥有成本(TCO) 降低50%。
而北京超级云计算中心正是敏锐地把握住了技术创新的趋势。3个月后的同年11月,北京超级云计算中心选择戴尔科技为设备供应方,采用第二代AMD EPYC 处理器的A分区迅速正式上线了100个节点,截至2020年10月已逐步扩容到3000节点,从而实现算力的大跨越。
迎来黄金期的超算
戴尔科技助力前行
近年来,随着国内移动互联网快速发展,越来越多企业对强大算力的需求持续升温,这也给中国超算的发展带来了黄金期。
统计数据显示,截止至2019年,我国传统超算市场的整体规模达280亿元,其中尖端超算目前大约占四分之一,而通用超算占四分之三。但目前来看,超算主要是尖端超级计算机及其用户,中小用户和面向行业的业务型用户的需求没有得到满足。
北京超级云计算中心聚焦通用计算市场,以随需供应的“超级云计算服务”的模式向用户提供算力,面向海量无超算资源的用户以及中小微超算用户,无疑为超算的商业化发展探索出一条新路线。
还需指出的是,“计算”作为一种支撑和工具,它只是先进生产力链条中的一个环节。在计算之外,数据的采集与处理、软件的设计与调优、模型模式的开发等等,同样重要。
在这方面,戴尔科技作为全球领先的IT端到端解决方案提供商,不仅为像北京超级云计算中心这样的客户提供全面的HPC就绪方案和HPC产品方案,同时也在软件应用等方面,帮助客户用好超算,释放超算的更大潜力。
坐落于著名学府剑桥大学的“Cumulus–英国科学云”是英国最大的学术超级计算机,由戴尔科技为其提供算力支持,性能可达每秒超过2千万亿次浮点运算。
除了算力支持外,戴尔科技还联合合作伙伴开发了戴尔数据加速器(Dell Data Accelerator:DAC),通过基于NVMe的存储解决方案,消除了拖慢系统性能的存储瓶颈,实现了HPC系统中新一代的数据密集型工作流程。
在2019年6月Virtual Institute公布的2019 I/O-500榜单中,集成了DAC的Cumulus以620.69的得分位列第一,领先第二名290分!这意味着它首次亮相即是世界上最快的HPC存储系统,比第二名的性能提高了近一倍。
并且,戴尔科技通过经工程验证的系统配置(包括DAC服务器节点,内存,网络,PCIe存储和NVMe存储),已向广大HPC用户提供该解决方案,从而共享DAC的优势。这意味着DAC提供了全球最快的开源NVMe存储解决方案之一。
可以看见,戴尔科技能为HPC用户提供的,绝不仅仅是算力这么简单。事实上,凭借多年的创新与开放,戴尔科技已经形成了完整的生态系统,可以为客户提供从HPC的采购到部署、从应用到运维的全生命周期管理服务,释放超算的强大潜力,让客户将精力真正投入到业务当中。
好文章,需要你的鼓励
开源数据库服务商Percona为PostgreSQL推出透明数据加密(TDE)扩展,填补了该数据库在企业级安全功能方面的空白。该pg_tde扩展目前已包含在Percona PostgreSQL发行版中,可加密磁盘上所有数据库文件,并支持与主流密钥管理服务集成。Percona正努力将此功能纳入PostgreSQL主发行版,帮助用户满足GDPR等法规的加密要求。
新加坡国立大学研究团队开发了SPIRAL框架,通过让AI与自己对弈零和游戏来提升推理能力。实验显示,仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%,通用推理提升8.4%,且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中,为AI训练提供了新思路。
西部数据首席产品与工程官Ahmed Shihab表示,公司HAMR技术进展顺利,OptiNAND能提供容量优势。HAMR技术物理原理已突破,正进行制造工艺优化。相比希捷10盘片技术,西数11盘片设计提供更大发展空间,可更快推向市场。OptiNAND结合UltraSMR算法可实现更高单盘容量。公司采取保守策略,注重可靠性,客户已完成相关软件认证。硬盘在数据经济中仍是基础,在视频监控等写密集型应用中具备成本和耐久性优势。
同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息,创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系,结合深度学习和数学优化方法,在合成数据集上实现37.9%的精度提升,并在真实设备上展现出色泛化能力,为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。