12月29日,2020第十届中国云计算标准和应用大会在北京举行,大会主论坛上发布了国内首个云超算标准,华为作为共同发起单位参与标准全程制定。该标准在中国电子技术标准化研究院组织下,由云超算客户、云计算软件、硬件厂商及云服务提供商共同编制,为规范云超算服务的产品能力和建设部署,促进云超算技术发展和生态建设,提供重要指导作用。
高性能计算(High Performance Computing,HPC)是指将计算能力积聚,用并行计算方式满足个人电脑无法处理的大资料量与高速运算需求,在科学研究、仿真计算、工程模型和影视渲染等 领域得到广泛应用。 云超算是一种新型的高性能计算方式,基于云平台技术底座,深度融合高性能计算、边缘计算、人工智能等最新技术,提供统一的算力平台,共享的资源池和高性能的算力,可以解决传统HPC在使用过程中易遇扩展性不佳、遭遇性能瓶颈、管理维护难等实际问题。华为云致力于打造云原生能力加持的云超算解决方案,并开展多场景的技术探索和创新,有助于推动云超算标准更好的落地推广。
华为云超算:以云计算技术重铸高性能计算统一云化平台
华为云超算解决方案,是以华为云Stack为基础的高性能计算统一云化平台。方案打造云化智算统一界面,为上层各类超算业务提供高性能多样化的IaaS资源、大数据、人工智能平台以及云原生作业编排服务等云化的技术服务。同时,作为一朵超算混合云,不仅拥有云服务的统一运营平台和运维平台,以满足客户对云资源的计量计费、配额管理和优化、多租户隔离等超算运营需求及全资源监控、运维可视化、统一鉴权认证等运维需求,还可以通过混合云业务流编排来弹性使用公有云上的高性能IaaS服务、大数据服务、AI等服务,并且能沿用云市场的各类已完成集成验证的超算SaaS化应用,充分享有华为云的丰富生态。
云原生,已成为云超算架构中重要组成部分
随着容器技术的成熟,越来越多的企业把容器作为AI、大数据以及高性能批量计算的下一代基础设施。本次云超算标准中,也着重提及了对容器资源及管理的要求。
华为云一直是容器及云原生的领导者,是云原生计算基金会(CNCF)的创始会员和中国首个白金会员,在社区的代码贡献和Maintainer数量也稳居中国第一。华为云针对AI、大数据及高性能计算场景打造了容器批量计算引擎Volcano,在任务调度、作业管理、资源管理等方面均进行了大量技术层面优化。优化后,华为云超算集群的整体资源利用率提升25%,计算效率提升30%。目前,基于云原生技术加持的华为云超算解决方案已在多领域得到广泛运用。
面向未来,华为云将继续保持开放的架构,与行业领先的合作伙伴进行合作,为HPC行业提供更优的超算服务和解决方案,使能更为广泛的场景应用,为云超算生态发展持续贡献力量。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。