1月22日,中国电子云自主研发的首款分布式存储产品CeaStor仓海存储系统在京发布。
在国家政策与行业需求双重因素的影响下,数字技术与产业融合成效愈发明显,随之,数据量正呈现爆发式增长,IDC在《DataAge2025》的报告中预测,到2025年全球数据将急速增长到175ZB,数据爆发式增长将带动存储市场快速发展。
我国《十四五规划》中,将超大规模分布式存储技术创新列在数字经济重点产业云计算专项的首要位置。
中国系统高级副总裁、CTO朱国平
中国系统高级副总裁、CTO朱国平表示,中国电子云作为中国电子打造、原生于PKS体系的新一代的基础设施,在中国电子“坚底强链”战略下,向下不断夯实IaaS,向上丰富PaaS产品。其中存储作为云计算最重要的服务之一,中国电子云正式发布首款自研分布式存储产品CeaStor以及CeaStor10000系列产品。
安全、先进、绿色,打造面向未来的存储产品
据朱国平介绍,中国电子云CeaStor存储产品是面向新数据时代,基于“安全、先进、绿色”设计理念,可满足传统应用、大数据、人工智能等各种业务场景的海量文件、大容量、高性能、高扩展等需求的分布式存储。
在安全能力上,CeaStor具备PKS原生安全、云原生安全和合规安全,具有安全为先、一数多用等特点,同时,CeaStor存储支持多副本和纠删码,异地容灾等多种冗余保护措施,为用户提供多层级的数据保护和容灾功能,进一步实现了用户数据存储的极致可靠。
在先进能力上,CeaStor采用了面向未来的磐石架构,全用户态协议栈,无限压低时延;并支持端到端NVME协议,通过RDMA智能加速充分发挥硬件能力;在规模上支持用户在线扩展,单集群规模可高达10000+个节点,满足客户业务不断变化的需求,其中,单节点随机读写性能可高达50万IOPS,且随节点数线性增长。此外,CeaStor生于云,服务于云,是真正的云原生存储系统,可以为用户提供声明式存储资源供给服务,并利用云原生技术,实现实现高度自动化运维以及存储的“敏捷开发、敏捷发布”。并通过软件定义SSD,实现延长磁盘寿命,提高磁盘读写能力,并降低关键业务读写时延。
在绿色能力上,CeaStor将块、对象、文件等存储协议打通,实现一池多用,并采用动态EC提高了磁盘得盘率,并将算子下沉,进一步降低网络负载,简化上层应用,提升了计算速度。更为关键的是,CeaStor支持QLC作为存储介质,利用软件优化弥补了QLC介质的缺陷,让用户在拥有的高性能的同时,还实现了最优的成本
最后,朱国平也在现场发布了CeaStor10000系列产品,而这也预示着,中国电子云不仅可以为用户提供云上的云盘、对象、文件和大数据存储服务,还可以为用户提供超融合产品和SDS产品(软件定义存储)。
打造研发铁军,加强研发创新体系建设
在数字经济蓬勃发展的今天,存放数据的存储产品至关重要。作为数据底座,存储产品的门槛高、投入大,从酝酿到成熟,极具挑战且需要不断坚持。
毫无疑问的是,中国电子云CeaStor离不开中国电子云一直以来在研发上进行的投入。发布会上,中国系统高级副总裁兼中国电子云执行总裁马劲表示,中国电子云目前在北京、武汉打造了研发中心总部,在南京、成都、杭州、深圳、合肥设立了特色研发中心,并将秉承IaaS产品自研,PaaS产品自研+合作,SaaS产品则通过中电蓝信+生态合作的方式一站式满足政企及行业客户的各项需求,为政府、央企国企、公共服务机构以及金融机构客户提供更多服务。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。