Google Cloud托管式Lustre现已正式上线,该服务基于DDN的EXAScaler软件构建。
该项目最初于今年4月宣布,旨在为Google Cloud提供文件存储和快速访问服务,面向构建AI、生成式AI和高性能计算应用的企业和初创公司。Lustre是一个开源并行文件系统,具备高吞吐量和低延迟特性。作为Lustre的主要维护者,DDN利用该技术运行其横向扩展的EXAScaler阵列硬件。
DDN联合创始人兼总裁Paul Bloch表示:"通过将我们的EXAScaler技术以完全托管服务的形式提供给Google Cloud客户,我们正在帮助各行业组织加速创新,而无需承担管理复杂基础设施的负担。"
Google Cloud托管式Lustre专为紧密耦合的高性能计算工作负载以及AI训练和推理而设计。该服务可提供高达1TBps的读取吞吐量,延迟小于1毫秒,存储容量可从18TiB扩展至8PiB以上。通过多个性能层级(125MBps/TiB到1,000MBps/TiB),客户可以根据其AI、仿真或分析工作负载的特定需求定制性能。
该服务具备POSIX兼容性,并与Google Cloud计算引擎、Google Kubernetes引擎(GKE)、IAM、VPC服务控制以及Vertex AI平台等Google服务实现原生集成,同时支持Google Cloud的Nvidia GPU服务器。Vertex AI是一个综合的数据工程、数据科学和机器学习工程工作流平台,用于训练、部署和定制大语言模型以及开发AI应用。
Google Cloud托管式Lustre支持Terraform、与Google Cloud Storage的批量数据传输,以及用于GKE的托管CSI驱动程序。该服务提供99.9%的可用性服务级别协议。
Nvidia加速计算产品总监Dave Salvator表示:"通过整合DDN的企业级数据平台和Google的全球云能力,组织可以轻松访问大量数据,并在Google Cloud上利用Nvidia AI平台释放AI的全部潜力——缩短洞察时间,最大化GPU利用率,降低总体拥有成本。"
Google Cloud表示,它还提供另外两个并行文件系统——DDN Infinia和基于IBM Storage Scale的Sycomp Storage。Infinia和Storage Scale都在Google Cloud市场中提供,但都不是Google托管服务。
本地DDN客户能够根据需要将其EXAScaler工作负载迁移到Google云端。
客户可以直接通过Google Cloud控制台部署实例,或与Google Cloud或DDN代表联系获得定制化指导和支持。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。