Together AI推出自助式GPU基础设施服务

AI云服务初创公司Together AI宣布其Instant Clusters服务正式上线，该服务可自动配置GPU集群。用户通过单一API即可访问从8个GPU的单节点到数百个处理器的大型多节点系统。服务支持英伟达最新Hopper和Blackwell GPU，针对分布式训练和弹性推理进行优化。集群预装驱动程序、调度器和网络组件，支持按小时、按日和多月承诺的灵活定价模式。

专门为人工智能模型开发和部署构建云服务的初创公司Together Computer Inc.（运营名称为Together AI）今日宣布，其自动化GPU集群配置服务Instant Clusters正式全面上线。

该公司表示，客户可以通过单一应用程序编程接口访问GPU集群，规模从配备8个GPU的单节点系统到拥有数百个处理器的大型多节点系统不等。该服务支持英伟达最新硬件，包括Hopper和Blackwell GPU，并针对分布式训练和弹性推理等应用场景进行了优化。

Together AI首席产品官Charles Zedlewski表示，该服务自初夏开始进行内测，正式版本根据用户反馈加入了多项更新功能，包括改进的自动扩缩容功能、动态扩展预留基础设施的能力，以及对基础设施即代码工具Skypilot和Terraform的支持。

"我们添加了Terraform支持，让用户能够围绕这些GPU集群构建自己的自动化系统，"Zedlewski说，"我们还增加了重新创建集群并使用原始数据和存储重新挂载的功能。"

这种重新挂载功能支持间歇性训练工作负载，用户可以在大规模模型开发中常见的长时间周期内暂停和恢复训练任务。

Instant Clusters本质上旨在模拟传统云基础设施的用户体验，同时处理AI工作负载的特定需求。集群预装了驱动程序、调度器和网络组件，包括GPU Operator、英伟达网络操作器和InfiniBand互连。该公司表示，手动配置这些组件可能需要数天时间。

Zedlewski指出，由于GPU基础设施与传统CPU环境存在根本差异，安装和配置仍主要依赖手动流程。"GPU基础设施的整个虚拟化和自动化堆栈与我们长期熟悉的x86 CPU基础设施的等效堆栈存在显著差异，"他说。云计算提供商花费了20年时间微调CPU基础设施，但仍在学习如何针对AI进行优化。

Together AI表示，公司在集群可用前会执行硬件检查、压力测试和节点间通信验证。"如果你配置了一个8节点、64GPU的集群，我们基本上会在每个节点出现在你的环境中之前对其进行预测试，"Zedlewski说。

Instant Clusters针对Kubernetes、Slurm和其他编排工具进行了优化。客户可以锁定特定的驱动程序和英伟达Cuda版本，并重复使用自定义容器镜像，以简化训练和推理阶段的可重现性。

存储可按需挂载到集群。虽然用户必须使用Together AI的POSIX兼容并行文件系统，但存储和计算可以独立扩展。

该服务根据使用时长支持可变定价模式，提供小时、日和多月承诺选项。低端英伟达HGX H100推理集群根据客户的频次承诺，价格从每小时1.76美元到2.39美元不等。英伟达高端HGX B200长期承诺价格为每小时4美元，按需使用价格为每小时5.50美元。

Zedlewski表示，大多数组织很难通过自建基础设施来匹配这种成本效率："如果有人试图自行构建，我会感到非常惊讶。"

Q&A

Q1：Instant Clusters是什么服务？

A：Instant Clusters是Together AI推出的自动化GPU集群配置服务，允许客户通过单一API访问从8个GPU的单节点到数百个处理器的大型多节点GPU集群，支持英伟达最新的Hopper和Blackwell GPU硬件。

Q2：Instant Clusters有什么优势？

A：该服务集群预装了驱动程序、调度器和网络组件，避免了手动配置需要数天时间的问题。还提供硬件检查、压力测试和节点间通信验证，确保集群在交付前完全可用。

Q3：Instant Clusters的价格如何？

A：服务支持按小时、日和多月承诺的可变定价模式。低端英伟达HGX H100推理集群每小时1.76-2.39美元，高端HGX B200长期承诺每小时4美元，按需使用每小时5.50美元。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Together AI推出自助式GPU基础设施服务

来源：SiliconANGLE

2025

09/10

08:07

分享

点赞

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

端侧感知、私有闭环、量子协同， NVIDIA全栈异构计算范式“接管”实体产业底座

边缘智算筑基、全栈软硬协同，研华科技将AI带进产业闭环

千问AI眼镜将升级为智能体眼镜：能灵活调用Skill和Agent，能全天候感知

对话Moonix郭于晨：先让用户戴上“眼镜”，再让“AI”记录世界

亮相WAIC 2026，临床实证赋能康养升级 无芯科技定义AI疗愈新范式

生态覆盖持续扩散，一文看懂各行业企业鸿蒙化转型进度

WAIC亮出集群协作真功夫，优艾智合领跑工业具身智能规模化

Monte Carlo推出AI智能体全栈可观测性工具

菁彩Vivid助力电影行业高质量发展，四方战略合作签约仪式在京举行

Databricks完成10亿美元K轮融资，估值突破1000亿美元

Predoc获得3000万美元融资，扩展AI健康信息管理平台

Google正式公布Gemini使用限制详情

OpenAI推出Critterz动画电影，AI技术正式进军好莱坞

微软与Nebius签署近200亿美元AI基础设施合同

AI将在2030年前渗透所有IT工作——但不会取代所有IT岗位

AI工厂引领产业变革：芯片巨头如何重塑计算基础设施

谷歌法庭文件承认开放网络正"快速衰落"

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

亮相WAIC 2026，临床实证赋能康养升级无芯科技定义AI疗愈新范式