雅虎日本母公司将164个OpenStack集群整合为一个

LY Corporation是一家主导亚洲多国即时通讯、电商与支付业务的日本互联网巨头，正将高度定制化的OpenStack云平台迁移至更标准化的开源云架构，并推进大规模整合。新云平台"Flava"计划将原有跨越164个以上OpenStack集群的海量虚拟机，整合至单一集群，同时引入Prometheus、Grafana等可观测性工具，并计划利用大语言模型自动化处理复杂故障决策流程，以支撑约3亿月活用户的服务需求。

LY Corporation是一家日本互联网巨头，旗下业务涵盖即时通讯、电子商务和支付等领域，在亚洲多个国家占据重要地位。该公司近日披露，正计划将高度定制化的OpenStack云平台替换为更标准化的开源云架构，并在此过程中推进大规模的资源整合。

LY Corporation于2023年由雅虎日本与韩国即时通讯巨头LINE合并成立，目前正致力于将双方的基础设施整合至一个名为"Flava"的全新统一云平台，以支撑旗下各项服务的稳定运行。由于LINE即时通讯应用和雅虎门户网站的月活用户总量约达3亿，该云平台需具备相当规模的承载能力。

上周末，该公司透露：LINE的内部云平台"Verda"由运行在11,000台主机上、分布于4个OpenStack集群的130,000台虚拟机组成；雅虎日本的"YNW"云平台则运行于27,000台服务器之上，超过160,000台虚拟机分散在160多个OpenStack集群中。

根据新"Flava"云平台的建设规划，目标是实现500台以上主机、9,000余台虚拟机，并统一整合至单一OpenStack集群。此外，公司还采用了开源的Envoy代理、Linux操作系统、扩展型伯克利包过滤器（eBPF）、快速数据通道（XDP）、FRRouting（FRR）以及Ceph存储系统。

LY云基础设施部门负责人Ryuutarou Inoue表示："旧有云平台对OpenStack进行了过多自定义修改，导致升级工作举步维艰。Flava采用的架构紧跟OpenStack上游版本，将定制补丁控制在最低限度，若确实需要功能性变更，我们会主动向上游社区贡献，争取将其合并至主项目。"

他补充道："通过消除升级障碍，我们实现了常态化的更新节奏，使安全防护和最新特性始终保持在线。"

Inoue还表示，LY力求"避免将可用性保障的过度投入集中在基础设施层"，转而以"故障随时可能发生"为前提进行设计。他介绍，Flava的设计理念围绕以下三大"支柱"展开：

在可观测性方面，LY同样高度重视。Inoue表示，其团队借助Prometheus、Grafana及内部仪表盘"持续监控云平台整体健康状况与趋势，以便及早发现异常迹象"。一旦上述工具发出预警，"我们会深入分析内核级追踪记录和数据包捕获等底层信号，精准定位根本原因"。

Inoue坦言，LY"每天都会在某处发生硬件故障"，全靠人工处理根本无法实现。他写道："目前，我们已将大部分流程自动化，从故障检测、发起现场数据中心操作请求，到将替换后的硬件重新接入集群，均已实现自动化处理。不过，仍有部分任务和非常规故障模式需要工程师亲自介入。未来，我们计划将大语言模型引入这些需要大量人工决策的工作流程，进一步提升自动化水平。"

值得关注的背景是，LY此前曾出现严重的信息安全事故，导致用户数据泄露，日本政府已就此要求该公司对技术架构进行整改，以提升安全性与隐私保护水平。

Q&A

Q1：LY Corporation的Flava云平台和原有云平台相比有哪些主要变化？

A：Flava相比原有的Verda和YNW云平台有大幅简化。原有体系共涉及超过160个OpenStack集群、约27万台虚拟机和数万台服务器；而Flava的目标是整合为单一OpenStack集群，搭载500台以上主机和9,000余台虚拟机。此外，Flava减少了对OpenStack的自定义修改，采用更贴近上游版本的标准化架构，以降低升级难度，保持安全更新的持续供给。

Q2：LY Corporation为什么要推进云平台整合？

A：主要有两方面原因。一是原有云平台对OpenStack进行了大量自定义修改，导致版本升级极为困难，安全和功能更新无法及时跟进。二是LY此前发生过严重的信息安全事故，用户数据遭到泄露，日本政府因此要求该公司对技术架构进行整改，提升安全与隐私保护能力，这也加速了Flava整合项目的推进。

Q3：LY Corporation如何处理每天发生的硬件故障？

A：LY Corporation已将硬件故障处理流程高度自动化，覆盖从故障检测、发起现场数据中心操作请求，到将替换硬件重新接入集群的全流程。同时，团队使用Prometheus、Grafana及内部仪表盘持续监控云平台健康状态，发现异常时会深入分析内核级追踪和数据包捕获信息。对于仍需人工介入的复杂故障，公司未来计划引入大语言模型辅助决策，进一步推进自动化。

来源：The Register

0赞

好文章，需要你的鼓励

雅虎日本母公司将164个OpenStack集群整合为一个

来源：The Register

2026

04/08

19:47

分享

点赞

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

端侧感知、私有闭环、量子协同， NVIDIA全栈异构计算范式“接管”实体产业底座

边缘智算筑基、全栈软硬协同，研华科技将AI带进产业闭环

千问AI眼镜将升级为智能体眼镜：能灵活调用Skill和Agent，能全天候感知

对话Moonix郭于晨：先让用户戴上“眼镜”，再让“AI”记录世界

亮相WAIC 2026，临床实证赋能康养升级 无芯科技定义AI疗愈新范式

生态覆盖持续扩散，一文看懂各行业企业鸿蒙化转型进度

WAIC亮出集群协作真功夫，优艾智合领跑工业具身智能规模化

脑部植入物助瘫痪男子重获进食与饮水能力

能源公司IPO融资创21世纪新高，押注AI基础设施热潮

Apple Intelligence获中国监管批准，携手阿里巴巴与百度正式进入中国市场

Nutanix瞄准新云AI经济 推出平台战略抢占控制层

AWS首席执行官：AI炒作论调很可笑

Nutanix将Kubernetes平台扩展到裸机部署以应对硬件挑战

Uber成为亚马逊AI芯片最新拥趸，云服务竞争白热化

Anthropic与谷歌、博通扩大算力合作应对需求激增

超大规模云服务商订单激增显示AI基础设施需求强劲增长

第一资本银行如何通过"无服务器优先"模式实现IT运营转型

微软商业软件组合面临英国竞争监管机构调查

FinOps：是CIO的有效工具还是云控制安慰剂？

全球云基础设施支出激增，超大规模厂商竞相满足市场需求

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

亮相WAIC 2026，临床实证赋能康养升级无芯科技定义AI疗愈新范式

Nutanix瞄准新云AI经济推出平台战略抢占控制层