Cloudflare 宣称已找到能减少推理工作负载所需硬件的优化方案,并正在开展早期对话,试图为 AI 时代重新构建万维网。
这一构想在公司上周的第四季度财报电话会议中被提出。公司 CEO、董事长兼联合创始人 Matthew Prince 指出,他们的"客户中包括了许多最重要的 AI 公司,同时也服务着全球大量的内容创作者。处于这两者之间的位置使我们在探索后搜索时代网络商业模式方面发挥着重要作用。"
Prince 认为 Cloudflare 因此处于"独特地位,可以帮助确定内容创作者如何获得补偿,哪些 AI 代理可以在什么条件下访问内容,以及未来由 AI 驱动的网络将如何组合在一起。"
他并非在空谈,因为他还透露"我们正在与所有相关方进行的对话,都将为未来奠定基础。请持续关注,这确实是令人兴奋的时刻。"
这听起来很像 Cloudflare 想要利用其作为大型内容分发网络提供商的地位来管理机器人对内容的访问权限,并在中间设置收费关卡,以确保内容提供商不会白白将其内容提供给 AI。许多大语言模型都是通过抓取互联网内容进行训练的,内容创作者认为这侵犯了版权,而 AI 公司则认为这属于合理使用。多个法院案件将很快审查这两种论点,同时主要内容公司也在与模型开发商达成付费协议。
Prince CEO 还认为,凭借 GPU 优化技术,Cloudflare 可以通过其无服务器"Workers"在 AI 市场取得成功。
"Cloudflare Workers 的杀手级应用正在显现为 AI,"Prince 热情地表示。由于无服务器是按使用付费的模式,开发者无需租用可能闲置的服务器,而是可以按需使用无服务器系统。
他继续说道:"就在上个月,中国工程师团队在 DeepSeek 模型的 AI 训练领域展现的效率让世界感到惊讶。我们发现在 Cloudflare 平台上的 AI 推理也可以进行同样的优化,为客户带来更快的性能和更低的价格,同时为我们带来更高的利润率和更少的资本支出。"
"我们认为推理比训练是更大的机会,我们的团队持续找到突破性进展,使我们远超任何替代方案,"他补充道。
更少资源消耗的 AI 和重新架构的网络被提及为 Cloudflare 目前正在追求的未来机会,这将影响未来的业绩。
公司截至 2024 年 12 月 31 日的第四季度收入同比增长 27%,达到 4.599 亿美元,但净亏损 1,280 万美元。
全年收入为 16.7 亿美元,增长 29%,亏损 7,800 万美元,较 2023 财年的 1.84 亿美元亏损有所改善。
公司预计 2025 年第一季度收入在 4.68 亿至 4.69 亿美元之间,全年收入在 20.9 至 20.94 亿美元之间。
要实现这一目标,公司可能需要避免自身故障,比如 2 月 6 日其 R2 对象存储服务离线 59 分钟,导致数据无法访问的事件。
产品总监 Matt Silverlock 和员工 Javier Castro 承认,停机是"由于人为错误和在处理 R2 上托管的钓鱼网站报告时缺乏足够的验证保护措施所致。"
在 Cloudflare 员工试图关闭钓鱼网站时,他们的操作"导致对该网站执行了高级产品禁用操作,进而导致负责 R2 API 的生产 R2 Gateway 服务被禁用。"
如果 Cloudflare 操作正确,只有钓鱼者使用的 R2 存储桶和端点会被关闭。相反,整个服务都离线了。公司现在正在重新审视其流程,以确保这种情况不再发生。
好文章,需要你的鼓励
谷歌研究团队推出VaultGemma,这是其首个采用差分隐私技术的大语言模型。该模型基于Gemma 2构建,拥有10亿参数,通过在训练阶段引入校准噪声来防止模型"记忆"敏感用户数据。研究团队建立了差分隐私缩放定律,平衡计算预算、隐私预算和数据预算。尽管添加差分隐私会影响准确性,但VaultGemma在性能上与同规模非私有模型相当。该模型现已在Hugging Face和Kaggle平台开放下载。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
英国宽带服务商Olilo正式推出多千兆宽带服务,专门面向技术人员、工程师、系统管理员和家庭实验室爱好者。该公司自建Layer 2网络基础设施,提供对称多千兆宽带,支持静态IPv4地址和原生IPv6。Olilo与伦敦三大互联网交换中心建立对等连接,在英国对等网络中排名第24位。服务经过150多名技术用户的付费封闭测试,并通过Discord社区持续收集用户反馈优化服务。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。