数据集成和管理供应商 Informatica 加强了其智能数据管理云平台 (IDMC) 与 Databricks 数据智能平台的集成,包括对 AI 函数的支持。
Databricks 提供智能数据仓库服务,随着生成式 AI 热潮带来越来越多需要处理的数据,其业务正在飞速发展。去年年底,该公司筹集了 100 亿美元资金,最近又通过债务融资贷款获得了 50 亿美元,使其总融资额达到 190 亿美元。Informatica 的数据提取、转换和加载 (ETL) 以及数据管理和治理产品,帮助将高质量数据导入 Databricks 用于 AI 训练和推理。
Informatica CEO Amit Walia 表示:"我们在 Databricks 相关业务方面取得了显著成功,业务快速增长,为武田制药、毕马威和 Point72 等客户带来了重要的业务成果。"
他说:"与 Databricks 合作的一个关键优先事项是帮助客户构建企业级生成式 AI 应用。这些应用利用高质量、可信的企业数据,在遵守企业数据治理政策的同时,提供具有丰富业务背景和深度行业语义理解的高影响力生成式 AI 应用。"
Databricks 产品高级副总裁 Adam Conway 补充道:"作为云原生、AI 驱动的数据管理领导者,Informatica 是我们的重要合作伙伴,支持从数据集成和转换到数据质量、治理和保护的所有方面。"
Databricks AI 函数是内置的 SQL 操作,允许客户直接对数据应用 AI。Informatica 的原生 SQL ELT 通过无代码数据管道支持 Databricks AI 函数,为无代码用户开放 Databricks 生成式 AI 功能。Databricks AI 函数使客户能够直接通过 SQL 在客户数据上使用生成式 AI 功能,包括情感分析、相似度匹配、摘要生成、翻译和语法纠正。
新的 Informatica 原生 SQL ELT for Databricks 使得"下推"数据管道成为可能,提供 50 多个开箱即用的转换功能,并支持 250 多个原生 Databricks SQL 函数。
去年 6 月,Informatica 将其 AI 驱动的 IDMC 集成到 Databricks 数据智能平台中。Informatica 的 Databricks DBRX 生成式 AI 解决方案蓝图为客户使用 Databricks DBRX 开发检索增强生成 (RAG) 生成式 AI 应用提供了路线图。原生 Databricks SQL ELT 使联合客户能够在 Databricks SQL 上执行具有完整下推功能的数据库内转换。
Informatica 在 Databricks Partner Connect 上的 CDI-Free 产品为客户提供了访问 Informatica 云数据摄取和转换功能的途径。其 IDMC 平台已通过 Databricks Unity Catalog 验证。
总的来说,Informatica IDMC 平台包含多个针对 Databricks 优化的功能,如 300 多个数据连接器、创建低代码/无代码数据管道的能力、数据摄取和复制,以及通过 Informatica 的 CLAIRE GPT 和 CLAIRE copilot 提供的生成式 AI 驱动自动化。
在 Informatica 2025 财年第三季度,收入同比增长 3.4% 至 4.225 亿美元。其每月处理的云交易量超过 101 万亿次,Walia 表示:"这一成就反映了我们对产品创新、以客户为中心的承诺,以及我们成为数据和 AI 领域瑞士角色的目标。我们看到 AI 驱动的数据管理用例势头强劲。"
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。