数据集成和管理供应商 Informatica 加强了其智能数据管理云平台 (IDMC) 与 Databricks 数据智能平台的集成,包括对 AI 函数的支持。
Databricks 提供智能数据仓库服务,随着生成式 AI 热潮带来越来越多需要处理的数据,其业务正在飞速发展。去年年底,该公司筹集了 100 亿美元资金,最近又通过债务融资贷款获得了 50 亿美元,使其总融资额达到 190 亿美元。Informatica 的数据提取、转换和加载 (ETL) 以及数据管理和治理产品,帮助将高质量数据导入 Databricks 用于 AI 训练和推理。
Informatica CEO Amit Walia 表示:"我们在 Databricks 相关业务方面取得了显著成功,业务快速增长,为武田制药、毕马威和 Point72 等客户带来了重要的业务成果。"
他说:"与 Databricks 合作的一个关键优先事项是帮助客户构建企业级生成式 AI 应用。这些应用利用高质量、可信的企业数据,在遵守企业数据治理政策的同时,提供具有丰富业务背景和深度行业语义理解的高影响力生成式 AI 应用。"
Databricks 产品高级副总裁 Adam Conway 补充道:"作为云原生、AI 驱动的数据管理领导者,Informatica 是我们的重要合作伙伴,支持从数据集成和转换到数据质量、治理和保护的所有方面。"
Databricks AI 函数是内置的 SQL 操作,允许客户直接对数据应用 AI。Informatica 的原生 SQL ELT 通过无代码数据管道支持 Databricks AI 函数,为无代码用户开放 Databricks 生成式 AI 功能。Databricks AI 函数使客户能够直接通过 SQL 在客户数据上使用生成式 AI 功能,包括情感分析、相似度匹配、摘要生成、翻译和语法纠正。
新的 Informatica 原生 SQL ELT for Databricks 使得"下推"数据管道成为可能,提供 50 多个开箱即用的转换功能,并支持 250 多个原生 Databricks SQL 函数。
去年 6 月,Informatica 将其 AI 驱动的 IDMC 集成到 Databricks 数据智能平台中。Informatica 的 Databricks DBRX 生成式 AI 解决方案蓝图为客户使用 Databricks DBRX 开发检索增强生成 (RAG) 生成式 AI 应用提供了路线图。原生 Databricks SQL ELT 使联合客户能够在 Databricks SQL 上执行具有完整下推功能的数据库内转换。
Informatica 在 Databricks Partner Connect 上的 CDI-Free 产品为客户提供了访问 Informatica 云数据摄取和转换功能的途径。其 IDMC 平台已通过 Databricks Unity Catalog 验证。
总的来说,Informatica IDMC 平台包含多个针对 Databricks 优化的功能,如 300 多个数据连接器、创建低代码/无代码数据管道的能力、数据摄取和复制,以及通过 Informatica 的 CLAIRE GPT 和 CLAIRE copilot 提供的生成式 AI 驱动自动化。
在 Informatica 2025 财年第三季度,收入同比增长 3.4% 至 4.225 亿美元。其每月处理的云交易量超过 101 万亿次,Walia 表示:"这一成就反映了我们对产品创新、以客户为中心的承诺,以及我们成为数据和 AI 领域瑞士角色的目标。我们看到 AI 驱动的数据管理用例势头强劲。"
好文章,需要你的鼓励
香港大学和加州大学伯克利分校的一项新研究显示,在没有人工标注数据的情况下,语言模型和视觉语言模型能够更好地泛化。这一发现挑战了大型语言模型社区的主流观点,即模型需要手工标注的训练样本。研究表明,过度依赖人工示例反而可能对模型的泛化能力产生负面影响。
OpenAI 发布了一款名为 Operator 的网络自动化工具,该工具使用名为计算机使用代理 (CUA) 的新 AI 模型来控制网络浏览器。Operator 通过视觉界面观察和交互屏幕元素,模仿人类操作方式执行任务。这项技术目前仍处于研究预览阶段,OpenAI 希望通过用户反馈来改进系统功能。
大型语言模型如 ChatGPT 展现了对话能力,但它们并不真正理解所使用的词汇。研究者们在冲绳科学技术大学构建了一个受大脑启发的人工智能模型,虽然其学习能力有限,但似乎掌握了词汇背后的概念。通过模仿婴儿学习语言的方式,研究团队将人工智能训练在一个能够与世界互动的机器人中,探索如何让人工智能实现类似人类的语言理解。
这篇文章介绍了利用人工智能设计新酶的成功案例,这种酶有潜力分解塑料。尽管生物学告诉我们,简单的化学反应可能非常复杂,但通过AI驱动的蛋白质设计,研究人员能够创造出与自然界不同的酶。研究表明,设计酶的过程虽然复杂,但可以在计算机上完成,未来可能会有更多的应用。