假如这天上班,
领导丢给你1000个文件,
含文本、表格、JPG、MP4各种格式,
要求你在一秒钟之内找到
那个叫“xxx”的文件,
试问如何做到?
(不禁想起了那些年的实习生涯)
哈哈,
这个问题地球人都知道,
检索呗!
没错,就是检索——
检索给了我们一双
在纷繁复杂表象下洞察世事的慧眼,
带来了高效、便捷的体验。
而在数据保护领域,
检索不仅能带来高效,
用得好,还能省钱。
对企业而言,数据恢复永远是一个争分夺秒的过程。每多一分钟的恢复时间,就意味着多一分损失。灾备事件发生后,企业要在第一时间确定哪些数据应该被恢复,从而减少损失。
在这个过程中,数据保护装置就成为企业能否快速恢复业务的关键——因为它需要快速找出数据的位置或指定时间段内包含了哪些数据,而这就对数据保护装置提出了很高的要求。
那么,今天领先的数据保护装置是如何实现数据的快速检索呢?分享一篇戴尔易安信中国研发中心技术大咖撰写的文章,探寻数据保护装置内的数据检索秘密。
作者简介
刘敏
高级首席工程师,资深架构师,戴尔科技集团软件安全专家,戴尔科技集团全球专利委员会委员,主要关注软件架构、分布式系统、搜索及安全等领域。
张鸣
戴尔科技集团数据保护事业部/软件工程总监,负责多个数据保护软件产品架构在云计算,虚拟化,搜索场景下针对不同客户需求的技术演进,同时领导多个软件工程师团队专注在下一代数据保护软件产品的开发。
当企业数据随着业务发展迅速增加,需要保护的数据也呈几何级数增长。另外伴随着虚拟化技术广泛应用,企业内部需要进行数据保护的对象也越来越多地表现为虚拟机及虚拟机里的关键工作负载。而在日益庞大的数据集面前,快速检索数据成为越来越重要的需求。
基于这样的背景,戴尔科技集团推出了最新的融合数据保护解决方案——IDPA 4400,它包含完备的搜索子系统,集成了强劲的搜索功能,提供了延伸的客户场景。
完全的分布式架构
IDPA 4400的搜索子系统是完全的分布式架构,支持分布式架构很多特性,包括:
易于缩放
搜索子系统根据数据保护系统的容量部署多个节点组成集群,达成系统的搜索吞吐需求,既可以动态减少节点数量,节省系统资源以便其它子系统提高性能,也可以增加节点数量使搜索子系统的性能成比例提升。
高可用
集群内的索引存在多份副本,单一节点的不可用并不影响整个子系统的可用性。如果某一节点不可用,该节点上的数据会自动在其它可用节点上再建副本,后续再有节点不可用也是如此,而且整个过程是全自动的,无需人工干预。
并发吞吐
搜索子系统的每个节点可以直接和数据保护子系统的节点通讯以获取信息,用户的搜索请求也会分发到子系统的若干或者全部节点上并发执行,将结果汇总后呈现给用户,实现最大的吞吐能力。
多级搜索支持
对于数据保护的粒度和数据恢复的粒度,不同用户之间有不一样的需求,而搜索子系统支持不同级别的查找功能,所需的系统资源也会随着粒度的提高而增加。
元数据搜索
也称为文件搜索,搜索系统存储了数据保护对象(通常最终表现为文件)的元数据(例如域、应用、路径、作者和日期等),用户可以根据这些元数据非常快速地定位到数据的备份及历史记录并对应进行操作。
全文搜索
大部分情况下,元数据搜索要求用户记得需要查找的文件的文件名,起码是部分文件名或者路径,相对而言这一点并不容易实现。
而全文搜索就大大减轻了用户记忆文件名或路径的压力,启用了全文搜索功能以后,用户只需搜索文件中的内容就可以定位到数据,方便又快捷。并且,文件搜索功能可以支持各种常用的文件格式,例如办公文档、邮件、网页、音频、视频、图片等等。
虚拟机内元数据搜索
全文搜索尽管方便强大,但也有不适用的情况。
比如虚拟机场景下,通常是把虚拟机的整个磁盘内容作为一个/多个文件进行保护,但全文搜索并不支持虚拟机的磁盘文件。对此,搜索子系统借助VMWare技术,实现了虚拟机磁盘内容的元数据检索功能。
可扩展的搜索结果操作
搜索完成得到搜索结果后,用户还可以采取其他操作以满足别的需求,这些操作可以根据数据保护系统的功能对应地进行扩展,一些常见操作包括:
● 查看文件详细信息:查看元数据搜索相关的全部信息;
● 预览文件内容:预览全文搜索对应的提取出来的文本内容;
● 下载文件:下载整个文件到本地以便进行进一步的检查和操作;
● 恢复文件:把文件的特定版本恢复到目标系统或者机器。
数据搜索和数据恢复相结合,将带来持续的高效和成本节约。
作为戴尔易安信专为中小型企业打造的集成式数据保护解决方案,IDPA 4400将保护存储、服务和软件、搜索和分析,以及云长期保留和灾难恢复整合到一个设备中,可为企业提供简单而强大的数据保护,性价比极高。
▲点击图片了解更多戴尔易安信IDPA 4400信息
IDPA 4400具备以下特点:
强大的全面覆盖范围、性能和云计算就绪性。它支持大型应用程序生态系统,可将备份时间缩短为原来的1/2、将所需带宽减少98%,并且支持7倍多的备份流;
可在应用装置中增加达20%的容量,平均重复数据消除率为 55:1;
易于管理、部署和升级,支持从24TB到96TB的本地扩容,上云最高可扩展至192TB,无需额外硬件;
提供高效且经济划算的原生云灾难恢复(恢复到 Amazon AWS)以及端到端流程编排——点击3次即可完成故障切换,点击2次即可完成回切 ,且实现所有这些不需要额外的硬件;
领先的VMware集成使虚拟机管理员可以从本地vSphere用户界面直接完成最常见的备份和恢复任务。
此外,IDPA DP4400已加入戴尔易安信未来无忧存储保障计划,该计划提供3年期满意度保障、硬件投资保护、最高55:1数据保护重复数据删除率保障以及明确定价,以一致且可预测的保障定价让客户更加安心。
融合了数据搜索和数据恢复的IDPA DP4400,无疑为企业用户提供了一柄强大的数据保护利器,二者结合将使数据恢复越来越简单直接,数据保护系统的用户反馈也必将越来越好。
好文章,需要你的鼓励
谷歌发布代理支付协议AP2,支持AI代理代表用户自动购物和决策。该开放协议获得60多家商户和金融机构支持,旨在实现AI平台、支付系统和供应商间的互操作性。协议要求两级审批机制:意图授权和购物车授权,确保交易可追溯。支持全自动购买和加密货币支付。万事达、美国运通、PayPal等主要金融服务商已表示支持。
腾讯混元团队推出P3-SAM系统,这是首个能够自动精确分割任意3D物体的AI模型。该系统采用原生3D处理方式,摆脱了传统方法对2D投影的依赖,在近370万个3D模型上训练而成。P3-SAM支持完全自动分割和交互式分割两种模式,在多个标准测试中达到领先性能,为游戏开发、工业设计等领域提供了强大的3D理解工具。
CrowdStrike在其年度Fal.Con 2025大会上发布了智能代理安全平台和智能代理安全团队两款新产品,旨在应对AI时代日益增长的安全需求。新平台基于企业图谱架构,统一企业遥测数据,配备AI优化查询语言。Charlotte AI AgentWorks提供无代码平台,让安全团队可轻松构建和部署可信安全代理。智能代理安全团队则通过AI驱动的代理直接服务客户,解决传统防御无法应对AI速度威胁的问题。
NVIDIA Research推出了革命性的UDR系统,让用户可以完全自定义AI研究助手的工作策略。该系统解决了传统研究工具固化、难以专业化定制的问题,支持任意语言模型,用户可用自然语言编写研究策略,系统自动转换为可执行代码。提供三种示例策略和直观界面,实现了AI工具的民主化定制,为专业研究和个人调研提供了前所未有的灵活性。