生活中处处充满了数据
在地球上
我们每天都会产生
5亿条推文
400万GB的聊天数据
2940亿封电子邮件
……
根据IDC的数据,在2020年,全球创建、捕获、复制和消耗的数据总量约为64ZB,而到了2025年,全球数据总量可能会达到惊人的163ZB,如果将其存储在艾字节数据中心里,整个数据中心可能有好几个足球场那么大,建造和维护成本高达数十亿美元。
那么,有没有一种更有效的方式来存储这些数据呢?
当然是有的啦~许多科学家认为,另一种更加高效的解决方案就潜藏在我们的DNA当中:既然DNA能够承载遗传信息,那么它也能够储存数字信息。按照国际上广泛接受的说法,每一克DNA可存储215PB的数据。麻省理工学院生物工程教授马克·巴斯这样说到:
“理论上,一个装满DNA的咖啡杯可以存储世界上所有的数据。DNA的存储密度甚至比闪存要大一千倍,而当你制造出DNA聚合物后,它就不会消耗任何能量,你可以编写DNA,然后将其永久保存。”
我们可以看到,相比于其他存储介质,将DNA作为存储介质拥有诸多优势:
01
存储密度极高
每个核苷酸,最多相当于两个比特,约为1立方纳米。理论上讲,1立方毫米的DNA便能够存储大约1EB的数据,真正做到把EB级的数据“握到手心里”。
02
存储时间长
在合适的存储条件下,这些DNA可以存储上万年,且几乎没有后期维护成本。
03
能耗极低
使用DNA作为存储介质无需额外的维护成本,由于其高密度的特性,存储数据不再像其他介质一样需要占用大量场地,能耗也远远小于传统介质。
DNA的存储原理并不复杂,数字存储系统将文本、照片等信息编码为0和1;同样的,遗传密码的四种核苷酸在DNA中编码为:A、T、C和G。我们可以用0来表示G和C,用1来表示A和T。简单来讲就是用遗传代码ATGC来替代计算机的二进制代码。
整个DNA存储流程大致可以分为四个步骤:信息编码、DNA合成、DNA测序和信息解码:
第一步:借助信息科学领域的编码算法,将数据转换为DNA中的四种碱基序列。
第二步:利用DNA合成技术例如固相亚磷酰胺三脂法、酶合成法进行DNA的合成,这一步骤相当于数据的写入。
第三步:依靠基因测序技术,在众多信息中读取你所需要的DNA序列信息。
第四步:将碱基序列重新转换成二进制序列,在经过纠错后便可得到原始数据。
当然,将DNA作为存储介质并不是一个新颖的话题,使用DNA存储数据的想法可以追溯到1959年,但以当时的技术条件,该项研究并未取得突破性进展。近年来,随着算力上限的不断突破、各科学领域不断交叉融合,才让几十年前近乎疯狂的想法逐渐变为可能。
当然,人类在探索的路途中不止DNA存储一种,下一代颠覆性存储技术还有无惧湿热、干冷的玻璃存储以及可行性更高的全息光存储。我们可以发现,无论是哪一种存储技术,都在追求更小的体积和更大的容量,这也是存储的本质:通过提高读写效率以满足数据管理和数据应用的需求。
尽管大规模使用下一代存储介质还不能完全实现,但我们一直在朝着这一方向努力着,例如数据缩减技术:在存储介质上保留一个唯一实例,将冗余数据替换为指向唯一数据副本的一个指针,从而做到在更少的空间储存更多的数据,节约存储成本并延长SSD的使用时间。越高的数据缩减比就意味着更多的有效空间,而这一比例也是衡量一款存储产品先进与否的重要标准。
而在这方面,戴尔科技“第五代存储”家族的PowerStore绝对可以称作该领域的佼佼者,在不妥协性能的前提下至少实现4:1的无损数据缩减,即每4TB数据写入存储盘里最终只占用1TB的空间。

戴尔PowerStore采用英特尔®至强®可扩展处理器,该处理器可以优化工作负载,可靠性强,还有高计算力、高稳定性和高效敏捷性,帮助企业为数字化变革做好准备。
除了4:1的数据缩减比以外,PowerStore还采用了专用的压缩处理器,不会额外占用控制器的CPU资源,这就意味着用户不必担心开启缩减功能后,存储性能急剧下降,让您的数据缩减功能“始终可用”。

当然,数据缩减功能不仅仅是PowerStore独有,今年新发布的PowerMax 2500除了拥有开放系统4:1数据缩减以外,在大型机存储领域也能提供3:1的数据缩减保证,填补了业内该领域的空白。
30年前,人们很难想象GB级别的数据能够存放在一块十几克的塑料盒子里,而现在,包含闪存颗粒的U盘已经成为人们日常工作生活中的常客。戴尔科技作为全球数字化转型领导者,也将通过不断革新的技术帮助企业提炼宝贵的数据,挖掘数据的价值!

如果您想了解更多有关戴尔科技的产品和解决方案信息,请扫描以下二维码咨询戴尔官方客服。

好文章,需要你的鼓励
Helios Towers供应链总监Dawn McCarroll在采访中分享了公司的数字化转型经验。作为一家在非洲和中东地区运营近15000个移动通信塔站的公司,Helios正通过SAP S/4Hana系统升级、AI技术应用和精益六西格玛方法论来优化供应链管理。McCarroll特别强调了公司Impact 2030战略中的数字包容性目标,计划在未来五年内培训60%的合作伙伴员工掌握精益六西格玛原则,并利用大数据和AI技术实现端到端的供应链集成。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
威胁行为者在npm注册表上传8个恶意包,伪装成n8n工作流自动化平台的集成组件来窃取开发者OAuth凭据。其中一个名为"n8n-nodes-hfgjf-irtuinvcm-lasdqewriit"的包模仿Google Ads集成,诱导用户在看似合法的表单中关联广告账户,然后将凭据传输到攻击者控制的服务器。这种攻击利用了工作流自动化平台作为集中凭据库的特点,能够获取多个服务的OAuth令牌和API密钥。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。