在大数据时代,海量数据不断产生。企业数据量预计每18到24个月就会翻一番,且增速未见放缓。同时,企业数据的范围越来越广,从客户信息、财务交易、边缘计算到IT运营服务日志,各路数据汇聚成了“数据海洋”。
云计算架构的快速发展带来了更多数据处理方案。边缘、内部部署、公有云和私有云产品层出不穷,按需随选和一切即服务(as a service)解决方案也在迅速扩张。毋庸置疑,我们处在一个多云世界,数据几乎可以被存储在任何地方。从中挖掘数据价值对于企业至关重要,却也绝非易事。
在琳琅满目的云解决方案中,Cloudera的与众不同之处就在于帮助企业有效处理和管理存储在任何地方的任何数据。Cloudera 所提出的企业数据云理念正是这个全面云化时代中的沧海明珠。
在云计算发展早期,公有云似乎可以满足IT部门的所有需求。公有云所提供的简单模型,能够节省企业数据中心扩张带来的成本。然而其弊端也很快暴露出来,数据可能会被供应商锁定,导致企业无法随需应用,但转移出来成本又很高。面对这些问题,IT部门从实际经验中总结了一条真理——更多选择,绝不设限。数据和工作负载应该被放在最便于应用且能够创造价值的地方。企业的多样化部署,造就了今天的混合和多云世界,也带来了管理多个环境中数据的诸多挑战。
Cloudera的愿景是建立现代数据架构,帮助企业从数据中快速获得价值。数据管理应该从边缘处的数据创建开始,直至最终的数据处理,无论是在公有云、私有云,还是本地数据中心。这种贯穿数据整个生命周期的管理方式,支持Cloudera平台能够打通企业内部的数据孤岛,让相关业务部门能够获得其所需数据。毕竟,数据只有在对整个企业都实时可见、且被应用时,才真正能够释放价值。
业界普遍认为,非结构化数据是企业数据的主要组成部分。在下一个十年里,非结构化数据在所有数据中的占比预计将达到80%。为了管理这些数据,首先需要了解它们。企业需要对元数据进行规范化和分类,并且从经济和运营角度考虑,将数据存放在最能产生价值的地方。任务虽然艰巨,但Cloudera在这一领域独具优势。Cloudera的产品在全球范围内管理着超过40万台服务器,从5EB数据中为企业不断挖掘有价值的数据洞察。
Cloudera在借助AI和机器学习管理数据领域已经深耕多年。Cloudera认为,任何企业的数据战略都必须跨越边缘到云,数据管理必须自始至终。2019年1月Cloudera宣布与Hortonworks合并。这两家企业的强强联手,使Cloudera一跃成为全球数据管理市场的佼佼者。Cloudera的传统AI驱动数据管理与Hortonworks端到端数据管理方式相结合,创建了全球领先的下一代数据平台Cloudera Data Platform。Cloudera希望为企业提供一个本身即是多云且多功能的平台,用于管理企业数据云。通过统一的平台界面,对数据进行整个生命周期管理,并提供一致的安全和治理服务。
两家企业的合并十分顺利,短短9个月,Cloudera就推出了公有云版本的Cloudera Data Platform,其中包括Cloudera Data Warehouse和Cloudera Machine Learning服务,目前已在AWS和Microsoft Azure上商用。除了将边缘和云中数据管理整合在现有解决方案中,Cloudera目前的重点在于为CDP提供私有云功能。上述功能的测试版将于今年夏天正式推出。
Cloudera面对的是一个260亿美元的巨大市场。未来三年内,市场规模预计将会翻倍至520亿美元,这无疑是一个巨大的发展机遇。尽管市面上有很多企业数据管理产品,但是能够纵观全局、提供从边缘到云的一致性体验和全套功能的产品却很少。Cloudera将借此机会定义未来15至20年后的数据管理方式,并对新一代IT技术产生深远影响。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。