以Docker为代表的容器,在人们眼中是平台层面的技术。与属于基础架构层面的虚拟机相比,容器看似与底层存储设备没有什么必然的联系,甚至许多情况下使用本地存储就可以了。那么Docker到底有没有企业存储方面的需求?它与传统存储阵列之间有哪些需要配合的地方呢?
从企业存储生态系统到Docker结合点
Copy-On-Write机制的Docker存储卷,支持LVM、ZFS、BTRFS、AUFS和OverlayFS等几种供给格式。
随着每一轮新技术热潮的来袭,从事技术工作的笔者都会有一种“危机感”,毕竟包括企业级在内的IT行业更新太快,不坚持学习就很容易落伍。
从虚拟化、云计算、大数据,一直到软件定义无不如此,我们谨慎地关注着每个概念中有多少炒作的泡沫?当然也会有真正改变用户IT消费方式的变革,包括与传统基础设施,特别是服务器、存储设备的结合点;还有公共云服务、Server SAN/超融合这样的颠覆。
具体到技术和厂商,比如下图中的VMware、微软(Hyper-V和Azure);新一轮还在发展完善中的开源虚拟化管理/云平台OpenStack;还有本文要讨论的重点——Docker容器。
现 在有一种比较激进的思想,未来一切都是软件定义的,传统商业存储阵列将会慢慢失去市场。我们看到了VSAN的出现——至少目前它的应用还是有局限,而不是 万能的;我们也看到搭车OpenStack/KVM而火热的Ceph开源分布式存储,但它距离成熟易用还有很大的一段距离。因此在当前,虚拟化/云计算平台一直在加强对传统外部共享存储的支持,容器也不例外。
本文中引用了一些来自戴尔的资料,但它们都具有普适性,我们接下来的话题也会围绕通用技术趋势,而不是专属于某一家具体的产品。
上图列出了存储系统与领先的技术合作伙伴间的管理整合,这些是行业内一线厂商基本都要去做的工作。大致包括以下几个方面:
虚拟化整合:VMware VAAI、VASA、VVOL,微软Hyper-V对应的API支持等,由于本文主题在这里不详细介绍了。
云平台整合:OpenStack针对块存储设备支持的Cinder driver等。
应用保护整合:生成和管理具备Oracle数据库等应用程序一致性的快照/恢复点,也包括Windows VSS、VMware虚拟机的支持。
备份软件整合:通 过流行的备份软件对生成快照的数据进行保护,从而确保可恢复性,这里列出了赛门铁克(严格说现在算Veritas)和CommVault。如果是基于戴尔 SC存储快照的备份,应该还有自家的NetVault备份软件可以支持。(详见:《DellWorld2015快讯:NetVault Backup11智能备份详解》)
应用监控整合:如Foglight,是戴尔收购Quest获得的高级应用监控解决方案。我记得EMC等厂商也提供类似的软件产品
Docker容器整合:针对SAN共享块存储设备的容器卷管理系统。
Flocker拥有“无限可能”的卷管理器
目前我们看到包括EMC、戴尔SC系列在内的几家存储厂商/产品家族,都在与ClusterHQ公司的Flocker合作——一个针对Docker应用开源的容器数据卷管理器,它能够像本地存储那样对基于块的共享存储提供良好支持。
Flocker带来了灵活性和扩展性,它提供的工具能够:
●迁移数据
●运行容器化状态的服务(例如数据库)
●可移动性 - 在集群中的任意容器上使用
●管理Docker容器和数据卷
●卷跟随容器在主机之间(移动)
●由控制服务提供的REST API接口
与 Flocker结合之后,存储阵列拥有“无限可能”。Flocker可以支持较高版本的CentOS和Ubuntu Linux服务器(不排除有更新增加);可以使用的数据卷除了共享块存储之外,还有“本地”存储——我们理解后者中也包括被虚拟机视为本地存储的 Amazon EBS、OpenStack Ceph RBD和Swift中的镜像挂载,还有RackSpace云设施里类似的实现。
Flocker还可以与Linux上运行的任意数据库一起工作,这 里面包括传统关系型的MySQL、PostgreSQL,也有新兴的MongoDB、Redis和RabbitMQ等。上图中并未列出Oracle,应该 是因为Oracle已经有并且推荐使用自己的存储管理器ASM,直接控制到磁盘/SSD/LUN一级,Oracle一直不官方支持除自家VM之外的虚拟机 环境,我们也没听说过有人在容器中使用。
共享块存储容器迁移、能否做HA?
我们来看一下使用了Flocker之后有何不同。在原生Docker环境,当一台服务器上运行的容器化有状态服务(数据库)迁移至另一台时,其数据卷会留在原地,在新的服务器上启动的容器没有任何数据。也就是说,在迁移之前需要先手动停止容器并复制数据到新的服务器才能使用。
而在使用了Flocker之后,当容器移动时数据卷与它一起移动,您的数据库(容器)能够保持其数据状态。这里大家有没有联想到VMware的vMotion呢?传统并且最实用的vMotion虚拟机迁移是需要vmdk镜像位于共享存储上的,在这里戴尔SC阵列是同样的角色,我想与Flocker合作的其他传统存储厂商也是类似情况。
最后,具体到戴尔的存储是如何与Flocker一同工作呢?如上图,我们看到SC阵列上有一个100TB的LUN 10映射到2台服务器,其中Ubuntu Docker Host 1在上面运行了一个MongoDB容器。当Flocker迁移容器时,会一并发送指令给戴尔存储插件(由存储厂商与Flocker合作开发)迁移卷到Ubuntu Docker Host 2。
这里并不需要真正的数据拷贝,简单理解应该是一个把MongoDB卷从Host 1的容器上解除注册,然后将其注册到Host 2上的过程。
进一步思考,按照从vMotion到vSphere HA的思路,容器是否也可以在两台主机之间做高可用呢?在侦测到Host 1出现故障时,上面提到容器迁移的后半部分——即在备用主机注册共享存储上的数据卷,然后启动容器这一过程,实现起来并不复杂。
我们预计,随着Docker应用的不断普及,企业级数据迁移、高可用需求的不断出现,主流存储厂商会陆续提供这方面的支持。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。