小美和朋友好久不见了,尽管俩人在一座城市打拼,因为各自行程不一致,常常三五个月都见不了面。这周末,她们的日程终于合上了,约在一家火锅店碰头。
开饭前,好友拿出手机:“小美,咱俩这么久没见了,自拍一下呗。”
“好啊!”小美凑过去,比了个剪刀手,“快,发朋友圈我给你点赞。”
10分钟过去了……
小美:“亲爱的,你在干嘛呢,怎么这么久都不发。”
好友:“别急,我在P图呢,我把脸P小点,还有后面那个灭火器太煞风景了。”
小美差点没把刚喝的水喷出来,什么年代了还P图!说着拿自己手机拉着好友自拍一张:“看,自带瘦脸、美白、祛痘、长腿功能,根本不用P~”
“呀,你这个手机堪比单反了哎,后面的灭火器都虚化了,而且我脸上的痘痘都没有了,脸也小了,看着很自然,一点也不违和。怎么做到的呀?”
小美扬起眉毛,举着手机洋洋自得:“智能双摄,拍出来就是这么美,我男朋友搞IT的,跟我介绍过原理,主要用了AI算法……”
当手机遇上AI▲▲▲
Q2017年开始最火爆的风口是什么?
自从Google阿尔法狗打败世界围棋冠军后,人工智能这个热点就被引爆,一直从年头烧到年尾。引用IT界的百试不爽的话说:站在风口上,猪都会飞。没错,人工智能就是这个风口。所以,2017年不但出现了大量与人工智能相关的独角兽公司,就连传统企业也开始发展自己的AI系统和应用。
手机作为人人必备的消费品,自然也要乘着AI的东风再上一层楼。
智能手机领域,自带美颜功能的产品越来越受青睐。如今是一个“无美颜不自拍”的时代,与其“拍照1分钟,修图2小时”这么麻烦,不如直接“所拍即所得”来得畅快。当下大多数年轻人都把自拍功能视为选购手机的首要条件,各大手机厂商也纷纷加入美颜手机阵营,专注于手机拍照的技术创新。
戴尔易安信某位客户,推出了新一代旗舰机,这款手机在自拍领域堪称业界翘楚:除了光学防抖、一键美白、多场景优化等功能,更有一把大杀器——结合AI的智能摄像头。智能双摄有多厉害?它能智能识别20多个独立场景、上千个场景组合,并可针对不同场景进行专属优化,拍出只属于你的独特美图。
AI智能双摄是如何炼成的▲▲▲
Q摄像头怎么会和AI发生反应,变成AI智能摄像头的呢?
这背后的技术原理在于深度学习的图像识别算法。过程是输入海量用户照片,根据拍照场景和用户观感不断调整照相参数,从而建立并维护适用于上千个场景组合的参数体系,支撑这个过程的就是基于Caffe架构(卷积神经网络)的深度学习应用平台。
以下是戴尔易安信团队拿下旗舰机AI智能双摄项目并进行开发的过程。
在开始之前,客户提出要求:升级AI集群的深度学习应用平台,要能够支撑2PB的海量存储空间需求,单客户端并发带宽达到2GB/s。为此,研发人员需要进行高速的图片文件读取和训练,为旗舰机的AI智能双摄提供深度学习框架的技术支撑。
当前,客户已经购买了NVIDIA(英伟达)支持8GPU的DGX-1服务器,希望在一周内定下方案并走上采购流程。面对这么一块大蛋糕,很多友商都摩拳擦掌,积极参与测试,欲一举拿下这个标志性项目。
对此,戴尔易安信售前团队、EDT团队和测试团队通力合作,联合NVIDIA资源收集DGX-1的兼容性信息,根据客户实际环境对技术方案进行多次论证,选定NSS架构并进行POC测试(Proof of Concept,针对客户具体应用的验证性测试),最终获得了优于友商的测试结果。
在深度学习的训练过程中,戴尔易安信团队将训练图片打包多成个文件集,从后端存储批量读到DGX-1本地内存,进行图片灰度、锐化等预处理;图片经过预处理后,组合成Batch队列导入GPU迭代循环训练,训练完成后,将可回滚的数据点、Checkpoint等写回后端存储。
在考虑Lustre/Ceph等多种架构选项之后,戴尔易安信团队最终采用了部署简单、技术成熟的NSS方案作为AI存储集群的架构。此架构通过实际业务压力测试,实现了快速并发读取图片,整体文件存储系统规模为2.5PB,单一挂载点100TB以上,测得单套读性能可达6.57GB/s、写性能可达1.84GB/s。
关于基础架构的技术选型,客户认为IT基础架构应以业务为中心,要选择稳定、成熟的合作伙伴搭建IT基础设施,借鉴他们的经验快速完成平台建设,而IT管理人员,不应被常规事物分走精力,要把关注点更多放到业务上。
最终,戴尔易安信高性能、稳定和成熟的技术方案说服了客户,他们选择与戴尔易安信合作,使用戴尔易安信的PowerEdge服务器、SC存储以及IB网络技术搭建平台,建设基于Caffe平台的深度学习框架,为研发团队提供最佳服务。
这个方案完全符合客户AI平台最初设计为2700img/s的期望性能目标,可实现智能运维管理和自动化、监控和管理运行状况、均衡工作负载并增强应用性能和可用性,从而提高研发部门的图片训练效率,快速构建AI深度学习训练平台。由此助力客户旗舰机开拓面部解锁、人脸识别、智能拍照、人像美颜等功能,占领手机行业技术制高点,加快产品研发进度,为2018年Android 9.0版本升级夯实基础。
对于跟戴尔易安信合作的原因,客户表示,戴尔易安信是一家脉络很清晰的公司,在智能手机行业,戴尔易安信长期致力于提供从服务器、存储、网络到高性能计算、实时数据分析等企业级IT解决方案和全方位的数据保护、迁移等增值服务,无论在技术还是经验层面都值得信赖。客户还提出,随着手机AI和大数据相关项目越来越多,他们正在考虑采用更多的戴尔易安信企业级解决方案。
好文章,需要你的鼓励
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
这项由香港中文大学和AWS团队联合开发的研究推出了TALK2MOVE系统,实现了用自然语言精准操作图片中物体的位置、角度和大小。该系统采用强化学习训练方式,通过空间感知奖励机制和智能步骤采样技术,在移动、旋转、缩放三类操作上的准确率显著超越现有方法,同时大幅降低了对昂贵训练数据的依赖,为AI图像编辑领域带来重要突破。
研究人员对Claude、GPT-4、Gemini和Grok等商用AI模型进行测试,发现这些模型能够记忆并完整输出受版权保护的内容。其中越狱后的Claude 3.7 Sonnet能输出95.8%的《哈利波特与魔法石》内容,而Gemini和Grok在无需越狱情况下也能输出超过70%的内容。这一发现可能对正在进行的AI版权诉讼产生重要影响,目前多家AI公司面临超过60项相关法律诉讼。
斯坦福大学等知名机构联合研究发现,企业AI助手在执行组织政策时存在严重"偏科"问题:处理允许请求时成功率超95%,但拒绝违规请求时仅13-40%。研究团队开发的COMPASS评估框架通过8个行业5920个测试问题,揭示了AI助手普遍缺乏"拒绝技能"的问题,并提出了针对性训练解决方案。