还记得你第一次输入
「验证码」
是在哪一年吗?
不知从什么时候开始
在我们登录网站账号时
输入验证码成为了一道
必答题
一开始,我们会被要求输入一些
数字验证码或者
回答简单的算术题
比如这样
▼
虽然在当时并不知道
这个突然冒出的验证码
是用来干什么的
但好在答题过程并不复杂
顺手填一下就好
可是后来我发现
这种“丧心病狂”的验证码
你一定见过吧
▼
还有这种
▼
这种
▼
当I是大写i而不是小写l
当0是数字零而不是大写O
当l是小写L而不是数字1的时候
我陷入了深深的怀疑...
好在,今天很多网站的验证码又回归了简单
比如让你用鼠标点击一下
或是移动完成一个拼图
验证码终于不再那么复杂了~
可是,至始至终
我都不知道验证码不断变化的背后
到底是为了什么...?
直到最近,我才知道
验证码的引入主要是为了
? 防止恶意程序采用暴力破解的方式进行不断的登录尝试,来破解用户密码。
? 防止恶意程序进行大量的注册,占用网站服务器资源。
? 防止垃圾帖,广告贴刷屏,使论坛、博客等网站没有办法运行。
只不过道高一尺魔高一丈
黑客也会通过技术手段
来实现验证码的自动识别
▲图片来自网络,若有侵权请联系我们删除
于是乎,在攻击者和程序员的
“军备竞赛”之下
验证码只能往复杂化的道路越走越远
从而严重影响了正常用户的登录体验
而在这其中
其实就大量运用到了AI
通过模仿人类的视觉识别原理来分析验证码!
人类视觉原理(对应于上左图):
◆ 从原始信号摄入开始(瞳孔摄入像素);
◆ 接着做初步处理(大脑皮层某些细胞发现边缘和方向);◆ 然后抽象(大脑判定,眼前的物体的形状);
◆ 最后进一步抽象(大脑进一步判定该物体为头像)。
深度学习利用了类似的过程(对应于上右图):
◆ 首先尽可能找到验证码图片里的各种边,这些边就是底层的特征(Low-level features);◆ 然后下一步,对这些底层特征进行组合,就可以看到大致的轮廓,它们就是中间层特征(Mid-level features);
◆ 最后,我们对轮廓进行组合,就可以组成各种各样数字和字母了,也就是高层特征(High-level features)这个时候就可以识别出或者分类出验证码了。
识别验证码
只是AI的小试牛刀
当然,上面说到的验证码识别,只是AI的简单应用,而像深度学习,如科研分析、语音识别等,所需的计算量就会非常大。
比如,2012年摘得ImageNet图像分类大赛冠军的AlexNet网络,包含8层神经网络、6000万个参数、65万个神经元;2015年夺冠的微软ResNet网络更是达到了152层。如此大的数据量,如果还用CPU进行训练,花费的时间就要以年计了。
因此,深度学习十分依赖高端硬件设施,其学习训练过程中涉及到大量矩阵运算,而GPU就是专门为矩阵运算而设计的。当前所有的主流深度学习框架,如TensorFlow、Caffe2、MXNet、PyTorch、CNTK等,均完善地支持GPU运算。
在这里,小编介绍一下戴尔易安信在去年发布的全新DSS 8440服务器,这是一款双插槽4U服务器,最大特性在于提供了高达10个GPU加速卡的支持,并且具备大量的本地存储,非常适合机器学习、训练应用程序以及其他计算密集型工作负载。
GPU是计算的利器,同时也会产生大量的能耗。但对DSS 8440来说,它采用了最多4台模块化电源进行供电,最大可以实现3200-4000W的供电能力,足以应对GPU的高能耗。
同时,DSS 8440还提供双层共12个散热风扇,用于解决伴随高能耗产生的散热问题。
*DSS 8440是一个动态机器学习平台,搭载2个Intel®至强®可扩展处理器,每个处理器最多24个内核/2个LGA3647/英特尔C620,专为机器学习应用程序和其他需要最高计算性能的高要求工作负载而设计。
未来版本的DSS 8440还将附带Graphcore处理器。
Graphcore的IPU处理器完全不同于以往的处理器类型,它专为AI/机器学习而设计。其强大的并行处理能力,实现了快速训练模型和实时操控,这使得Graphcore能够在帮助自然语言处理以及理解自动驾驶方面带来重要作用。
总而言之,可行的技术路线,需要底层基础架构的有力支撑。戴尔易安信DSS 8440是帮助用户构建足够算力平台的利刃。通过在开放平台上提供巨大的计算能力,DSS 8440能够帮助人们更快获得机器学习工作负载结果!
? 最后,说点题外话。其实从AI帮助破解验证码,从而给人们带来不好的用户体验来看,AI也是一把双刃剑,用得好是造福人类的强大工具,用不好也可能带来危害。
但是就任何技术来说,这都是不可避免的。结合技术发展史来看,人类社会的进步就是依靠不断的创新,只是创新的同时要不断健全相关的法律法规。所以,在这样的前提下,AI是让我们人类的生活变得更舒适的工具和手段。
尊敬的读者
计算机视觉技术的进步
推动着AI的进一步发展
也为越来越多的行业带来丰富和深刻的洞察
如何构建现代化的视觉智能体系?
戴尔科技企业级精品课特别邀请
中国科学院自动化研究所副研究员吕彦峰
为您深入解读计算机视觉智能
扫描下方二维码
即可参加
相关产品推荐:河南省眼科研究所副所长雷博:临床诊断像破案一样
相关产品:DELL 7400
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。