现阶段,人工智能应用场景正在不断增多,市场规模不断扩大,使得机器学习价值日益凸显。越来越多企业开始应用机器学习技术来实现数字化转型。
例如,一家招聘网站,每天都要处理数以万计的求职简历,并且精准分发至数百个企业的不同职位中。分发的越精准,获取的用户信任度就会越高,网站经营自然也会取得良性发展。可是如此数量的简历,依靠人工分类筛选效率过于低下,而且分发精准度也难以得到保障。这时就可以利用人工智能技术,通过机器学习训练的方式来解决这个问题。
招聘网站可以将企业过往应聘者简历以数据形式记录下来,并依据成功聘用简历内容,设置关键标识的标签。这些标签与招聘企业不同职位需求一一进行对应,并对每一份简历,都有记录标识出是否最终被聘用,以深入了解招聘企业需求。然后开始训练机器,拿出一半数量的简历,让机器通过学习这些简历找出其中的模式。
训练完毕,用另一半数量的简历来对机器进行测试。如果成功率够高,就可以让机器根据新收到的简历来判断是否适合被聘用。
机器学习的建模、算法困扰
然而,对于多数行业来说,收集和处理数据是一个难题。机器学习三要素包括数据、算法和算力,三者缺一不可。也就是说,想要将机器学习技术在行业中成功进行应用,首先需要具备丰厚的数据积累,比如上文中的“足够多简历”,并且具有将这些数据建成数字模型,就好像上文中“找到简历申请成功的模式”,及运用这些模型实现管理、控制、分析、判断等能力,比如上面“用另一半简历进行测试”。
从目前看来,企业想要快速上手机器学习仍然是一个问题,因为企业首先需要具备丰厚的数据积累,其次要建立不同的模型,最后运用这些模型实现管理、控制、分析、判断等能力。但是在大多数企业之中,机器学习的普及会遇到知识的壁垒——有行业技术的人不懂AI,懂AI的人缺乏行业技术积累。如此一来,即便企业已经积累了海量数据,也无法将数据成功进行建模,有效转换成机器可以理解的知识。即便是有一些既有行业知识,又了解AI,但也只能局限在本行业,甚至某个企业中,实现智能化的业务处理。这让机器学习的普及步履维艰。
有没有方法可以让企业快速简单的掌握机器学习这项技能?
为了帮助客户最大限度实现数据价值,亚马逊云科技致力于帮助客户降低使用机器学习的门槛。2017 年亚马逊云科技在 re:Invent上发布了一款重要AI服务——Amazon SageMaker,这也是当年最有具有战略意义的产品发布。Amazon SageMaker能够面向包括数据科学家等多类角色,提供端到端快速应用构建的机器学习技术服务。
来到2021 re:Invent全球大会,亚马逊云科技又带来Amazon SageMaker的六项新功能。其中Amazon SageMaker Canvas进一步降低机器学习使用门槛,业务分析师可以无需编码即可使用点击式界面进行更准确的机器学习预测。
Amazon SageMaker Canvas面向零机器学习经验群体。也就是说,无论你从事的是生产加工、建筑制造乃至于人力资源、业务分析,完全没有机器学习的使用经验,都可以轻松使用这种无代码机器学习预测服务。
Amazon SageMaker Canvas 就是将机器学习模型的诸多步骤转变成可视化、可交互的 UI,从而解决用户的AI业务应用问题,号称:不写一行代码,快速生成机器学习预测模型。客户可以将Amazon SageMaker Canvas连接到他们的数据存储(例如 Amazon Redshift、Amazon S3、Snowflake、本地数据存储、本地文件等)。
在re:Invent 大会上对Amazon SageMaker Canvas的实例展示中,只需要通过拖拽上传数据,并指定模型,再点击一下快速生成,就可以自动化的完成机器学习的全部过程,并获取到一个机器学习准确度非常高的学习模型。
例如:全球豪华汽车和摩托车制造商宝马集团在整个价值链中已经采用人工智能,为客户、产品、员工和流程创造附加价值。Amazon SageMaker Canvas将人工智能/机器学习扩展至整个宝马集团。而且Amazon SageMaker Canvas还支持宝马集团的核心数据科学团队协作,并对由业务用户创建的模型在投入生产环境之前对其进行评估。
除了无需编码实现机器学习之外,为了让更多人能够了解AI技术,亚马逊云科技还通过Amazon SageMaker Studio Lab向大家提供出免费的机器学习开发环境,将机器学习带给每个人。
目前,全球众多研究人员和数据科学家正使用Amazon SageMaker快速构建、训练和部署机器学习模型。现在想要使用Amazon SageMaker Studio Lab的用户,不需要拥有亚马逊云科技账户或提供账单详细信息,只需要通过Web浏览器,使用电子邮件注册,Amazon SageMaker Studio Lab就能向用户提供无限制的用户会话、15 GB持久存储、用于免费训练机器学习模型,以及长达12小时的CPU和4小时的GPU计算。
使用Amazon SageMaker Studio Lab用户可以像开合笔记本电脑一样轻松地开始、停止和重启机器学习项目。而不需要构建、扩展或管理云资源,当用户完成实验并希望将他们的想法付诸实践时,可以轻松将其机器学习项目导出至Amazon SageMaker Studio,在亚马逊云科技上部署和扩展他们的模型。
免费的学习环境,将让更多用户获得机器学习技术的学习机会。Amazon SageMaker Studio Lab也可以成为数据科学家的免费原型设计环境,用户无需支付任何费用,即可快速、轻松地开始构建和训练机器学习模型。
宾夕法尼亚大学工程学院是现代计算机的发源地,在1946 年诞生了世界第一台大型通用电子数字计算机 ENIAC。70 多年来,宾夕法尼亚大学计算机与信息科学教授Dan Roth认为,使用机器学习编程最困难的部分之一是配置要构建的环境,通常需要学生选择计算实例、安全策略并提供信用卡。Amazon SageMaker Studio Lab则消除了这些设置所要的复杂性,并提供了一个免费的强大的实验环境。这让他们无需花时间配置机器学习环境,即可编写代码。
在今年年初,亚马逊推出了一项新的领导力准则:“成功和规模带来更大责任”。
为了让人工智能和机器学习技术可以得到更加广泛的普及,亚马逊云科技也正加大力度践行这一新领导力原则,Amazon Future Engineer、Amazon Girls’ Tech Day和Amazon Get IT针对年轻学者的科学、技术、工程和数学(STEM)教育计划,以及与学院和大学的合作。
为了将机器学习能力交到更多人的手中,亚马逊云科技还将通过Amazon DeepRacer冠军杯赛、培训与认证、机器学习大学、机器学习纳米学位等项目,计划到 2025 年全球培训 2900 万人,力促人工智能和机器学习更加普及。
通过Amazon DeepRacer,将理论转化为实际操作,学习如何训练机器学习模型驱动虚拟赛车。学生还可以在Amazon DeepRacer Student League中测试他们的虚拟赛车。Amazon DeepRacer Student League通过一辆由机器学习驱动的全自动驾驶 1/18 比例的赛车、3D 赛车模拟器以及一场全球竞赛,帮助各种技能水平的人学习如何构建机器学习模型。
Capital One、宝马、德勤、摩根大通、埃森哲和Liberty Mutual等企业已经使用Amazon DeepRacer让员工亲自构建、训练和部署机器学习模型。
千万美元奖学金 力促人工智能和机器学习更加普及
不仅如此,亚马逊云科技还提供高达1000万美元的亚马逊云科技人工智能和机器学习奖学金计划(Amazon AI & ML Scholarship),用于奖励全球范围内年青人和服务设施欠缺地区的学生,帮助他们做好准备,在未来从事工人智能与机器学习相关工作。
该项目除了免费提供数十小时机器学习模型训练和教育材料,还为来自弱势群体和服务设施欠缺地区的2000名学生提供Python Udacity Nanodegree人工智能编程项目奖学金,为获得者提供机器学习的基础编程工具和技术。
亚马逊云科技人工智能和机器学习奖学金计划与英特尔合作提供,并由人才转型平台Udacity提供支持,世界各地的学生均可获得数十小时免费培训模块和涵盖机器学习基础知识及其实际应用程序的教程。
从无代码机器学习、免费机器学习开发环境,再到1000万美元奖学金计划、智能赛事的举办,可以看出亚马逊云科技正在不遗余力地实行人工智能与机器学习的技术普及工作。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。