被《哈佛商业评论》誉为
21世纪最性感的职业
Glassdoor 2022年美国职业榜上
排名第三
以“高大上、高工资、高技能”
为主要标签
打工人做梦的素材源泉
这个金光闪闪的职业就是
「数据科学家」
数据科学家人才困境
“数据科学家是能够从杂乱无章的非结构化数据中挖掘出宝藏的人。”
商业世界正变得越来越以数据为中心,随着高级分析、人工智能 (AI) 和机器学习 (ML) 的广泛应用,组织对数据科学家的需求正在飙升。
数据科学家了解数据的力量并将其与更大的业务战略联系起来,他们对数据进行清洗、处理,将大量信息转化为有益于增加收入的情报。然而现在除了科技巨头,很多公司都缺乏数据科学家。
软件开发和咨询公司Anaconda的2022年数据科学现状调查表明,90%的公司都遭遇了数据科学家人才短缺的问题。无独有偶,在全球最大的自由职业工作社区Upwork今年8月发布的调查中,60%的招聘人员表示,最难招聘的职位是数据科学家。
不少组织试图提高数据科学家的职位薪水来吸引人才,但获得必要的技能和学位既困难又费时,可能需要很多年才能找到足够的候选人来满足需求。对此就没有办法了吗?
不,越来越多的组织正在寻找数据科学家的“平替”——「公民数据科学家」。
公民数据科学家
按照Gartner的定义,公民数据科学家(citizen data scientist)是创建或生成模型的人,这些人可能是营销、运营、金融、定价、IT或任何其他员工,基本角色在统计和分析领域之外。
与真正的数据科学家相比,公民数据科学家可能缺乏深厚的统计知识、不会编程、也不了解机器学习的工作原理,但他们可能是最了解公司文化、市场和盈利驱动的人。
公民数据科学家可以使用各种自动化工具来降低数据科学任务的难度,如数据准备、建模和模式识别等,并据此执行复杂的诊断分析,从数据中提取有价值的见解——而这可能比对公司运作机制知之甚少的专业数据科学家更能给公司带来创新。
授权公民数据科学家的关键是赋予他们适当的工具,这些工具将重复型、手动密集型的机器学习任务自动化,可以让缺乏专业技能的公民数据科学家用来解决相对简单的数据分析问题。
于是可得以下公式:
普通员工+适当的工具=公民数据科学家
授权公民数据科学家
作为全球领先的IT解决方案供应商,戴尔科技集团以全面先进的解决方案助力各行业用户数字化转型,其中经验证的工程设计方案提供交钥匙式的硬件和软件组合,可帮助组织又快又好地实现数据洞察。
戴尔经过验证的AI设计从一开始就设计为根据特定用例动态满足需求,自动机器学习解决方案Automatic Machine Learning(AutoML)可自动执行算法选择、特征生成、超参数调整和模型评估,能够简化和加快AI的开发时间,降低数据科学门槛,帮助组织授权公民数据科学家。
这一方案包括用于自动机器学习H20.ai Driverless AI、用于云原生AI开发和部署的NVIDIA AI Enterprise Suite™,VMware vSphere® Tanzu™,以及经过验证和优化的戴尔基础架构堆栈,包括VxRail V670或PowerEdge R750xa服务器、PowerSwitch网络和PowerScale F600存储。
该方案主要优点如下:
AI简化:自动机器学习让用户更容易训练AI模型,快速比较数千种组合和迭代,在几分钟或几小时内找到最佳模型;
更快的AI洞察力:机器学习操作 (MLOps)允许将AI更快引地入到生产中,帮助组织快速发现隐藏在数据中的业务价值,轻松解决复杂问题;
经过验证的AI专业知识:组织可以自信地部署经过工程测试/验证的AutoML解决方案,并获得世界一流的服务和支持。
基于戴尔自动机器学习解决方案,那些一般由专业数据科学家负责的工作(如构建机器学习 (ML) 模型、数据预处理、特征工程、模型选择、超参数优化和模型后处理等复杂任务),可全部或部分交给AutoML框架自动完成,即便是不具备数据科学专业知识的公民数据科学家也可以成功构建机器学习模型,推动业务成果转化。
数据科学经常被视为从事高深莫测的活动,专业数据科学家的高门槛也让很多组织望而却步,这一现状严重限制了多个项目快速迭代和增量改进的可能性,对打造数据驱动型企业形成障碍。
对于资源有限、无力雇佣数据科学家的企业来说,使用戴尔自动机器学习解决方案授权公民数据科学家带来了机会,数据科学民主化是大势所趋,在戴尔AI解决方案支持下,普通员工也可以拨开数据矿山上的迷雾,获得价值洞察,进而助力组织在数字经济中取得成功。
END
会员福利
如果您想了解更多有关戴尔科技的产品和解决方案信息,请扫描以下二维码咨询戴尔官方客服。
好文章,需要你的鼓励
OpenAI发布ChatGPT Atlas AI浏览器,支持网页问答、历史查询和邮件改写等功能。同时曝光秘密项目Mercury,雇佣约100名前投行精英以每小时150美元训练AI金融模型。公司还因用户滥用Sora生成马丁·路德·金视频而暂停相关功能。此外,医疗AI搜索引擎OpenEvidence获2亿美元融资,估值60亿美元。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
随着Chrome和Safari主导浏览器市场,众多替代浏览器正在挑战这些行业巨头。本文梳理了当前顶级替代浏览器,包括AI驱动的浏览器如Perplexity的Comet、Arc公司的Dia、Opera的Neon和OpenAI的Atlas;注重隐私的浏览器如Brave、DuckDuckGo、Ladybird和Vivaldi;以及专注特定领域的浏览器如Opera Air和SigmaOS。这些浏览器通过AI集成、隐私保护、定制化和专注用户福祉等特色功能,为用户提供了多样化的浏览体验选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。