近日,2023全国大学生计算机系统能力大赛暨第三届OceanBase数据库大赛落下帷幕。本届大赛共吸引海内外包括新加坡国立大学、清华大学、浙江大学、西安交通大学等268所高校的1154支队伍参赛,经过三个多月的比拼,来自西北工业大学的“五点下班”队夺得冠奖,获10万奖金。
OceanBase是蚂蚁集团旗下的自研原生分布式数据库,曾连续打破“数据库世界杯”的世界纪录。作为业内首个专注于数据库内核技术的大赛,OceanBase数据库大赛发起于2021年,旨在培养和发现数据库行业专业内核能力的关键人才,已连续举办三届,有超过3500支队伍参赛。
2023年大赛进一步升级为全国大学生计算机系统能力大赛,由系统能力培养研究专家组发起,全国高等学校计算机教育研究会、系统能力培养研究项目示范高校共同主办、OceanBase承办、华东师范大学等协办。
大赛分为初赛和决赛两个阶段。初赛基于功能小而全的MiniOB进行,参赛者能够快速上手学习数据库的基本功能模块,提升对数据库内核运作原理的认知。决赛则基于OceanBase在启动过程中的核心步骤 ,要求选手优化单机模式下的相关步骤,如缩短选举时间、加快数据库初始化等,参赛选手需要在短时间内了解OceanBase的工作原理,直面源码。
最终,来自西北工业大学、浙江大学、电子科技大学、中国人民大学等高校的20支队伍参与了决赛答辩。决赛队伍的选手普遍为00后,队伍名称也各有趣味,如“五点下班”、“梭哈你跟不跟”、“白天写论文、晚上写bug”等。
“五点下班”队夺冠后表示,大赛提供了深入了解数据库内核的机会,从“麻雀虽小但五脏俱全”的MiniOB开始,从0到1进行数据库内核研发,再到工业级OceanBase上进行优化,难度逐级上升,将所学理论应用到了工业级数据库的实现中。
作为本次大赛的协办方,华东师范大学数据科学与工程学院院长钱卫宁教授表示,数据库尤其是分布式数据库,是支撑数字化转型的基础设施之一,以OceanBase为代表的一批国产数据库系统正在快速崛起、换道超车,在系统架构和核心技术上取得了系列突破,大赛将有力推动中国分布式数据库系统技术和产业发展。
今年是OceanBase数据库大赛首次纳入全国大学生计算机系统能力大赛,全国大学生计算机系统能力大赛技术委员会主任、教育部计算机类专业教指委副秘书长高小鹏教授介绍,这是期望通过大赛牵引教学,培养熟练掌握数据库技术的核心人才,帮助学生在思考问题的系统性、全面性基础上,进一步提升工程实施能力。
数据库,是基础软件“皇冠上的明珠”。数据库人才短缺是全球性问题,而国内比国外对这一问题的感触更深。越来越多企业联合高校搭建竞技平台,帮助产业培养人才,有望帮助年轻人树立信念、获得实践土壤,成为推动国产数据库发展的下一代。
“OceanBase初创之时,国内数据库内核研发人才短缺,我们引进了一批最优秀的毕业生自己培养,虽然毕业生经验不多,但通过自己的努力很快便成为了国产数据库的中坚力量。”OceanBase CTO 杨传辉谈到,“14年过去,OceanBase在自研数据库领域已拥有一定领先优势,我们希望通过持续举办、长期投入数据库大赛,来加速中国数据库内核人才培养的步伐。”
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。