在2021年两会中,生物医药领域的发展成为了热点话题。上海对生物医药等三大先导产业提出了新的目标:努力实现产业规模倍增,打造包括生命健康产业在内的六大重点产业集群。
当前,中国医药领域数字化进程不断加速,国家积极推动精准医学发展,基因测序正在从个体走向大规模群体,从科研走向广泛应用,伴随而来的计算分析模式也逐步走向云端,基因测序行业在云计算、大数据、AI的科技浪潮之下,正在释放前所未有的能量。
4月16日,由上海市生物医药科技发展中心主办,上海市生物医药行业协会协办,华为技术公司承办的万物生长——基因测序精英沙龙活动在上海成功举办。
华为与业内知名专家学者、基因测序相关企业齐聚现场,聚焦行业发展,凝聚思想共识,激发奋进力量,共同就云计算、大数据、AI等新技术赋能基因测序行业场景,做了深入探讨。
上海市生物医药科技发展中心主任兼上海市生物医药技术研究院院长傅大煦致欢迎辞,他表示基因技术正在迎来一个新的发展的春天,国家对基因技术的发展越来越重视,基因编辑技术越来越被临床认可,未来基因测序这个行业在医学领域一定有很大的发展空间。大数据云计算等一系列的技术为基因测序技术也带来了新的发展机遇,推动上海基因检测与基因技术达到新的发展。
基因测序从科研走向应用
上海市生物医药技术研究院副院长黄薇带来了《精准医学时代测序技术从科研走向应用的创新发展》的主题分享。
复旦大学生命科学研究院副院长卢大儒为大家带来了题为《基因测序与遗传病》的主题分享。
云计算、大数据、AI助力基因测序行业发展
北京希望组CEO汪德鹏就《三代测序大数据分析与云计算》与大家进行了深入探讨。
华为云医疗智能体产品总监孟鑫介绍了“华为云人工智能在基因测序领域的探索和实践”。华为云携手生态伙伴,将云计算、AI、大数据等技术与基因测序技术有机结合,共同推动基因测序的数字化和智能化转型。他表示,华为云医疗智能体(EIHealth)为基因组、医学影像、药物研发三个领域提供了专业AI研发平台,并深度融合AI与科学计算,产生更加便捷、快速、准确、可解释的医疗智能模型,加速医疗大健康行业的创新发展。
自由研讨环节由华为云医疗智能体产品总监孟鑫主持,参会嘉宾就“云计算、大数据、AI如何助力基因测序”、“基因测序行业云化之路阻塞问题讨论”等话题,从各自的观点出发,充分探讨,碰撞思维的火花。
华为云医疗智能体产品总监孟鑫提到,云计算的安全性能有效承载基因测序行业对数据等保安全的高要求,华为在保护客户数据隐私与安全方面遵从着严格的行业标准规范。
北京希望组CEO汪德鹏提到,华为云可能会带来基因测序价值的商业模式突破创新,把技术研究与商业价值变现有效结合,进而推动基因测序行业圈层的知识产权保护与发展。
华为上海云与计算CTO徐华蕾提到,生信领域BT+IT跨学科深度交叉的特点和其他行业非常不同,现在科研人员往往是既需要懂生命科学领域知识又要有IT相应能力,甚至需要亲自写脚本,极大的影响了科研成果产出效率。华为作为一家专业的拥有深厚ICT技术能力的公司,在基因测序领域已经做了大量的研发并形成专业的解决方案,切实的帮助生信科研人员聚焦科研本身。
基因测序行业正在势如破竹的发展,而云计算加速了这一进程,此次基因测序精英沙龙,各位业内大咖共襄盛举,是华为技术有限公司深化服务产业集群,助力生物医药行业数字化转型的又一次重要实践。华为技术有限公司聚焦生物医药行业发展,举办万物生长生物医药行业系列活动,接下来,还将为业内朋友带来主题为医药流通、创新药物研发、医疗器械等的专题活动。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。