2018年7月10日-11日,2018中国大数据应用大会在成都召开,大会以"大数据赋能数字中国"为主题。由成都市人民政府指导,中国大数据专家委员会、中国电子信息产业集团有限公司中国电子学会、四川省经济和信息化委员会主办,世界工程组织联合会工程技术创新委员会(WFEO-CEIT)、成都市经济和信息化委员会、成都市博览局全力支持,中国电子器材有限公司、中国电子学会科技交流中心承办,业内知名媒体至顶网与科技行者协办。大会上医渡云联合创始人兼首席执行官 孙喆先生发表了《数据智能,推动产业创新》的主题演讲。
从全球的医疗发展来看,精准医疗的概念,现在成为了一个热门的主题。精准医疗其实它有一个很大的精准点,就来自于是不是基于真实的世界去做,能不能基于海量的数据去做,这个其实是做医疗大数据的一个基准。
无论是对于医生诊疗,还是监管局监管药片,以前都是随即对照的方法,它带来的好处是比较明确的效力研究。它的问题在于会有特定的设定组。比如说我们要去对照某一个人群有没有效果,它要把所有的干扰因素都去掉。当我们研究的药品放到现实当中,有些药品是没有效的,我们实际感受到的药是没有研究的效果那么好的。
在今天的真实环境下,真实的数据它有几个大的部分,一类最核心的还是围绕临床数据,无论今天做新药的研发还是做真实世界的诊疗,都是在大量的医疗当中去做,这都是数据核心的部分。为了把数据做好,还要考虑今天在精准医疗所需要的生物药品数据,基因数据,包括气侯环境,外部的数据,以及每个人的健康生活状态的数据,这些数据的共建才能为精准医疗打下一个基础。
现实当中,医疗数据相较于其它的行业而言它的共性是不一样的。医疗机构的封闭导致无法将医疗数据共享。从立法的角度来讲,医疗数据首先是属于患者的,很难被企业或者是医疗机构去使用,我们的行业进程和实际的状况还是有差距的,所以还是有一条比较长的路要走。
此外,医疗数据对比,会比金融数据更难。因为它是非结构化数据,医疗发生对于疾病的描述,仅仅是疾病当中的可能是5%或者是10%,还有很多我们不知道关于医疗相关的数据,这都阻碍了我们在医疗数据应用上处理的难题。
从2015年开始,无论是大数据还是人工智能都成为了国家的战略,要建立统一的信息平台对行业的数据治理。推动了信息产业更多的进入到这个行业之中
把医疗大数据做好的核心是要解决数据网络的问题,也就是说这些数据从哪儿来。当前数据存储在不同的医疗机构、不同的制药企业之中,又缺乏一个好的标准、缺乏共享机制、缺乏流通环节还有隐私保护环节。这些都是要挖掘的,需要进行采集、清洗、重构。需要有对数据的认知能力。
行业的趋势,首先是要解决医疗数据获取的问题,挖掘出可用的数据,构建成产品应用平台,打通闭环,之后才能服务于其它的机构。
医渡云今天在中国已经是这个行业从数据的规模到整个的产业应用闭环是做得最完整的。现在医渡云整个平台和合作伙伴覆盖了三亿的人的数据。差不多有十二亿人次的临床数据。医渡云联合了一百家医院,同时有七百家以治疗为主的医院网络体系,还有70万医生群体帮他们做诊断。有大量覆盖的疾病,这个疾病是大类的疾病。应用的方面其实涉及到的方向主要是集中在医疗、科研、管理,包括政府监管和新药研发这几个大的行业。
医渡云非常强调跟医疗机构的合作,中国最主要的医疗数据也是存储在医疗机构。在全中国肿瘤领域,以及在综合化医疗领域最好的医院都是医渡云的合作伙伴。同时医渡云需要和各地的政府,和很多的专家,很多的医科大学从人才的角度,从区域人群的数据和整个公共服务的角度都需要把这个网络体系做起来,去解决应用场景应用问题。
医渡云业务最下层构建的是整个医疗大脑部分,往上是医渡云的医疗服务平台,它面向政府的监管,面向老百姓的健康,以及保险等几个大的方面。
医渡云有600多人,60%从事过医生事业。做了这些基础化的服务之后,医渡云还希望把平台支撑到医疗机构。医疗机构里边有大量的产业专家,需要跟合作伙伴建立以疾病、专科为主的临床的研究网络,在这个研究网络可以看到还是以全生命周期为基准的数据为本。今天在医渡云的平台上,医生可以协同打通自己的GCDP进行新药的研发,这都基于医渡云底层技术优势。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。