2018年7月10日-11日,2018中国大数据应用大会在成都召开,大会以"大数据赋能数字中国"为主题。由成都市人民政府指导,中国大数据专家委员会、中国电子信息产业集团有限公司中国电子学会、四川省经济和信息化委员会主办,世界工程组织联合会工程技术创新委员会(WFEO-CEIT)、成都市经济和信息化委员会、成都市博览局全力支持,中国电子器材有限公司、中国电子学会科技交流中心承办,业内知名媒体至顶网与科技行者协办。大会上医渡云联合创始人兼首席执行官 孙喆先生发表了《数据智能,推动产业创新》的主题演讲。
从全球的医疗发展来看,精准医疗的概念,现在成为了一个热门的主题。精准医疗其实它有一个很大的精准点,就来自于是不是基于真实的世界去做,能不能基于海量的数据去做,这个其实是做医疗大数据的一个基准。
无论是对于医生诊疗,还是监管局监管药片,以前都是随即对照的方法,它带来的好处是比较明确的效力研究。它的问题在于会有特定的设定组。比如说我们要去对照某一个人群有没有效果,它要把所有的干扰因素都去掉。当我们研究的药品放到现实当中,有些药品是没有效的,我们实际感受到的药是没有研究的效果那么好的。
在今天的真实环境下,真实的数据它有几个大的部分,一类最核心的还是围绕临床数据,无论今天做新药的研发还是做真实世界的诊疗,都是在大量的医疗当中去做,这都是数据核心的部分。为了把数据做好,还要考虑今天在精准医疗所需要的生物药品数据,基因数据,包括气侯环境,外部的数据,以及每个人的健康生活状态的数据,这些数据的共建才能为精准医疗打下一个基础。
现实当中,医疗数据相较于其它的行业而言它的共性是不一样的。医疗机构的封闭导致无法将医疗数据共享。从立法的角度来讲,医疗数据首先是属于患者的,很难被企业或者是医疗机构去使用,我们的行业进程和实际的状况还是有差距的,所以还是有一条比较长的路要走。
此外,医疗数据对比,会比金融数据更难。因为它是非结构化数据,医疗发生对于疾病的描述,仅仅是疾病当中的可能是5%或者是10%,还有很多我们不知道关于医疗相关的数据,这都阻碍了我们在医疗数据应用上处理的难题。
从2015年开始,无论是大数据还是人工智能都成为了国家的战略,要建立统一的信息平台对行业的数据治理。推动了信息产业更多的进入到这个行业之中
把医疗大数据做好的核心是要解决数据网络的问题,也就是说这些数据从哪儿来。当前数据存储在不同的医疗机构、不同的制药企业之中,又缺乏一个好的标准、缺乏共享机制、缺乏流通环节还有隐私保护环节。这些都是要挖掘的,需要进行采集、清洗、重构。需要有对数据的认知能力。
行业的趋势,首先是要解决医疗数据获取的问题,挖掘出可用的数据,构建成产品应用平台,打通闭环,之后才能服务于其它的机构。
医渡云今天在中国已经是这个行业从数据的规模到整个的产业应用闭环是做得最完整的。现在医渡云整个平台和合作伙伴覆盖了三亿的人的数据。差不多有十二亿人次的临床数据。医渡云联合了一百家医院,同时有七百家以治疗为主的医院网络体系,还有70万医生群体帮他们做诊断。有大量覆盖的疾病,这个疾病是大类的疾病。应用的方面其实涉及到的方向主要是集中在医疗、科研、管理,包括政府监管和新药研发这几个大的行业。
医渡云非常强调跟医疗机构的合作,中国最主要的医疗数据也是存储在医疗机构。在全中国肿瘤领域,以及在综合化医疗领域最好的医院都是医渡云的合作伙伴。同时医渡云需要和各地的政府,和很多的专家,很多的医科大学从人才的角度,从区域人群的数据和整个公共服务的角度都需要把这个网络体系做起来,去解决应用场景应用问题。
医渡云业务最下层构建的是整个医疗大脑部分,往上是医渡云的医疗服务平台,它面向政府的监管,面向老百姓的健康,以及保险等几个大的方面。
医渡云有600多人,60%从事过医生事业。做了这些基础化的服务之后,医渡云还希望把平台支撑到医疗机构。医疗机构里边有大量的产业专家,需要跟合作伙伴建立以疾病、专科为主的临床的研究网络,在这个研究网络可以看到还是以全生命周期为基准的数据为本。今天在医渡云的平台上,医生可以协同打通自己的GCDP进行新药的研发,这都基于医渡云底层技术优势。
好文章,需要你的鼓励
在基于Chiplet的架构中,可观测性正成为系统设计的关键缺失环节。多位半导体行业专家指出,AI可从硅层遥测数据中挖掘价值,但前提是架构须提供一致的检测手段、近传感器数据压缩及可编程采集能力。专家们强调,多供应商Chiplet生态系统需要标准化、安全的遥测模式,以实现跨芯片、封装和互联域的故障定位,同时保护敏感运营数据。目前,AI在遥测分析阶段已展现出显著价值,但可观测性的扩展本质上仍是架构问题。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
生命科学企业在全渠道战略和AI平台上投入巨大,但成效往往不尽如人意。问题根源不在于技术本身,而在于组织架构、数据治理和工作方式未能同步演进。许多转型项目止步于试点阶段,原因是各部门数据孤立、职责不清。要实现从传统CRM向智能互动的真正转型,企业需优先建立统一的数据基础和跨团队协作机制,并将AI能力嵌入日常工作流程,而非将其视为独立模块。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。