来源:清元宇宙
除了聊天、对话、代写作业,对ai的想象还能再疯狂一点吗?
要不,让ai来看病!
让ai看病?你一定觉得这是在开玩笑。虽然ai的沟通能力确是一流,庞大的数据库也让其展现了惊人的“学识”,但是,让ai看病,似乎太过异想天开。
事实上,ai的水平并不一定比一般的医生要差!
就在不久前,谷歌新一代的医疗聊天机器人med-palm 2以85%的得分率,通过了美国执业医师资格考试,并且在梅奥诊所等研究型医院开始了“实习”生活。
随着基于大语言模型的生成式ai的出现,“ai 医疗”迎来了重要的发展时机。
未来,ai机器人和你沟通病情、看片子、开药方甚至动手术,或许会成为一种常态。
01 ai的医疗应用前景
医疗健康领域一直都是人工智能技术率先落地的行业之一。
目前,ai在医疗领域讨论最多的应用场景大致有三个方面,医学影像识别、疾病诊断以及制药。
在医学影像识别方面,ai的作用不难理解,其主要是帮助医生预先标注影像中可能存在病变的部分。这节省了大量的时间,与此同时,在一些难以察觉的病症上,ai精准和高效的优势显露无遗。
在美国,一家名为videahealth的牙科护理公司,其率先开拓了人工智能在牙科领域的应用。
标记处代表存在蛀牙风险
该公司提供了ai辅助查阅医学影像的服务,人工智能根据影像检测患者的蛀牙程度,然后在图中打上标记,帮助医生很快地获知并且判断病人的牙齿情况。由此,医生节省了很大的时间和精力,并且能够在更长的时间内保持清醒的头脑和准确的判断力。
videahealth首席执行官兼创始人弗洛里安·希伦 (florian hillen) 表示,“当你去看牙医时,通常会错过其中一些疾病。不过,我们的人工智能会接收您的x光片,并指出您在其他疾病中的放射线骨质流失,这有助于牙医不会错过它。”
目前,美国90%的牙科诊所都可以使用这一平台辅助诊断。
此外,ai在疾病诊断方面也有着极为亮眼的表现。
在国际著名科学期刊《plos one》上的一项研究指出,深度学习模型在阿尔茨海默氏症诊断中比未经训练的ai模型更加准确,而且该技术能够排除一些干扰诊断的因素,如年龄。
马萨诸塞州综合医院研究人员用数万张人脑扫描图像训练了一个深度学习模型,部分图像是患有阿尔兹海默氏症的患者大脑,部分没有,随后该研究将该模型与真实临床诊断数据进行了对比。
结果显示,经过训练的深度学习模型识别阿尔茨海默氏症的准确率达到90.2%,相比之下,比没有接受过训练的、更简单的人工智能模型的诊断准确率高约5个百分点。
值得一提的是,90%的准确率还远远高于临床检测准确率。
在制药方面,ai的用途或许有点难以理解。
简单来说,ai的作用集中在新药研发上。凭借强大的数据整合与分析能力,ai能够帮助科学家识别新药靶点、设计新药、预测药物疗效及毒性,从而缩短药物发现及开发的时间,节省成本。
新药研发是一个极其耗时耗力的过程。一款全新靶点、全新机制的新药,其研发需要经过靶点发现、靶点验证、先导物发现,以及先导物优化等阶段,这个过程可能需要验证、筛选数十万个化合物。
ai具备强大的数据分析和深度学习能力,可以快速处理和解析大量的生物化学信息,帮助科学家筛选出合适的化合物,设计优化药物分子结构,从而缩短研发周期,节约研发成本。
例如,辉瑞推出的新冠口服药paxlovid(奈玛特韦片/利托那韦片),在传统的药物研发模式下,这款新药的研发过程可能需要花费数月时间。但在ai技术的赋能下,辉瑞和晶泰科技双方的科学家仅用了6个星期,便完成了药物的研发。
不过,ai制药虽然高效,但其通过率却并不高。
截至2022年年底,全球获批临床的ai药物管线有80条,其中有41条推进到1期,约占总数的一半;推进到2期的管线有29条。
虽然截至目前,没有任何一款由ai发现的新药物获批上市。不过,低通过率并不意味着ai制药这条路走错了,相反,许多医学界、药学界人士都相信,ai技术在生物医药领域的突破只是时间问题,但ai制药的趋势不可逆转。
02 ai巨头逐鹿医疗领域
看到如此广阔的应用前景,谷歌、微软、openai等科技巨头又怎会嗅不到商机呢。
谈及ai在医疗领域的应用,谷歌自然是避不开的重要对象。
2022年底,google首次推出医疗ai聊天机器人med-palm。该机器人主要用于回答医疗信息问题,提供优质医疗服务。
据了解,这是第一款成功通过美国医师执照考试(usmle)的ai模型,并被冠以“史上最高分医疗ai”的荣誉。
凭借此举,谷歌确立了自己在智能医疗领域的地位,成为了“ai 医疗”赛道上的重要领跑者。
不过,谷歌的追求和期待显然不止于此。
今年4月,med-palm的升级版——med-palm2进入测试阶段,并在谷歌5月的i/o大会上正式发布。只需输入患者的症状、病例、年龄等细节,med-palm 2就能给出长篇的解答。
据悉,med-palm 2是第一个在美国医疗执照考试(usmle)类问题上达到专家级表现的大语言模型,它能够正确回答多项选择题和开放式问题,并对答案进行推理,准确率高达86.5%,大幅超越了第一代的med-palm以及gpt3.5。
一篇发表在国际著名医学期刊《jama internal medicine》上的研究称,人工智能助手可能有能力帮助医生起草对患者问题的回答;聊天机器人对患者的回应要普遍优于医生的回应,并且在回答质量和同理心评分都明显高得多,“用人工智能改善医疗保健的机会是巨大的”。
不过,谷歌一项公开的研究表明,med-palm 2仍然存在一些大型语言模型常见的准确性问题。医生们发现google的med-palm和med-palm 2提供的答案,与其他医生相比,有更多的不准确性和无关紧要的信息。
尽管如此,在其他的指标上,如显示推理的证据、得到共识的答案,med-palm 2的表现可谓出色。保守来说,med-palm 2在推理、判断简单疾病层面和人类医生已相差不远。
目前,谷歌已经安排医疗ai聊天机器人med-palm 2在梅奥诊所(mayo clinic)等研究型医院“任职”,以方便对其进行进一步的检测和优化。
当然,除了医疗ai聊天机器人,谷歌还与一些医疗机构合作,构建ai模型以帮助简化超声图像的获取和解释,从而实现识别孕妇的胎龄以及早期乳腺癌检测等重要信息。
此外,其他一些知名的科技公司也致力于将ai应用于医疗领域。
同样在4月,微软和epic systems宣布将把openai的gpt-4人工智能语言模型引入医疗保健领域,以帮助医护人员回复患者信息和分析医疗记录。
半导体巨头英伟达(nvidia)不甘示弱。本周三,其宣布将向生物医药公司recursion pharmaceuticals(rxrx.us)投资5000万美元。事实上,早在2022年,它就发布了bionemo框架,用于训练和部署超算规模的大型生物分子语言模型,以帮助科学家更好地了解疾病,并为患者找到治疗方法。
英伟达创始人兼首席执行官黄仁勋表示:“生成式 ai 是发现新药物和治疗方法的革命性工具。我们很高兴与recursion的世界一流团队合作,加速全球生物分子生成 ai 模型的开发,并加快生物技术和制药公司的药物发现”。
而作为顶级玩家的马斯克,秉持以往“要干就要干大事”的作风,上来就给同行们秀了一波高端操作——脑机接口。
这一技术看似科幻,但也实则也是“ai 医疗”领域的一隅。在治疗癫痫、帕金森等神经系统疾病方面,脑机接口技术拥有广阔的应用前景。此外,脑机接口利用“脑-脊接口”甚至可以让瘫痪病人重新站起来。
03 “ai 医疗”模式的忧思
虽然“ai 医疗”模式已是大势所趋,不过,ai技术对于医疗行业的负面性以及当下存在的一些不足仍值得留意。
关于这一点,作为如今这场ai浪潮开启者的openai就曾特别指出,基于大型语言模型的chatgpt的输出可能不准确、不真实,有时还具有误导性;此外,chatgpt偶尔也可能产生有害的指令或有偏见的内容。
2021年,一个名为epic sepsis model的医疗诊断模型在筛查败血症病患时,出现了严重的漏检事故。密歇根大学医学院研究者通过调查分析了27697人的就诊情况,结果发现,该模型未能识别67%败血症病患。
哈佛医学院的数据科学家kun-hsing yu说:“ai的一些医疗决策,实际上就是抛硬币。”
这话并非虚言,其本人就曾对一场ai筛查肺癌竞赛中的模型进行检验。
虽然面对主办方提供的1397位患者的胸部ct扫描数据,五个获奖模型准确度都在90%以上。但经过kun-hsing yu赛后的重新测试,他震惊地发现,即便使用原比赛数据的子集,这些“获奖”模型最高准确率却下降到了60-70%。
并且,这样一种前后不一的结果,在许多学者的实验中也频频出现。
他们认为数据集是问题根源之一。
ai数据集的规模很大程度上决定了ai诊断的中允程度和一致性,但目前公开可用的数据集比较稀缺,这导致了模型很容易产生带偏见的判断。此外,数据集作为ai模型的关键部分,很多机构采取了严格的保密措施,使其成为了看不见的“黑箱”,缺乏透明度。
技术虽然是中立的,但却总是染上人的偏见。因此,ai医疗背后看不见的“黑箱”,不得不成为我们警惕的对象。
当然,除了医疗偏见问题,隐私问题也是ai浸润社会的趋势下,不得不考虑的问题。
医疗健康领域既涉及患者的个人信息,又涉及个人的生物识别特征,因而对医疗数据以及患者隐私保护的要求必然十分严格。
但智能时代,个人和公共之间的边界却是日益模糊的,个人数据是训练ai、提升ai服务水平的重要基石,要完全封闭个人信息显得十分困难。而个人信息在流动的过程中,是否能够被妥善保护,则成了一个值得思考的社会命题。