《科创板日报(bào)》12月28日讯(编(biān)辑(jí) 宋子乔) 众多(duō)专(zhuān)业学科中,医(yī)学(xué)以难度强(qiáng)、压力大著称,但仍有(yǒu)无数人接(jiē)受挑战(zhàn),选择迎难而上(shàng),如今,AI也跑来和医学生“抢饭碗(wǎn)”。
当地时间(jiān)12月27日,谷歌公布了一(yī)个(gè)新的医疗AI模型“Med-PaLM”。在经历(lì)一系列考(kǎo)核后,该模型被证实“几乎达到”了人类医生的水平。
![]()
具(jù)体来看,研究(jiū)团队准备(bèi)了一个医学问题问答数据(jù)集“MultiMedQA”,涵(hán)盖(gài)医学考试(shì)、医学(xué)研究和消费者医学问题,该(gāi)“题库”收集了(le)MedQA(USMLE,美国医师(shī)执照考试题),还引入了他们自己的(de)新数(shù)据集HealthSearchQA,它由搜索(suǒ)过的健(jiàn)康问题组成(chéng)。
该团队又请来一组临床医生作答。这些临床医生分布于美国和英国,在初级保健、外科、内(nèi)科和儿科方面(miàn)具有专(zhuān)业经(jīng)验。
最后(hòu),研究人员将模型和人(rén)类医生的(de)答案匿名后交给(gěi)9名分别来(lái)自美国、英国(guó)和印度(dù)的(de)临床医(yī)生进行评(píng)估。
结果(guǒ)显示,Med-PaLM在科学常识(shí)方面(miàn)的正确率在92%以上,在理解、检索(suǒ)和推理能力方面,也几乎达(dá)到了人类医生(shēng)的水(shuǐ)平,并在(zài)克服隐性偏(piān)见方面略胜一筹。
不(bú)过,该研究(jiū)负责人也表示,Med-PaLM给出的答案在整(zhěng)体上仍然不如临床(chuáng)医生,该模型在实(shí)际应用前有待(dài)进一步完善。
追根溯源,Med-PaLM是怎么诞生的(de)呢?
这里(lǐ)不得不提谷歌在(zài)今年发布的转(zhuǎn)换(huàn)器语言(yán)模(mó)型——PaLM,该模型基于Pathways架构、拥有(yǒu)5400亿参数(shù),是Google迄今(jīn)为止研发的最大规模的模型,全名为Pathways Language Model。
PaLM模型在语言理解等各种方面的评估测试中的表现十分(fèn)出色,甚至还在语言和推理类的测评中超过了人类。
Med-PaLM正是PaLM的衍生品。谷歌研究团队首先在上(shàng)文提及的医学问题问答(dá)数据集“MultiMedQA”上评估了PaLM及微调变体Flan-PaLM,然(rán)后,基(jī)于此提出了指(zhǐ)令提示x调(diào)整,让(ràng)Flan-PaLM进一步与医学接轨,进一步(bù)产(chǎn)生了(le)Med-PaLM。
值得注意的(de)是,AI模型的每一次(cì)突破,都预示着更聪(cōng)明的机器(qì)人即(jí)将(jiāng)到来。指挥机器人干活不是什么(me)新奇的事,但要让机器人能够理解你的命令背后(hòu)的意(yì)图,那就要考(kǎo)验它的“大脑”好(hǎo)不好(hǎo)用(yòng)了。将(jiāng)AI模型应用(yòng)到机器人(rén)身上相当(dāng)于给机器(qì)人“开智”。
据(jù)了解(jiě),今年8月份(fèn),谷歌(gē)就(jiù)将大型语(yǔ)言模型首(shǒu)次集成到机器人中,有了AI模(mó)型(xíng)的加持(chí),机器人(rén)能像人类一(yī)样响应完整的命令。
谷歌研(yán)究人(rén)员就此做了演示。当对(duì)机器人说:“我(wǒ)饿了,你能给我点零食吗?”机器人在自助餐厅中搜索一(yī)番后,打开了一(yī)个抽屉,找到一袋薯片并将它拿给(gěi)研究人员。
可以预见的(de)是,通过进一步的(de)训练、优化,Med-PaLM模型的回答准确率(lǜ)将进一步提高,基于此模型的机(jī)器人(rén)医生也有望更快出现。