关注我们:

王士泉:生成式大语言模型对医疗产品提升的影响

2023-05-17

来源:未知

分享到:


王士泉:生成式大语言模型对医疗产品提升的影响 引言 基于生成式大语言模型的快速发展和能力的迅速提升,正带

王士泉:生成式大语言模型对医疗产品提升的影响

引言

基于生成式大语言模型的快速发展和能力的迅速提升,正带来巨大商机。今年3月15日,最近比较火热的ChatGPT已发布了GPT-4版本,表现出很高的人机交互水平,在各种专业和学术基准上显示等同人类水平的性能。在全球引发了轰动,让人们体验到支持多任务的GPT模型在语言理解、多轮对话、文本生成、机器翻译、文本概要、语言推理、实体识别、语言推理和关系抽取等方面丰富的语言处理能力,而1750亿个参数和巨量的语料产生的涌现现象,也让人们对生成式大语言模型在医疗领域应用产生了期许。

王士泉是国内医疗信息化解决方案龙头企业东华医为科技有限公司的科研类项目负责人,拥有近20年的行业信息化经验。王士泉表示:“在健康医疗领域,利用生成式大模型打造AI产品会对电子病历与共享交换类系统、临床知识库与CDSS以及临床科研三大类系统产生较大影响。由于国内医疗数据不可能外接到ChatGPT或其他外部运营的大模型上,这意味着必须要有自己可控的、较为廉价的类似模型与工具。”

王士泉系统分析了生成式大模型在健康医疗领域三大类系统产生的提升效果。

1684307947897.jpg

 

一、电子病历系统与区域卫生交换共享、检索类系统

电子病历系统、临床/专病库系统、区域卫生共享平台等,由于数据格式复杂性、规范性等问题,数据质量、标准化与互联互通一直存在诸多困难。

电子病历系统/专科电子病历系统/急诊病历/护理系统等系统,长期存在病历模板定义与利用复杂、病历数据质量低、录入效率低等问题。利用生成式大模型,提供具有自学习能力的模板,可提升病历质控与病历录入效率。

生成式大语言模型基于强大的自然语言理解与生成能力,可大幅度提升对于医疗文档的转化、清洗以及检索和分析的效率,将对医院的CDR/RDR系统建设产生影响。智能检索与数据转换一直是CDR/RDR系统的两大难点,文本结构化,数据归一化,本质上就是利用数据格式统一,简化分析利用的困难。利用生成式大语言模型,提供基于自然语言的深度语义检索,会给各种快速的医疗数据转换与查询带来方便。

在全民健康信息平台建设中,医院端数据格式转化,数据的质控及数据利用,一直存在诸多困难,利用生成式大语言模型,会使上述过程更加语义化,为多模态数据检索和利用提供更丰富的场景。

二、知识库与临床决策支持类系统

传统的临床知识库构建通常采用ETL工具,从医书、临床指南,医学文献中抽取知识,抽取过程费时费力,而且更新困难。知识图谱等结构化的方式语义表达能力远弱于自然语言,包括多元关系、条件关系,因果关联等等各种知识模式的定义,都需要很高的专业认知能力和业务建模能力,增加了此类系统构建的难度。此外,由于应用场景不一,和具体医疗场景结合时,仍需要对知识库进行二次加工,建设效果普遍一般,大部分基于传统知识库的临床诊断,基本上只能作为文献查询辅助用途。而在临床决策系统中,也很难将特定病情和知识库的条目简单关系起来,并用结构化方法描述。

通过开源框架Langchain等一系列工具,以及各种Zero-Shot抽取能力,对文本数据的解析能力,可以高效的建立临床知识库系统。基于自然语言检索和问答,也将提升知识库应用的便利性。而利用生成式大语言模型,融通更多真实世界数据,将病人病情通过大模型进行解析与推理,结合知识库,可提供更加精准与个性化的临床决策支持。

三、临床科研系统

临床科研包括科研项目构建、构造CRF表单、临床数据采集、科研数据分析以及科研论文撰写等过程。对于临床科研数据采集,可利用生成式大语言模型的数据转换能力,快速把数据转换成CRF表单需要的格式。对于论文撰写,由于此类论文本身在模式上有大量的雷同,差别主要是病种不同,数据不同以及数据结果分析不同。采用基于生成式大语言模型数据到文本生成的技术,再结合一些常见的模板,将对文章初稿快速编写,起到一定的效果。

 

王士泉总结道:利用生成式大语言模型的多任务能力为核心,整合计算机视觉、图像处理、计算机语音处理等模型,形成多模态识别和生成能力,并让不同AI模型和算法实现能力互补,克服单一模型和算法的能力局限,通过模型和算法的整合,形成不同AI模型和算法有机生态,让可让医疗AI产品具有实现丰富强大的智能应用场景,更好的满足客户的价值需求。

VR硬件评估more+
智能硬件more+

投稿