本标准对基于大语言模型的药物警戒个例安全性报告人工智能辅助信息提取的全流程进行了系统性的规范,其主要技术内容涵盖模型选择、优化、部署、性能评估以及系统应用与质量控制等多个关键环节,并提出了LLM在该场景下应用的总体考量和通用原则。(一)应用大语言模型辅助信息提取的总体考量在大语言模型系统的开发、部署、验证和质量控制的全生命周期中,应遵循一系列通用原则,以确保其安全、负责和有效地运行。这些原则包括人工审查和监督(HumanOversight)、可问责(Accountability)、透明性(Transparency)、可解释性(Explainability)、风险管理(RiskManagement)、数据保护和隐私(DataProtectionandPrivacy)、治理(Governance)、持续学习(ContinuouslyLearning)。(二)大语言模型系统辅助信息提取的全流程管理1.大语言模型的选择本标准强调选择大语言模型应紧密结合药物警戒的应用场景和具体需求,确保技术适用性与任务目标的高度匹配。核心考量因素包括但不限于以下因素:长文本处理能力:鉴于药物警戒报告可能包含大量描述性文字,大语言模型支持的上下文Token宜不低于128K。逻辑推理能力:药物警戒信息提取涉及众多复杂的判断规则,模型须具备较强的逻辑推理能力。多模态数据处理能力:药物警戒场景需要处理包含文本、图像(如病历截图),甚至音频等多种形式的报告数据。技术成熟度与成本预算的平衡:需综合考量应用复杂度、技术成熟度及成本预算,在商业闭源模型或开源模型中做出审慎选择。持续预训练与微调定制化能力:宜选择支持持续预训练和针对性定制化的大语言模型,以更好地适应药物警戒的专业需求。部署需求的符合性:应充分考虑组织或用户对模型部署方式(如云端、本地化)的具体要求。持续学习与更新能力:选择具备持续学习和迭代更新能力的模型,以满足药物警戒业务发展的长远需求。2.模型调优为提升大语言模型在药物警戒信息提取任务中的表现,本标准推荐了多种模型调优技术,包括提示工程(PromptEngineering)、知识库管理以及模型微调等。提示工程:通过优化输入给模型的提示词(Prompt),如采用少样本示例(Few-shot)、思维链(Chain-of-Thought)引导、任务拆解等策略,提升模型输出的准确性。知识库管理:补充药物警戒相关的政策法规要求和行业专业知识,如《药物警戒质量管理规范》《个例安全性报告E2B(R3)区域实施指南》、药品说明书、医学术语集(如MedDRA,MedicalDictionaryforRegulatoryActivities)等,为模型提供必要的背景知识和专业参考,增强其理解和判断的准确度。模型微调:对于特定任务,可利用大量高质量的标注数据对基础模型进行微调,使其更适应药物警戒领域的语言特点和信息提取需求。但本标准同时强调,微调需审慎评估数据质量、标注成本、测试集的适用性,并进行充分的验证。3.模型部署和架构设计本标准指出,模型的部署策略应根据机构的实际需求(如数据量、处理速度、安全性要求等)灵活选择。在系统架构设计层面,必须将数据保护和合规性置于核心地位,为此,本标准专设章节强调数据安全与隐私保护的重要性。系统应该严格遵守国家关于数据安全、个人信息保护、网络安全、伦理规范以及数据跨境传输等方面的法律法规要求,并在设计之初就充分考虑敏感数据的全生命周期安全,包括数据的采集、传输、存储、处理、使用及销毁等各个环节,确保技术架构能够支撑合规运营。4.模型性能评估本标准推荐采用混淆矩阵中的准确率(Accuracy)、精确率(Precision)和召回率(Recall)、Fβ分数(FβScore)等指标来评估大语言模型在药物警戒个例安全性报告信息提取任务中的性能。尤为重要的是,本标准创造性地结合药物警戒业务的实际场景,对混淆矩阵中的基本术语(如TP真阳性、FN假阴性、FP假阳性、TN真阴性)赋予了具体的业务含义,例如“正提”(模型正确提取且内容准确的字段)、“漏提”(模型未能提取应提取的字段)、“错提”(模型提取了不应提取的字段,或提取内容不准确)、“正拒”(模型正确地未提取不相关或不存在的字段)等,并给出了相应的计算公式。5.系统应用策略与质量控制本标准指出,应根据模型的实际输出准确率、法规符合性要求以及数据准确度要求等因素,综合评估并制定合理的大语言模型使用策略。具体可分为基本依赖大语言模型进行信息自动提取、大语言模型与人工相结合但以模型为主进行提取,以及模型与人工结合但以人工为主进行提取等不同模式。至关重要的是,在整个大语言模型应用系统的生命周期中,必须坚持人工审核和监督,并建立清晰的问责机制。此外,还应制定相应的标准操作规程(StandardOperatingProcedure,SOP),对提取结果进行定期审查,并根据评估结果和外部环境变化(如法规更新)对系统和流程进行必要的更新。