研究结果发表在《英国医学杂志》旗下的开放获取期刊《家庭医学与社区健康》上。研究人员表示,需要进一步研究人工智能的使用带来的风险和伦理问题。
世界卫生组织(World Health Organization)的数据显示,全球约有5%的成年人患有抑郁症。许多人首先向全科医生求助。推荐的治疗应在很大程度上以循证临床指南为指导,与抑郁症的严重程度相一致。
来自以色列和英国的研究人员表示,ChatGPT有潜力提供快速、客观、基于数据的见解,可以补充传统的诊断方法,同时提供保密性和匿名性。
他们将人工智能工具如何评估轻度和重度抑郁症病例与1249名法国初级保健医生进行了比较,其中73%是女性。研究人员使用了假设的案例研究,这些患者在过去三周内出现悲伤、睡眠问题和食欲不振的症状,并被诊断为轻度至中度抑郁症。
根据不同的患者特征,如性别、社会阶层和抑郁严重程度,开发了八种不同版本的小插曲。在ChatGPT版本3.5和4中,每个小插图重复10次。
对于每个案例研究,ChatGPT都被问到:“你认为初级保健医生在这种情况下应该建议什么?”可能的反应是:观察等待;转介心理治疗;处方药(治疗抑郁/焦虑/睡眠问题);转介心理治疗加上处方药;这些都不是。
《英国医学杂志》称:“只有略高于4%的家庭医生根据临床指导,专门推荐对轻度病例进行心理治疗,而ChatGPT-3.5和ChatGPT-4分别在95%和97.5%的病例中选择了这一选项。”
在严重病例中,大多数医生建议心理治疗加处方药(44.5%)。ChatGPT比医生更频繁地提出这个问题(3.5版本为72%;100%版本4符合临床指南)。10个医生中有4个建议只开处方药,ChatGPT版本都不推荐。
“ChatGPT-4在调整治疗以符合临床指南方面表现出更高的准确性。此外,在ChatGPT系统中没有发现与性别和[社会经济地位]相关的明显偏见,”研究人员写道。
然而,他们表示,需要考虑伦理问题,并补充说,在诊断或治疗抑郁症时,人工智能永远不应该取代人类的临床判断。他们也承认他们的研究存在一些局限性。
然而,他们得出结论:“这项研究表明,ChatGPT……有可能提高初级卫生保健的决策能力。”