从性能上看,GPT-3的参数量较上一代提升超100倍达1750亿,训练所用的数据量达45TB。新推出的ChatGPT主要源于GPT-3的预训练模型,能对文本输入生成类似人类的响应,是专门为会话任务设计的模型。
发表在MedRxiv上的一项研究称,ChatGPT标志着自然语言处理模型(NLP)在医学问题回答任务上有显著改进。耶鲁大学研究者考察了ChatGPT在美国医学执照考试中的表现,结果显示ChatGPT在4个试题数据集上的准确率分别为64.4%、57.8%、44%和42%。随着问题难度增加,ChatGPT模型性能显著下降。研究认为,该模型与大学三年级医学生相当。