06月
01日
OpenAI公布大模型新训练方法:阻止ChatGPT“一本正经地胡说八道”
牛透社6月1日消息,据新浪科技,当地时间周三,OpenAI公司通过论文介绍了一种全新的方法,来训练生成式人工智能语言模型。据论文介绍,OpenAI准备采用新战略,防止人工智能胡编。比如在过去,一旦提供一个正确的最终答案,模型会获得某种鼓励,但是以后,在每一个单一的逻辑推理环节如果表现正确,就将获得鼓励反馈。这种模式也被称之为“过程监督”,有助于产生更加清晰合理的回答,鼓励生成式人工智能能够像人类一样,在推理思考中做到“环环相扣”。