娇腿绕腰肢 商业快讯 2024-6-28 07:48 123人围观
美东时间6月27日周四,OpenAI公布,研究人员训练了一个基于 GPT-4 的模型名为 CriticGPT,用于捕捉ChatGPT 代码输出中的错误。据介绍,CriticGPT 旨在使用“从人类反馈中强化学习(RLHF)”的技术来训练、改进 GPT-4 的回答,以协助人类 AI 训练员完成工作。
TA还没有介绍自己。