更容易验证人工智能模型的反应

2024-11-23 21:23来源:本站编辑

尽管具有令人印象深刻的功能,但大型语言模型远非完美。这些人工智能模型有时会产生“幻觉”,在响应查询时生成不正确或不受支持的信息。

由于这种幻觉问题,法学硕士的回答通常要经过人类事实核查员的验证,特别是当一个模型被部署在医疗保健或金融等高风险环境中时。然而,验证过程通常需要人们通读模型引用的长文档,这是一项非常繁重且容易出错的任务,可能会阻止一些用户首先部署生成人工智能模型。

为了帮助人类验证者,麻省理工学院的研究人员创建了一个用户友好的系统,使人们能够更快地验证法学硕士的反应。有了这个名为SymGen的工具,法学硕士就可以生成带有引用的响应,这些引用直接指向源文档中的位置,比如数据库中的给定单元格。

用户将鼠标悬停在其文本响应的高亮部分上,以查看模型用于生成特定单词或短语的数据。同时,未突出显示的部分向用户显示哪些短语需要额外注意检查和验证。

“我们让人们能够选择性地关注他们需要更担心的文本部分。最后,SymGen可以让人们对模型的反应更有信心,因为他们可以很容易地仔细观察,以确保信息得到验证,”电子工程和计算机科学研究生、SymGen论文的共同主要作者沈香农(Shannon Shen)说。

中磅网声明:未经许可,不得转载。