GLiGuard：面向大语言模型安全防护的模式条件分类方法

来源： seebug_paper_rss · 发布时间 2026-05-11 16:40 (UTC+08:00) · 抓取时间 2026-06-04 08:55 (UTC+08:00)

摘要

作者：Urchade Zaratiana, Mary Newhauser, George Hurn-Maloney, Ash Lewis 译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/html/2605.07982v1 摘要保障大语言模型（LLM）输出安全合规、符合政策要求，需要能跨多安全维度实时扩展的内容审核机制。然而，当前最优的安全护栏模型均基于70亿–27...

扩展字段

{
  "guid": "https://paper.seebug.org/3485"
}

网安资讯详情 - SecLens 情报雷达

GLiGuard：面向大语言模型安全防护的模式条件分类方法

摘要

标签

扩展字段