Tags发布时间Nov 18, 2025摘要作者Jianli Zhao, Tingchen Fu, Rylan Schaeffer, Mrinank Sharma, Fazl Barez 译者知道创宇404实验室翻译组 原文链接httpsarxiv.orghtml2510.26418v2 摘要 大型推理模型LRMs通过增加推理时的计算量实现了更高的任务性能且已有研究表明这种规模化推理或许还能通过强化拒绝机制提升...来源安全文摘