翁荔的技术博客深入、细致,具有前瞻性,被很多 AI 研究者视为重要的参考资料。如今,她离开了 OpenAI,开启新的征程。而且她表示,之后可能有更多时间频繁更新博客。
我们训练模型使其明白,通过遵循一套定义明确的模型安全行为政策,可以让其很好地拒绝敏感或不安全的请求,包括何时拒绝或不拒绝,从而在安全性和实用性之间取得良好的平衡。 在每次模型发布时,我们都提高了其对抗稳健性,包括防御越狱攻击、指令层次结构以及通过推理大幅提升稳健性。我们在透明度方面的承诺都已体现在我们详细的模型系统卡中。 我们开发了业界领先的具有多模态能力的审核模型,并免费分享给了公众。我们目前在更通用的监控框架和增强的安全推理能力方面的工作将为更多的安全工作流提供支持。 我们为安全数据记录、指标、仪表板、主动学习管道、分类器部署、推理时间过滤和全新的快速响应系统建立了工程开发基础。
《Sora 之后,OpenAI Lilian Weng 亲自撰文教你从头设计视频生成扩散模型》 《OpenAI 安全系统负责人长文梳理:大模型的对抗攻击与防御》 《大模型自主智能体爆火,OpenAI 也在暗中观察、发力,这是内部人的分析博客》 《为内存塞不下 Transformer 犯愁?OpenAI 应用 AI 研究负责人写了份指南》 《关于 Prompt Engineering 你该了解啥?OpenAI 应用研究负责人帮你梳理了》 《OpenAI Lilian Weng 万字长文解读 LLM 幻觉:从理解到克服》
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com