点击蓝字 关注我们
关注并星标
从此不迷路
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
论文标题:XGrammar: Flexible and Efficient Structured Generation Engine for Large Language Models 论文地址:https://arxiv.org/pdf/2411.15100 代码地址:https://github.com/mlc-ai/xgrammar
计算机视觉研究院专栏
Column of Computer Vision Institute
上下文无关 token:仅通过查看 PDA 中的当前位置而不是堆栈即可确定其有效性的 token。
上下文相关 token:必须使用整个堆栈来确定其有效性的 token。
XGrammar 能否高效支持约束解码的每个步骤?
XGrammar 能否在 LLM serving 中实现端到端结构化生成的最小开销?
XGrammar 能否部署在更广泛的平台上?
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
往期推荐
🔗