中端设计在IC开发中的价值和思考

文摘   2024-11-18 22:53   北京  
IC设计中通常基于设计时间线/业务线分为前端设计和后端实现,这个也是大家通常所能理解和接受的。类似下图
可以看到这里的FE/BE有一个明显的桥接地带,就是逻辑综合(synthesis),所以在实际的公司业务部门分布上,会有下列三种情形存在:
  • 将综合部分会划归为前端

  • 将综合划归为后端

  • 将综合单独出来,变为中端(ME:middle-end)

这里的三种方式笔者都有接触,相对于不同业务各有优缺点,但是从芯片的整体规模日益增大的趋势下,第三种的情形未来应该会越来越多


这个话题放到前几年,可能还不是很敏感,从2020年开始,国内的初创公司多了很多,大部分都是BEless的模式。从保护自身核心利益出发,RTL代码是不便于公开的,所以采用网表交付就成为最优解,上述基本流程变成了

公司的中端部门基本就是公司的对外数据交付部门了,所有的数据出口都是这里,后端外包团队的结果会直接去到FAB进行TO。这里的中端组的权责就是:给外包团队提供数据和业务支撑,确保最终流片。
这种模式主要是服务于初创公司第一版的业务模式,快并且时间可控,费用自然会高。当然,简单的用一把资金能解决的问题一定只是部分解决。这种模式里的伤与痛,也只有真正经历过的同学可以体会的到吧。这个流程也是一种中间产物,从业务收敛上讲,最后还是会回归本文的开票所述的三种模式之一。
从结构图上看,中端犹如项目的腰(类核心力量),承上而启下,这个部位的带宽一定要足,确保前后端无缝衔接,犹如连接两个马达之间的传动轴,一定是需要细心呵护和用心经营的。
随着芯片规模和复杂的不断地增大,前两种模式通过类似一种刷前端/后端机时的方式已经很难在高速的发展中继续跟进了,专业的人做专业的事,独立的中端部门可以很好的解决下面的问题场景
  • SDC质量:不是不好,是不够好

    • 时钟有,但是不全

    • gen-clock都有,但是和master的关系不清楚

    • clock的定义点不太合适

    • CGU的写法对于后端实现的友好性

    • DFT对SDC的影响考量

    • clock 结构优化

    • 使用MCP替换Falsepath

    • IO约束的合理性

    • 时钟树的重聚和细节(launch vs capture)

    • 等等

  • UPF的各种小issue

    • load_upf可以,但是check_mv有error

    • isolation/LS插入的质量细节商榷

    • power-domain/power-state的合并和优化

    • 对层次化设计的支持

    • 全芯片rail的logic和physical的布局

    • 等等

以上种种,看起来都什么大问题,但是对于大芯片而言,哪个细节出问题都是会导致大问题。芯片设计是一个很难收敛的硬设计,要保证系统的稳定性(stability),就必须降低/剪除系统的冗余性(Redundancy)/多义性(ambiguity)。这个特点对于静态的时序分析和低功耗分析的挑战尤甚,如果还是对此不太理解的话,可以想象一下RTL在跑linting的时候的信息量,就可以感知到静态分析的威力了。
类似的,对于综合(DC/Genus),静态时序分析(PT/Tempus),低功耗分析(vclp/LEC_low-power)的各种信息分类:info,warning和error(严格上讲,error是需要全部消灭的),也是需要中端团队查验的,
中端的任务是平抑前后端的差异,最终的服务对象还是后端团队,这里有一些简单的案例可以分享给大家,可能一点点的工作,就可以让后端的实施变得平滑通过是提高项目静态质量。
  • 时钟的定义点必须是leaf cell的output pin:有时候为了方便,前端会把时钟的点位定义点放到CGU的一个hierarchy的输出pin,这样很容易下约束,但是会面临port punch的挑战,最惨代价就是在BE侧,导致这个时钟丢失。

    综合view

APR cts view
这个情形,clock_out依然是一个clock point,但是由于APR 工具的push port,这个点依然是有clock 属性,但是却没法真实的驱动后面的逻辑了,也就相当于把这个clock弄丢了。
  • 时钟的定义点需要尊重原著:有时候,clock是从外部的PAD进来的,但是由于PAD都是双向口,那么进来的那一支一定是固定的pin,可能会有同学用这个点定义clock, 譬如这里的C pin

    这个从原理上讲,没有问题,但是却没有精确反应实际情形,有实际的风险,真实且正确的定义是这样的:

    这样做是有它的道理的,不仅仅是点位的问题,一起看一下下图

可以看到,从PAD进到C的timing arc在rise和falling的线性度不是非常一致,这里在核算min-pulse width之类问题的时候,结果会比之前定义到C点上要悲观很多;如果定义到C点,会导致sign-off乐观,往往芯片最怕乐观,这种木桶效应的伤害,都是每个经历者的终身遗憾啊!所以这里的clock的定义点需要修正到PAD上。
常言道:精品必出于细品,只有好好品味把玩自己的数据库,才能做出真正的精品项目,只要比对手强一丢丢,那么你的出货可能就不止这么一丢丢了。各位同学,关注中端就从今天开始吧。

喜欢文章的小伙伴,点赞加关注吧!

欢迎一起加入号主的知识星球,近期热门话题:

  • CTS

  • PAD ring planning

  • eBook share:   tech_file and design rule

  • PT tips

  • LVS naming conversion and physical cell handling

  • Calibre GDS operation

  • ......







处芯积律
处芯积律,而后知所至。一个芯片人的技术和行业研究分享。
 最新文章