跨时钟域传输总结

文摘 2024-11-22 10:00 吉林

点击蓝字关注我们

关注、星标公众号，精彩内容每日送达

来源：网络素材

一、单比特CDC传输1.1 慢到快

快时钟域相比慢时钟域采样速度更快，也就是说从慢时钟域来到快时钟域的信号一定可以被采集到。既然快时钟一定可以采集到慢时钟分发的数据，那么考虑的问题就只剩下如何保证采样到的信号质量！最常用的同步方法是双级触发器缓存法，俗称延迟打拍法。信号从一个时钟域进入另一个时钟域之前，将该信号用两级触发器连续缓存两次，可有效降低因为时序不满足而导致的亚稳态问题。

具体如下图所示：来自慢时钟clk1的信号在clk2被多次采样（信号在clk1持续一个时钟周期，在clk2持续三个时钟周期），如果只需要在clk2持续一个时钟周期，可以采用边沿检测即可得到signal4；

1.2 快到慢

慢时钟域相比快时钟域采样速度更慢，也就是说从快时钟域来到慢时钟域的信号极有可能被漏采。一般要求在接收时钟域中采样信号要保持三个时钟边沿的时间（也就是1.5倍的采样时钟周期）才会避免出现漏采。也就是快到慢跨时钟域的核心是如何延长信号长度！

对于电平信号而言（一般电平信号持续时间足够长），信号长度可以得到保证，所以正常采用两级同步器采样即可。

对于脉冲信号而言（一般脉冲信号持续时间很短），长度难以得到保证，需要对信号进行延长。目前，常用延长方法有两种：

一是开环（无反馈）延长，在知道两个时钟频率比的情况下，可以采用“快时钟域脉宽扩展+慢时钟域延迟打拍”的方法进行同步。

二是闭环（有反馈）延长，信号延长的恢复位置由反馈信号决定，此方法实质是通过相互握手的方式对窄脉冲信号进行脉宽扩展，这也是我们常说的“握手协议”。

然而，除了“握手协议”以外其他两种方法都是有缺陷、有限制的，具体如下图所示：

可以看到无论是电平还是脉冲信号使用起来都是有限制的，因为它们采用的都是无反馈的开环设计（详细可查看博文跨时钟传输——单比特）。采用闭环的反馈设计可以避免这些问题，具体流程如下：

快时钟域对脉冲信号进行检测，检测为高电平时输出高电平信号req。

慢时钟域对快时钟域的信号req进行延迟打拍采样。因为此时的脉冲信号被快时钟域保持拉高状态，延迟打拍肯定会采集到该信号。

慢时钟域确认采样得到高电平信号req_r2后，拉高反馈信号ack再反馈给快时钟域。

快时钟域对反馈信号ack进行延迟打拍采样得到ack_r0。如果检测到反馈信号为高电平，证明慢时钟域已经接收到有效的高电平信号，信号恢复原来状态。

1.3 单比特“握手协议”verilog代码

verilog代码

代码语言：c

复制//单比特快到慢“握手协议”module cdc_sbit_handshake(input   aclk, //快时钟input   arst_n, //快时钟域复位信号input   signal_a,//快时钟域信号input   bclk, //慢时钟input   brst_n, //慢时钟域复位信号output   signal_b//慢时钟域输出信号);
//慢时钟域信号展宽直至反馈信号回来再恢复reg   req;//寄存慢时钟域展宽信号reg   ack_r0;//反馈信号always@(posedge aclk or negedge arst_n) beginif(!arst_n) beginreq <= 1'b0;endelse if(signal_a) beginreq <= 1'b1; //信号展宽endelse if(ack_r0) beginreq <= 1'b0;  //反馈信号到来时恢复endend//展宽信号跨时钟同步至慢时钟域reg   req_r0;reg   req_r1;reg   req_r2;always@(posedge bclk or negedge brst_n) beginif(!brst_n)begin{req_r2,req_r1,req_r0} <= 3'b0;endelse begin{req_r2,req_r1,req_r0} <=  {req_r1,req_r0,req};endend//生成反馈信号并同步至快时钟域reg   ack;always@(posedge aclk or negedge arst_n) beginif(!arst_n) begin{ack_r0,ack} <= 2'b0;endelse begin{ack_r0,ack} <=  {ack,req_r1};endend//信号上升沿检测，让输出持续一个慢时钟周期assign signal_b = ~req_r2 & req_r1;endmodule

Testbench

代码语言：c

复制`timescale 1ns/1ps //仿真时间单位1ns 仿真时间精度1psmodule cdc_sbit_handshake_tb;//信号申明reg   aclk;reg   arst_n;reg   signal_a;reg  bclk;reg  brst_n;wire signal_b;//例化cdc_sbit_handshake u_cdc_sbit_handshake(.aclk (aclk),.bclk (bclk),.arst_n (arst_n),.brst_n (brst_n),.signal_a (signal_a),.signal_b (signal_b));//快时钟域慢时钟生成always #5  aclk =~ aclk;always #15 bclk =~ bclk;//初始信号赋值与激励initial beginsignal_a = 0;aclk = 0;bclk = 0;arst_n = 1;brst_n = 1;#15;arst_n = 0;brst_n = 0;#15;arst_n = 1;brst_n = 1;signal_a = 1;#10;signal_a = 0;endendmodule

仿真结果

二、多比特CDC传输

多比特为能不能使用二级同步器传输？使用格雷码也不行吗？什么情况下可以使用同步器加格雷码跨时钟传输？

先给结论：多比特信号不能用二级同步器跨时钟传输，哪怕使用格雷码大部分情况也不行，只有在格雷码自增或自减顺序变化才可以跨时钟传输。对于多比特数据，在进行传输时候会因为时序问题导致所有寄存器不会同时翻转（不是不翻转，是不同时翻转！），所以容易在跨时钟传输的时候出现中间态。使用格雷码可以避免这种现象，但是当格雷码不是按计数顺序变化（非顺序变化相当于每次变化不止一位），这同样是不允许的，因为格雷码每次只有一位发生变化的前提是，数据是递增或递减的。比如异步FIFO中格雷码可以通过二级同步器进行CDC传输。

2.1 慢到快：MUX同步器法

慢到快这种情况在快时钟接收端是一定能够采样得到的，但是根据上文可知，多比特不适合采用二级同步器直接传输采样，因为在传输过程中有多位同时变化，那么有什么解决办法呢？解决办法是在传输过程中不变化！所以必须在写入使能信号有效时传输！

传输非同步数据到接收时钟域时配上一个同步的控制信号，数据和控制信号被同时发送到接收时钟域，同时控制信号在接收时钟域使用两级寄存器同步到接收时钟域，使用此同步后的控制信号来加载数据，这样数据就可以在目的寄存器被安全加载。

具体代码可参考链接：Verilog 跨时钟域传输：慢到快

verilog代码

代码语言：c

复制//同步模块工作时钟为 100MHz 的模块//异步数据对来自工作时钟为 20MHz 的模块module delay_sample(input               rstn,input               clk1,input [31:0]        din,input               din_en,input               clk2,output [31:0]       dout,output              dout_en);//sync din_enreg [2:0]    din_en_r ;always @(posedge clk2 or negedge rstn) beginif (!rstn) din_en_r  <= 3'b0 ;else       din_en_r  <= {din_en_r[1:0], din_en} ;endwire din_en_pos = din_en_r[1] && !din_en_r[2] ;//sync datareg [31:0]           dout_r ;reg                  dout_en_r ;always @(posedge clk2 or negedge rstn) beginif (!rstn)dout_r         <= 'b0 ;else if (din_en_pos)dout_r         <= din ;end//dout_en delayalways @(posedge clk2 or negedge rstn) beginif (!rstn)        dout_en_r      <= 1'b0 ;else              dout_en_r      <= din_en_pos ;endassign       dout    = dout_r ;assign       dout_en = dout_en_r ;endmodule

时序结构如下图所示：

但如果慢时钟域没有数据使能信号 din_en, 或数据使能信号一直有效，此时在快时钟域对数据使能信号进行上升沿检测的方法将会失效。因为数据使能信号一直有效，除了第一个数据，快时钟域将无法检测到后继数据的传输时刻。

解决方法就是，在快时钟域对慢时钟信号的边沿进行检测。

2.2 快到慢：握手协议

快到慢必然会伴随着漏采的风险，根据单比特CDC传输的方法可以知道避免的方法就是延长信号的长度，所以需要带写入的使能信号对信号进行延长。此处任采用握手的方式，完全握手具体原理如下图所示：

优点：可以解决快时钟域向慢时钟域过渡的问题，且其适用的范围很广。

缺点：实现较为复杂，特别是其效率不高，在对设计性能要求较高的场合应该慎用。

这一部分具体可以查看链接：FPGA学习笔记——跨时钟域（CDC）设计之多bit信号同步

verilog代码

代码语言：c

复制module  data_driver(input        clk_a,     //发送端时钟信号 input        rst_n,    //复位信号，低电平有效 input        data_ack, //数据接收确人信号input             clk_b,   //接收端时钟信号 input             rst_n,   //复位信号，低电平有效 input    [3:0]    data,    //接收数据 input             data_req,    //请求接收信号output   reg      data_ack//数据接收确人信号); /********************** 发送端 **********************/ reg    [3:0]    data;   //发送数据 reg       data_req ;      //请求接收信号reg    [2:0]    cnt_reg; reg             data_ack_sync1; reg             data_ack_sync2;//计数 always@(posedge clk_a or negedge rst_n) begin if(!rst_n)  cnt_reg <= 3'd0;else if(data_ack_sync1 && !data_ack_sync2 == 1'b1)cnt_reg <= 3'd0;else if(data_req == 1'b1)cnt_reg <= cnt_reg;  else  cnt_reg <= cnt_reg + 1'b1; end  //data_ack两级同步 always@(posedge clk_a or negedge rst_n) begin if(!rst_n)  begin  data_ack_sync1 <= 1'b0;   data_ack_sync2 <= 1'b0;  end  else  begin  data_ack_sync1 <= data_ack;   data_ack_sync2 <= data_ack_sync1;  end end //请求接收信号always@(posedge clk_a or negedge rst_n) begin if(!rst_n)  data_req <= 1'b0;  else if(cnt_reg == 3'd4) data_req <= 1'b1;  else if(data_ack_sync2 == 1'b1)  data_req <= 1'b0;  else  data_req <= data_req; end  //发送数据 always@(posedge clk_a or negedge rst_n) begin if(!rst_n)  data <= 4'd0;  else if(data == 4'd7 && data_ack_sync2 == 1'b1 && data_req == 1'b1 )  data <= 4'd0;  else  begin  if(data_ack_sync2 == 1'b1 && data_req == 1'b1 )  data <= data + 1'b1;   else  data <= data;  end end /********************** 接收端 **********************/ reg             data_req_sync1; reg             data_req_sync2;  //data_req两级同步 always@(posedge clk_b or negedge rst_n) begin if(!rst_n)  begin  data_req_sync1 <= 1'b0;   data_req_sync2 <= 1'b0;  end  else  begin  data_req_sync1 <= data_req;   data_req_sync2 <= data_req_sync1;  end end //数据接收确人信号always@(posedge clk_b or negedge rst_n) begin if(!rst_n)  data_ack <= 1'b0;  else if(data_req_sync2 == 1'b1)  data_ack <= 1'b1;  else  data_ack <= 1'b0; end

endmodule2.3 异步FIFO（慢到快和快到慢通杀）

关于异步FIFO具体可以看看这篇：异步FIFO设计原理与设计方法以及重要问题汇总（包含verilog代码|Testbench|仿真结果），对异步FIFO介绍很详细并且总结了若干重要问题。

FIFO 是一种“先进先出队列”，数据从一头写入，从另一头读出，读出顺序和写入顺序一模一样。因为队列空间有限，因此一般把队列设计为环形。对于队列来说，最重要的事情是不能在队空的时候读数、不能在队满的时候写数。一般通过比较读写指针来获得“队空”和“队满”信息。异步FIFO常常用在高速数据跨时钟域的场景上。

异步FIFO主要由五部分组成：RAM、写控制端、读控制端、两个时钟同步端

双端口RAM：此处为伪双端口RAM进行数据存储与读出，有两组数据线、地址线、时钟线。

写控制端：写指针与满信号产生器，用于判断是否可以写入数据，写操作时，写使能有效且FIFO未满。

读控制端：读指针与空信号产生器，用于判断是否可以读取数据，读操作时，读使能有效且FIFO未空。

两个时钟同步端：读指针同步到写指针域进行“写满”判断，写指针同步到读指针域进行“读空”判断。

verilog代码

代码语言：c


复制//深度为8，数据位宽为8的异步FIFOmodule async_fifo #(parameter   DATA_DEPTH = 8, //深度为8parameter   DATA_WIDTH = 8, //数据位宽为8parameter   PTR_WIDTH  = 3 //读写指针位宽为3)(input  [DATA_WIDTH - 1 : 0] wr_data,  //写数据input                    wr_clk,   //写时钟input                    wr_rst_n, //写时钟复位input                    wr_en,  //写使能input                    rd_clk,  //读数据input                    rd_rst_n, //读时钟复位input                    rd_en,  //读使能output reg                  fifo_full, //“满”标志位output reg                  fifo_empty, //“空”标志位output reg [DATA_WIDTH - 1 : 0] rd_data //写时钟);/*----------------------------------------------------------------------------------------------伪双口RAM模块--------------------------------------------------------------------------------------------*///定义一个宽度为8，深度为DEPTH的8的RAM_FIFOreg [DATA_WIDTH - 1 : 0] ram_fifo [DATA_DEPTH - 1 : 0];//写指针计数reg [PTR_WIDTH : 0]  wr_ptr; //信息位+地址位所以指针位宽为4always@ (posedge wr_clk or negedge wr_rst_n) beginif(!wr_rst_n) beginwr_ptr <= 0;endelse if(wr_en && !fifo_full) beginwr_ptr <= wr_ptr + 1;endelse beginwr_ptr <= wr_ptr;endend//RAM写入数据wire [PTR_WIDTH -1 : 0]  wr_addr;assign wr_addr = wr_ptr[PTR_WIDTH -1 : 0]; //RAM写数据只需要地址位不需要信息位，所以寻址地址位宽为3always@ (posedge wr_clk or negedge wr_rst_n) beginif(!wr_rst_n) beginram_fifo[wr_addr] <= 0; //复位endelse if(wr_en && !fifo_full) beginram_fifo[wr_addr] <= wr_data; //数据写入endelse beginram_fifo[wr_addr] <= ram_fifo[wr_addr]; //保持不变endend//读指针计数reg [PTR_WIDTH : 0]  rd_ptr;always@ (posedge rd_clk or negedge rd_rst_n) beginif(!rd_rst_n) beginrd_ptr <= 0;endelse if(rd_en && !fifo_empty) beginrd_ptr <= rd_ptr + 1;endelse beginrd_ptr <= rd_ptr;endend//RAM读出数据wire [PTR_WIDTH -1 : 0]  rd_addr;assign rd_addr = rd_ptr[PTR_WIDTH -1 : 0];//RAM读数据只需要地址位不需要信息位，所以寻址地址位宽为3always@ (posedge rd_clk or negedge rd_rst_n) beginif(!rd_rst_n) beginrd_data <= 0; //复位endelse if(rd_en && !fifo_empty) beginrd_data <= ram_fifo[rd_addr]; //读数据endelse beginrd_data <= rd_data;  //保持不变endend/*--------------------------------------------------------------------------------------------读写指针（格雷码）转换与跨时钟域同步模块---------------------------------------------------------------------------------------------*///读写指针转换成格雷码wire [PTR_WIDTH : 0] wr_ptr_gray;wire [PTR_WIDTH : 0] rd_ptr_gray;assign wr_ptr_gray = wr_ptr ^ (wr_ptr >> 1);assign rd_ptr_gray = rd_ptr ^ (rd_ptr >> 1);//写指针同步到读时钟域//打两拍reg [PTR_WIDTH : 0] wr_ptr_gray_r1;reg [PTR_WIDTH : 0] wr_ptr_gray_r2;always@ (posedge rd_clk or negedge rd_rst_n) beginif(!rd_rst_n) beginwr_ptr_gray_r1 <= 0;wr_ptr_gray_r2 <= 0;endelse beginwr_ptr_gray_r1 <= wr_ptr_gray;wr_ptr_gray_r2 <= wr_ptr_gray_r1;endend//读指针同步到写时钟域//打两拍reg [PTR_WIDTH : 0] rd_ptr_gray_r1;reg [PTR_WIDTH : 0] rd_ptr_gray_r2;always@ (posedge wr_clk or negedge wr_rst_n) beginif(!wr_rst_n) beginrd_ptr_gray_r1 <= 0;rd_ptr_gray_r2 <= 0;endelse beginrd_ptr_gray_r1 <= rd_ptr_gray;rd_ptr_gray_r2 <= rd_ptr_gray_r1;endend/*----------------------------------------------------------------------------------------------------------------------------空满信号判断模块--------------------------------------------------------------------------------------------------------------------------*///组合逻辑判断写满always@ (*) beginif(!wr_rst_n) beginfifo_full <= 0;endelse if( wr_ptr_gray == { ~rd_ptr_gray_r2[PTR_WIDTH : PTR_WIDTH - 1],rd_ptr_gray_r2[PTR_WIDTH - 2 : 0] }) beginfifo_full <= 1;endelse beginfifo_full <= 0;endend//组合逻辑判断读空always@ (*) beginif(!rd_rst_n) beginfifo_empty <= 0;endelse if(rd_ptr_gray == wr_ptr_gray_r2) beginfifo_empty <= 1;endelse beginfifo_empty <= 0;endendendmoduleTestbench代码语言：c复制`timescale 1ns/1ps;//仿真时间单位1ns 仿真时间精度1psmodule async_fifo_tb #(parameter   DATA_DEPTH = 8,parameter   DATA_WIDTH = 8,parameter   PTR_WIDTH  = 3);//信号申明reg  [DATA_WIDTH - 1 : 0] wr_data;reg                    wr_clk;reg                    wr_rst_n;reg                    wr_en;reg                    rd_clk;reg                    rd_rst_n;reg                    rd_en;wire                  fifo_full;wire                  fifo_empty;wire [DATA_WIDTH - 1 : 0] rd_data;//例化async_fifo u_async_fifo (.wr_clk  (wr_clk),.rd_clk  (rd_clk),.wr_rst_n (wr_rst_n),.rd_rst_n (rd_rst_n),.wr_en  (wr_en),.rd_en  (rd_en),.wr_data (wr_data),.rd_data (rd_data),.fifo_empty (fifo_empty),.fifo_full (fifo_full));//读写时钟信号生成always #10 rd_clk = ~rd_clk;always #5  wr_clk = ~wr_clk;//信号初始化和赋值initial beginwr_clk = 0;wr_rst_n = 1;wr_en = 0;rd_clk = 0;rd_rst_n = 1;rd_en = 0;#10;wr_rst_n = 0;rd_rst_n = 0;#10;wr_rst_n = 1;rd_rst_n = 1;//only writewr_en = 1;rd_en = 0;repeat(10) begin@(negedge wr_clk) beginwr_data = {$random}%30;endend//only readwr_en = 0;rd_en = 1;repeat(10) begin@(negedge rd_clk);endrd_en =0;//read and writewr_en = 0;rd_en = 0;#80;wr_en = 1;rd_en = 1;repeat(20) begin@(negedge wr_clk) beginwr_data = {$random}%30;endendendendmodule

仿真结果

三、CDC的几个重要问题（重要！！！）

多比特为能不能使用二级同步器传输？使用格雷码也不行吗？什么情况下可以使用同步器加格雷码跨时钟传输？

先给结论：多比特信号不能用二级同步器跨时钟传输，哪怕使用格雷码大部分情况也不行，只有在格雷码自增或自减顺序变化才可以跨时钟传输。对于多比特数据，在进行传输时候会因为时序问题导致所有寄存器不会同时翻转（不是不翻转，是不同时翻转！），所以容易在跨时钟传输的时候出现中间态。使用格雷码可以避免这种现象，但是当格雷码不是按计数顺序变化（非顺序变化相当于每次变化不止一位），这同样是不允许的，因为格雷码每次只有一位发生变化的前提是，数据是递增或递减的。比如异步FIFO中格雷码可以通过二级同步器进行CDC传输。

慢到快使用打两拍的前提是什么？先给结论：两级同步器与慢时钟域之间无组合逻辑，因为组合逻辑里存在竞争冒险，从而导致毛刺产生。我们无法预先知道CLKB 的上升沿何时会到来，CLKB 采样到的信号就无法预知。

仅仅通过简单的同步器同步有可能是不安全的，那么如何传递两个同时需要的信号(b_load和b_en)？

将b_load和b_en信号在b_clk时钟域中合并成一个信号b_lden，然后同步至a_clk中。若果不能合并，比如译码信息则加入一个控制信号，等两个信号稳定了再采样！

四、总结（重要）

采样中“快到慢”与“慢到快”在考虑问题时有什么区别？慢到快：只需要考虑亚稳态问题.
快到慢：除亚稳态问题外，还需考虑慢时钟的采样速率问题。因为根据采样定理，采样频率低于信号最高频率2倍的时候，是无法完整采样的。

CDC传输方法总结：单比特：

慢到快只考虑亚稳态问题，采用延迟打拍法；

快到慢还需要考虑慢时钟采样速度，但是只要延长信号长度即可。常用方法为电平同步器、脉冲同步器、握手协议。其中，握手协议限制较为灵活，但握手信号需要在两个时钟域来回传递导致延时很大，所以握手协议是以牺牲效率为代价保证信号传递质量。

多比特：

慢到快：只考虑亚稳态问题，采用延迟打拍法。为需要传输的数据配上一个同步的控制使能信号，数据和控制信号被同时发送到接收时钟域，使用此同步后的控制信号来加载数据（控制信号有效表示数据稳定不变化从而避免传输出错），这样数据就可以在目的寄存器被安全加载。这种方法我们称为MUX同步器法/多周期路径同步法（意思都差不多）。

快到慢：因为考虑时钟采样速度，所以需要延长（使能信号）信号长度。最常用的还是“握手协议”，将使能信号同步后再加载多比特数据。

处理多比特数据跨时钟传输，最常用还是异步FIFO，

一来异步FIFO同时适用快到慢和慢到快两种CDC传输；

二来也能更好地满足数据流具有较快的传输速度要求。

想要了解FPGA吗？这里有实例分享，ZYNQ设计，关注我们的公众号，探索

http://mp.weixin.qq.com/s?__biz=MzU1MDE0MjcxMQ==&mid=2247501933&idx=1&sn=771ee9c3ca36323af53f4cf3a786f9f9

Hack电子

电子设计、FPGA设计、实例分享、ZYNQ设计等，欢迎大家关注！