跨时钟域传输总结

文摘   2024-11-22 10:00   吉林  

点击蓝字关注我们

关注、星标公众,精彩内容每日送达

来源:网络素材

一、单比特CDC传输1.1 慢到快

快时钟域相比慢时钟域采样速度更快,也就是说从慢时钟域来到快时钟域的信号一定可以被采集到。既然快时钟一定可以采集到慢时钟分发的数据,那么考虑的问题就只剩下如何保证采样到的信号质量!最常用的同步方法是双级触发器缓存法,俗称延迟打拍法。信号从一个时钟域进入另一个时钟域之前,将该信号用两级触发器连续缓存两次,可有效降低因为时序不满足而导致的亚稳态问题。

具体如下图所示:来自慢时钟clk1的信号在clk2被多次采样(信号在clk1持续一个时钟周期,在clk2持续三个时钟周期),如果只需要在clk2持续一个时钟周期,可以采用边沿检测即可得到signal4;

1.2 快到慢

慢时钟域相比快时钟域采样速度更慢,也就是说从快时钟域来到慢时钟域的信号极有可能被漏采。一般要求在接收时钟域中采样信号要保持三个时钟边沿的时间(也就是1.5倍的采样时钟周期)才会避免出现漏采。也就是快到慢跨时钟域的核心是如何延长信号长度!

对于电平信号而言(一般电平信号持续时间足够长),信号长度可以得到保证,所以正常采用两级同步器采样即可。

对于脉冲信号而言(一般脉冲信号持续时间很短),长度难以得到保证,需要对信号进行延长。目前,常用延长方法有两种:

一是开环(无反馈)延长,在知道两个时钟频率比的情况下,可以采用“快时钟域脉宽扩展+慢时钟域延迟打拍”的方法进行同步。

二是闭环(有反馈)延长,信号延长的恢复位置由反馈信号决定,此方法实质是通过相互握手的方式对窄脉冲信号进行脉宽扩展,这也是我们常说的“握手协议”。

然而,除了“握手协议”以外其他两种方法都是有缺陷、有限制的,具体如下图所示:

可以看到无论是电平还是脉冲信号使用起来都是有限制的,因为它们采用的都是无反馈的开环设计(详细可查看博文跨时钟传输——单比特)。采用闭环的反馈设计可以避免这些问题,具体流程如下:

快时钟域对脉冲信号进行检测,检测为高电平时输出高电平信号req。

慢时钟域对快时钟域的信号req进行延迟打拍采样。因为此时的脉冲信号被快时钟域保持拉高状态,延迟打拍肯定会采集到该信号。

慢时钟域确认采样得到高电平信号req_r2后,拉高反馈信号ack再反馈给快时钟域。

快时钟域对反馈信号ack进行延迟打拍采样得到ack_r0。如果检测到反馈信号为高电平,证明慢时钟域已经接收到有效的高电平信号,信号恢复原来状态。

1.3 单比特“握手协议”verilog代码

verilog代码

代码语言:c

复制//单比特快到慢“握手协议”module cdc_sbit_handshake(input   aclk, //快时钟input   arst_n, //快时钟域复位信号input   signal_a,//快时钟域信号input   bclk, //慢时钟input   brst_n, //慢时钟域复位信号output   signal_b//慢时钟域输出信号);
//慢时钟域信号展宽直至反馈信号回来再恢复reg   req;//寄存慢时钟域展宽信号reg   ack_r0;//反馈信号always@(posedge aclk or negedge arst_n) beginif(!arst_n) beginreq <= 1'b0;endelse if(signal_a) beginreq <= 1'b1; //信号展宽endelse if(ack_r0) beginreq <= 1'b0;  //反馈信号到来时恢复endend//展宽信号跨时钟同步至慢时钟域reg   req_r0;reg   req_r1;reg   req_r2;always@(posedge bclk or negedge brst_n) beginif(!brst_n)begin{req_r2,req_r1,req_r0} <= 3'b0;endelse begin{req_r2,req_r1,req_r0} <=  {req_r1,req_r0,req};endend//生成反馈信号并同步至快时钟域reg   ack;always@(posedge aclk or negedge arst_n) beginif(!arst_n) begin{ack_r0,ack} <= 2'b0;endelse begin{ack_r0,ack} <=  {ack,req_r1};endend//信号上升沿检测,让输出持续一个慢时钟周期assign signal_b = ~req_r2 & req_r1;endmodule

Testbench

代码语言:c

复制`timescale 1ns/1ps //仿真时间单位1ns 仿真时间精度1psmodule cdc_sbit_handshake_tb;//信号申明reg   aclk;reg   arst_n;reg   signal_a;reg  bclk;reg  brst_n;wire signal_b;//例化cdc_sbit_handshake u_cdc_sbit_handshake(.aclk (aclk),.bclk (bclk),.arst_n (arst_n),.brst_n (brst_n),.signal_a (signal_a),.signal_b (signal_b));//快时钟域慢时钟生成always #5  aclk =~ aclk;always #15 bclk =~ bclk;//初始信号赋值与激励initial beginsignal_a = 0;aclk = 0;bclk = 0;arst_n = 1;brst_n = 1;#15;arst_n = 0;brst_n = 0;#15;arst_n = 1;brst_n = 1;signal_a = 1;#10;signal_a = 0;endendmodule

仿真结果

二、多比特CDC传输

多比特为能不能使用二级同步器传输?使用格雷码也不行吗?什么情况下可以使用同步器加格雷码跨时钟传输?

先给结论:多比特信号不能用二级同步器跨时钟传输,哪怕使用格雷码大部分情况也不行,只有在格雷码自增或自减顺序变化才可以跨时钟传输。对于多比特数据,在进行传输时候会因为时序问题导致所有寄存器不会同时翻转(不是不翻转,是不同时翻转!),所以容易在跨时钟传输的时候出现中间态。使用格雷码可以避免这种现象,但是当格雷码不是按计数顺序变化(非顺序变化相当于每次变化不止一位),这同样是不允许的,因为格雷码每次只有一位发生变化的前提是,数据是递增或递减的。比如异步FIFO中格雷码可以通过二级同步器进行CDC传输。

2.1 慢到快:MUX同步器法

慢到快这种情况在快时钟接收端是一定能够采样得到的,但是根据上文可知,多比特不适合采用二级同步器直接传输采样,因为在传输过程中有多位同时变化,那么有什么解决办法呢?解决办法是在传输过程中不变化!所以必须在写入使能信号有效时传输!

传输非同步数据到接收时钟域时配上一个同步的控制信号,数据和控制信号被同时发送到接收时钟域,同时控制信号在接收时钟域使用两级寄存器同步到接收时钟域,使用此同步后的控制信号来加载数据,这样数据就可以在目的寄存器被安全加载。

具体代码可参考链接:Verilog 跨时钟域传输:慢到快

verilog代码

代码语言:c

复制//同步模块工作时钟为 100MHz 的模块//异步数据对来自工作时钟为 20MHz 的模块module delay_sample(input               rstn,input               clk1,input [31:0]        din,input               din_en,input               clk2,output [31:0]       dout,output              dout_en);//sync din_enreg [2:0]    din_en_r ;always @(posedge clk2 or negedge rstn) beginif (!rstn) din_en_r  <= 3'b0 ;else       din_en_r  <= {din_en_r[1:0], din_en} ;endwire din_en_pos = din_en_r[1] && !din_en_r[2] ;//sync datareg [31:0]           dout_r ;reg                  dout_en_r ;always @(posedge clk2 or negedge rstn) beginif (!rstn)dout_r         <= 'b0 ;else if (din_en_pos)dout_r         <= din ;end//dout_en delayalways @(posedge clk2 or negedge rstn) beginif (!rstn)        dout_en_r      <= 1'b0 ;else              dout_en_r      <= din_en_pos ;endassign       dout    = dout_r ;assign       dout_en = dout_en_r ;endmodule

时序结构如下图所示:

但如果慢时钟域没有数据使能信号 din_en, 或数据使能信号一直有效,此时在快时钟域对数据使能信号进行上升沿检测的方法将会失效。因为数据使能信号一直有效,除了第一个数据,快时钟域将无法检测到后继数据的传输时刻。

解决方法就是,在快时钟域对慢时钟信号的边沿进行检测。

2.2 快到慢:握手协议

快到慢必然会伴随着漏采的风险,根据单比特CDC传输的方法可以知道避免的方法就是延长信号的长度,所以需要带写入的使能信号对信号进行延长。此处任采用握手的方式,完全握手具体原理如下图所示:



优点:可以解决快时钟域向慢时钟域过渡的问题,且其适用的范围很广。

缺点:实现较为复杂,特别是其效率不高,在对设计性能要求较高的场合应该慎用。

这一部分具体可以查看链接:FPGA学习笔记——跨时钟域(CDC)设计之多bit信号同步

verilog代码

代码语言:c

复制module  data_driver(input        clk_a,     //发送端时钟信号 input        rst_n,    //复位信号,低电平有效 input        data_ack, //数据接收确人信号input             clk_b,   //接收端时钟信号 input             rst_n,   //复位信号,低电平有效 input    [3:0]    data,    //接收数据 input             data_req,    //请求接收信号output   reg      data_ack//数据接收确人信号); /********************** 发送端 **********************/ reg    [3:0]    data;   //发送数据 reg       data_req ;      //请求接收信号reg    [2:0]    cnt_reg; reg             data_ack_sync1; reg             data_ack_sync2;//计数 always@(posedge clk_a or negedge rst_n) begin if(!rst_n)  cnt_reg <= 3'd0;else if(data_ack_sync1 && !data_ack_sync2 == 1'b1)cnt_reg <= 3'd0;else if(data_req == 1'b1)cnt_reg <= cnt_reg;  else  cnt_reg <= cnt_reg + 1'b1; end  //data_ack两级同步 always@(posedge clk_a or negedge rst_n) begin if(!rst_n)  begin  data_ack_sync1 <= 1'b0;   data_ack_sync2 <= 1'b0;  end  else  begin  data_ack_sync1 <= data_ack;   data_ack_sync2 <= data_ack_sync1;  end end //请求接收信号always@(posedge clk_a or negedge rst_n) begin if(!rst_n)  data_req <= 1'b0;  else if(cnt_reg == 3'd4) data_req <= 1'b1;  else if(data_ack_sync2 == 1'b1)  data_req <= 1'b0;  else  data_req <= data_req; end  //发送数据 always@(posedge clk_a or negedge rst_n) begin if(!rst_n)  data <= 4'd0;  else if(data == 4'd7 && data_ack_sync2 == 1'b1 && data_req == 1'b1 )  data <= 4'd0;  else  begin  if(data_ack_sync2 == 1'b1 && data_req == 1'b1 )  data <= data + 1'b1;   else  data <= data;  end end /********************** 接收端 **********************/ reg             data_req_sync1; reg             data_req_sync2;  //data_req两级同步 always@(posedge clk_b or negedge rst_n) begin if(!rst_n)  begin  data_req_sync1 <= 1'b0;   data_req_sync2 <= 1'b0;  end  else  begin  data_req_sync1 <= data_req;   data_req_sync2 <= data_req_sync1;  end end //数据接收确人信号always@(posedge clk_b or negedge rst_n) begin if(!rst_n)  data_ack <= 1'b0;  else if(data_req_sync2 == 1'b1)  data_ack <= 1'b1;  else  data_ack <= 1'b0; end

endmodule2.3 异步FIFO(慢到快和快到慢通杀)

关于异步FIFO具体可以看看这篇:异步FIFO设计原理与设计方法以及重要问题汇总(包含verilog代码|Testbench|仿真结果),对异步FIFO介绍很详细并且总结了若干重要问题。

FIFO 是一种“先进先出队列”,数据从一头写入,从另一头读出,读出顺序和写入顺序一模一样。因为队列空间有限,因此一般把队列设计为环形。对于队列来说,最重要的事情是不能在队空的时候读数、不能在队满的时候写数。一般通过比较读写指针来获得“队空”和“队满”信息。异步FIFO常常用在高速数据跨时钟域的场景上。

异步FIFO主要由五部分组成:RAM、写控制端、读控制端、两个时钟同步端

双端口RAM:此处为伪双端口RAM进行数据存储与读出,有两组数据线、地址线、时钟线。

写控制端:写指针与满信号产生器,用于判断是否可以写入数据,写操作时,写使能有效且FIFO未满。

读控制端:读指针与空信号产生器,用于判断是否可以读取数据,读操作时,读使能有效且FIFO未空。

两个时钟同步端:读指针同步到写指针域进行“写满”判断,写指针同步到读指针域进行“读空”判断。

verilog代码

代码语言:c


复制//深度为8,数据位宽为8的异步FIFOmodule async_fifo #(parameter   DATA_DEPTH = 8, //深度为8parameter   DATA_WIDTH = 8, //数据位宽为8parameter   PTR_WIDTH  = 3 //读写指针位宽为3)(input  [DATA_WIDTH - 1 : 0] wr_data,  //写数据input                    wr_clk,   //写时钟input                    wr_rst_n, //写时钟复位input                    wr_en,  //写使能input                    rd_clk,  //读数据input                    rd_rst_n, //读时钟复位input                    rd_en,  //读使能output reg                  fifo_full, //“满”标志位output reg                  fifo_empty, //“空”标志位output reg [DATA_WIDTH - 1 : 0] rd_data //写时钟);/*----------------------------------------------------------------------------------------------伪双口RAM模块--------------------------------------------------------------------------------------------*///定义一个宽度为8,深度为DEPTH的8的RAM_FIFOreg [DATA_WIDTH - 1 : 0] ram_fifo [DATA_DEPTH - 1 : 0];//写指针计数reg [PTR_WIDTH : 0]  wr_ptr; //信息位+地址位所以指针位宽为4always@ (posedge wr_clk or negedge wr_rst_n) beginif(!wr_rst_n) beginwr_ptr <= 0;endelse if(wr_en && !fifo_full) beginwr_ptr <= wr_ptr + 1;endelse beginwr_ptr <= wr_ptr;endend//RAM写入数据wire [PTR_WIDTH -1 : 0]  wr_addr;assign wr_addr = wr_ptr[PTR_WIDTH -1 : 0]; //RAM写数据只需要地址位不需要信息位,所以寻址地址位宽为3always@ (posedge wr_clk or negedge wr_rst_n) beginif(!wr_rst_n) beginram_fifo[wr_addr] <= 0; //复位endelse if(wr_en && !fifo_full) beginram_fifo[wr_addr] <= wr_data; //数据写入endelse beginram_fifo[wr_addr] <= ram_fifo[wr_addr]; //保持不变endend//读指针计数reg [PTR_WIDTH : 0]  rd_ptr;always@ (posedge rd_clk or negedge rd_rst_n) beginif(!rd_rst_n) beginrd_ptr <= 0;endelse if(rd_en && !fifo_empty) beginrd_ptr <= rd_ptr + 1;endelse beginrd_ptr <= rd_ptr;endend//RAM读出数据wire [PTR_WIDTH -1 : 0]  rd_addr;assign rd_addr = rd_ptr[PTR_WIDTH -1 : 0];//RAM读数据只需要地址位不需要信息位,所以寻址地址位宽为3always@ (posedge rd_clk or negedge rd_rst_n) beginif(!rd_rst_n) beginrd_data <= 0; //复位endelse if(rd_en && !fifo_empty) beginrd_data <= ram_fifo[rd_addr]; //读数据endelse beginrd_data <= rd_data;  //保持不变endend/*--------------------------------------------------------------------------------------------读写指针(格雷码)转换与跨时钟域同步模块---------------------------------------------------------------------------------------------*///读写指针转换成格雷码wire [PTR_WIDTH : 0] wr_ptr_gray;wire [PTR_WIDTH : 0] rd_ptr_gray;assign wr_ptr_gray = wr_ptr ^ (wr_ptr >> 1);assign rd_ptr_gray = rd_ptr ^ (rd_ptr >> 1);//写指针同步到读时钟域//打两拍reg [PTR_WIDTH : 0] wr_ptr_gray_r1;reg [PTR_WIDTH : 0] wr_ptr_gray_r2;always@ (posedge rd_clk or negedge rd_rst_n) beginif(!rd_rst_n) beginwr_ptr_gray_r1 <= 0;wr_ptr_gray_r2 <= 0;endelse beginwr_ptr_gray_r1 <= wr_ptr_gray;wr_ptr_gray_r2 <= wr_ptr_gray_r1;endend//读指针同步到写时钟域//打两拍reg [PTR_WIDTH : 0] rd_ptr_gray_r1;reg [PTR_WIDTH : 0] rd_ptr_gray_r2;always@ (posedge wr_clk or negedge wr_rst_n) beginif(!wr_rst_n) beginrd_ptr_gray_r1 <= 0;rd_ptr_gray_r2 <= 0;endelse beginrd_ptr_gray_r1 <= rd_ptr_gray;rd_ptr_gray_r2 <= rd_ptr_gray_r1;endend/*----------------------------------------------------------------------------------------------------------------------------空满信号判断模块--------------------------------------------------------------------------------------------------------------------------*///组合逻辑判断写满always@ (*) beginif(!wr_rst_n) beginfifo_full <= 0;endelse if( wr_ptr_gray == { ~rd_ptr_gray_r2[PTR_WIDTH : PTR_WIDTH - 1],rd_ptr_gray_r2[PTR_WIDTH - 2 : 0] }) beginfifo_full <= 1;endelse beginfifo_full <= 0;endend//组合逻辑判断读空always@ (*) beginif(!rd_rst_n) beginfifo_empty <= 0;endelse if(rd_ptr_gray == wr_ptr_gray_r2) beginfifo_empty <= 1;endelse beginfifo_empty <= 0;endendendmoduleTestbench代码语言:c复制`timescale 1ns/1ps;//仿真时间单位1ns 仿真时间精度1psmodule async_fifo_tb #(parameter   DATA_DEPTH = 8,parameter   DATA_WIDTH = 8,parameter   PTR_WIDTH  = 3);//信号申明reg  [DATA_WIDTH - 1 : 0] wr_data;reg                    wr_clk;reg                    wr_rst_n;reg                    wr_en;reg                    rd_clk;reg                    rd_rst_n;reg                    rd_en;wire                  fifo_full;wire                  fifo_empty;wire [DATA_WIDTH - 1 : 0] rd_data;//例化async_fifo u_async_fifo (.wr_clk  (wr_clk),.rd_clk  (rd_clk),.wr_rst_n (wr_rst_n),.rd_rst_n (rd_rst_n),.wr_en  (wr_en),.rd_en  (rd_en),.wr_data (wr_data),.rd_data (rd_data),.fifo_empty (fifo_empty),.fifo_full (fifo_full));//读写时钟信号生成always #10 rd_clk = ~rd_clk;always #5  wr_clk = ~wr_clk;//信号初始化和赋值initial beginwr_clk = 0;wr_rst_n = 1;wr_en = 0;rd_clk = 0;rd_rst_n = 1;rd_en = 0;#10;wr_rst_n = 0;rd_rst_n = 0;#10;wr_rst_n = 1;rd_rst_n = 1;//only writewr_en = 1;rd_en = 0;repeat(10) begin@(negedge wr_clk) beginwr_data = {$random}%30;endend//only readwr_en = 0;rd_en = 1;repeat(10) begin@(negedge rd_clk);endrd_en =0;//read and writewr_en = 0;rd_en = 0;#80;wr_en = 1;rd_en = 1;repeat(20) begin@(negedge wr_clk) beginwr_data = {$random}%30;endendendendmodule

仿真结果

三、CDC的几个重要问题(重要!!!)

多比特为能不能使用二级同步器传输?使用格雷码也不行吗?什么情况下可以使用同步器加格雷码跨时钟传输?

先给结论:多比特信号不能用二级同步器跨时钟传输,哪怕使用格雷码大部分情况也不行,只有在格雷码自增或自减顺序变化才可以跨时钟传输。对于多比特数据,在进行传输时候会因为时序问题导致所有寄存器不会同时翻转(不是不翻转,是不同时翻转!),所以容易在跨时钟传输的时候出现中间态。使用格雷码可以避免这种现象,但是当格雷码不是按计数顺序变化(非顺序变化相当于每次变化不止一位),这同样是不允许的,因为格雷码每次只有一位发生变化的前提是,数据是递增或递减的。比如异步FIFO中格雷码可以通过二级同步器进行CDC传输。

慢到快使用打两拍的前提是什么?先给结论:两级同步器与慢时钟域之间无组合逻辑,因为组合逻辑里存在竞争冒险,从而导致毛刺产生。我们无法预先知道CLKB 的上升沿何时会到来,CLKB 采样到的信号就无法预知。

仅仅通过简单的同步器同步有可能是不安全的,那么如何传递两个同时需要的信号(b_load和b_en)?

将b_load和b_en信号在b_clk时钟域中合并成一个信号b_lden,然后同步至a_clk中。若果不能合并,比如译码信息则加入一个控制信号,等两个信号稳定了再采样!

四、总结(重要)

采样中“快到慢”与“慢到快”在考虑问题时有什么区别?慢到快:只需要考虑亚稳态问题.
快到慢:除亚稳态问题外,还需考虑慢时钟的采样速率问题。因为根据采样定理,采样频率低于信号最高频率2倍的时候,是无法完整采样的。

CDC传输方法总结:单比特:

慢到快只考虑亚稳态问题,采用延迟打拍法;

快到慢还需要考虑慢时钟采样速度,但是只要延长信号长度即可。常用方法为电平同步器、脉冲同步器、握手协议。其中,握手协议限制较为灵活,但握手信号需要在两个时钟域来回传递导致延时很大,所以握手协议是以牺牲效率为代价保证信号传递质量。

多比特:

慢到快:只考虑亚稳态问题,采用延迟打拍法。为需要传输的数据配上一个同步的控制使能信号,数据和控制信号被同时发送到接收时钟域,使用此同步后的控制信号来加载数据(控制信号有效表示数据稳定不变化从而避免传输出错),这样数据就可以在目的寄存器被安全加载。这种方法我们称为MUX同步器法/多周期路径同步法(意思都差不多)。

快到慢:因为考虑时钟采样速度,所以需要延长(使能信号)信号长度。最常用的还是“握手协议”,将使能信号同步后再加载多比特数据。

处理多比特数据跨时钟传输,最常用还是异步FIFO,

一来异步FIFO同时适用快到慢和慢到快两种CDC传输;

二来也能更好地满足数据流具有较快的传输速度要求。

想要了解FPGA吗?这里有实例分享,ZYNQ设计,关注我们的公众号,探索

Hack电子
电子设计、FPGA设计、实例分享、ZYNQ设计等,欢迎大家关注!
 最新文章