一:最大值法
将彩色图像中的三分量亮度 R , G , B 的最大值作为灰度图的灰度值。具体表达式如下。
gray(i, j) = max[𝑅(𝑖,𝑗),𝐺(𝑖,𝑗),𝐵(𝑖,𝑗)]
二:平均值法
1.原理
将彩色图像中的三分量亮度求平均得到一个灰度值。如下 :
gray(i, j) = { 𝑅(𝑖,𝑗) + 𝐺(𝑖,𝑗) + 𝐵(𝑖,𝑗) } / 3
上式中有除法,考虑到在 FPGA 中实现除法比较的消耗资源(除法就可以使用 移位的方式 实现),这里在实现前可以先做如下的近似处理:
2.verilog实现
module rgb2gray
(
input clk, //时钟
input reset_p, //复位
input rgb_valid, //rgb输入有效标识
input rgb_hs, //rgb输入行信号
input rgb_vs, //rgb输入场信号
input [7:0] red_8b_i, //R输入
input [7:0] green_8b_i, //G输入
input [7:0] blue_8b_i, //B输入
output [7:0] gray_8b_o, //GRAY输出
output reg gray_valid, //gray输出有效标识
output reg gray_hs, //gray输出行信号
output reg gray_vs //gray输出场信号
);
wire [9:0]sum;
reg [15:0]gray_r;
assign sum = red_8b_i + green_8b_i + blue_8b_i;
always@(posedge clk or posedge reset_p)
begin
if(reset_p)
gray_r <= 16'd0;
else if(rgb_valid)
gray_r <= (sum << 6)+(sum << 4)+(sum << 2)+ sum;
else
gray_r <= 16'd0;
end
assign gray_8b_o = gray_r[15:8]; //>>8右移8位
always@(posedge clk)
begin
gray_valid <= rgb_valid;
gray_hs <= rgb_hs;
gray_vs <= rgb_vs;
end
避免除法做近似处理计算的 gray 和 直接通过除法求的平均值 是稍存在偏差的。这个是可以接收的误差范围。
三,加权平均 RGB--Ycbcr
1.基本原理
RGB888 转 YCbCr 的公式,
Y=0.299R+0.587G+0.114B
Cb= 0.568(B-Y)+128=-0.172R-0.339G+0.511B+128
Cr=0.713(R-Y)+128=0.511R-0.428G-0.083B+128
效果如下:
由结果可以看到,相比 RGB 分量转灰度图来说,YCbCr 取 Y 分量的灰度图更具有层次感,和原图片更为接近。
gray(i, j) = 0.299 ∗ 𝑅(𝑖,𝑗) + 0.587 ∗ 𝐺(𝑖,𝑗) + 0.114 ∗ 𝐵(𝑖,𝑗)
gray(i, j) = [0.299 ∗ 𝑅(𝑖,𝑗) + 0.587 ∗ 𝐺(𝑖,𝑗) + 0.114 ∗ 𝐵(𝑖,𝑗)] ∗ 1024/1024
近似取整处理后:
gray(i, j) ≈ [306 ∗ 𝑅(𝑖,𝑗) + 601 ∗ 𝐺(𝑖,𝑗) + 117 ∗ 𝐵(𝑖,𝑗)]/1024
gray(i, j) ≈ [306 ∗ 𝑅(𝑖,𝑗) + 601 ∗ 𝐺(𝑖,𝑗) + 117 ∗ 𝐵(𝑖,𝑗)] ≫ 10
也可以压缩到 8 位以内,式子变为如下。具体压缩到多少位可以根据实际需求:
gray(i, j) = [77 ∗ 𝑅(𝑖,𝑗) + 150 ∗ 𝐺(𝑖,𝑗) + 29 ∗ 𝐵(𝑖,𝑗)] ≫ 8
2.代码实现
1)公式计算法实现:
rgb2gray
#(
.PROC_METHOD ( "FORMULA" )//"AVERAGE" :求平均法
//or "FORMULA" :直接公式法
//or "LUT" :查找表法
)rgb2gray
(
.clk (loc_clk50m ),//input
.reset_p (g_rst_p ),//input
.rgb_valid (image_data_valid ),//input
.rgb_hs (image_data_hs ),//input
.rgb_vs (image_data_vs ),//input
.red_8b_i ({image_data[15:11],3'b000}),//input R[7:0]
.green_8b_i ({image_data[10:5],2'b00} ),//input G[7:0]
.blue_8b_i ({image_data[4:0],3'b000} ),//input B[7:0]
.gray_8b_o (image_gray_data ),//output [7:0]
.gray_valid (image_gray_data_valid ),//output reg
.gray_hs ( ),//output reg
.gray_vs ( ) //output reg
);
wire [15:0]red_x77;
wire [15:0]green_x150;
wire [15:0]blue_x29;
reg [15:0]sum;
//乘法转换成移位相加方式
assign red_x77 = (red_8b_i << 6) + (red_8b_i << 3) + (red_8b_i << 2) + red_8b_i;
assign green_x150 = (green_8b_i<< 7) + (green_8b_i<< 4) + (green_8b_i<< 2) + (green_8b_i<<1);
assign blue_x29 = (blue_8b_i << 4) + (blue_8b_i << 3) + (blue_8b_i << 2) + blue_8b_i;
always@(posedge clk or posedge reset_p)
begin
if(reset_p)
sum <= 16'd0;
else if(rgb_valid)
sum <= red_x77 + green_x150 + blue_x29;
else
sum <= 16'd0;
end
//提取Y亮度为灰度输出
assign gray_8b_o = sum[15:8];
//打拍计算
always@(posedge clk)
begin
gray_valid <= rgb_valid;
gray_hs <= rgb_hs;
gray_vs <= rgb_vs;
end
进行打拍计算,在图像处理时,我们是有数据的同步信号的,有的是数据使能信号,有的还有行同步信号和帧同步信号。经过图像处理后的数据延迟了拍数,这些同步信号也要相应的打拍,否则最终的图像显示会出问题。
将Y,Cb,Cr分量都获取的代码实现办法:
module rgb2gray
(
input clk, //时钟
input reset_p, //复位
input rgb_valid, //rgb输入有效标识
input rgb_hs, //rgb输入行信号
input rgb_vs, //rgb输入场信号
input [7:0] red_8b_i, //R输入
input [7:0] green_8b_i, //G输入
input [7:0] blue_8b_i, //B输入
output reg [7:0] gray_8b_o, //GRAY输出
output gray_valid, //gray输出有效标识
output gray_hs, //gray输出行信号
output gray_vs //gray输出场信号
);
//典型灰度转换公式Gray = R*0.299+G*0.587+B*0.114=(R*77 + G*150 + B*29) >>8
// Y = 0.299*R + 0.587*G + 0.114*B
// Cb = 0.586*(B-Y) + 128 = -0.172*R - 0.339*G + 0.511*B + 128
// Cr = 0.713*(R-Y) + 128 = 0.511*R - 0.428*G - 0.083*B + 128
// --->
// Y = ( 77*R + 150*G + 29*B) >> 8
// Cb = (-43*R - 85*G + 128*B) >> 8 + 128
// Cr = (128*R - 107*G - 21*B) >> 8 + 128
// --->
// Y = ( 77*R + 150*G + 29*B) >> 8
// Cb = (-43*R - 85*G + 128*B + 32768) >> 8
// Cr = (128*R - 107*G - 21*B + 32768) >> 8
reg [15:0] R1;
reg [15:0] R2;
reg [15:0] R3;
reg [15:0] G1;
reg [15:0] G2;
reg [15:0] G3;
reg [15:0] B1;
reg [15:0] B2;
reg [15:0] B3;
reg [15:0] Y1;
reg [15:0] Cb1;
reg [15:0] Cr1;
reg [7:0] Y2,Cb2,Cr2;
reg [3:0] rgb_valid_r; //rgb输入有效标识
reg [3:0] rgb_hs_r; //rgb输入行信号
reg [3:0] rgb_vs_r; //rgb输入场信号
提取三种分量的RGB值,并且进行相加得到
always@(posedge clk or negedge reset_p) begin
if (reset_p) begin
{R1,G1,B1} <= {16'd0,16'd0,16'd0};
{R2,G2,B2} <= {16'd0,16'd0,16'd0};
{R3,G3,B3} <= {16'd0,16'd0,16'd0};
end
else begin
{R1,G1,B1} <= {{red_8b_i * 16'd77},{green_8b_i * 16'd150},{blue_8b_i * 16'd29}};
{R2,G2,B2} <= {{red_8b_i * 16'd43},{green_8b_i * 16'd85},{blue_8b_i * 16'd128}};
{R3,G3,B3} <= {{red_8b_i * 16'd128},{green_8b_i * 16'd107},{blue_8b_i * 16'd21}};
end
end
always@(posedge clk or negedge reset_p) begin
if (reset_p) begin
Y1 <= 16'd0;
Cb1 <= 16'd0;
Cr1 <= 16'd0;
end
else begin
Y1 <= R1+G1+B1;
Cb1 <= B2 - R2 - G2 + 16'd32768;//128扩大256倍
Cr1 <= R3 - G3 - B3 + 16'd32768; //128扩大256倍
end
end
//右移8位得到
always@(posedge clk or negedge reset_p) begin
if (reset_p) begin
Y2 <= 8'd0;
Cb2 <= 8'd0;
Cr2 <= 8'd0;
end
else begin
Y2 <= Y1[15:8];
Cb2 <= Cb1[15:8];
Cr2 <= Cr1[15:8];
end
end
最终输出Y分量为灰度:
assign gray_8b_o = Y2;
在HDMI显示屏上进行显示灰度处理实现的效果:
always@(posedge clk or negedge reset_p) begin
if (reset_p)
gray_8b_o <= 8'h0;
else if ( (Cb2 > 77) && (Cb2 < 127) && (Cr2 > 133) && (Cr2 < 173))
gray_8b_o <= 8'hFF;
else
gray_8b_o <= 8'h0;
end
在HDMI显示屏上进行显示肤色提取实现的效果:
2)查找表法:
采用查找表方法实现,主要的优势是直接通过 访问 ROM 内的数据,相对使用移位相加实现乘法使用的 LUT 资源会少点,但占用的存储器会更多。
需要将 R 、 G 、 B 乘以系数之后的数值存储在 ROM 中,然后通过读取 ROM 方式来得到计算之后的数值。使用 Vivado 添加 3 个 ROM IP 核,分别通过 R*75、G*147、B*36(0≤R≤255,0≤G≤255,0≤B≤255)的计算值建立 3 个初始化 coe 文件.
rom_red_x77 rom_red_x77(
.clka (clk ), // input wire clka
.ena (rgb_valid ), // input wire ena
.addra (red_8b_i ), // input wire [7 : 0] addra
.douta (red_x77 ) // output wire [14 : 0] douta
);
rom_green_x150 rom_green_x150(
.clka (clk ), // input wire clka
.ena (rgb_valid ), // input wire ena
.addra (green_8b_i ), // input wire [7 : 0] addra
.douta (green_x150 ) // output wire [15 : 0] douta
);
rom_blue_x29 rom_blue_x29(
.clka (clk ), // input wire clka
.ena (rgb_valid ), // input wire ena
.addra (blue_8b_i ), // input wire [7 : 0] addra
.douta (blue_x29 ) // output wire [13 : 0] douta
);
always@(posedge clk or posedge reset_p)
begin
if(reset_p)
sum <= 16'd0;
else if(rgb_valid_dly1)
sum <= red_x77 + green_x150 + blue_x29;
else
sum <= 16'd0;
end
assign gray_8b_o = sum[15:8];
always@(posedge clk)
begin
rgb_valid_dly1 <= rgb_valid;
rgb_hs_dly1 <= rgb_hs;
rgb_vs_dly1 <= rgb_vs;
end
always@(posedge clk)
begin
gray_valid <= rgb_valid_dly1;
gray_hs <= rgb_hs_dly1;
gray_vs <= rgb_vs_dly1;
end
如果能将多种实现方法的.v 文件整合到一个模块保存在一个 .v 文件,使用起来就更加的方便。
整合方法1: 宏定义法
通过不同的宏定义条件编译方式进行选择某种实现方式
//`define AVERAGE //求平均法
//`define FORMULA //直接公式法
`define LUT //查找表法
module rgb2gray (
clk,
rst_n,
rgb_valid,
red_8b_i,
green_8b_i,
blue_8b_i,
gray_8b_o,
gray_valid
);
`ifdef AVERAGE //求平均法 GRAY=(R+B+G)/3=((R+B+G)*85)>>8
...//方法 1
`endif
`ifdef FORMULA //灰度转换公式 Gray = R*0.299+G*0.587+B*0.114
...//方法 2
`endif
`ifdef LUT//查找表方式
...//方法 3
`endif
endmodule
整合方法2: 使用 generate -if 方法
添加三种方法名称的定义
module rgb2gray
#(
parameter PROC_METHOD = "AVERAGE" //"AVERAGE" :求平均法
//or "FORMULA" :直接公式法
//or "LUT" :查找表法
)
(
clk,
rst_n,
rgb_valid,
red_8b_i,
green_8b_i,
blue_8b_i,
gray_8b_o,
gray_valid
);
generate
if (PROC_METHOD == "AVERAGE") begin: PROC_AVERAGE
//---------------------------------------------
//求平均法 GRAY = (R+B+G)/3=((R+B+G)*85)>>8
//方法 1
//---------------------------------------------
end
else if (PROC_METHOD == "FORMULA") begin: PROC_FORMULA
//---------------------------------------------
//典型灰度转换公式 Gray = R*0.299+G*0.587+B*0.114=(R*77 + G*150 + B*29) >>8
//方法 2
//---------------------------------------------
end
else if(PROC_METHOD == "LUT") begin: PROC_LUT
//---------------------------------------------
//查找表方式,可以省去公式法中乘法运算 Gray =(R*77 + G*150 + B*29) >>8,将 3 个分量
乘以系数后的数值存储在 ROM 中
//方法 3
//---------------------------------------------
end
endgenerate
endmodule
以上两种方法直接在例化模块时就可通过 重定义参数 PROC_METHOD 实现不同方法的设置,例化:
rgb2gray
#(
.PROC_METHOD("FORMULA") //"AVERAGE" :求平均法
//or "FORMULA" :直接公式法
//or "LUT" :查找表法
)rgb2gray_average
(
.clk (clk ),
. reset_p (reset_p ),
.rgb_valid (rgb_valid ),
.red_8b_i (red_8b_i ),
.green_8b_i(green_8b_i),
.blue_8b_i (blue_8b_i ),
.gray_8b_o (gray_8b_o ),
.gray_valid(gray_valid)
);
景芯SoC v4.0芯片全流程实战
终身辅导、一对一辅导是景芯SoC训练营的特色!
手把手教您搭建SoC,从入门到进阶,带您掌握架构、算法、设计、验证、DFT、后端全流程低功耗!直播视频不定期升级!让您快速超越同龄人!
报名微信:13541390811
景芯全流程课程如下:
景芯SoC设计 视频+文档+实战+一对一终身辅导(视频免费无期限)
景芯SoC验证 视频+文档+实战+一对一终身辅导(视频免费无期限)
景芯SoC中端 视频+文档+实战+一对一终身辅导(视频免费无期限)
景芯SoC后端 视频+文档+实战+一对一终身辅导(视频免费无期限)
进阶课程:
12nm 2.5GHz A72 低功耗DVFS实战培训(价格不到同行1/2)
DDR4/3项目实战培训(价格不到同行1/2)
小编逐步将教程、芯片设计全流程知识公布在知识星球,包括设计、验证、DFT、后端全流程知识以及大量技术文档,如果你和我一样渴求知识,不惧怕全流程的知识爆炸,那么欢迎您加入讨论学习,共同进步!
景芯主营业务是design service+一对一芯片辅导培训!
另外小编团队提供芯片Design Service,设计服务包括:
提供SoC、MCU、ISP、CIS等芯片设计、验证、DFT设计服务
提供DDR/PCIE/MIPI/CAN/USB/ETH/QSPI/UART/I2C等IP设计
提供7nm、12nm、28nm、40nm、55nm、65nm、90nm等后端设计
提供高校、企业定制化芯片设计服务、设计培训业务
手把手教您掌握SoC算法、设计、验证、DFT、后端全流程低功耗!
景芯SoCv3.0,是一款用于【芯片全流程实战培训】的低功耗多媒体SoC!
景芯SoC系统分为三个层次的功耗管理,并集成低功耗RISC-V处理器,集成ITCM SRAM、DTCM SRAM,集成MIPI、ISP、USB、QSPI、UART、I2C、GPIO等IP,采用SMIC40工艺流片。
高速接口的Verilog设计实现 从图像算法到RTL设计实现 MIPI、ISP的Verilog实现与仿真 Lint、CDC检查及UVM验证 SoC子系统的C驱动仿真 后仿真
SoC子系统级的UVM环境搭建 SoC子系统级的UVC环境搭建 SoC子系统级的VIP环境搭建 SoC子系统的DMA SRAM UVM联合验证 SoC子系统的UART UVC验证 SoC子系统的长包、短包、超长包、毛刺包、包头/包尾错误UVM验证
仅验证一门课程内容就抵得上其他培训机构的3-4门课程,价格仅其1/6
DFT设计(芯片级) Synthesis逻辑综合(芯片级) 低功耗UPF设计、CLP技术 formal验证等技术
(四)SoC后端课程,您将学会
低功耗设计
布局布线(低功耗FF flow) StarRC/QRC STA/Tempus 功耗分析 DRC/LVS设计
仅后端一门课程内容就抵得上其他培训机构的3-4门课程,价格仅其1/6
课程提供服务器供大家实践!带你从算法、前端、DFT到后端全流程参与SoC项目设计。请联系号主报名!联系微信:135-4139-0811
景芯SoC训练营图像处理的数据通路:
一键式完成C代码编译、仿真、综合、DFT插入、形式验证、布局布线、寄生参数抽取、STA分析、DRC/LVS、后仿真、形式验证、功耗分析等全流程。升级后的芯片设计工程V4.0 flow如下:
SoC一键式执行flow
MIPI DPHY+CSI2解码
数字电路中经典设计:多条通信数据Lane Merging设计实现
数字电路中经典设计:多条通信数据Lane Distribution实现
景芯SoC验证架构
景芯SoC全芯片验证架构:
景芯资深老学员告诉我,留学X国的硕士去外企某芯片巨头薪资是20万+美金!折合RMB超过140万,才25岁左右的小伙子!薪资超140万!
小编去看了glassdoor的工资:
1-3经经验的ASIC Engineer的工资报价有212K美刀,20万美刀。
7-9年经验的ASIC Engineer的工资报价有311K美刀,30万美刀。
当然具体薪资也是看每个候选人的水平以及岗位匹配度。
学历、项目经验都是非常重要的,期待着景芯战友们的更多捷报!走出国门,世界更精彩!景芯SoC项目的正能量之大,小编自己都很震撼,小编一定持续打磨,让景芯战友们一起成功!
景芯SoC UPF低功耗设计
全芯片UPF低功耗设计(含DFT设计)
景芯SoC训练营培训项目,低功耗设计前,功耗为27.9mW。
低功耗设计后,功耗为0.285mW,功耗降低98.9%!
电压降检查:
低功耗检查:
芯片的版图设计V1.0
芯片的版图设计V2.0
芯片的版图设计V4.0
低功耗设计的DRC/LVS,芯片顶层的LVS实践价值极高,具有挑战性!业界独一无二的经验分享。
ISP图像处理
dpc - 坏点校正
blc - 黑电平校正
bnr - 拜耳降噪
dgain - 数字增益
demosaic - 去马赛克
wb - 白平衡增益
ccm - 色彩校正矩阵
csc - 色彩空间转换 (基于整数优化的RGB2YUV转换公式)
gamma - Gamma校正 (对亮度基于查表的Gamma校正)
ee - 边缘增强
stat_ae - 自动曝光统计
stat_awb - 自动白平衡统计
CNN图像识别
支持手写数字的AI识别:
仿真结果:仿真识别上图7、2、1、0、4、1、4、9
景芯SoC 3.0 ISP:
景芯SoC V3.0 DFT方案:
如果您和小编一样渴求进步,想掌握芯片设计全流程,欢迎加入小编知识星球,疯狂成长,一起进步!早日成为芯片大佬!
景芯学员们,小编十分感谢你们对景芯的肯定、信任和支持,你们的鼓励让小编十分感激,小编一定更努力精心打磨景芯SoC实战课,我承诺,一定要做到零差评,让大家无论资深还是资浅都能从景芯训练营获得成长!
以上就是今天分享的内容,如果您和小编一样渴求进步,想掌握芯片设计全流程,欢迎加入小编知识星球,疯狂成长,一起进步!早日成为芯片大佬!
景芯SoC V3.0课程提供服务器供大家实践!手把手教您学会SoC的算法、前端、DFT、后端全流程实战。
请联系号主报名!联系微信:135-4139-0811
景芯SoC训练营图像处理的数据通路:
景芯SoC的CRG设计:
一键式完成C代码编译、仿真、综合、DFT插入、形式验证、布局布线、寄生参数抽取、STA分析、DRC/LVS、后仿真、形式验证、功耗分析等全流程。升级后的芯片设计工程V2.0 flow如下:
SoC一键式执行flow
MIPI DPHY+CSI2解码
数字电路中经典设计:多条通信数据Lane Merging设计实现
数字电路中经典设计:多条通信数据Lane Distribution实现
UPF低功耗设计
全芯片UPF低功耗设计(含DFT设计)
景芯SoC训练营培训项目,低功耗设计前,功耗为27.9mW。
低功耗设计后,功耗为0.285mW,功耗降低98.9%!
电压降检查:
低功耗检查:
低功耗设计的DRC/LVS,芯片顶层的LVS实践价值极高,具有挑战性!业界独一无二的经验分享。