一、 FFT vs LoRA vs QLoRA
1.1 全量微调(FFT)
1.2 LoRA
1.3 QLoRA
二、 QLoRA 提出新数据类型 4-bit NormalFloat (NF4)
2.1 8-bit 量化和量化常数c
2.2 NormalFloat (NF) 数据类型
2.3 4-bit NormalFloat (NF4)
估计标准正态分布N(0,1)的分位数,得到正态分布的k位分位数量化数据类型。
将这些分位数值归一化到[-1, 1]范围内。
将输入权重张量归一化到[-1, 1]范围内进行量化。