详解CPU原子操作

文摘   2024-10-08 18:59   四川  

在多线程或多核处理器系统中,多个线程或处理器可能同时对相同的内存地址进行操作,这种情况下可能会出现数据竞争(Data Race)或不一致的情况。例如,如果多个线程同时增加一个共享变量,而操作不是原子性的,那么可能会导致多个线程读取相同的值,最终结果可能不正确。


原子操作可以避免数据竞争。无论系统如何调度,原子操作总是能一次性执行完毕,不会被中途打断。由于原子操作的不可分割性,它能确保在多线程或多处理器环境下的安全性,保证多个线程同时对同一共享变量进行读写的正确性。


RISC-V 把原子指令划分成单独的指令扩展,命名为 'A'。该扩展中主要包含两部分,一个 LR/SC 指令,即Load-Reserved/Store-Conditional,另外一个是 AMO 指令,RV32A 有两种类型的原子操作:

  • 内存原子操作(AMO)

  • 加载保留/条件存储(load reserved / store conditional)



内存原子操作(AMO)


AMO是强大的“读改写”指令,该操作加载rs1指向的存储器位置的内容,并将其存储在寄存器 rd 中,然后与rs2中的值进行二进制运算,并将结果保存回rd中,然后再写到rs1指向的存储器位置。

为什么要amo指令?

AMO指令要求整个读出,计算,写回必须为原子性质,就是读出和写回之间,该存储器地址不能被其它进程访问,通常总线会锁定,这样就支持多核SoC系统。虽然 RISC-V B位操作扩展支持一系列复杂的位控制指令,但Atomic扩展并不只是针对多处理器系统,它还有助于那些必要的位操作需求比较简单的嵌入式系统,从而精简软件指令代码。

AMO自旋锁的示例如下:


  • 先在寄存器t0中放入1(li t0, 1)。

  • load加载a0地址中的内容到t1中,a0为锁的地址。

  • 比较t1和0(bnez),t1不等于0则跳转到again,t1不等于0说明锁已经被持有。

  • 把t0(1)放到a0表示的地址中,含义为上锁,把a0处的原值放到t1中。

  • 比较t1和0(bnez),t1不等于0则跳转到again,t1不等于0说明锁已经被持有。

  • 执行关键区Critical section代码。

  • 解锁,把x0(0)的值赋给(a0),把(a0)的值交给x0(丢弃)。注意,RISC-V架构规定x0固定为0值。


再次申明,AMO指令要求整个读出,计算,写回必须为原子性质,就是读出和写回之间,该存储器地址不能被其它进程访问,通常总线会锁定。AMO指令也可以支持释放一致性模型,可以通过指令中的aq/rl位,来设置获取或释放属性。

外还提供 AMO 指令的原因是,它们在多处理器系统中拥有比加载保留/条件存储更好的可扩展性,例如可以用它们来实现高效的归约。AMO 指令在于 I/O 设备通信时也很有用,可以实现总线事务的原子读写。这种原子性可以简化设备驱动,并提高 I/O 性能。


LR/SC指令

虽然原子操作能解决多线程的竞争问题,但由于会将总线锁住,导致其他核无法访问总线,在核数众多且频发抢锁的情况下,会造成总线长期被锁的情况,因此引入一种新的互斥类型的存储器访问指令,即LR(load reserved)/SC(store conditional)指令。LR指令是Load Reserved的缩写,读取保留;SC指令是Store Conditional 的缩写,条件存储,即load reserved/store conditional。


LR指令是从内存地址rs1中加载内容到rd寄存器。然后在rs1对应地址上设置保留标记(reservation set)。

SC指令在把rs2值写到rs1地址之前,会先判断rs1内存地址是否有设置保留标记,如果设置了,则把rs2值正常写入到rs1内存地址里,并把rd寄存器设置成 0,表示保存成功。如果rs1内存地址没有设置保留标记,则不保存,并把rd寄存器设置成1表示保存失败。不管成功还是失败,SC指令都会把当前hart 保留的所有保留标记全部清除。一个例子如下:

  • 加载旧的值

  • 比较旧的值与 a1 是否相等

  • 相等则存入新的值

  • 如果存入失败,重新尝试

  • …比较-交换成功之后的代码…

  • 比较-交换不成功

总结

原子操作通常依赖于硬件支持。大多数现代处理器提供了原子操作的指令,支持直接对内存进行原子性的读、写、加减、交换等操作。操作系统和编译器也会提供一些高级接口(如锁、信号量、互斥量等)来确保原子操作的执行。

原子操作的常见类型

(1)、读写操作:在某些系统中,某些基本数据类型的读写操作是原子的。比如,在许多平台上,对 int 类型变量的读写操作可以是原子操作,因为这类操作往往可以在一个CPU指令周期内完成。

(2)、加减操作:诸如 fetch-and-add(取值并加)、fetch-and-sub(取值并减)等操作可以作为原子操作。例如,多个线程对一个共享变量同时执行加减操作时,原子操作可以保证结果正确。

(3)、比较并交换(Compare-and-Swap, CAS):这是一个常见的原子操作,它比较某个内存位置的值,如果该值与期望值相同,则将其替换为新的值。这种操作可以确保只有一个线程成功修改了数据,而不会产生竞争。

例子:

```c
bool compare_and_swap(int *ptr, int old_val, int new_val) {
if (*ptr == old_val) {
*ptr = new_val;
return true;
}
return false;
}
```

(4)、锁操作:原子操作可以用来实现轻量级的锁机制,比如自旋锁(spinlock)。原子操作可以确保只有一个线程能够获取锁,而其他线程在等待时不会进入不可预测的状态。

典型场景:

  • 计数器:在多线程环境中,如果多个线程同时对一个计数器进行递增或递减操作,使用原子操作可以保证计数器值的正确性。

  • 锁机制:通过原子操作实现的自旋锁、互斥锁等机制,确保线程之间在访问共享资源时不会出现竞争。

  • 无锁编程:在高性能要求的程序中,使用原子操作可以避免锁的使用,减少线程切换的开销,提高效率。


全栈芯片工程师
十多年SoC、MCU、ISP、CIS芯片设计经验!为客户提供优质的design service!研究生毕业于电子科大,曾就职海思,后加入创业公司任芯片设计经理,创办了景芯SoC全流程芯片设计培训营!
 最新文章