在多线程或多核处理器系统中,多个线程或处理器可能同时对相同的内存地址进行操作,这种情况下可能会出现数据竞争(Data Race)或不一致的情况。例如,如果多个线程同时增加一个共享变量,而操作不是原子性的,那么可能会导致多个线程读取相同的值,最终结果可能不正确。
原子操作可以避免数据竞争。无论系统如何调度,原子操作总是能一次性执行完毕,不会被中途打断。由于原子操作的不可分割性,它能确保在多线程或多处理器环境下的安全性,保证多个线程同时对同一共享变量进行读写的正确性。
RISC-V 把原子指令划分成单独的指令扩展,命名为 'A'。该扩展中主要包含两部分,一个 LR/SC 指令,即Load-Reserved/Store-Conditional,另外一个是 AMO 指令,RV32A 有两种类型的原子操作:
内存原子操作(AMO)
加载保留/条件存储(load reserved / store conditional)
内存原子操作(AMO)
AMO是强大的“读改写”指令,该操作加载rs1指向的存储器位置的内容,并将其存储在寄存器 rd 中,然后与rs2中的值进行二进制运算,并将结果保存回rd中,然后再写到rs1指向的存储器位置。
为什么要amo指令?
AMO指令要求整个读出,计算,写回必须为原子性质,就是读出和写回之间,该存储器地址不能被其它进程访问,通常总线会锁定,这样就支持多核SoC系统。虽然 RISC-V B位操作扩展支持一系列复杂的位控制指令,但Atomic扩展并不只是针对多处理器系统,它还有助于那些必要的位操作需求比较简单的嵌入式系统,从而精简软件指令代码。
AMO自旋锁的示例如下:
先在寄存器t0中放入1(li t0, 1)。
load加载a0地址中的内容到t1中,a0为锁的地址。
比较t1和0(bnez),t1不等于0则跳转到again,t1不等于0说明锁已经被持有。
把t0(1)放到a0表示的地址中,含义为上锁,把a0处的原值放到t1中。
比较t1和0(bnez),t1不等于0则跳转到again,t1不等于0说明锁已经被持有。
执行关键区Critical section代码。
解锁,把x0(0)的值赋给(a0),把(a0)的值交给x0(丢弃)。注意,RISC-V架构规定x0固定为0值。
再次申明,AMO指令要求整个读出,计算,写回必须为原子性质,就是读出和写回之间,该存储器地址不能被其它进程访问,通常总线会锁定。AMO指令也可以支持释放一致性模型,可以通过指令中的aq/rl位,来设置获取或释放属性。
另外还提供 AMO 指令的原因是,它们在多处理器系统中拥有比加载保留/条件存储更好的可扩展性,例如可以用它们来实现高效的归约。AMO 指令在于 I/O 设备通信时也很有用,可以实现总线事务的原子读写。这种原子性可以简化设备驱动,并提高 I/O 性能。
LR/SC指令
虽然原子操作能解决多线程的竞争问题,但由于会将总线锁住,导致其他核无法访问总线,在核数众多且频发抢锁的情况下,会造成总线长期被锁的情况,因此引入一种新的互斥类型的存储器访问指令,即LR(load reserved)/SC(store conditional)指令。LR指令是Load Reserved的缩写,读取保留;SC指令是Store Conditional 的缩写,条件存储,即load reserved/store conditional。
LR指令是从内存地址rs1中加载内容到rd寄存器。然后在rs1对应地址上设置保留标记(reservation set)。
SC指令在把rs2值写到rs1地址之前,会先判断rs1内存地址是否有设置保留标记,如果设置了,则把rs2值正常写入到rs1内存地址里,并把rd寄存器设置成 0,表示保存成功。如果rs1内存地址没有设置保留标记,则不保存,并把rd寄存器设置成1表示保存失败。不管成功还是失败,SC指令都会把当前hart 保留的所有保留标记全部清除。一个例子如下:
加载旧的值
比较旧的值与 a1 是否相等
相等则存入新的值
如果存入失败,重新尝试
…比较-交换成功之后的代码…
比较-交换不成功
总结
原子操作通常依赖于硬件支持。大多数现代处理器提供了原子操作的指令,支持直接对内存进行原子性的读、写、加减、交换等操作。操作系统和编译器也会提供一些高级接口(如锁、信号量、互斥量等)来确保原子操作的执行。
原子操作的常见类型
例子:
```c
bool compare_and_swap(int *ptr, int old_val, int new_val) {
if (*ptr == old_val) {
*ptr = new_val;
return true;
}
return false;
}
```