eBPF Talk: guard spinlock

文摘 2024-10-14 08:10 新加坡

守护 spinlock。

eBPF Talk: spinlock 详解

当使用 spinlock 进行统计时 eBPF Talk: 正确地进行统计，必须要使用 bpf_spin_lock() 和 bpf_spin_unlock() 来保护 spinlock 变量：

struct xdp_stat_item {
    u64 pkt_cnt;
    u64 pkt_byte;
    struct bpf_spin_lock lock;
};

static __always_inline void
stat_xdp(struct xdp_md *ctx)
{
    stat = (typeof(stat)) bpf_map_lookup_elem(&stats, &key);
    if (stat) {
        bpf_spin_lock(&stat->lock);
        stat->pkt_cnt++;
        stat->pkt_byte += (u64)(ctx->data_end - ctx->data);
        bpf_spin_unlock(&stat->lock);
    }
}

然而，改写成 guard 的形式：

static __always_inline void
stat_xdp(struct xdp_md *ctx)
{
    stat = (typeof(stat)) bpf_map_lookup_elem(&stats, &key);
    if (stat) {
        guard(&stat->lock);
        stat->pkt_cnt++;
        stat->pkt_byte += (u64)(ctx->data_end - ctx->data);
    }
}

会更加简洁，且不需要关心 bpf_spin_lock() 和 bpf_spin_unlock() 的调用。

guard 实现

此处，guard 的实现如下：

struct guard_spinlock_t {
    struct bpf_spin_lock *lock;
};

void
guard_spinlock_destructor(struct guard_spinlock_t *guard)
{
    bpf_spin_unlock(guard->lock);
}

#define guard_spinlock_constructor(lock)        \
({                                              \
    struct guard_spinlock_t guard = { lock };   \
    bpf_spin_lock(lock);                        \
    guard;                                      \
})

#define __cleanup(fn) __attribute__((cleanup(fn)))

#define guard(lock)                                                     \
    struct guard_spinlock_t var __cleanup(guard_spinlock_destructor) =  \
        guard_spinlock_constructor(lock)

guard 宏定义了一个 guard_spinlock_t 结构体变量 var，并在作用域结束时，调用 guard_spinlock_destructor() 函数解锁 lock。

这儿依赖 clang 编译器的 cleanup 特性。

`cleanup` 特性

参考 clang 文档：cleanup^[1]。

This attribute allows a function to be run when a local variable goes out of
scope. The attribute takes the identifier of a function with a parameter type
that is a pointer to the type with the attribute.

翻译：此属性允许在局部变量超出作用域时运行一个函数。该属性接受一个函数的标识符，该函数的参数类型是一个指向具有此属性类型的指针。

比如上面的 guard(&stat->lock)，会展开成 struct guard_spinlock_t var __attribute__((cleanup(guard_spinlock_destructor))) = ({ struct guard_spinlock_t guard = { &stat->lock }; bpf_spin_lock(&stat->lock); guard; })。在定义局部变量 var 时，便已调用 bpf_spin_lock(&stat->lock)；而在 var 超出作用域时，会在 guard_spinlock_destructor() 函数中调用 bpf_spin_unlock(&stat->lock)。

因此，guard(&stat->lock) 的临界区便是其所在作用域的剩余部分。

将 `cleanup` 特性应用到 `ringbuf` 和 `perfevent`

在使用 ringbuf 和 perfevent 时，如果使用 reserve() 和 discard()/commit()，可以使用 cleanup 特性来简化代码。

比如 ringbuf，伪代码如下：

struct {
    __uint(type, BPF_MAP_TYPE_RINGBUF);
} ringbuf SEC(".maps");

struct ringbuf_data {
    __u8 data[64];
};

struct guard_ringbuf {
    void *data;
    int *err;
};

void
guard_ringbuf_destructor(struct guard_ringbuf *guard)
{
    if (!guard->data)
        return;

    if (*guard->err)
        bpf_ringbuf_discard(guard->data, 0);
    else
        bpf_ringbuf_submit(guard->data, 0);
}

#define guard_ringbuf_constructor(ringbuf, size, err)   \
({                                                      \
    struct guard_ringbuf guard = { };                   \
    guard.err = err;                                    \
    guard.data = bpf_ringbuf_reserve(ringbuf, size, 0); \
    guard;                                              \
})

#define guard_ringbuf(ringbuf, data, err)                           \
    struct guard_ringbuf _g __cleanup(guard_ringbuf_destructor) =   \
        guard_ringbuf_constructor(ringbuf, sizeof(*data), err);     \
    data = (typeof(data)) _g.data;

SEC("xdp")
int xdp_fn(struct xdp_md *ctx)
{
    struct ringbuf_data *data;
    int err = 0;

    guard_ringbuf(&ringbuf, data, &err);
    if (!data)
        return XDP_DROP;

    /* do something with data, and use err to determine whether to commit or
     * discard the data.
     */

    return XDP_PASS;
}

总结

cleanup 特性可以简化代码，使得资源管理更加简单。

参考资料

[1]

cleanup: https://clang.llvm.org/docs/AttributeReference.html#cleanup

http://mp.weixin.qq.com/s?__biz=MjM5MTQxNTk5MA==&mid=2247485762&idx=1&sn=7ee361d49bff12d925183b30b7f8ff47

eBPF Talk

专注于 eBPF 技术，以及 Linux 网络上的 eBPF 技术应用

最新文章

eBPF Talk: 修复了 bpftool 中存在了 7 年的 BUG

eBPF Talk: 自制查看 bpf prog 反汇编的工具

eBPF Talk: 我禁用了 freplace tailcall freplace

eBPF Talk: guard spinlock

eBPF Talk: CPUMAP 简介

eBPF Talk: trace sockops 程序

eBPF Talk: 改进 XDP 解析 TCP options

eBPF Talk: 又修了一个 tailcall 有关的 BUG

eBPF Talk: ringbuf 经验分享

eBPF Talk: XDP 解析所有 TCP options

eBPF Talk: 给 x86 BPF JIT 做下优化

eBPF Talk: BPF 读取 TOA 的 4 种方式

eBPF Talk: 手撕 verifier log 一例

eBPF Talk: 耗时 10 个月，修复了又一个 tailcall 的 bug

eBPF Talk: 在设备层统计网络包延迟

eBPF Talk: 跟踪 ipv4 sysctl 配置变更

eBPF Talk: 使用 drgn 学习 bpf

eBPF Talk: 跟踪 RPS/XPS 配置变更

eBPF Talk: 跟踪 IRQ 绑核

eBPF Talk: 一行代码两行泪

eBPF Talk: vista 支持对 XDP/tc-bpf 进行抓包

eBPF Talk: 混部环境下无损升级 XDP 程序的思路

eBPF Talk: pwru 继承者 vista

eBPF Talk: challenge verifier

eBPF Talk: binary search

eBPF Talk: bpf prog stats

eBPF Talk: packet range check

Linux 网络：性能杀手 spinlock

eBPF Talk: 踩坑 XDP on Mellanox

eBPF Talk: tc-bpf 转发网络包

eBPF Talk: eBPF 程序模块化与单测构想

eBPF Talk: 给 XDP 程序写 unittest

eBPF Talk: 使用 metadata 将信息从 XDP 传给 AF_XDP

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

eBPF Talk: guard spinlock

guard 实现

cleanup 特性

将 cleanup 特性应用到 ringbuf 和 perfevent

总结

`cleanup` 特性

将 `cleanup` 特性应用到 `ringbuf` 和 `perfevent`