C++98-26：元编程之编译期拆解技术

教育科技 2023-08-22 19:51 陕西

人们往往会将一个大问题拆解成许多小问题，通过解决一个个小问题，最终就能解决整个大问题。

若是拆解过后，这些小问题的处理逻辑不变，变化的只是输入状态，那么此时就是一种代码复用。对应编程世界，一种是自上而下的拆解组合方式，称为递归；一种是自下而上的拆解组合方式，称为迭代。

拆解后还能组合，拆解才有意义，递归和迭代本身就带有一种约束，必须具备起始状态和终止状态。若是没有起始状态，递归就没有起点，循环就没有开始；若是没有终止状态，递归就没有终点，循环就没有结束，

本文所说的元编程拆解技术，就是编译期的问题拆解与组合技术，编译期不像运行期那样能够动态地改变输入与输出状态，C++ 诞生了许多技术来解决这个问题，这便是后文要介绍的。

本文以一个需求为例，来讲解这些技术：

要求编写一个 unroll<N>(callback) 函数，该函数将调用 N 次传入的 callback 函数。

起始状态就是 N，终止状态就是 N 为零，拆解后处理逻辑不变的小问题就是 callback。

先不看文，你首先想到的是什么解法？文读毕，对比一下文中的各种拆解技术思路，获益更多。

原始递归法

模板元编程最开始就只支持递归这一种拆解方式，每次输入一个状态，依次产生下一个状态，若状态与递归终止状态相同，则结束。

采用这种方式，实现需求如下：

 1namespace cpp98 {
 2
 3    // declaration
 4    template <std::size_t, class F> void unroll(F);
 5
 6    template <std::size_t N, class F>
 7    struct unroll_helper {
 8        void operator()(F f) {
 9            f();
10            unroll<N-1, F>(f);
11        }
12    };
13
14    // terminated state
15    template <class F>
16    struct unroll_helper<0, F> {
17        void operator()(F) {}
18    };
19
20    // definition
21    template <std::size_t N, class F>
22    void unroll(F f) {
23        unroll_helper<N, F>()(f);
24    }
25
26    void print_cpp98() {
27        std::puts("hello cpp98");
28    }
29}
30
31int main() {
32    cpp98::unroll<2>(cpp98::print_cpp98);
33    // output:
34    // hello cpp98
35    // hello cpp98
36}

由于函数模板不支持偏特化，于是需要借助一个 unroll_helper 类模板，来实现递归终止条件，再在 unroll 函数中调用该帮助类，不断拆解问题。

递归输入条件 N 为起始状态，每次拆解执行完成之后，通过 N - 1 得到下一个状态，从而不断解决问题。

这个时期，C++ 的元编程拆解技术还很弱，一个简单的需求，实现起来也颇为繁琐。

可变参数模板

时间来到 C++11，模板元编程迎来强大扩展，非常有用的一个新特性就是可变参数模板，它能够让我们摆脱递归这种原始拆解方式。

但是 C++11 还只是开始，基础组件不完善，所以并不能非常有效地实现目标。

什么意思呢？看如下这个不太完善的实现：

 1namespace cpp11 {
 2
 3    template <std::size_t... Is>
 4    class index_sequence {};
 5
 6    template <class F, std::size_t... Is>
 7    void unroll(F f, index_sequence<Is...>) {
 8        using expand = std::size_t[];
 9        expand{ (f(), Is)... };
10    }
11
12}
13
14
15int main() {
16    cpp11::unroll([] { std::puts("hello cpp11"); },
17        cpp11::index_sequence<2, 1>());
18}

原始递归法是采用不断递归来动态地产生状态，而有了可变参数模板，状态可以直接在编译期初期产生，从而直接拿来用就可以。

这里定义了一个 index_sequence 用来接收所有状态，然后借助一些逗号表达式技巧展开参数包，在参数包展开的过程当中，执行处理逻辑。

C++11 起也支持 Lambda，因此也不用再提供一个额外的调用函数。

这个实现的唯一缺点就是由于缺乏相应的组件，需要手动产生状态，导致使用起来较为麻烦。

完善版可变参数模板

C++14 增加了 std::index_sequence 和 std::make_index_sequence，于是就能将手动产生状态变成动态产生，完善实现。

代码如下：

 1namespace cpp14 {
 2
 3    template <class F, std::size_t... Is>
 4    void helper(F f, std::index_sequence<Is...>) {
 5        using expand = std::size_t[];
 6        expand{ (f(), Is)... };
 7    }
 8
 9    // variable template
10    template <std::size_t N>
11    auto unroll = [](auto f) { // generic lambda
12        helper(f, std::make_index_sequence<N>{});
13    };
14}
15
16int main() {
17    cpp14::unroll<3>([] { std::puts("hello cpp14"); });
18}

同时，C++14 还支持 variable template 和 generic lambda，这进一步简化了实现。

Fold Expression

前面的方式是采用逗号表达式技巧来展开参数包，C++17 支持 Fold expression，可以直接展开，因此代码得到进一步简化。

变成：

 1namespace cpp17 {
 2
 3    template <class F, std::size_t... Is>
 4    void helper(F f, std::index_sequence<Is...>) {
 5        ((f(), Is), ...); // fold expression
 6    }
 7
 8    template <std::size_t N>
 9    auto unroll = [](auto f) { // generic lambda
10        helper(f, std::make_index_sequence<N>{});
11    };
12}

constexpr if

C++17 的另一种拆解技术是借助 constexpr if，它的好处在于能够直接在本函数内判断终止状态，这样就不再需要去定义一个递归终止函数。

 1namespace cpp17 {
 2    // variable template + constexpr if
 3    template <std::size_t N>
 4    auto unroll = [](auto expr) {
 5        if constexpr (N) {
 6            expr();
 7            unroll<N-1>(expr);
 8        }
 9    };
10}
11
12int main() {
13    cpp17::unroll<3>([] { std::puts("hello cpp17"); });
14}

与原始递归法相比，这种方式除了消除递归终止函数，还免于编写一个额外的 helper 类，generic lambda 更是减少了模板参数。

这是目前为止，最简洁的实现。

C++20 双层 Lambda 法

有没有非递归的简洁拆解方式呢？当然也有。

看如下实现：

 1namespace cpp20 {
 2
 3    template <auto N> constexpr auto unroll = [](auto f) {
 4        [f]<auto... Is>(std::index_sequence<Is...>) {
 5            ((f(), void(Is)), ...);
 6        }(std::make_index_sequence<N>());
 7    };
 8}
 9
10int main() {
11    cpp20::unroll<3>([] { std::puts("hello cpp20"); });
12}

这里的关键是 C++20 的 template lambda，它支持为 lambda 编写模板参数，基于此才能够编写索引的模板参数。

Lambda 函数里面再套一个 Lambda 函数，外层用于提供调用接口，内层用于管理状态和处理调用。如果没有 template lambda，内层 Lambda 的 std::index_sequence 参数就无法写，也就接收不了状态。、

Structured Binding Packs

原本有些新特性是应该在 C++23 就进入标准的，但由于种种原因，我们只有期望 C++26 能用上了。Structured binding packs 就是这么一个特性。

前面除了递归以外的所有拆解方法，都得借助 std::index_sequence，这就是代码依旧复杂的原因所在。

有没有一种方式可以直接让我们访问参数包，而不必再定义一个参数为 std::index_sequence 的函数才能拿到那些参数包？Structured binding packs 就提供了这一能力。

这是 P1061 所提出的一种方式，让我们能够通过 Structured bindings 直接得到参数包。

于是实现变为：

 1namespace p1061 {
 2
 3    template <auto N> constexpr auto unroll = [](auto f) {
 4        auto [... Is] = std::make_index_sequence<N>();
 5        ((f(), void(Is)), ...);
 6    };
 7
 8}
 9
10int main() {
11    p1061::unroll<3>([] { std::puts("hello p1061"); });
12}

这种拆解技术才是最直观的方式，两行代码解决一切。

Expansion Statements

另外一种方式就是我们在反射中经常使用到的一个特性：template for。

这种方式比 Structured Binding Packs 更强大，是静态反射里面的一个扩展特性，能够支持编译期迭代。

对于本次需求的实现为：

 1namespace p1306 {
 2    template <auto N> constexpr auto unroll = [](auto f) {
 3        constexpr std::array<int, N> dummy{};
 4        template for (auto& e : dummy)
 5            f();
 6    };
 7}
 8
 9int main() {
10    p1306::unroll<3>([] { std::puts("hello p1306"); });
11}

这里借助了 std::array，构建了一个并不会实际使用的变量，目的是为了当作遍历次数。

总结

本文从 C++98 开始介绍了许多拆解技术，在不断的优化过程中，也能够看到 C++ 的发展历程。

由最原始的复杂、难用，到最后的两行代码搞定，也能够看到 C++ 元编程的发展。

利用好这些技术，对大家的元编程能力会有显著提高。

有收获，还希望大家点赞、分享、转发。

http://mp.weixin.qq.com/s?__biz=MzUxOTQ4NjIzNw==&mid=2247488268&idx=1&sn=3a6761ccd184fd5cf5615d108b7052f9

CppMore

Dive deep into the C++ core, and discover more!

最新文章

《产生式元编程》第七章巧活用折叠表达式

《产生式元编程》第六章感今朝妙艺几人知

《产生式元编程》第五章忆昔年模板三两事

C++20 std::format 替换 fmtlib 的关键点

《产生式元编程》第四章封装合并框架顿立

Lambda, bind(front), std::function, Function Pointer Benchmarks

使用 C++20 安全地比较不同类型的整型值

Normal OR Rules for Reference Bindings

觉者和修者，知与行本是一体

Configuring Transitive Dependencies with Modern CMake

Mastering Placeholder Type Deduction

Left-to-Right vs. Right-to-Left Coding Styles

C++26's Placeholder variables with no name

C++26 Pack Indexing

Reflection for C++26

The Second Edition is Done

癸卯小记

std:: versus ::std::

借助 ChatGPT 快速实现一个轻量级的控制台进度条库

Memory Reallocation when Parsing CSV Files

Parsing CSV Files in C++20

《产生式元编程》第三章替换蓝染概念纤悉

Modern C++ 23 秋开放入口，如期而至

一波书单，高薪有望

"+" 的几个使用小技巧，你了解吗

《产生式元编程》第二章自复用代码生成技

《产生式元编程》第一章宏编程计数引原理

C++98-26：元编程之编译期拆解技术

编译期消息分发，两点补充说明

编译期消息分发？C++20 已能优雅实现！

Monads in Modern C++, What, Why, and How

std::exchange 的原理及应用

An In-depth Look at C++ Keyword: static

重载决议中的合并问题补充

The Book is Done!

Modern C++ 23春开放入口

Technique: Take a constexpr string from Compile Time to Run Time

Comprehensive C++ String-to-Int Conversion Benchmarks(C89-C++23)

Overview of C++23 Features

2023，新的变化，新的开始

5种方式初始化String成员，怎样选择？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉