为更严谨地分析上述问题,按照关于基金能力的已有研究的惯例,聚焦于基金的选股能力上。基金经理有选股能力意味着他可以选出那些相对表现更好的股票。因此,换个角度来说,可以认为基金经理有一个同股票未来收益正相关的截面信号。更具体来看,假设你是一个希望募资的基金经理。你有一个信号 Y(已标准化为均值为 0,方差为 1)可用于选股。将股票收益 R[n] 对滞后的信号 Y[n] 回归,可得如下关系:其中, 为股票总数,而 为信号 Y 的风险溢价,这表明你是有选股能力的。其中, 为股票 的权重, 为股票 n 的收益。与此同时,潜在投资者 Alice 自己也有一套选股信号 A。其结构与你的 Y 信号类似:同样的, 表明 Alice 有选股能力。凭着这套信号,Alice 赚过不少钱,因此变得富有。但一套信号毕竟不便于分散风险,且容量也有限,因此,Alice 希望看看你是否有独立于她的 A 信号的额外的获取超额收益的能力,从而她可以通过投资给你来改善自己的投资组合。因此,Alice 关心的问题如下:其中:换言之,为评估你是否有相对于她自己的额外选股能力,Alice 会对你的选股能力()施加惩罚,从中扣除你的信号和她自己的信号相关(重叠)的部分的溢价。考虑两个极端情况。如果你的 Y 信号和 Alice 的 A 信号完全不相关(,则 ;而如果两个信号完全相关,则 。如果你不担心策略的私密性,则证明自己有能力就不是一个问题。你可以将 Y 信号的全部数据都提供给 Alice,而 Alice 便可验证你的确有显著的选股能力。但问题在于策略的私密性的确很重要,而这就引出了本文开篇所讨论的基金管理人的两难问题。
2. Zero-Knowledge Proof
那上述两难问题是否是不可解决的呢?已有的常识会倾向于肯定的回答,即这一问题难以解决。但 Chinco (2022) 给了我们一个不一样的答案:并不完全是。答案取决于潜在投资者 Alice 的行为。具体来说,如果 Alice 像大家通常设想或看到的那样,仅仅是简单地在会面中听取你的陈述,然后据此做出分析和是否投钱给你的决策,那么,上述两难问题便无法解决。因为 Alice 的可用信息全部来自于你提供的关于策略的说明。但如果你和 Alice 的会面不是这样简单的静态交互呢?更确切地说,如果 Alice 可以积极主动地设计一组问题来考察你,那么,就完全有可能做到,在不泄露你的交易策略的细节信息的情况下,让 Alice 有充足的信息来评判你是否有选股能力,从而做出最优的投资决策。满足这一要求的办法是存在的。事实上,这在计算机科学中已广为人知,即“零知识证明”(Zero-Knowledge Proof)。“零知识证明”的目的正是为了在帮助判断所关心的问题的同时,无须泄露具体信息。(Note: 基于区块链的交易实际上也有用到类似的技术来保护交易双方的隐私信息,当然具体细节更为复杂。)一个典型的例子是假设只有你知道一个房间的密码。现在你要向小明证明你有这个房间的密码但不希望让小明知道密码是什么。那你要如何证明呢?一个简单的办法是小明指定一件或几件这个房间内的东西,由你取出给小明。如果你的确能取到这些东西给小明,则可证明你知道房间的密码。与此同时,小明始终不知道房间密码。因此,你们的目的达成了。注意,这里的关键是小明要参与进来“出题”。由于是小明出的题,他很清楚知道如何验证你是否答对了(拿到或没拿到指定的东西)。对于上述资产管理人募资问题,也是类似的。你希望向 Alice 证明你与她不相关的选股能力:,但又不希望泄露策略细节。借鉴上述简化的例子,为了解决上述两难问题,就需要改变“你陈述、Alice 听取”的老套模式,改为由 Alice “出题”——你回答——Alice 再验证的互动模式。但 Alice 如何出题才能检验你是否有选股能力呢?实际上并不难。Alice 可以给你两组数据,其中一组包含随机选择的 只股票相对于其 A 信号的真实残差收益(),另一组数据则包含与真实数据有着相同分布的假信号,而样本量同样为 。与此同时,Alice 还告诉你每只股票的编号。而 Alice 给你的问题则是分辨出哪组数据是真实数据,哪一组数据又是假数据。特别地,为了获得上述假数据,Alice 可以打乱抽取的 只股票的残差收益的顺序为其重新赋值。举个简单的例子。假设 Alice 选了 只股票,这些股票的编号为 。相应的股票残差收益为:为了生成假数据,Alice 将上述股票编号随机排序,并得到以下映射:即将股票 17 的真实残差收益 -0.70 赋给股票 52,股票 50 的残差收益不变,并将股票 52 的真实残差收益 -0.40 赋给股票 79,同时将股票 79 的真实残差收益 1.48 赋给股票 17。因此,假数据如下:由于假数据是对真实数据的重排,因此其分布跟真实数据完全相同。又由于它是随机重排得到的,因此,理论上,Y 信号无法预测该数据集中的股票未来收益。由于你有股票的编号,你可以计算每只股票的 Y 信号值。因此,如果你的确有显著的选股能力,即 成立。那么,通过对两组数据分别进行截面回归估计其中 Y 信号的溢价 并进行比较,你便可以识别出哪组数据是真实数据。特别地,有着更大的 的那组数据应为真实数据,而另一组则为假数据。当然,与任何统计检验分析一样,单次分析中总可能由于运气而识别错误。但如果 Alice 给出很多个这样的问题且你可以较好地回答,则 Alice 便会对你的选股能力更有信心。例如,如果 Alice 设计了 100 个这样的识别问题而你成功回答了 99 个,那么 Alice 应该可以较有把握地认为你的确是有能力的;进一步,如果她设计了 1000 个问题而你回答对了 999 个,则 Alice 可以非常有把握地相信你是有能力的。与此同时,Alice 从你对这些问题的回答中,除了可以更好地确认你是否有选股能力,并无法获取更多的信息。Alice 无从从中知晓你的策略逻辑,也无从知晓你是如何开发出这个选股策略的(比方说,假设你有一枚神奇的硬币可以帮助你确定一只股票是否值得买入,但 Alice 无法知道这一点,反而,她更可能相信你的确有独特的数据或分析能力来帮助你选股)。事实上,Alice 也无需关心这一点,她只需要通过你回答问题的正确率来获取对你能力的置信度即可。就这样,通过改变你们会面中的互动方式,你和 Alice 一起解决了募资中的两难问题:你成功回答了 Alice 的多数问题,使得 Alice 相信你有很好的选股能力,并决定投资给你。在不泄露你的策略信息的情况下,你们达成了友好的合作。Perfect!