公共物品调研:维基百科何以持续发展至今?

文摘   2024-11-07 10:34   泰国  
作者:白丁&雾月,极客web3
提到互联网时代的公共物品,维基百科可能是最具代表性的案例,这一海内外闻名的线上百科全书由吉米·威尔士和拉里·桑格于2001年共同创立,旨在通过互联网提供可自由访问的知识平台,“让每个人都能自由获取全人类的知识”。
时至今日,维基百科已无可争议地实现了这一目标,靠着“用户上传内容”的开放编辑模式,任何人都可以线上贡献内容,维基百科得以汇聚全世界的“智囊”。
截至目前,该平台有超过300种语言的词条内容,收录条目超过6200万个,每月内发生的编辑行为超过1400万次,仅英文维基的数据量便已超过20TB,月访问量则高达60亿次以上,稳居全球10大最受欢迎的网站之列。凭借这些数据,维基百科当之无愧为Web2时代知识库的标杆。
而在AI飞速发展的当下,维基百科的价值更是难以估量。计算机科学家杰西·道奇曾表示,维基百科是ChatGPT底层大语言模型最大的单一信息来源,其内容可能占到LLM所抓取数据的3%~5%。西蒙弗雷泽大学教员尼古拉斯·文森特甚至说,“没有维基百科,生成式人工智能就会不复存在。”
最让人感到惊奇的是,规模如此庞大、运营如此成功的维基百科并非一家商业化私营机构,甚至是“全世界最大的无商业广告的网站”,这听起来相当不可思议,因为与其体量相近的互联网平台大多靠着广告费或烧钱填窟窿才能维持生计,对于变现能力困难、生存周期普遍较短的Web2公共物品而言,靠着非商业化模式运营至今且始终维持庞大的体量,简直难如登天。
Wikimedia Foundation的CEO Katherine Maher更是在2021年直言:“如果维基百科不是在21世纪初创立,在今天这个碎片化、商业化的互联网世界里,它根本无法诞生。”
主打非盈利向的维基百科究竟何以达到如今的影响力,其中奥秘值得一探究竟。抱着对Public goods的研究兴趣,我们对维基百科进行了简单调研,由于该案例对公共物品经营者尤其是内容输出平台具有极强的启示意义,在此推荐大家阅读此文。下面我们将从维基百科的内容产出模式、现金流来源与支出分配、权力与财政上的争议多角度展开阐述
UGC:划时代的内容生成模式
维基百科的开放编辑模式可以追溯到其创立初期,其前身是Nupedia,目标是建立一个高质量的在线百科网站。然而Nupedia的编辑流程非常缓慢,上传的内容必须经过多级审查和专家批准,严重限制了内容生成速度,该项目在2000年建立后一年内收录的文章数量屈指可数。
为了提高内容产出效率Nupedia的发起人拉里·桑格提出了新想法,开发出套名为Wiki”的知识网络系统,该系统允许用户自由上传内容,任何可以参与编辑词条成为了后来的维基百科。
从产品层面看,wiki是一种知识网络系统,用户在web的基础上对wiki文本进行创建、更改和发布的成本远比HTML文本小,同时wiki系统支持面向社群的协同写作,提供便于社群交流的简单工具,这有助于共享某个领域的知识。
在《世界是平的》一书中,作者直接将上述模式称为“社区上传内容”,而在更多文献当中,拉里·桑格推出的内容编辑模式被称为UGC(User-Generated Content),即“用户生成内容”,其背后往往没有可观的物质激励,更多凭兴趣来驱动。
UGC很快就打破了传统百科全书由专家和出版商主导把控的形式,能灵活收录非学术向但具有一定关注度的热点事件,也因此迅速捕获了广大用户的心智。这种自下而上的“众包”模式让维基百科的信息触手快速延伸到了方方面面,2001年1月上线后,维基百科迅速超越了Nupedia,后者于2003年被关闭,而《大英百科全书》也在维基百科的冲击下于2012年宣布停止印刷出版。
目前,全球有数百万志愿者参与编辑和维护维基百科平台上的内容,活跃编辑者(每月至少参与编辑一次)约有12万人,每分钟在网站上发生的编辑事件就有约300次。
UGC虽然为维基百科的崛起创造了条件,但其带来的副作用也同样明显。在开放自由编辑模式下,如何保证内容的准确是绕开的痛点维基百科曾发生过数不清的词条造假或破坏性编辑事件,最常见的包括插入虚假信息、广告文案或是带有政治导向的内容,其中最著名的当属“约翰·席根塔勒词条造假事件”。面对这些破坏性行为该如何加以解决,其实是极为艰巨且难以根治的任务。
维基百科目前的解决方案是,提供让词条内容回退到旧版本的功能,每个词条下都有修订行为的历史记录,任何人发现词条被恶意变更后,都可以让词条回退到旧版本。
有数据统计,明显的恶意编辑行为很容易被发现并移除,根据实验检测,此类纠错行为平均几分钟即可触发。现在维基百科已经广泛使用bot纠正简单的书面错误或低俗内容,但难以快速察觉的破坏行为仍需要人工介入。
对于需要人类手动介入解决的问题,维基百科制定了分为三层的保障体系,以尽可能去中心化的方式执行。首先当恶意编辑行为发生时,最常规的处理办法是“修改、回退、讨论”,当用户A对某词条做出编辑后,如果用户B有质疑,可以将其回退至旧版本,然后于讨论页上说明彼此间的分歧,谋求共识。
有时争议双方容易陷入僵持,反复发生“编辑、回退、编辑、回退”,这就需要更高权限角色的介入,俗称管理员和巡查员。
管理员则拥有删除条目、保护页面、防止编辑冲突以及处理投诉等更高权限,而巡查员的主要任务是快速审查和标记最新发布的内容,可以将有问题的内容标记为“待审查”,向管理员或更高级别的志愿者报告。
此外管理员可以将易被恶意修改的条目(如公共人物词条)设置为部分或完全保护状态,限制编辑权限,使词条状态维持稳定。管理员还有权封禁恶意编辑词条的用户。
对于更复杂的情况,维基百科还有由资深志愿者组成的仲裁委员会,作为最后的解决手段。委员会成员均为资深志愿者,其决策基于维基百科的编辑方针和社区规范,保证内容符合中立、可验证的标准。
在开源内容许可协议方面,维基百科采用了若干知识共享许可协议,其中最重要的是CC BY-SA 4.0协议,该协议允许用户自由分享或改编内容,但必须满足两个条件:
1. 必须标明原作者姓名、作品来源和链接
2. 如果作品被改编,则改编作品也必须按CC BY-SA 4.0协议发布,方便更多用户进行二创。除CC BY-SA 4.0之外,一些较早的内容和图片仍适用于GNU自由文件许可协议 (GFDL)

现金流分析:仅捐款撑起巴别塔

现金流来源

对于体量大、用户多的大型互联网平台而言,如何获取稳定的现金流是最头疼的问题,主打非商业化与免费阅读、价值观中立的维基百科几乎不可能像推特、YouTube等商业化平台那样靠着插入广告或会员制变现。此外,维基百科背后缺乏强有力的私营机构施以巨额补贴,其如何获取现金流维持运转是很多人都好奇的问题。
对此我们可以先拿百度百科作为对比。以搜索“医疗保险”词条为例,很容易发现百度百科严重依赖于广告系统收入,这种商业变现方式往往会带来偏向性或不实信息,比如2016年的魏则西事件就是此模式下的牺牲品,最终驱使网信办等部门勒令相关互联网平台降低商业推广比重。
如果按照Vitalik“收入-邪恶曲线”中的度量标准,魏则西事件堪称公共物品过度货币化带来负外部性的典型案例。相比之下,维基百科的非商业化方针使其更为中立,得以保留更多的正外部性,但这种模式真的可持续运转吗?
维基百科与其它“百科类”产品对比表
针对维基百科可持续性的问题,不得不追溯到其背后的发起组织———维基媒体基金会。该基金会成立于2003年,总部位于旧金山,目前员工规模达到500多人。其资金来源主要来自于捐赠和补助,按照其公开披露的材料,维基媒体基金会的收入来源包括以下几个方面:
首先是用户捐赠。每年,维基媒体基金会会发起募捐活动,向全球用户呼吁捐赠支持平台运营,这些捐款大多数额较小,但捐赠者数量庞大,在基金会的收入中占很大比例。大部分用户浏览维基百科时,每年会有两次在屏幕上弹出一个横幅,向用户请求捐款以维持平台运行。
维基媒体基金会在2022-2023财年数据,基金会总收入达到了1.8亿美元,其中小额的用户捐赠约占资金来源的90%以上。平均来看,每个捐赠者的贡献约为11美元,全球大约有750万人通过这种方式支持维基百科。
除了个人捐款外,维基媒体基金会还接受一些大型企业和基金的资助,如谷歌、微软和盖茨基金会等,仅谷歌和艾尔弗·斯隆基金会便至少分别向维基百科捐款超300万美元。
此外,维基媒体基金会还积极申请公益项目的赠款,一个典型的例子是“Reading Wikipedia in the Classroom”,该项目旨在帮助全球教师和学生更好地利用维基百科进行教学,最初在尼日利亚、玻利维亚和菲律宾试点实施,如今已扩展到超过40个国家,帮助该地区人民在课堂上有效使用维基百科。通过该项目,维基媒体基金会成功收到了多方赞助。
为了可持续发展,维基媒体基金会也在积极探索除捐赠外的自主经济来源。基金会于2021年10月推出了“Wikimedia Enterprise”服务,主要面向Google、Amazon等大型科技企业提供专门的付费API,这项服务为基金会带来了额外收入。在2022-2023财年,Wikimedia Enterprise带来了数百万美元的收入,仅谷歌一家便向维基百科付款超200万美元,付费API业务有望成为未来维基百科收入增长的重要推动力。
基金会还运营着一个维基媒体在线商店(store.wikimedia.org),销售带有维基百科标志的周边商品,如T恤、马克杯和贴纸等。尽管这部分收入占比相对较小,但也是基金会的补充收入来源之一,每年大约能带来几十万美元的额外收入。
除上述官方明确提及的稳定资金来源之外,通过查询资产负债表我们还可以看到,维基基金会还会参与一些投资活动。2023年维基媒体基金会投资获利约650万美金,不过2022年其投资行为亏损了1100多万美金。

支出分配

维基媒体基金会对所有资金使用都有详细的预算规划和财务审核,每一笔较大开支都经过多重审批,尽量确保合理和透明。维基基金会的财务报告也会定期公开,让捐赠者和公众了解资金的具体使用情况。
根据维基基金会的报表,我们可以看到其具体的支出情况,仅2022财年其支出便达到1.69亿美元,其中员工薪酬和福利占到开支中的60%,这笔资金主要用于支付技术团队和社区人员的工资及相关福利,涵盖了服务器维护、软件更新、数据安全等工作的支出。
作为全球最大的在线百科全书,维基百科需要处理庞大的数据和流量,光是维护和升级服务器、数据中心等技术资源就是一笔庞大的开支。截至2024年,维基百科在全球范围内建有6个数据中心,分布在美国、荷兰、法国、新加坡,以确保维基百科和其他维基媒体项目的稳定运行。
同时,维基百科离不开全球志愿者社区的支持,维基基金会在世界各地提供各种奖项和资助活动以推动社区建设,这部分支出约占14%。比如维基基金会曾在一些地区组织“编辑马拉松”活动,鼓励志愿者集中对特定主题词条进行编辑,扩展内容广度和深度。典型案例包括以法国为主的多国举办的“Fashion Edit-a-thons”以及2020年聚焦气候主体的“Wiki4Climate”活动。
此外,维基基金会还投入了大量资源用于专业服务,包括法律咨询、外部技术支持和会计审计等,以保障维基百科在全球范围内的合规性和运营安全。
同时,基金会的管理费用还涵盖了办公设施租赁及日常管理支出,以维持内部运作,并定期举办技术研讨会和国际编辑会议,促进全球志愿者社区的合作与交流,这同样需要资金支持。
上述两部分合计到15%的总支出。此外,维基媒体基金会通过广告和支付渠道在社会上发起的募捐活动支出,占到总支出的4%。

维基百科的挑战:骗捐、腐败与政治正确

任何一个公共物品的可持续发展都是难以忽视的问题。无法否认的是,在这方面维基百科过去做得很好,但其依然存在隐患和挑战。首先,维基百科的运营资金主要依赖用户捐赠,尽管这种模式维系了平台的发展,但其非自主的经济来源仍然存在极强的不稳定性,在大语言模型的冲击下,用户向维基百科捐赠的意愿更容易受到影响。
其次,作为一个非营利组织,如果基金会尝试通过付费API等典型的商业化手段来增加收入,又可能引发外界对平台性质和中立性的争议。如此看来,维基百科在经济来源和中立性上的不稳定性已成顽疾,说到这就有一个不得不提的问题。
正所谓“树大招风”,维基百科仅靠捐助,便获得如此巨大的经济来源,外界对此多有不满,且其资金去向颇具争议性“超募”、“骗捐”等类似传言似乎就从未平息。一方面是维基百科的募款文案有时会夸大其在资金需求上的紧迫性,甚至给人一种维基百科“即将倒闭”的印象,引发用户对平台财务状况的误解。
另一方面,一些知情者提供了具体数据,表明维基百科的运营并不需要那么多资金,有很大的“公饱私囊”嫌疑。
维基社区报纸的前联合主编Kolbe表示,自己对于维基内部运作情况十分熟悉,维基基金会2016年推出的捐赠基金计划,本来计划10年内完成1亿募捐目标,但近期募捐活动、募捐广告密度明显增加,至少提前5年就能完成数倍于此的募捐规模,而作为对比的是,维基百科每年正常运转,其实只需要1000万美元。
此前一位巴西编辑Felipe da Fonseca也曾说道:”用其他人的工作成果去给自己要钱,这种乞丐一般的姿势,实在是太丑陋了,是不道德的。“
维基百科的创始人吉米·威尔士也频繁遭遇社区的指控,许多人认为维基媒体基金会的成本/效益比堪称悲惨,基金会多年来在软件开发上花费了数百万美元,却没有产生出任何有效的东西。威尔士在2014年承认,自己对无休止的争议感到沮丧,这些争议指责他没有经过充分的社群咨询而执意浪费资金开发一些没有实际价值的软件,也没有适当的增量推广来弥补错误。
而在2017年2月,The Signpost发表了题为《维基百科身患癌症》的专栏文章,作者批评维基媒体基金会的年度支出不断增加,但未取得相应的产出效果。
马斯克也是一个坚定的维基百科批判者。2023年马斯克将推特改名为“X”引来诸多讨论,此时马斯克发文调侃:如果维基百科将名字“Wikipedia”改为“Dickipedia”一年,将马上捐给维基基金会10亿美元,以表达自己对于维基呼吁捐款和超募传言的不满。后来马斯克还发布了“Wikipedia is broken”,“Wikipedia is losing its objectivity”等等言论,本文对此不一一列举。
马斯克的言论可能含有一些政治因素(维基百科的诸多词条有明显反对特朗普的倾向),我们不做相关讨论,但这确实代表了许多知名人物对维基百科的消极态度。
面对此类传言,维基基金会方面解释称,募款所得不仅用于日常运营,还可以确保维基百科在无广告、免费阅读且不受商业利益影响的前提下,有足够的储备金以应对潜在的危机,这种资金管理策略可以增强其容错性,有助于维基百科保持非营利公共物品的独立和稳定。
除上述问题外,维基百科的发展还存在多方面问题。
首先,作为一个开放编辑的平台,维基百科的内容依赖全球志愿者来创建和维护,虽然这种模式鼓励了广泛参与,但也带来了误导性、不准确甚至恶意修改的情况,虽然平台有严格的编辑规则和审核机制,但AI时代下如何确保内容的可靠和中立,并及时纠正错误,将是其发展过程中难以忽视的挑战。
同时,通过一些第三方数据,我们可以发现,虽然维基百科的用户在逐年增多,但近年来平台的活跃编辑人数明显减少。出现该现象的原因主要有两个:
  1. 维基百科的审核机制越来越严厉,新人编辑的积极性被打消
  2. 管理员权限越来越高,可以封锁部分编辑的账户和IP地址,有滥用职权的现象
另外,管理层内部也并非铁板一块,尤其是维基百科社区和维基基金会其实存在诸多分歧,并且一度摆上台面,甚至还牵涉到管理层腐败和滥用职权的问题。
2014年,维基媒体基金会尝试在在德语版维基百科上安装一种可查看多媒体内容的新软件,而维基百科的德语编辑们拒绝更新用户界面,双方僵持不下。最终,维基基金会强制安装新软件,并设置高级权限,防止编辑回滚到旧版本。
2021年9月13日,维基媒体基金会还发动了针对中文维基百科的行动,致使7名用户遭封禁,12名管理员的权限遭移除。其中有三名用户在中文维基百科的活跃度占前十。由于事后维基媒体基金会并没有对此事做出系统而细致的举证或解释,该事件被中国大陆维基社区及中文媒体认为,涉嫌过度干涉社群自主权、打压持有敌对西方意识形态的嫌疑。并且缺乏程序正义。
除此之外,在资源分配相关问题上,例如不同语言版本间的资金分配,开发软件、维护基础设施的成本设置,不同地区的投入等等,维基百科社区和基金会其实都一直在相互争夺主导权。
维基百科作为公共物品,本就靠公信力获得捐赠来持续运营,而这种公信力又靠其内容的权威性和全面性,以及社区与基金会之间去中心化的权力分配来维持,而上述公之于众的内斗行为对于公信力是一种破坏,再加AI等大语言模型的冲击,维基百科的词条质量与用户规模可能会出现不可逆转的下降,导致其公信力进一步下调。
与此同时,维基百科还面临着志愿者多样性不足的问题。例如,关于女性、少数族裔和非英语地区文化的内容常常被忽视。如何吸引更多的志愿者,并鼓励来自不同背景和地区的人参与,是平台未来发展的另一关键。

总结

维基百科的成功不仅在于作为一个知识共享平台的卓越成就,更在于为公共物品的可持续发展提供了宝贵的思考。作为全球最大的开放式百科全书,维基百科不以商业性手段作为盈利方式,尽量保持了内容中立性,成功应对了互联网时代下的挑战,这对其他公共物品的管理有深远的启示。
维基百科的历史表明,只有通过稳定的经济来源、高效的资利用、透明的财务管理和深度的社区参与,公共物品才能在长远发展中稳健前行。同时我们也要看到,维基百科的运营,无论是从财政上、组织上以及舆论上,都并非完美,存在着不小的问题,引来了难以忽视的的争议。前车之鉴,后车之师,这些问题对于其他公共物品的构建者无疑具有极强的警示作用。
未来,公共物品的可持续发展将面临更多复杂的环境变化,包括因碎片化自媒体冲击下带来的用户注意力分散与运营成本陡增,以及全球范围内法律法规的调整,乃至用户需求的不断演变。这意味着公共物品不仅要持续吸引用户参与,还需要积极探索更多的收入来源,以开辟出稳健的可持续发展道路。

参考资料

1.Wikipedia from Wikipedia
2.Wikimedia Foundation from Wikipedia
3.Wikimedia Foundation reports/Financial/Audits/2022-2023 - frequently asked questions
4.Wikimedia Foundation 2021-2022 Annual Report
5.Reading Wikipedia in the Classroom
6.Foundation launches Wikimedia Enterprise: the new, opt-in product for companies and organizations to easily reuse content from Wikipedia and Wikimedia projects
7.Wikipedia:Administrators from Wikipedia
8.The Wikipedia Revolution: How a Bunch of Nobodies Created the World's Greatest Encyclopedia
9.Annual Report 2022-2023-The humans behind a year of impact around the world
10.WIKIMEDIA FOUNDATION,INC.Consolidated Financial Statements
11.Commons:Fashion Edit-a-thons from Wikipedia
12.Edit-a-thon from Wikipedia
13.https://www.nytimes.com/2023/07/18/magazine/wikipedia-ai-chatgpt.html
14.https://www.pingwest.com/a/244154

极客 Web3
类似于Messari的Web3行业研究机构