面对数字鸿沟最后一公里——利用自然语言推理模型(TE)解读网络运营商公开文本数据
(Connect the last mile - textual entailment identify efforts in bridging the digital divide)
范庄媛,张帆
随着人们生活和工作对互联网的依赖日益加深,数字鸿沟 (digital divide) 的影响逐渐显现。在美国,大型互联网服务提供商不一定有意愿服务于边缘化和低人口密度社区,因此政府资助计划倾斜于未能连接互联网的农村和低收入社区。本文基于自然语言处理算法,分析了1000多家互联网服务提供商 (Internet Service Provider, ISP) 发布在其网站的大量描述性文本,推断其发展定位、目标和身份。通过其服务领域的社会经济状况及其业务发展定位创建的不同 ISP 类型,展现了当前美国互联网服务在地理、社会和服务质量水平方面的明显区分,并为规划者和政策制定者提供制定有效的建议,以填补当前数字鸿沟。
引用
Fan, Z., Zhang, F. Connect the last mile - textual entailment identify efforts in bridging the digital divide. Urban Informatics 1, 10 (2022).
https://doi.org/10.1007/s44212-022-00010-4
互联网的重要性与日俱增,但低密度地区依然面临互联网服务欠缺的局面。随着最近发布的 2022 年宽带公平、接入和部署计划 (BEAD),政府规划机构再次面临决策问题——谁应该获得这笔资金,并在未来十年内帮助未得到服务和服务不足的社区弥合数字鸿沟?
本研究试图通过分析当前ISP公开发布资料中的客户细分、市场地域和公司发展定位,构建ISP类型分类以提供决策信息。本文主要解决两个研究问题:1)美国有多少种不同的ISP?2) 谁关心网络服务不足的人群并有能力帮助他们连入互联网?
具体来说,在检索到 ISP 的定性描述后,本研究将数据与来自 FCC 和 ACS 的每个 ISP 的定量记录相结合,并创建一个ISP 类型 (typology)。它是根据 1,089 家 ISP 当前覆盖区域的社会经济因素以及他们自己的使命和价值声明对 ISP 进行的分类。这种类型概述了这些服务的主要任务和目标、空间分布和策略,包括:1. 老年人和任务相关(涵盖老年人口比例高的地区,以前有资源的公用事业基础设施公司);2. 老年人和使命驱动(涵盖老年人口比例高,并且雄心壮志地表达他们的使命和价值观的地区);3. 低收入和任务相关(覆盖低收入社区比例高的地区);4. 高收入且与使命无关(以技术为中心,主导高收入市场)。最后,该研究使用 FCC 477 提供的互联网速度数据和来自谷歌的客户评论数据,进行ISP类型有关其质量或服务的验证。
图1. ISP类型地理分布图
图1为四种ISP类型的地理分布结果。较深的颜色表示一个区域内的独立ISP数量较多。可以发现高级别和使命相关的ISP 类型在美国中部和北部的集中度更高。相比之下,服务于低收入群体的ISP主要集中在南部地区。可以看出,当前可用的互联网服务按不同的收入水平、种族构成、年龄和地域进行细分。
本研究揭示了两个主要发现。首先, ISP 在线文本分析展现出了一个有趣的模式。高收入和与使命无关的ISP通常在其网站上很少展示与其使命和发展定位相关的词语。低收入和任务相关ISP 包括大量非营利组织。高级和任务驱动的ISP 明确提到他们的业务目标是“连接当地人”、“弥合数字鸿沟”或“产生经济影响”。其次,ISP 类型的聚类结果表明 Internet 服务在地理和社会方面都有明显的市场细分。这一结果进一步挑战了“数字鸿沟”的模糊定义及其随后的“普遍访问”政治宣言。随着成功的 ISP 不断发展以迎合自己的市场,规划者和政策制定者需要看到这些不同 ISP 可以提供的互联网质量中也存在不断加深的“数字鸿沟”。这种类型学研究可以在未来随着时间的推移进行迭代,以反映新的政策激励措施可能如何影响美国的互联网服务格局。
范庄媛,香港大学地理系博士研究生。
https://www.zhuangyuanfan.com/
张帆,香港科技大学土木与环境工程系助理教授。研究领域包括地理信息科学、城市数据科学和地理人工智能。
https://www.ce.ust.hk/people/fan-zhang-zhangfan
END
编辑:乔思、刘乃瑜
审核/指导:刘信陶、曹瑞