重塑公共交通︱公共交通数据新标准:升级 GTFS,助力精细化公交决策

学术   2024-11-06 08:35   北京  

一览众山小-可持续城市与交通


一览

十一月



原文/Vahed Barzegari, Gera Taubkin, Mehdi Nourinejad, Interactive-OR

翻译/汪芮宇、刘蔚琛、徐文睿、刘又嘉、黄显婷、林思愉、黄广盛、王月瞳、王奥博、季均一、李天一

校核/众山小  排版/常海兴

文献/金逸雯  编辑/众山小

导 读 □


交通规划是一项复杂的决策工程,涵盖从公共交通网络的战略布局到运营调度的方方面面。本白皮书聚焦交通规划领域的核心数据源——通用交通数据源规范(GTFS),既肯定了其为交通数据标准化作出的重大贡献,也深入探讨了其局限性。GTFS 的限制主要体现在单一文件结构、缺乏关键数据(如乘客流量)、数据准确性等方面,制约了其在交通规划中的应用潜力。为此,本白皮书提出了一种全新的数据规范:交通规划数据规范(TPFS),以强化传统 GTFS 在交通规划中的应用,助力更高效、更精准的城市交通管理。



TPFS 通过修改现有数据源和引入新数据源来增强 GTFS,从而提供更全面的数据集。例如,在停车站文件中增加了海拔高度属性,使规划人员能够在分析中考虑地形变化。此外,TPFS 还引入了全新的数据源,如车场目录文件,其中包括公交车场的详细信息,这对高效的车队管理和线路规划至关重要。针对 GTFS 中缺乏乘客数据的问题,我们建议增加一个名为乘客数据文件的新文件,该文件从每个运行方案、日类型和特定区间的站点上下车数据中获取。整合乘客数据可深入了解全天和一周内的需求变化,最终提高服务效率,改善乘客体验,从而加强规划和运营决策。


TPFS 中的数据分为三个不同的类别: 营收性数据、非营收性数据和乘客数据。营收性数据包括与公交车辆载客时经过的站点、路径和行程有关的数据。非营收性数据提供公交车辆在不载客的情况下行驶的轨迹和行程信息,以及有关车辆段等设施的详细信息。乘客数据提供了乘客在站点上下车的数据,为规划人员提供了有关公交使用变化的宝贵信息。


为了说明 TPFS 的实际应用和效益,本文介绍了多伦多公交委员会 (TTC)、约克区交通局 (YRT) 和底特律交通局的案例研究。这些案例研究展示了 TPFS 如何通过提供更丰富、更详细的数据来加强公交规划和运营,从而做出更明智的决策,并最终提高服务质量和效率。


我们讨论了设计数据结构的应用,并介绍了 TPFS 在改善公交运营和规划方面的各种实际用途。TPFS 弥补了 GTFS 的许多不足,增强了司机调度、车场管理、供需分析和基础设施规划等应用的功能。我们提供了一个交通电气化的特殊项目,作为更详细的使用案例,交通机构可借此优化充电站的布局并精确分析能源消耗。公交电气化过程涉及三个关键步骤,如确定高峰服务日、规划充电设施的位置和容量以及了解区间运行模式,所有这些都通过 TPFS 得到简化和实现。


一、引言


1.1

什么是GTFS?


通用公共交通数据标准(GTFS)是一种标准化的数据格式,用于表示公共交通时刻表及其相关的地理信息(Antrim 和 Barbeau,2013;Li 和 Fan,2020)。GTFS被广泛使用,以确保各种应用和服务之间能够轻松共享和使用交通数据。GTFS 中的公共交通数据结构包括多个关键数据组成,例如线路、行程、站点和时刻表(Pereira,Andrade 和 Vieira,2023)。线路和形状文件定义了交通工具所行驶的路径,如图一所示,展示了几个城市的交通布局。


图一、使用GTFS对公共交通的布局进行可视化 


一些基本定义如下。站点是乘客上下交通工具的特定地点。行程代表一辆交通工具沿特定线路行驶的单次旅程,并具有唯一标识符。每趟行程沿着预定的线路运行,每当交通工具在该线路完成一次旅程时,就被视为一趟行程。时刻表文件,也称为“stop_times” 文件,包含每趟行程的详细时间信息。它列出了站点的顺序,并记录了每个站点的预定到达和出发时间。图二 展示了多个城市的线路和站点数量,为比较不同城市的交通系统规模提供参考。


图二   从GTFS中获取公共交通线路和站点的数量


GTFS 提供了一种统一的、开放格式的数据结构。GTFS 的主要优点包括:


标准化格式:GTFS 提供了一个通用的公共交通数据格式,使各机构能够更轻松地共享数据,并确保不同系统之间的兼容性(Fortin、Morency 和 Trépanier,2016)。


兼容性:许多软件工具和应用程序都支持 GTFS,从而允许各机构将数据分享给更广泛的受众,并实现相互可操作性(Kunama 等,2017)。


易用性:GTFS 数据相对简单,技术和非技术用户都能轻松理解,这使其适用于多种应用和分析场景(Wessel 和 Farber,2019)。


开源性:GTFS 是开源标准,促进了交通领域内的创新与合作(McHugh,2013)。


1.2

GTFS 的缺点和不足


构建GTFS 是交通行业向前迈出的重要一步;然而,它也存在一些缺点,阻碍了数据分析效率的提高:


数据结构:GTFS 最初的设计目的是帮助乘客使用现有的交通网络寻找出行路径。然而要满足交通规划的需求,其数据库的结构还缺少一些重要的数据推送(或表格),例如线路版本(形状或模式)、车辆区块以及枢纽站。虽然可以使用现有的 GTFS 数据创建这些目录,但这需要额外的工作和数据验证(Wessel、Allen 和 Farber,2017)。例如,创建线路形状或模式的目录需要将站点时间和行程数据连接起来,并从形状数据中提取线路形状轨迹。该过程还需要进行数据验证并确定关键参数,如首末站、站点数量和线路长度。如果在 GTFS 创建阶段就完成这些工作,将简化终端用户的工作。


数据层:GTFS 侧重于以乘客为导向的数据,缺少非营收信息,例如:

1. 往返车库的连接(进出库)

2. 枢纽站之间的空驶行程

3. 往返服务设施的连接(加油/充电站、休息区)


GTFS 也未包含车库、停车场和司机休息区等非营收基础设施的目录。尽管这些信息存在于交通管理机构的调度系统,但 GTFS 并未提供这些数据。


乘客数据:由于保密性问题以及各机构收集方法存在差异,GTFS 未包含乘客数据(ABUSALIM,2020)。这一缺失限制了全面的数据分析,也削弱了交通数据存储的开源性。


数据准确性:GTFS 数据的准确性不一致,存在以下问题:

1. 在站点时间数据中缺少站点之间的距离和轨迹;

2. 在行程数据中缺少车辆区块;

3. 到达和出发时间不完整或已四舍五入;

4. 计算出的速度不合常理。


在将信息存入 GTFS 数据库之前,必须进行验证和确认,以确保数据的准确性和可靠性,满足终端用户的需求(Farber、Ritter 和 Fu,2016;Braga、Loureiro 和 Pereira,2023;Devunuri 和 Lehe,2024)。


图三展示了 GTFS 的优点和缺点。在接下来的章节中,我们将数据分为三类:营收数据、非营收数据和乘客数据。针对每一类数据,我们将更新部分现有的 GTFS 数据或添加新的数据,以使我们的新数据结构更加全面。


图三、GTFS的优点和缺点


二、营收性数据推送


2.1

运营商目录


GTFS 中的“agency.txt”文件提供了有关负责数据推送服务的公交机构的基本信息,如机构名称、URL、时区、语言和联系信息。然而,它并不包括管理和控制车辆及驾驶员运营的公交公司的具体信息。为弥补这一不足,我们建议在“agency.txt”文件旁边添加一个名为“operator.txt”的新文件,其中包含操作员个人的详细信息,包括姓名、资质和所属机构。包含“operator.txt”的文件将增强 GTFS,即提供更全面的公交系统视图,提高数据准确性和运营透明度。


要包含“operator.txt ”文件,operator_id,operator_name,operator_agency_id等列是必要的。请注意,operator_agency_id 列指的是机构。这种格式既能与机构文件保持一致,又能提供有关操作员个人的详细信息。


2.2

日期类型目录


GTFS 框架中的两个重要文件是“calendar.txt”和“calendar_dates.txt”。这两个文件在定义和管理公交时刻表方面发挥着不同但互补的作用。 “calendar.txt”文件描述了公交机构服务的常规时间安排。该文件中的每个条目都规定了特定服务在规定日期范围内的每周运行天数。TTC 机构就可以被认为成一个研究案例(2024 年 6 月 24 日至 2024 年 7 月 26 日)。如表 1a 所示,“calendar.txt”文件主要用于建立指定时间窗口内公交服务的每周基准运营时间表。而“calendar_dates.txt”文件规定了“calendar.txt”中定义的常规时间表的例外情况。这个文件可用于添加特殊服务日期(如节假日)或删除常规服务日期(如维修工作)。如表 1b 所示,该文件用于管理常规时间表的偏差,使公交公司能够处理特殊活动、节假日和其他不经常的服务。


尽管 GTFS 文件非常重要,但也存在一些挑战和局限性。其中一个重大挑战是很难直接从数据中识别具有类似服务的日期。GTFS 结构本身并不支持根据服务特征对日期进行分组,因此需要进行额外的数据处理和分析。


要按服务对日期进行分类,应进行详细分析,将具有相同积极活跃服务标识符的日期分组。这需要处理“calendar.txt”和“calendar_dates.txt”以得出具有相同服务特征的日期集。这项分析任务可能很复杂,尤其是对于拥有大量复杂时间表的大型公交机构而言。


为了解决目前 GTFS 结构中发现的弱点,我们建议引入两个文件:“day_type.txt”和“date.txt”。这两个文件可以取代“calendar.txt”和“calendar_dates.txt”文件,旨在简化类似服务日期的识别和分组,从而提高探索和分析公交网络和时间表的能力。


“day_type.txt”文件将包含“day_type_id、day_type_short_name和day_type_long_name 等字段。day_type_id 将作为每种类型日的唯一标识符。day_type_short_name 将为日类型提供一个简短的描述性名称,如工作日、周末或节假日。day_type_long_name 将对日类型进行更详细的描述(如表 2a 所示)。


图五、表a) “calendar.txt”文件 和 表b) TTC的“calendar_dates.txt”文件的格式示例



“date.txt”文件将包括日期、天和 day_type_id 字段。日期字段将指定具体日期,格式为 YYYYMMDD,而 day_type_id 字段将参考 “day_type.txt” 中的 day_type_id,指明每个日期的日类型(如表 2b 所示)。通过合并这两个文件,公交公司可以更容易地分类和识别具有相同服务模式的日期。这种结构使公交时刻表分析更加精简高效,有助于更好地了解公交网络。这种方法不仅能解决目前的局限性,还能为未来增强公交数据分析提供一个强大稳固的框架。


图六 表a)"day_type.txt"文件格式示例 和 表b)为TTC提议的"date.txt"文件格式示例


2.3

日期时段目录


GTFS数据格式提供了站点时刻文件中行程内所有连续停靠点的旅行时间,以便对公共交通运营进行详细的时间分析(Prajapati、Bhattarai和Bajracharya,2020)。为了增强时间数据分析的详细程度,我们引入了一个补充文件,称其为日期时段目录(day_period_catalog.txt)。该文件将包含三个基本列:日类型识别符(day_type_id)、日时段识别符(day_period_id)和日时间窗(day_period_window)。day_type_id将对日类型进行分类,如工作日、周末和假日,反映公共交通系统不同的运营动态。day_period_id将为一天中的不同时间段分配唯一的标识符。day_period_window将定义每个时间段的时间边界,例如,0:00-6:00和6:00-8:00,以便更详细地分析不同时间段的公交系统的性能。


这一提议旨在提供一个稳健的框架,以实现更精确的时间分割和分析,这有助于更有效地规划和运营公共交通。


我们以底特律的GTFS(从2024年4月22日到2024年7月15日)为例。通过检查GTFS数据源,我们展示了三种不同的日类型,如表3所示(公交地图,2024b)。城市规划者可以根据个人经验确定日时间段的边界,或使用计算算法来最小化偏差。在这个示例中,我们利用差分进化算法——一种随机的基于种群的优化算法,来解决多维实值函数——来确定每种日类型的最优时间段边界。表4展示了每种日类型的时间段最优边界。


图七、底特律作为案例的的日期类型文件格式示例


图八、底特律作为案例的日期类型时段目录样例


2.4

站点目录


站点文件(stops.txt)包含了有关公共交通系统内停靠站的基本信息,使得我们能够开发公交停靠站映射算法(Vuurstaek等,2020)。该文件中每行条目包括停靠站ID、停靠站名称、停靠站纬度、停靠站经度以及其他相关细节,这些信息描述了每个停靠站的位置和特征。然而,该文件的一个重大缺陷是缺乏爬升数据。缺少了爬升的相关数据,我们难以全面了解每个站点的地形信息,而这对于规划和运营都是重要的。加入爬升数据将使交通路线的建模更加准确,尤其是在丘陵或山区。爬升信息可以提高到达时间预测的准确性,并为坡道和电梯等道路基础设施项目提供支持。


此外,爬升在解决公共交通系统中的能源消耗问题上也发挥着重要作用。海拔变化会影响实际旅行距离和公共交通车辆的耗能。总之,了解沿途的海拔情况有助于优化能源使用、规划更高效的路线,并有效管理车辆速度,从而实现节约成本、减少环境影响和提供更可靠的服务。


2.5

线路目录


GTFS中的线路文件(routes.txt)定义了交通机构提供的所有路线。该文件中的每一行对应一条特定的路线,包含如路线ID、机构ID、路线简称、路线全名、路线描述、路线类型(例如0、1、2)和路线颜色等详细信息,以便于可视化。


该文件提供了关于公共交通出行的可行路线选择的概览,将行程与特定路线连接起来,确保了交通数据的全面性和组织性(Para等,2024)。此外我们建议添加一个名为运营标识符(operator_id)的新列,并将路线类型(route_type)修改为公共交通类型(transit_type)(例如,公交、地铁、铁路),这些特性将提供更多多模式信息,以增强数据的可用性。


2.6

运营时段内的运行模式


GTFS中的形状文件(shapes.txt)描述了车辆所经过的物理路径。该文件中的每一行代表形状上的一个点,通过唯一的形状标识符进行识别,并包含点的纬度、经度和顺序等详细信息。该文件提供了在地图上绘制精确路线的功能,提供了空间参考,这有助于可视化整个交通路线,而不仅限于停靠位置。这提高了交通数据在规划和导航中的准确性和可用性(Pereira、Andrade和Vieira,2023)。然而,我们建议以下修改和添加,以进一步优化该文件。


我们提出一个新术语,模式(pattern)。模式可以理解为具有相同停靠顺序和轨迹的一组行程的代表。每个模式都有一些特征,我们将在以下小节中讨论。


“revenue-pattern_catalog.txt”文件提供运营模式目录信息,描述各个模式的特性。该文件应具有至少四列数据,分别是“线路索引”(route_id),“模式索引”(pattern_id) ,“模式类型” (pattern_type,也称为运营类型),“运行类型”(service_type,例如常规公交运行,大站快线公交运行,短途公交运行,快速公交BRT运行,和深夜公交运行)和“公交车类型”(transit_type)。


“revenue-pattern_catalog.txt”中明确了每条公交线路有多少种运营模式,以及每种模式下的运行类型和车辆类型。同时,我们还额外添加了两列数据,分别是“模式运行长度”(pattern_length)以及“模式公交站点数量”(pattern_stops_number)。这两列数据可以表明每种模式下公交运行的长度和停靠公交站点的数量。



2.6.1 运营模式目录

“revenue-pattern_catalog.txt”文件提供运营模式目录信息,描述各个模式的特性。该文件应具有至少四列数据,分别是“线路索引”(route_id),“模式索引”(pattern_id) ,“模式类型” (pattern_type,也称为运营类型),“运行类型”(service_type,例如常规公交运行,大站快线公交运行,短途公交运行,快速公交BRT运行,和深夜公交运行)和“公交车类型”(transit_type)。


“revenue-pattern_catalog.txt”中明确了每条公交线路有多少种运营模式,以及每种模式下的运行类型和车辆类型。同时,我们还额外添加了两列数据,分别是“模式运行长度”(pattern_length)以及“模式公交站点数量”(pattern_stops_number)。这两列数据可以表明每种模式下公交运行的长度和停靠公交站点的数量。



2.6.2 运营模式路径

原有GTFS格式种的“shapes.txt”文件仅是点位的组合以定义公交线路的地理特征。这种定义方式具有一个局限性,即不包含公交运行线路的公交站信息。这意味着,尽管“shape.txt”文件提供了路线的地理路径,但并未直接将这些路径与具体的站点位置关联。因此,需要进行额外的数据处理,将“ stops.txt” 文件中的公交站点地理信息映射到其在公交路线路径上的相应位置,增加了精准确定每个公交站点在公交路径上位置的难度。以 加拿大约克区13路公交(York Region Transit 13 Bus Route) 为例,在 GTFS 中13路公交线路地理特征数据显示,该路线的路径开始于首个公交站点之前,同时在末站之后仍有延伸(如 图9 所示,Bus Maps, 2024c)。


图九、约克区公交管理部门提供的13路公交线路路径示例


为了解决这一问题,我们设计了一个名为 “revenue_pattern_trajectory.txt ”的新文件。该文件描述了公交线路运营模式的物理布局,包括七列数据:“模式索引”(pattern_id)、“点位维度”(point_lat)、“点位经度”(point_lon)、“点位高程”(point_elevation)、“点位顺序”(point_sequence)、“已行驶距离”(distance_traveled)、“公交站点索引”(stop_id) 和 “公交站点顺序”(stop_sequence)。其中,公交站点索引和公交站点顺序可以用于标识站点在模式路径上的位置。只有在对应某个公交站点时,“revenue_pattern_trajectory.txt”中所包含的点位数据才会在 “公交站点索引”和 “公交站点顺序”列中有相应值。


以 约克区13路公交(卢瑟福路由北向南路线,Rutherford Road – Sb) 为例,该线路从拿帕谷大道 /伊斯灵顿大道(Napa Valley Av / Islington Av) 出发,终点为 伊斯灵顿大道/卢瑟福路(Islington Av / Rutherford Rd),共有 5 个站点。如前所述, GTFS 中公交线路地理数据显示,13路公交路径开始于首个公交站之前,并在末站之后仍有延伸。此外,GTFS 数据中未包含公交站点的坐标信息。在我们设计的“revenue_pattern_trajectory.txt ”中,该公交运营模式开始于首站,结束于末站,同时包含了所有公交站点信息(如 图10 所示)。


图十  改进后的约克区13路公交线路路径信息示例



2.6.3 运营模式公交站点间行程时间

GTFS 中的 “shapes.txt”主要用于可视化公交线路网络,仅为选配性文件。此外,GTFS中的“stop_times.txt” 文件提供了路径顺序中相邻公交站点之间所需行程时间信息。我们设计在新版数据结构时建议除stop_times.txt 文件外,还应将revenue_pattern_trajectory.txt 和 revenue_pattern_stop_times.txt 列为必需性文件。


“revenue_pattern_stop_times.txt”是原GTFS中 “shapes.txt”和 “stop_times.txt”文件的组合,包含四列主要数据:“模式索引”(pattern_id)、“公交站点索引”(stop_id)、“公交站点顺序”( stop_sequence)、和 “已行驶距离”(distance_traveled)。这四列数据可以用于确定每种运营模式中的站点及其顺序。尽管我们可根据“revenue_pattern_trajectory.txt”文件中的信息推导出公交站点及其顺序,但 “revenue_pattern_stop_times.txt”文件能够更明确地提供每种运营模式中公交站点的位置和排序。“revenue_pattern_stop_times.txt”中还应包括其他数据列,即 “记录日期类型索引”(day_type_id) 和“记录当日时段类型索引”( day_period_id),用于表示不同日期和不同当日时间段内的连续公交站点之间的平均行程时间。最后,我们提出一个名为 run_time 的数据列,包含连续公交站点之间的运行时间。


生成 “revenue_pattern_stop_times.txt ”文件涉及下述几个关键步骤。


第一步是将日期分类为不同类型。确定日期类型后,为每种日期设立最合适的当日时段分类。当日时段指的是一天中的特定时间段。当日时段可以通过预设规则手动确定,或通过优化算法分析数据来寻找最佳划分。优化当日时段划分可以基于多种指标,可以利用公交线路的行程时间变化为依据,或者可以结合乘客数据进行综合考虑。


确定单日时段划分后,下一步是计算每种公交运营模式在每个时段内连续站点之间的平均运行时间。这个平均值的计算需要考虑在同一时间段内遵循相同模式的所有公交车的行程时间记录。


图十一以美国底特律市9路公交为例,展示了由杰弗逊&雷克普安特(Jefferson  &  Lakepointe )至罗莎·帕克斯公交枢纽下客区(Rosa  Parks  Transit Center – Deboarding)的运行模式。图十a为总体公交信息,图十b显示了该运行模式的地理布局。 图十c为已经划分出的三个单日时段。下一步是为每个单日时段内的每种运营模式计算连续站点之间的平均行程时间。


图十一-a、数据概况


图十一-b、9路巴士线路图


图十一-c、9路巴士在不同日期类型的行程时间


2.7

运营行程目录


GTFS 中的行程文件定义了公交系统中每条路线的单独行程。行程文件中的每一行都包含了行程识别号,线路识别号和时刻表版本等详细信息,也可以增加行程枢纽站,方向和地理信息号等额外信息。此外,GTFS中的站点时间文件详细说明了每个行程的站点,给出了每个站点的预计到达和发车时间。站点时间文件中的每一行都包含行程识别号、停靠点识别号、站点停靠顺序、预计到达时间和离开时间。站点时间文件对于构建准确的时刻表、实现精确的行程规划以及确保公交运营准点率非常重要。


我们建议将行程文件和站点时间文件合成一个对交通规划师特别有用的新文件。我们建议新文件命名为运营行程目录(c),其中包括行程识别号,行程类别(营收行程),pattern_id,日期类型识别号,运营高峰段识别号,预计到达时间,发车时间和车辆识别号。GTFS中不同的日期类型识别号可能指向同一个行程识别号,但在我们的文件中,每个行程只关联一个运营日识别号。


2.8

车辆目录


GTFS中的行程文件提供了每个行程的车辆识别号。但是,行程文件有一些局限性。不同的日期类型识别号可能指向同一个车辆识别号,并且车辆特征或车辆服务起始站点和结束服务的站点的信息。为了解决这些问题,我们建议添加一个名为车辆目录的新文件,记录车辆识别号,公交类别,车辆类别识别号,日期类别识别号和车库识别号。


2.9

车辆类别目录


GTFS目前没有提供有关公交服务车辆的详细信息。为了解决这个问题,我们建议在数据库中添加一个名为车辆类别的新文件。车辆类别文件将包括车辆类别识别号,车辆名称,公交类别(例如公共汽车、地铁、有轨电车等)、发动机类别(例如柴油、电动、天然气、混合动力等),车辆尺寸(例如普通公交车、大型客车等)、座位数和额定最高载客量。车辆类别文件提供的车辆详细信息丰富了GTFS的信息,这些信息可以解决运营规划、资源分配、需求分配等问题,还能分析车辆拥挤度,评估服务指标。这一新功能使公交规划和数据分析更加细致,从而提高公共交通系统的效率和效力。


我们能找到一些公交公司车辆类型的信息渠道。例如,2024年6月2日的数据显示,多伦多公交公司现有2418辆公交车(公交车/残疾人公交车)、214辆有轨电车和847节地铁车厢(多伦多公交公司,2024年)。图十二总结了多伦多公交公司旗下的公交模式信息。但是,网络上的数据常常有错误、不完整或是已经过时了。因此,公交公司应该通过车辆类别目录文件提供更最新最准确的信息。


图十二、多伦多公交公司车辆类别的样本数据


三、非运营时段的数据推送


3.1

后勤设施目录


城市中与交通相关的后勤设施的存在对公共交通规划和管理起着重要作用。维修站、充电站、加油站、停车场、司机餐厅和司机的休息区等设施对于优化公共服务的规划和调度至关重要。为了有效地将后勤设施数据与公共网络合并在一起,我们建议创建一个名为后勤设施目录的文件来提供这些设施的详细信息。后勤设施文件将包括设施识别号,设施类别,设施地理位置和设施描述等信息。鉴于车辆段的重要性,我们建议将车辆段信息纳入一个新文件,而后勤设施文件将包含除了车辆段以外所有后勤设施的信息。


将公交后勤设施的信息纳入数据库可以极大地帮助交通规划人员优化运营、协调不同交通模式的时间表、改善服务质量、提高可达性和可靠性、支持可持续的交通计划以及改善战略规划(Villwock-Witte & van Grol,2015;Malekzadeh & Chung,2020;Ghafouri-Azar 等,2023)。


3.2

非运营模式轨迹


每辆车在运营班次的开始或结束时,都会存在一种需要空车行驶的情况。了解这一点有助于我们计算每辆车在每个班次中行驶的确切距离和时间。我们建议新增一个名为 “非运营模式轨迹.txt”的文件,其中包含以下列:运行模式识别号、运行模式类型、位置经度、位置纬度、位置海拔、位置顺序、行驶距离。“运行模式类型”这一列属性将非运营模式分类为以下三种类型之一:推出(车辆从车场出发前往枢纽站开始载客服务时)、中途空驶(车辆在枢纽站之间空驶或前往加油站等设施时),以及入库(车辆完成运营后返回车场时)。这种非运营模式轨迹文件的结构与运营文件结合使用,将使我们能够准确计算每辆车在每个班次中,包括运营和非运营活动所行驶的距离和所花费的时间。


3.3

非运营行程目录


类似于“运营行程目录”,我们需要新增一个文件来代表车辆没有载客时运行的行程。我们提出了 “非运营模式目录” 文件,其中包含以下列:trip_id、trip_type、pattern_id、日期类型识别号、时段类型识别号、开始时间、结束时间 和 车次识别号。


3.4

班次全描述


在前几节中,我们讨论了运营和非运营行程及模式。在本节中,我们引入一个新文件,名为 block_full_description.txt,该文件提供每个班次的运营和非运营行程的顺序。文件包含四列:第一列是 block_id,第二列是 trip_type(运营行程或非运营行程),第三列是 trip_id,最后一列是 trip_sequence。图十三展示了一个全周期班次操作的示例。


图十三、一个区块操作的完整周期示例


3.5

车场目录


GTFS 目前缺乏关于车场的信息,而车场是所有车辆开始和结束服务的关键地点。为了解决这个问题,我们建议在 GTFS 数据集内新增一个名为 `depot_catalog.txt`(车场目录.txt) 的文件。该文件将包括以下几列:depot_id(每个车场的唯一标识符)、transit_type(车场服务的交通类型,如公交车、地铁、有轨电车等)、depot_name、depot_lat 和 depot_lon 以及 depot_capacity(车场容量,指车场可容纳的车辆数量)。新增 `depot_catalog.txt` 文件可以提供关于车场的必要细节,进而改善运营规划、车辆调度和整体交通服务管理,增强 GTFS。


图十四   TTC车库位置的地理示意图


四、乘客数据


乘客数据,包括在车站上下车的乘客统计,为需求模式提供了重要的洞察,帮助交通机构优化路线、时间表和资源。如果能够获得乘客数据,交通规划者就可以提高服务的效率、可靠性和整体乘客满意度。将乘客数据整合到规划过程中,使机构能够更好地满足通勤者的需求,并提升提供给社区的公共交通服务质量。


整合上下车数据和载客率对于有效确定满足需求所需的车辆容量至关重要。图十五展示了两个不同路线在特定时间段内的上下车和在车载客数据。两个路线的停靠站数量相同,最大在车载客量也相同。然而,载客量的分布布局在这两种情况下显著不同。


在图十五a中,载客率在大多数停靠站保持一致的高水平,峰值载客量需要在整个路线运营超过40名乘客容量的车辆。由于持续的高载客量,整个路线必须运营更大容量的车辆以满足需求。相比之下,图十五b中的载客数据在10到15号停靠站之间显示出一个明显的峰值,随后在后续停靠站出现急剧下降。这种分布表明,虽然在10到15号停靠站之间使用高容量车辆是有益的,但其他停靠站可以使用较小的车辆,以优化运营效率并降低成本。图十五强调了乘客数据在路线管理和车辆分配中的重要性。


图十五-a、车辆载客峰值较为均匀的路线 A示意图

图十五-b、车辆载客峰值波动剧烈的路线 B示意图


五、数据应用场景


TPFS 引入了一系列功能,显著增强了交通规划和运营能力,解决了 GTFS 的局限性。通过这些改进,交通机构能够优化其服务,更高效地管理资源,并改善整体乘客体验。TPFS 超越了 GTFS 的局限性,在车场管理、供需分析和基础设施规划等方面提供了更强的功能。这些改进使交通运输机构能够优化其服务、更有效地管理资源并改善整体乘客体验。它还有助于公交车电气化工作,使交通运输机构能够优化充电站的位置并精确分析能源消耗。在下文中,我们将简要讨论 TPFS 的一些应用,然后在单独的小节中详细阐述 TPFS 在网络规划和场景分析以及公交车电气化领域的应用。


在车库管理和车辆调度方面,GTFS 的不足之处在于提供的车辆车库信息有限,而这些信息对于车队管理至关重要。TPFS 用一份全面的车库目录填补了这一空白,该目录包括车库位置、容量和车辆类型的详细数据。这使交通运输机构能够优化车辆调度,最大限度地减少停机时间,并确保车辆被分配到最合适的路线。非营利行程数据的加入进一步增强了管理营利和非营利车辆流动的能力,从而提高了运营效率。


供需管理可以受益于TPFS 包含详细的客流量数据。虽然 GTFS 无法提供有效管理客流量和解决拥挤问题所需的精细度,但 TPFS 详细的客流量数据与 `revenue_pattern_stop_times.txt` 文件相结合,使交通运输机构能够实时监控客流量并根据需要调整服务水平。通过分析拥挤发生的地点和时间,机构可以部署更多车辆、调整时间表或修改路线以缓解拥堵。这为乘客带来了更舒适、更高效的交通体验,直接解决了城市交通系统面临的一个关键挑战。


在交通工具开发领域,GTFS 基本数据结构限制了创建高级分析工具的潜力。TPFS 拥有全面而详细的数据集,支持开发精细化的交通规划和运营工具。这些工具可以利用 TPFS 数据深入了解乘客模式,优化路线规划并提高服务交付,进而提高交通机构的运营效率和乘客整体体验。


关于能源管理和环境影响分析,GTFS 缺乏有关车辆推进类型和路线特定能源消耗的详细数据,因此很难评估和优化整个交通网络的能源使用。TPFS 通过包含一个包含车辆动力信息(例如柴油、电动、混合动力)的“vehicle_type.txt”文件和一个包含海拔数据的新“revenue_pattern_trajectory.txt”来解决这个问题。这些新增功能使交通机构能够根据路线特征、车辆类型和地形挑战更准确地模拟能源消耗。机构可以使用这些数据来优化路线以提高能源效率,减少燃料消耗和排放,并为环境可持续性计划做出贡献。


GTFS 提供基本的路线和站点数据,但缺乏长期基础设施规划所需的深度。TPFS 包含详细的站场、站点和技术对象目录,支持做出更好的基础设施投资决策。例如,TPFS 中高程数据与站点位置的集成可以帮助确定需要改善基础设施(例如坡道、电梯或加固路面)的区域。此外,“technical_object.txt”文件可以纳入充电站和维修站等设施,从而促进新基础设施项目或现有设施升级的全面规划。


5.1

网络规划和场景分析


在进行网络规划和场景分析时,我们会考虑三个关键要素:站点、行程和路线。对于每个要素,都可以评估不同的场景,例如移除或重新定位站点、调整出行班次或添加新路线。在此应用中,GTFS 和 TPFS 之间这些数据的可用性和质量存在很大差异。虽然 GTFS 提供了一些基础信息,但 TPFS 提供了更全面的数据集,可以进行更深入的分析和更明智的决策(图十六)。


在站点方面,规划人员可能需要移除需求低的站点、重新安置现有站点或增加新站点以更好地服务乘客,我们需要了解客流量变化及其对整个网络的影响。TPFS 提供全面的客流量数据,使规划人员能够评估站点是否表现不佳或服务变化是否可以提高性能。然而,GTFS 缺乏这种程度的细节,使得此类决策更具挑战性。


就出行而言,要做出有关班次调整的明智决策(是否增加还是减少高需求或低需求路线上的班次),需要用到TPFS 乘客量和车辆类型数据。例如,如果某个路线在高峰时段出现拥挤,规划人员可以使用 TPFS 来确定可用的车辆类型以及是否可以部署更多车辆以降低负载率。相比之下,由于GTFS 没有提供足够的车辆类型或载客量信息,无法在这些情景下实现。


5.2

公交线网规划与情景分析


在进行公交线网规划与情景分析时,我们会考虑三个关键要素:车站、行程和线路。针对每个要素,可以评估不同的情景,例如移除或迁移车站位置、调整行程频率,或新增线路。在此应用中,GTFS 和 TPFS 提供的数据在可用性和质量上存在显著差异。尽管 GTFS 会提供一些基础信息,TPFS 则涵盖了更为全面的数据集,从而支持更深入的分析和更加明智的决策(见图十六)。


在车站方面,规划者可能需要移除低需求的车站、迁移现有车站或增加新车站,以便更好地为乘客服务。因此,我们需要了解客流量的变化及其对整体路网的影响。TPFS 提供了全面的客流量数据,使规划者能够评估某个车站是否表现欠佳,以及通过调整服务是否能提高其效率。然而,GTFS 缺乏这种细致的信息,使得此类决策更具挑战性。


就行程而言,要对发车频率调整做出明智的决策——无论是增加还是减少高需求或低需求线路上的班次,都需要获取TPFS的客流量及车辆类型数据。例如,如果某一线路在高峰时段出现拥挤情况,规划师可以利用 TPFS 来确定可用的车辆类型,以及是否能够增加车辆以降低满载率。相比之下,GTFS 在车辆类型和满载率方面提供的信息不足,这限制了其在这些情境中的实用性。


此外,在设计新的公交线路时,尤其是在公交密度较低的地区,TPFS 提供了有关营收和非营收路线的重要数据,以及有关车场、加油站或充电站等设施的位置信息。这些数据不仅能确保新线路的有效布局,还能得到现有基础设施的良好支持。此外,规划师可能需要考虑将一条线路分为两项不同的服务,例如常规线路和快速公交线路,以满足高需求路段的需求,同时保持对低需求路段的服务。如图8底部所示,GTFS 仅提供有关营收路线的部分信息,缺乏成功实施线路规划所需的非营收路线、客流量、设施特征和车辆规格的数据。


总体而言,TPFS能够支持公交线网规划的关键部分,如修改车站位置、调整行程频率和设计新路线。通过提供有关客流量、车辆类型、车场特征和设施的准确数据,TPFS使公共交通机构能够做出基于数据导向的决策,从而优化服务交付。相比之下,GTFS 的局限性要求依赖额外的数据来源,这使得规划过程变得复杂,并在非营收数据和车辆规格等领域留下了空白。


图十六、网络规划和场景分析: TPFS vs GTFS



5.3

公交电气化


与GTFS相比,TPFS 在公交电气化方面具有显著优势。GTFS缺乏有效规划电动公交车及其相关充电基础设施部署所需的详细线路和站点数据。相比之下,TPFS提供了更丰富的路线轨迹、站点位置和海拔信息,使得电动公交运营的规划更加精确。这不仅有助于战略性地布局充电站,还能确保电动公交车具备足够的能力以高效运营,从而促进公交车队向可持续发展的平稳过渡。


我们将公交电气化问题分解为几个关键步骤,并讨论TPFS和GTFS如何提供必要的数据。所需的输入数据将被分为三个子类,如 图十七 所示。


第一个子类涉及时刻表数据。确定最繁忙的日期至关重要,这样能确保我们的分析涵盖最坏情况下的场景—即当公交线网在最大负荷下运行,行程和车辆数量达到最高时。虽然GTFS可以提供这种数据(灰色部分所示),但要识别具有相似服务模式的日期,需要经过多个步骤,过程较为繁琐。而TPFS 通过直接提供日期类型数据(绿色部分所示)简化了这一过程,使得识别高峰服务日变得更加容易。


第二个子类涉及充电设施。为了有效规划公交电气化,我们需要详细了解充电设施的位置及每个充电器的容量。GTFS并不提供这些信息(如图十七中的红色部分所示)。然而,TPFS弥补了这一空缺,通过技术目标文件包含的充电设施位置及其特征,使基础设施规划变得更加便捷。


图十七、公交电气化问题所需的输入数据


第三部分涉及与街区相关的信息。对于公共交通电气化,全面了解街区运营(包括营利性和非营利性路线、车辆类型和容量、负载系数以及路线特征,包括布局和海拔剖面)至关重要。GTFS仅提供营利性路线和基本路线布局的数据。相比之下,TPFS提供了一个全面的数据集,包括所有必要的信息,确保公共交通机构拥有有效规划和运营所需的一切数据。


公共交通电气化的挑战最近引起了广泛关注,许多公共交通机构正在寻求从柴油车过渡到电动车辆的最佳方式。如果每个机构独立行动,整个过程将需要大量的精力和资金。然而,通过发布所有与公共交通电气化相关的数据,TPFS为研究人员和第三方开发者提供了宝贵的机会,以便分析不同城市、识别挑战并得出见解。然后,公共交通机构可以利用这些研究结果,以最小的努力和资源迈向更加绿色的城市。


值得注意的是,已经开发了多种工具来应对类似的挑战。例如,WSP的电池优化和生命周期工具(BOLT)提供了一个强大的仿真平台,用于模拟重型电池电动公交车(BEB)车队的运营。BOLT帮助政府机构和公共交通运营商快速识别电气化的最佳路线,同时分析车库的能源消耗。它能够模拟各种电气化场景,结合影响BEB或BEV(电池电动车)车队调度运营的关键因素,如能源消耗、续航性能和生命周期运营成本。接下来,我们将详细介绍PowerTransit Pro工具,因其独特的特性及其专注于优化路上充电计划,同时最大化车队电气化效率。


PowerTransit Pro工具由交互式运营研究团队开发。PowerTransit Pro是一个强大的平台,旨在最大化电气化公交车的数量,同时优化它们的沿途充电计划,并遵守诸如每个站点的充电接口数量有限、电池容量、最低安全电量和可用充电时间等实际运营的约束条件。该工具提供了车队性能、各站点的充电概况以及每辆车的充电计划的全面汇总。


该工具的可视化设计为公共交通规划人员提供了一个清晰、交互式的数据展示,使他们能够测试不同的情景并就公交车电气化和充电站点布局做出明智的决策(图十八a)。充电使用概况突出显示了公交车在停车期间充电站点的使用效率,允许规划人员在高峰和非高峰时段优化充电计划(图十八b)。此外,针对优化后的公共交通,能耗概况和道路坡度变化提供了对不同公交路线上的能源需求和运营挑战的更深入见解。


图十八-a、PowerTransit Pro的曼哈顿案例


图十八-b、在Hamilton区域内的优化结果


该工具具有高度的可扩展性,已经为一些机构开发了定制版本,如GO Transit、华盛顿大都会区公共交通网络、Hamilton街道铁路交通和纽约MTA城市公共交通网络(图十九)。目前,PowerTransit Pro依赖于GTFS数据和各种API来收集所需的输入数据。GTFS提供了街区布局和营利性路线的基本信息。然而,为了完全发挥作用,该工具还需要收集关于非营利性路线及其轨迹的信息,以及现有充电设施的数据,这些需要通过API或其他外部来源获取。


图十九、PowerTransit Pro的概览和结果:(a)华盛顿都市圈公共交通网络,(b)Go公共交通网路,(c)Hamilton街道铁路公共交通网络,(d)纽约MTA城市公共交通网络


随着TPFS的发展,PowerTransit Pro将能够直接从单一的综合数据源获取所有所需数据。TPFS包括关于非营利性路线、轨迹和充电设施的详细信息,消除了对外部API或数据源的需求。


这种集成为评估和优化全球各城市的公交车电气化提供了重大机会,使PowerTransit Pro在支持可持续城市交通的任务中更加高效和全面。


六、结论


本白皮书概述了在公共交通规划中引入新的数据规范的必要性,提出了比现有的通用公共交通数据规范(GTFS)显著改进之后的公共交通规划数据规范(TPFS)。新的和修改后的数据流被分为三个主要类别:收入相关数据、非收入相关数据和乘客量数据。通过提供更详细和全面的数据,TPFS帮助在公共交通领域做出更为明智的决策和规划。类似于展示GTFS数据流之间关系的方式(Prommaharaj et al.,2020),我们在图二十中展示了新数据结构中的数据源关系。


来自多伦多交通委员会(TTC)、约克地区交通局(YRT)和底特律交通局的案例研究,突显了采用TPFS的实际应用和优势。这些案例展示了TPFS如何通过提供更丰富的数据来改进公共交通的规划和运营,从而为乘客提供更好的服务,并提高交通管理机构的运营效率。


所提出的TPFS为公共交通数据管理提供了一个前瞻性的方案,旨在解决GTFS的局限性,并为交通规划人员提供更健全的框架。通过利用TPFS加强的数据能力,交通管理机构可以做出更明智的决策,优化其运营,并最终为用户提供更高质量的服务。


 图二十、所提出数据结构中各数据源之前的关系


THE

END



我们为本文提供的免费下载资料有:


1.《交通规划信息流规范:为交通规划人员升级 GTFS》


请联系我们微信号@Citipedia

或电邮daizongliu@qq.com索取


可持续城市与交通

一览众山小



2024年,与我们来一场步履不停的旅程

In 2024, join our endless journey

En 2024, participez à notre voyage sans fin

2024年、私たちと絶え間ない旅に出かけよう

En 2024, únete a nuestro viaje interminable.

في عام 2024، انضم إلى رحلتنا اللانهائية.

2024, ร่วมเดินทางกับเราในการผจญภัยที่ไม่มีที่สิ้นสุด

2024, எங்களுடைய நிரந்தர பயணத்தில் சேருங்கள்.






一览众山小-可持续城市与交通


我们 | 作为独立的专业志愿者团体

秉承 | 专业理想与价值观

信守 | 非营利原则

愿景 | 帮助中国城市可持续发展

关注 | 城市、交通、大数据与气候

至今 | 遍布全球1000名志愿者网络

推送 | 近4000篇原创专业译文

感谢 | 过去10年多来您的支持

报名 | 后台留言关键词“志愿者”了解



2014-2024 © 转载请注明:

转载自公众号“一览众山小-可持续城市与交通”

一览众山小-可持续城市与交通
我们是独立的专业志愿者团体,秉承专业理想与价值观,不依托任何机构,信守非盈利原则,帮助中国可持续发展。我们关注的领域包括城市规划、城市交通、城市设计、量化城市等。作为公众号最大的专业志愿者平台,我们感谢您的关注和支持,并欢迎您的加入!
 最新文章