阅读今日所有推文,汇聚好运召唤神龙
Fighting,小侠客们好呀,今天的侠客主题是<臻享数据集>合集之——AI+新能源充电桩数据集。在信息爆炸时代,数据是无处不在且不可忽视的重要资源,并且成为驱动创新和决策的关键要素。算法模型的成功与否,很大程度依赖于数据的质量和多样性。无论是数据分析、论文验证还是模型开发,<臻享数据集>合集旨在沉淀多维度、高广度、高质量的臻享数据资源,聚焦于最新最完整的垂直领域优质AI数据集,为您提供最强大的基础数据集支撑。文末均附有数据提取码,合集已发表数据集如下:1. AI+新能源电池数据集
2. AI+新能源汽车数据集
3. AI+新能源风电数据集
4. AI+新能源光伏数据集
5. AI+新能源微电网数据集
6. AI+电力智慧检测数据集
7. AI+遥感电力设施检测数据集
8. AI+红外电力设施检测数据集
9. GEFCom全球能源预测数据集
10. 新加坡统一负荷与电价数据集
11. 澳大利亚气象与光伏数据集
12. 中国台湾城市栅格气象与风光发电量数据集
随着我国新能源汽车市场的蓬勃发展,充电桩的需求量日益增加,充电桩的智能化程度不仅影响充电站运营商的经营效益,也大大影响着用户的充电体验。AI技术可以涵盖充电站/充电桩从车辆进场、充电中、充电完成离场的全流程算法方案赋能;AI预测性维护技术可以对充电桩进行实时感知,进行相应的预测并发出警报;AI时空预测技术还可以建模充电桩使用电量,提高充电桩的使用率。
AI+新能源充电桩可以促进充电桩领域的人工智能技术产、学、研、用协作,引领行业技术创新,助力新能源充电桩的高质量发展,进一步推广人工智能与充电桩领域的融合创新应用。因此小编在这里整理了一份AI+新能源充电桩数据集,共包含7+细分场景数据集,助力AI+新能源充电桩领域的研究与创新。来吧,涨涨姿势~1. California EV Charging Dataset
2. South Korea EV Charging Dataset
3. 深圳市充电桩时空需求数据集
4. 广州市充电桩占用率数据集
5. 新能源充电桩故障检测数据集
6. 居民家用新能源充电桩数据集
7. 新能源充电站负荷预测数据集
California EV Charging Dataset【数据背景】Palo Alto EV充电站数据集提供了加利福尼亚州帕洛阿尔托市电动汽车(EV)充电站的使用模式数据,研究人员可以利用该数据集研究收费行为,开发预测模型,并提出优化充电站放置的策略。企业可以使用数据来确定扩大充电基础架构并改善用户体验的机会。Palo Alto EV充电站通过数据驱动的方法来支持EV基础架构计划和管理,从而支持可持续的移动性计划。它使利益相关者有能力做出明智的决定,增强电动汽车充电生态系统,并为更广泛的电动汽车采用,以实现更绿色可持续的未来。EVChargingStation.csv:数据文件夹
eda-evchargingpaloaltoca.ipynb:eda分析【数据说明】包括有关充电站位置的详细信息、可用的充电连接器类型、充电会话持续时间、能源消耗和其他相关指标,使用户能够分析趋势,确定峰值使用时间,评估基础架构性能以及开发数据驱动的解决方案,以提高EV充电服务的效率和可访问性。EVChargingStation.csv将每个充电会话的所有字段数据存档为单个数据点,数据收集开始日期为2011年7月29日,结束日期为2020年12月31日,数据持续时间达9年多,所有可用数据都以逗号分隔值(csv)文件的形式逐行保存,所包含的主要数据字段如下所示:1. Station Name:充电站名字;
2. MAC Address:充电桩的MAC地址;2. Org Name:城市名字;
4. Start Time Zone:进行充电所在的时区;6. End Time Zone:结束充电所在的时区;7. Transaction Date (Pacific Time):交易时间(太平洋时间);8. Total Duration (hh:mm:ss):充电会话的总持续时间;9. Charging Time (hh:mm:ss):充电持续时间;10. Energy (kWh):充电会话的能源消耗量;11. GHG Savings (kg):温室气体储蓄(单位kg);12. Gasoline Savings (gallons):汽油储蓄(单位加仑);South Korea EV Charging Dataset【数据背景】这里公开了一个超大体量的电动汽车充电交易数据集,可以用于从电动汽车充电桩和用户角度进行多方面分析。整个数据集收集的来自2238名电动汽车用户和2119个充电桩的72856例充电会话。数据集包括充电运营公司年度商业运营期间发生的整个会话,具体包括标识符、充电桩位置、充电桩类别等。该数据集可用于电力系统和市场的多种运作方式,包括电动汽车充电服务业务、充电桩安装选址、充电需求交易以及电动汽车相关基础设施的长期投资规划等等。ChargingRecords.csv:充电会话数据
- Data ststistics (EV charging sessions).R- Plotting charging probability profiles (EV charger).R
- Plotting charging probability profiles (EV user).R
- Data generation (departure time, arrival time).Rs41597-024-02942-9.pdf:数据集参考论文
【数据说明】整个数据集包括2337个电动汽车用户、2119个充电桩和72856个充电会话。数据集以逗号分隔值(CSV)的形式提供。特别的是,ID记录为0的电动汽车用户指的是本研究中未订阅商业运营公司的客户。由于数据的预处理方法需要根据各种研究目的加以应用,因此这里提供的是未经预处理的原始数据。数据集共包含16列,包括ChargingsessionID、UserID、ChargerID、ChargerCompany、Location、ChargerType、ChargerCapacity、ChargerCDC、StartDay、StartTime、EndDay、EndTime、SrartDatetime、EndDatetime、Duration和Demand,行数对应于独立会话的数量,包括2021年9月30日至2022年9月31日各充电桩商业运营期间发生的所有充电会话。具体地,CSV包含的数据字段如下所示:1. ChargingsessionID:充电会话ID;2. UserID:用户ID,其中0表示其它公司用户,1–2337表示公司用户;4. ChargerCompany:充电桩公司标识,0表示其它,1表示本公司;5. Location:充电桩安装位置的地点类型(包含accommodation、apartment、bus garage、camping、company、golf、hotel、market、public area、public institution、public parking lot、resort、restaurant和 sightseeing);6. ChargerType:充电桩类型,1表示快充,0表示慢充;8. ChargerACDC:充电桩类型,AC/DC;9. StartDay:充电桩会话的起始日期,格式为YYYY-MM-DD;10. StartTime:充电桩会话的起始时间戳,格式为HH:MM:SS;11. EndDay:充电桩会话的结束日期,格式为YYYY-MM-DD;12. EndTime:充电桩会话的结束时间戳,格式为HH:MM:SS;13. StartDatetime:充电桩会话起始时间的完整时间戳,格式为YYYY-MM-DD HH:MM:SS;14. EndDatetime:充电桩会话结束时间的完整时间戳,格式为YYYY-MM-DD HH:MM:SS;15. Duration:充电桩会话持续时间,单位为min;16. Demand:充电会话的电动汽车充电量,单位为kWh。下图为每个充电桩安装位置的每日耦合概率估计。安装在accommodation、apartment、hotel、camping和resort等地点的充电桩往往在晚上和晚些时候充电,其它地点往往在白天有充电行为。
如下图所示,一周中各天的充电模式都非常相似,但bus garages除外,它们只有零星的充电模式。此外,company、public institution和apartment都有工作日周末模式。
【数据背景】充电需求时空预测已受到越来越多的研究关注,尤其是智能充电桩领域,因其提供的未来信息能够很好地帮助政策制定。随着近年来电动汽车保有量的爆炸性增长,电动汽车充电需求的时空预测却缺少一个数据质量良好的城市级别数据集,导致在该方向上的很多重要研究(比如动态充电定价、充电桩推荐等等)受到了阻碍。为了填补这一研究空缺,这里收集和整理了一个来自深圳市18061个公共充电桩的时空需求数据集。Data Files
- adj.csv
- distance.csv
- information.csv
- occupancy.csv
- price.csv
- time.csv
- Shenzhen.qgz
【数据描述】数据采集来自深圳市18061个公共充电桩一个月(2022年6月19日—2022年7月18日)的使用记录 。在时序维度,数据集的时间颗粒度为5min,共有8640个时间戳。在空间维度,它覆盖了深圳市的247个交通区域(节点)及其 1006条相邻关系(边)。此外,该数据集还包括了各个区域所采用的充电定价方案:在这247个交通区中,有57个(红线框内)采用分时段收费方案,其它则采用固定收费方案,更多详情见下表。Datasets共包含7份CSV数据文件,所记录的具体数据如下:
1. adj.csv:研究区域的相邻矩阵,1表示两个交通区域相邻,反之不相邻
2. distance.csv:节点之间的距离
3. information.csv:数据基本信息,包括桩容量、经度、纬度、是否位于中央商务区(1:是,0:否)以及是否基于时间定价方案(1:是,0:否)
4. occupancy.csv:研究区域的实时电动汽车充电占用率
5. price.csv:研究地区的实时电动汽车充电定价
6. time.csv:研究期间的时间戳
7. Shenzhen.qgz:深圳市QGIS地图文件,存储的是深圳市交通小区数据,使用免费轻量版工具QGIS即可打开。
这项研究中使用的数据来自可用的移动应用程序,该应用程序提供了充电桩的实时可用性(即是否闲置)。在中国深圳,2022年6月19日至7月18日(30天)的研究期间,总共涵盖了18061个充电桩,同时收集了充电桩的定价方案。出于分析目的,将数据组织为充电需求和充电价格,每5min就会对深圳247个交通区进行数据记录。从空间的角度来看,所有研究的交通区域都与相邻的社区连接,以形成具有247个节点和1006个边缘的图数据集。从时间的角度来看,总共8640个时间戳的评估数据分为训练,验证和测试集,其比例为6:2:2。此外,每种方法都配置为单独运行,以支持在4个不同的时间间隔(即15、30、45和60分钟)中预测充电需求。
下图为基于该数据集的IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS已发表顶刊论文2309.05259.pdf,所提出的PAG算法,它是一种具有物理信息和基于注意力的预测模型,用于电动汽车充电的时空需求预测,预测还包括其它代表性方法如LSTM,GCN-LSTM,GAT-LSTM。我们还可以通过以下程序命令训练和测试模型:
1. 在main.py的第45行中选择模型,或通过跳过此过程来使用默认模型(PAG);
2. 通过pycharm等运行main.py或更改root_path和命令:cd [path] && python main.py。
【数据背景】电动汽车数量的快速增长导致了各种与充电相关的问题,如公共充电桩短缺、寻找可用充电桩的不便、不必要的巡航搜索可用充电桩导致的额外交通拥堵等。由于仅建造新的充电桩可能无法显著提高充电效率,因此预测充电站占用率的方法作为解决这些问题的有效手段被广泛讨论。然而,在利用分布式数据训练高效模型、提高收敛速度和增强模型泛化能力方面遇到了一些挑战。Dataset
- guangzhou
-- test
--- 89086.xlsx
--- 89449.xlsx
--- ......
--- 89453.xlsx
-- train
--- 26323.xlsx
--- 26898.xlsx
--- ......
--- 88842.xlsx
- shenzhen
-- test
-- train
Charging-TWAFR-GRU:参考项目代码Charging-Occupancy-Prediction.pdf:数据集参考论文【数据说明】数据集包括中国广州35个充电站的充电桩占用率数据,其地理分布如下图所示:该数据集的占用数据跨度为2021年12月10日至2022年1月7日,数据起始日期为2021年12月10日0点0分,数据结束日期为2022年1月7日23点55分,分别使用充电站id命名的xlsx格式的数据表保存充电站占用率数据,所有可用数据均逐行保存,数据间隔为5min,每个充电站有8352条占用记录,因此总共约有30万条记录,占用率可以通过工作充电桩数量/充电桩总数计算得到,每个数据表所包含的具体数据字段如下所示:1. time:数据时间戳,格式为YYYY-MM-DD HH:MM:SS;
3. total:充电桩总数;