今晚内容稍硬核,是作为一个大数据分析的尝试,欢迎指正。
前段时间我尝试用爬虫把广州市区所有巴士线路(除夜间线路)全部爬取了下来,共有673条线路上下行站点,得出一个超10万条记录的数据库,用Pandas大数据工具做了一些分析,试试画出宏观的广州巴士线网热点图。
如果以每五个连续站点作为一个公交覆盖区域来分析,得出以下市区前5的公交密度区域:
第三名 "棠下,三元里大道中,棠溪,三元里大道北"区间。 这个区域有16条公交线路覆盖,相当夸张;
第二名 "怡乐村,省荣军医院,中山大学,康乐村,鹭江 ), 有16条巴士线路覆盖;
第一名 "石牌村,国防大厦,华侨医院,员村山顶" ,足足有19条巴士线路覆盖;
这个覆盖率是不是和你预期是一样?
后话:
有感兴趣的小伙伴,我可以共享这个分析的代码和数据库一起玩玩