哪个城市是中央眼中的心头爱？基于新闻联播文本的大数据分析

文摘教育 2024-01-21 15:01 湖北

又到了年底数据大盘点的时刻，在过去的一年里，哪个城市在中央眼中获得了更多的关注呢？新闻联播作为国家意志的传声筒，无疑代表了相当程度上的国家关注。本次分析的数据来自于央视网，遍历其页面，检索获取了2023年至今的所有新闻联播文本。

共检索了384天的数据，约有9000条各类新闻播报。从这些语料中检索中国344个城市出现次数，以解释这些城市在国家政治、经济或社会方面的重要性。靠前出现的次数是北京、上海、杭州、重庆、成都、吉林（省市）、天津、广州、深圳、西安、台湾、厦门等等。而我国的经济前列的城市则是上海、北京、深圳、重庆、广州、苏州、成都、杭州、武汉、南京，如果建立在更长时间序列，来看城市在新闻联播中的关注度移动，相信也是一个很有趣的话题。

把这些城市可视化出来~除了长三角城市外，好像北方的城市更容易被提及诶。除了西部三省外，云贵地区的声量也较弱，长江中游的十余个城市除了武汉南昌长沙外，其余城市也基本上属于“小透明”。

附送本文所使用的数据抓取代码，如果有时间可以绘制近10年来的城市关注度转移情况，相信也会是很有意思的事情，有空剪辑一个视频出来hhh。

import requestsimport pandas as pdfrom bs4 import BeautifulSoupfrom datetime import datetime, timedelta# Function to extract details from a video linkdef get_video_details(video_url):    res_video = requests.get(video_url)    res_video.encoding = 'utf-8'    soup_video = BeautifulSoup(res_video.text, 'html.parser')    title = soup_video.find('title').text    description = soup_video.find('meta', {'name': 'description'})['content']    source = soup_video.find('span', class_='laiyuan').text    time = soup_video.find('span', class_='time').text    content = soup_video.find('div', id='content_area').text.strip()    return f"标题: {title}\n描述: {description}\n来源: {source}\n时间: {time}\n内容: {content}"# Initialize DataFramedf = pd.DataFrame(columns=['Video Title', 'Video Link', 'Video Image', 'Video Duration'])# Specify the date rangestart_date = datetime.strptime('20230101', '%Y%m%d')end_date = datetime.today()
# Iterate over each day in the date rangewhile start_date <= end_date:    date_str = start_date.strftime('%Y%m%d')    url = f'https://tv.cctv.com/lm/xwlb/day/{date_str}.shtml'
    # Fetch HTML content    res = requests.get(url)    res.encoding = 'utf-8'    html_code = res.text    soup = BeautifulSoup(html_code, 'html.parser')
    # Extract information from each video entry    for li in soup.find_all('li'):        a_tag = li.find('a', {'alt': True})        if a_tag:            video_title = a_tag.get('alt')            video_link = li.find('a', {'href': True}).get('href')            video_image = li.find('img').get('src')            video_duration = li.find('span').text
            # Append the extracted information to the DataFrame            df = df.append({'Video Title': video_title,                            'Video Link': video_link,                            'Video Image': video_image,                            'Video Duration': video_duration}, ignore_index=True)    # Print or use the DataFrame as needed    df['Details'] = df['Video Link'].apply(get_video_details)    # Save DataFrame to CSV    df.to_csv(f'videos_{date_str}.csv', index=False)    # Clear the DataFrame for the next iteration    df = pd.DataFrame(columns=['Video Title', 'Video Link', 'Video Image', 'Video Duration'])    # Move to the next day    start_date += timedelta(days=1)

http://mp.weixin.qq.com/s?__biz=Mzg4NTE4NDE4NQ==&mid=2247486329&idx=1&sn=8869e6539e9d1f7ba9aec889a60d69f9

城市感知计算

认识世界和改造世界，张岩博士和志愿者团队搭建的非盈利城市科学分享平台，欢迎加好友学术交流。

最新文章

GISChat茶话会十三期总结与回放

谷歌代码之夏Mesa项目中国开发者招募

GISChat第13期：空间异质性的建模与应用（本周六晚20:00准时开讲~）

利用移动传感数据实现城市环境噪声感知的智能理解

使用街景图像和混合语义图的多级城市街道表征方法

GISChat茶话会十二期总结与回放

GISChat第12期：从建成环境到虚拟空间（周四晚20:00准时开讲~）

论文分享｜基于路划模型（stroke-based）表征的中国主要城市路网韧性测度

GISChat新媒体矩阵及成员介绍

GISChat第11期分享（本周日晚20:00准时开讲~）

SAGE-GSAN:基于街景影像的出租车一氧化碳排放估计的图方法

基于噪音投诉数据和视觉语言混合方法感知噪音暴露及不平等

第10期茶话会回顾（科研习惯与科研经验分析）~

第10期茶话会回顾（工业GIS之旅）~

陈能成教授团队Nature Cities发文揭示全球城市化的局地干旱效应

GISChat第10期分享（明天20:00准时开讲~）

微调BERT实现中文微博情感分类（模型分享至HuggingFace）

空间结构如何影响心理恢复?一种基于图神经网络和街景图像的方法

物理-社会空间交互的视角：实现用户下一位置预测的异构图融合网络

第9期茶话会回顾

GISChat第9期：学术生涯规划与科研经验分享（明天-7月2日晚20：00准时开讲）

茶话会第8期分享（本周末20:00！）

中国地图故事第六辑：高考关注度的地区差异

绘制订阅者的全家福（留言送5件GISChat定制文化衫！）

第七期茶话会回顾

利用微博签到数据感知城市动态（分析代码+抓包教程）

茶话会第7期分享(本周末20:00！)

基于树莓派打造你的个人感知终端

茶话会的故事

人本视角出发的GeoAI模型研究以及其在城市地理问题中的应用—（视频总结版）

碳通量核算-工厂碳排放及海洋碳吸收—（视频总结版）

论文分享｜超过十万条微博数据揭示小区环境如何影响居民在COVID封控期间的情绪

IEEE J-STARS“街景影像与地理人工智能”专刊征稿

分析700份代表提案，看看两会大家关心什么！

GISChat茶话会第五期-前沿研究分享（下周六晚！）

考虑道路风险和道路行人需求的溃坝洪水灾害下的行人疏散规划

微博签到数据的获取思路与实战

第一届亚洲地图学会议AsiaCarto 2024（一号通知）

深度感知一切|自港大&抖音的DepthAnythig

中国人口贩卖数据爬取教程与分析报告

哪个城市是中央眼中的心头爱？基于新闻联播文本的大数据分析

2024年度展望：无用之用&公众号的朋友们

带审图号标准地图制作，如何设置中国地图的标准投影？

标准地图国内外对比＆区划数据获取方法

超越微博，小红书数据采集数据、代码和思路

房价真的降了么！

从街景图像中分析安全感知的性别差异

城市绿地可达性及其计算方法

IJGIS 专刊征稿 | GeoHealth Data Science

应用于城市分析的空间显式的可解释性人工智能

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉