2024 一键批量下载微博内容/图片/视频/评论/转发/阅读数等数据,导出word,excel和pdf

科技   2024-10-16 08:20   北京  

之前分享过微博下载工具 2024批量下载知乎回答文章想法专栏收藏夹,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf ,今天再整理分享下微博内容/图片/视频/评论/转发/阅读数等数据下载,导出word,excel和pdf,有问题加微信 sushengbuhuo

以歌手李健这个号为例https://weibo.com/n/歌手李健,复制微博cookie到文件cookie.txt,如何获取cookie见之前文章总有人问我 cookie 到底是什么? 


打开我开发的工具输入微博uid开始抓取。

默认批量抓取最近一个月的微博数据,导出的excel微博数据包含微博链接,微博类型,时间,微博内容,图片链接,发布来源,发布地区,阅读数,转发数,评论数,点赞数,其中微博类型包含原创,转发,快转。只有抓取自己的uid才有阅读数。

李健的第一条微博发布于2010年。抓取微博excel数据后打开另外一个工具批量下载微博内容,无水印图片和视频。

下载的每条微博内容保存到word和txt,无水印图片,视频,效果见网盘  https://pan.quark.cn/s/bd6925a37518   

word微博内容:

将所有微博内容合成一个word文件,大小不到100Kb,这下看起来方便了 。

再写脚本根据微博点赞转发评论数之和做个降序排列,这样就能找出受欢迎的前10的微博了。

import pandas as pd
df=pd.read_csv('weibo/歌手李健/1744395855.csv')
df['sort']=df['点赞数']+df['转发数']+df['评论数']
df.sort_values(by=['sort'],ascending=False, inplace=True)
df.head(10).to_csv('歌手李健.csv',encoding='utf_8_sig',index=False)
https://www.weibo.com/1744395855/LgnjmrmvF
https://www.weibo.com/1744395855/Cc3T09sqM
https://www.weibo.com/1744395855/C9UW2BmNd
https://www.weibo.com/1744395855/ChaNZmx6A 
https://www.weibo.com/1744395855/Jfpw2xihv
https://www.weibo.com/1744395855/CfNZzoAMV
https://www.weibo.com/1744395855/Ckrkv2A0b
https://www.weibo.com/1744395855/Fn3bhwNWv
https://www.weibo.com/1744395855/Gt5of2OCo
https://www.weibo.com/1744395855/Gt5of2OCo

再分析下微博发布工具比例图,平常主要用iPad和网页版发微博。

所有微博内容词云图:原创微博与转发数据分布图,2013年大量转发。转发评论点赞数据分布图,2015年是高峰。

导出微博内容pdf,大小 40MB。

然后是批量下载微博评论,工具下载地址在公众号后台对话框回复 微博,打开工具输入微博链接和网页版微博cookie就行,比如 https://weibo.com/1744395855/O0haQaIfE,https://m.weibo.cn/detail/5000660202553386

不过下载的评论比实际评论数少很多,部分评论被微博过滤了,点击加载更多没反应。

导出的excel数据包含每条评论的微博昵称,微博uid,评论时间,评论内容,评论地区,回复数,点赞数等。

对excel文件分析评论IP地址分布图:

对excel文件分析评论内容生成的词云图:当然也支持批量下载微博评论,将所有微博链接放在一个txt文件,一行一个链接,打开工具输入文件名和cookie批量下载。

还有批量下载微博转发内容,导出的excel数据包含微博昵称,微博uid,转发时间,转发内容,转发地区,转发来源,转发数,评论数,点赞数,比如https://m.weibo.cn/status/5000660202553386这条微博有5000多条转发微博:对excel文件分析微博转发ip地址分布图:

对excel文件分析微博转发内容词云图:

最新原创文章:

加入我的知识星球

2024 更新版:苏生不惑开发过的那些原创工具和脚本

2024 公众号苏生不惑发布软件目录

2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数

2024 极品互联网宝藏资源库,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,导出 excel 和 pdf

2024批量下载知乎回答文章想法专栏收藏夹,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf

2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

2024苏生不惑精华帖合集,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,微博内容/图片/视频/评论/转发数据,导出 excel 和 pdf

如果文章对你有帮助还请 点赞/在看/分享 三连支持下, 感谢各位!

公众号苏生不惑

扫描二维码关注或搜索微信susheng_buhuo

苏生不惑
这个账号已经持续5年每周更新原创文章,分享些有趣实用的软件/网站和黑科技教程,来跟我一起高效地玩转互联网。 联系:sushengbuhuo
 最新文章