bsky-scraper:一个针对Bluesky社交平台的数据抓取工具,可以收集Bluesky实时信息流中的帖子内容并保存为JSONL格式。支持获取文本、创建时间、作者、URI、图片状态和回复信息等数据,并使用缓存优化作者handle的解析效率。
参考文献:
[1] http://github.com/deepfates/bsky-scraper
NLP工程化(星球号)
欢迎加入我的知识星球,长按或下方二维码。星球号针对公众号提供增值服务:Dify源码剖析及答疑,电子书籍报告下载,公众号所有付费资料。
<<<左右滑动见更多>>>