ModelCube数据集 | Reddit WSB帖子数据集

文摘   2024-11-28 08:01   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。

背景

WallStreetBets(WallStreetBets,也称为WSB)是一个Reddit的子网站,参与者在这里讨论股票和期权交易。它因其粗俗的性质和用户操纵证券的指控而出名。最近,由于对GameStop股票的兴趣,该社区再次成为主流。


数据集中包含WallStreetBets上发布的帖子的相关信息。数据中可能包含一小部分粗俗的语言,这些帖子没有经过过滤。

字段说明

字段名称字段说明
title标题
score帖子得分
idID
url网址
comms_num通信号码
created创建时间戳
body帖子正文
timestamp时间戳

数据来源

帖子来自Reddit WallStreetBets子网站,使用praw从https://www.reddit.com/r/wallstreetbets/下载(Python Reddit API包装器)。

数据集的用途

  1. 进行情绪分析

  2. 确定讨论主题

  3. 跟踪趋势(如GME、AMP、NOK等关键词的出现以及数据中实际的其他趋势)

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10255

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章