ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。
介绍
Spotify API 2017首歌曲的数据集。每首歌都被标记为"1"或"0","1"表示我喜欢,"0"表示我不喜欢。我把它用于数据,看看我是否可以建立一个分类器来预测我是否喜欢一首歌。
关于如何从Spotipy API获取这些数据的代码,以及建模方法可以参考链接https://opendatascience.com/blog/a-machine-learning-deep-dive-into-my-spotify-data/.
数据集中每一行代表一首歌,共有16列。其中13列是歌曲属性,一列是歌曲名称,一列为艺术家,还有一列称为"目标",这是歌曲的标签。这些列的意义可以在这里找到:https://developer.spotify.com/web-api/get-audio-features/。
字段说明
字段名称 | 字段说明 |
---|---|
acousticness | 对音轨是否为声学的置信度测量(范围从 0.0 到 1.0) |
danceability | 舞蹈性 |
duration_ms | 持续时间(毫秒) |
energy | 活力 |
instrumentalness | 器乐性 |
key | 音调 |
liveness | 活跃度 |
loudness | 响度 |
mode | 模式 |
speechiness | 言语性 |
tempo | 节奏 |
time_signature | 时间标识 |
valence | 价格 |
target | 目标,是否喜欢 |
song_title | 歌名 |
artist | 艺术家 |
数据来源
Spotify提供了这些易于访问的数据。
数据集的用途
研究是否会喜欢一首歌?
数据文件
下载数据集请登录ModelCube
http://modelcube.cn/dataset/dataset-detail/10266