ModelCube数据集 | 欧洲51.5万酒店评论数据集

文摘   2024-10-30 08:08   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。

数据及来源

该数据是从Booking.com中抓取的。文件中的所有数据都已向所有人公开。请注意,数据最初归Booking.com所有。

该数据集包含欧洲1493家豪华酒店的51.5万条客户评论和评分。同时,还提供了酒店的地理位置,以供进一步分析。

字段说明

字段名称字段说明
Hotel_Address酒店地址
Review_Date评论者发布相应评论的日期
Average_Score酒店的平均得分,根据去年的最新评论计算
Hotel_Name酒店名称
Reviewer_Nationality评论者的国籍
Negative_Review评论者给酒店的负面评价
Review_Total_Negative_Word_Counts负面评论中的总字数
Positive_Review评论者给酒店的正面评价
Review_Total_Positive_Word_Counts正面评论中的总字数
Reviewer_Score评论者根据其体验给酒店的评分
Total_Number_of_Reviews_Reviewer_Has_Given评论者过去给出的评论数量
Total_Number_of_Reviews该酒店的有效评论总数
Tags评论者给酒店的标签
days_since_review审核日期和抓取日期之间的时间间隔
Additional_Number_of_Scorning还有一些客人只是对服务进行了评分,而不是评论。这个数字表示其中有多少有效评分,但没有评论
lat酒店纬度
lng酒店经度

数据集的用途

  1. 根据评论和分数拟合回归模型,看看哪些单词更能代表更高/更低的分数。

  2. 对评论进行情绪分析。

  3. 找出评论者的国籍和分数之间的相关性。

  4. 对数据集进行美丽且信息丰富的可视化。

  5. 为喜欢酒店特色的客人提供简单的推荐引擎。

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10187

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章