ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。
数据及来源
该数据是从Booking.com中抓取的。文件中的所有数据都已向所有人公开。请注意,数据最初归Booking.com所有。
该数据集包含欧洲1493家豪华酒店的51.5万条客户评论和评分。同时,还提供了酒店的地理位置,以供进一步分析。
字段说明
字段名称 | 字段说明 |
---|---|
Hotel_Address | 酒店地址 |
Review_Date | 评论者发布相应评论的日期 |
Average_Score | 酒店的平均得分,根据去年的最新评论计算 |
Hotel_Name | 酒店名称 |
Reviewer_Nationality | 评论者的国籍 |
Negative_Review | 评论者给酒店的负面评价 |
Review_Total_Negative_Word_Counts | 负面评论中的总字数 |
Positive_Review | 评论者给酒店的正面评价 |
Review_Total_Positive_Word_Counts | 正面评论中的总字数 |
Reviewer_Score | 评论者根据其体验给酒店的评分 |
Total_Number_of_Reviews_Reviewer_Has_Given | 评论者过去给出的评论数量 |
Total_Number_of_Reviews | 该酒店的有效评论总数 |
Tags | 评论者给酒店的标签 |
days_since_review | 审核日期和抓取日期之间的时间间隔 |
Additional_Number_of_Scorning | 还有一些客人只是对服务进行了评分,而不是评论。这个数字表示其中有多少有效评分,但没有评论 |
lat | 酒店纬度 |
lng | 酒店经度 |
数据集的用途
根据评论和分数拟合回归模型,看看哪些单词更能代表更高/更低的分数。
对评论进行情绪分析。
找出评论者的国籍和分数之间的相关性。
对数据集进行美丽且信息丰富的可视化。
为喜欢酒店特色的客人提供简单的推荐引擎。
数据文件
下载数据集请登录ModelCube
http://modelcube.cn/dataset/dataset-detail/10187