ModelCube数据集 | Zomato Bangalore餐厅评论数据集

文摘   2024-08-02 08:08   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。

介绍

班加罗尔有来自世界各地的餐馆。从美国到日本,从俄罗斯到南极洲,你都可以在这里找到各种菜系。无论是送餐、外出就餐、酒吧、酒吧、饮料、自助餐还是甜点,你叫得出名字的,班加罗尔都有。班加罗尔是美食家的最佳去处。餐厅的数量每天都在增加,目前大约有12,000家餐厅。面对如此众多的餐厅,这个行业尚未饱和,每天都有新餐厅开业。然而,对于他们来说,与已经建立的餐厅竞争变得越来越困难。他们面临的关键问题包括高昂的房地产成本、不断上升的食品成本、优质人才的短缺、分散的供应链和过度许可。这个Zomato数据旨在分析地点的人口统计学。最重要的是,它将帮助新餐厅决定特定地点的主题、菜单、菜肴、成本等。它还旨在根据食物找出班加罗尔不同社区之间的相似性。该数据集还包含每个餐厅的评论,这将有助于找出该地点的整体评分。

分析Zomato数据集的基本思路是了解影响班加罗尔不同地点不同类型餐厅成立的各种因素,以及每个餐厅的综合评分。班加罗尔是一个拥有超过12,000家餐厅的城市,这些餐厅提供来自世界各地的菜肴。随着每天新餐厅的开业,这个行业尚未饱和,需求也在不断增加。尽管需求在增加,但对于新餐厅来说,与已经建立的餐厅竞争却变得更加困难。他们中的大多数提供相同的食品。班加罗尔是印度的IT之都,这里的许多人主要依赖餐厅食物,因为他们没有时间为自己烹饪。面对如此庞大的餐厅需求,因此有必要研究地点的人口统计学。一个地区哪种食物更受欢迎。整个地区是否都喜欢吃素食。如果是,那么这个地区是否由特定的人群居住,例如,耆那教徒、马瓦里人、古吉拉特人,他们大多是素食者。通过研究诸如人口统计、教育水平、收入水平、餐厅类型、菜单多样性等因素,可以进行如下分析:

1.餐厅的位置。

2.餐食的大约价格。

3.主题餐厅还是非主题餐厅。

4.哪个城市的哪个社区有最多的餐厅提供哪种菜肴。

5.力求在社区中找到最佳菜肴的人的需求。

6.某个特定社区是否以其特有的食物而闻名。

“只是为了你下次外出时能享受一顿美餐。”

该数据截至2019年3月15日,准确反映了Zomato网站上可获得的数据。数据是从Zomato网站以两个阶段爬取的。在了解了网站的结构后,发现每个社区都有6-7种类型的餐厅,例如自助餐、咖啡馆、送餐、甜点、外出就餐、饮料与夜生活、酒吧和酒吧。

第一阶段,

在第一阶段的提取过程中,仅从主页上提取了餐厅的URL、名称和地址。Zomato上每个餐厅的URL被记录在CSV文件中,以便以后可以单独为每个餐厅提取数据。这样做使得提取过程更加简单,并减轻了机器的额外负担。

第二阶段,

在第二阶段,读取了每个餐厅和每个类别的记录数据,并为每个餐厅单独提取了数据。在这个阶段,共提取了15个变量。对于每个社区和每个类别,提取了在线订餐、预订餐桌、评分、投票、电话、位置、餐厅类型、受欢迎的菜肴、菜系、大约成本(两人份)、评论列表、菜单项目等信息。

字段说明

字段名称字段说明
urlZomato网站上的餐厅网址
address班加罗尔的餐厅地址
name餐厅的名称
online_order餐厅是否提供在线订餐服务
book_table是否提供预订餐桌选项
rate餐厅的整体评分(满分5分)
votes截至上述提及日期为止餐厅的总评分数量
phone餐厅的电话号码
location餐厅所在地区的名称
rest_type餐厅类型
dish_liked人们喜欢的餐厅里的菜肴
cuisines食物风格,以逗号分隔
approx_cost(for two people)包含两个人的大概餐费
reviews_list包含餐厅评论的元组列表,每个元组包含两个值,评级和客户评论
menu_item包含餐厅提供的菜单列表
listed_in(type)就餐方式
listed_in(city)该餐厅的街区

数据集的用途

1.研究如果有人想开新餐厅,应该考虑哪些因素。

2.研究一个地区的人口结构?

3.研究餐厅的主题?

5.研究食品连锁店的类别餐厅是否比其对手更容易吸引更多顾客?

6.研究是否有任何社区相似?如果两个社区相似,这意味着它们有关联吗?

7.研究一个地区哪种食物更受欢迎?

8.研究整个社区是否都喜欢素食?如果是,那么这个社区是否由特定的群体居住,例如耆那教徒、马瓦里人、古吉拉特人,他们大多是素食者。

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10075

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章