ModelCube数据集 | 加州房价数据集

文摘   2024-08-08 07:02   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。

介绍

这是Aurélien Géron的书籍《动手学机器学习:使用Scikit-Learn和TensorFlow》第二章中使用的数据集。它是一个实现机器学习算法的优秀入门数据集,因为它需要基本的数据清洗,字段列表易于理解,且大小适中,既不显得过于简单化,也不显得过于繁琐。

该数据包含了1990年加州人口普查的信息。因此,虽然它可能不像Zillow Zestimate数据集那样帮助您预测当前的房价,但它确实为教授机器学习基础知识提供了一个易于接触的数据集。

该数据涉及的是在给定的加利福尼亚地区找到的房屋,以及基于1990年人口普查数据的一些摘要统计信息。请注意,数据尚未清理,因此需要进行一些预处理步骤!

字段说明

字段名称字段说明
longitude经度
latitude纬度
housing_median_age住房_中位数_房龄
total_rooms总房间数
total_bedrooms总卧室数
population人口
households家庭
median_income中位数收入
median_house_value中位数房屋价值
ocean_proximity与海洋的接近程度

该数据集是加州住房数据集的修改版本,可从以下网站获得:Luís Torgo的页面(波尔图大学)。

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10092

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章