ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。
介绍
这是Aurélien Géron的书籍《动手学机器学习:使用Scikit-Learn和TensorFlow》第二章中使用的数据集。它是一个实现机器学习算法的优秀入门数据集,因为它需要基本的数据清洗,字段列表易于理解,且大小适中,既不显得过于简单化,也不显得过于繁琐。
该数据包含了1990年加州人口普查的信息。因此,虽然它可能不像Zillow Zestimate数据集那样帮助您预测当前的房价,但它确实为教授机器学习基础知识提供了一个易于接触的数据集。
该数据涉及的是在给定的加利福尼亚地区找到的房屋,以及基于1990年人口普查数据的一些摘要统计信息。请注意,数据尚未清理,因此需要进行一些预处理步骤!
字段说明
字段名称 | 字段说明 |
---|---|
longitude | 经度 |
latitude | 纬度 |
housing_median_age | 住房_中位数_房龄 |
total_rooms | 总房间数 |
total_bedrooms | 总卧室数 |
population | 人口 |
households | 家庭 |
median_income | 中位数收入 |
median_house_value | 中位数房屋价值 |
ocean_proximity | 与海洋的接近程度 |
该数据集是加州住房数据集的修改版本,可从以下网站获得:Luís Torgo的页面(波尔图大学)。
数据文件
下载数据集请登录ModelCube
http://modelcube.cn/dataset/dataset-detail/10092