ModelCube数据集 | 百万新闻标题数据集

文摘   2024-10-16 08:11   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。

介绍

该数据集包含了19年来发布的一百万条新闻标题数据,数据源于著名的ABC(澳大利亚广播公司)。

字段说明

字段名称字段说明
publish_date文章以yyyyMMdd格式发布的日期,起始日期:2003-02-19,结束日期:2021-12-31
headline_text新闻文本,英文小写

数据集的用途

将这个新闻数据集视为2003年初至2021年底全球值得注意事件的总结历史记录,并将重点放在澳大利亚。

这包括abcnews网站在给定日期范围内发布的全部文章。

每天有200篇文章,对国际新闻有很好的关注,我们可以相当肯定的是,每一个重要事件都在这里被捕捉到了。

深入挖掘关键词,可以看到过去十年中塑造的所有重要事件,以及它们是如何随着时间的推移而演变的。

例如:阿富汗战争、金融危机、多次选举、生态灾难、恐怖主义、名人、犯罪活动等。

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10170

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章