数据集网站收集(可用于机器学习,数据挖掘等,持续更新)「建议收藏」

数据集网站收集(可用于机器学习,数据挖掘等,持续更新)「建议收藏」数据集网站收集(持续更新)1.Kaggle:"https://www.kaggle.com/"可以按关键字搜索数据集自带讨论区有热心群众分享自己的Kernel,可供参考(热心群众们自己对数据的分析代码)2.天池:"https://tianchi.aliyu

大家好,欢迎来到IT知识分享网。

数据集网站收集(持续更新)

1.Kaggle: https://www.kaggle.com/

  • 可以按关键字搜索数据集
  • 自带讨论区
  • 有热心群众分享自己的Kernel,可供参考(热心群众们自己对数据的分析代码)

2.天池: https://tianchi.aliyun.com/competition/gameList/algorithmList

  • 包括阿里系公司(淘宝,饿了么)的部分业务数据(不是很全,只作为赛题数据)
  • 需要登录才可以下载

2.UCI Machine Learning Repositoryhttp://archive.ics.uci.edu/ml/datasets.php

  • 可以按关键字搜索数据集
  • 可以按任务类型(用于分类,回归,聚类),数据类型(文本,时序),领域(工程,CS,商业),特征数量等进行筛选

3.美国政府开放数据Data.gov https://www.data.gov/

  • 可以按关键字搜索数据集
  • 分为农业,气候,教育等多个主题

4.中国国家统计局 http://data.stats.gov.cn/easyquery.htm?cn=A01

  • 需要登录
  • 网站自带一定的可视化功能
  • 数据可导出为csv,pdf等格式
  • 包括国家的工业,农业,运输业,经济等方方面面的数据
  • 可以自行选择数据的时间跨度,例如按年导出(2015-2019工业年产值),按月导出(2015.2-2020.2铁路旅客运输量)

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/29037.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信