全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2593 0
2022-04-19
在网络上,几乎所有您感兴趣的主题都有数百万个数据集。如果你想买一只小狗,你可以 找到 收集小狗买家投诉或小狗认知研究的数据集。或者,如果您喜欢滑雪,您可以 找到 有关滑雪胜地收入或受伤率和参与人数的数据。 数据集搜索 已为其中近 2500 万个数据集编制索引,让您可以在一个地方搜索数据集并找到指向数据所在位置的链接。在过去的一年里,人们已经尝试过并提供了反馈,现在 Dataset Search 正式退出测试版。


数据集搜索有哪些新功能?
根据我们从数据集搜索的早期采用者那里学到的知识,我们添加了新功能。您现在可以根据您想要的数据集类型(例如,表格、图像、文本)或数据集是否可从提供商处免费获得来过滤结果。如果数据集是关于地理区域的,您可以查看地图。此外,该产品现在可在移动设备上使用,并且我们显着提高了数据集描述的质量。但是有一点没有改变:任何发布数据的人都可以通过使用开放标准 (schema.org) 在自己的网页上描述其数据集的属性, 在数据集搜索中发现他们的数据集。

我们还了解到有多少不同类型的人在寻找数据。有学术研究人员,寻找数据来发展他们的假设(例如,尝试 催产素),学生寻找表格格式的免费数据,涵盖他们的毕业论文主题(例如,尝试  使用相应过滤器的监禁率),业务分析师和寻找有关 移动应用程序 或 快餐店信息的数据科学家,等等。所有这些都有数据!我们的用户会问什么?最常见的查询包括“教育”、“天气”、“癌症”、“犯罪”、“足球”,当然还有“狗”。


您可以在数据集搜索中找到哪些数据集?
数据集搜索还为我们提供了 Web 上数据的快照。这里有几个亮点。数据集涵盖的最大主题是地球科学、生物学和农业。世界上大多数政府都会发布他们的数据并使用 schema.org 对其进行描述。美国在可用的开放政府数据集数量上领先,超过 200 万个。以及最流行的数据格式?表格——您可以在 Dataset Search 上找到超过 600 万个表格。

编辑推荐
1、2022年300个以上最佳免费数据科学课程
2、大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
3、机器学习模型方法总结
4、历史最全机器学习/深度学习/人工智能专业术语表中英对照表
5、机器学习如何应用于商业场景?三个真实的商业项目
6、数据工作者的自我修养 | 哪些技能是必不可少的?
7、《汗牛充栋:数据分析书籍分享》CDA网校新课上线
8、文本挖掘常用的107个语料库
9、一图读懂“东数西算”工程
10、零基础转行数据分析,看这篇文章就够了

DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群