导读昨天,谷歌发布了一款重磅产品 Google Dataset Search,谷歌表示其宗旨是“Making it easier to discover datasets”,让用户更容易找到想要的数据集。 当下,许多学科的科学家和越来越多的写手需要与数据打交道,网上有成千上万的数据存储库,可以访问数百万个数据集,同时世界各个国家与地区政府也在网上公布他们的数据。
本月早些时候,谷歌推出了数据集搜索专用引擎 Dataset Search,这是一个建立在元数据上的搜索引擎,可以对网络上数千个存储库中的数百万个数据集进行搜索。谷歌团队称其为「Google Scholar for data」。本文将介绍构建 Dataset Search 的一些技术细节,概述有助于开发开放数据生态系统的内容。此外,谷歌还解决了自 Dataset...
在这个 Dataset Search 版本中,用户可以找到环境科学和社会科学领域的大多数数据集引用,以及来自其他学科领域的数据,包括政府提供的数据和新闻机构(如 ProPublica)提供的数据。随着越来越多的数据存储库使用 schema.org 标准来描述他们的数据集,用户在 Dataset Search 中找到的数据集的种类和覆盖范围将会越来越多。 Data...
Dataset Search 测试版地址:https://toolbox.google.com/datasetsearch Dataset Search 与谷歌的其他专用搜索引擎(如用于搜索新闻和图像的引擎,以及 Google Scholar 和 Google Books)一样可以免费使用,它基于拥有者对文件和数据库的分类方式来查找文件和数据集。该引擎读取文件内容的方式与搜索引擎搜索网页的方式不同。...
谷歌Dataset Search 高度依赖大大小小的数据集提供者,利用开放 schema.org/Dataset 标准在自己的站点上添加结构化的元数据。元数据指定了每个数据集的显著属性:名称和描述、空间和时间覆盖、出处信息等。Dataset Search 利用这一元信息,将其与谷歌上的其他可用资源连接,并为这个丰富的元数据语料库建立索引。建好索引之后...
【新智元导读】继Google学术搜索之后,谷歌又一神作——Dataset Search重磅来袭! 千呼万唤始出来!Google Dataset Search腾空出世了! 还记得曾经的你,在做科研的时候,为了得到一份儿数据集,绞尽脑汁各种百度、各种google,但结果往往一无所获。从今儿起,再也不用担心这个问题了!
呐,搜索界面就是这个:https://toolbox.google.com/datasetsearch 来自谷歌官方的简介:数据集搜索使用户能够查找网上数以千计的存储区中存储的数据集,从而让这些数据集可供大众使用,让人人受益。 数据集和相关数据往往分布在网上的多个数据存储区中。在大多数情况下,搜索引擎既无法提供这些数据库相关信息的链接,也不...
Dataset Search 测试版地址:https://toolbox.google.com/datasetsearch Dataset Search 与谷歌的其他专用搜索引擎(如用于搜索新闻和图像的引擎,以及 Google Scholar 和 Google Books)一样可以免费使用,它基于拥有者对文件和数据库的分类方式来查找文件和数据集。该引擎读取文件内容的方式与搜索引擎搜索网页的方式不同。
谷歌Dataset Search 技术概览 利用来自数据集提供者的结构化元数据 当谷歌的搜索引擎处理带有 schema.org/Dataset 标记的网页时,它知道那里有数据集元数据,并处理那个结构化元数据以创建描述页面上每个标注数据集的「记录」。schema.org 的使用允许开发人员将这种结构化信息嵌入到 HTML 中,而不影响页面的外观,同时使信...
https://toolbox.google.com/datasetsearch 什么是 Dataset Search? 数据集搜索使用户能够查找网上数以千计的存储区中存储的数据集,从而让这些数据集可供大众使用,让人人受益。 数据集和相关数据往往分布在网上的多个数据存储区中。在大多数情况下,搜索引擎既无法提供这些数据库相关信息的链接,也不会将这些信息编入...