本月早些时候,谷歌推出了数据集搜索专用引擎 Dataset Search,这是一个建立在元数据上的搜索引擎,可以对网络上数千个存储库中的数百万个数据集进行搜索。谷歌团队称其为「Google Scholar for data」。本文将介绍构建 Dataset Search 的一些技术细节,概述有助于开发开放数据生态系统的内容。此外,谷歌还解决了自 Dat...
Dataset Search 测试版地址:https://toolbox.google.com/datasetsearch Dataset Search 与谷歌的其他专用搜索引擎(如用于搜索新闻和图像的引擎,以及 Google Scholar 和 Google Books)一样可以免费使用,它基于拥有者对文件和数据库的分类方式来查找文件和数据集。该引擎读取文件内容的方式与搜索引擎搜索网页的方式不同。...
选自Google AI,作者:Matthew Burgess、Natasha Noy,机器之心编译。 本月早些时候,谷歌推出了数据集搜索专用引擎 Dataset Search,这是一个建立在元数据上的搜索引擎,可以对网络上数千个存储库中的数百万个数据集进行搜索。谷歌团队称其为「Google Scholar for data」。本文将介绍构建 Dataset Search 的一些技术细节,概...
为了帮助数据集搜索引擎能够索引到已存在的数据,搜索巨头 Google、微软、Yahoo、Yandex 创立了 Schema.org,让数据拥有者以标准化词汇“标记”其数据集。这样 Google 数据集搜索算法就可以对这些数据进行排名了。考虑到 Google 的影响力,所发布的数据集搜索引擎将很快促进领域内的关键选手标准化其数据,以成为数据生态...
通过“数据集搜索”功能,谷歌旨在调整其Google Scholar搜索方案,以帮助数据极客和研究人员在单个搜索栏中筛选这些数据。谷歌为数据集提供商概述了指导方针,这将帮助搜索巨头和其他公司更容易识别其内容,并顺利地将信息重定向到搜索它的研究人员。这种方法基于协作数据社区模式(collaborative data community Schema)提出的...
千呼万唤始出来!Google Dataset Search腾空出世了! 还记得曾经的你,在做科研的时候,为了得到一份儿数据集,绞尽脑汁各种百度、各种google,但结果往往一无所获。从今儿起,再也不用担心这个问题了! 谷歌超级重磅神器来也: Dataset Search——数据集搜索领跑者 ...
谷歌发布了一款重磅产品 Google Dataset Search,谷歌表示其宗旨是“Making it easier to discover datasets”,让用户更容易找到想要的数据集。 当下,许多学科的科学家和越来越多的写手需要与数据打交道,网上有成千上万的数据存储库,可以访问数百万个数据集,同时世界各个国家与地区政府也在网上公布他们的数据。谷歌表示...
【新智元导读】继Google学术搜索之后,谷歌又一神作——Dataset Search重磅来袭! 千呼万唤始出来!Google Dataset Search腾空出世了! 还记得曾经的你,在做科研的时候,为了得到一份儿数据集,绞尽脑汁各种百度、各种google,但结果往往一无所获。从今儿起,再也不用担心这个问题了!
An example search for weather records in Google Dataset Search. Image: Google Dataset Search的初始版本将涵盖环境和社会科学,政府数据以及来自ProPublica等新闻机构的数据集。但是,如果这项服务流行起来,那么随着机构和科学家争相访问其信息,它所索引的数据量应该会迅速增加。
Google Dataset Search 俗称为 “Google 学术数据搜索”,此搜索引擎的搜索范围涵盖整个网络上几千个存储区中数百万数据集的元数据。在本篇文章中,我们将详细介绍 Dataset Search 的构建过程,并概述我们认为有助于开发开放数据生态系统的内容。此外,我们还会解决自 Dataset Search 发布以来经常收到的一个问题,“为什么...