ToTTo is an open-domain English table-to-text dataset with over 120,000 training examples that proposes a controlled generation task: given a Wikipedia table and a set of highlighted table cells, produce a one-sentence description. We hope it can serve as a useful research benchmark for high...
早在2017 年,Google 就已经开始了“数据集检索”任务的实践,并且在 2019 年提出了一个“数据集搜索引擎”的初步构想与技术框架,而在 2020 年 1 月,“Dataset Search” 正式结束测试,上线了谷歌。 Dataset Search 的页面十分简洁,只有搜索框与和一个简单的登录按钮,使...
Google Dataset Search 是一个数据集搜索引擎。用户只需搜索关键字,就能在网络上发现托管在数千个存储区...
The names, aliases and Wikidata Ids of the entities can be found inhttps://storage.googleapis.com/gresearch/kelm-corpus/updated-2021/entities.jsonl. This dataset has been released under theCC BY-SA 2.0 license. Releases No releases published...
Discover Google Research. We publish research papers across a wide range of domains and share our latest developments in AI and science research.
为了帮助研究社区找到有趣的数据集,我们继续使用Google Dataset Search为来自许多不同组织的各种开放数据集建立索引。我们还认为创建新的数据集以供社区探索和开发新技术,并确保负责任地共享开放数据集也很重要。今年,我们还发布了许多跨领域的开放数据集: Open Images V5: 对流行的Open Images数据集进行更新,其中包括...
在《ToTTo:一个受控的表到文本生成数据集》(ToTTo: A Controlled Table-to-Text Generation Dataset)中,研究人员提出了一个开放域的表到文本生成数据集。该数据集是由一种新的注释过程(通过句子修改)以及一个可用于评估模型「幻觉」的受控文本生成任务生成的。在接下来的介绍中,我们将「表到文本」称为ToTTo。
didi_dataset disarm distracting_control dnn_predict_accuracy docent domain_conditional_predictors dot_vs_learned_similarity dp_multiq dql_grasping dreg_estimators drfact dselect_k_moe dual_dice dual_pixels dvrl ebp eeg_modelling eim eli5_retrieval_large_lm ...
在《ToTTo:一个受控的表到文本生成数据集》(ToTTo: A Controlled Table-to-Text Generation Dataset)中,研究人员提出了一个开放域的表到文本生成数据集。 该数据集是由一种新的注释过程(通过句子修改)以及一个可用于评估模型「幻觉」的受控文本生成任务生成的。
在《ToTTo:一个受控的表到文本生成数据集》(ToTTo: A Controlled Table-to-Text Generation Dataset)中,研究人员提出了一个开放域的表到文本生成数据集。 该数据集是由一种新的注释过程(通过句子修改)以及一个可用于评估模型「幻觉」的受控文本生成任务生成的。