journal-ref: Information about the journal the paper was published in doi: https://www.doi.org abstract: The abstract of the paper categories: Categories / tags in the ArXiv system versions: A version history 3.LLMs微调 ChatGenTitle基于Meta的LLaMA模型进行微调,微调主流的方法有:Instruct微调和Lo...
该数据集是原始 arXiv 数据的镜像,存储量高达 1.1TB,并且还会继续增加。数据集仅提供了 json 格式的元数据文件,它包含每篇论文的相关条目,具体如下:id:arXiv ID,可用于访问论文;submitter:论文提交者;authors:论文作者;title:论文标题;comments:论文页数和图表等其他信息;journal-ref:论文发表的期刊;...
comments: Additional info, such as number of pages and figures journal-ref: Information about the journal the paper was published in doi: [https://www.doi.org](Digital Object Identifier) abstract: The abstract of the paper categories: Categories / tags in the ArXiv system versions: A version...
journal-ref:论文发表的期刊; doi:数字对象标识符; abstract:论文摘要; categories:论文在 arXiv 系统的所属类别或标签; versions:论文版本。 此外,用户可以通过以下两个链接直接在 arXiv 上访问每篇论文: arxiv.org/abs/{id}:包含摘要和进一步链接的论文页面; arxiv.org/pdf/{id}:论文 PDF 下载页面。 批量...
5.整理了220W+篇arXiv论文的元信息,这些元信息包括:title和abstract,更多的有:id、submitter、authors、comments、journal-ref、doi、categories、versions; 1.项目背景 科研论文写作中,生成一个有吸引力的、准确的论文标题需要综合考虑多个因素,这是论文作者面临的一个重要挑战。生成一个论文标题的难点有: 简洁但准确...
https://www.kaggle.com/Cornell-University/arxiv 目前,arXiv开放给kaggle的内容非常丰富,包括170万篇文章,其相关功能包括文章标题,作者,类别,摘要,全文PDF等。该数据集数据量级高达1.1TB,并且还会持续更新。包含的内容如下:id:arXiv ID;submitter;authors;title;comments;journal-ref;doi;abstract;...
journal-ref:论文发表的期刊; doi:数字对象标识符; abstract:论文摘要; categories:论文在 arXiv 系统的所属类别或标签; versions:论文版本。 此外,用户可以通过以下两个链接直接在 arXiv 上访问每篇论文: https://arxiv.org/abs/{id}:包含摘要和进一步链接的论文页面; ...
journal-ref:论文发表的期刊信息; doi:数字对象标识符; abstract:论文摘要; categories:论文在 arXiv 所属类别或标签; versions:论文版本。 可以轻松地在这些浩如烟海的论文中进行遍历、筛选、查阅。 数据集目前已更新了 5 个版本 此外,用户还可以通过以下两个链接直接在 arXiv 上访问每篇论文: ...
journal-ref: Information about the journal the paper was published indoi: [https://www.doi.org](Digital Object Identifier)abstract: The abstract of the papercategories: Categories / tags in the ArXiv systemversions: A version history You can access each paper directly on ArXiv using these ...
journal_ref A journal reference if present. doi A URL for the resolved DOI to an external resource if present. primary_category The result's primary arXiv category. See arXiv: Category Taxonomy[4]. categories All of the result's categories. See arXiv: Category Taxonomy. links Up to three...