结合本体技术,提出了一种新的从文档中抽取引文元数据信息的方法。该方法采用模式匹配方式,可以从文档中提取作者、标题、日期等信息,并使用OWL 本体描述语言进行形式化,为进一步的语义搜索和语义存储奠定基础。实验数据证明了该方法的有效性。关键词:信息抽取;语义网;本体;模式匹配Abstract: A new method using onto
专利摘要:本发明公开了一种基于FastText‑CRF的引文元数据抽取方法,考虑了引文段对引文元数据的影响,先从引文数据中提取引文段,然后利用FastText模型做一个分类器,对引文段做一个粗分类,最后将粗分类的结果输入到CRF条件随机场模型得出最后的分类标签。通过将FastText模型与CRF模型相结合的技术应用于引文元数据抽取,可...
这个学术搜索系统以数十亿计的海量元数据为基础,利用数据仓储、资源整合、知识挖掘、数据分析、文献学模型等相关技术,较好地解决了复杂异构数据库群的集成集合,实现高效、精准、统一的学术资源搜索,进而通过分面聚类、引文分析、知识关联分析等实现高价值学术文献发现、纵横结合的深度知识挖掘、可视化的全方位知识关联。
Guillaume Cabanac认为有关这篇论文的引用信息在某个时候被偷偷放入其他一百多篇论文的元数据文件中,这些文件被提交给Crossref并被自动抓取,而那些文章的作者可能并不知情,因为元数据文件可以根据需要多次重新提交,所以更新的元数据文件也可以在文章发表后的任何时间提交。而这个文件的更改不会影响论文的PDF或HTML版本,Di...
这个学术搜索系统以数十亿计的海量元数据为基础,利用数据仓储、资源整合、知识挖掘、数据分析、文献学模型等相关技术,较好地解决了复杂异构数据库群的集成集合,实现高效、精准、统一的学术资源搜索,进而通过分面聚类、引文分析、知识关联分析等实现高价值学术文献发现、纵横结合的深度知识挖掘、可视化的全方位知识关联。这...
一旦我们将文献导入到EndNote中,利用插入引文功能,我们只需要简单地选择文献,然后将其插入到我们需要引用的地方,EndNote会自动生成正确的引文格式,如APA、MLA等。这样一来,我们不仅省去了繁琐的格式调整步骤,还能有效避免因格式错误而引起的低分风险。 【协同与共享】...
【摘要】结合本体技术,提出了一种新的从文档中抽取引文元数据信息的方法.该方 法采用模式匹配方式,可以从文档中提取作者、标题、日期等信息,并使用 OWL 本 体描述语言进行形式化,为进一步的语义搜索和语义存储奠定基础.实验数据证明了 该方法的有效性. 【总页数】3 页(P304-306) 【作者】郭志鑫 【作者单位】...
这个学术搜索系统以数十亿计的海量元数据为基础,利用数据仓储、资源整合、知识挖掘、数据分析、文献学模型等相关技术,较好地解决了复杂异构数据库群的集成集合,实现高效、精准、统一的学术资源搜索,进而通过分面聚类、引文分析、知识关联分析等实现高价值学术文献发现、纵横结合的深度知识挖掘、可视化的全方位知识关联。
这个学术搜索系统以数以十亿计的海量元数据为基础,利用数据仓储、资源整合、知识挖掘、数据分析、文献计量学模型等相关技术,较好地解决了复杂异构数据库群的集成集合,实现高效、精准、统一的学术资源搜索,进而通过分面聚类、引文分析、知识关联分析等实现高价值学术文献发现、纵横结合的深度知识挖掘、可视化的全方位知识关联...