异常空间信息识别、缺失参照成分补回、空间语义角色标注、空间表达异形同义判别、空间方位关系推理,以构建中文空间语义理解能力评测数据集为例,介绍从SpaCE2021到SpaCE2024数据集的设计思想、数据集制作概况以及机器在空间语义理解任务上的表现。
北京大学在读博士研究生,主要研究方向为语言知识工程、自然语言处理 语言学知识驱动的空间语义理解能力评测数据集研究 詹卫东,孙春晖,肖力铭 关键词 人工智能;大语言模型;语言学知识;空间语义理解;数据合成 一、引言 ChatGPT等大语言模型的问世,引发了对以乔姆斯基理论为代表的语言学研究理念的尖刻批评,如Piantadosi(20...
1. 研究背景 随着信息技术的快速发展,自然语言处理领域的研究取得了显著进展。在这个背景下,空间语义理解能力作为语言学知识与计算机技术结合的产物,成为了一个研究热点。语言学知识驱动的空间语义理解能力评测数据集研究,旨在通过构建高质量的数据集,评估计算机系统在理解和处理与空间相关的语义信息方面的能力。 在现实生...
主题词: 人工智能;大语言模型;语言学知识;空间语义理解;数据合成 摘要:近20年来,深度学习技术显著提升了机器的自然语言处理能力,使之在诸多任务上接近甚至超过人类水平。机器学习的对象不再是直接来自人类语言学研究成果(知识),而是人类语言材料(数据)。在靠数据和算力驱动的大语言模型几近建成巴别塔的当下,...
语言学知识驱动的空间语义理解能力评测数据集研究 詹卫东,孙春晖,肖力铭 (北京大学 中文系 北京 100871) 提 要 近20年来,深度学习技术显著提升了机器的自然语言处理能力,使之在诸多任务上接近甚至超过人类水平。机器学习的对象不再是...
语言学知识驱动的空间语义理解能力评测数据集研究 詹卫东,孙春晖,肖力铭 关键词 人工智能;大语言模型;语言学知识;空间语义理解;数据合成 一、引言 ChatGPT等大语言模型的问世,引发了对以乔姆斯基理论为代表的语言学研究理念的尖刻批评,如Piantadosi(2023),Hinton(2024)。语言学家不甘示弱,做了针锋相对的回击,如Katz...
语言学知识驱动的空间语义理解能力评测数据集研究 詹卫东,孙春晖,肖力铭 关键词 人工智能;大语言模型;语言学知识;空间语义理解;数据合成 一、引言 ChatGPT等大语言模型的问世,引发了对以乔姆斯基理论为代表的语言学研究理念的尖刻批评,如Piantadosi(2023),Hinton(2024)。语言学家不甘示弱,做了针锋相对的回击,如Katz...
语言学知识驱动的空间语义理解能力评测数据集研究 詹卫东,孙春晖,肖力铭 (北京大学 中文系 北京 100871) 提 要 近20年来,深度学习技术显著提升了机器的自然语言处理能力,使之在诸多任务上接近甚至超过人类水平。机器学习的对象不再是直接来...