“识别”的手语 识别 (一)一手伸食、中指,指尖朝前,上下动几下,表示打量的意思。(二)左手平伸,指尖朝上;右手伸掌插入左手中、无名指指缝,并向两边作分开的动作。
手语识别研究是数据驱动的,而手语数据的获取和标注相对复杂。之所以我涉足这一领域,是因为倪兰老师参与了国家和上海的科研活动,希望将人工智能技术应用于手语研究,这促使我开始着手语数据的采集和研究规划。在搭建手语识别系统时,还有另一种技术路线--基于传感设备(如数据手套和位置跟踪器)的系统。穿戴式设备如数据...
穿戴式设备如数据手套也曾是主流手语识别研究方向。 随着深度学习在人脸识别应用上的成功,手语识别研究也逐渐向机器学习和计算机视觉结合的方向发展。 目前,我的研究小组跟踪了计算机视觉领域的主流方法,正在以深度学习方法为主来处理手语识别问题,后续研究计划更加关注手语语言学交叉学科问题的探索。 我和团队已经探索了四...
手语孤立词“搬家”,双手抬起为准备动作阶段,双手呈人字状并从左向右移动为有效移动阶段,手落下的过程为结束动作阶段。 连续手语识别需要利用深度学习和机器学习分类算法处理。 二、开源数据集 1.国外数据集 著名的连续手语数据集是RWTH- PHOENIX-Weather 包含由 9 个人提供的45 760 个视频样本,其中包含 5 356 个...
倪兰教授比喻说:“就像外国人学习中文,如果他们按照英语的句法结构来组织汉语词汇,那么他们说的汉语可能会让人难以理解。同样,手语也需要遵循其自身的语法结构”。在技术开发方面,倪兰教授认为,手语识别的核心问题在于手语的内部结构,包括语音构造、构词方式和句法结构。她指出,手语的语法结构问题,尤其是如何将手语...
方昱春教授,同样作为一位CV学者,指出手语识别的复杂性远超人脸识别,并基于七年的研究经验,对手语数据的收集和管理提出了见解,指出面部隐私保护技术“DeID”,可能为手语数据的安全共享提供新的解决方案。这场论坛不仅促进了技术交流,更是跨学科合作的典范,正如在圆桌结束后观众所言:如果说交叉学科研究中最稀缺...
倪兰教授认为,过去人们普遍认为只要理解单个手势的含义就能解决手语识别问题,但当AI和数字人出现后,机械地将汉语词汇翻译成手语,听障群体却难以理解机器自动生成的手语。 倪兰教授比喻说:“就像外国人学习中文,如果他们按照英语的句法结构来组织汉语词汇,那么他们说的汉语可能会让人难以理解。同样,手语也需要遵循其自身的...
由此产生的“手语识别”是一个多学科交叉的研究课题,既要懂语言学,还要懂得计算机科学、认知神经科学、心理学等等。那么何谓“手语识别”呢?即通过机器能识别,准确地翻译出自然手语这门空间语言所表达的完整意思。 1 我国手语识别成果喜人 如果要研究手语识别,首先要了解手语,认识手语,了解聋人的需求。随着社会的文明...
为了便于听人与聋人的无障碍交流,视频手语识别被广泛研究。由于标注成本高昂,现有手语数据规模十分有限。本报告将围绕低资源的视频手语识别,介绍个人近期的一些研究工作,包括如何通过融合手型先验、手语预训练等方式提升在对应手语识别子任务上的性能。最后,对未来研究进行展望。
手语识别是指通过计算机算法,自动将听障人士所用的手语转换为文字语言的一种技术。它的实现,很像人类翻译师接受培训的过程。 首先进行手势数据采集,构筑一本专门指导机器的“手语学习指导书”。 具体来说,首先采集真人的视频手语数据,并从视频中提取手势动作信息。就像每一本指导书都有参考答案一样,每个手势都会被加...