人大附中吴悠,有一篇一作论文入选该赛道,还被选为了Spotlight Project。论文题为《Vision-Braille:An End-to-End Tool for Chinese Braille Image-to-Text Translation》,提出了一种中文盲文图像到文本的端到端翻译工具。据张铭教授介绍,吴悠在2022年高一加入她的课题组时,就提出了这个项目的想法。端到端中文盲...
NeurIPS2022 Spotlight | TANGO:一种基于光照分解实现逼真稳健的文本驱动3D风格化 1. 论文和代码地址 论文地址:https://arxiv.org/abs/2210.11277 [1] 代码地址:https://cyw-3d.github.io/tango [2] . 2. 动机 通过文本提示、图像或者3D形状等风格化的3D内容生成,在计算机视觉和图形学中有重要的应用。Text2...
1、引言 Transformer结构在包括点云配准在内的许多视觉任务展示出了巨大的潜力。位置编码作为顺序感知模块,在Transformer结构中扮演重要角色。针对3D点云配准任务,来自华中科技大学的研究团队提出了基于一个内点的位置编码实现高效点云配准。 首...
NeurIPS 2022(Spotlight):迭代融合:利用历史的融合学习 南京理工大学, 南开大学, NeurIPS 2022(Spotlight) 撰稿人:杨凌风,李翔 # 共同一作:杨凌风,李翔 *通讯作者:杨健 推荐理事:林宙辰 原文标题:RecursiveMix: Mixed Learning with History...
本文介绍的工作 GhostNetV2 是 GhostNet 的增强版本,被 NeurIPS 2022 接收为 Spotlight。 1.1.2 重新思考 Attention 对模型架构的影响 Self-attention 的优点是长距离建模的能力,但是计算复杂度与输入的分辨率大小呈二次方增长的关系,这对于高分辨率的图片而言是非常不友好的。而一些检测和分割任务都需要高分辨率的输入...
的理论框架 UNICORN(UNIfied Information Theoretic Framework of Context-Based Offline Meta-ReiNforcement Learning),将现有主流方法利用一个基于任务表征的通用互信息优化目标进行了统一,并凭借理论创新和全面的实验验证,成为离线及元强化学习领域的重要里程碑,被人工智能三大顶级会议 NeurIPS 2024 接收为 Spotlight ...
NeurIPS 2022 Spotlight | 生成式语义分割新范式GMMSeg,可同时处理闭集和开集识别 GMMSeg 同时具备判别式与生成式模型的优势,在语义分割领域,首次实现使用单一的模型实例,在闭集 (closed-set) 及开放世界 (open-world) 分割任务中同时取得先进性能。 当前主流语义分割算法本质上是基于 softmax 分类器的判别式分类模型...
近年来,通过基于体渲染技术的神经隐式表面学习来实现多视图三维重建成为计算机三维视觉领域研究的热点。然而,目前仍然存在一个关键性问题亟待解决:现有的方法缺乏明确的多视图几何约束,因此通常无法实现几何一致的三维重建。为了应对这一问题,我们提出了一种几何一致的神经隐式多视图三维重建算法。首先,我们从理论上分析了...
陈天睿:高中赛道SpotLight 今年NeurIPS专门设置了高中生赛道,结果有三名中国高中生的论文获得了Spotlight。上海星河湾双语学校的陈天睿,就是一位。他提出了用于精确地理定位和验证的多模态智能体,只需随意拍一张照片,就能得判断这张图片是在哪里拍的。目前产品已经到了可用阶段。整个项目从想法到落地,全都是他一个...
人大附中吴悠,有一篇一作论文入选该赛道,还被选为了Spotlight Project。 论文题为《Vision-Braille:An End-to-End Tool for Chinese Braille Image-to-Text Translation》,提出了一种中文盲文图像到文本的端到端翻译工具。 据张铭教授介绍,吴悠在2022年高一加入她的课题组时,就提出了这个项目的想法。