前言 昨天北京时间的凌晨,美国西雅图召开了计算机视觉盛会CVPR 2024,会上正式公布了最佳论文等奖项。 其中最佳学生论文奖得主之一的paper为Mip-Splatting: Alias-free 3D Gaussian Splatting。该论文由德国图宾根大学、图宾根AI中心、上海科技大学及布拉格捷克技术大学共同发表,其中三位华人作者均为上海科技大学在读或毕业的...
自动驾驶的一个关键组成部分是理解静态环境,例如道路布局和连接性,围绕着自动驾驶车辆(AV)的环境。因此,已经开发了高清晰度(HD)地图,用于捕获和提供此类信息,包含道路边界、车道分隔线和道路标志等语义,以厘米级别的精度。近年来,HD地图已被证明对AV的开发和部署至关重要,今天被广泛使用。然而,HD地图标注和长期维护...
来自多伦多大学等机构的最新论文被接收为Oral。 本文提出了一个通用的矢量化地图不确定性表述,并扩展了多个最先进的在线地图估计方法,使其额外输出不确定性估计,而不会降低纯建图性能。 论文地址:https://arxiv.org/pdf/2403.16439.pdf 香港大学团队提出的Total-Decom被CVPR 2024录用。最新算法可以分解重建的网格,为...
全像素双核(dual-pixel, DP)传感器最初被用于促进相机自动对焦。这种传感器的工作原理是将传统的图像传感器的每个像素一分为二,因而能够从一次拍摄中捕获两幅带有微小基线的图像对(DP pair),即左视图和右视图。这种图像对在对焦平面的左右视图几乎不存在视差,而离焦平面的左右视图存在视差,该视差又称为离焦视差。由于...
CVPR 2024 Oral:生命之树大模型 图1:使用CLIP目标(c)来训练一个ViT-B/16模型,该模型使用超过45万个不同的类标签,所有这些标签都来自生命之树的分类标签(a)。由于文本编码器是一个自回归语言模型,因此排序表示仅能依赖于高级别的分类,如类、门和界(b)。这自然导致了标签的层次表示,有助于视觉编码器学习更...
CVPR 2024 Oral开源!打通在线地图和轨迹预测中的壁垒! 点击下方卡片,关注「3D视觉工坊」公众号 选择星标,干货第一时间送达 来源:3D视觉工坊 添加小助理:dddvision,备注:方向+学校/公司+昵称,拉你入群。文末附行业细分群 扫描下方二维码,加入3D视觉知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:...
商汤披露:50篇论文入选CVPR 2024 一水 发自 凹非寺 量子位 | 公众号 QbitAI CVPR正在进行中,中国科研力量再次成为场内外焦点之一。 日前,AI顶会常客选手商汤科技,已经披露了今年成绩单:50篇论文入选,其中还有9篇被录用为Oral、Highlight。 这些成果,既是商汤科研和技术实力的最新证明,也透露着这家知名AI公司对于...
CVPR 2024 Oral开源!打通在线地图和轨迹预测中的壁垒! 来源:3D视觉工坊 添加小助理:dddvision,备注:方向+学校/公司+昵称,拉你入群。文末附行业细分群 扫描下方二维码,加入3D视觉知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门视频课程(星球成员免费学习)、最新顶会论文、计算机视觉书籍、...
IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2024 - Oral [ Backbone ] [PTv3] - [arXiv] [Bib] [Project] →here OA-CNNs: Omni-Adaptive Sparse CNNs for 3D Semantic Segmentation Bohao Peng, Xiaoyang Wu, Li Jiang, Yukang Chen, Hengshuang Zhao, Zhuotao Tian, Jiaya Jia...
[CVPR 2024 Oral] InternVL Family: A Pioneering Open-Source Alternative to GPT-4o. 接近GPT-4o表现的开源多模态对话模型 - zhaopufeng/InternVL