基于tiny-YOLOv3提出了一种目标检测,单目深度估计和语义分割的三任务神经网络tiny-depth-YOLO,实现在实时视频通信中对背景人员的隐私保护.采用编码器-解码器结构,将逐像素的稠密深度估计转换为深度标签,并同YOLO的边界框,置信度,分类标签一同训练,在推理阶段,直接回归出带有深度的目标检测信息.采用MobileNet的深度可分离...