Crowd Violence设计为评估暴力检测在密集人群场景中的质量,与真实场景很接近,但是数据集仍然不足,且质量不高。RWF 2000从You Tube中采集,包括2000个clip,所有都是从安防摄像头中获取,没有经过多媒体技术的修改,因此可以用于现实应用。 Algorithm 由于视频中连续帧高度相关,而对于识别人的行为的兴趣领域往往仅