文本到视频生成扩散模型由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,从而实现视频生成的功能。 发布于 2023-07-07 13:54・IP 属地浙江 ...
基于Unet++网络结构建筑物抗震能力评价研究 秦玉来 【期刊名称】《中国新技术新产品》 【年(卷),期】2024()8 【摘要】为了快速评价建筑物的抗震能力,本文基于Unet++网络结构,建立了抗震能力评价模型,主要功能包括特征图的跳跃连接、深度监督机制、信息输入与输出。完成理论建模后,将某城市的一个下辖区作为评价对象,...