Ascend ModelZoo,欢迎各位开发者贡献要求开发者提交的模型包括源码、readme、参考模型license文件、测试用例和readme,并遵循以下标准请贡献者在提交代码之前签署CLA协议,“个人签署”,链接如您完成签署,可在自己提交的PR评论区输入/check-cla进行核实校验说明:本仓子模块如下:TensorFlowTensorFlow贡献子仓 PyTorch PyTorch...
模型转换,使用onnx模型转换为om模型时,执行信息保存在model_om_epoch_17.txt 中,执行命令为atc --model=epoch_17_1_int32.onnx --framework=5 --output=epoch_17_nofp --soc_version=Ascend310P3 --input_shape="input:1,3,800,1333" 使用ait benchmark --om-model ../itivsdd_om/model/epoch_17...
frame #12: torch::autograd::Engine::thread_init(int) + 0x39 (0x7fe1d64d4359 in /home/LY/anaconda3/lib/python3.7/site-packages/torch/lib/libtorch_cpu.so) frame #13: torch::autograd::python::PythonEngine::thread_init(int) + 0x38 (0x7fe2030ab828 in /home/LY/anaconda3/lib/python3....
https://gitee.com/ascend/modelzoo/wikis/checkpoint转换为pb的注意点?sort_id=2865370 我们在模型转换时有一些输入节点,上面wiki所说的节点是否是下图中的节点: 曹仁平 4年前 复制链接地址 convert_variables_to_constants后面两个列表默认是不传的,第一个列表是传入需要转换的节点,默认是全部节点转换,第二个...
To make it easier for developers to enjoy the benefits of Ascend ModelZoo, we are continuing to add typical networks and related pre-trained models. If you have any needs, open an issue on modelzoo/issues or Ascend BBS, and we will response to it in a timely manner. Contribution Before...
按照https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/PyTorch/contrib/cv/detection/CenterNet链接的readme文档进行操作,单机8卡可以成功训练模型,按照文档开始训练——> 训练模型——> 多机多卡训练部分操作,多级多卡训练失败 四、部分日志信息如下
由于目前不清楚是否pytorch_npu1.11.0无法单机多卡训练(DDP),因此用modolzoo中的docker镜像的环境(cann6.3.RC2,pytorch:1.11.0,链接为:https://ascendhub.huawei.com/#/detail/pytorch-modelzoo)重新安装了一个python3.8同时按照教程安装了pytorch2.1.0和torch_npu对应版本,在原来的cuda环境下可以训练的脚本现在在tor...
--操作系统版本:Ascend:1*Ascend 910 CPU:24vCPUs 96GB 三、测试步骤: 直接运行test.py文件即可。test.py中写了运行三个.sh文件的代码,最后在写了运行mian_train.py的代码 四、日志信息: 代码链接 日志链接 bxf创建了Bug-Report3年前 bxf将关联仓库设置为Ascend/modelzoo3年前 ...
Ascend/modelzoo Issues /详情 [北邮]-[Seq2Seq]-[训练报错:Fatal Python error: Aborted] CLOSED 训练问题 codingth 创建于 2021-05-26 14:53 问题现象(附截图): 初步分析: run on the PyCharm ToolKit ModelArts: { "status": "completed",
一、问题现象(附报错日志上下文):之前用cuda跑的pytorch代码最近转换到用910B去跑,训练的正反向都正常,但是突然在前向传播的某一句(前几轮都不报错,而且在cuda种可以正常运行)报错...