dd bs=1M count=128 if=/dev/zero of=test dd bs=1M count=128 if=/dev/zero of=tes...
适配pytorch 时使用 aclrtMalloc(p, nbytes, ACL_MEM_MALLOC_HUGE_FIRST) 来申请显存,使用中发现 910B 的显存会有无法理解的增长 。比如 在上层不做任何cache, 每次使用显存都调用 aclrtMalloc的情况下; 创建一个约 100个 参数共1B 大小的 fp16 模型,显存理应占用 2GB, 在cuda上也确实如此。但是在 910b...
NPAPI插件:不要使用malloc,使用NPN_MemAlloc,前者在windows上会崩溃,后者则正常。释放也使用NPN_MemFree。根据测试经验,释放时经常出错,或者参数传递不了。在进行参数交互的时候,必须这样做。...