可以看到不支持 argmax 算子,当然不支持的算子还有很多,这里只谈论一种,后续不断的增加。 2、实现argmax函数 这里使用 ncnn::Mat 实现了 onnx 的 argmax 函数,其中要求 batch_size 为1,如果需要支持不为1的情况请自行修改代码,也就是在通道的 for 循环外再增加一个 batch 的循环,因为这里固定了只读取第0...
Numba + 单调队列实现 以上朴素 numba 实现中,避免了频繁 python 函数调用,时间上得到了优化,然而其复杂度仍然为 O(K线数量 * backhour),导致性能仍然不够完美 在算法领域,rolling argmax 有个标准最优解,需要使用单调队列来优化,其复杂度为 O(K线数量 + backhour),复杂度降低一个数量级 该算法具体原理较复杂...