rgb_to_ycocg函数有一个4x8位通道交错缓冲器(BGRA)和3个输出缓冲器(Y、Co和Cg),每个输出缓冲器都是16位值。目前,我正在使用这段代码: void rgb_to_ycocg(const uint8_t *pSrc, int32_t srcStep, int16_t *pDst[3], int32_t dstStep)相比,我的性能很差。我知道我需要尝试更好的...