这两天看了下neon,f32x4,u64x2这种把数据类型写得清清楚楚的设计的确合我胃口(sse就俩,__m128和__m128i),但代价就是操作起来vreinterpretq满天飞……(也怪C不支持函数重载)不过neon的shuffle支持太弱了吧,隔壁一条指令的事。而且bitwise指令好像浮点整数通用,硬件上也走同一条pipeline的吗?Intel却选的分离,相...