是一种资料压缩(data compression)技术,将数个资料或码向量合并成一向量,再一起量化。它使用一个包含多个码字(codeword or codevector)之码书(codebook),编码时利用最小误差原理,由码书中搜寻最佳之码字,用以代表输入向量,而只记录或传送此码字之指标(index),因指标之资料量远小于输入向量之资料量,因此具有良好之...
代码向量使ML从业者能够解决以前只有高度专业化的软件工程知识才能解决的代码问题。相反,代码向量可以帮助软件分析师利用一般的,现成的ML工具,而无需成为ML专家。在这篇文章中,我介绍了ML代码的一些用例。我还解释了为什么代码向量是必要的以及如何构造它们。最后,我将介绍SEI中代码矢量 java 数据向量化 机器学习 ML ...