位置敏感哈希算法(LocalitySensitiveHashing, LSH)tS,~是近似最近邻搜索算法中最流行的一种,它有 坚实的理论依据并且在高维数据空间中表现优异I31。 位置敏感哈希算法将相似度较高的样本映射到同 收稿日期:2012一l1-19 基金项目:黑龙江省教育厅2013年度科学技术研究(面上)项目(12531089)。
使用真实数据集对位置敏感哈希算法的理论性能与实际性能进行对比分析,在实验上验证了二者是完全不同的。(2)传统位置敏感哈希算法性能分析所基于的前提在实际应用中并不存在,因而会导致理论分析结果与实际性能不符合。在实验中表现为位置敏感哈希算法的召回率会在理论值附近上下波动,而非精确相等。为此,我们提出了新的...
在广泛阅读国内外参考文献的基础上,本文对位置敏感哈希算法进行了系统的研究。在研究中,我们发现位置敏感哈希理论与基于该理论的算法实现有着本质差别,而这一差别导致应用传统性能分析方法所得到的分析结论是不正确的。 为此,本文从位置敏感哈希算法性能分析入手开展研究工作,论文工作包括: (1)阐述了位置敏感哈希理论和...
目前的主要方法都基于用户-匿名器-基于位置的服务(locationbasedservices,lbs)模型。提出了一种基于位置敏感哈希分割的空间k-匿名共匿算法。这种算法在保距性和共匿性方面都可以满足要求,而且算法具有适度的计算复杂度。最后,针对有效性(最小化匿名空间区域)和效率(构建代价)做了实验,证明所提出的算法具有良好的性能...
基于位置敏感哈希的海量文本数据查询算法研究