【方案一】使用Hash函数 + 分文件的方式 使用hash函数将第一个文件的所有整数映射到1000个文件中,每个文件有1000万个整数,大约40M内存, 内存可以放下,把1000个文件记为 a1,a2,a3...a1000,用同样的hash函数映射第二个文件到1000个文件中,这1000个文件记为b1,b2,b3...b1000,由于使用的是相同的hash函数,所以...
给两个文件,分别有100亿个query,我们只有1G内存,如何找到两个文件交集?分别给出精确 算法和近似算法? 参考答案 精确算法:Hash分桶法 • 将两个文件中的query hash到N个小文件中,并标明query的来源 • 在各个小文件中找到重合的query • 将找到的重合query汇总 近似算法:BloomFilter ...
所以两个文件中一样的数字会被分配到文件下标一致的文件中,分别对a1和b1求交集,a2和b2求交集,ai和...
精选谷歌、微软等知名IT企业的50余道典型面试题,从基础知识、代码质量、解题思路、优化效率和综合能力五个方面系统整理了影响面试的5个要点。