一般来说,搜索引擎包括一个召回层(recall layer),其目标是以低延迟和低计算成本检索相关文档,通常称为检索(retrieval),以及一个精度层(precision layer),其目标是通过更复杂的算法或模型将最符合用户需求的文件排在最前面,通常称为排名(ranking)。虽然嵌入可以应用于两个层,但它在召回层通常有更多机会发挥作用,因为...
Search is a multi-stage ranking system where retrieval is the first stage, followed by various stages of ranking and filtering models. To wholly optimize the system to return those new good results and suppress those new bad results in the end, we performed later-stage optimization. In particul...
论文:Embedding-based Retrieval in Facebook Search 地址:https://arxiv.org/abs/2006.11632 摘要 相对于传统的网页搜索来说,社交网络中的搜索问题不仅需要关注输入query的信息,还需要考虑用户的上下文信息,在Facebook搜索中用户的社交图网络便是这种上下文信息中非常重要的一部分。虽然embedding的检索技术在传统的搜索引...
Embedding-based Retrieval in Facebook Search 这篇文章是facebook发表在KDD2020上的一篇关于社交网络中的搜索中的embedding 检索问题。 airxiv 地址arxiv.org/abs/2006.1163 不同于传统的网络搜索,社交网络上的检索问题不仅仅关注于query的文字信息,还要关注于个人的上下文信息。虽然embedding 的检索在其他的搜索引擎中...
Location features 这里就比较好理解了,在query增加搜索者的city, region, country, and language等信息,在doc侧也增加相应的信息。 单纯增加location feature大约有2%的提升 Social embedding features 文章没有具体说细节,应该是使用GNN或者GCN的变种编码Facebook的社交网络作为预训练的emb ...
Embedding-based Retrieval in Facebook Search ABSTRACT 在社交网络(如Facebook)中的搜索提出了与传统的web搜索不同的挑战:除了查询文本之外,考虑到搜索者的上下文以提供相关结果是很重要的。搜索者的社交图谱是上下文的一个组成部分,也是Facebook搜索的一个独特方面。尽管基于嵌入的检索(embedding-based retrieval ,EBR...
Embedding-based Retrieval in Facebook Search 2020.7 Facebook Brief summary: Text的boolean match不能解决语义匹配问题,引入embedding。(EBR) 双塔模型:query embedding;document embedding; hinge_loss 三元组作为训练样本
3.unified embedding model比单纯的text embedding召回率提升16%以上,在fb垂直搜索中有文本特征、定位特征和社交特征。 4.文本特征使用character n-gram比word n-gram鲁棒性更好(如针对拼写错误的查询)。文本embedding在模糊匹配和选择匹配场景比传统布尔检索好。
Embedding-based Retrieval in Facebook Search 文献翻译,Embedding-basedRetrievalinFacebookSearch摘要:在Facebook等社交网络中进行搜索与经典网络搜索相比面临不同的挑战:除了查询文本之外,考虑搜索者的
今天分享的是 Facebook 发表在 KDD 2020 上的推荐论文《Embedding-based Retrieval in Facebook Search》 1. 背景 不同于传统的网络搜索,社交网络上的检索问题不仅仅关注于 query 的文字信息,还要关注于个人的上下文信息以及用户画像。(例如在 Facebook 场景中搜索 “John Smith”,在 Facebook 上可能有成千上万个...