凭借所有这些技术,我们的解决方案最终在 WSDM Cup 2024 中排名第一,超越在很大程度上是其竞争对手。关...
在第十七届国际互联网搜索与数据挖掘会议(The 17th International Conference on Web Search and Data Mining, WSDM 2024)上,来自中国科学院计算技术研究所的张兆与李一鸣两位同学获得 WSDM CUP 2024 挑战赛第一名的优异成绩。会议于3月4日至3月8日在墨...
在本文中,我们介绍了 WSDM Cup 2024 中“对话式多文档 QA”挑战赛的获胜方法,该方法利用了大型语言模型 (LLM) 卓越的自然语言理解和生成能力。 在方案中,首先让大模型适应该任务,然后设计一种混合训练策略,以充分利用领域内的未标记数据。 此外,采用先进的文本嵌入模型来过滤掉潜在的不相关文档,并为模型集成设计...
本届会议论文录用率仅约15%,并且WSDM历来注重前沿技术的落地应用,每届大会设有的WSDM Cup环节提供工业界真实场景中的数据和任务用以研究和评测。 今年的WSDM Cup设有3个评测任务,吸引了微软、华为、腾讯、京东、中国科学院、清华大学、中国台湾大学等众多国内外知名机构的参与。美团搜索与NLP部继去年获得了WSDM Cup ...
WSDM Cup:多语种聊天赛 最近参加了Kaggle的WSDM Cup - Multilingual Chatbot Arena比赛,感觉有必要分享一下我的观察和感受。这次比赛主要涉及到LLM(Large Language Model)的应用,模型调参,分类任务,以及一点点强化学习的内容。 📈 赛事难度:整体来说,这次比赛的难度不算特别高,大概在1到5星之间,算是比较友好的。
刚刚在墨尔本结束的第12届WSDM大会传来一个好消息,由美团搜索与NLP部NLP中心的刘帅朋、刘硕和任磊三位同学组成的Travel团队,在WSDM Cup 2019大赛 “真假新闻甄别任务” 中获得了第二名的好成绩。队长刘帅朋受邀于2月15日代表团队在会上作口头技术报告,向全球同行展示了来自美团点评的解决方案。本文将详细介绍他们本...
第17 届 ACM 国际 WSDM 会议于 2024 年 3 月 4 日至 3 月 8 日在墨西哥举行,WSDM Cup 2024 旨在为全球参赛者提供真实工业环境下开展算法评测和研究的平台。 「对话式多文档问答」挑战赛 Conversational Multi-Doc QA 赛题任务 每个月有数以亿计的用户在小红书上分享和发现生活的美好,并在小红书海量笔记中...
这些行为是对任何科学家和技术人员所要求的最高诚信的冒犯,并且如果任其发展,可能会破坏公众的信任并阻碍科学技术的未来发展。该竞赛是该系列竞赛中的第一场竞赛,探讨了网络搜索和数据挖掘技术在多大程度上可以用来区分多余的引文和真实的引用识别。赛题详解可参考:https://biendata.com/competition/wsdm2020/...
美团搜索与NLP部与国内两所高校组队,提出了一种基于BERT和LightGBM的多模融合检索排序解决方案,拿下了WSDM Cup 2020 Task 1榜单的第一名。本文系获奖作者的经验总结文章。 1. 背景 第13届“国际网络搜索与数据挖掘会议”(WSDM 2020)于2月3日在美国休斯敦召开,该会议由SIGIR、SIGKDD、SIGMOD和SIGWEB四个专委会共同...
说实话这个比赛的notebook里没有什么有价值的开源, EDA EDA: WSDM Cup - Multilingual Chatbot Arena WSDM Sentiment Analysis EDA TensorFlow Please be Boring Gemma2Keras Languages we speak Gemma2 हम ज…