目前,论文已被NeurIPS Datasets and Benchmark Track 2024接收。其主要有三个特点:1. TEG-DB datasets提供了涵盖4个领域9个统一格式的TEG数据集,规模从小到大不等,均包含丰富的节点和边的原始文本数据,这些数据集填补了TEGs领域的空白,旨在为相关研究提供重要数据集资源。2. 研究人员开发了TEGs研究的标准化流...
多年来,浙江大学周晟老师团队与阿里安全交互内容安全团队持续开展产学研合作。近日,双⽅针对标签噪声下图神经⽹络的联合研究成果《NoisyGL:标签噪声下图神经网络的综合基准》被 NeurIPS Datasets and Benchmarks Track 2024 收录。本次 NeurIPS D&B Track 共收到 1820 篇投稿,录⽤率为 25.3%。论文标题:Noisy...
近日,双⽅针对标签噪声下图神经⽹络的联合研究成果《NoisyGL:标签噪声下图神经网络的综合基准》被 NeurIPS Datasets and Benchmarks Track 2024 收录。本次 NeurIPS D&B Track 共收到 1820 篇投稿,录⽤率为 25.3%。 论文标题:NoisyGL: A Comprehensive Benchmark for Graph Neural Networks under Label Noise ...
近日,双⽅针对标签噪声下图神经⽹络的联合研究成果《NoisyGL:标签噪声下图神经网络的综合基准》被 NeurIPS Datasets and Benchmarks Track 2024 收录。本次 NeurIPS D&B Track 共收到 1820 篇投稿,录⽤率为 25.3%。 论文标题:NoisyGL: A Comprehensive Benchmark for Graph Neural Networks under Label Noise ...
论文题目:VERIFIED: A Video Corpus Moment Retrieval Benchmark for Fine-Grained Video Understanding (NeurIPS 2024 Track on Datasets and Benchmarks)论文链接:https://arxiv.org/pdf/2410.08593主页链接:https://verified-neurips.github.io/ 一、介绍 视频语料库时刻检索(VCMR)旨在根据文本查询从大量视频...
论文二:JailbreakBench(Datasets and Benchmarks Track) 论文地址:https://arxiv.org/pdf/2404.01318 JailbreakBench是全新评估大模型越狱能力的基准。上个月,该数据集在HuggingFace上,被下载了2500次。 而且,多家媒体还使用了这个越狱神器,Gemini 1.5技术报告中也将其用于模型稳健性的评估。
目前,该论文已被 NeurIPS 2024 Datasets and Benchmarks Track 接收为 Spotlight,并已开源完整数据集和相关代码。 论文链接: https://arxiv.org/abs/2409.13832 Demo链接: https://gtsinger.github.io/ 数据链接: https://huggingface...
多年来,浙江大学周晟老师团队与阿里安全交互内容安全团队持续开展产学研合作。近日,双⽅针对标签噪声下图神经⽹络的联合研究成果《NoisyGL:标签噪声下图神经网络的综合基准》被 NeurIPS Datasets and Benchmarks Track 2024 收录。本次 NeurIPS D&B Track 共收到 1820 篇投稿,录⽤率为 25.3%。
论文二:JailbreakBench(Datasets and Benchmarks Track) 论文地址:https://arxiv.org/pdf/2404.01318 JailbreakBench是全新评估大模型越狱能力的基准。上个月,该数据集在HuggingFace上,被下载了2500次。 而且,多家媒体还使用了这个越狱神器,Gemini 1.5技术报告中也将其用于模型稳健性的评估。
论文二:JailbreakBench(Datasets and Benchmarks Track) 论文地址:https://arxiv.org/pdf/2404.01318 JailbreakBench是全新评估大模型越狱能力的基准。上个月,该数据集在HuggingFace上,被下载了2500次。 而且,多家媒体还使用了这个越狱神器,Gemini 1.5技术报告中也将其用于模型稳健性的评估。