2024 年 1 月 19 日,业界首个网络安全大模型评测平台 SecBench 正式发布,该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授 / 夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室 OpenCompass 团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨...
表中的数字表示平均正确率。特别地,腾讯混元大模型在该项测试中列位第一 (94.28%),分数明显高于包括OpenAI o1和GPT系列在内的所有其他大模型。此外,混元大模型在逻辑推理问题 (Logical Reasoning - LR) 上的表现也显著高于其他所有模型 (93.06%),展现了其在处理具有挑战的网络安全问题时的强大性能。 打开网易新闻 ...
2024年1月19日,业界首个网络安全大模型评测平台SecBenc正式发布,该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室OpenCompass团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全...
2024年1月19日,网络安全大模型评测平台SecBenc正式发布,该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室OpenCompass团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全领域的落地...
2024年1月19日,业界首个网络安全大模型评测平台SecBench正式发布,该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室OpenCompass团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全...
2024年1月19日,业界首个网络安全大模型评测平台SecBench正式发布,该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室OpenCompass团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全...
针对开源大模型在网络安全应用中安全能力的评估难题,腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室OpenCompass团队,共同建设了业界首个网络安全大模型评测平台SecBench。旨在为大模型在安全领域的落地应用选择基座模型提供参考...
表中的数字表示平均正确率。特别地,腾讯混元大模型在该项测试中列位第一 (94.28%),分数明显高于包括 OpenAI o1 和 GPT 系列在内的所有其他大模型。此外,混元大模型在逻辑推理问题 (Logical Reasoning - LR) 上的表现也显著高于其他所有模型 (93.06%),展现了其在处理具有挑战的网络安全问题时的强大性能。
1月19日,业界首个网络安全大模型评测平台SecBenc正式发布。该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授/夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室OpenCompass团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全领域的...
表中的数字表示平均正确率。特别地,腾讯混元大模型在该项测试中列位第一 (94.28%),分数明显高于包括OpenAI o1和GPT系列在内的所有其他大模型。此外,混元大模型在逻辑推理问题 (Logical Reasoning - LR) 上的表现也显著高于其他所有模型 (93.06%),展现了其在处理具有挑战的网络安全问题时的强大性能。