刘聪NLP 3月24日 10:10 来自HUAWEI Mate 50 转发微博 @零重力瓦力 一款基于多模态大模型的 SVG 代码生成器。它将矢量化任务转换为代码生成任务,直接在 SVG 代码空间进行解析和生成。这种方式的最大优势在于,它不单单是对图像轮廓的拟合,而是结合了视觉和语言模型的能力,理解图像的语义结构,从而生成更紧凑...
刘聪NLP 2025-03-31 R1复现小记:在业务场景的两类NLP任务上有显著效果 云原生大模型向量数据库机器学习 在近期业务优化中尝试将强化学习(RL)技术迁移至两类NLP任务,均取得显著效果提升,跟大家分享一下实验结论。 70 0 0 0 刘聪NLP 2025-03-31 R1-Zero(GRPO)的复现实验记录,踩坑问题(小模型) AI大模型...
刘聪NLP LLM(大型语言模型)话题的优秀答主 大家好,我是刘聪NLP。 刚刚刷到的,小米也开源了大模型-MiMo-7B。 HF:https://http://huggingface.co/XiaomiMiMoPaper:https://http://github.com/XiaomiMiMo/MiMo这是一个参数级别为7B的系列模型,共包括4个,Base,Base… ...
刘聪NLP 新知答主 感谢知乎的认可!被评为2024年度新知答主的我,很激动,很兴奋,很开心!这里是NLP刘聪,如货币般流通! 这里的刘聪,不会rapper,只读paper!哈哈哈,抖个机灵~我是科技互联网领域答主-刘聪NLP。 我玩知乎已经7年10个月,虽不是第一批内测的知友,也没有十年的知龄,但也确实不短了。我和知乎...
刘聪NLP 25-01-28 10:42 发布于 辽宁 来自 HUAWEI Mate 50 入驻微博啦,以后多分享AIGC前沿知识,欢迎讨论。#大模型##新人##人工智能# û收藏 2 3 ñ5 评论 o p 同时转发到我的微博 按热度 按时间 正在加载,请稍候......
NLP领域的标准工具书!深入解析ChatGPT技术、算法、原理和训练方法 作者:刘聪 杜振东 涂铭 沈盛宇 [瑞士]路易斯·汤斯顿,[瑞士]莱安德罗·冯·韦拉,[法]托马斯·沃尔夫出版社:机械工业出版社出版时间:2024年06月 手机专享价 ¥ 当当价 降价通知 ¥178.50 定价 ¥238.00 ...
开源了首个中文Unilm预训练模型、中文GPT2、夸夸闲聊机器人(ChatBot)、大模型微调等项目。作为主要负责人,在多项自然语言处理比赛中获得前三名,在中文核心期刊和SCI发表多篇论文,有多项发明专利。知乎ID为“刘聪NLP”,拥有公众号“NLP工作站”。 杜振东
冲冲冲 Uranus: 110K r1 中文蒸馏数据集来了 | 周末花了点时间和 @刘聪NLP 一起,基于我司的平台捣鼓出了一个可能是现在最全面的 r1 蒸馏数据集,希望能为大家的工作 or research 提供帮助 :D 链接 发布于 2025-02-17 21:44・IP 属地江苏 赞同5 分享收藏 ...
知乎知学堂 等你来答 切换模式 登录/注册 刘聪NLP 大模型话题下的优秀答主 发布于 2025-03-11 23:43・IP 属地江苏 写下你的评论... 还没有评论,发表第一个评论吧 登录知乎,您可以享受以下权益: 更懂你的优质内容 更专业的大咖答主
来自DeepSeek研究员的R1本地部署使用技巧 - 温度设置建议将温度参数设在0.5到0.7之间,最好用0.6。可以避免模型输出重复或无逻辑的回答。 - 提示信息规范请不要额外添加系统级的提示,所有说明内容都应直接写...