MINT-1T是一个包含一万亿token的多模态预训练数据集,它是史上最大的同类数据集,并且比以前的开源数据集更加多样化。 把开源多模态数据集的规模扩展了10倍,达到万亿token! 数据集来源于HTML、PDF和ArXiv论文等不同源,都是精挑细选的好货,妈妈再也不用担心我的AI吃不饱了! 论文标题: MINT-1T: Scaling Open-...
Feature request / 功能建议 请问多模态glm-4v-9b可以只用文本数据集lora微调吗,因为想改变他的自我认知,如果只能通过带images路径的数据集微调自我认知,要注意些什么,有推荐的微调工具吗 Motivation / 动机 想改变glm-4v-9b多模态模型的自我认知 Your contribution /
【7月18日大模型日报合集】DeepLearning 新的LLM预训练短期课程; 图基础模型GraphFM:在152个数据集上进行训练; LLM模型之高质量数据选择和微调方法; rl-mpc-locomotion PPT解读(梳理了四足机器人运动学和动力学,MPC,WBC,RL(PPO)); 不存在什么原生多模态模型; 场景融合与 ROI 考量:金融大模型落地的两大困境有解...
“大脑”的感知/地图定位/预测/决策/规划功能模块或者端到端学习的传感器数据(摄像头/雷达/激光雷达/GPS/IMU/超声波等)- 车辆控制命令(加速/刹车/转向)、管理计算资源分工协作的操作系统软件平台、底层支持线控的车体控制平台、连接云端服务器(比如高清地图)的接口、车联网通信平台以及车内多模态(图像/语音/图形)...