ShareGPT格式的数据集中,一般是如下格式: [{"conversations":[{"from":"human","value":"I saw a dress that I liked. It was originally priced at $200 but it's on sale for 20% off. Can you tell me how much it will cost after the discount?"},{"from":"function_call","value":"{\"...
ShareGPT is a Chrome extension that allows you to share your wildest ChatGPT conversations with one click.
Alpaca 格式适用于指令驱动的任务,如文本生成、摘要、翻译等,具有清晰的指令、输入和输出字段。 ShareGPT 格式则侧重于多轮对话,适用于对话系统的训练,模拟用户与 AI 的交互。 如果是基于指令的任务,Alpaca格式是理想的选择;如果是对话模型,ShareGPT格式会更合适。 长风破浪会有时,直挂云帆济沧海! 可通过下方链接找...
ShareGPT ShareGPT 最早是chrome的一个插件,用于方便的分享ChatGPT的对话。2024年不再维护,API不能使用了。ShareGPT Dataset是用sharegpt插件收集的大家分享的用chatgpt生成的对话数据集。基础格式如下,需要指定role(也就是from)和content(也就是value) [ { "from": "human", "value": "How to tell if a c...
ShareGPT4V来源于从先进的GPT4-Vision模型获得的10万条「图像-高度详细的文本描述」数据。研究者们从多种图片数据源(如COCO,LAION,CC,SAM等)搜集图片数据,接着使用各自数据源特定的prompt来控制GPT4-Vision产生高质量的初始数据。如下图所示,给GPT4-Vision模型一张《超人》剧照,其不仅可以准确地识别出《...
作者推出了ShareGPT4Video系列,旨在通过密集且精确的标题,促进大型视频语言模型(LVLMs)的视频理解和文本到视频模型(T2VMs)的视频生成。该系列包括:1) ShareGPT4Video,标注了40K个各种长度和来源的视频的GPT4V密集标题,通过精心设计的数据过滤和标注策略开发而成。2) ShareCaptioner-Video,一个高效且强大的任意视频字幕...
近期,中国科学技术大学与上海AI Lab的研究团队成功开源了ShareGPT4V数据集,这一举措不仅为多模态研究注入了新的活力,更是在性能上超越了同级的7B模型,引领了多模态性能的新飞跃。 一、ShareGPT4V数据集概述 ShareGPT4V是一个包含120万条高质量图像-文本描述的数据集,其数据来源广泛且多样,涵盖了世界知识、对象属性...
ShareGPT 数据评估 ShareGPT浏览人数已经达到4,731,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:ShareGPT的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您...
ShareGPT共享chatGPT会话存在XSS 昨天(3月8号)chatGPT的历史会话保存功能无了(…崩了可能?或者是下线了?),新的会话都无法保存,历史会话全部丢失 于是乎,为了方便存会话,后来就找到了这个浏览器插件——https://sharegpt.com/ 它可以把chatGPT的会话保存下来,生成一个共享链接,让大家一起浏览你觉得不错的会话,...
最近,来自中国科学技术大学、北京大学、上海 AI Lab等团队的研究人员发布了引人瞩目的 ShareGPT4Video系列,旨在提升视频理解和生成能力。