根据《纽约时报》报道,除了已经用掉的英文文本数据,OpenAI 的研究人员创建了一个名为 Whisper 的语音识别工具,转录了 100 多万小时的 YouTube 视频中的音频来训练 GPT-4。三位知情人士中的两人说,OpenAI 总裁 Greg Brockman 也亲自帮助收集视频。即使 OpenAI 的一些员工讨论了此举可能违反 YouTube 规则的问题,...
据《纽约时报》4月6日报道,随着2021年底OpenAI面临数据供应问题,研究人员创建了一款名为Whisper的语音识别工具,用以将YouTube视频转录为对话文本,最终转录了超100万小时的YouTube视频,用于训练GPT-4。YouTube禁止将其视频用于“独立”于该视频平台的应用程序,OpenAI的做法可能违反了YouTube的规则。《纽约时报》记者...
最后来问问大家,你是GPT-4用户么?最近几周有感到GPT-4能力下降么?欢迎在评论区聊聊。Bubeck演讲:https://www.youtube.com/watch?v=qbIk7-JPB2c张弋访谈:https://xyzfm.link/s/UfTan0每天一个GPT-4独角兽https://gpt-unicorn.adamkdean.co.uk 参考链接:[1]https://news.ycombinator.com/item?id=...
Live Demo:报税、写诗、写代码,无所不能 如果说着这些数据、案例,似乎还难以让人直观感受到GPT-4的真正实力,那么OpenAI的总裁和联合创始人Greg Brockman,就亲自在YouTube上进行了一把直播,来实时演示Live Demo中,展示了GPT-4的真正实力——总结文章、写代码、报税、写诗……GPT-3.5做不到的, GPT-4轻松...
近日,《纽约时报》报道,科技巨头OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型,这一行为可能侵犯了YouTube创作者的版权。据报道,OpenAI通过使用其Whisper语音识别工具,转录了超过一百万小时的YouTube视频内容,并将这些数据用于训练其GPT-4模型。同时,谷歌也被曝出使用YouTube视频来训练自家的...
同时,各地公共文化和旅游惠民活动多有推陈出新。(来源:财联社)报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4 本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到属于 AI 版权法模糊灰色...
报道称,OpenAI 迫切需要训练数据,并开发了 Whisper 音频转录模型来克服困难,转录了超过 100 万小时的 YouTube 视频来训练其最先进的大型语言模型 GPT-4。报道提到,OpenAI 在 2021 年耗尽了有用的数据供应,并在耗尽其他资源后讨论了转录 YouTube 视频、播客和有声读物的可行性。此外,OpenAI 使用了包括来自 ...
Tonio Buonassisi在教育方面展现出了极高的热情和才能。他曾荣获麻省理工学院Everett Moore Baker杰出本科教学奖,他的教学影响不仅局限于课堂,还通过其OpenCourseware/YouTube光伏讲座系列获得了超过179,000次观看。他最近还制作了一系列名为「加速材料制造」的YouTube视频,重点关注人工智能在材料研究中的应用。Yoon Kim...
据《纽约时报》4月6日报道,随着2021年底OpenAI面临数据供应问题,研究人员创建了一款名为Whisper的语音识别工具,用以将YouTube视频转录为对话文本,最终转录了超100万小时的YouTube视频,用于训练GPT-4。YouTube禁止将其视频用于“独立”于该视频平台的应用程序,OpenAI的做法可能违反了YouTube的规则。《纽约时报》记者...
据报道,OpenAI在开发其最新一代大型语言模型GPT-4的过程中,面临着训练数据枯竭的问题。为了丰富和扩大模型的训练素材,这家AI巨头采取了一种颇具争议的方法——借助其自主开发的Whisper音频转录模型,从YouTube平台转录了超过一百万小时的视频内容,旨在提升模型对多样化语言环境和复杂语境的理解能力。2021年,OpenAI在...