GPT-4o 现在可以实时查看和分析事物,可以帮助盲人描述当前环境,还能帮忙打车。唯一的 bug 是需要随时举着手机,要是能做成眼镜就更 perfect 了。视频链接:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg 2.「充当」语音客服 给客服 GPT-4o 找茬儿?很难!哪怕是处女座!一名叫 Joe 的小哥编了一...
尽管GPT-4o在多模态能力上 有所提升 但OpenAI并未展示出真正的视觉多模态突破功能在实时音频交互方面市场上已有产品具备类似功能ChatGPT虽处高光背后也有危机OpenAI CEO山姆·奥特曼(Sam Altman)曾表示未来五年OpenAI最大的瓶颈可能会出现在供应链和计算资源方面另一方面OpenAI也一直因版权问题受到质疑发布会前不久美国八...
在第三个场景里,巴雷特希望GPT辅导自己做数学题,但不能直接说答案,而是要一步一步给出解题思路。这个任务对GPT-4o就是小菜一碟,于是巴雷特加大了任务难度,把一串源代码展现给GPT-4o看,然后要求GPT-4o用一句话描述这段代码的含义。没有一秒钟迟疑,GPT-4o就给出了巴雷特想要的答案。最后一个场景是,米拉...
北京时间3月26日凌晨,OpenAI发布了GPT-4o的原生图像生成功能。这两天,随着吉卜力风格AI图像成了社交平台的焦点,大家才重新审视这次“重磅”发布。此文作者张好蔚,95后,从零开始接触AI,自学用comfy生图流搭建了一套“文生图”视觉系统——目前大部分文生图应用也是这么来的。但GPT-4o来了,似乎她妈这样的...
GPT-4o的取名可见其深意,O代表“Omini”,意思是无所不能的。从现场表现来看,它也算是“o如其名”了。首先是实时语音对话,GPT-4o加持下的新ChatGPT不仅无缝接梗,情绪价值也直接拉满。比如,研发负责人Mark Chen表示自己因为上台紧张,ChatGPT便温柔地鼓励道:“你在台上做演示吗?那你真的太棒了!深呼吸...
“GPT-4o的特别之处,在于它将GPT-4级别的智能带给了所有人,包括我们的免费用户。”北京时间5月13日凌晨,早有预告的OpenAI春季更新如期而至。在这次总时长不到半个小时的发布会中,圈内最熟悉的公司首席执行官山姆 奥特曼(Sam Altman)并未现身,首席技术官穆里 穆拉蒂(Muri Murati)及两名研究主管马克 陈...
近日,OpenAI正式发布GPT-4o,上线语音交互等新功能,比GPT-4速度快两倍,能实现无延迟实时对话,开放免费使用权限,所有用户均可免费使用该模型,并将推出桌面版的ChatGPT和新的用户界面。那么,什么是GPT-4o?GPT-4o是否会代替Siri,成为未来智能助手的“领军者”呢?GPT-4o到底有多强?GPT-4o是GPT-4的迭代...
当地时间5月13日,OpenAI通过直播展示了产品更新。与此前传出的市场消息不同,OpenAI并未推出搜索引擎,也未推出GPT-4.5或GPT-5,而是发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。此前OpenAI公司CEO奥尔特曼(Sam Altman)就已经否认了公司将会发布GPT-5,他表示新版...
这应该就是一个简化的GPT4-o的架构,当然一些细节OpenAI也不会公布,其实大家可以理解,OpenAI现在已经不是一个技术工作,它是一个工程化和产品化非常牛B的公司,所以这部分核心能力,是不太会公布的。 我们可以窥一斑而知全豹,比如下面的链接 http://openai.com/gpt-4o-contributions/ ...