OpenAI同时降低了Realtime API的收费,将GPT-4o音频的定价降低了60%,降至每 100 万个输入token收费40 美元,每 100 万个输出token收费80 美元。缓存音频输入定价降低了87.5%,现在定价为每100 万个输入token收费2.50 美元。OpenAI将要添加的更小模型 GPT-4o mini定价更便宜,每 100 万个输入token收费10 美元...
在经过上周的高层人事出走及超大型募集资金等争议新闻后,OpenAI本周举行开发者大会DevDay,宣布包含GPT-4o图片微调、开发逼真对话功能的Realtime API等新功能,供开发人员开发结合GPT-4o、4o mini模型的AI应用。DevDay上OpenAI宣布的新功能包括Realtime API、视觉微调、提示缓存(Prompt Caching in the API)以及模...
在开发者大会上,OpenAI宣布重磅消息:实时语音API公测版开放,让开发者能够轻松集成GPT的实时、低延迟多模态交互功能。 现在,开发者可以利用6种预设进行语音交互,价格优惠:音频输入每分钟5美元,输出每分钟20美元。 微软宣布GPT-4o-Realtime-Preview 音频和语音公开预览版的推出,这是对Microsoft Azure OpenAI 服务的重大...
在经过上周的高层人事出走及超大型募集资金等争议新闻后,OpenAI本周举行开发者大会DevDay,宣布包含GPT-4o图片微调、开发逼真对话功能的Realtime API等新功能,供开发人员开发结合GPT-4o、4o mini模型的AI应用。 DevDay上OpenAI宣布的新功能包括Realtime API、视觉微调、提示缓存(Prompt Caching in the API)以及模型...
中国时间凌晨 1 点多,OpenAI 召开了本年的开发者大会(旧金山场)。顺道说一下,今年开发者大会一共 3 场:10月1号旧金山;10月30号伦敦,以及11月21日新加坡本次的发布,大体是常规更新,包括:【新东西】Realtime API可以理解为就是 GPT-4o 带 advanced voice 的那套,支
OpenAI DevDay公布,OpenAI最新的大语言模型(LLM) GPT-4o 引入了视觉微调。此功能让开发者能用图像和文本自定义模型的视觉理解功能。这是被称为视觉AI新前沿的重大更新。它可能会对自动驾驶汽车、医学成像和视觉搜索功能等领域产生深远影响。OpenAI 称,东南亚版“美团+滴滴” Grab 已经利用这项技术改进其地图服务...
第9天(当地时间12月17日):o1 API正式版 OpenAI称o1 API为功能更强大的模型、新的定制工具,可提高性能、灵活性和成本效益的升级。支持函数调用、结构化输出和视觉功能;更新支持低延迟自然对话体验Realtime API,可进行简单的WebRTC集成,GPT-4o音频的定价降60%,GPT-4o mini音频费率降为1/10;支持偏好微调...
Realtime API目前只面向付费开发者,其音频功能基于新模型GPT-4o gpt-4o-realtime-preview。而Chat Completions API的音频功能将使用新的模型gpt-4o-audio-preview,在未来几周内发布,开发者可以输入文本或音频,并生成文本、音频。 Realtime API的定价很高,Realtime API同时使用文本token和音频toekn。文本输入token的...
OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线,在车道计数的准确性上Grab实现了20%的提升,在限速标志的定位上提高了13%,这些成绩均超过了原始的GPT-