为了更好的落地应用,百度发布了iRAG技术(检索增强文生图技术)。李彦宏介绍,百度在开发各种各样应用过程中遇到的一个障碍,就是大模型的幻觉。“必须把障碍搬走之后,我才能再往前走。”为了解决文生图的幻觉,百度研发了iRAG。其将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。iRAG在市
1)在快递领域,让大模型帮助处理订单,做到了一张纸一句话寄快递,不再需要其他繁琐流程,时间从3分钟缩短19秒,而且90%以上的问题都是由大模型解决,效率提升非常明显。2)小说创作领域,一开始用开源模型,后来用文心轻量级模型,经过上万组数据的SFT结果有了明显提升。最近转到文心4.0版本,仅用数百条数据,4....
李彦宏指出,外行通常将“模型开源”和“代码开源”这两个概念相混淆。“模型开源”指的是公开模型的参数,但这些参数的来源、训练方式却并不透明,对于开源模型的后期微调(SFT)和安全对齐等工作仍需耗费大量资源。即便拿到源代码,也无法得知具体的训练数据量和比例,难以在开源模型的基础上实现更高效的迭代和开发。...
李彦宏表示:“大模型调用量高、增速快,表明有越来越多的应用在使用文心大模型。”百度iRAG检索增强的文生图技术全球领先,多模态大模型开始广泛应用 为什么最近半年基础模型调用量增速这么快?或者说什么技术提升导致了基础模型突然变得很有用呢?李彦宏认为:“主要是检索增强(RAG)的能力。大模型最初发布的时候有幻觉...
李彦宏进一步指出,相对于全新的超级应用,大模型对现有企业、现有应用的改造可以创造出更大的价值。「几乎所有行业里已经成型的公司,一旦转过弯来,能很好地利用大模型能力的话,它获得的收益、获得的价值增益加起来,一定是最大的。当然这并不表明创业公司没有机会,创业公司做出三五个 Super App、做出几百几千个...
李彦宏表示,大模型火了将近两年,相关技术以前所未有的速度进行迭代和创新,从大公司,到创业者,到风险投资,各路人马大家都在寻找生成式AI时代基于大模型的超级应用。然而客观地讲,大家期待的超级应用还没有出现。李彦宏认为百度是中国人工智能的扛旗者,有资格回答这个问题,“今年5月份,当我们的人均调用量达到...
“过去24个月,AI行业的最大变化是大模型基本消除了幻觉,不再一本正经地胡说八道。”李彦宏认为,让大模型这一概率模型变得可用、可被信赖的技术,就是RAG(Retrieval-augmented Generation),即检索增强技术。百度做搜索起家,自然要选择检索增强这条路,但是事实上,检索增强不是百度特色,而已成为行业共识。目前,...
李彦宏表示,百度作为一家技术公司,定位是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具,“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工智能+’行动,每一个人,每一家企业,只需要充分利用这些...
李彦宏在谈及开源闭源之争时表示,开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低时,商业化的闭源模型是最能打的。李彦宏称,要避免掉入“超级应用陷阱”,认为一定要出现一个10亿DAU的APP才叫成功,这是移动...
但是,在大多数实际应用场景中,开源模型可能并不是最佳选择。当你处在一个激烈竞争的市场环境当中,提升业务效率和降低成本成为关键,此时商业化的闭源模型往往能提供最优的解决方案。 当然,这些都不是最重要的,没有应用,光有基础模型,不管是开源还是闭源都一文...