1、谷歌推出下一代模型 PaLM 2 一年一度的谷歌 I/O 在 5 月 10 日上午召开,皮查伊宣布推出 PaLM 2 预览版本,改进了数学、代码、推理、多语言翻译和自然语言生成能力,利用谷歌最新的 TPU 算力基础设施提升了训练速度。由于它的构建方式是将计算、优化扩展、改进的数据集混合以及模型架构改进结合在一起,因此服务...
通过开源模型,可以为架构和数据库的改进提供灵感。Elastic和MongoDB就是很好的例子,它们的故事说明,初创公司可以通过某种方式为社区赋能,这种方法产生的价值,比通过搭建一个专有工具产生的价值高出上千倍...你也不需要从创造的价值中获取100%的红利,而是可以只将其中1%的价值变现,维持公司的经营。但即便只是1%,也足够...
苹果发布了MM1模型,一个包含高达30B参数的多模态模型家族,包括密集模型和混合专家变体。 苹果MM1大模型分为三个参数规模,其中最大的拥有300亿参数。(当前主流竞品:谷歌PaLM大模型拥有5400亿参数,OpenAI的GPT-4更是拥有1.7万亿参数),目前MM1在多项评测指标上要略优于 GPT-4V 和 Gemini Pro。
8:LIDA 是一个使用大型语言模型「「自动生成可视化和信息图表」」的库,它与语法无关(可与任何编程语言和可视化库配合使用,例如 matplotlib、seaborn、altair、d3 等),并可与多个大型语言模型提供商(OpenAI、Azure OpenAI、PaLM、Cohere、Huggingface)配合使用。
谷歌和DeepMind最近推出了MedPaLM,一种开源大语言模型,MedPaLM 是一种面向医学领域的开源大语言模型。它旨在在医学领域产生安全和有用的答案。它结合了 HealthSearchQA,一个新的在线搜索医学问题自由回答数据集,以及六个现有的开放式问题回答数据集,涵盖专业医学检查、研究和消费者查询。
Falcon-180B 显著优于像 PaLM 或 Chinchilla 这样的模型,并且在同时开发的模型如 LLaMA 2 或 Inflection-1 上有所改进。它接近 PaLM-2-Large 的性能,但预训练和推理成本降低,使其成为我们所知的全球三个最佳语言模型之一,与 GPT-4 和 PaLM-2-Large 并列。我们报告了详细的评估,以及对用于预训练 Falcon 的...