大神Andrej Karpathy 3小时亲授视频完整版: 深入浅出大语言模型(Deep Dive into LLMs like ChatGPT),https://www.youtube.com/watch?v=7xTGNNLPyMI, 视频播放量 295、弹幕量 0、点赞数 6、投硬币枚数 0、收藏人数 29、转发人数 6, 视频作者 AI4Learn, 作者简介 AI for
https://www.youtube.com/watch?v=7xTGNNLPyMI&ab_channel=AndrejKarpathy 这是对大型语言模型(LLM)人工智能技术的深入探讨,该技术为 ChatGPT 和相关产品提供了动力。 它涵盖了如何开发模型的全部训练堆栈,以及如何思考模型 "心理 "的心理模型,以及如何在实际应用中最好地使用它们。 我已经有一个 ~ 年前的 ...
举个例子,Sam Altman在几周前宣布了GPTs App Store,这是OpenAI尝试创建的一个定制化层面,你可以去Chat GPT,你可以创建你自己的GPT,今天这只包括沿着特定自定义指令的定制化,或者你可以通过上传文件添加知识,当你上传文件时,有一种叫做检索增强生成的方法,chatgpt实际上可以参考那些文件中的文本块,并在生成答案时使用...
这个视频是Andrej Karpathy,原OpenAI的核心成员做的科普视频,这个专门讲LLM的,基本上把LLM的所有方面都讲全了,非常的详细,时长将近一个小时。 这是视频的主要内容。 Chapters: 章节: Part 1: LLMs 第一部分:LLMs 00:00:00 Intro: Large Language Model (LLM) talk 介绍:大型语言模型(LLM)讨论 00:00:20...
当然可以!Andrej Karpathy 的 "Deep Dive into LLMs like ChatGPT" 视频深入浅出地讲解了大型语言模型(LLMs)如 ChatGPT 的核心概念和技术。 这是一个非常棒的视频,信息量巨大,我来帮你总结提炼一下视频的主要内容: 视频核心观点:LLMs 是“下一个词预测机器” ...
Andrej Karpathy是知名的计算机科学家,专注于深度学习和计算机视觉。他曾是特斯拉人工智能和Autopilot Vision的总监,后于2022年离开。Karpathy在2023年重返OpenAI,但在2024年2月又离开了OpenAI。 Karpathy 最近发布了一个名为llm.c的项目。这个项目允许用户在没有PyTorch和cPython的情况下,仅使用纯C语言来训练大型语...
很好,一个认真评估LLMs的竞争者已经加入了讨论。LLM的评估正在改善,但不久之前它们的状态非常糟糕,定性经验经常与定量排名不一致。这是因为好的评估非常困难。 karpathy(@jeremyphoward):@karpathy 在LLM评估中的Moravec悖论 我对这个新的前沿数学基准做出了反应,LLM只解决了2%的问题。这是因为LLM越来越压倒现有的...
Llama.cpp代码: https://github.com/ggerganov/llama.cpp Andrej’s code: https://github.com/karpathy/llama2.c/blob/master/run.c 教程: https://blog.oxen.ai/how-to-run-llama-2-on-cpu-after-fine-tuning-with-lora/ ...
安德烈·卡帕西(Andrej Karpathy)在Twitter上提出了一个关于视频生成模型与语言模型性能差异的有趣问题。视频模型在生成复杂、高分辨率的纹理和反射方面表现出色,而语言模型在生成连贯文本方面却常常挣扎,尤其是在几百字的长篇幅中。这一发现挑战了我们对人工智能能力的现有理解,并提示我们需要更深入地探讨这种差距的原因...
Andrej Karpathy – Intro to Large Language Models Andrew Gallimore – Psychonauts Are Now Mapping Hyper-Dimensional Worlds Andrew Hall – A Bad Day On Mars Andrew Hall – Easter Egg Hunt Andrew Hall – Handbag of the Gods Andrew Hall – Lightning and its Fractal Domain Andrew Hall ...