Andrej Karpathy 在YouTube上发布了一段新视频,时长3小时31分钟: 《深入探讨大型语言模型(LLM)如ChatGPT》 这是一部面向普通观众的深入讲解视频,探讨了驱动ChatGPT及相关产品的大型语言模型(LLM)技术。...
karpathy.ai - my twitter: https://twitter.com/karpathy - "discussion forum": nvm, use youtube comments below for now :) - (new) Neural Networks: Zero to Hero series Discord channel: https://discord.gg/Hp2m3kheJn , for people who'd like to chat more and go beyond youtube ...
Andrej Karpathy大语言模型训练与推理全过程解析 source:https://www.youtube.com/watch?v=7xTGNNLPyMI&ab_channel=AndrejKarpathy 本视频详细介绍了大语言模型(LLM)的训练流程、内部机制及推理过程,并对模型在问题求解、工具使用、RLHF(基于人类反馈的强化学习)等方面的表现进行了探讨。 1. 文本与 Token 化 文...
However, generative AI provides a potential opportunity to change that. With Eureka Labs, Karpathy envisages a future in which human teachers will still design the course materials, with AI teachers used to teach the actual courses. This will pave the way for an entire curriculum of courses t...
大神又来新课程了,Andrej Karpathy是OpenAI创始成员之一,同时也是前Tesla的AI技术总监,虽然只有37岁,确实履历丰富背景强悍。2023年7月从Tesla离职后,开始在Youtube上发布一系列AI相关课程视频。 Andrej的视频课程 这次11月23日发布的视频标题为“[1hr Talk] Intro to Large Language Models”长达一个小时,从基础讲...
这个讲LLM的视频不能错过 | Deep Dive into LLMs like ChatGPT by Andrej KarpathyYouTube上有,刚想搬发现有人手快已经搬回来了:链接讲的非常清晰,非理工科的也能看懂。 发布于 2025-02-06 20:49・IP 属地广东 赞同 分享收藏 ...
【原视频链接】https://www.youtube.com/watch?v=7xTGNNLPyMI 这是一次面向广大观众的大型语言模型(LLM)AI技术的深度探索,该技术驱动着ChatGPT及相关产品。内容涵盖了模型开发的完整训练流程,以及如何理解它们的“心理学”模型,并探讨了如何在实际应用中最大化地利用这些模型。大约一年前,我已经发布了一个“LLM...
https://www.youtube.com/watch?v=7xTGNNLPyMI&ab_channel=AndrejKarpathy 这是对大型语言模型(LLM)人工智能技术的深入探讨,该技术为 ChatGPT 和相关产品提供了动力。 它涵盖了如何开发模型的全部训练堆栈,以及如何思考模型 "心理 "的心理模型,以及如何在实际应用中最好地使用它们。 我已经有一个 ~ 年前的 ...
https://www.youtube.com/watch?v=EWvNQjAaOHw&ab_channel=AndrejKarpathy 00:00:00 介绍不断发展的 LLM 生态系统 00:02:54 ChatGPT 内部交互原理 00:13:12 基础 LLM 交互示例 00:18:03 注意所使用的模型及定价层级 00:22:54 模型思考及其使用时机 00:31:00 工具使用:互联网搜索 00:42:04 工具...
LearnPod创建的收藏夹LearnPod内容:【自学】Andrej Karpathy的深度解析《Deep Dive into LLMs like ChatGPT》带你深入了解ChatGPT等,如果您对当前收藏夹内容感兴趣点击“收藏”可转入个人收藏夹方便浏览