DeepLearningCode/nsfw_data_scrapper’s past year of commit activity Shell0MIT2,90200UpdatedJan 15, 2019 incubator-mxnetPublicForked fromapache/mxnet Lightweight, Portable, Flexible Distributed/Mobile Deep Learning with Dynamic, Mutation-aware Dataflow Dep Scheduler; for Python, R, Julia, Scala, Go,...
Torch7 (with nnx and optim package) -- A scientific computing framework with wide support for machine learning algorithms. (https://github.com/torch/torch7) Usage: The DeepQLearning module can be easily included in a Lua scipt using: Brain = require 'deepqlearn' The brain must then be ...
https://cbovar.github.io/ConvNetDraw/ 2.caffe可视化工具 输入:caffe配置文件 输出:网络结构 地址: http://ethereon.github.io/netscope/#/editor 3.深度学习可视化工具Visual DL Visual DL是百度开发的,基于echar和PaddlePaddle,支持PaddlePaddle,PyTorch和MXNet等主流框架。ps:这个是我最喜欢的,毕竟echar的渲染能...
我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。DeepSeek 项目的星数还在以肉眼可见的速度增长。去年 12 月 26 日,DeepSeek AI ...
现代科技信息的获取方式非常丰富,利用好这些资源能让你事半功倍。除了传统的书籍和课程,你还可以通过线上平台(如Coursera、Udemy、YouTube)观看AI相关的教程,通过GitHub上的开源项目学习别人是如何实现AI模型的。 此外,AI社区、技术论坛、博客等也是宝贵的学习资源,参与其中,不仅能获得新技术的分享,还能与同行互相交流...
随后在 1 月 23 日,DeepSeek 以 V3 为基础使用强化学习(Reinforcement Learning)驱动重构训练范式,提出了 DeepSeek-R1,彻底改变了开源 AI 世界。 DeepSeek R1 性能完全对标 OpenAI o1,与 DeepSeek V3 相比性能有大幅提升,其论文指出纯强化学习可以赋予 LLM 强推理能力,而无需大量监督微调,震动了 AI 业界。 从...
我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。 截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。 DeepSeek 项目的星数还在以肉眼可见的速度增长。
令人惊讶的是,DeepSeek 还发布了通过他们称为蒸馏的过程训练的小型模型。然而,在 LLMs 的背景下,蒸馏并不一定遵循深度学习中使用的经典知识蒸馏方法。传统上,在知识蒸馏(如我在《机器学习 Q 和 AI》一书的第 6 章中简要描述的),一个较小的学生模型在较大的教师模型的 logits 和目标数据集上训练。
(摘自“DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning”,https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf) 最有可能与OpenAI指控行为相似的是前两种途径:(1)using few-sho...
首先在github上进行搜寻,如下图: 发现第一个星数最多,而且远高于其它的项目,于是拉取这个链接: https://github.com/devsisters/DQN-tensorflow 本篇博客主要是讲解一下该代码运行环境的如何搭建,采用 conda 配置。 首先看下 README 上的内容, 主要是requirement最重要: ...