DeepSeek绕过CUDA | 众所周知,英伟达的CUDA(Compute Unified Device Architecture,统一运算架构)能大幅降低研发大模型的难度,获全球开发商使用,一举将英伟达推上AI芯片领域的垄断地位。但最新发现显示,DeepSeek使用英伟达的H800芯片训练时,使用英伟达底层硬件指令PTX(Parallel Thread Execution)语言,而非高级编程语言CUDA。这...
为了解决这些风险,重点开发高效的架构和最优化技术至关重要,这些架构和技术可以在不损害道德标准的情况下在消费者硬件上运行。量化和剪枝等技术是优化人工智能用于道德应用的关键,因为它们减少了模型大小和计算需求,使人工智能更容易访问,同时最大限度地减少滥用的可能性。 开源项目在这方面至关重要,因为它们为人工智能开...