11月2日晚间,幻方宣布,探索AGI的新组织“深度求索”在成立半年后,发布第一代大模型——开源代码大模型DeepSeek Coder,已经开放内测,免费商用,完全开源。公告显示,DeepSeek Coder模型有指令Python快速写出程序、修改UI、测试bug以及数据分析,学写SQL等技能。 本文源自金融界AI电报...
据站长之家 9 月 27 日消息,近日,蚂蚁集团代码大模型 CodeFuse-CodeLlama-34B 4bits 量化版本发布。据悉,该模型是 CodeFuse-CodeLlama-34B 模型的 4bits 量化版本,后者是通过 QLoRA 对基座模型 CodeLlama-34b-Python 进行多代码任务微调而得到的代码大模型,模型输入长
在LiveCodeBench和MultiPL-E基准测试中,OpenCoder的指令模型展现了强大的逻辑推理和多语言代码生成能力。 结论与展望 OpenCoder作为一个完全开源的代码LLM,提供了透明的数据处理流程和可重复的数据集,超越了以往的开放模型。我们通过详细的实验证明了OpenCoder在多个代码LLM评估基准上的顶级性能,并通过开放“开放食谱”推动了...
幻方Deep Seek V2多模态专家模型解析 DeepSeek V2不仅236b模型和代码完全开源,而且性能比肩llama3和gpt4,同时中文能力非常强大,适合作为量化的基座模型。#财经 #金融 #人工智能 #量化 #程序员 - 趋势大陈哥于20240513发布在抖音,已经收获了1.1万个喜欢,来抖音,记录美
首先,模型系列很多,直接开源了6种尺寸(0.5B、1.8B、4B、7B、14B、72B)的基础模型(base)、聊天模型(chat)以及量化模型(包括Int4 和 Int8 GPTQ 模型,以及 AWQ 和 GGUF 量化模型)。 其次,更多的生态融入。 目前,Qwen1.5的代码合并到Hugging Face transformers,使其transformers>=4.37.0而无需trust_remote_code...
色情图片离线识别(离线鉴黄),基于TensorFlow实现。识别只需200ms,可断网测试,成功率99%,调用只要一行代码,从雅虎的开源项目open_nsfw移植,tflite(6M)为训练好的模型(已量化),该模型文件可用于iOS、java、C++等平台,Python使用生成的tfLite文件检测图片的速度远
InvriantStock识别股市不变特征创造长期高夏普率 InvriantStock通过两个特征识别模块,对中国和美国近30年的股票市场测试下取得了3.7和1.9的夏普比率,回撤低于20%,代码和模型均已经开源,算法适应不同市场风格。#财 - 长升牛于20240927发布在抖音,已经收获了1027个喜欢,
依靠人工智能技术进行投资的对冲基金及科技公司幻方量化本月发布一个开源的人工智能模型,其编写代码和数学运算能力给全球科技界留下深刻印象。开发者表示,该模型在常用基准测试中击败竞争对手,而成本仅为美国科技巨头开发的其他工具的一小部分,且是在华盛顿严控芯片的情况下取得的。美国对半导体技术的限制是中国雄心壮志...
海思嵌入式AI提供了超轻量级的AI技术框架、极致性能完全满足MCU的推理要求、并能够将多模型快速转换为代码并导入工程,开发者进行方便快速的产品部署。 1)极简框架:在MCU上部署的AI模型,转为网络层的运行代码后,直接调用RISC-V核的优化算子库,省去了模型解析器等一般复杂的框架。RISC-V的开源架构支持自定义指令集,...
据站长之家9月27日消息,近日,蚂蚁集团代码大模型CodeFuse-CodeLlama-34B4bits量化版本发布。据悉,该模型是CodeFuse-CodeLlama-34B模型的4bits量化版本,后者是通过QLoRA对基座模型CodeLlama-34b-Python进行多代码任务微调而得到的代码大模型,模型输入长...