grok-1结构

2025-02-17 01:22:50

拼音 [ 拼音 ]

Grok-1模型结构图 - 知乎

Grok-1是截止2024年3月地球最大参数量(314B )开源基座大语言模型。 2023年10月,由xAI 在JAX和Rust基础上使用定制的训练栈从头训练。以下是模型结构图: Grok-1 tokenizer:131,072个token的SentencePiece 嵌入维度:6144 Transformer 层数:64 注意力机制:Grouped-query attention 48个Q权重矩阵8个K权重矩阵 8个V权...
代码搜索引擎-OpenGrok 介绍1-如何搜索结构体定义-函数实现

1）.选则对应的工程：kernel5.4 2）.在Definition框中输入结构体名称drv_dt_ids点击搜索。3）.点击搜索的结果跳转到对应定义的位置。4）.点击3）中搜索到的变量，自动跳转到对应的文件中。示例2：函数声明及实现搜索 1）类似示例1中步骤，在Definition框中输入函数名称stm_drm_platform_remove点击搜索。2）点击搜...
ketchum 的想法: 马斯克兑现承诺,开源Grok大模型 | MoE的版本的...

马斯克兑现承诺,开源Grok大模型 | MoE的版本的314B模型。该模型包含8个专家(其中2个处于活跃状态),这些专家总共拥有约86亿个激活参数。模型层次结构包括64层,查询关注头为48个。此外,键/值的关注头有8个,嵌入向量的大小是61,440个元素。该模型采用旋转变换(RoPE)和SentencePiece分词器(含有大约131,072个令牌...