DeepSeek-R1系列模型概述

DeepSeek-R1系列模型是基于Transformer架构的大型语言模型,支持中英文双语处理。该系列模型通过不断优化算法和增加训练数据,逐步提升了模型的性能和适用性。
目前,DeepSeek-R1系列已推出多个版本,包括但不限于:

  • R1-35B

  • R1-671B

  • R1-13B

  • R1-7B

每个版本的命名中的数字代表模型的参数量(以十亿为单位)。例如,“35B”表示该模型拥有350亿个参数。

各版本的核心区别

 

版本参数量适用场景
R1-7B70亿轻量化,低延迟,适合移动设备或边缘计算
R1-13B13-亿平衡性能和资源效率
R1-35B350亿高精度文本生成和复杂任务
R1-671B6710亿多模态的输入和输出

 

作者:SteveChen  创建时间:2025-03-31 22:58
最后编辑:SteveChen  更新时间:2025-03-31 23:03
上一篇:
下一篇: