DeepSeek模型

DeepSeek-R1系列模型概述

DeepSeek-R1系列模型是基于Transformer架构的大型语言模型，支持中英文双语处理。该系列模型通过不断优化算法和增加训练数据，逐步提升了模型的性能和适用性。
目前，DeepSeek-R1系列已推出多个版本，包括但不限于：

每个版本的命名中的数字代表模型的参数量（以十亿为单位）。例如，“35B”表示该模型拥有350亿个参数。

作者：SteveChen 创建时间：2025-03-31 22:58
最后编辑：SteveChen 更新时间：2025-03-31 23:03