标签:DeepSeek-R1-Distill
-
DeepSeek-R1-Distill-Llama-70B模型介绍
DeepSeek-R1-Distill-Llama-70B 是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于 DeepSeek-R1 的推理能力,通过蒸馏…
-
DeepSeek-R1-Distill-Llama-8B模型介绍及安装部署教程
DeepSeek-R1-Distill-Llama-8B 是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于 DeepSeek-R1 的推理能力,通过蒸馏技…