标签：DeepSeek - 第二支羽毛|吹灭读书灯，一身都是月

DeepSeek R1：了解 GRPO 和多阶段训练

DeepSeek R1：了解GRPO和多阶段训练近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏

LLM架构

深度探索：DeepSeek-R1 如何从零开始训练，以及这项开源研究将如何以前所未有的速度推动 AI 进步

近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏

开源

开源 AI 大升级！DeepSeek 发布 Janus Pro 7B 多模态模型，免费又强大！

DeepSeek发布了Janus Pro 7B。这是一款免费的多模态AI，它不仅能精准理解图像，还能根据文本生成高质量的视觉图像。那些单一功能的模型可以退下了，Janus Pro来统一AI的 “视觉” 与 “想象力” 了。接下来咱们详细分析一下，为什么这次发布引起了广泛关注，以及你现在就能上手使用

开源

DeepSeek-R1如何突破语言模型的极限——深入数学视角解读群体相对策略优化（GRPO）

强化学习

强化学习系列第二篇 |文末点击阅读原文查看网页版| 更多专栏文章点击查看： LLM 架构专栏

弹