归档 - 第二支羽毛|吹灭读书灯，一身都是月

2025

DeepSeek-R1：通过强化学习激励大语言模型的推理能力

2025-04-12 DeepSeek-R1：通过强化学习激励大语言模型的推理能力

OpenAI o3-mini 与 DeepSeek-R1 在各类基准测试中的大比拼

2025-04-12 OpenAI o3-mini 与 DeepSeek-R1 在各类基准测试中的大比拼

用DeepSeek R1和Ollama构建本地RAG系统，向PDF提问不再是梦！

2025-04-12 用DeepSeek R1和Ollama构建本地RAG系统，向PDF提问不再是梦！

DeepSeek R1重磅开源！一文读懂训练方法与RAG应用搭建

2025-04-12 DeepSeek R1重磅开源！一文读懂训练方法与RAG应用搭建

DeepSeek-R1：通过强化学习激发大语言模型的推理潜能

2025-04-12 DeepSeek-R1：通过强化学习激发大语言模型的推理潜能

微调DeepSeek LLM：使用监督微调（SFT）与Hugging Face数据集的详细指南

2025-04-12 微调DeepSeek LLM：使用监督微调（SFT）与Hugging Face数据集的详细指南

2025-04-12 微调特定于域的搜索的文本嵌入：附Python代码详解

一文读懂 GenPRM：用生成推理扩展过程奖励模型测试时间计算

2025-04-12 一文读懂 GenPRM：用生成推理扩展过程奖励模型测试时间计算

向量相似性搜索与图数据库：数据处理的创新融合

2025-04-10 向量相似性搜索与图数据库：数据处理的创新融合

使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT，以实现更智能的 AI

2025-04-10 使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT，以实现更智能的 AI

弹