第二支羽毛 第二支羽毛
宇宙
  • 生活
    1. 随笔
  • 大模型
    1. RAG
    2. 强化学习
    3. Agent
    4. LLM架构
  • 论文
    1. 论文速递
    2. 机器学习
    3. 多模态
    4. 基础模型
  • 理论基础
  • 欢迎订阅 开源
    大模型
  • 强化学习
  • Agent
  • LLM架构
  • 论文
  • 机器学习
  • 多模态
  • 基础模型
  • 分类 标签 归档 上网导航
    1 2W8000字读懂GPT全家桶:从GPT-1到O1的技术演进与突破 2 强化学习详解第三部分:蒙特卡洛与时间差分学习,从经验中学习 3 2W8000字深度剖析25种RAG变体 4 万字解析非结构化文档中的隐藏价值:多模态检索增强生成(RAG)的前景 5 深度解析创新RAG:PIKE-RAG与DeepRAG,RAG技术的创新变革
    Anonymous User
    • 登录
    柏企

    柏企

    吹灭读书灯,一身都是月

    • 累计撰写 105 篇文章
    • 累计创建 16 个分类
    • 累计收获 175 个点赞
    • 导航
      • 宇宙
        • 生活
          • 随笔
        • 大模型
          • RAG
          • 强化学习
          • Agent
          • LLM架构
        • 论文
          • 论文速递
          • 机器学习
          • 多模态
          • 基础模型
        • 理论基础
      • 欢迎订阅
      • 开源
      • 大模型
        • 强化学习
        • Agent
        • LLM架构
      • 论文
        • 机器学习
        • 多模态
        • 基础模型
      • 分类
      • 标签
      • 归档
      • 上网导航
      目录
    2025
    强化自训练(ReST):让大语言模型更懂你的“心”
    2025-04-12 强化自训练(ReST):让大语言模型更懂你的“心”

    基础模型 

    Qwen2.5-Max:对标DeepSeek V3
    2025-04-12 Qwen2.5-Max:对标DeepSeek V3

    开源 

    DeepSeek-R1的顿悟时刻是如何出现的? 背后的数学原理:强化学习如何教大型语言模型进行推理
    2025-04-12 DeepSeek-R1的顿悟时刻是如何出现的? 背后的数学原理:强化学习如何教大型语言模型进行推理

    强化学习 

    2025-04-12 强化学习中的关键模型与算法:从Actor-Critic到GRPO

    强化学习 

    DeepSeek-R1:通过强化学习激励大语言模型的推理能力
    2025-04-12 DeepSeek-R1:通过强化学习激励大语言模型的推理能力

    基础模型 

    OpenAI o3-mini 与 DeepSeek-R1 在各类基准测试中的大比拼
    2025-04-12 OpenAI o3-mini 与 DeepSeek-R1 在各类基准测试中的大比拼

    LLM架构 

    用DeepSeek R1和Ollama构建本地RAG系统,向PDF提问不再是梦!
    2025-04-12 用DeepSeek R1和Ollama构建本地RAG系统,向PDF提问不再是梦!

    RAG 

    DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建
    2025-04-12 DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建

    RAG 

    DeepSeek-R1:通过强化学习激发大语言模型的推理潜能
    2025-04-12 DeepSeek-R1:通过强化学习激发大语言模型的推理潜能

    强化学习 

     微调DeepSeek LLM:使用监督微调(SFT)与Hugging Face数据集的详细指南
    2025-04-12 微调DeepSeek LLM:使用监督微调(SFT)与Hugging Face数据集的详细指南

    LLM架构 

    上一页 下一页
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • …
    • 11
    柏企

    柏企

    吹灭读书灯,一身都是月

    地球

    文章

    105

    分类

    16

    点赞

    175

    公告

      欢迎来访第二支羽毛,博主还没有发布任何公告!

    目录
    人生倒计时
    时钟
    微信公众号
    分类 更多
    标签云 更多
    Llama4贝尔曼方法ModernBERTGPUVLMMOABertQwen2.5HTMLLSTMPPOAutoGen注意力机制Attention知乎RNNGRUsMQA
    最新文章 更多
    • 从线性到非线性:感知器如何诞生深度学习
    • LangGraph 多智能体群:使用 LangGraph 创建群风格多智能体系统的 Python 库
    • 利用Transformer、DPR、FAISS和BART对检索增强生成(RAG)进行深入技术探索
    • 神经网络系列:源起
    • 强化学习详解第八部分 RLAIF 如何实现人工智能反馈的规模化飞跃
    弹
    • 第二支羽毛 第二支羽毛
    • © 2025 第二支羽毛Powered by Halo & Dream2.0 Plus

      建站00天0时0分0秒 0访客 0访问