第二支羽毛 第二支羽毛
宇宙
  • 生活
    1. 随笔
  • 大模型
    1. RAG
    2. 强化学习
    3. Agent
    4. LLM架构
  • 论文
    1. 论文速递
    2. 机器学习
    3. 多模态
    4. 基础模型
  • 理论基础
  • 欢迎订阅 开源
    大模型
  • 强化学习
  • Agent
  • LLM架构
  • 论文
  • 机器学习
  • 多模态
  • 基础模型
  • 分类 标签 归档 上网导航
    1 2W8000字读懂GPT全家桶:从GPT-1到O1的技术演进与突破 2 强化学习详解第三部分:蒙特卡洛与时间差分学习,从经验中学习 3 2W8000字深度剖析25种RAG变体 4 万字解析非结构化文档中的隐藏价值:多模态检索增强生成(RAG)的前景 5 深度解析创新RAG:PIKE-RAG与DeepRAG,RAG技术的创新变革
    Anonymous User
    • 登录
    柏企

    柏企

    吹灭读书灯,一身都是月

    • 累计撰写 102 篇文章
    • 累计创建 16 个分类
    • 累计收获 170 个点赞
    • 导航
      • 宇宙
        • 生活
          • 随笔
        • 大模型
          • RAG
          • 强化学习
          • Agent
          • LLM架构
        • 论文
          • 论文速递
          • 机器学习
          • 多模态
          • 基础模型
        • 理论基础
      • 欢迎订阅
      • 开源
      • 大模型
        • 强化学习
        • Agent
        • LLM架构
      • 论文
        • 机器学习
        • 多模态
        • 基础模型
      • 分类
      • 标签
      • 归档
      • 上网导航
      目录
    2025
     一文读懂自动编码器:类型、原理与应用
    2025-04-12 一文读懂自动编码器:类型、原理与应用

    理论基础 

    缓存增强生成(CAG)对比检索增强生成(RAG):谁才是大语言模型的最优解?
    2025-04-12 缓存增强生成(CAG)对比检索增强生成(RAG):谁才是大语言模型的最优解?

    RAG 

    ReaderLM v2:前沿小型语言模型,实现HTML到Markdown和JSON的转换
    2025-04-12 ReaderLM v2:前沿小型语言模型,实现HTML到Markdown和JSON的转换

    基础模型 

    重现 OpenAI o1 的技术路线
    2025-04-12 重现 OpenAI o1 的技术路线

    LLM架构 

    典型的RAG流程、每个模块的最佳实践和综合评估
    2025-04-12 典型的RAG流程、每个模块的最佳实践和综合评估

    RAG 

     加速大模型推理:深入探究MQA、GQA、MLA(DeepSeek)、KV缓存技术
    2025-04-12 加速大模型推理:深入探究MQA、GQA、MLA(DeepSeek)、KV缓存技术

    LLM架构 

    强化自训练(ReST):让大语言模型更懂你的“心”
    2025-04-12 强化自训练(ReST):让大语言模型更懂你的“心”

    基础模型 

    Qwen2.5-Max:对标DeepSeek V3
    2025-04-12 Qwen2.5-Max:对标DeepSeek V3

    开源 

    DeepSeek-R1的顿悟时刻是如何出现的? 背后的数学原理:强化学习如何教大型语言模型进行推理
    2025-04-12 DeepSeek-R1的顿悟时刻是如何出现的? 背后的数学原理:强化学习如何教大型语言模型进行推理

    强化学习 

    2025-04-12 强化学习中的关键模型与算法:从Actor-Critic到GRPO

    强化学习 

    上一页 下一页
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    柏企

    柏企

    吹灭读书灯,一身都是月

    地球

    文章

    102

    分类

    16

    点赞

    170

    公告

      欢迎来访第二支羽毛,博主还没有发布任何公告!

    目录
    人生倒计时
    时钟
    微信公众号
    分类 更多
    标签云 更多
    Llama4贝尔曼方法ModernBERTGPUVLMMOABertQwen2.5HTMLLSTMPPOAutoGen注意力机制Attention知乎RNNGRUsMQA
    最新文章 更多
    • 神经网络系列:源起
    • 强化学习详解第八部分 RLAIF 如何实现人工智能反馈的规模化飞跃
    • 强化学习详解第七部分 RLHF:解码 AI 与人类偏好对齐的奥秘
    • 牛津大学提出 NoProp : 不再需要反向传播来训练神经网络
    • 清华大学| 强化学习是否激励LLM中超越基本模型的推理能力?
    弹
    • 第二支羽毛 第二支羽毛
    • © 2025 第二支羽毛Powered by Halo & Dream2.0 Plus

      建站00天0时0分0秒 0访客 0访问