第二支羽毛 第二支羽毛
宇宙
  • 生活
    1. 随笔
  • 大模型
    1. RAG
    2. 强化学习
    3. Agent
    4. LLM架构
  • 论文
    1. 论文速递
    2. 机器学习
    3. 多模态
    4. 基础模型
  • 理论基础
  • 欢迎订阅 开源
    大模型
  • 强化学习
  • Agent
  • LLM架构
  • 论文
  • 机器学习
  • 多模态
  • 基础模型
  • 分类 标签 归档 上网导航
    1 2W8000字读懂GPT全家桶:从GPT-1到O1的技术演进与突破 2 强化学习详解第八部分 RLAIF 如何实现人工智能反馈的规模化飞跃 3 DeepSeek-R1如何突破语言模型的极限——深入数学视角解读群体相对策略优化(GRPO) 4 强化学习详解第七部分 RLHF:解码 AI 与人类偏好对齐的奥秘 5 2W8000字深度剖析25种RAG变体
    Anonymous User
    • 登录
    柏企

    柏企

    吹灭读书灯,一身都是月

    • 累计撰写 109 篇文章
    • 累计创建 16 个分类
    • 累计收获 183 个点赞
    • 导航
      • 宇宙
        • 生活
          • 随笔
        • 大模型
          • RAG
          • 强化学习
          • Agent
          • LLM架构
        • 论文
          • 论文速递
          • 机器学习
          • 多模态
          • 基础模型
        • 理论基础
      • 欢迎订阅
      • 开源
      • 大模型
        • 强化学习
        • Agent
        • LLM架构
      • 论文
        • 机器学习
        • 多模态
        • 基础模型
      • 分类
      • 标签
      • 归档
      • 上网导航
      目录
    2025
    用DeepSeek R1和Ollama构建本地RAG系统,向PDF提问不再是梦!
    2025-04-12 用DeepSeek R1和Ollama构建本地RAG系统,向PDF提问不再是梦!

    RAG 

    DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建
    2025-04-12 DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建

    RAG 

    DeepSeek-R1:通过强化学习激发大语言模型的推理潜能
    2025-04-12 DeepSeek-R1:通过强化学习激发大语言模型的推理潜能

    强化学习 

     微调DeepSeek LLM:使用监督微调(SFT)与Hugging Face数据集的详细指南
    2025-04-12 微调DeepSeek LLM:使用监督微调(SFT)与Hugging Face数据集的详细指南

    LLM架构 

    2025-04-12 微调特定于域的搜索的文本嵌入:附Python代码详解

    LLM架构 

    一文读懂 GenPRM:用生成推理扩展过程奖励模型测试时间计算
    2025-04-12 一文读懂 GenPRM:用生成推理扩展过程奖励模型测试时间计算

    基础模型 

    向量相似性搜索与图数据库:数据处理的创新融合
    2025-04-10 向量相似性搜索与图数据库:数据处理的创新融合

    RAG 

    使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI
    2025-04-10 使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI

    LLM架构RAG 

    DeepSeek R1:了解 GRPO 和多阶段训练
    2025-04-10 DeepSeek R1:了解 GRPO 和多阶段训练

    LLM架构 

    深度探索:DeepSeek-R1 如何从零开始训练,以及这项开源研究将如何以前所未有的速度推动 AI 进步
    2025-04-10 深度探索:DeepSeek-R1 如何从零开始训练,以及这项开源研究将如何以前所未有的速度推动 AI 进步

    开源 

    上一页 下一页
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • …
    • 11
    柏企

    柏企

    吹灭读书灯,一身都是月

    地球

    文章

    109

    分类

    16

    点赞

    183

    公告

      欢迎来访第二支羽毛,博主还没有发布任何公告!

    目录
    人生倒计时
    时钟
    微信公众号
    分类 更多
    • 论文 1
      • 基础模型 10
      • 多模态 3
      • 机器学习 0
      • 论文速递 5
    • 开源 5
    • 理论基础 8
    • 友链 0
    • 大模型 1
      • LLM架构 45
      • Agent 11
      • 强化学习 14
      • RAG 14
    • 文章 0
    • 生活 0
    • 随笔 0
    标签云 更多
    Llama4贝尔曼方法ModernBERTGPUVLMMOABertQwen2.5HTMLLSTMPPOAutoGen注意力机制Attention知乎RNNGRUsMQA
    最新文章 更多
    • 对Transformer中位置编码的可视化理解
    • 从Softmax到Flash Attention的关键优化
    • 无需人工监督!SPHERE 框架如何驱动小语言模型多步推理自我进化?
    • 字节跳动的 BAGEL:一体化的大语言模型
    • 从线性到非线性:感知器如何诞生深度学习
    弹
    • 第二支羽毛 第二支羽毛
    • © 2025 第二支羽毛Powered by Halo & Dream2.0 Plus

      建站00天0时0分0秒 0访客 0访问