第二支羽毛 第二支羽毛
宇宙
  • 生活
    1. 随笔
  • 大模型
    1. RAG
    2. 强化学习
    3. Agent
    4. LLM架构
  • 论文
    1. 论文速递
    2. 机器学习
    3. 多模态
    4. 基础模型
  • 理论基础
  • 欢迎订阅 开源
    大模型
  • 强化学习
  • Agent
  • LLM架构
  • 论文
  • 机器学习
  • 多模态
  • 基础模型
  • 分类 标签 归档 上网导航
    1 2W8000字读懂GPT全家桶:从GPT-1到O1的技术演进与突破 2 强化学习详解第三部分:蒙特卡洛与时间差分学习,从经验中学习 3 2W8000字深度剖析25种RAG变体 4 万字解析非结构化文档中的隐藏价值:多模态检索增强生成(RAG)的前景 5 深度解析创新RAG:PIKE-RAG与DeepRAG,RAG技术的创新变革
    Anonymous User
    • 登录
    柏企

    柏企

    吹灭读书灯,一身都是月

    • 累计撰写 102 篇文章
    • 累计创建 16 个分类
    • 累计收获 170 个点赞
    • 导航
      • 宇宙
        • 生活
          • 随笔
        • 大模型
          • RAG
          • 强化学习
          • Agent
          • LLM架构
        • 论文
          • 论文速递
          • 机器学习
          • 多模态
          • 基础模型
        • 理论基础
      • 欢迎订阅
      • 开源
      • 大模型
        • 强化学习
        • Agent
        • LLM架构
      • 论文
        • 机器学习
        • 多模态
        • 基础模型
      • 分类
      • 标签
      • 归档
      • 上网导航
      目录
    2025
    DeepSeek-R1:通过强化学习激励大语言模型的推理能力
    2025-04-12 DeepSeek-R1:通过强化学习激励大语言模型的推理能力

    基础模型 

    OpenAI o3-mini 与 DeepSeek-R1 在各类基准测试中的大比拼
    2025-04-12 OpenAI o3-mini 与 DeepSeek-R1 在各类基准测试中的大比拼

    LLM架构 

    用DeepSeek R1和Ollama构建本地RAG系统,向PDF提问不再是梦!
    2025-04-12 用DeepSeek R1和Ollama构建本地RAG系统,向PDF提问不再是梦!

    RAG 

    DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建
    2025-04-12 DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建

    RAG 

    DeepSeek-R1:通过强化学习激发大语言模型的推理潜能
    2025-04-12 DeepSeek-R1:通过强化学习激发大语言模型的推理潜能

    强化学习 

     微调DeepSeek LLM:使用监督微调(SFT)与Hugging Face数据集的详细指南
    2025-04-12 微调DeepSeek LLM:使用监督微调(SFT)与Hugging Face数据集的详细指南

    LLM架构 

    2025-04-12 微调特定于域的搜索的文本嵌入:附Python代码详解

    LLM架构 

    一文读懂 GenPRM:用生成推理扩展过程奖励模型测试时间计算
    2025-04-12 一文读懂 GenPRM:用生成推理扩展过程奖励模型测试时间计算

    基础模型 

    向量相似性搜索与图数据库:数据处理的创新融合
    2025-04-10 向量相似性搜索与图数据库:数据处理的创新融合

    RAG 

    使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI
    2025-04-10 使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI

    LLM架构RAG 

    上一页 下一页
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    柏企

    柏企

    吹灭读书灯,一身都是月

    地球

    文章

    102

    分类

    16

    点赞

    170

    公告

      欢迎来访第二支羽毛,博主还没有发布任何公告!

    目录
    人生倒计时
    时钟
    微信公众号
    分类 更多
    标签云 更多
    Llama4贝尔曼方法ModernBERTGPUVLMMOABertQwen2.5HTMLLSTMPPOAutoGen注意力机制Attention知乎RNNGRUsMQA
    最新文章 更多
    • 神经网络系列:源起
    • 强化学习详解第八部分 RLAIF 如何实现人工智能反馈的规模化飞跃
    • 强化学习详解第七部分 RLHF:解码 AI 与人类偏好对齐的奥秘
    • 牛津大学提出 NoProp : 不再需要反向传播来训练神经网络
    • 清华大学| 强化学习是否激励LLM中超越基本模型的推理能力?
    弹
    • 第二支羽毛 第二支羽毛
    • © 2025 第二支羽毛Powered by Halo & Dream2.0 Plus

      建站00天0时0分0秒 0访客 0访问