置顶

2W8000字读懂GPT全家桶:从GPT-1到O1的技术演进与突破

2025-03-25

强化学习详解第四部分:函数逼近,让强化学习适用于复杂世界


我们在强化学习之旅中来到了关键节点 到目前为止,我们探索的环境中,智能体可以明确表示每一个可能的状态 - 动作对。但一旦踏入现实世界的复杂环境,这种 “奢侈” 便不复存在。 |文末点击阅读原文查看网页版| 更多专栏文章点击查看:

Meta发布Llama 4:开源AI新巨头震撼登场!

开源 

在OpenAI与谷歌为争夺最佳生成式人工智能(GenAI)模型激战正酣之时,Meta终于苏醒,推出全新Llama 4系列模型,并且完全开源,这下AI圈可热闹啦! Llama 4究竟是什么“宝藏”? Llama 4可不是单枪匹马的一个大语言模型(LLM),而是一个“大家族”。Meta发布的这一系列包含

1W8000字 从理论到实践: MCP 在 7 大 AI 框架中的具体应用

Agent 

用Python和TypeScript框架,基于MCP服务器为LLM赋能,打造AI应用 MCP支持的AI框架 AI代理工具包为开发者开放了各种API,让AI解决方案具备执行任务的工具,确保能给出准确结果,提升用户满意度。然而,把这些工具集成到AI应用里并进行管理,过程往往很繁琐。本文将为你介绍一种行业

2w字解析量化技术,全网最全的大模型量化技术解析


2w字解析量化技术,全网最全的大模型量化技术解析 📖阅读时长:50分钟 🕙发布时间:2025-01-31 这篇网页文章主要围绕机器学习中的量化技术展开,详细介绍了其在大语言模型中的应用、基础概念、技术方法及不同模型的量化策略。 量化是机器学习领域的一项关键优化技术,它能把高精度数值转化为低精度格

万字解析非结构化文档中的隐藏价值:多模态检索增强生成(RAG)的前景


本文将深入探讨两种创新的多模态文档检索方法 ——ColPali 和 ColFlor。它们在多模态 RAG 技术领域表现卓越,正重塑着文档处理的格局。我们不仅会剖析其系统结构、性能优势,还将通过实际案例展示它们在处理文档时的出色表现 |文末点击阅读原文查看网页版| 更多专栏文章点击查看:

LLM架构从基础到精通之词向量3


LLM大模型架构之词嵌入(Part3) 以下是已更新文章: 1. LLM大模型架构专栏|| 从NLP基础谈起 2.LLM大模型架构专栏|| 自然语言处理(NLP)之建模 3. LLM大模型架构之词嵌入(Part1)

ReSearch框架:通过强化学习推理搜索的LLM框架


论文与代码 论文:https://arxiv.org/abs/2503.19470 代码:https://github.com/Agent-RL/ReSearch 摘要 将推理与外部搜索过程集成颇具挑战,尤其是针对复杂多跳问题。本文提出ReSearch框架,通过强化学习训练大语言模型(LLMs)进行

DeepSeek-R1如何突破语言模型的极限——深入数学视角解读群体相对策略优化(GRPO)


强化学习系列第二篇 |文末点击阅读原文查看网页版| 更多专栏文章点击查看: LLM 架构专栏

深度解析PPO与GRPO:强化学习算法的进阶之路


强化学习系列第二篇 更多专栏文章点击查看: LLM 架构专栏