第二支羽毛

探索大型语言模型新架构：从 MoE 到 MoA

探索大型语言模型新架构：从 MoE 到 MoA 当前，商业科技公司纷纷投身于一场激烈的竞赛，不断扩大语言模型的规模，并为其注入海量的高质量数据，试图逐步提升模型的准确性。然而，这种看似顺理成章的发展路径逐渐暴露出诸多内在局限。一方面，高质量数据的获取并非易事；另一方面，计算能力的瓶颈以及在普通用户硬

LLM架构