无问芯穹联合上海创智学院(上海交通大学背景)正式发布终端本征智能大模型 Megrez 2.0(Megrez-2-3x7B-A3B-Preview)。
该模型通过终端本征架构,突破端侧“能效-空间-智能”不可能三角,在实现 21B 参数(云端级智能水平)的同时,将实际计算量控制在 3B、内存占用控制在 7B 规模(INT4 量化下不足 4G 内存占用),适配各类终端设备 。

模型链接:https://www.modelscope.cn/models/InfiniAI/Megrez2-3x7B-A3B-Preview/summary
Megrez 2.0 采用重参数机制,将相邻 MoE 层分组复用专家参数,将总参数量从 21B 降至 7B,同时保持 21B 专家池空间,实现更高能效、更低内存和更强智能,其速度比同内存占用模型快 50%,精度比同尺寸稠密模型提升 36%,内存比同精度模型节约 75% 。
此外,Megrez 2.0 支持终端设备在“休眠时段”无感知地持续创造价值(如整理会议纪要),实现端侧级算力撬动云端级智能,推动 AI 智能体等应用在终端释放更大能动性 。
暂无更多评论