+
 新版
2026-03-13 08:35
百元板子跑百亿这算盘珠子蹦我脸上了
2025-12-20 11:58
百元板跑大模型别骗自己了
2025-12-20 11:00
开源别让代码跑得比算力还快
2025-11-23 19:47
? 很高兴介绍上海交通大学IPADS研究所、上海人工智能学院与ZenergizeAI联合开源的SmallThinker系列端侧大模型这是国内首个专为边缘计算设备原生设计的稀疏大模型,在保持高性能的同时大幅降低硬件需求。以下是有助于开发者快速了解该项目的关键信息:1. 核心特性:- 原生稀疏架构:SmallThinker-4B参数和21B参数两个版本- 百元级硬件支持:可在瑞芯微RK3588等开发板流畅运行- 全流程自主训练:从零开始预训练,非微调裁剪模型2. 技术亮点:- 动态稀疏计算优化- 内存访问模式重设计- 支持Transformers 4.53.3+原生运行- 提供ModelScope支持3. 应用场景:- 边缘设备实时推理- 隐私敏感场景- 低延迟交互应用4. 快速使用:```pythonfrom transformers import AutoModelForCausalLMmodel = AutoModelForCausalLM.from_pretrained```5. 资源:- 模型下载:HuggingFace仓库- 完整指南:GitHub提供从环境配置到模型转换的详细文档注:默认启用的稀疏lm_head可能影响精度,开发者可通过修改代码禁用该特性。这种面向边缘计算的模型架构创新,为在智能终端部署大语言模型提供了新可能,特别适合国产化应用场景。建议关注其后续的性能优化和工具链生态发展。
2025-11-23 18:34
国产AI崛起,端侧大模型牛
2025-11-22 11:55
小智思考者是由上海交通大学IPADS研究所与人工智能学院联合初创公司本智激活共同研发的**专为终端设备优化的开源大模型系列**,具有以下核心特点和突破:### 关键信息速览1. **硬件适配** - 专为百元级国产芯片设计,可在本地流畅运行**百亿参数模型**,极大降低了边缘计算门槛。2. **模型架构创新** - 包含两个稀疏化模型: - **4.6亿激活参数版** - **30亿激活参数版** - 通过动态稀疏化技术实现高性能与低资源占用的平衡。3. 隐私与性能优势 - **完全本地运行**:数据无需上传云端,保障隐私安全,降低延迟。---### 使用方式- **运行支持** - 通过🤗Transformers或ModelScope加载,需参考[GitHub]的详细指南转换模型格式。 - 注:默认启用稀疏lm_head以提升效率,但可能略微影响精度,用户可通过代码调整。- 适用场景 智能家居控制、移动端实时交互、隐私敏感型应用开发等边缘AI需求。这一技术为资源受限设备提供了与云端大模型接近的能力,是AI普惠化的重要实践。
2025-11-22 10:12
SmallThinker开源了端侧大模型新选择
2025-11-18 12:36
百元机跑AI?怕不是要跑出个电子痴呆。
回复 @
{{emojiItem.symbol}}
返回顶部
顶部