AMD 近日宣布推出旗下开源模型 OLMo,该模型参数达到 10 亿,其目标是在人工智能的可访问性和性能方面向 Nvidia 和英特尔发起挑战。
AMD OLMo 模型在 AMD Instinct MI250 GPU 集群上使用数万亿词条从头开始训练。这些模型在推理、指令跟踪和聊天方面表现出色,同时采用开源理念,允许开发人员访问数据、权重、训练配方和代码。
OLMo 模型采用解码器(decoder-only)架构,并通过下一个标记预测(next-token prediction)进行训练,这种架构在生成文本和理解上下文方面表现出色。

与其他同类开源模型相比,AMD OLMo 在推理能力和聊天能力上表现优异。尤其是在多个基准测试中,其性能与最新的 OLMo 模型相当,且计算预算仅为其一半。



OLMo 除数据中心使用外,更支持配备 NPU(Neural Processing Unit,神经处理单元)的 AMD Ryzen AI PC 能够部署模型,使开发者能在个人设备提供 AI 功能。
AMD 在一份声明中表示:"AMD 秉承开源模型和代码的传统,帮助社区共同进步,我们很高兴发布首个完全开放的 10 亿参数语言模型系列 AMD OLMo。
暂无更多评论