+
DevOps研发效能
媒体矩阵
开源中国APP
大模型
ChatGPT 和其他类 GPT 的 AI 都是基于 GPT(Generative Pre-trained Transformer)架构的大型语言模型。它们是使用深度学习技术训练的神经网络,具有自然语言理解和生成的能力。 这些模型都是基于无监督学习的方式进行训练的,利用大量的文本数据进行预训练,并通过微调和迁移学习等技术来完成各种自然语言处理任务,如问答、对话生成、文本摘要、情感分析等。
关注 71.1W
加载中
美团技术团队
美团技术团队 发表了博客
语音大语言模型(Speech LLM)想落地,绕不开一个死结:既要快速理解语音里的语义,又要说出自然的音色,还得实时响应。比如智能音箱 "听不懂" 语音,车载助手 "说" 得像机器人,实时翻译延迟卡半秒 ------深究根源,全在 "语音 Token 化":作为拆分语音为 Speech LLM "离散单元" 的关键步骤,传统方案始终没平衡好 ------ 要么缺语义、要么丢声学、要么延迟高,刚好卡了 Speech LLM 落地的 "死结"。 ![](https://oscimg.oschi...
得物技术
得物技术 发表了博客
一、背景 ==== 每次打开 Claude Code 开始新对话,它都是一张白纸。昨天你花了 10 分钟解释的项目架构、你反复纠正的代码风格偏好、你建立的特殊开发规范------全部归零。但是使用过 OpenClaw 和 Hermes 的同学都知道,这 2 个 agent 具备持久化记忆系统,这让我开始思考:能不能给 Claude Code 装上一套"长期记忆"系统?更进一步,不只是被动记忆,而是主动学习:观察我的行为模式、项目架构,提炼行为规律、项目知识,下次自动...
美团技术团队
美团技术团队 发表了博客
ACL(Annual Meeting of the Association for Computational Linguistics)是计算语言学和自然语言处理(NLP)领域的国际顶级学术会议。自 1962 年创办以来,ACL 已成为 NLP 领域规模最大、影响力最高的学术盛会,汇聚了来自全球学术界和工业界的顶尖研究者。 ![](https://oscimg.oschina.net/oscnet/up-2186b9e75225a1f0da3c65315b427984ec1.png) 🎯 **活动预告** 6 月 11 日(周四)下午,我们将分享美团技术团队被 ACL 顶会...
美团技术团队
美团技术团队 发表了博客
大模型在 AIME、IMO 等高难度竞赛中拿奖拿到手,仿佛已经进化出了“人类最强大脑”。但与此同时,如果你问大模型:“离洗车店只有 50 米,我是开车去还是走路去?”。这些号称满分推理的模型,依然会一本正经地为你规划导航路线。 这种看似知识丰富,但没常识的现象,正是当前大模型评测的死穴:大模型虽然擅长记忆复杂的公式,却常常连一道简单的逻辑题都答不对。 ![](https://p0.meituan.net/meituantechblog/875e78d1c8378ca...
美团技术团队
美团技术团队 发表了博客
当团队 90% 以上的代码由 AI 生成,31 万行的复杂业务系统还在高速膨胀,你会发现一个反直觉的事实:AI Coding 不会自动收敛复杂度 ------ 没有统一规范的约束,不同人用 AI 写出的代码风格各异,系统反而会加速腐化。 ![](https://oscimg.oschina.net/oscnet/up-8b540cde0b5a49609e5b8a00b4f6cc2ae51.png) 本文记录了我们如何在不停止业务交付的前提下,完成这场重构。在这个过程中,我们积累了三个关键经验,希望这篇实战经验...
禅道项目管理软件
禅道项目管理软件 发表了博客
谁能想到,去年还只存在于畅想中的AI员工,如今已经真的成为现实。 今年年初,深圳市福田区就启用了70名基于DeepSeek开发的“AI数智员工”,开启人机协同办公。 当下的现实已经变成:人类能做的常规工作,AI也能做,甚至能更快速高效地做,比如发邮件、整理反馈工单、梳理任务进度等等。这意味着,AI不再是个聊天对话框,我们可以让AI做更多的执行类工作,让它们像真正的职场同事那样,独立执行任务、交付任务结果。 当然,这并...
商汤万象开发者
商汤万象开发者 发表了博客
本文将深入探讨在多模型工程落地中,一个看似不起眼却极度影响开发体验的问题——模型入口的统一与类型识别,并详细解析 LazyLLM 是如何通过优雅的机制解决它的。 1. 背景与问题:模型入口为何"四分五裂"? 在多模型工程里,最先让人头疼的,往往不是模型效果,而是入口不统一。 明明业务逻辑都是“用一个模型处理数据”,但在写代码前,开发者却被迫要先做一堆“选择题”: 这是在线 API,还是本地部署部署的模型? 这是文本对...
美团技术团队
美团技术团队 发表了博客
如果你看过今年春晚武术节目《武BOT》,一定会对那群与人类武者同台对打的机器人印象深刻。但在流畅的武术动作背后,是一个工程师团队连续数周针对特定舞台、特定灯光反复调试后才可能达到的动作丝滑。 ![](https://oscimg.oschina.net/oscnet//18af0bfc1f93c3b4b3ecf4fcd6a6c9df.png) 为什么机器人在固定场景下表现良好,但换一个环境、任务,泛化能力就会明显下降? 究其根源,是具身行业缺少带动作标注的训练数据进行泛化学习...
商汤万象开发者
商汤万象开发者 发表了博客
一、三天搭出 AI Agent,却被上下文坑翻了 2026年,一个人就是一支技术团队。 最近大家用Claude Code,OpenClaw这类AI助手爽写Agent,三天起高楼,五天宴宾客——不需要后端经验,甚至不需要理解什么是"并发"。本地测试时,多轮对话丝滑得像德芙,检索精准得像狙击枪,你觉得稳了,准备迎接人生第一笔被动收入。 但真实用户涌入后,系统开始"变异":用户A收到了用户B的隐私记录,昨天保存的设置 magically 串到了别人账号里,同...
得物技术
得物技术 发表了博客
# 一、背景 推荐系统在提升用户体验的同时,也面临着信息茧房、兴趣收敛和内容同质化的挑战。随着用户与系统交互的深入,"推荐→用户反馈→再推荐"的闭环会逐渐强化用户的少数主兴趣,导致推荐结果趋同,降低用户的新鲜感与满意度。 生成式AI技术的快速发展为推荐系统带来了新的机遇。与传统的判别式匹配范式不同,生成式召回通过预测用户下一个可能点击的内容,实现从"匹配已知"到"预测潜在"的范式转变。在得物社区这一潮流生活...
商汤万象开发者
商汤万象开发者 发表了博客
## 1\. 背景与问题 在真实工程环境里,算力平台几乎从来不是单一、稳定的。 公司内部,可能同时维护着多套集群;不同团队用着不同的调度系统;业务一调整,平台就升级、迁移,甚至整体更换。而一旦对外部署或交付给客户,运行环境的不确定性只会更高。不同平台之间,往往在这些地方差异明显: - **作业提交方式不同**:有的用 `srun`,有的用 `kubectl`,有的则是云厂商的专有 CLI。 - **资源申请参数不一致**:GPU、CPU、内存的...
商汤万象开发者
商汤万象开发者 发表了博客
很多 AI 应用在原型阶段都很顺:模型能调通,RAG 能跑起来,Agent 也能串起来。但一旦进入工程化部署,问题就变了。 真正麻烦的,往往不是“某个模块能不能工作”,而是: 多个模块怎么在同一条链路里协同; 下游步骤如何拿到原始输入和上游中间结果; 一条 pipeline 里哪些模块需要部署,谁来启动,URL 怎么回填; tracing、hook、状态管理,怎么和业务流程放在一起。 这正是 LazyLLM 设计 Flow 组件时要解决的问题。它不是只想...
大东
大东 发表了资讯
开源大模型之争,谷歌向左,Meta 向右。
美团技术团队
美团技术团队 发表了博客
![](https://oscimg.oschina.net/oscnet/up-e559f8bd0b265a3075a91dc4652a526c7d6.png) 引言 --- 现如今的大语言模型已经能流畅地写文章、写代码,甚至执行复杂的 Agent 工作流,然而,它们在面对严谨的数学定理证明时,却往往显得力不从心。 在常规的数学解题中,模型只需要"答对最终数值"即可,但数学定理证明不同,它要求极度严苛的逻辑链条,任何一句自然语言的模棱两可,都可能导致整个证明的崩塌。那么,如何让 AI 从"猜答...
商汤万象开发者
商汤万象开发者 发表了博客
问题:调用主体不明 在工程框架里,有一类很隐蔽但很常见的问题:同一个方法,看起来一样,结果却完全不同。å 为什么?因为方法的语义,不只取决于“做了什么”,还取决于——谁在调用。 很多操作天然分两种: 类级操作:影响全局 实例级操作:只影响当前对象 但问题在于,这两种操作,写法往往是一样的,于是就很容易出现这种情况:本来只是想改当前对象,结果把全局改了;或者全局状态,被某个实例悄悄改掉。更麻烦的是,这类...
美团技术团队
美团技术团队 发表了博客
引言 --- 物理世界的信息由图像、声音、文字交织而成。今天的大模型,本质上仍然是**以语言为中心的建模系统**,语言作为人类智慧符号化表述,在"压缩即智能"的范式下表现出强大的能力。但通往真正的物理世界智能,也许语言并不是世界的边界。视觉、语音与文本等多模态信号,实际上是对现实物理对象的不同侧面投影。 ![](https://oscimg.oschina.net/oscnet//9a7083f3770ac68563e7dddbf688ad4e.png) 这就引出一个根本问题:**能...
OpenAgents
OpenAgents 发表了博客
OpenClaw火了。 3 个月内斩获 28 万 GitHub Star ,这个全能的AI助手帮你聊天、管日程、写代码···· 显而易见,AI 正从"聊天"走向"行动"。 但行动之后呢?随着养虾热潮深入,新的问题浮现:当多个智能体需要一起完成复杂任务时,谁来负责协调?如何让不同智能体一起工作? OpenAgents 给出了答案:Agent 网络。 OpenAgents是一个专注于多智能体协作的开源框架,支持跨框架协作,多个智能体可以在其中相互沟通协作、共享资源,...
美团技术团队
美团技术团队 发表了博客
近日,美团 LongCat 团队正式对外发布并开源 LongCat-Flash-Thinking-2601。作为已发布的 LongCat-Flash-Thinking 模型的升级版,LongCat-Flash-Thinking-2601 在 Agentic Search(智能体搜索)、Agentic Tool Use(智能体工具调用)、TIR(工具交互推理)等核心评测基准上,均达到开源模型 SOTA 水平。 ![](https://oscimg.oschina.net/oscnet//5e3596fd27bf221957293281fe0ebf6a.png) 该模型尤其在工具调用上表现出卓越的泛化...
美团技术团队
美团技术团队 发表了博客
[AAAI](https://aaai.org/) 是人工智能领域顶级的国际学术会议,本文精选了美团技术团队被收录的8篇学术论文(附下载链接),覆盖大模型推理、 退火策略、过程奖励模型、强化学习、视觉文本渲染等多个技术领域,希望这些论文能对大家有所帮助或启发。 ![](https://oscimg.oschina.net/oscnet/up-bfa53eac2485e32035c0be1186b661ead5b.jpg) 01 Promoting Efficient Reasoning with Verifiable Stepwise Reward -----------------...
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
返回顶部
顶部