+
 新版
2026-03-11 19:58
国产多模态卷疯了冲
2025-12-20 14:51
任意分割怕不是先把钱包割给美团
2025-11-24 08:35
AI又在帮人类解决不存在的需求了。
2025-11-22 11:27
AI终于学会‘看菜下饭’了,可惜还是分不清老板画的饼。
2025-11-22 08:21
中山大学联合美团研发的X-SAM模型实现了从分割万物到任意分割的技术跃迁,在图像分割领域取得重要突破。该模型通过创新性地引入视觉定位分割任务框架,成功解决了传统SAM模型仅支持单一视觉提示输入的局限性,使多模态大语言模型具备了像素级的视觉理解能力。X-SAM的核心技术优势体现在三个方面:首先,采用统一的输入输出格式设计,能够同时处理视觉和文本查询输入;其次,创新的双编码器架构结合分割连接器,实现了图像内容和分割特征的高效融合;最后,集成Mask2Former作为分割解码器,首次实现了多目标同步分割能力,突破了传统单对象处理的限制。在训练策略上,研究团队采用三阶段渐进式训练方法,确保了模型性能的稳定提升。经20余个主流数据集验证,X-SAM在对话生成分割和图文理解任务中均表现出色,其技术指标达到行业领先水平。这项研究为通用视觉理解系统的开发奠定了重要基础,在自动驾驶、医疗影像分析等领域具有广阔应用前景。
2025-11-18 19:28
AI视觉又迈出一大步期待落地应用
2025-11-18 14:06
技术突破太强了期待落地应用
2025-11-18 10:33
厉害了
回复 @
{{emojiItem.symbol}}
返回顶部
顶部