DevOps研发效能
媒体矩阵
开源中国APP
大模型
ChatGPT 和其他类 GPT 的 AI 都是基于 GPT(Generative Pre-trained Transformer)架构的大型语言模型。它们是使用深度学习技术训练的神经网络,具有自然语言理解和生成的能力。 这些模型都是基于无监督学习的方式进行训练的,利用大量的文本数据进行预训练,并通过微调和迁移学习等技术来完成各种自然语言处理任务,如问答、对话生成、文本摘要、情感分析等。
关注 66.7W
加载中
袋鼠云数栈
袋鼠云数栈 发表了博客
在城市更新与产业升级的背景下,会展经济正在重新被定义。它不再是单一场馆的短期活动,而是城市产业链中高密度、高频次的流量集聚点。尤其对于旅游城市而言,如何通过会展带动人流、联动消费、延伸服务,成为政府必须要深度思考的命题。 某地级市作为该省重点发展区域,在加快构建现代产业体系的过程中,选择将5A级景区核心区内的会展中心作为数字化转型试点,希望以此带动文化、旅游、商业、城市服务等相关产业联动升级。但转...
ClouGence
ClouGence 发表了博客
在之前的文章中,我们介绍了[如何使用 CloudCanal 和 Ollama 搭建全栈私有的 RAG 问答服务](https://my.oschina.net/u/5170379/blog/18459339),为企业级 RAG 应用提供了部署简单、安全可靠的解决方案。 最近,我们用这套方案,在 CloudCanal 官网上线了基于 **知识库 **的智能问答机器人。在发布前的测试过程中,却发现它似乎没有想象中那么"智能",出现了答非所问、检索失焦、上下文理解有误等问题**。** 今天,我们将从 Clou...
肖滢
肖滢 发表了资讯
这十年来,技术栈换了一茬又一茬。从 asp.net mvc 到 asp.net core 到.net 6、7...10,从 jquery 到 vue,写了 c++、java、python、R 等等等等,直到现在,用上个 cursor,语法都不用学都可以手搓一个站点出来:使用 Astro 三天完成官网。看着为了理想,我放弃了一切,仿佛又回到了十年前,那个对技术充满好奇的少年。
阿里云大数据AI技术
阿里云大数据AI技术 发表了博客
随着大语言模型(LLM)规模和计算需求增长,如何高效应用这些模型成为关键挑战。阿里云PAI团队推出 **EasyDistill** 开源框架([GitHub链接](https://github.com/modelscope/easydistill)),简化大模型的知识蒸馏过程,显著降低计算成本,同时保持高性能。基于 EasyDistill 训练的 **DistilQwen-ThoughtX **系列模型,结合创新的**变长思维链推理**技术,能够根据任务难度自适应调整推理步骤,避免传统思维链方法的"过度思考"...
肖滢
肖滢 发表了资讯
最近,AI 浏览器的赛道着实有点挤。 5 月 8 日,ArcBlock 公司宣布推出全球首款真正为 AI 设计的浏览器——ArcSphere,基于 ArcBlock 的去中心化身份 (DID) 技术构建。甚至还阴阳了一下另外两款 AI 浏览器 Comet 和 Dia,至今还在搞内测。 老牌浏览器厂商 Opera 也没闲着,前几天 发布了 AI agentic 浏览器——Opera Neon,可以理解网站内容并代表用户执行操作,例如填写表格、预订行程和购物,所有 AI 处理都在本地进行。 在...
阿里云大数据AI技术
阿里云大数据AI技术 发表了博客
作者:汪诚愚(熊兮)、严俊冰(玖烛)、蔡文睿(清素)、岳元浩(顾城)、黄俊(临在) 前言 随着大型语言模型(LLM)的复杂性和规模不断增长,对于许多研究人员和企业而言,如何有效地利用这些庞大的模型变得愈发重要。然而,巨大的计算需求和训练成本为模型的广泛应用设置了障碍。知识蒸馏是一种将大模型的知识转移到小模型的方法,其核心思想是在不显著降低性能的前提下,通过训练将复杂的模型转化为更小、更高效的版本。通...
阿里云大数据AI技术
阿里云大数据AI技术 发表了博客
作者:蔡文睿(清素)、汪诚愚(熊兮)、严俊冰(玖烛)、黄俊(临在) # 前言 近年来,自然语言处理(NLP)领域以大语言模型(LLM)的出现为标志,发生了深刻变革,引领了语言理解、生成和推理任务的进步。其中,进步尤其显著的是深度推理模型的发展,如 OpenAI 的 o1、DeepSeek-R1 和 QwQ-32B 等,它们在数学问题、代码生成等复杂推理任务中表现突出。这些模型的成功很大程度上得益于使用思维链(Chain-of-Thought, CoT)的推...
一君_
一君_ 发表了博客
最近 Agentic AI 一词常出现在大众视野里,很多人还没玩转 Agent,又要开始了解 Agentic AI,这是不是新瓶装旧酒,又造没必要的概念? 还真不是。Agentic AI 的核心能力很好理解——接到任务后,先思考规划,然后自动调用、组合一切可以使用的工具,帮你完成任务。 和对话式、生成式的 GenAI 相比,Agentic AI 具备自主决策与行动的能力。 和单个的 Agent 相比,Agentic AI 则是能同时调动多个 Agent 或者其他工具,完成更复杂的...
蚂蚁开源
蚂蚁开源 发表了博客
“当我们看到这些数据趋势的时候,一个词浮现在我的眼前——黑客松(Hackathon),AI 领域的项目,快速地出现、快速地停更,他们似乎在做一场真实市场里的黑客松,那么,什么领域涌现了最多项目,哪些方面是停更的重灾区,哪些项目幸存了,激烈竞争的项目们如今怎么样了,我们都尝试着在这份趋势报告里叙述一二。” --王旭,蚂蚁开源技术委员会副主席 「根据 OpenDigger 的数据显示,人工智能已经于 2023 年超越云原生,成为协作...
肖滢
肖滢 发表了资讯
深入了解相关研究进展后我们会发现,当前面向最小欧式距离(Minimal Euclidean distance)检索和面向最大内积(Maximum Inner Product)检索的算法之间,存在一条难以跨越的技术鸿沟。这种割裂,正是许多朋友向我吐槽 “向量检索门槛太高” 的根本原因之一。 大多数使用向量数据库的用户,其实并不关心生成向量的 AI 模型是如何训练的,也不太在意该选择什么样的模型架构或向量度量方式 —— 他们只想知道一件事:到底该用哪种算...
astaxie
astaxie 发表了资讯
🔥 DeepChat 0.2.1 重磅更新! 朋友们,DeepChat 又有重要更新啦!这次真的解决了很多实用问题✨ 🚀 核心改进: 修复OpenAI调用崩溃bug,对话更稳定 优化搜索意图识别,找信息更精准 新增Artifact预览"复制为图片"功能 支持卡片样式,界面更美观 内置DeepResearch MCP功能上线 💡 特别推荐: 新的模板化自动提示工具,让AI理解你的需求更准确! 作为Apache 2.0开源项目,DeepChat真的是商用友好、开箱即用...
肖滢
肖滢 发表了资讯
MCP 与 ANP 在协议架构、身份认证、信息组织三个方面存在大的差异。 MCP 是典型的 CS(客户端 - 服务端)架构,ANP 是典型的 P2P(点对点)架构。 MCP 身份认证基于 Oauth 标准,让客户端方便的访问当前互联网的资源;ANP 的身份认证基于 W3C DID 标准,重点解决智能体之间的跨平台互操作性问题,让所有智能体都能互联互通。 MCP 的信息组织基于 JSON-RPC 技术,本质上是 API 调用;ANP 的信息组织基于语义网的 Linked-Data 技术...
肖滢
肖滢 发表了资讯
鲲鹏正式推出鲲鹏 AI + 解决方案,开源发布多样化算力集群软件开源社区 openFuyao,构建 AI 时代卓越引擎。面向 AI 计算领域,昇腾发布 CATLASS 算子模板库、MindIE Motor 推理服务加速库、推理微服务 MIS,并持续升级分层开放 CANN 的能力、MindSpeed RL 强化学习套件、大规模专家并行推理解决方案,让算子开发更简单,应用部署更便捷,模型训练和推理更高效。...
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
返回顶部
顶部