引言 在当今的 Web 端对话式办公浪潮中,电子表格无疑是最核心、但也最复杂的业务场景之一。传统 Excel 的交互极其繁琐,公式学习成本高,数据分析与报表美化的门槛更是让许多终端用户望而却步。而对于前端开发者而言,想要在 Web 端实现一个"听得懂人话"的 AI 智能表格,面临的挑战绝不仅仅是接一个大模型的 API 那么简单。 在研发初期,我们遇到了大模型在处理复杂前端组件时的通病:面对 SpreadJS 极其丰富庞大的 API,模型容...
随着帕兰蒂尔在AI时代的爆火,本体(Ontology)这个词冲出学术圈,重新成了技术圈的热门词。很多人的反应是,这不是哲学系的东西吗? 这个困惑是合理的。Ontology 作为哲学术语,可以追溯到十七世纪,德国哲学家戈克莱尼乌斯在 1613 年的著作里第一次用这个词,指的是"研究存在本身的学问",什么东西存在,存在意味着什么,存在物之间的关系是什么。康德在《纯粹理性批判》里花了大量篇幅讨论这些问题,把它推向了哲学史上最复杂...
为了让 AI 学会使用系统,微调这个思路,逻辑上是最干净的。 RAG 是在推理时临时拼上下文,本体是在系统外维护一套结构化描述,这两种方式都有一种"补丁"的感觉,核心模型不懂你的业务,你在外面加了一层让它懂。微调不一样,它直接修改模型的权重,让业务知识成为模型本身的一部分。用完就是会,不用每次推理都带着额外的文档。而且有一个真实的先例支撑这个直觉:模型为什么会写 Python?不是因为推理时有人给它传了 Python 手...
今天,我们决定将 CloudDM 全面开源。 Apache 2.0 协议,所有功能全部开放,没有功能阉割,没有企业版限制。你可以自由部署、修改、二次开发,也可以真正把它用于生产环境中的数据库研发与管控。 GitHub 地址:https://github.com/ClouGence/open-cdm Gitee 地址:https://gitee.com/clougence/open-cdm CloudDM 是什么 很多数据库工具,本质上只解决单点问题。 比如 DBeaver / Navicat 解决连接和查询问题,Archery / Yearnin...
作者:互联网大数据团队-Wang Zhiwen 本文主要介绍了 vivo 大数据架构的演进历程中 YARN 服务的升级事项,从整体方案出发剖析每个环节遇到的问题难点并逐一分析讲解,对于研究调度器性能和从事大数据运维工作的同学具有较大的参考借鉴价值。 1分钟看图掌握核心要点👇 图 1 VS 图 2,您更倾向于哪张图来辅助理解全文呢?欢迎在评论区留言~ 一、背景 vivo 大数据平台早期引入的 Hadoop YARN 2.6.0 版本,在长期运行中已逐渐难以...
导读: KaptureCX 是一家专注于客户支持自动化平台的企业,服务于电子商务、医疗保健、金融等多个垂直领域的客户。随着业务的增长,其数据平台面临着**海量工单状态频繁更新(Heavy Upserts)以及复杂多表关联查询(Heavy Joins)**的双重挑战。 本文档详细记录了 KaptureCX 如何将其核心业务分析引擎从 ClickHouse 迁移至 StarRocks ,并引入 RisingWave 与 Kafka 重构实时 CDC(变更数据捕获)摄取链路,最终实现了查询性能从...
随着智能设备形态的多元化与用户场景的深度碎片化,移动应用开发正经历从“单点功能”向“全场景服务”的范式转变。登录转化率低、分享渠道适配成本高、高频任务需反复唤醒应用等痛点,持续消耗着开发者精力与用户耐心。与此同时,AI能力下沉、多端分布式协同、以及开源共享机制,正逐步成为突破体验瓶颈的核心驱动力。 在这一行业演进背景下,操作系统级平台正通过底层能力开放与标准化组件,为开发者提供从技术接入到体验优化...
作者:铖朴、瑜棕、顺岭 背景 随着 AI,尤其是 Generative AI(后文简称 GenAI)的快速发展,AI Agent 系统中涌现出大量新的核心概念,例如 Model、Prompt、Token、Tool Calling、Agent、Memory、Session 等。这些概念已成为算法工程师、运维人员和可观测平台用户最关心的观测对象。它们需要像传统系统中的 HTTP 请求、数据库调用一样,被标准化地采集、展示和消费,以便系统维护者清晰了解调用过程、高效排查问题。 基于此,O...
着业务数字化持续推进,企业正面临日益复杂的数据架构挑战。 为满足事务、分析、向量检索与缓存等多样化需求,企业需要同时运行多种数据库技术栈。数据库团队经常同时维护着超过 5 套不同的数据库系统。 例如:MySQL 或 Oracle 处理事务,ClickHouse 或 Doris 做分析,Milvus 或 Pinecone 做向量检索,Redis 做缓存,MongoDB 存储半结构化数据。每套系统有自己的运维体系、监控工具、SQL 方言,团队里有人专门负责 ETL 管道,专...
数据架构的来源业务架构,由业务产品团队,软件团队和数据团队共同参与制定的架构。对于软件架构师来说,数据架构重要输出是数据模型,数据模型按照抽象程度由高到底分为概念模型,逻辑模型,物理模型 本文从业务系统研发的视角来描述数据架构,如果从数据平台的角度,数据架构还包含了数据标准,数据质量等 概念模型:从业务架构而来,业务视角的高层次,粗粒度的模型,定义了主体域,业务实体,实体之间的关系,相关的业务规则...































