+
DevOps研发效能
媒体矩阵
开源中国APP
AI & 大数据
Artificial Intelligence 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。AI 研究通常需要大量数据支撑。
关注 182.6W
加载中
Apache SeaTunnel
Apache SeaTunnel 发表了博客
如果只把 SeaTunnel Zeta 理解成一个"更快的执行引擎",其实会低估它真正的价值。 对数据集成系统来说,真正难的从来不是"把链路跑起来",而是下面几件事能不能同时成立:吞吐足够高、失败后能恢复、数据不重复不丢失、资源开销不过度失控。 而 Zeta 值得认真看的地方,恰恰在这里:它不是靠某一个性能优化点取胜,而是把一致性、恢复、并发收敛和资源控制做成了一套闭环的系统能力。 > 说明:本文基于 SeaTunnel commit `c5ce...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
如果你做过调度系统,大概率经历过这样的时刻: 凌晨两点,手机突然亮了。 不是消息,是报警------任务挂了。 你盯着屏幕,脑子里只剩一句话: **"能不能让它自己修?"** 这听起来有点理想主义,但这一次,我们真的想认真聊聊这件事。 不久后,Apache DolphinScheduler 社区将举办新一期线上 Meetup。 这一次,我们不聊宏大架构,也不堆复杂概念, 而是从一个很"工程师"的问题出发------ 👉 **有没有可能,让调度系统更"省人"...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
![封面](https://oscimg.oschina.net/oscnet//f9884f08285bc59949fd7f1ae36d8cdf.png) 视频:https://www.bilibili.com/video/BV1bEBxBSEzy/?share_source=copy_web\&vd_source=95c219dd0dce02a8912d922af4c821e9 在数字化转型浪潮席卷全球的今天,智能制造已成为制造业高质量发展的核心引擎。然而,在迈向智能化的道路上,企业面临着诸多挑战:多系统数据孤岛、复杂的调度依赖、监控告警滞后等问题层出不穷。 在近期的 Apache...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
Community Over Code Asia 2026 将于今年 8 月 7 日---9 日在北京举行,大会议题征集也进入倒计时! 4 月 21 日 23:59,报名通道将准时关闭,计划来参加这场全世界开源盛会的小伙伴,请抓紧时间投递你的议题! 届时,来自全球的 Apache Committer、开源社区核心贡献者、企业技术负责人以及开发者,将在北京共同探讨 AI、云原生、大数据、开源社区治理、 Apache 项目等最新实践。 如果你正在推动一个开源项目,或者在生产环境中实...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
在数据平台不断演进的过程中,一个非常常见但又隐蔽的误区是:**团队会不自觉地让调度系统承担越来越多"本不属于它"的职责,比如在调度层写复杂业务逻辑、控制计算参数,甚至试图统一管理不同计算引擎的执行细节**。短期来看似乎提升了效率,但从长期来看,这种设计往往会让系统变得高度耦合、难以维护,甚至在规模上来之后失去稳定性。 因此,在讨论具体实践之前,我们必须先把一件事情讲清楚:**调度系统与数据引擎之间的边界...
禅道项目管理软件
禅道项目管理软件 发表了博客
公司明明有很多经验丰富的员工、有积累了数年的项目文档,但每当新项目启动或新人入职时,为什么大家还是在重复造轮子? 这背后的关键是:企业并不缺知识,也不缺文档,缺的是一套将碎片化信息转化为能便利取用的知识库。 在AI时代,真正的竞争力不再是拥有多少文档,而是提取、复用和迭代知识的速度。今天来安利一个目前我觉得最好用的AI知识库。 点击获取禅道AI知识库 一、为什么企业知识库难积累? 我们总习惯把技术方案丢进...
vivo互联网技术
vivo互联网技术 运营/编辑 发表了博客
> 作者: vivo互联网项目团队- Ding Junjie > 本文从 Coding Agent 为什么能率先跑通谈起,分析 OpenClaw 若要进入真实生产场景还缺哪些关键能力。核心判断是,要让 Agent 在业务世界稳定落地,必须把开放、分散、难回滚的执行环境,重构成一个可视化、相对封闭、可验证、可恢复的操作空间。 1分钟看图掌握核心观点👇 ![动图封面](https://oscimg.oschina.net/oscnet//cc694e2589df5d531e5026559620a2d3.jpg) ![动图封面](htt...
禅道项目管理软件
禅道项目管理软件 发表了博客
最近圈子里到处都在讨论“AI能不能替代程序员”,各类观点众说纷纭、莫衷一是,让人难以分辨。 到底是人机协作还是人机竞争?AI究竟是不是比手搓代码更厉害?为了评估AI在实际开发场景中的表现,我们组织了一场人工手搓代码与OpenAI Codex的比赛,看看在实际研发场景中,两者到底谁更胜一筹。 这次要解决的问题场景是研发团队最日常的研发工作——解Bug! 解Bug不仅考验技术功底,更需要对项目逻辑、业务场景的熟悉度,也是最能...
商汤万象开发者
商汤万象开发者 发表了博客
## 1\. 背景与问题 在真实工程环境里,算力平台几乎从来不是单一、稳定的。 公司内部,可能同时维护着多套集群;不同团队用着不同的调度系统;业务一调整,平台就升级、迁移,甚至整体更换。而一旦对外部署或交付给客户,运行环境的不确定性只会更高。不同平台之间,往往在这些地方差异明显: - **作业提交方式不同**:有的用 `srun`,有的用 `kubectl`,有的则是云厂商的专有 CLI。 - **资源申请参数不一致**:GPU、CPU、内存的...
Baihai_IDP
Baihai_IDP 发表了博客
> **编者按:** 你是否也曾在深夜调试大语言模型服务时,对着飙升的延迟和捉襟见肘的 GPU 显存一筹莫展?为什么同样的模型,在线服务商能支撑高并发,而你自建的推理服务却频频超时?当你试图通过增大 batch size 提升吞吐量时,却换来首字延迟的恶性膨胀 ------ 这些问题的根源,往往藏在黑盒般的推理引擎内部。 > > 这篇文章没有停留在理论层面,而是深入 Nano-vLLM ------ 一个由 DeepSeek 贡献者开源的、仅 1200 行代码却完...
Baihai_IDP
Baihai_IDP 发表了博客
> **编者按:** 当多模态模型不断朝着更大参数、更长推理路径的方向演进时,我们是否忽略了"轻量、高效、实用"这一同样重要的维度?今天为大家带来的文章,作者的观点是:通过精细化数据设计与混合推理策略,可以训练出一款在性能与成本之间实现理想平衡的小型多模态推理模型。 > > 文章围绕微软最新开源的 Phi-4-reasoning-vision-15B 展开,系统阐述了该模型的研发初衷与关键设计决策。作者首先指出,当前多模态模型普遍追求更...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
在生产环境中,调度平台的性能问题从来不是单点瓶颈,而是**调度决策、任务执行、元数据存储、协调机制**等多层因素叠加的结果。以 **Apache DolphinScheduler** 为例,如果你只盯着某一个组件(比如 Master 或 Worker),往往会误判问题根因。 这篇文章从真实生产实践出发,系统拆解调度平台的性能瓶颈,并给出可落地的优化策略。 # 一、从整体架构上,瓶颈到底在哪一层? DolphinScheduler 的核心链路可以抽象为: ![](https:...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
随着数据平台从"能跑"走向"稳定运行",团队面临的问题也在发生变化。早期更多关注任务是否成功执行,而在规模扩大之后,问题逐渐转向权限是否可控、链路是否清晰、变更是否可管理以及故障是否能够恢复。 DataOps 的价值,正是在这一阶段体现出来。它并不是简单的工具使用规范,而是一套围绕开发、调度与治理的工程化方法。本文以 WhaleStudio 的开发管理框架为例,从实际生产经验出发,梳理一套可以直接落地的开发标准。 三层开...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
很少有人会把“成为 ASF Member”当成一个明确目标。 因为它既不能申请,也没有明确路径,它更像是一种结果——在一个社区中长期做事之后,被自然看见。 范佳正是这样走到这一步的。 不久前,他受邀成为 Apache Software Foundation(ASF)Member。借这个契机,我们和他做了一次完整的交流。相比一段荣誉的确认,这次对话更像一次回溯:从数据集成,到开源参与,再到系统设计与社区理解,一个工程师是如何一步步走到这里的。 ##...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
![3月月报ST](https://openwrite-whaleops.oss-cn-zhangjiakou.aliyuncs.com/2026/04/07/3yue-yue-baost.png) 嘿!2026 年 3 月月报来啦!Apache SeaTunnel 社区超给力~ 26 位小伙伴踊跃参与代码贡献,发布了 2.3.13 新版本,新增 5 个连接器,核心引擎、文件连接器、CDC、Transform 均得到大幅增强,并修复 Bug 20+ 项。 与此同时,基础设施也更新啦,欢迎企业和个人用户升级新版本,关注新功能,跟着社区一起冲冲冲! > 汇总周...
vivo互联网技术
vivo互联网技术 运营/编辑 发表了博客
作者:互联网搜索团队-Wang Wenqian 本文通过对OpenClaw,Claude Code等主流Agent产品的设计进行分析,给出Agent架构设计的关键决策,分析各方案的利弊。 1分钟看图掌握核心观点👇 图 1 VS 图 2,您更倾向于哪张图来辅助理解全文呢? 一、引言 构建一个 Agent 需要做一系列架构决策:上下文怎么管理?工具怎么加载?工具怎么查找?Agent 的主循环围绕什么来设计? 这些决策没有标准答案,但每个选择都有明确的代价。本文从 Op...
得物技术
得物技术 发表了博客
# 一、引言:财务数仓为什么需要AI? ## 财务数仓的特殊性 在电商数仓体系中,财务域是复杂度最高、容错率最低的领域。不仅因为财务对于数据准确性的要求高,也因为财务是横向域,与几乎所有的域都有数据交叉,因此对业务 Sense 的要求很高。财务数仓工程师本质上在做三件事: - 业务翻译:将交易、支付、资金、促销补贴、成本等数十个业务系统的数据,翻译成通用的财务语言; - 资产架构:从 ODS 到 DWD、DWS、ADS 层层构建,确...
得物技术
得物技术 发表了博客
# 一、背景 在实际迭代开发中,不同需求的代码规模差异很大,有些需求涉及上千行代码,有些则只有一两行。且对于前端的代码验收,主要侧重在界面功能,通过功能验收,没法确保每一行代码都测试到的,以及功能的代码逻辑是否合理,是否健壮、是否规范等问题,都需要通过人工代码 CR 来进一步兜底验收代码的质量,尽量降低业务线上出错的可能。但当面对上千行的代码变更时,人工 CR 也是心有余而力不足。 传统的代码审查依赖人工,...
NebulaGraph
NebulaGraph 发表了博客
本文简要介绍本体论的起源及应用,NebulaGraph 将在 4.18 举办「Data+AI」MeetUp,由 NebulaGraph 产品专家@方扬,带来主题为「以本体论重构数据:图技术驱动 AI 理解世界」的 topic,将结合本体论对 NebulaGraph 的 AI 能力进行深度分享,欢迎大家关注「NebulaGraph」公众号,将于下周公开议程与报名链接。 本文首发于「NebulaGraph 公众号」,更多产品资讯请访问「NebulaGraph 官网」 2月 28 日,美国和以色列对伊朗发动突袭。...
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
返回顶部
顶部