NebulaGraph
NebulaGraph 发表了博客
本文根据 NebulaGraph@方扬,在社区 AI+Data MeetUp 上的演讲整理。文末附 PPT 下载链接、直播回放。 本文首发于「NebulaGraph 公众号」,更多产品资讯请访问「NebulaGraph 官网」 ✨推荐阅读 别再卷大模型了:Palantir 告诉我们,AI 的进阶是“本体论” 从去年 DeepSeek 发布到现在,基本上每天我们都能接收到新东西——AI的发展实在是太快了。作为一家数据库厂商,说实话我们自己也很焦虑。我们一直在想:在AI时代,我们应该做...
百度Geek说
百度Geek说 发表了博客
导读 introduction 本文提出了一套8维度的Skill量化评估框架,通过元数据质量、执行引导清晰度、领域知识密度等指标对Skill进行打分评级,解决了Skill质量难以客观衡量的问题。为提升评估可靠性,设计了多模型交叉验证流程,并适配不同AI工具环境提供四种执行策略。该框架既能帮助开发者识别改进短板,也能辅助用户横向对比选择优质Skill,但需注意其侧重于文档与设计质量评估,并非运行时性能的完整度量。 00 为什么需要一把尺...
DolphinScheduler社区
DolphinScheduler社区 架构师 发表了博客
在数据平台不断演进的过程中,很多团队都会经历一个关键转折点:调度系统已经足够稳定,任务也能够按时运行,但整体效率却没有提升,反而随着规模扩大变得越来越难维护。问题的根源在于,平台仍然停留在“任务调度”的层面,而没有上升到“工程治理”的层面。 本文要讨论的正是这一转变——调度如何从一个执行工具,演进为支撑 DataOps 的核心平台,以及这一过程中最关键的方法论与实践路径,并结合 Apache DolphinScheduler 的...
DolphinScheduler社区
DolphinScheduler社区 架构师 发表了博客
作者 | 三线程序员 "与 DolphinScheduler 集成有时间再写吧,欠的东西太多了。",现在项目快部署了,特此来还债。 ### 1. 为什么要集成DolphinScheduler 我们已经验证了SeaTunnel的本地模式(local)可以正常跑ETL任务。但实际生产环境中,需要: - **定时调度**:每日/每小时自动执行数据同步任务 - **任务依赖**:上游数据准备就绪后再触发下游任务 - **告警通知**:任务失败时发送通知(三线城市还没这个岗位,炸了再说) - ...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
作者 \| 三线程序员 ![](https://oscimg.oschina.net/oscnet//9e000b2d95a6d55f85f9eca2731e934f.jpg) 想用Apache SeaTunnel对接瀚高数据库该怎么配?本文分享实战经验,瀚高数据库基于PostgreSQL内核,直接用标准JDBC驱动即可连接。文中给出了瀚高MySQL模式读写PG模式、Doris数据迁移至瀚高的配置示例,操作顺畅。 ### 1. 瀚高数据库简介 瀚高数据库(HighGo)是国产数据库厂商,基于PostgreSQL内核开发,专注于企业级应用。与...
Baihai_IDP
Baihai_IDP 发表了博客
> **编者按:** 你是否曾好奇,当我们向大语言模型输入一段文字、看着它逐字逐句生成回复时,背后那些动辄千亿参数的神经网络究竟在"计算"什么?它们又是如何在短短几秒内完成如此复杂的推理过程? > > 我们今天为大家带来的文章,作者的观点是推理引擎的价值不仅在于调度,更在于通过重写模型代码与深度优化底层计算逻辑,将静态的权重转化为高效的智能输出。 **作者 \| Neutree AI** **编译 \| 岳扬** **01 模型内部机制、KV ...
OpenAgents
OpenAgents 发表了博客
当AI智能体从实验室Demo走向全民日常,一个极具画面感的景象正在全球科技圈蔓延:普通用户在本地部署专属AI Agent,圈内人戏称这是“养AI小龙虾”—— 每个人都有自己的“专属智能伙伴”,却只能困在个人设备的“玻璃缸”里,无法与其他“小龙虾”互通有无。 热潮之下,开发者忙着用LangGraph、AutoGen搭建封闭的Agent团队,试图通过固定分工实现高效协作;企业却在多智能体协同的“泥潭”中挣扎:延迟过高、协议不兼容、安全风...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
如果只把 SeaTunnel Zeta 理解成一个"更快的执行引擎",其实会低估它真正的价值。 对数据集成系统来说,真正难的从来不是"把链路跑起来",而是下面几件事能不能同时成立:吞吐足够高、失败后能恢复、数据不重复不丢失、资源开销不过度失控。 而 Zeta 值得认真看的地方,恰恰在这里:它不是靠某一个性能优化点取胜,而是把一致性、恢复、并发收敛和资源控制做成了一套闭环的系统能力。 > 说明:本文基于 SeaTunnel commit `c5ce...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
如果你做过调度系统,大概率经历过这样的时刻: 凌晨两点,手机突然亮了。 不是消息,是报警------任务挂了。 你盯着屏幕,脑子里只剩一句话: **"能不能让它自己修?"** 这听起来有点理想主义,但这一次,我们真的想认真聊聊这件事。 不久后,Apache DolphinScheduler 社区将举办新一期线上 Meetup。 这一次,我们不聊宏大架构,也不堆复杂概念, 而是从一个很"工程师"的问题出发------ 👉 **有没有可能,让调度系统更"省人"...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
![封面](https://oscimg.oschina.net/oscnet//f9884f08285bc59949fd7f1ae36d8cdf.png) 视频:https://www.bilibili.com/video/BV1bEBxBSEzy/?share_source=copy_web\&vd_source=95c219dd0dce02a8912d922af4c821e9 在数字化转型浪潮席卷全球的今天,智能制造已成为制造业高质量发展的核心引擎。然而,在迈向智能化的道路上,企业面临着诸多挑战:多系统数据孤岛、复杂的调度依赖、监控告警滞后等问题层出不穷。 在近期的 Apache...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
Community Over Code Asia 2026 将于今年 8 月 7 日---9 日在北京举行,大会议题征集也进入倒计时! 4 月 21 日 23:59,报名通道将准时关闭,计划来参加这场全世界开源盛会的小伙伴,请抓紧时间投递你的议题! 届时,来自全球的 Apache Committer、开源社区核心贡献者、企业技术负责人以及开发者,将在北京共同探讨 AI、云原生、大数据、开源社区治理、 Apache 项目等最新实践。 如果你正在推动一个开源项目,或者在生产环境中实...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
在数据平台不断演进的过程中,一个非常常见但又隐蔽的误区是:**团队会不自觉地让调度系统承担越来越多"本不属于它"的职责,比如在调度层写复杂业务逻辑、控制计算参数,甚至试图统一管理不同计算引擎的执行细节**。短期来看似乎提升了效率,但从长期来看,这种设计往往会让系统变得高度耦合、难以维护,甚至在规模上来之后失去稳定性。 因此,在讨论具体实践之前,我们必须先把一件事情讲清楚:**调度系统与数据引擎之间的边界...
禅道项目管理软件
禅道项目管理软件 发表了博客
公司明明有很多经验丰富的员工、有积累了数年的项目文档,但每当新项目启动或新人入职时,为什么大家还是在重复造轮子? 这背后的关键是:企业并不缺知识,也不缺文档,缺的是一套将碎片化信息转化为能便利取用的知识库。 在AI时代,真正的竞争力不再是拥有多少文档,而是提取、复用和迭代知识的速度。今天来安利一个目前我觉得最好用的AI知识库。 点击获取禅道AI知识库 一、为什么企业知识库难积累? 我们总习惯把技术方案丢进...
vivo互联网技术
vivo互联网技术 运营/编辑 发表了博客
> 作者: vivo互联网项目团队- Ding Junjie > 本文从 Coding Agent 为什么能率先跑通谈起,分析 OpenClaw 若要进入真实生产场景还缺哪些关键能力。核心判断是,要让 Agent 在业务世界稳定落地,必须把开放、分散、难回滚的执行环境,重构成一个可视化、相对封闭、可验证、可恢复的操作空间。 1分钟看图掌握核心观点👇 ![动图封面](https://oscimg.oschina.net/oscnet//cc694e2589df5d531e5026559620a2d3.jpg) ![动图封面](htt...
禅道项目管理软件
禅道项目管理软件 发表了博客
最近圈子里到处都在讨论“AI能不能替代程序员”,各类观点众说纷纭、莫衷一是,让人难以分辨。 到底是人机协作还是人机竞争?AI究竟是不是比手搓代码更厉害?为了评估AI在实际开发场景中的表现,我们组织了一场人工手搓代码与OpenAI Codex的比赛,看看在实际研发场景中,两者到底谁更胜一筹。 这次要解决的问题场景是研发团队最日常的研发工作——解Bug! 解Bug不仅考验技术功底,更需要对项目逻辑、业务场景的熟悉度,也是最能...
商汤万象开发者
商汤万象开发者 发表了博客
## 1\. 背景与问题 在真实工程环境里,算力平台几乎从来不是单一、稳定的。 公司内部,可能同时维护着多套集群;不同团队用着不同的调度系统;业务一调整,平台就升级、迁移,甚至整体更换。而一旦对外部署或交付给客户,运行环境的不确定性只会更高。不同平台之间,往往在这些地方差异明显: - **作业提交方式不同**:有的用 `srun`,有的用 `kubectl`,有的则是云厂商的专有 CLI。 - **资源申请参数不一致**:GPU、CPU、内存的...
Baihai_IDP
Baihai_IDP 发表了博客
> **编者按:** 你是否也曾在深夜调试大语言模型服务时,对着飙升的延迟和捉襟见肘的 GPU 显存一筹莫展?为什么同样的模型,在线服务商能支撑高并发,而你自建的推理服务却频频超时?当你试图通过增大 batch size 提升吞吐量时,却换来首字延迟的恶性膨胀 ------ 这些问题的根源,往往藏在黑盒般的推理引擎内部。 > > 这篇文章没有停留在理论层面,而是深入 Nano-vLLM ------ 一个由 DeepSeek 贡献者开源的、仅 1200 行代码却完...
Baihai_IDP
Baihai_IDP 发表了博客
> **编者按:** 当多模态模型不断朝着更大参数、更长推理路径的方向演进时,我们是否忽略了"轻量、高效、实用"这一同样重要的维度?今天为大家带来的文章,作者的观点是:通过精细化数据设计与混合推理策略,可以训练出一款在性能与成本之间实现理想平衡的小型多模态推理模型。 > > 文章围绕微软最新开源的 Phi-4-reasoning-vision-15B 展开,系统阐述了该模型的研发初衷与关键设计决策。作者首先指出,当前多模态模型普遍追求更...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
在生产环境中,调度平台的性能问题从来不是单点瓶颈,而是**调度决策、任务执行、元数据存储、协调机制**等多层因素叠加的结果。以 **Apache DolphinScheduler** 为例,如果你只盯着某一个组件(比如 Master 或 Worker),往往会误判问题根因。 这篇文章从真实生产实践出发,系统拆解调度平台的性能瓶颈,并给出可落地的优化策略。 # 一、从整体架构上,瓶颈到底在哪一层? DolphinScheduler 的核心链路可以抽象为: ![](https:...
Apache SeaTunnel
Apache SeaTunnel 发表了博客
随着数据平台从"能跑"走向"稳定运行",团队面临的问题也在发生变化。早期更多关注任务是否成功执行,而在规模扩大之后,问题逐渐转向权限是否可控、链路是否清晰、变更是否可管理以及故障是否能够恢复。 DataOps 的价值,正是在这一阶段体现出来。它并不是简单的工具使用规范,而是一套围绕开发、调度与治理的工程化方法。本文以 WhaleStudio 的开发管理框架为例,从实际生产经验出发,梳理一套可以直接落地的开发标准。 三层开...
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页