elasticstack
elasticstack 发表了博客
作者:来自 Elastic Dan Courcy 近日, Elastic 9.4 正式发布,这是ElasticsearchPlatform 的最新版本。除了包含帮助开发者进行上下文工程(context engineering)、应用与基础设施监控以及 AI 驱动的安全运营的新功能之外,Elastic 9.4 还在Elastic Search & AI、Elastic Observability和Elastic Security中引入了一系列广泛的新能力。 那么,Elastic 9.4 有哪些新内容? Elastic 9.4 代表了 Elasticsearch 平台未来的发展方向...
极限实验室
极限实验室 发表了博客
## 从"用搜索"到"造搜索" 搜索系统的需求千差万别。标准功能覆盖不了所有场景——行业特定的分词规则、定制化的业务逻辑、与外部系统的深度集成…… 以往,这类定制需求需要依赖厂商支持。**从 Easysearch 2.1.2 开始,你可以自己动手了。** 随着构建依赖库正式发布到 Maven 中央仓库,Easysearch 的插件开发能力正式对外开放。这意味着 Easysearch 不再是一个黑盒产品,而是一个**可扩展、可定制的搜索平台**。你可以基于官方接...
ClouGence
ClouGence 发表了博客
同样的数据,放在不同的系统里,成本可以相差数倍。这是我们的用户完成 Google Spanner 到 StarRocks 迁移后的真实结果,分析成本直接降低了 70%--80%。 这一差距主要是因为 Spanner 是为事务设计的,计费模型也围绕事务场景构建。当分析负载逐渐堆积在上面时,不仅查询慢,资源利用率低,成本更是不断攀升。而 StarRocks 面向实时分析场景,从架构、性能到成本都更适合承载分析查询业务。 本文将介绍如何实现 Google Spanner 到...
ClouGence
ClouGence 发表了博客
在做 Elasticsearch 之间的数据同步时,很多团队第一反应是使用 **Logstash**。作为 Elastic 官方生态的一部分,它配置简单,能解决基本的数据搬运需求。但由于缺乏直观的监控、告警以及精细的任务管理,在跨集群或大规模同步场景中,Logstash 常常不是最佳方案。 针对这些问题,CloudCanal 提供了基于增量扫描的企业级数据同步解决方案,本文将介绍这种方案的实现机制和特性,并带你从零开始构建数据链路,帮你快速上手。 Logs...
极限实验室
极限实验室 发表了博客
**15,000 条 heavy-OR 规则,200,000 条文档,同一台机器:Easysearch 在线规则引擎全流程 11.68 秒,Percolate Query 仅搜索阶段就跑了 254.30 秒——慢了 21.8 倍。** 在"规则先存、文档后到"这类场景下,Percolate Query 的延迟会随规则数量和复杂度的增长快速恶化。规则涨到数千条后,每批文档匹配的耗时可以从秒级攀升至几分钟。这类问题换索引参数、调批次大小、精简 DSL,都治标不治本,根子在执行模型本身。 本文通过一...
elasticstack
elasticstack 发表了博客
作者:来自 Elastic David Pilato 刚接触Elasticsearch吗?欢迎参加我们的Elasticsearch入门网络研讨会。你也可以开始免费云试用,或者现在就在你的本地机器上试试Elastic。 在管理Elasticsearch索引时,您可能需要验证一个索引中所有文档是否也存在于另一个索引中,例如在重新索引操作、迁移或数据管道之后。Elasticsearch没有内置“diff”命令,但正确的做法取决于一个关键问题:你的文档ID在两个索引之间是否稳定? 问题 假设...
极限实验室
极限实验室 发表了博客
最近一次高并发写入压测中,我们遇到了一个非常诡异的 BKD merge 崩溃。从报错看,很像 Easysearch 2.1.2 在 merge 阶段把 segment 读成了错误状态。典型错误是这样的: ```text java.lang.ArrayIndexOutOfBoundsException: Index -3 out of bounds for length 8 java.lang.ArrayIndexOutOfBoundsException: Index -4 out of bounds for length 8 ``` 异常栈最终落在 Lucene BKD 相关路径上: * `BKDReader.readNodeData()` * `...
elasticstack
elasticstack 发表了博客
作者:来自Elastic Joe Reuter 学习如何使用 Elasticsearch 日志聚类和 AI agents自动化错误分诊,将生产日志转化为可执行的根因报告。 工程反馈循环通常被描绘为一个清晰的周期:发布功能、监控其健康状态、进行问题分诊、识别 bug,以及部署 修复。然而,在大规模云环境中,从监控到问题识别的路径往往成为瓶颈。当运行在 Elastic Cloud 上的数千个 Kibana 实例在庞大的代码库中产生数百万条日志时,从错误发生到工程师理解其...
数据引擎
数据引擎 发表了博客
对很多团队来说,开始认真看待敏感数据脱敏,往往不是因为要做数据安全建设汇报,而是因为某个很具体的场景:BI 同学想查转化漏斗,需要手机号字段;测试同学要复现线上问题,希望看一眼真实用户信息;外包同学在处理工单时,也会提出“只查一下,不会外传”。这些请求看起来都很合理,但一旦默认明文可见,风险就已经发生了。 更需要关注的是,数据库团队通常处在一个两难位置:基本不给看,业务说排障、分析、核验都做不下去;...
IvorySQL
IvorySQL 发表了博客
IvorySQL v5(5.0、5.1、5.3) 已经发布一段时间了。 在这段时间里,我们陆续收到了来自社区用户的一些反馈: 有人已经在生产环境升级使用,也有人正在测试评估,还有不少开发者对新版本的能力表示关注。 这些真实的使用体验,对 IvorySQL 的持续改进非常重要。 因此,我们想邀请大家参与一次 **IvorySQL 用户调研**,听听社区的真实声音。 🔍 我们想了解什么? ----------- 这次调研主要关注三个方面。 **1. IvorySQL 的使用...
美团技术团队
美团技术团队 发表了博客
![](https://oscimg.oschina.net/oscnet/up-844d16480b983a05cb961be26e650a66657.png) **速读** 在美团,我们构建了以指标平台为核心的新一代 BI 架构,通过自动语义和增强计算两种核心能力的建设,部分解决了传统 BI 平台在个性化数据集驱动下产生的数据口径混乱、查询性能差等问题。 自动语义能力实现了"定义即研发"。它将业务语言定义的指标自动解析为结构化的逻辑表达,并通过主外键关系将数仓模型自动关联成星型、雪花等模...
elasticstack
elasticstack 发表了博客
作者:来自ElasticSneha Sachidananda 从你的 AI agent 开始使用 Elastic Security Elastic Agent Skills 是开源包,为你的 AI coding agent 提供原生 Elastic 专业知识。如果你已经在使用 Elastic Agent Builder,你会得到与安全数据原生配合的 AI agents。Agent Skills 面向另一端:将相同的 Elastic Security 知识带给你的团队已经在使用的外部 AI 工具,比如 Cursor、Claude Code 或 GitHub Copilot。 如果你使用 AI codin...
墨天轮小墨
墨天轮小墨 发表了博客
2026年3月墨天轮社区的[**中国数据库流行度排行榜**](https://www.modb.pro/dbRank?0319)正式出炉,受前期假期因素影响,行业整体动态较此前略有放缓,但头部格局重塑、细分赛道突破的趋势依旧鲜明。 本月头部厂商位次迎来重要调整,技术创新、场景落地与生态共建仍是行业主线,国产数据库在金融、政务、民生、工业互联网等关键领域持续深化替代,整体呈现出头部竞争加剧、中部稳步提升、特色赛道亮点频出的良好态势,行业发展韧...
墨天轮小墨
墨天轮小墨 发表了博客
本文为[墨天轮社区](https://www.modb.pro/?0316)整理的2026年2月国产数据库大事件和重要产品发布消息。 > 多家数据库相关厂商发布2025年业绩预告:达梦数据2025年净利5.17亿元,增长42.83%;电科金仓2025年营收预计超5亿元,创历史新高;海量数据2025年预计净亏损4000万元\~6000万元,亏损较去年明显收窄...... > 本月多个千万级大单落地:中电云计算以4477万元中标国家管网国产分布式数据库框架、中亦科技1858万元中标江苏农商...
SelectDB
SelectDB 数据库管理员 发表了博客
我们正处在一个数据与智能深度耦合的时代。当生成式 AI 重构着人机交互的边界,当大模型开始渗透每一个业务环节,一个根本性问题浮出水面:AI 究竟能跑多快、多准,这取决于它能多快、多准地获取实时数据。 这正是我们今天强调实时分析的底层逻辑。它不再是加分项,而是企业在数字经济中生存与成功的必需品。实时分析的价值并非孤立存在,它紧密围绕三大核心驱动力,重塑着企业的竞争壁垒: 即时决策与快速响应:这是最直观、也...
elasticstack
elasticstack 发表了博客
作者:来自 Elastic Tommaso Teofili 介绍Elasticsearch中 HNSW 的一种新的自适应提前终止策略。 从向量搜索到强大的REST API,Elasticsearch为开发者提供了最全面的搜索工具包。在Elasticsearch Labs仓库中,探索我们的示例笔记本,尝试一些新东西。你也可以开始免费试用,或者今天就在本地运行Elasticsearch。 弹性搜索使用层级可导航小世界(HNSW)算法在邻近图上进行向量搜索。HNSW已知能在k个最近邻(KNN)结果的质量与相关...
elasticstack
elasticstack 发表了博客
作者:来自 Elastic Jedr Blaszyk, Valerio Arvizzigno 及 Joe McElroy 学习如何使用Agent Builder,将自定义的Elastic Agent暴露给外部服务,比如Gemini Enterprise,并采用A2A协议。 Agent Builder 现已在通用卡上线。开始 Elastic Cloud 试用,并查看 Agent Builder 的文档。 Elastic Agent Builder 是一套功能,用于直接在 Elasticsearch 中创建数据驱动的 AI 代理。在本系列之前的文章中,我们演示了如何为定制代理配备执行...
得物技术
得物技术 发表了博客
# 一、概述 Spark UI是Apache Spark内置的Web监控界面,为开发者和运维人员提供对Spark应用程序执行过程的实时、可视化洞察。它以直观的方式展示作业(Jobs)、阶段(Stages)、任务(Tasks)、SQL执行计划、Executor资源使用、存储状态及运行时环境等关键信息。通过Spark UI,用户可以快速定位性能瓶颈(如数据倾斜、Shuffle 开销、调度延迟)、分析执行计划、监控资源利用率,并进行有效的调优与故障排查。无论是开发调试还是...
elasticstack
elasticstack 发表了博客
作者:来自 Elastic Jim Ferenczi, Benjamin Trent 及 Ignacio Vera Sequeiros 介绍在 Elasticsearch 中使用 Base64 编码字符串来加速向量摄取。 从向量搜索到强大的REST API,Elasticsearch为开发者提供了最全面的搜索工具包。在Elasticsearch Labs仓库中,探索我们的示例笔记本,尝试一些新东西。你也可以开始免费试用,或者今天就在本地运行Elasticsearch。 我们正在提升 Elasticsearch 中向量的摄取速度。现在,在Elastic C...
OceanBase数据库
OceanBase数据库 发表了博客
摘要: 混合检索通过融合向量检索、稀疏检索和全文检索三种模态,克服单一检索方式的语义或关键词盲区,提升召回率与精确度。OceanBase推出的AI原生搜索数据库seekdb支持单次查询同时调用三种模态,并提供内置加权融合机制及预设搜索模式。配合Agentic RAG动态选择策略,提升召回与精度。 1. 从 Corrective RAG 到多模态检索 Corrective RAG(CRAG),通过文档评分和托底机制来提升 RAG 系统的可靠性,主要解决检索结果的质量验...
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页