精彩博客

Milvus x KubeSphere: 如何一键部署火爆全球的开源向量数据库

✏️ 作者介绍:Mia Li,Zilliz 数据工程师 本文将介绍如何使用 KubeSphere 容器平台可视化部署 Milvus 向量数据库以及 Milvus 在云原生场景下的基本使用。下面,让我们先来简单了解一下 Milvus 和 KubeSphere 吧! Milvus 是什么? Milvus 是一款开源的向量数据库,支持针对 TB 级向量的增删改操作和近实时查询,具有高度灵活、稳定可靠以及高速查询等特点。Milvus 集成 FAISS、NMSLIB、Annoy 等常见的向量索引库,提供一整套简...

2021/06/18 10:36
788
0
Milvus 2.0 新版本一览:重新定义向量数据库

✏️ 作者:栾小凡, Zilliz 研发总监 2018 年 10 月,我们写下了向量数据库 Milvus 的第一行代码;在历经了 29 个月、19 个版本的迭代与全球 1000 家用户的实践验证后,终于在 2021 年 3月迎来了 Milvus 1.0 版本。Milvus 解决了对向量数据进行增删改查(CRUD)操作和数据持久化的问题,但随着新需求的出现,更多问题也逐渐浮现出来。本文旨在总结过去三年的经验,聊聊 Milvus 2.0 期待解决的问题,以及为什么 Milvus 2.0 是解...

2021/06/29 11:00
690
0
Zilliz 合伙人、系统架构师郭人通出席GOTC 2021专题论坛,谈向量数据库的开发挑战

AI 正在引领人类的下一次工业革命,成为支撑数字经济的基本工具组件。 7月9-10日,由开放原子开源基金会与 Linux 基金会联合开源中国社区共同发起的首届“GOTC 全球开源技术峰会”在上海世博中心举行,Zilliz 合伙人、系统架构师郭人通受邀出席“AI、大数据与数字经济专题论坛”,与 LF AI & Data 基金会执行董事 Ibrahim Haddad、中兴通讯 AI 研发总工韩炳涛、英特尔 OpenVINO 边缘人工智能软件首席布道师 Raymond Lo 等同场共...

2021/07/16 11:00
500
0
「新数据」太棘手,向量数据库来帮忙!《新程序员》刊登 Zilliz 长文解读

中国 KubeCon + CloudNativeCon + Open Source Summit 虚拟大会 12 月 9 日至 10 日 https://www.lfasiallc.com/kubecon-cloudnativecon-open-source-summit-china/ 诚意邀您成为赞助商 新数据库时代,数据库领域有哪些新技术、新应用?谁将改变数据库的游戏规则? 酷爱阅读科技杂志的 Z 宝,刚刚收到了刊登了 Zilliz 长篇署名文章的《新程序员》! 顺手一翻,Z 宝不禁感叹 CSDN 策划出品的这期杂志简直是众星云集:2020 年图灵...

2021/09/15 12:30
615
0
Scikit-learn:最近邻搜索sklearn.neighbors

http://blog.csdn.net/pipisorry/article/details/53156836 ball tree k-d tree也有问题[最近邻查找算法kd-tree ]。矩形并不是用到这里最好的方式。偏斜的数据集会造成我们想要保持树的平衡与保持区域的正方形特性的冲突。另外,矩形甚至是正方形并不是用在这里最完美的形状,由于它的角。如果图6中的圆再大一些,即黑点距离目标点点再远一些,圆就会与左上角的矩形相交,需要多检查一个区域的点,而且那个区域是当前区域双亲结...

2017/08/14 01:13
262
0
最近邻搜索

* [The Homepage of Nearest Neighbors and Similarity Search](http://simsearch.yury.name/tutorial.html) * [Approximate Nearest Neighbor search in Go](https://mathetake.github.io/blogs/gann.html)

2018/08/29 10:47
572
0
基于KD-Tree的最近邻搜索

目标:查询目标点附近的10个最近邻邻居。 load fisheriris x = meas(:,3:4); figure(100); g1=gscatter(x(:,1),x(:,2),species); %species分类中是有三个分类:setosa,versicolor,virginica legend('Location','best') newpoint = [5 1.45]; line(newpoint(1),newpoint(2),'marker','x','color','k',... 'markersize',10,'linewidth',2) Mdl = KDTreeSearcher(x) ; [n,d] = knnsearch(Mdl,newpoint,'...

2018/11/27 20:01
533
0
数组索引的kdtree建立及简明快速的k近邻搜索方法

1. kdtree概念 kd树(k-dimensional树的简称),是一种分割k维数据空间的数据结构,主要应用于多维空间关键数据的搜索,如范围搜索和最近邻搜索。 如下图所示,在既定的分割维度上,每一个根节点的值均大于其左子树,并小于其右子树。这样的二叉树,对于搜索某个点的最临近点或k近邻点,是十分高效快速的。 2. 建立kdtree 建立kdtree,主要有两步操作:选择合适的分割维度,选择中值节点作为分割节点。分割维度的选择遵循的原则...

2018/09/23 18:33
143
0
根据人脸关键点实现平面三角剖分和最近邻搜索 ( KNN, K=1 ), opencv3.4.2, C++

头文件: #pragma once #include <iostream> #include <vector> #include <map> #include <opencv2/core/core.hpp> #include <opencv2/highgui/highgui.hpp> #include <opencv2/imgproc/imgproc.hpp> #define UL unsigend long using namespace std; using namespace cv; int test_triangulation(); void show_a_image_mat(const Mat& img); cv::Mat VisualizePoints(const cv::Mat& src_img, const vector<cv::Point2f...

2018/08/17 15:30
720
0
吴涌波:非结构化数据及社交媒体分析

吴涌波:非结构化数据及社交媒体分析 2013 SAS中国用户大会暨商业分析领袖峰会于6月20日在北京召开,吴涌波发表了主题为 “非结构化数据及社交媒体分析”的精彩演讲。通过该文档,您可以了解到非结构化数据自动分类和关键信息提取、社交媒体分析、文本分析应用案例等内容。 对其内容详细阅读

2013/07/18 07:53
303
0
公检法行业大数据 之非结构化数据篇

  近年来,随着公检法行业新业务不断上线,公安高清卡口、社采系统和人口库的升级,检察院统一业务软件、高清审讯系统改造,法院的数字法庭、电子卷宗等建设,使得数据每年都是以50-80%的速度递增。 大多数公检法行业信息中心主任所要管理的级数据已经从TB级发展到PB级了。特别在公安行业,很多总队的信息中心数据量已经接近10PB。对于如此大数据量的管理,传统的管理模式让IT管理员感到有些力不从心了。 这些数据中的结构化数...

2014/09/29 15:18
152
0
公检法行业大数据 之非结构化数据篇

  近年来,随着公检法行业新业务不断上线,公安高清卡口、社采系统和人口库的升级,检察院统一业务软件、高清审讯系统改造,法院的数字法庭、电子卷宗等建设,使得数据每年都是以50-80%的速度递增。 大多数公检法行业信息中心主任所要管理的级数据已经从TB级发展到PB级了。特别在公安行业,很多总队的信息中心数据量已经接近10PB。对于如此大数据量的管理,传统的管理模式让IT管理员感到有些力不从心了。 这些数据中的结构化数...

2014/09/29 15:24
203
0
结构化、半结构化、非结构化数据

结构化数据:具有既定格式的实体化数据,如常用的XML文档 半结构化数据:格式松散,即使有格式也常被忽略,结构只能作为数据结构的一般性指导,如电子表格 非结构化数据:没结构数据,如图像、纯文本.

2017/10/30 09:57
444
0
非结构化数据更需中台,从爱数AnyShare 7看企业内容管理未来变革

人们常言,二十一世纪最有价值的商品就是数据。在数字化的大浪潮下,一切都离不开数据,数据成为各个行业最重要的生产要素。与石油需要提炼之后才能应用到各行各业一样,数据也必须通过加工、整理之后才能发挥价值。 这个“加工”过程其实就是从数据转化为内容、信息再到知识的过程,一旦数据变成了知识,其价值变现方能最大化。如今,在海量数据增长成为常态的情况下,千行百业面临的共同挑战就是如何充分利用数据这一项生产要...

2020/07/08 17:21
117
0
福利 |《非结构化数据分析》书评:探索非结构化数据的魅力

文末有数据派独家福利哦 在过去的几年里,围绕大数据、物联网和人工智能等信息的宣传铺天盖地。这些新闻源源不断地向我们展示了技术和分析工作如何改变我们的生活和商业模式。将大数据和物联网转化为有实际价值的信息是增强分析时代的下一个创新前沿。 在全球互联的时代,数据无时无刻不在产生。在过去的一年半到两年中,地球上产生的新的数据量相当于人类历史上产生的数据总和,其中很大一部分数据都是以文本、语音、视频和图片...

2020/09/20 17:42
24
0
企业该如何管理非结构化数据?

随着大数据、人工智能等技术的发展,数字化进程不断加速,海量大数据汹涌而来,我们步入了数据智能应用的时代。办公文档、邮件、图片、研究报告、法律法规、各类报表、音频/视频信息这些非结构化数据成为企业数据主要形态。 据IDC预测,到2025年,全球数据总量达到175zb,而非结构化数据将会占据数据总量的80%-90%,这意味着企业要花费大量的成本长期存放这些数据。一旦数据没能有效流转,复用率也是极低的,最终变成一堆丢也丢...

2020/12/03 11:54
273
0

没有更多内容

加载失败,请刷新页面

没有更多内容

如何做架构设计? | 京东云技术团队

也许您对软件设计存在一些疑惑,或者缺乏明确思路,那么本文将非常适合您。 1、设计很重要 我们可以看一下周边的事物,那些好的东西,他们并不会天然存在,都是被设计出来的,因此设计就是创...

前天 10:02
8K
1
得物App万米高空WiFi拦截记

0.前情摘要 在一次飞行途中,我司客户遭遇到了得物App在飞机上的WiFi网络访问异常的问题。这让我们意识到在特定场景下,用户可能面临无法使用得物App的困扰。经过SRE团队与无线团队、网络团队...

06/01 19:17
1.5W
2
编码器-解码器 | 基于 Transformers 的编码器-解码器模型

基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史,更多背景知识,建议读者阅读由 Sebastion Rude...

06/01 18:00
6.2K
1
如何基于G6进行双树流转绘制? | 京东云技术团队

1. 背景 业务背景:CRM系统随着各业务条线对线索精细化分配的诉求逐渐增加,各个条线的流向规则会越来越复杂,各个条线甚至整个CRM的线索流转规则急需一种树形的可视化的图来表达。 技术背景...

06/01 09:54
5.2K
1
redis.conf 7.0 配置和原理全解,生产王者必备

5.5 redis.conf 配置详解 我是 Redis, 当程序员用指令 ./redis-server /path/to/redis.conf 把我启动的时候,第一个参数必须是redis.conf 文件的路径。 这个文件很重要,就好像是你们的 DN...

05/30 16:13
1.4W
3
大语言模型技术原理

在今天这个时代,人们的工作和生活已经离不开数据访问,而几乎所有平台背后的数据存储和查询都离不开数据库。SQL作为一种数据库的查询和处理语言历史悠久,最早由IBM于上世纪70年代初研究关系...

05/30 11:25
9.6K
4
QUIC 协议:特性、应用场景及其对物联网/车联网的影响

什么是 QUIC 协议 QUIC(Quick UDP Internet Connections)是由谷歌公司开发的一种基于用户数据报协议(UDP)的传输层协议,旨在提高网络连接的速度和可靠性,以取代当前互联网基础设施中广泛...

05/27 22:14
9K
2
Nodejs 应用编译构建提速建议 | 京东云技术团队

编译构建的整体过程 拉取编译镜像 拉取缓存镜像 拉取项目源码 挂载缓存目录 执行编译命令(用户自定义) 持久化缓存 上传编译镜像 为什么在本地构建就快, 但编译机上很慢 在编辑机上每次的构建...

05/26 09:36
9.9K
0
Flutter热更新技术探索 | 京东云技术团队

一,需求背景: APP发布到市场后,难免会遇到严重的BUG阻碍用户使用,因此有在不发布新版本APP的情况下使用热更新技术立即修复BUG需求。原生APP(例如:Android & IOS)的热更新需求已经比较...

05/26 09:30
1W
1
得物前端巡检平台的建设和应用

1.背景 我们所在的效能团队,对这个需求最原始的来源是在一次“小项目”的评审中,增长的业务同学提出来的,目的在于保障前端页面稳定性的同时减少大量测试人力的回归成本。页面稳定性提升,...

05/25 18:39
1.2W
1
Iframe在Vue中的状态保持技术 | 京东云技术团队

引言 Iframe是一个历史悠久的HTML元素,根据MDN WEB DOCS官方介绍,Iframe定义为HTML内联框架元素,表示嵌套的Browsing Context,它能够将另一个HTML页面嵌入到当前页面中。Iframe可以廉价实...

05/25 10:22
7.8K
0
Kafka实时数据即席查询应用与实践

作者:vivo 互联网搜索团队- Deng Jie Kafka中的实时数据是以Topic的概念进行分类存储,而Topic的数据是有一定时效性的,比如保存24小时、36小时、48小时等。而在定位一些实时数据的Case时,...

05/24 20:59
1.2W
0
【实践篇】领域驱动设计:DDD工程参考架构 | 京东云技术团队

背景 为什么要制定参考工程架构 不同团队落地DDD所采取的应用架构风格可能不同,并没有统一的、标准的DDD工程架构。有些团队可能遵循经典的DDD四层架构,或改进的DDD四层架构,有些团队可能综...

05/22 10:10
1.5W
1
得物社区亿级ES数据搜索性能调优实践

1.背景 2020年以来内容标注结果搜索就是社区中后台业务的核心高频使用场景之一,为了支撑复杂的后台搜索,我们将社区内容的关键信息额外存了一份到Elasticsearch中作为二级索引使用。随着标注...

05/19 18:48
1.8W
1
Pose泰裤辣! 一键提取姿态生成新图像

摘要:从图像提取人体姿态,用姿态信息控制生成具有相同姿态的新图像。 本文分享自华为云社区《Pose泰裤辣! 一键提取姿态生成新图像》,作者: Emma_Liu 。 人体姿态骨架生成图像 ControlNet...

05/19 15:39
1.2W
1
应用现代化中的弹性伸缩

作者:马伟,青云科技容器顾问,云原生爱好者,目前专注于云原生技术,云原生领域技术栈涉及 Kubernetes、KubeSphere、KubeKey 等。 2019 年,我在给很多企业部署虚拟化,介绍虚拟网络和虚拟...

05/18 14:19
6.8K
0
降低 Spark 计算成本 50.18 %,使用 Kyligence 湖仓引擎构建云原生大数据底座,为计算提速 2x

2023 中国开源未来发展峰会于 5 月 13 日成功举办。在大会开源原生商业分论坛,Kyligence 解决方案架构高级总监张小龙发表《云原生大数据底座演进 》主题演讲,向与会嘉宾介绍了他对开源发展...

05/18 10:55
1.2W
1
深入浅出 OkHttp 源码解析及应用实践

作者:vivo 互联网服务器团队- Tie Qinrui OkHttp 在 Java 和 Android 世界中被广泛使用,深入学习源代码有助于掌握软件特性和提高编程水平。 本文首先从源代码入手简要分析了一个请求发起过...

05/17 20:59
1.3W
2
故障分析 | 一条本该记录到慢日志的 SQL 是如何被漏掉的

作者:吴斯亮 某金融行业 DBA,数据库技术爱好者。 本文来源:原创投稿 * 爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。 背景 生产环境中 select count(*...

05/16 16:30
1.2W
2
云原生背景下如何配置 JVM 内存

背景 前段时间业务研发反馈说是他的应用内存使用率很高,导致频繁的重启,让我排查下是怎么回事; 在这之前我也没怎么在意过这个问题,正好这次排查分析的过程做一个记录。 首先我查看了监控...

05/15 10:13
1W
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部