精彩博客

智能会话机器人:SaaS 平台的设计与思考

1. 前言 随着自然语言处理和智能语音识别技术的发展,智能会话机器人开始部分替代人工客服。 网上关于NLP算法的文章有很多,但关于 Chatbot 架构的却很少,关于 Chatbot SaaS 平台架构的则更...

昨天 21:17
601
0
数栈人:从青铜到星耀,10年大数据人的奋战晋级之路

今天,大家就请跟着数栈君一起,和申杭聊聊他从青铜到星耀的大数据之路。 数栈君:申杭,你是07年从华中科技大学软件工程专业毕业的,能说说你当时为什么选择这个专业吗? 申杭:当时会计、师...

昨天 18:16
567
0
一文抽丝剥茧带你掌握复杂Gremlin查询的调试方法

摘要:Gremlin是图数据库查询使用最普遍的基础查询语言。Gremlin的图灵完备性,使其能够编写非常复杂的查询语句。对于复杂的问题,我们该如何编写一个复杂的查询?以及我们该如何理解已有的复...

前天 10:50
512
0
用户行为分析所需的SDK埋点方案

1 综述 本方案包括埋点技术实现方案和埋点业务设计方案两部分。旨在通过本方案完成数据采集技术构建和业务设计,在App、小程序的系统供应商配合下完成用户行为数据采集埋点,并基于埋点的数据...

05/04 13:24
2.7K
0
Faiss源码剖析:类结构分析

摘要:在下文中,我将尝试通过Faiss源码中各种类结构的设计来梳理Faiss中的各种概念以及它们之间的关系。 本文分享自华为云社区《Faiss源码剖析(一):类结构分析》,原文作者:HW007。 Fais...

04/30 11:02
2.5K
2
数栈产品分享:简析数据中台如何通过DataAPI实现数据共享

数栈是云原生—站式数据中台PaaS,我们在github和gitee上有一个有趣的开源项目:FlinkX,FlinkX是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,也可以采集实时变化的数据,...

04/29 17:56
505
0
如何通过openLooKeng更高效访问HBase?

1. HBase Connector介绍 数据虚拟化引擎openLooKeng中的HBase Connector支持访问Apache HBase集群并进行查询和创建表的操作。用户可以在openLooKeng中创建表,并映射到HBase Cluster中已有的...

04/28 20:12
3K
1
实时计算框架:Spark集群搭建与入门案例

一、Spark概述 1、Spark简介 Spark是专为大规模数据处理而设计的,基于内存快速通用,可扩展的集群计算引擎,实现了高效的DAG执行引擎,可以通过基于内存来高效处理数据流,运算速度相比于Map...

04/26 08:31
2.5K
0
数栈运维案例:云上RAC部署、运维及实践案例

数据库产品越来越多,各家云厂商也都推出基于开源MySQL、Postgre等的关系型数据库产品,多副本、高可用、读写分离、分库分表等功能更是集成在各类产品中,降低了机房建设和运维成本,助力更多...

04/25 11:49
141
0
260万奖金池!目标检测新赛事!百度发起"智能交通检测"大赛!

推荐理由:本次比赛总奖金池260万+,除了为选手提供 20000+张百度地图业务真实图像数据、参赛基线方案Baseline、专家答疑等资源支持外,还提供了深度学习计算环境,可在一站式AI开发平台AI ...

04/21 15:38
1.3W
0
AUC/ROC:面试中80%都会问的知识点

摘要:ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到) 本文分享自华为云社区《技术干货 | 解决面试中80%问题,基于MindSpore实现AUC/ROC》,原文作者:李...

04/21 11:41
3K
1
6种常见的地标识别算法整理和总结

摘要:地标识别,基于深度学习及大规模图像训练,支持上千种物体识别及场景识别,广泛应用于拍照识图、幼教科普、图片分类等场景。本文将为大家带来6种关于地标识的算法整理和总结。 本文分享...

04/19 10:05
2.9K
0
OLAP引擎:基于Presto组件进行跨数据源分析

一、Presto概述 1、Presto简介 Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节,Presto虽然具备解析SQL的能力,但它并不属于标准的数据库范畴。 Presto...

04/18 12:52
2.8K
0
基于深度神经网络的噪声标签学习

摘要:介绍带噪学习领域前沿方法,解决不完美场景下的神经网络优化策略,旨在提升模型性能。 本文分享自华为云社区《Learning from Noisy Labels with Deep Neural Networks》,原文作者:猜...

04/14 11:27
2.7K
0
生成对抗网络7日打卡营来了!GAN就对了!

PaddlePaddle高T组团带学「生成对抗网络」,理论解析+代码实践,带你逐步掌握GAN核心思想、常用模型脉络及应用代码;真正理解 GAN、会用 GAN、善用 GAN 。 下载安装命令 ## CPU版本安装命令 ...

04/12 23:38
7.7K
0
文字识别:关键信息提取的3种探索方法

摘要:如何通过深度学习模型来从文档图片中自动化地提取出关键信息成为一项亟待解决的挑战,受到学术界和工业界的广泛关注。 本文分享自华为云社区《技术综述十:文字识别之关键信息提取》,...

04/09 10:25
5.6K
0
OLAP引擎:基于Druid组件进行数据统计分析

一、Druid概述 1、Druid简介 Druid是一款基于分布式架构的OLAP引擎,支持数据写入、低延时、高性能的数据分析,具有优秀的数据聚合能力与实时查询能力。在大数据分析、实时计算、监控等领域都...

04/05 11:07
4.2K
0
清明节特辑 |记忆存储、声音还原、性格模仿……AI可以让人类永生吗?

摘要:如果能用AI “复活”逝去的亲人 你愿意吗? 清明节,很少有人会去特地想这样一个问题:我们为什么要给过世的人修墓,然后每年固定的时间去扫墓?当农耕文化的色彩褪去,清明节的祭祀活...

04/02 10:23
2.8K
0
如何从 0 到 1 构建埋点体系

本文根据资深数据产品经理陈家崑《从 0 到 1 埋点体系指南》的分享内容整理。主要内容如下: · 首次开荒指南 · 埋点体系迭代指南 · 体系落地指南 · 数据埋点实操案例 一、开荒 所谓开荒,...

04/01 18:16
6.2K
0
ICLR 2021 | 美团AutoML论文:鲁棒的神经网络架构搜索 DARTS-

背景 美团日益增长的用户侧和商家侧业务对人工智能(AI)技术有着非常广泛和强烈的诉求。从用户角度出发,美团 AI 在外卖之外,有到店消费、酒店旅游等200多个生活服务场景,均需要 AI 来提升...

03/26 14:49
1K
0

没有更多内容

加载失败,请刷新页面

揭秘在召唤师峡谷中移动路径选择逻辑?

摘要:在游戏中,只需要鼠标轻轻的一点,系统会立即寻找离角色最近的一条路线。这背后的行为逻辑又有什么奥秘呢? 作者:JohnserfSeed 在游戏中,当我们需要让角色移动到指定位置时,只需要鼠...

2020/11/09 17:38
1.8W
1
深入了解kafka系列-消费者

前言 与生产者对应的是消费者,应用程序可以通过KafkaConsumer来订阅主题,并从订阅的主题中拉取消息。不过在使用KafkaConsumer消费消息之前需要先了解消费者和消费组的概念,否则无法理解如...

2020/07/03 11:36
3.1W
19
Ignite在集群内存空间不足时的处理方式

如果内存空间即将用完,Ignite可以水平扩展以存储应用和服务生成的更多数据,这是Ignite的基础功能之一,因此增加资源是最简单的处理方法。但是实际上多数情况都无法立即扩展集群,通常都是为...

2020/06/27 15:54
1.3W
0
保护Kafka环境的最佳实践

对于许多企业来说,Kafka是整个企业数据系统的中枢,因此保护事件流平台对于数据安全至关重要,并且通常是管理层要求的。本文会讲述五个安全类别以及Kafka和Confluent平台的基本功能,这些功...

2020/06/12 11:06
2.2W
3
ElasticSearch 索引设置总结

在使用ES时,我们常见的就是需要生成一个template来定义索引的设置,分词器,Mapping.本文将基于项目经验来总结一些常用的配置。 Index设置 index.refresh_interval 配置一个刷新时间,将ind...

2020/05/24 18:55
3.8W
13
刚哥谈架构(六)-大数据的文件存储

上一次我们谈到了各种类型的数据库,今天我们来谈谈在大数据,尤其是Hadoop栈下的数据和文件的存储。 我们知道为了解决大数据的存储和处理问题,google最先设计了推出了Map/Reduce的算法,而...

2020/04/26 13:57
2.6W
2
机器学习在马蜂窝酒店聚合中的应用初探

马蜂窝技术原创内容,更多干货请关注公众号:mfwtech 出门旅行,订酒店是必不可少的一个环节。住得干净、舒心对于每个出门在外的人来说都非常重要。 在线预订酒店让这件事更加方便。当用户在...

2020/01/17 15:31
1.5W
1
揭秘“撩”大数据的正确姿势:生动示例解说大数据“三驾马车”

我是我:“缘起于美丽,相识于邂逅,厮守到白头!” 众听众:“呃,难道今天是要分享如何作诗?!” 我是我:“大家不要误会,今天主要的分享不是如何作诗,而是《揭秘:‘撩’大数据的正确姿...

2019/12/31 10:42
8.8K
3
KTV歌曲推荐-深入浅出协同过滤

前言 推荐算法有很多,最基础的就是协同过滤,前段时间对KTV数据比较感兴趣,大家去唱歌也只是唱熟悉的歌,那是不是有办法给大家一些建议拓展一下唱歌的宽度呢。KTV推荐可能要考虑很多因素,...

2019/11/14 12:05
5.8K
6
Scala implicit 隐式转换安全驾驶指南

这篇短文将结合实例对隐式转换的各种场景进行解释和总结,希望看完的人能够安全驶过隐式转换这个大坑。 隐式转换函数 隐式转换函数有两种作用场景。 1 转换为期望类型:就是指一旦编译器看到...

2019/09/29 23:03
2K
2
云端数据仓库的模式选型与建设

数据,对一个企业的重要性不言而喻,如何利用好企业内部数据,发挥数据的更大价值,对于企业管理者而言尤为重要。作为最传统的数据应用之一,数据仓库在企业内部扮演着重要的角色,构建并正确...

2019/08/29 10:24
5.1K
8
Flink 源码解析 —— 深度解析 Flink 是如何管理好内存的?

前言 如今,许多用于分析大型数据集的开源系统都是用 Java 或者是基于 JVM 的编程语言实现的。最着名的例子是 Apache Hadoop,还有较新的框架,如 Apache Spark、Apache Drill、Apache Flin...

2019/08/11 22:14
1.1W
5
关系型数据库全表扫描分片详解

导读:数据总线(DBus)专注于数据的实时采集与实时分发,可以对IT系统在业务流程中产生的数据进行汇聚,经过转换处理后成为统一JSON的数据格式(UMS),提供给不同数据使用方订阅和消费,充...

2019/08/02 10:28
3.3K
1
谈谈机器学习模型的可解释性

随着AI和机器学习的发展,越来越多的决策会交给自动化的机器学习算法来做。但是当我们把一些非常重要的决定交给机器的时候,我们真的放心么?当波音飞机忽略驾驶员的指令,决定义无反顾的冲向...

2019/07/02 03:01
6.3K
9
再谈使用开源软件搭建数据分析平台

三年前,我写了这篇博客使用开源软件快速搭建数据分析平台, 当时收到了许多的反馈,有50个点赞和300+的收藏。到现在我还能收到一些关于dataplay2的问题。在过去的三年,开源社区和新技术的发...

2019/04/20 00:54
2.9W
10
现代IM系统中的消息系统架构 - 架构篇

前言 IM全称是『Instant Messaging』,中文名是即时通讯。在这个高度信息化的移动互联网时代,生活中IM类产品已经成为必备品,比较有名的如钉钉、微信、QQ等以IM为核心功能的产品。当然目前微...

2019/04/16 14:34
4.7K
8
Kafka连接器深度解读之JDBC源连接器

在现实业务中,Kafka经常会遇到的一个集成场景就是,从数据库获取数据,因为关系数据库是一个非常丰富的事件源。数据库中的现有数据以及对该数据的任何更改都可以流式传输到Kafka主题中,在这...

2019/03/12 14:02
1W
5
自动机器学习简述(AutoML)

为什么需要自动机器学习 对于机器学习的新用户而言,使用机器学习算法的一个主要的障碍就是算法的性能受许多的设计决策影响。随着深度学习的流行,工程师需要选择相应的神经网络架构,训练过...

2019/02/19 02:46
8.3W
5
缓存伪共享问题以及解决方案缓存行填充

缓存伪共享 共享对象存在同一个缓存中,由于MESI协议,一个对象中一些不需要改变的属性因为其他改变的属性,导致整个对象的缓存进入到M被修改状态。 MESI缓存一致性协议:https://blog.csdn...

2019/01/29 16:52
4.8K
2
百亿次的锤炼 - 地狱模式的分布式系统测试

本文以近期开源的Dragonboat多组Raft库为例,介绍Dragonboat这样一个典型分布式系统是如何做测试的。Dragonboat以Go实现,能在普通硬件上提供每秒1000万次以上的强一致读写,它是目前github....

2019/01/18 18:50
4.4K
6

没有更多内容

加载失败,请刷新页面

返回顶部
顶部