精彩博客

暂无文章

美团搜索粗排优化的探索与实践

粗排是工业界搜广推系统的重要模块。美团搜索排序团队在优化粗排效果的探索和实践中,基于业务实际场景,从精排联动和效果性能联合优化两方面优化粗排,提升了粗排的效果。本文介绍了美团搜索...

08/12 16:23
5.7K
2
地址标准化服务AI深度学习模型推理优化实践

导读 深度学习已在面向自然语言处理等领域的实际业务场景中广泛落地,对它的推理性能优化成为了部署环节中重要的一环。推理性能的提升:一方面,可以充分发挥部署硬件的能力,降低用户响应时...

08/11 15:01
3.7K
2
大众点评搜索相关性技术探索与实践

搜索相关性用于衡量Query和Doc的相关程度,是搜索引擎的重要环节,本文主要讲述大众点评搜索团队在相关性计算上的技术探索和实践,通过多相似矩阵模型结构、多阶段训练等方法提升预训练模型在...

07/07 14:58
5.7K
1
美团综合业务推荐系统的质量模型及实践

推荐系统是效果导向的数据应用服务,在功能的“有”和“无”之间,有很长的效果“好”和“坏”的光谱。本文以用户请求的粒度建立质量模型,通过数据血缘关联了数据表、算法模型、系统服务和用...

06/17 10:05
6.7K
2
对话摘要技术在美团的探索(SIGIR)

随着互联网产生的文本数据越来越多,文本信息过载问题日益严重,对各类文本进行一个“降维”处理显得非常必要,而文本摘要就是其中一个重要的手段。本文首先介绍了经典的文本摘要方法,包括抽...

05/30 15:01
4.8K
0
业务数据治理体系化思考与实践

美团住宿数据治理团队从事数据治理工作多年,从最初的被动、单点治理,发展到后来的主动、专项治理,再发展到现在的体系化、自动化治理。一路走来,他们不断进行积累和沉淀,也在持续思考与实...

05/17 23:18
8.6K
2
LLVM之父Chris Lattner:编译器的黄金时代

作者|Chris Lattner 翻译|胡燕君、周亚坤 摩尔定律失效论的讨论与日俱增,2018年,图灵奖获得者 John Hennessey 和 David Patterson 在一次演讲上更是直言,几十年来的 RISC(精简指令集)...

04/21 08:16
1.7W
4
详细解读!推荐算法架构——召回

导语 | 召回模块面对几百上千万的推荐池物料规模,候选集十分庞大。由于后续有排序模块作为保障,故不需要十分准确,但必须保证不要遗漏和低延迟。目前主要通过多路召回来实现,一方面各路可...

04/13 15:58
9.5K
0
详解基于机器学习的恶意代码检测技术

摘要:由于机器学习算法可以挖掘输入特征之间更深层次的联系,更加充分地利用恶意代码的信息,因此基于机器学习的恶意代码检测往往表现出较高的准确率,并且一定程度上可以对未知的恶意代码实...

02/25 15:56
7.9K
3
机器学习和深度学习的区别

作者:ZOMI酱 文章来源:https://zhuanlan.zhihu.com/p/455602945 机器学习和深度学习算法流程 终于考上人工智能的研究僧啦,不知道机器学习和深度学习有啥区别,感觉一切都是深度学习 挖槽,...

02/18 16:15
1.5W
4
详解CNN实现中文文本分类过程

摘要:本文主要讲解CNN实现中文文本分类的过程,并与贝叶斯、决策树、逻辑回归、随机森林、KNN、SVM等分类算法进行对比。 本文分享自华为云社区《[Python人工智能] 二十一.Word2Vec+CNN中文文...

02/15 11:12
9K
3
一文彻底讲清楚Flink状态管理

关注公众号:大数据技术派,回复“资料”,领取1000G资料。 本文首发于我的个人博客:Flink状态管理 Flink系列文章 第01讲:Flink 的应用场景和架构模型 第02讲:Flink 入门程序 WordCount ...

2021/11/06 11:02
7.5K
3
刚哥谈架构(十三)大数据软件开源版图

开源一词最初是指开源软件(OSS)。开源软件是源代码可以任意获取的计算机软件,任何人都能查看、修改和分发他们认为合适的代码。 开源软件依托同行评审和社区生产,皆以分散、协作的方式开发...

2021/06/22 10:59
3.7W
2
揭秘在召唤师峡谷中移动路径选择逻辑?

摘要:在游戏中,只需要鼠标轻轻的一点,系统会立即寻找离角色最近的一条路线。这背后的行为逻辑又有什么奥秘呢? 作者:JohnserfSeed 在游戏中,当我们需要让角色移动到指定位置时,只需要鼠...

2020/11/09 17:38
2W
1
一次压缩引发堆外内存过高的教训

本文来自:HeapDump性能社区 PerfMa(笨马网络)官网 一、项目介绍 lz_rec_push_kafka_consume 该项目通过kafka与算法进行交互,通过push推荐平台(lz_rec_push_platform)预生成消息体。 二、问...

2020/09/17 14:42
1.4W
3
深入了解kafka系列-消费者

前言 与生产者对应的是消费者,应用程序可以通过KafkaConsumer来订阅主题,并从订阅的主题中拉取消息。不过在使用KafkaConsumer消费消息之前需要先了解消费者和消费组的概念,否则无法理解如...

2020/07/03 11:36
3.2W
19
Ignite在集群内存空间不足时的处理方式

如果内存空间即将用完,Ignite可以水平扩展以存储应用和服务生成的更多数据,这是Ignite的基础功能之一,因此增加资源是最简单的处理方法。但是实际上多数情况都无法立即扩展集群,通常都是为...

2020/06/27 15:54
1.9W
0
保护Kafka环境的最佳实践

对于许多企业来说,Kafka是整个企业数据系统的中枢,因此保护事件流平台对于数据安全至关重要,并且通常是管理层要求的。本文会讲述五个安全类别以及Kafka和Confluent平台的基本功能,这些功...

2020/06/12 11:06
2.4W
4
ElasticSearch 索引设置总结

在使用ES时,我们常见的就是需要生成一个template来定义索引的设置,分词器,Mapping.本文将基于项目经验来总结一些常用的配置。 Index设置 index.refresh_interval 配置一个刷新时间,将ind...

2020/05/24 18:55
4.2W
13
刚哥谈架构(六)-大数据的文件存储

上一次我们谈到了各种类型的数据库,今天我们来谈谈在大数据,尤其是Hadoop栈下的数据和文件的存储。 我们知道为了解决大数据的存储和处理问题,google最先设计了推出了Map/Reduce的算法,而...

2020/04/26 13:57
2.8W
2

没有更多内容

加载失败,请刷新页面

返回顶部
顶部