精彩博客

暂无文章

向量数据库真的能满足所有 AI Agent 的记忆需求吗?

编者按: 当 AI Agent 执行长期任务时,如何有效管理和存储它们的"记忆"?向量数据库真的能满足所有 AI Agent 的记忆需求吗? 我们今天为大家带来的文章中,作者指出当前主流的向量数据库虽然...

01/17 10:01
2.4K
0
RAG的技术困境:为何单纯依赖向量嵌入不可靠?

编者按: 向量嵌入技术真的能像宣传的那样精确地帮助检索和理解信息吗?检索增强生成(RAG)技术的可靠性真的像我们想象的那么高吗? 本文揭示了 RAG 技术中最为致命的技术短板 —— 向量嵌入...

01/10 14:14
3.8K
1
长上下文语言模型评估体系探析

编者按: 如今,AI模型的上下文窗口正以惊人的速度扩大——从2018年的区区512个token到现在的200万token。这种跨越式发展不仅仅是数字的变化,更代表着全新的应用机会:律师可以让AI快速分析...

2024/11/29 10:12
2.2K
0
从 Llama 1 到 3.1:Llama 模型架构演进详解

编者按: 面对 Llama 模型家族的持续更新,您是否想要了解它们之间的关键区别和实际性能表现?本文将探讨 Llama 系列模型的架构演变,梳理了 Llama 模型从 1.0 到 3.1 的完整演进历程,深入剖...

2024/11/25 10:30
4.1K
1
长上下文LLMs:RAG 的终结者还是最佳搭档?

编者按:随着大语言模型(LLMs)的上下文窗口不断扩大,您是否开始思考:我们还需要花费大量时间和资源来构建复杂的检索增强生成(RAG)系统吗? 本文深入探讨了长上下文 LLMs 与 RAG 系统的...

2024/10/16 10:44
4.5K
2
全域用户建模在美团首页推荐的探索与实践

本文详述了全域建模技术在美团首页推荐系统的发展和演进。美团首页推荐算法团队通过多阶段递进式探索验证,在召回与排序模块引入多展位、多应用渠道的多源用户交互数据,并在落地过程中解决了...

2024/10/12 09:49
3.6K
0
异常检测算法在可观测性平台的落地和实践|得物技术

一、背景 在稳定性保证中,重要的一个环节就是故障管理体系建设,故障管理体系的四大核心功能------故障发现、故障触达、故障定位和故障恢复,其中故障发现作为故障管理的第一步至关重要,包...

2024/08/29 17:47
4.3K
0
社区供稿 | 如何让大模型输出 10k+ 字长文?

随着大语言模型的发展,许多模型已经能够处理超过100k+ tokens的输入上下文。然而,这些模型在生成长文本时,普遍存在输出长度受限的问题。 在实际应用中,为了克服这个问题,人们普遍采用「...

2024/08/23 10:30
4.4K
1
利用多Lora节省大模型部署成本|得物技术

一、背景 近期,我们在大模型集群的部署过程中遇到了一些挑战。公司有多个业务场景,每个场景都基于自身的数据进行微调,训练出相应的大模型并上线。然而,这些场景的调用量并不高,同时大模...

2024/08/20 18:08
8.9K
2
信息流广告预估技术在美团外卖的实践

本文整理自美团技术沙龙第81期《美团在广告算法领域的探索及实践》(B站视频)。文章首先介绍了美团信息流广告业务以及预估技术的现状,然后重点分享了信息流广告预估在美团的具体实践,围绕决...

2024/08/16 10:14
4.2K
0
深度解读KubeEdge架构设计与边缘AI实践探索

摘要:解读业界首个云原生边缘计算框架KubeEdge的架构设计,如何实现边云协同AI,将AI能力无缝下沉至边缘,让AI赋能边侧各行各业,构建智能、高效、自治的边缘计算新时代,共同探索智能边缘的...

2024/08/06 11:22
4.6K
0
搜索广告召回技术在美团的实践

本文整理自美团技术沙龙第81期《美团在广告算法领域的探索及实践》(B站视频)。首先介绍了美团搜索广告的三个阶段:多策略关键词挖掘、分层召回体系、生成式召回;然后重点介绍了生成式关键...

2024/07/05 11:02
5.2K
0
视觉语言模型详解

视觉语言模型可以同时从图像和文本中学习,因此可用于视觉问答、图像描述等多种任务。本文,我们将带大家一览视觉语言模型领域: 作个概述、了解其工作原理、搞清楚如何找到真命天“模”、如何...

2024/05/06 11:42
7.8K
0
模型量化与量化在LLM中的应用 | 得物技术

一、模型推理优化 随着模型在各种场景中的落地实践,模型的推理加速早已成为AI工程化的重要内容。而近年基于Transformer架构的大模型继而成为主流,在各项任务中取得SoTA成绩,它们在训练和推...

2024/04/30 10:10
5.7K
1
百亿大规模图在广告场景的应用

本文通过搜索推荐项目进行外卖搜索广告弱供给填充,提高流量变现效率。我们提出外卖多场景异构大图、异构大图在线建模技术演进路线,解决外卖搜索推荐业务多渠道、即时化的挑战。相关成果发表...

2024/03/29 10:37
3.4K
1
大众点评内容搜索算法优化的探索与实践

本文整理自美团技术沙龙第80期《美团内容智能分发的算法实践》,分享内容主要包括三部分。第一部分介绍了大众点评内容搜索的场景特点以及面临的挑战;第二部分介绍了为应对这些困难和挑战,技...

2024/03/22 10:22
2.6K
0
揭示语言大模型的采样过程

作者 | Chip Huyen OneFlow编译 翻译|杨婷、宛子琳 机器学习模型具有概率性。对于同一个问题,机器可能会给出不同回答,以“世界上最棒的美食是什么?”这一问题为例。假如我们间隔一分钟,...

2024/03/15 08:35
994
2
万字带你了解ChatGLM

本文分享自华为云社区《【云驻共创】华为云之昇思MindSpore大模型专题(第二期)-第一课:ChatGLM》,作者: 愚公搬代码。 前言 1.昇思MindSpore 昇思MindSpore是华为公司推出的一款全场景A...

2024/03/13 11:38
2.8K
0
语言大模型的浮点运算分配

本文通过实证分析展示了实际LLM模型的FLOPS分配情况,并与理论分析进行对比。通过理论和实证相结合的方式,本文为理解和优化语言大模型的性能提供了有益见解。 作者Finbarr Timbers是一名机器...

2024/02/04 12:59
504
0
分布式因果推断在美团履约平台的探索与实践

美团履约平台技术部在因果推断领域持续的探索和实践中,自研了一系列分布式的工具。本文重点介绍了分布式因果树算法的实现,并系统地阐述如何设计实现一种分布式因果树算法,以及因果效应评估...

2024/01/26 11:07
4.5K
0

没有更多内容

加载失败,请刷新页面

暂无文章

返回顶部
顶部