首页
开源软件
问答
博客
翻译
资讯
Gitee
众包
活动
专区
源创会
高手问答
开源访谈
周刊
公司开源导航页
登录
注册
Gitee
资讯
专区
问答
活动
软件库
Tool
博客
众包
登录
注册
使用Triton部署chatglm2-6b模型 | 京东云技术团队
一、技术介绍 NVIDIA Triton Inference Server是一个针对CPU和GPU进行优化的云端和推理的解决方案。 支持的模型类型包括TensorRT、TensorFlow、PyTorch(meta-llama/Llama-2-7b)、Python(chatglm)、ONNX Runtime和......
作者:
京东云开发者
使用Triton部署chatglm2-6b模型 | 京东云技术团队
分享
复制链接
README badge(
)
社交分享
微信
QQ
微博
暂无评论
回复 @
{{ emoji.type }}
{{emojiItem.symbol}}
推荐博客
案例解析关于ArkUI框架中ForEach的潜在陷阱与性能优化
华为云开发者联盟
·
前天 17:22
0 评论
支持 Upsert、Kafka Connector、集成 Airbyte,Milvus 助力高效数据流处理
Zilliz
·
前天 16:41
1 评论
基于AI的架构优化:创新数据集构造法提升Feature envy坏味道检测与重构准确率
华为云开发者联盟
·
前天 15:55
0 评论
Go语言实现GoF设计模式:备忘录模式的实践探索
华为云开发者联盟
·
前天 15:21
0 评论
Istio 网格的出口定义者:深入了解 Egress Gateway
华为云开发者联盟
·
前天 14:59
0 评论
七年 4 个阶段:滴滴可观测架构演进与实践
TakinTalks稳定性社区
·
前天 14:49
2 评论
AREX 在开发自测场景中应用实践
AREX中文社区
·
前天 14:14
0 评论
无到无限,回顾 AWS 关系型数据库 15 年的发展历程
Bytebase
·
前天 13:39
0 评论
解锁机器学习-梯度下降:从技术到实战的全面指南
techlead_krischang
·
前天 13:39
0 评论
利用 OpenNJet HA Copilot 实现高可用部署 (二)
OpenNJet
·
前天 13:33
0 评论
删除一条评论
评论删除后,数据将无法恢复
取消
确定
©OSCHINA(OSChina.NET)
工信部
开源软件推进联盟
指定官方社区
社区规范
深圳市奥思网络科技有限公司版权所有
粤ICP备12009483号
顶部
暂无评论