+
DevOps研发效能
媒体矩阵
开源中国APP
授权协议 未知
开发语言 Python 查看源码 »
操作系统 跨平台
软件类型 开源软件
开源组织 蚂蚁金服
地区 国产
投 递 者
适用人群 未知
收录时间 2023-09-12

软件简介

CodeFuse-13B是基于GPT-NeoX框架训练的13B参数代码生成模型,能够处理4096个字符的代码序列。

该模型在1000B Token的代码、中文、英文数据数据集上进行预训练,覆盖超过40种编程语言。

为了进一步提升生成代码的效果和质量,该模型还在CodeFuse-Evol-instruction-66k数据集上进行了微调,使得该模型能够生成更加准确、高效、符合要求的代码。在HumanEval评测集上Pass@1达到37.1%(采用BeamSearch解码,其中BeamSize=3)。

要求

  • python 3.8及以上版本
  • pytorch 1.12及以上版本,推荐2.0及以上版本
  • transformers 4.24.0及以上版本
  • 建议使用CUDA 11.4及以上(GPU用户、flash-attention用户等需考虑此选
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击加入讨论🔥(2) 发布并加入讨论🔥
发表了资讯
2023/09/08 19:23

蚂蚁集团正式开源 CodeFuse 代码大模型

在今日的外滩大会分论坛上,蚂蚁集团正式开源代码大模型 CodeFuse。 据介绍,这是蚂蚁自研的代码生成专属大模型,可以根据开发者的输入提供智能建议和实时支持,帮助开发者自动生成代码、自动增加注释、自动生成测试用例、修复和优化代码等,以提升研发效率。 CodeFuse 基于蚂蚁基础大模型研发,现已上架 Hugging Face:https://huggingface.co/codefuse-ai。 本次开源的内容包括: MFT(多任务微调)框架,也称为MFTcoder; 两...

10
18
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
2 评论
5 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部