Dolly 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
Dolly 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
Dolly 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 Apache-2.0
开发语言 Python 查看源码 »
操作系统 跨平台
软件类型 开源软件
开源组织
地区 不详
投 递 者 Alias_Travis
适用人群 未知
收录时间 2023-03-27

软件简介

Dolly 是一个低成本的 LLM,Dolly 采用 EleutherAI 现有的 60 亿参数的开源模型,并对其进行细微的修改,以激发指令跟随能力。

开始训练

  • dollyrepo 添加到 Databricks(在 Repos 下单击 Add Repo,输入 https://github.com/databrickslabs/dolly.git,然后单击创建仓库)。
  • 开始一个 12.2 LTS ML (includes Apache Spark 3.3.2, GPU, Scala 2.12)具有 8 个 A100 GPU 节点类型的单节点集群(例如 Standard_ND96asr_v4或者 p4d.24xlarge).
  • dolly仓库中打开 train_dollynotebook,附加到你的 GPU 集群,并运行所有单元。训练完成后,notebook 会将模型保存在 /dbfs/dolly_training.

在本地运行单元测试

pyenv local 3.8.13
python -m venv .venv
. .venv/bin/activate
pip install -r requirements_dev.txt
./run_pytest.sh
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击加入讨论🔥(2) 发布并加入讨论🔥
发表了资讯
2023/08/29 15:51

新一轮融资或将使 Databricks 估值超 430 亿美元

彭博社消息称,大数据软件巨头 Databricks 正在与全球投资管理巨头 T. Rowe Price 就新一轮融资进行谈判。如果本轮融资成功,Databricks 估值将达到 430 亿美元。不过谈判目前仍处于“初步”阶段,双方存在可能无法达成协议的风险。Databricks 拒绝对此事发表评论。 总部位于旧金山的 Databricks 是硅谷/湾区地区发展最快的公司之一,也是 IT 行业历史上发展最快的公司之一。其融资历程包括:2021 年 2 月完成了 10 亿美元的 G ...

2
0
发表了资讯
2023/04/13 08:54

Databrick 推出 Dolly 2.0:首个真正开放和商业可行的指令调优 LLM

Databricks 发布了 Dolly 2.0,这是该公司于两周前发布的一种训练成本不到 30 美元,类似 ChatGPT 的大型语言模型 (LLM) Dolly 的改进版本。公告称,Dolly 2.0 是第一个开源的指令跟随型语言模型,它在人类生成的指令数据集上进行了微调,可用于研究和商业用途。 根据介绍,Dolly 1.0 使用了斯坦福大学 Alpaca 团队使用 OpenAI API 创建的数据集进行训练;该数据集包含 ChatGPT 的输出,而其服务条款试图阻止任何人创建与 Open...

1
5
发表了资讯
2023/03/28 08:23

Databricks 开源 LLM,训练只需三个小时、30 美元

大数据分析公司 Databricks Inc 近日也加入了生成式 AI 领域的竞争之中,发布了一个名为 Dolly 的开源大型语言模型,将模型命名为 Dolly 是为了向第一只克隆羊多莉致敬。 像 ChatGPT 和 Bard 这样的生成式 AI,它们使用的数据通常来自于在成千上万不同网站,使用的数据量十分惊人,而且想要使用这些数据训练 AI 还需要数以千计的强大 GPU 在背后提供支持。 Databricks 希望通过开源 Dolly 及其训练数据,让任何人都能开发出一个...

11
24
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
2 评论
23 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部