LLaMA 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
LLaMA 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
LLaMA 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 GPL
开发语言 Python 查看源码 »
操作系统 跨平台
软件类型 开源软件
开源组织 Facebook
地区 不详
投 递 者
适用人群 未知
收录时间 2023-03-31

软件简介

LLaMA 语言模型全称为 "Large Language Model Meta AI",是 Meta 的全新大型语言模型(LLM),这是一个模型系列,根据参数规模进行了划分(分为 70 亿、130 亿、330 亿和 650 亿参数不等)。

值得注意的是,其中 LaMA-13B(130 亿参数的模型)尽管模型参数相比 OpenAI 的 GPT-3(1750 亿参数) 要少了十几倍,但在性能上反而可以超过 GPT-3 模型。更小的模型也意味着开发者可以在 PC 甚至是智能手机等设备上本地运行类 ChatGPT 这样的 AI 助手,无需依赖数据中心这样的大规模设施。

目前 LLaMA 的一个精简版可在GitHub上找到,Meta 暂时还没有要公开发布完整模型和权重的计划。Meta 提供了一个登记页面,感兴趣的开发者可以申请登记,从而获得完整的代码和权重。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击引领话题📣 发布并加入讨论🔥
发表了资讯
2024/11/06 16:02

Meta 将允许其 AI 模型用于美国军事目的

Meta公司周一表示,将允许从事国家安全工作的美国政府机构和承包商,将该公司的人工智能模型Llama用于军事目的。此举无疑改变了该公司此前禁止将其AI技术用于此类领域的方针政策。 Meta公司表示,其将向联邦机构提供其名为Llama的人工智能模型,并正在与洛克希德·马丁公司(Lockheed Martin)等国防承包商,以及Palantir和Anduril等专注于国防的科技公司合作。 Llama模型是开源的,这意味着全球范围内的其他开发者、公司和政府可...

0
1
发表了资讯
2024/08/31 09:19

Llama AI 模型下载量已接近 3.5 亿次

Meta 透露,迄今为止其 Llama 生成式 AI 模型下载量已接近 3.5 亿次,相较去年同期增长了 10 倍,并迅速接近 3.5 亿次下载量;仅在上个月,下载量就超了过 2000 万次。 从 2024 年 5 月到 2024 年 7 月发布 Llama 3.1 的三个月时间内,其主要云服务供应商合作伙伴的 Llama 使用量(按 token 计算)也增长了一倍以上。1 月至 7 月,一些最大的云服务供应商的 Llama 每月使用量实现了 10 倍增长。 Llama 3.1 于 7 月份正式推出,将...

8
2
发表了资讯
2024/04/19 14:03

开源大模型 Llama3 发布,百度智能云支持其全系列训练推理

北京时间4月19日凌晨,Meta 正式发布多模态开源大模型Llama 3,包括8B 和 70B 参数的大模型,官方号称有史以来最强大的开源大模型。 4月19日中午,在Meta推出Llama 3后,百度智能云千帆大模型平台宣布在国内首家推出针对Llama3全系列版本的训练推理方案,便于开发者进行再训练,搭建专属大模型,现已开放邀约测试。 据称百度智能云千帆大模型平台中各种尺寸模型定制工具ModelBuilder已预置了最全面最丰富的大模型,支持国内外第...

3
1
发表了资讯
2024/04/15 14:31

Opera 支持本地 LLM,本地下载大模型即可自建服务

Opera 近日宣布,其将在开发者频道的 Opera One 浏览器中添加对 150 个本地 LLM 模型的实验性支持。支持模型包括: Meta 的 Llama Vicuna Google 的 Gemma Mistral AI 的 Mixtral 使用本地大型语言模型意味着用户的数据保存在本地设备上,无需将信息发送到服务器。Opera 正在 Opera One 的开发者频道中测试这套新的本地 LLM。本地 LLM 通常需要每个模型 2-10 GB 的本地存储空间,然后将使用本地 LLM 代替 Opera 的 AI Aria。...

2
4
发表了资讯
2024/04/09 11:42

Meta 下周将发布两款小型的 Llama 3 模型

根据 The Information 的报道,Meta 计划在下周推出两款小型的 Llama 3 模型,为即将在今年夏季发布的正式版 Llama 3 模型预热。 Meta 相信,这两款小模型的发布有助于激发人们对于Llama 3 模型的兴趣。Meta希望Llama 3能赶上OpenAI的GPT-4,后者能根据用户上传到聊天机器人上的图片回答问题。正式版的Llama 3 将支持多模态,它将能够理解并生成文本和图像。相比之下,下周发布的两款小型机将不具备多模态功能。 一般而言,较小...

0
1
发表了资讯
2024/02/29 16:37

Meta 计划 7 月发布 Llama 3

根据 The Information 的报道,Meta 计划在 7 月发布最新版本的大语言模型 —— Llama 3。 Meta 的一位员工透露,由于研究人员尚未开始对模型进行微调,因此公司尚未决定Llama 3是否是多模态的。Meta员工还说,Llama 3最高可能拥有超过1400亿个参数,相比之下,去年7月发布的Llama 2的参数最高为700亿。 参数数量越多,通常意味着模型能提供的结果越精确,不过较小的模型可能在处理速度上更有优势。Llama 3正在由Meta旗下的独立...

0
1
发表了资讯
2024/01/27 10:53

谷歌与 Hugging Face 合作,帮助开发人员训练 AI 模型

据 TheVerge 报道,Google Cloud 与AI 模型托管平台 Hugging Face 建立了新的合作伙伴关系,让开发人员无需支付 Google Cloud 订阅费用即可构建、训练和部署 AI 模型。 现在,使用 Hugging Face 平台的外部开发人员将能够“经济高效”地访问谷歌的张量处理单元 (TPU) 和GPU 超级计算机,其中包括数千台 Nvidia 的热门且出口受限的 H100。 Hugging Face 是流行的 AI 模型托管平台,存储了海量开源基础模型,例如 Meta 的 Llama ...

0
2
发表了资讯
2024/01/19 10:39

扎克伯格:Meta 正在全力开发开源 AGI(通用人工智能)

扎克伯格今天在 Instagram 发表视频称 Meta 正在开发开源通用人工智能 (AGI)。为了实现这一目标,公司正将其两大 AI 研究团队 FAIR 和 GenAI 进行更紧密的整合,以构建完整的通用人工智能,并尽可能地开源。 via https://www.instagram.com/reel/C2QARHJR1sZ/ 扎克伯格说道:“我们的长期愿景是开发通用人工智能,并以负责任的方式进行开源,让每个人都能广泛受益。” 他在视频中表示:“我们清楚地认识到,下一代服务的需求是构...

1
0
发表了资讯
2023/10/13 15:51

M2 Ultra 可并行运行 128 个 Llama2-7B 流

llama.cpp 是开发者 Georgi Gerganov 用纯 C/C++ 代码实现的 LLaMA 模型推理开源项目。所谓推理,即是「给输入-跑模型-得输出」的模型运行过程。 最近 Georgi Gerganov 用搭载苹果 M2 Ultra 处理器的设备运行了一系列测试,其中包括并行运行 128 个 Llama 2 7B 流。 具体结果如下: via https://github.com/ggerganov/llama.cpp/pull/3228 对于 M2 Ultra 的这番表现,有人给出了解释,M2 Ultra 或 M1 和 M2 系列 CPU 的速度之所...

2
3
发表了资讯
2023/09/21 14:59

红杉资本:生成式 AI 进入第二阶段

红杉资本发布一份报告,总结了这一年生成式AI突飞猛进的发展,探讨了生成式AI的发展趋势和市场表现。 一年前他们发布了一份预测,一年后红杉总结之前的预测,发现了他们预测正确和错误的部分: 预测错误的部分: 1.事情发展得很快。他们原以为需要近十年的时间才能实现实习生级别的代码生成、好莱坞质量的视频或不听起来像机器的人类语音。但现实是,技术发展的速度超出了他们的预期。 2.供应端的瓶颈。他们没有预见到用户需求会...

0
5
发表了资讯
2023/09/15 18:30

马斯克、比尔·盖茨、扎克伯格、黄仁勋欢聚一堂

马斯克 (Elon Musk)、比尔·盖茨 (Bill Gates)、扎克伯格 (Mark Zuckerberg) 等科技行业的高管和名人周三参加了一场闭门会议,与 60 多名美国参议员就 AI 的各种可能性和风险展开了辩论。 据介绍,参议员们正在考虑通过立法监管 AI 技术。 马斯克警告称,AI 有可能威胁到人类。盖茨则指出,AI 可能有助于解决全球饥饿问题。非营利组织 Center for Humane Technology 负责人Tristan Harris 警告开源 AI 系统会被滥用,如 Llama ...

9
0
发表了资讯
2023/09/11 15:45

Meta 正在构建新开源大模型,性能超越 Llama 2、比肩 GPT-4

根据 Siliconangle 的报道,Meta 正在寻求在生成式 AI 领域与 OpenAI 展开竞争,将发布新的开源大模型,其性能或将与GPT-4 不相上下。 报道称,这款新模型比 Llama 2 强大数倍,将提供文本、图像生成以及分析等功能。目前该模型正处于开发之中,最终功能尚不确定。 Meta 最终目标是加速开发下一代生成式人工智能模型,使其能够生成更多类似人类的表达。 长期以来,Meta 一直在采用开源方法公开其大模型产品,是业内众所周知的最...

0
3
发表了资讯
2023/09/11 15:06

俄罗斯科技巨头 Yandex 创建大模型 YandexGPT,称性能优于 ChatGPT

根据俄罗斯媒体 Russia Today 的报道,当地科技巨头 Yandex 在采访中表示,其创建的大模型 YandexGPT 相比 ChatGPT 具有更好的性能和更广阔的前景。 Yandex 的搜索和广告技术业务部总监 Dmitry Masyuk 表示,YandexGPT 在生成俄语内容时的表现已经能够“稳步超越”ChatGPT 3.5 版本,甚至在许多情况下提供了优于 ChatGPT 4.0 的回答。他还说道,YandexGPT 与其美国对手抗衡将“只是时间问题”。 而跟 Meta 公司开发的 Llama-2-...

2
4
发表了资讯
2023/07/31 11:33

不同语言使用 AI 大模型的成本不同:英语最便宜、中文是英文成本的 2 倍

推特用户 Dylan Patel(@dylan522p) 发布的一张图片显示,大语言模型使用不同语言的成本差异很大。 这名用户展示了一张牛津大学的研究显示成果。根据对GPT-4和其他常见大语言模型的研究,由于 OpenAI 等服务所采用的服务器成本衡量和计费的方式,英语输入和输出的费用要比其他语言低得多,其中简体中文的费用大约是英语的两倍,西班牙语是英语的 1.5 倍,而缅甸的掸语则是英语的 15 倍。 根据牛津大学的研究,让一个 LLM 处理一句...

8
3
发表了资讯
2023/07/26 10:36

OpenBuddy 发布基于 Llama 2 的新一代跨语言对话模型,开源可商用

OpenBuddy-LLaMA2-13B 是一个基于 Llama 2 的全新跨语言对话模型。 Llama 2 是 Meta 最新发布的模型基座,它的数据比前一代模型更为充分,且对月活7亿以下的商用予以支持。这意味着,更多的公司和团队可以使用这个模型进行商业开发,推动各类应用的普及和创新。 然而,和之前的版本相同,Llama 2 仍具备一定的局限性:LLaMA模型基座以英语训练数据为主,未考虑跨语言场景应用。模型本身在英语上表现较好,但在中文等非英语语系的...

0
7
发表了资讯
2023/07/19 10:57

Meta 放大招:发布开源大语言模型 Llama 2,可免费商用

Meta 和微软深度合作,正式推出下一代开源大语言模型 Llama 2,并宣布免费提供给研究和商业使用。 Llama 2 论文地址:Llama 2: Open Foundation and Fine-Tuned Chat Models 据介绍,相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度是 Llama 1 的 2 倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在 2 万亿的 token 上训练的,微调 Chat 模型是在 100 万人类标记数据上训练的。 Meta 称 Llama 2 在许...

13
10
发表了资讯
2023/07/13 19:26

Meta 将发布商用版 LLaMA

根据英国《金融时报》的报道,Meta 准备发布其人工智能模型 LLaMA 的商用版本,允许初创公司和企业在该技术的基础上构建定制软件。 此举将使 Meta 与微软支持的 OpenAI 和谷歌展开竞争。今年早些时候,Meta 面向研究人员和学者发布了自有大语言模型 LLaMA。其参数规模从 70 亿到 650 亿参数不等(包括 7B、13B、33B 和 65B 参数),该模型的一大优势是能运行在单张显卡上。 三位知情人士表示,新的商用版本将更广泛地提供给企业...

0
1
发表了资讯
2023/06/08 08:42

美国参议员就 LLaMA 模型泄露事件致函质询扎克伯格

美国参议院隐私、技术和法律小组委员会主席 Richard Blumenthal 和副主席 Josh Hawley 近日致信马克·扎克伯格 (Mark Zuckerberg),就 Meta 的大语言模型 LLaMA 泄露一事提出了质疑。 他们担忧该模型可能被滥用于垃圾邮件、欺诈、恶意软件、侵犯隐私、骚扰以及其他不法行为,从而造成伤害。因此在信中质询了 Meta 在发布 LLaMA 之前是如何评估的风险、采取了哪些措施来防止该模型被滥用,以及如何根据其不受限制的可用性更新政策...

0
2
发表了资讯
2023/04/12 08:28

被泄露的大语言模型 LLaMA,助长了一系列 ChatGPT 开源替代品

开源和基于 API 的分发之间的摩擦是生成式 AI 生态中极为迫切的矛盾。比如在从文本到图像领域,Stable Diffusion 的发布清楚地表明开源是基础模型的可行分发机制。不过在大型语言模型 (LLM) 领域却并非如此,该领域最大的突破来自 GPT-4、Claude 和 Cohere 等模型,这些模型只能通过 API 获取。并且这些模型的开源替代品没有表现出相同水平的性能,特别是在它们遵循人类指令的能力方面。 然而,一项意想不到的研究突破和泄露的模...

4
15
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
20 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部