Artificial Intelligence 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。AI 研究通常需要大量数据支撑。

加载中
置顶
发表了博客
03/15 19:09

华为云张平安:矢志打造中国 AI 算力的沃土

今天,AI 重塑一切,“人工智能+”首次被写入政府报告,AI 产业机遇加速涌现,AI 创新大有可为。 “所有的行业必须拥抱 AI,我们必须要有澎湃的 AI 算力,华为云矢志要将技术扎到根,做 AI 算力的沃土,推动行业智能应用创新,携手伙伴构建核心技术生态,共同加速千行万业的智能化。” 3月15日,在2024华为云&华为终端云创新峰会上,华为公司常务董事、华为云 CEO 张平安表示。 矢志打造中国AI算力的沃土 对中国来说,算力的紧缺... 展开更多

收藏 0
0
置顶
发表了博客
03/13 15:01

阿里通义灵码全面公测,来看看它的水平怎么样?

人工智能作为新一轮的技术革命,已经开始渗透到软件开发领域,改变着传统的编码模式。如何利用 AI 技术提升软件开发的效率和质量,成为各家研究的重点。去年10月阿里云正式发布的通义灵码-智能编码助手,如今已开启了全面公测,不妨就来看看它的编码水平怎么样? 通义灵码目前是免费的,它基于通义大模型,可以理解为国内的 Copilot 平替。它不仅支持14种主流编程语言,如 Java、Python、Go 等,还能够与主流的集成开发环境(I... 展开更多

收藏 2
0
置顶
发表了博客
03/15 16:11

AI加速引擎 PAI-TorchAcc:整体介绍与性能概述

1. 简介 PAI-TorchAcc(Torch Accelerator)是阿里云人工智能平台PAI开发的Pytorch上的大模型训练加速框架。 PAI-TorchAcc提供了一套基于Pytorch的简洁、易用的接口,无需进行模型转换就可以无缝地接入HuggingFace上的模型,并用多种分布式策略进行训练加速。 PAI-TorchAcc借助社区PyTorch/XLA,通过 LazyTensor 技术将Pytorch代码转换为静态执行图,基于计算图,结合阿里云上的计算资源情况,进行了大量的GPU硬件上模型训练的针对... 展开更多

收藏 0
0
置顶
发表了博客
昨天 13:21

通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base和Chat等多个版本的开源模型,为全球的开发者社区提供了空前的便捷性。阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen1.5模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松... 展开更多

收藏 0
0
置顶
架构师
发表了博客
昨天 16:27

【故障排查】10分钟解决Quartz重复调度的疑难杂症

我司使用Apache DolphinScheduler作为调度框架很久了,感兴趣的小伙伴可以看看这些干货文章: 因为之前监控到会出现重复的调度的问题,所以此文记录排查重复调度问题的全过程,希望对社区其他的小伙伴能够起到抛砖引玉的作用! > 注:本文使用的DolphinScheduler 3.1.1的版本。 > > 数据库使用的Tidb数据库,版本6.5.0,数据库的隔离级别是默认的RR(Read Committed)。 > > Quartz版本为2.3.2,存储模式为JDBC。使用的CronTri... 展开更多

收藏 0
0
置顶
发表了博客
03/01 08:49

OpenAI的组织形态、决策机制与产品构建

与ChatGPT面世后的疑惑类似,视频生成大模型Sora发布之后,人们依然在问同样的问题:为什么OpenAI能做出这样的创新成果? 要知道,世界上不乏人才密集、有钱、有数据的公司,但能持续做出划时代产品的团队寥寥无几。可以肯定的是,除了OpenAI团队中关键少数的技术远见,这些重量级产品的实现与他们的组织运作密不可分。 那么,这些人到底是如何被组织起来的,他们有什么样的组织形态和文化? 在Lenny Rachitsky主持的最新播客节... 展开更多

收藏 4
0
置顶
发表了博客
03/12 09:48

好久不见!OneFlow 1.0全新版本上线

好久不见。今天是 OneFlow 开源的第 1320 天。 与 OneFlow 框架的创作者们一样,过去一年,它也经历了过山车般的命运。好在,即使在下坡潜伏期依然被社区用户关注和使用,作为它的创作者,我们为此感到欣慰——这也是它还在更迭的价值和意义所在。 终于,OneFlow 迎来了一个新的里程碑。距离上一次版本发布一年后,我们很高兴发布全新的 OneFlow v1.0.0 版本。 本次更新共 447 个 commits,包括新特性 80+ 项,功能改进与问题修... 展开更多

收藏 0
0
置顶
发表了博客
03/06 08:03

混合输入矩阵乘法的性能优化

作者 | Manish Gupta OneFlow编译 翻译|宛子琳、杨婷 AI驱动的技术正逐渐融入人们日常生活的各个角落,有望提高人们获取知识的能力,并提升整体生产效率。语言大模型(LLM)正是这些应用的核心。LLM对内存的需求很高,通常需要专用的硬件加速器,以高效地提供数百亿亿次浮点运算(Exaflops级别)的计算能力。本文将展示如何通过更有效地利用内存来解决计算方面的挑战。 LLM中的大部分内存和计算资源都消耗在了矩阵乘法操作中的... 展开更多

收藏 0
0
置顶
发表了博客
03/14 15:01

阿里云PAI大模型RAG对话系统最佳实践

去年4月至9月,阿里云人工智能平台 PAI 团队与大数据基础工程技术团队合作,构建了基于知识库检索增强的大模型答疑对话机器人,并在阿里云官方答疑链路、研发小蜜、钉钉大数据技术服务助手等多个线上场景上线,显著提升答疑效率。相关文档:【万字长文】基于阿里云PAI搭建知识库向量检索增强的大模型对话系统 上线几个月来,随着 RAG 技术日趋火热,我们保持对线上链路的迭代,不断加入学界业界最新的 RAG 优化技术(eg: advan... 展开更多

收藏 1
1
置顶
发表了博客
03/13 14:25

《行业指标体系白皮书》重磅发布,剖析指标建设困境,构建前瞻性的指标体系(附下载)

正处于企业指标建设过程中的你,是否经常遇到这样的问题: • 各个部门独立建设信息系统,由此产生的指标定义和计算方式各异,导致管理层无法快速准确地掌握整体业务运行状况 • 缺乏对指标的统一管理和规范,产生重复的指标计算工作,导致数据计算资源被过度消耗,增加运维成本和数据处理压力 • 不知道指标体系建设有哪些流程?也不清楚在不同的流程阶段具体需要做哪些事情?更不了解同行业的其他企业的指标建设情况和参考? ... 展开更多

收藏 0
0
置顶
架构师
发表了博客
03/14 09:33

为什么90%的人说医疗行业没有“大”数据?

随着医疗行业数据量的爆炸式增长,如何高效、准确地处理和调度这些数据成为了行业内的一大挑战。医疗数据处理不仅涉及到数据量巨大,还需要处理实时性高、安全性要求严格的任务。包括数据抽取(ETL)、实时数据处理、数据源管理、任务调度的灵活性和易用性等都是行业普遍面临的难题。 ![file](https://oscimg.oschina.net/oscnet/up-fdfb683fdc2af1bd0638d751dc0f0838b70.jpg) **其中大数据工程师们往往**遇到的问题包括但不限于... 展开更多

收藏 0
0
置顶
发表了博客
03/13 11:38

万字带你了解ChatGLM

本文分享自华为云社区《【云驻共创】华为云之昇思MindSpore大模型专题(第二期)-第一课:ChatGLM》,作者: 愚公搬代码。 前言 1.昇思MindSpore 昇思MindSpore是华为公司推出的一款全场景AI计算框架。它提供了自动微分、分布式训练和推理、模型部署等功能,支持多种硬件平台,包括CPU、GPU和Ascend AI 处理器。MindSpore采用图和算子相结合的编程模型,能够高效地处理复杂的深度学习任务。它具有灵活的设计、高效的性能和易于使... 展开更多

收藏 11
0
置顶
发表了博客
03/11 20:19

程序员逆袭 CEO 总共分几步?

2024年,是充满未知和挑战的一年。AI 的发展日新月异,已经有人用它来写代码了,啥时候会替代程序员,可真不好说。另一方面,程序员扎堆的 IT 互联网行业却进入了平台期甚至下行期,降本增效成为行业主流,裁员缩招的声音不绝于耳。在这种前有狼后有虎的年头,作为程序员,又该何去何从? 程序员的职业生涯,真的只能走到35岁吗?我们该如何做,才能夯实自身,提高替代难度?对于有创业梦想的人,又该如何规划,才能穿越牛熊,逆... 展开更多

收藏 1
0
置顶
产品经理
发表了博客
02/06 18:30

句子嵌入: 交叉编码和重排序

这个系列目的是揭开嵌入的神秘面纱,并展示如何在你的项目中使用它们。第一篇博客介绍了如何使用和扩展开源嵌入模型,选择现有的模型,当前的评价方法,以及生态系统的发展状态。第二篇博客将会更一步深入嵌入并解释双向编码和交叉编码的区别。进一步我们将了解 检索和重排序 的理论。我们会构建一个工具,它可以来回答大约 400 篇 AI 的论文的问题。我们会在末尾大致讨论一下两个不同的论文。 你可以在这里阅读,或者通过点击左... 展开更多

收藏 2
0
置顶
产品经理
发表了博客
02/05 18:30

全世界 LoRA 训练脚本,联合起来!

太长不看版 我们把 Replicate 在 SDXL Cog 训练器中使用的枢轴微调 (Pivotal Tuning) 技术与 Kohya 训练器中使用的 Prodigy 优化器相结合,再加上一堆其他优化,一起对 SDXL 进行 Dreambooth LoRA 微调,取得了非常好的效果。你可以在 diffusers 上找到 我们使用的训练脚本🧨,或是直接 在 Colab 上 试着运行一下。 如果你想跳过技术讲解直接上手,可以使用这个 Hugging Face Space,通过简单的 UI 界面用我们精选的超参直接开... 展开更多

收藏 0
0
置顶
发表了博客
03/11 16:06

轻松玩转AI绘图,可私有化部署的Stable Diffusion

引言 Stable Diffusion 是一个开源的深度学习模型,主要利用文本描述生成高质量的图像,还可以图生图、模型合并、模型训练等。Stable Diffusion 的操作界面如下图所示: 如何生图 下面介绍一下小鹿喝水的生图过程,生成图的时候分为提示词和负面提示词,输入提示词的时候要明确描述,尽量具体描述你想要的场景、对象、风格和颜色。例如,不仅仅说“小鹿喝水”,而是说“一条小溪,旁边是茂密的树,小溪旁有小鹿在喝水”,负面提... 展开更多

收藏 2
0
置顶
发表了博客
03/08 10:42

一键Run带你体验扩散模型的魅力

本文分享自华为云社区《爆圈Sora横空出世,AGI通用人工智能时代真的要来了吗?一键Run带你体验扩散模型的魅力!》,作者: 码上开花_Lancer。 Sora这几天的爆炸性新闻,让所有人工智能相关从业者及对应用感兴趣的人群都感到沸腾,震撼到央视也在进行相关的讨论,简直可以和2023年初ChatGPT讨论带来的热潮一般。所以它到底为什么这么火? 一、什么是SORA? Sora 是OpenAI最新发布的文本生成视频模型,不仅可以生成长达一分钟的视频... 展开更多

收藏 0
0
置顶
发表了博客
03/05 15:54

AI加速引擎PAI-TorchAcc:OLMo训练加速最佳实践

**作者**:黄奕桐、沈雯婷、艾宝乐、王昂、李永 # 摘要 阿里云机器学习平台PAI开发的Pytorch训练加速框架PAI-TorchAcc已接入最新开源的大语言模型 OLMo。 在保证模型效果和易用性的前提下,PAI-TorchAcc相对 PyTorch 性能在 OLMo 1B 上加速比达到 1.64X,在 OLMo 7B 上加速比达到 1.52X。 本文分析了 PAI-TorchAcc 的性能收益来源。 # 1、PAI-TorchAcc 简介 PAI-TorchAcc(Torch Accelerator)是阿里云机器学习平台开发的Pytorch... 展开更多

收藏 0
0
置顶
发表了博客
03/05 15:50

通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

**作者**:汪诚愚(熊兮)、高一鸿(子洪)、黄俊(临在) Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base和Chat等多个版本的开源模型,为全球的开发者社区提供了空前的便捷性。阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen1.5模型系列提供了全面的技术支持... 展开更多

收藏 1
0
置顶
发表了博客
03/06 17:41

让运维无忧,实战解析巡检报告功能实现方案

随着大数据技术的演进和信息安全性需求的提升,数据规模的持续扩张为数据运维工作带来了严峻考验。面对海量数据所形成的繁重管理压力,运维人员面临效率瓶颈,而不断攀升的人力成本也使得单纯依赖扩充运维团队来解决问题变得不再实际可行。 由此可见,智能化与高效便捷是运维发展的必然方向。袋鼠云所推出的[巡检报告功能](https://www.dtstack.com/dtengine/easymr?src=szsm),正是为了顺应这一目标,致力于提供优化的解决方案... 展开更多

收藏 1
1
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
返回顶部
顶部