CUDA 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
CUDA 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
CUDA 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 未知
开发语言 C/C++
操作系统 Windows
软件类型 开源软件
开源组织
地区 不详
投 递 者 不详
适用人群 未知
收录时间 2008-11-21

软件简介

CUDA 工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境。CUDA 开发环境包括:

  • nvcc C语言编译器
  • 适用于GPU(图形处理器)的CUDA FFT和BLAS库
  • 分析器
  • 适用于GPU(图形处理器)的gdb调试器(在2008年3月推出alpha版)
  • CUDA运行时(CUDA runtime)驱动程序(目前在标准的NVIDIA GPU驱动中也提供)
  • CUDA编程手册

CUDA 开发者软件开发包(SDK)提供了一些范例(附有源代码),以帮助使用者开始CUDA编程。这些范例包括:

  • 并行双调排序
  • 矩阵乘法
  • 矩阵转置
  • 利用计时器进行性能评价
  • 并行大数组的前缀和(扫描)
  • 图像卷积
  • 使用Haar小波的一维DWT
  • OpenGL和Direct3D图形互操作示例
  • CUDA BLAS和FFT库的使用示例
  • CPU-GPU C—和C++—代码集成
  • 二项式期权定价模型
  • Black-Scholes期权定价模型
  • Monte-Carlo期权定价模型
  • 并行Mersenne Twister(随机数生成)
  • 并行直方图
  • 图像去噪
  • Sobel边缘检测滤波器
  • MathWorks MATLAB 插件 (点击这里下载)

新的基于 1.1 版 CUDA 的 SDK 范例现在也已经发布了。要查看完整的列表、下载代码,请点击此处

技术功能

  • 在GPU(图形处理器)上提供标准C编程语言
  • 为在支持CUDA的NVIDIA GPU(图形处理器)上进行并行计算而提供了统一的软硬件解决方案
  • CUDA兼容的GPU(图形处理器)包括很多:从低功耗的笔记本上用的GPU到高性能的,多GPU的系统。
  • 支持CUDA的GPU(图形处理器)支持并行数据缓存和线程执行管理器
  • 标准FFT(快速傅立叶变换)和BLAS(基本线性代数子程序)数值程序库
  • 针对计算的专用CUDA驱动
  • 经过优化的,从中央处理器(CPU)到支持CUDA的GPU(图形处理器)的直接上传、下载通道
  • CUDA驱动可与OpenGL和DirectX图形驱动程序实现互操作
  • 支持Linux 32位/64位以及Windows XP 32位/64位 操作系统
  • 为了研究以及开发语言的目的,CUDA提供对驱动程序的直接访问,以及汇编语言级的访问
展开阅读全文

评论

点击引领话题📣
发表了资讯
2022/12/11 07:40

NVIDIA CUDA 12.0 已发布

CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。 目前,NVIDIA CUDA 12.0 发布了,CUDA 12.0 带来了许多变化,包括最新 Hopper 和 Ada Lovelace GPU 的新功能、更新 C++ 方言、使 JIT LTO 支持官方、新的和改进的 API,以及各种其他功能。 CUDA 12.0 为 NVID...

2
0
发表了资讯
2022/05/14 07:51

NVIDIA CUDA 11.7 发布了

CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。 目前,NVIDIA CUDA 11.7 发布了,CUDA 11.7 为新的 NVIDIA Open GPU Kernel Modules 带来了兼容性支持,另一个重要的亮点是延迟加载支持。 而 CUDA 11.7 Toolkit 已作为 NVIDIA 专有计算堆栈的最新功能更新提供...

0
0
2019/11/23 07:42

CUDA 10.2 更新,NVIDIA 推出的并行计算架构

NVIDIA 已经发布了 CUDA 10.2,并对该版本进行了一些更改,内容包括有:成为支持Apple macOS的最新版本以及引入了用于GPU的标准C ++库。 据悉,CUDA 10.2 的重点包括以下几个方面: CUDA 10.2现在将libcu ++作为图形处理器的并行标准C ++库提供。 添加了CUDA虚拟内存管理(VMM)API。 这是最新的CUDA版本,支持Apple的macOS用于开发和运行应用程序。下一个CUDA版本将完全放弃对macOS的支持。 用于缓冲区分配/同步/流传输的新互操...

4
2
2019/02/28 08:25

CUDA 10.1 发布,NVIDIA 推出的并行计算架构

CUDA 10.1 发布了。CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。 CUAD 10.1 包含了一个新的 GEMM 轻量级库、一些实用和性能方面的提升、以及 CUDA Graphs APIs 的改进。 新版本的更新亮点有: cuBLASLt,一个新的轻量级 GEMM 库,具有灵活的API和张量核心,...

9
11
发表了资讯
2013/06/12 00:00

CUDA 5.5 RC 发布,并行计算的平台和架构

CUDA 5.5 RC 版本发布了,根据发行说明得知,这是下一个并行计算的平台和架构,包含多处理器 MPI 调试和剖析,逐步引导式性能分析以及静态的 CUDA 运行时库。 CUDA™ 工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境。CUDA开发环境包括: · nvcc C语言编译器 · 适用于GPU(图形处理器)的CUDA FFT和BLAS库 · 分析器 · 适用于GPU(图形处理器)的gdb调试器(在2008年3月推出alpha版) · CUDA运行时(CUDA ...

1
8
发表了资讯
2013/03/19 00:00

NVIDIA CUDA 正式支持 Python 语言

NVIDIA今天宣布,CUDA并行编程架构已经正式提供对开源编程语言Python的支持。这是C、C++、Fortran(PGI)之后,CUDA支持的第四种语言。 Python,吉多·范罗苏姆(Guido van Ross) 1989年创立,一种面向对象、直译式的编程语言,简单易学易用、成熟稳定,是当今十大编程语言之一,全球用户量超过300万人。NVIDIA表示,Python语言丰富的库和先进的特性使其非常适合为多种高性能计算应用开发程序,包括科学、工程、大数据分析等等。 ...

26
22
发表了资讯
2011/12/20 00:00

NVIDIA CUDA 4.1 编译器基于 LLVM 构建

CUDA™ 工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境。CUDA开发环境包括: · nvcc C语言编译器 · 适用于GPU(图形处理器)的CUDA FFT和BLAS库 · 分析器 · 适用于GPU(图形处理器)的gdb调试器(在2008年3月推出alpha版) · CUDA运行时(CUDA runtime)驱动程序(目前在标准的NVIDIA GPU驱动中也提供) · CUDA编程手册 在 NVIDIA ,CUDA 从 4.1 版本开始将使用 LLVM 进行构建,使用 LLVM 用于优化和 PT...

0
4
发表了资讯
2011/12/14 00:00

NVIDIA 宣布开源 CUDA

不知道是不是由于 AMD 最近在 OpenCL 的开源方面动作带来的压力,NVIDIA 宣布开源旗下的通用 GPU 计算 CUDA 编译器。 在 GTC Asia 上 NVIDIA 宣布将其通用图形处理器计算技术的 CUDA 的编译器开源(尚未明确将采用按照何种开源协议),从而允许软件厂商将 CUDE 程序移植到其他非 NVIDIA 设备上。业界推测此举可能是由于很多软件厂商受到来自客户方面的压力,要求将迁移到更加开发的高性能计算平台比如 OpenCL 上。 此外 NVIDIA...

10
8
发表了资讯
2011/03/01 00:00

简化并行开发 NVIDIA宣布CUDA 4.0

NVIDIA公司今天宣布了新版GPU通用计算开发包CUDA 4.0,主要改进方向是简化并行编程,让更多开发人员能够将应用程序移植到GPU平台。 CUDA 4.0的三大主要特性包括: - GPUDirect 2.0技术。GPUDirect 1.0主要用于高性能计算集群应用,方便不同节点之间的GPU相互联系,而GPUDirect 2.0则面向节点内应用,即多GPU并联系统。同一节点内的多块GPU可以不经过CPU、住内存,直接交换各自显存中的数据。 - 统一虚拟寻址(UVA)。简化通用计算...

2
3
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
57 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部