CUDA 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
CUDA 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
CUDA 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 未知
开发语言 C/C++
操作系统 Windows
软件类型 开源软件
开源组织
地区 不详
投 递 者 不详
适用人群 未知
收录时间 2008-11-21

软件简介

CUDA 工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境。CUDA 开发环境包括:

  • nvcc C语言编译器
  • 适用于GPU(图形处理器)的CUDA FFT和BLAS库
  • 分析器
  • 适用于GPU(图形处理器)的gdb调试器(在2008年3月推出alpha版)
  • CUDA运行时(CUDA runtime)驱动程序(目前在标准的NVIDIA GPU驱动中也提供)
  • CUDA编程手册

CUDA 开发者软件开发包(SDK)提供了一些范例(附有源代码),以帮助使用者开始CUDA编程。这些范例包括:

  • 并行双调排序
  • 矩阵乘法
  • 矩阵转置
  • 利用计时器进行性能评价
  • 并行大数组的前缀和(扫描)
  • 图像卷积
  • 使用Haar小波的一维DWT
  • OpenGL和Direct3D图形互操作示例
  • CUDA BLAS和FFT库的使用示例
  • CPU-GPU C—和C++—代码集成
  • 二项式期权定价模型
  • Black-Scholes期权定价模型
  • Monte-Carlo期权定价模型
  • 并行Mersenne Twister(随机数生成)
  • 并行直方图
  • 图像去噪
  • Sobel边缘检测滤波器
  • MathWorks MATLAB 插件 (点击这里下载)

新的基于 1.1 版 CUDA 的 SDK 范例现在也已经发布了。要查看完整的列表、下载代码,请点击此处

技术功能

  • 在GPU(图形处理器)上提供标准C编程语言
  • 为在支持CUDA的NVIDIA GPU(图形处理器)上进行并行计算而提供了统一的软硬件解决方案
  • CUDA兼容的GPU(图形处理器)包括很多:从低功耗的笔记本上用的GPU到高性能的,多GPU的系统。
  • 支持CUDA的GPU(图形处理器)支持并行数据缓存和线程执行管理器
  • 标准FFT(快速傅立叶变换)和BLAS(基本线性代数子程序)数值程序库
  • 针对计算的专用CUDA驱动
  • 经过优化的,从中央处理器(CPU)到支持CUDA的GPU(图形处理器)的直接上传、下载通道
  • CUDA驱动可与OpenGL和DirectX图形驱动程序实现互操作
  • 支持Linux 32位/64位以及Windows XP 32位/64位 操作系统
  • 为了研究以及开发语言的目的,CUDA提供对驱动程序的直接访问,以及汇编语言级的访问
展开阅读全文

评论 (0)

加载中
更多评论
2019/11/23 07:42

CUDA 10.2 更新,NVIDIA 推出的并行计算架构

NVIDIA 已经发布了 CUDA 10.2,并对该版本进行了一些更改,内容包括有:成为支持Apple macOS的最新版本以及引入了用于GPU的标准C ++库。 据悉,CUDA 10.2 的重点包括以下几个方面: CUDA 10.2现在将libcu ++作为图形处理器的并行标准C ++库提供。 添加了CUDA虚拟内存管理(VMM)API。 这是最新的CUDA版本,支持Apple的macOS用于开发和运行应用程序。下一个CUDA版本将完全放弃对macOS的支持。 用于缓冲区分配/同步/流传输的新互操...

4
2
发表于服务端专区
2019/02/28 08:25

CUDA 10.1 发布,NVIDIA 推出的并行计算架构

CUDA 10.1 发布了。CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。 CUAD 10.1 包含了一个新的 GEMM 轻量级库、一些实用和性能方面的提升、以及 CUDA Graphs APIs 的改进。 新版本的更新亮点有: cuBLASLt,一个新的轻量级 GEMM 库,具有灵活的API和张量核心,...

9
11
发表了资讯
2013/06/12 00:00

CUDA 5.5 RC 发布,并行计算的平台和架构

CUDA 5.5 RC 版本发布了,根据发行说明得知,这是下一个并行计算的平台和架构,包含多处理器 MPI 调试和剖析,逐步引导式性能分析以及静态的 CUDA 运行时库。 CUDA™ 工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境。CUDA开发环境包括: · nvcc C语言编译器 · 适用于GPU(图形处理器)的CUDA FFT和BLAS库 · 分析器 · 适用于GPU(图形处理器)的gdb调试器(在2008年3月推出alpha版) · CUDA运行时(CUDA ...

1
8
发表了资讯
2013/03/19 00:00

NVIDIA CUDA 正式支持 Python 语言

NVIDIA今天宣布,CUDA并行编程架构已经正式提供对开源编程语言Python的支持。这是C、C++、Fortran(PGI)之后,CUDA支持的第四种语言。 Python,吉多·范罗苏姆(Guido van Ross) 1989年创立,一种面向对象、直译式的编程语言,简单易学易用、成熟稳定,是当今十大编程语言之一,全球用户量超过300万人。NVIDIA表示,Python语言丰富的库和先进的特性使其非常适合为多种高性能计算应用开发程序,包括科学、工程、大数据分析等等。 ...

26
22
发表了资讯
2011/12/20 00:00

NVIDIA CUDA 4.1 编译器基于 LLVM 构建

CUDA™ 工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境。CUDA开发环境包括: · nvcc C语言编译器 · 适用于GPU(图形处理器)的CUDA FFT和BLAS库 · 分析器 · 适用于GPU(图形处理器)的gdb调试器(在2008年3月推出alpha版) · CUDA运行时(CUDA runtime)驱动程序(目前在标准的NVIDIA GPU驱动中也提供) · CUDA编程手册 在 NVIDIA ,CUDA 从 4.1 版本开始将使用 LLVM 进行构建,使用 LLVM 用于优化和 PT...

0
4
发表了资讯
2011/12/14 00:00

NVIDIA 宣布开源 CUDA

不知道是不是由于 AMD 最近在 OpenCL 的开源方面动作带来的压力,NVIDIA 宣布开源旗下的通用 GPU 计算 CUDA 编译器。 在 GTC Asia 上 NVIDIA 宣布将其通用图形处理器计算技术的 CUDA 的编译器开源(尚未明确将采用按照何种开源协议),从而允许软件厂商将 CUDE 程序移植到其他非 NVIDIA 设备上。业界推测此举可能是由于很多软件厂商受到来自客户方面的压力,要求将迁移到更加开发的高性能计算平台比如 OpenCL 上。 此外 NVIDIA...

10
8
发表了资讯
2011/03/01 00:00

简化并行开发 NVIDIA宣布CUDA 4.0

NVIDIA公司今天宣布了新版GPU通用计算开发包CUDA 4.0,主要改进方向是简化并行编程,让更多开发人员能够将应用程序移植到GPU平台。 CUDA 4.0的三大主要特性包括: - GPUDirect 2.0技术。GPUDirect 1.0主要用于高性能计算集群应用,方便不同节点之间的GPU相互联系,而GPUDirect 2.0则面向节点内应用,即多GPU并联系统。同一节点内的多块GPU可以不经过CPU、住内存,直接交换各自显存中的数据。 - 统一虚拟寻址(UVA)。简化通用计算...

2
3
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
2019/06/10 23:01

CUDA 编程

GPU 与 CPU CPU:擅长流程控制和逻辑处理,不规则数据结构,不可预测存储结构,单线程程序,分支密集型算法 GPU:擅长数据并行计算,规则数据结构,可预测存储模式 异构编程 现在的计算机体系架构中,要完成CUDA并行计算,单靠GPU一人之力是不能完成计算任务的,必须借助CPU来协同配合完成一次高性能的并行计算任务。 一般而言,并行部分在GPU上运行,串行部分在CPU运行,这就是异构计算。具体一点,异构计算的意思就是不同体系...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了问答
2016/03/15 17:06

/usr/bin/ld: cannot find -lcutil_x86_64 /usr/bin/ld: cannot find -lshrutil_x86_64

e_t, FILE*)’, declared with attribute warn_unused_result [-Wunused-result] /usr/bin/ld: cannot find -lcutil_x86_64 /usr/bin/ld: cannot find -lshrutil_x86_64 collect2: ld returned 1 exit status make: *** [../../bin/linux/release/NN] Error 1 gpgpu-sim@gpgpusim-VirtualBox:~/Projects/ISPassBenchmark/ispass2009-benchmarks-master/NN$ 求大神指教...

1
0
发表了问答
2015/07/31 20:55

利用CUDA加速旧代码过程中的两点疑问

一直从事电子信息系统建模仿真方面的工作,借助于面向对象的分析与设计(OOAD)等技术,利用C++语言实现了多个实际信息系统的功能模型。最近考虑用CUDA改写这些旧代码,以提高仿真时效性,但在这个过程中遇到了两个问题: 1. 感觉CUDA是面向过程的——参考了NVIDIA的示例程序,全部都是一系列的函数。之前在建模仿真过程中经常使用的OOAD方法与技术,例如封装、多态、继承、模板、设计模式等,感觉这些技术和方法很难和CUDA的函...

1
0
发表了问答
2015/07/27 14:22

申请学生版的intel parallel studio 2015 xe,填哪个学校都过不去认证,怎么办?

中文,英文都试了,就下面这样,怎么办?像什么南开大学,Stanford University, UC Berkeley, UCLA都过不去!很着急啊,我要用mkl库现在!

1
0
发表了问答
2013/01/08 20:01

在基友中山野鬼,宏哥,师兄铂金小猪多方意见考虑后,准备找个明主投奔、、、

1、GDAL处理矢量shp、mif、eoo、dxf、coverage等格式(有的格式是自己开发的 @铂金小猪 我师兄了解点)与栅格数据Geotiff、tiff、img、grid等格式在大地与平面坐标系,利用控制点除了常用布尔莎转换模型,还有平面四参数、二维七参数等,投影模型有高斯、TM、utm等算法,栅格转换模型除了常用实现的的布尔莎转换模型,放射模型外,还有二阶多项式、三阶、四节多项式以及格网转换等算法,同时还实现了多种重采样法平移法,在北京...

32
1
发表了问答
2012/12/21 17:19

diy密码破解系统选AMD还是NVIDIA

@oschina 你好,想跟你请教个问题:问什么见到的密码破解系统都是amd的gpu而少有nvidia的?问题是硬件架构有优势还是openCL和cuda有差别!

2
0
发表了问答
2013/01/17 18:56

急急急急急在线等CUDA问题

采用积分法计算圆周率/π的值。其计算原理是:在[0,1]范围内积分1/(1+x*x) /* 串行计算PI的程序,基本思想为:将积分区间均分为num小块,将每小块的面积加起来。 */ float cpuPI(int num){ float sum=0.0f; float temp; for(int i=0;i<num;i++){ temp=(i+0.5f)/num; // printf("%f\n",temp); sum+=4/(1+temp*temp); // printf("%f\n",sum); } return sum/num; } 求解释这段代码的意思,啊啊啊急急急急急...

1
1
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
0 评论
56 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部