cuDF 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
cuDF 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
授权协议: Apache
开发语言: Python
操作系统: 跨平台
收录时间: 2019-08-06
提 交 者: 红薯

cuDF 基于Apache Arrow柱状内存格式构建,是一个GPU DataFrame库,用于加载,连接,聚合,过滤和操作数据。

cuDF提供了类似 pandas 的 API,数据工程师和数据科学家都很熟悉它们,因此他们可以使用它轻松加快工作流程,而无需深入了解CUDA编程的细节。

例如,以下代码段下载CSV,然后使用GPU将其解析为行和列并运行计算:

import cudf, io, requests
from io import StringIO

url="https://github.com/plotly/datasets/raw/master/tips.csv"
content = requests.get(url).content.decode('utf-8')

tips_df = cudf.read_csv(StringIO(content))
tips_df['tip_percentage'] = tips_df['tip']/tips_df['total_bill']*100

# display average tip by dining party size
print(tips_df.groupby('size').tip_percentage.mean())

输出结果:

size
1    21.729201548727808
2    16.571919173482897
3    15.215685473711837
4    14.594900639351332
5    14.149548965142023
6    15.622920072028379
Name: tip_percentage, dtype: float64
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

cuDF 的相关资讯

还没有任何资讯

cuDF 的相关博客

Nvidia发展GPUDirect存储技术

Nvidia发展了名为GPUDirect存储(GPUDirect Storage)的数据传输技术,加快位在各种存储的数据,传输到GPU记忆体的速度,可以...

使用Python玩转GPU

问题 随着机器学习对模型运算速度的需求越来越强烈, 一直想进行GPU编程,但一直以来这些都是c++的专利 一想到c++里的各种坑,...

异构计算系列(二):机器学习领域涌现的异构加速技术

作者 | 易小萌、郭人通 策划 | 钰莹 “异构计算”(Heterogeneous computing),是指在系统中使用不同体系结构的处理器的联合...

异构计算系列(二):机器学习领域涌现的异构加速技术

作者 | 易小萌、郭人通 策划 | 钰莹 “异构计算”(Heterogeneous computing),是指在系统中使用不同体系结构的处理器的联合...

强强联手 百度智能云机器学习平台BML上线NVIDIA RAPIDS加速库

近日,百度智能云与英伟达合作,通过容器化技术将RAPIDS库封装到机器学习平台BML,并利用Kubernetes进一步管理,做到了开箱即...

加速加速再加速——大数据机器学习模型实践

最近要对大量的网格数据(千亿级别)建模,尝试了各种解决方案:多线程,多进程,分布式,GPU,多GPU,分布式多GPU…… 而开源世界里...

当 Mars 遇上 RAPIDS:用 GPU 以并行的方式加速数据科学

背景 在数据科学世界,Python 是一个不可忽视的存在,且有愈演愈烈之势。而其中主要的使用工具,包括 Numpy、Pandas 和 Scik...

Coding and Paper Letter(五十八)

资源整理。 1 Coding: 1.支持TMS、WMTS标准瓦片下载,支持百度地图瓦片、高德地图瓦片、腾讯地图瓦片、天地图、ArcServer Res...

在参加了39场Kaggle比赛之后,有人总结了一份图像分割炼丹的「奇技淫巧」

点击上方“AI算法与图像处理”,选择加"星标"或“置顶” 重磅干货,第一时间送达 本文转载自:机器之心 一个经历了 39 场 Ka...

cuDF 的相关问答

还没有任何问答,马上提问

评论 (0)

加载中
更多评论
0 评论
0 收藏
分享
返回顶部
顶部