Pandas 正在参加 2021 年度 OSC 中国开源项目评选,请投票支持!
Pandas 在 2021 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
2021 年度 OSC 中国开源项目评选 正在火热进行中,快来投票支持你喜欢的开源项目!
2021 年度 OSC 中国开源项目评选 >>> 中场回顾
Pandas 获得 2021 年度 OSC 中国开源项目评选「最佳人气项目」 !
授权协议 BSD
开发语言 Python 查看源码 »
操作系统 跨平台
软件类型 开源软件
所属分类 程序开发数学计算
开源组织
地区 不详
投 递 者 _A_J
适用人群 未知
收录时间 2012-10-30

软件简介

Python Data Analysis Library 或 pandas 是连接 SciPyNumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Comma-separated values (CSV) 文件表示在有关各方之间分发数据的最常见的方法之一。Pandas 提供了一种优化库功能来读写多种文件格式,包括 CSV 和高效的 HDF5 格式。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (2)

加载中
打分: 推荐
蛮好的,适合初学者
2017/03/06 00:55
回复
举报
都不更新的。这不科学。 #Pandas#
2016/10/01 11:28
回复
举报
更多评论
发表于AI & 大数据专区
2020/02/02 08:10

Pandas 1.0.0 发布,分析结构化数据的工具集

Pandas 1.0.0 发布了。Pandas 是一个强大的分析结构化数据的工具集;它的使用基础是 Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。 从 1.0.0 开始,Pandas 将采用 SemVer 的一种变体来发布版本,简单来讲,会依据以下几点规则: 将在次要版本中引入弃用(例如 1.1.0、1.2.0 与 2.1.0 等) 在主要版本中将强制弃用(例如 1.0.0、2.0.0 与 3.0.0 等) API 破坏性变更仅在主要版本中进行(实验...

3
11
发表于AI & 大数据专区
2018/05/20 07:34

Pandas 0.23.0 发布,Python 数据分析工具包

Pandas 是一个以 BSD 许可开源的库,为 Python 编程语言提供了高性能、易于使用的数据结构和数据分析工具。 Pandas 0.23.0 是自 0.22.0 以来的又一个主要版本,包括许多 API 更改、弃用,新特性,功能改进、性能改进以及大量错误修复。建议所有用户升级到此版本。 亮点包括: Round-trippable JSON format with ‘table’ orient. Instantiation from dicts respects order for Python 3.6+. Dependent column arguments for as...

0
3
发表了资讯
2017/05/09 07:31

Pandas 0.20.1 发布,Python 数据分析工具包

Pandas 是一个以 BSD 许可开源的库,为 Python 编程语言提供了高性能、易于使用的数据结构和数据分析工具。 Pandas 0.20.1 是自 0.19.2 以来的又一个主要版本,包括许多 API 更改、弃用,新特性,功能改进、性能改进以及大量错误修复。建议所有用户升级到此版本。 亮点包括: Series/DataFrame 新的 .agg()API ,类似于 groupby-rolling-resample API 与 feather-format 集成,包括一个新的顶级 pd.read_feather()和 DataFr...

0
13
发表了资讯
2014/10/20 00:00

Pandas v0.15.0 final 发布,Python 数据分析工具包

Pandas v0.15.0 final 发布,此版本现已提供下载,主要是大量的 API 改进,一些新特性,功能增强和性能提升,还有大量的 bug 修复,具体更新内容如下: Drop support for numpy < 1.7.0 The Categorical type was integrated as a first-class pandas type New scalar type Timedelta, and a new index type TimedeltaIndex New DataFrame default display for df.info() to include memory usage New datetimelike properties...

12
20
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
2019/06/20 22:35

Pandas

Pandas 什么是Pandas pandas能干什么 怎么用pandas Series DataFrame 时间对象处理 数据分组和聚合 其他常用方法 1、什么是Pandas 当大家谈论到数据分析时,提及最多的语言就是Python和SQL,而Python之所以适合做数据分析,就是因为他有很多强大的第三方库来协助,pandas就是其中之一,它是基于Numpy构建的,正因pandas的出现,让Python语言也成为使用最广泛而且强大的数据分析环境之一。如果说没有pandas的出现,目前的金融数据...

0
0
发表了博客
2019/02/16 22:26

Pandas

# -*- coding:UTF-8 -*- __autor__ = 'zhouli' __date__ = '2019/2/13 21:38' import pandas as pd firsts = pd.DataFrame( { 'val1': 1.0, 'val2': [1, 2, 3, 4], 'val3': ["test", "trains", "tony", "stark"], 'val4': 'iron_man' } ) print(firsts) >>> val1 val2 val3 val4 0 1.0 1 test iron_man 1 1.0 2 trains iron_man ...

0
0
发表了博客
2018/10/19 15:34

pandas

  pandas是一个强大的python数据分析的工具包,是基于NumPy构建的   主要功能: 具备对其功能的数据结构DataFrame Series 集成时间序列功能 提供丰富的数学运算和操作 灵活处理缺失数据   安装:pip install pandas   引用:import pandas as pd Series-一维数据对象   Series是一种类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组成   创建方式 In [206]: import pandas as pd In [207]: p...

0
0
2019/01/03 19:25

Pandas

Pandas的数据类型 Pandas基于两种数据类型:series与dataframe。 一个series是一个一维的数据类型,其中每一个元素都有一个标签。如果你阅读过这个系列的关于Numpy的文章,你就可以发现series类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。 一个dataframe是一个二维的表结构。Pandas的dataframe可以存储许多种不同的数据类型,并且每一个坐标轴都有自己的标签。你可以把它想象成一个series的字典项。 过滤 ...

0
0
2019/01/03 19:25

Pandas

Pandas的数据类型 Pandas基于两种数据类型:series与dataframe。 一个series是一个一维的数据类型,其中每一个元素都有一个标签。如果你阅读过这个系列的关于Numpy的文章,你就可以发现series类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。 一个dataframe是一个二维的表结构。Pandas的dataframe可以存储许多种不同的数据类型,并且每一个坐标轴都有自己的标签。你可以把它想象成一个series的字典项。 过滤 ...

0
0
发表了博客
2019/07/28 20:42

Pandas

Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的 数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。 Pandas基于两种数据类型:series与dataframe。 import pandas as pd from pandas import Series,DataFrame import numpy as np # 创建Series对象并省略索引 ''' index 参数是可省略的,你可以选择不输入...

0
0
发表了博客
2020/04/09 14:56

Pandas

正文共: 6791字 5 图 预计阅读时间: 17 分钟 每日分享 Attitude is a little thing that makes a big difference. 态度是件小事,但却意义重大。 小闫语录: 一个态度端正,对事认真的人,即使能力欠佳,最后的成果肯定不会太差。一个能力突出,但是态度不端,眼高手低的人,即使完成了任务,效果也未必见好。用人,做人,态度须为第一。 Pandas 1.Pandas介绍 1.1Pandas与Numpy的不同? 答:Numpy是一个科学计算库,用于计算,...

0
0
发表于服务端专区
2018/01/22 19:42

pandas

http://pandas.pydata.org/getpandas.html https://bitbucket.org/xurongzhong/python-chinese-library/wiki/%5B%E9%9B%AA%E5%B3%B0%E7%A3%81%E9%92%88%E7%9F%B3%E5%8D%9A%E5%AE%A2%5D%20python%E6%A8%A1%E5%9D%97%E4%BB%8B%E7%BB%8D-pandas%E5%85%A5%E9%97%A8 https://bitbucket.org/xurongzhong/small_python_daily_tools/wiki/%5B%E9%9B%AA%E5%B3%B0%E7%A3%81%E9%92%88%E7%9F%B3%E5%8D%9A%E5%AE%A2%5D%20%E4%BD%BF%E7%94%A8p...

0
0
发表了博客
2018/06/21 23:55

pandas数组(pandas Series)-(2)

pandas Series 比 numpy array 要强大很多,体现在很多方面 首先, pandas Series 有一些方法,比如: describe 方法可以给出 Series 的一些分析数据: import pandas as pd s = pd.Series([1,2,3,4]) d = s.describe() print(d) count 4.000000 mean 2.500000 std 1.290994 min 1.000000 25% 1.750000 50% 2.500000 75% 3.250000 max 4.000000 dtype: float64 其次, pandas Seri...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
2020/12/23 10:42

DATAFRAME之后 为啥最后一行数据会多出一行0?

代码

1
0
2019/03/04 13:00

Python3.7下载numpy在win7系统上需要注意什么问题吗

安装不了

1
0
发表于软件架构专区
2018/12/04 17:40

pandas替换列名必须列数相同么?

本人使用pandas.read_csv()读取一个csv文件内容获取得到一个datafame 当我想替换列名的时候我尝试使用传参 opcsv=pandas.read_csv(f,header=0,dtype={'code':str},names=names) 获得一个报错 Traceback (most recent call last): File "C:/Users/Administrator/Desktop/computerXP/upEXdate.py", line 74, in <module> openfile(inputdir) File "C:/Users/Administrator/Desktop/computerXP/upEXdate.py", line 19, in openf...

13
0
2018/01/18 13:12

pandas 数据清洗填充数据

A B 1 2 3 4 5 6 7 pandas.ffill()是用同一列的上一条记录填充下一条,即用2填充B列中空白部分,可是我想用3去填充空白部分,我该怎么写啊,应该调用什么方法啊

1
0
发表了问答
2016/06/10 16:12

Python Pandas模块如何进行追加保存(不覆盖源数据)?

请教一个问题,Pandas模块编辑excel时如何进行追加保存。 默认的df.to_excel会直接在原有工作表中添加新数据,覆盖掉之前的。哪怕指定添加的列是空的也不行。 我已经详细看了官方文档:http://pandas.pydata.org/pandas-docs/stable/io.html#io-excel-writer http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_excel.html 小弟英文水平有限,没研究出来可行的方法,求大神指点。...

2
0
发表了问答
2016/07/07 22:51

Pandas如何将DataFrame按列分组构成新的DataFrame?

初始的DataFrame是这样的: 我想形成这样的: 这个是通过调用gruoupby().first()形成的,但不是完整的DataFrame。

5
0
发表了问答
2017/05/25 17:19

Pandas的两个dataframe合并遇到了问题。

例如第一个dataframe:(3个) A B 1 5 2 6 3 7 第二个dataframe:(3个) Me a b c 现在我想让这两个dataframe合并,结果是 A B Me (9个) 1 5 a 1 5 b 1 5 c 2 6 a 2 6 b 2 6 c 3 7 a 3 7 b 3 7 c 该怎么办?

1
0
发表了问答
2017/01/22 10:59

在python中的表格如何判断删除两列同一行都为空值的整个行?

在python中的表格如何判断删除两列同一行都为空值的整个行?如下表,我只想删除像第一行这样两个列都为空值的,只有一个列为空值的不要删除 a b c 1 4 4 3 4 3 6 6

2
0
发表了问答
2016/11/25 20:13

pyhton 二分K均值聚类之后怎么给每一个记录贴上聚类的标签

用NUMPY把数据转换成矩阵,然后取出第一列(id)作为标识,然后经行聚类,最终聚类结果可以得到,但是怎么样将每一行数据在哪个类中进行记录呢? 这是二分K均值的源码,求大神教我

1
0
发表了问答
2016/03/22 14:52

pandas可否一次性读取多个文件并合并到一起

请问各位大神,在使用python过程中,想尝试pandas可否一次性读取多个文件并合并到一起,如下代码,一直未调试出来,请问是否pandas可以一次性读取多文件还是用其他方法 import pandas as pd import os listfile=os.listdir(r'D:\ben.qin\python\2012') for i in listfile df=pd.read_csv(listfile[i],encoding='gbk')...

5
1
发表了问答
2016/01/10 21:42

python2.7读取DataFrame中的中文出现问题

name industry area pe outstanding code 000001 平安银行 银行 深圳 7.51 1180405.50 .... 比如上面的df,我读取平安银行,df.loc['000001','name'] 却得到'\xe5\xb9\xb3\xe5\xae\x89\xe9\x93\xb6\xe8\xa1\x8c' 我也试了用encode,decode各种转,但是就是转不成中文... 我用的是python2.7,windos7...

6
0
发表了问答
2015/04/30 16:21

利用python写一个炒股程序

在一个网站看到如何写炒股策略,拿来和大家分享分享. 源地址: https://app.wmcloud.com/mercury/community/share/554051bbf9f06c1c3d687fac 技术分析入门 —— 双均线策略 本篇中,我们将通过技术分析流派中经典的“双均线策略”,向大家展现如何在量化实验室中使用Python测试自己的想法,并最终将它转化为策略! 1. 准备工作¶ 一大波Python库需要在使用之前被导入: matplotlib用于绘制图表 numpy时间序列的计算 pandas处理结构...

1
12
发表了问答
2015/04/08 18:53

HDF 文件解析遇到无法打开文件

File "hdf5extension.pyx", line 477, in tables.hdf5extension.File._g_new (tables/hdf5extension.c:4774) tables.exceptions.HDF5ExtError: HDF5 error back trace File "H5F.c", line 606, in H5Fopen unable to open file File "H5Fint.c", line 1089, in H5F_open unable to read superblock File "H5Fsuper.c", line 277, in H5F_super_read file signature not found End of HDF5 error back trace 成功安装 tables hdf...

1
0
发表了问答
2015/04/08 14:29

成功安装tables import tables 出错

>>> import tables Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib64/python2.6/site-packages/tables/__init__.py", line 82, in <module> from tables.utilsextension import ( ImportError: libhdf5.so.6: cannot open shared object file: No such file or directory 求意见...

1
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
2 评论
85 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部