Pandas v0.15.0 final 发布,此版本现已提供下载,主要是大量的 API 改进,一些新特性,功能增强和性能提升,还有大量的 bug 修复,具体更新内容如下:
Drop support for numpy < 1.7.0
The
Categorical
type was integrated as a first-class pandas typeNew scalar type
Timedelta
, and a new index typeTimedeltaIndex
New DataFrame default display for
df.info()
to include memory usageNew datetimelike properties accessor
.dt
for SeriesSplit indexing documentation into
Indexing and Selecting Data
andMultiIndex / Advanced Indexing
Split out string methods documentation into
Working with Text Data
read_csv
will now by default ignore blank lines when parsingAPI change in using Indexes in set operations
Internal refactoring of the
Index
class to no longer sub-classndarray
dropping support for
PyTables
less than version 3.0.0, andnumexpr
less than version 2.1
更多内容请看 Whatsnew。
Python Data Analysis Library 或 pandas 是连接 SciPy 和 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Comma-separated values (CSV) 文件表示在有关各方之间分发数据的最常见的方法之一。Pandas 提供了一种优化库功能来读写多种文件格式,包括 CSV 和高效的 HDF5 格式。