「Pandas」の版間の差分
削除された内容 追加された内容
en:Pandas (Software) (14:39, 3 October 2014 UTC) の一部を翻訳 |
(相違点なし)
|
2014年11月18日 (火) 08:35時点における版
作者 | The PyData Development Team |
---|---|
開発元 | コミュニティ開発 |
最新版 |
0.15.1
/ 2014年11月8日 |
リポジトリ | |
プログラミング 言語 | Python |
対応OS | クロスプラットフォーム |
種別 | 数値計算、統計 |
ライセンス | BSDライセンス |
公式サイト | http://pandas.pydata.org/ |
Pandasは、プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する。PandasはBSDライセンスのもとで提供されている。
特徴
- データ操作のための高速で効率的なデータフレーム (
DataFrame
) オブジェクト - メモリ内のデータ構造とその他のフォーマットのデータ間で相互に読み書きするためのツール群。フォーマット例: CSV、テキストファイル、Excel、SQLデータベース、HDF5フォーマットなど
- かしこいデータのアライメントおよび統合された欠損値処理
- データセットの柔軟な変形およびピボット
- ラベルに基づいたスライス、fancyインデクシング、巨大なデータセットのサブセット取得
- データセットに対するsplit-apply-combine操作を可能にするエンジンが提供するpowerful groupを使ったデータの集計および変換
- 高性能なデータセットのマージと結合
- 時系列データ: 日付範囲生成、周波数変換、移動窓を用いた統計値や線形回帰、シフトと遅延、など
- パフォーマンスのための高度な最適化。重要なコードはCythonまたはC言語で実装されている。
関連項目
- 数値解析ソフトウェア
- NumPy - Python用の数値計算ライブラリ
- SciPy - NumPyを基盤にした科学計算ライブラリ
- statsmodels
- matplotlib - NumPyを基盤にしたグラフ描画ライブラリ
参考文献