Pandas

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索
Pandas
作者 The PyData Development Team
開発元 コミュニティ開発
最新版 0.19.2 / 2016年12月24日(9か月前) (2016-12-24
リポジトリ https://github.com/pydata/pandas, https://github.com/pydata/pandas.git
プログラミング言語 Python
対応OS クロスプラットフォーム
種別 数値計算統計
ライセンス BSDライセンス
公式サイト http://pandas.pydata.org/
テンプレートを表示

Pandasは、プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する。PandasはBSDライセンスのもとで提供されている。

特徴[編集]

  • データ操作のための高速で効率的なデータフレーム (DataFrame) オブジェクト
  • メモリ内のデータ構造とその他のフォーマットのデータ間で相互に読み書きするためのツール群。フォーマット例: CSV、テキストファイル、Excel、SQLデータベース、HDF5フォーマットなど
  • かしこいデータのアライメントおよび統合された欠損値処理
  • データセットの柔軟な変形およびピボット
  • ラベルに基づいたスライス、fancyインデクシング、巨大なデータセットのサブセット取得
  • データセットに対するsplit-apply-combine操作を可能にするエンジンが提供するpowerful groupを使ったデータの集計および変換
  • 高性能なデータセットのマージと結合
  • 時系列データ: 日付範囲生成、周波数変換、移動窓を用いた統計値や線形回帰、シフトと遅延、など
  • パフォーマンスのための高度な最適化。重要なコードはCythonまたはC言語で実装されている。

歴史[編集]

開発者 Wes McKinney は、財務データの定量分析を実行するための高性能で柔軟なツールの必要性から、AQR Capital Managementにて2008年にPandasを開始しました。 AQRを去る前に、彼は管理人にライブラリを公開するように説得することができました。

他のAQR従業員の Chang She は、2012年にこのライブラリの第2の主要貢献者として取り組みました。同時期に、Pythonコミュニティでライブラリが普及し、さらに多くのコントリビューターがプロジェクトに加わりました。

関連項目[編集]

参考文献[編集]


外部リンク[編集]