pandas - Python用の柔軟で強力なデータ分析/操作ライブラリ。Rdata.frameオブジェクト、統計関数などに類似したラベル付きデータ構造を提供します。

(Flexible and powerful data analysis / manipulation library for Python, providing labeled data structures similar to R data.frame objects, statistical functions, and much more)

Created at: 2010-08-24 09:37:33
Language: Python
License: BSD-3-Clause


パンダ:強力なPythonデータ分析ツールキット

PyPI最新リリース コンダ最新リリース DOI パッケージステータス ライセンス Azureビルドステータス カバレッジ ダウンロード ギッター NumFOCUSを搭載 コードスタイル:黒 輸入:isort

それは何ですか?

pandasは、「リレーショナル」または「ラベル付き」データを簡単かつ直感的に操作できるように設計された、高速で柔軟で表現力豊かなデータ構造を提供するPythonパッケージです。これは、Pythonで実用的な実世界のデータ分析を行うための基本的な高レベルのビルディングブロックになることを目的としています。さらに、あらゆる言語で利用できる最も強力で柔軟なオープンソースデータ分析/操作ツールになるという幅広い目標があります。すでにこの目標に向かって順調に進んでいます。

主な特徴

パンダが得意とすることのほんの一部を次に示します。

  • 浮動小数点データおよび非浮動小数点データで欠落しているデータ
    NaN
    ( 、、、
    NA
    またはとして表される )を簡単に処理できます。
    NaT
  • サイズの可変性:列はDataFrameおよび高次元オブジェクトに挿入および削除できます
  • 自動および明示的なデータ整列:オブジェクトを一連のラベルに明示的に整列させるか、ユーザーがラベルを無視して、、
    Series
    など
    DataFrame
    が計算でデータを自動的に整列させることができます。
  • データの集約と変換の両方について、データセットに対して分割-適用-結合操作を実行するための強力で柔軟なgroupby機能
  • 他のPythonおよびNumPyデータ構造内の不規則で異なるインデックスのデータをDataFrameオブジェクトに簡単に変換できるようにします
  • インテリジェントなラベルベースのスライス派手なインデックス作成、および大規模なデータセットのサブセット化
  • データセットの直感的なマージ結合
  • データセットの柔軟な再形成ピボット
  • 軸の階層的ラベル付け(ティックごとに複数のラベルを持つ可能性があります)
  • フラットファイル (CSVおよび区切り文字)、Excelファイルデータベースからデータをロードし、超高速HDF5形式からデータを保存/ロードするための堅牢なIOツール
  • 時系列固有の機能:日付範囲の生成と頻度の変換、移動ウィンドウの統計、日付のシフトと遅延

入手先

ソースコードは現在、GitHubの https://github.com/pandas-dev/pandasでホストされています。

最新リリースバージョンのバイナリインストーラーは、Python Package Index(PyPI)およびCondaで入手できます。

# conda
conda install pandas
# or PyPI
pip install pandas

依存関係

必須、推奨、およびオプションの依存関係のサポートされている最小バージョンについては、完全なインストール手順を参照してください。

ソースからのインストール

ソースからパンダをインストールするには、上記の通常の依存関係に加えてCythonが必要です。CythonはPyPIからインストールできます。

pip install cython

pandas
ディレクトリ(gitリポジトリのクローンを作成した後にこのファイルを見つけたのと同じディレクトリ)で、次のコマンドを実行します。

python setup.py install

または開発モードでインストールする場合:

python -m pip install -e . --no-build-isolation --no-use-pep517

がある場合は

make
、を使用
make develop
して同じコマンドを実行することもできます。

または代わりに

python setup.py develop

ソースからインストールするための完全な手順を参照してください。

ライセンス

BSD 3

ドキュメンテーション

公式ドキュメントはPyData.orgでホストされています:https ://pandas.pydata.org/pandas-docs/stable

バックグラウンド

作業は2008年にAQR

pandas
(定量的ヘッジファンド)で開始され、それ以来活発に開発されています。

ヘルプを取得する

使用法に関する質問については、StackOverflowにアクセスするのが最適です。さらに、一般的な質問やディスカッションは、pydataメーリングリストでも行うことができます。

議論と開発

ほとんどの開発ディスカッションは、このリポジトリのGitHubで行われます。さらに、pandas-devメーリングリストは、専門的なディスカッションや設計の問題にも使用でき、Gitterチャネルは、開発に関連する迅速な質問に利用できます。

パンダへの貢献オープンソースヘルパー

すべての貢献、バグレポート、バグ修正、ドキュメントの改善、機能強化、およびアイデアを歓迎します。

貢献する方法の詳細な概要は、貢献ガイドにあります。

単にパンダのコードベースでの作業を開始したい場合は、GitHubの[問題]タブに移動して、興味深い問題の調査を開始してください。ドキュメントの下にリストされている多くの問題と、あなたが始めることができる良い最初の問題があります。

また、バグレポートの複製や、バージョン番号や複製手順などの重要な情報の要求などの問題を切り分けることもできます。トリアージの問題を開始したい場合、開始する簡単な方法の1つは、CodeTriageでパンダをサブスクライブすることです

または、パンダを使用することで、自分のアイデアを持っているか、ドキュメントで何かを探していて、「これは改善できる」と考えているかもしれません...あなたはそれについて何かをすることができます!

メーリングリストまたはGitterで気軽に質問してください。

このプロジェクトの貢献者および維持者として、あなたはパンダの行動規範を遵守することが期待されています。詳細については、次のURLをご覧ください。貢献者の行動規範