pandasは、「リレーショナル」または「ラベル付き」データを簡単かつ直感的に操作できるように設計された、高速で柔軟で表現力豊かなデータ構造を提供するPythonパッケージです。これは、Pythonで実用的な実世界のデータ分析を行うための基本的な高レベルのビルディングブロックになることを目的としています。さらに、あらゆる言語で利用できる最も強力で柔軟なオープンソースデータ分析/操作ツールになるという幅広い目標があります。すでにこの目標に向かって順調に進んでいます。
パンダが得意とすることのほんの一部を次に示します。
NaN( 、、、
NAまたはとして表される )を簡単に処理できます。
NaT
Seriesなど
DataFrameが計算でデータを自動的に整列させることができます。
ソースコードは現在、GitHubの https://github.com/pandas-dev/pandasでホストされています。
最新リリースバージョンのバイナリインストーラーは、Python Package Index(PyPI)およびCondaで入手できます。
# conda
conda install pandas
# or PyPI
pip install pandas
必須、推奨、およびオプションの依存関係のサポートされている最小バージョンについては、完全なインストール手順を参照してください。
ソースからパンダをインストールするには、上記の通常の依存関係に加えてCythonが必要です。CythonはPyPIからインストールできます。
pip install cython
pandasディレクトリ(gitリポジトリのクローンを作成した後にこのファイルを見つけたのと同じディレクトリ)で、次のコマンドを実行します。
python setup.py install
または開発モードでインストールする場合:
python -m pip install -e . --no-build-isolation --no-use-pep517
がある場合は
make、を使用
make developして同じコマンドを実行することもできます。
または代わりに
python setup.py develop
ソースからインストールするための完全な手順を参照してください。
公式ドキュメントはPyData.orgでホストされています:https ://pandas.pydata.org/pandas-docs/stable
作業は2008年にAQR
pandas(定量的ヘッジファンド)で開始され、それ以来活発に開発されています。
使用法に関する質問については、StackOverflowにアクセスするのが最適です。さらに、一般的な質問やディスカッションは、pydataメーリングリストでも行うことができます。
ほとんどの開発ディスカッションは、このリポジトリのGitHubで行われます。さらに、pandas-devメーリングリストは、専門的なディスカッションや設計の問題にも使用でき、Gitterチャネルは、開発に関連する迅速な質問に利用できます。
すべての貢献、バグレポート、バグ修正、ドキュメントの改善、機能強化、およびアイデアを歓迎します。
貢献する方法の詳細な概要は、貢献ガイドにあります。
単にパンダのコードベースでの作業を開始したい場合は、GitHubの[問題]タブに移動して、興味深い問題の調査を開始してください。ドキュメントの下にリストされている多くの問題と、あなたが始めることができる良い最初の問題があります。
また、バグレポートの複製や、バージョン番号や複製手順などの重要な情報の要求などの問題を切り分けることもできます。トリアージの問題を開始したい場合、開始する簡単な方法の1つは、CodeTriageでパンダをサブスクライブすることです。
または、パンダを使用することで、自分のアイデアを持っているか、ドキュメントで何かを探していて、「これは改善できる」と考えているかもしれません...あなたはそれについて何かをすることができます!
メーリングリストまたはGitterで気軽に質問してください。
このプロジェクトの貢献者および維持者として、あなたはパンダの行動規範を遵守することが期待されています。詳細については、次のURLをご覧ください。貢献者の行動規範