Python 学習:pandas って?

2014-05-27 :  PCクリニック
本文の前に、
-・・・ -・-
現時点での、blogramのランクインカテゴリは、
3、3、2、1、0、 0、0、0、0、0(39)で、換算ポイント 70pt 。
「グルコサミン」昨日昼前、1位に返り咲き。
「Python」今朝方、2位にダウン。
・-・ - -・

さて、本文。

「Web Analytics or Die」なるブログの過去記事:
Pythonデータ解析ライブラリpandasと遊ぶ:クロス集計~・・・
で、“pandas”なるものを見つけた。

  PythonでRっぽいことができるpandas

  Pythonにはpandasという素敵なライブラリがあります。
  pandasを簡単に言うと、PythonにRのデータフレームのような型を
  持たせるライブラリです。
  これによって、行列計算が劇的に楽になり、
  これまでRでやっていたような集計作業がPythonでも楽にできるようになります。
  詳しくは公式ページをどうぞ

  http://pandas.pydata.org

  RでできるならRでやればいいじゃん、という意見はもっともですが、
  Pythonを使うことによるメリットも当然あります。
  最も大きなメリットは、データクリーニングから集計・分析までPythonのみで
  実施できるという点です。データクリーニングに必要なテキスト処理などの
  地道な作業はPythonの方が得意です。当然、データベースからデータを抽出し、
  加工することもPythonなら普通にできます。
  もちろん、Rでもできることはできますが、Pythonほど便利ではありません。
  地味なメリットとしては計算が早いという点です。
  ベンチマークをとったわけじゃないですが、体感的にはpandasで集計した方が
  かなり早いです。というのも、pandasでは裏でnumpyを利用しており、
  このnumpyはC言語で書かれています。
  また、公式サイトやオライリー本を読む限り、かなり最適化を行なっているようです。

等々、・・・・・

2ヶ月前(2014-03-19)の記事:
WinPython x86 版 入れてみた
で、「WinPython」に含まれるパッケージを見ていたが、・・・

当時は、“pandas”なんて思いもよらないもの。

今調べてみたら「WinPython 2.7 win32」には、
「pandas-0.13.0.win32-py2.7.exe」が含まれている。


で、“pandas”とは、一言で云うと、・・・

  Rのデータフレームのような型を持たせるライブラリ

ですか?

それで、最初に参照したブログ記事にある、
  “pandasでクロス集計”
にある Python コードをコピー&ペーストし、
必要な“data.txt”をダウンロードさせて頂いた。

実行に問題はなかった。


でも、結論として
現状の<紙>は、使う予定が無さそう。
取り敢えずの「メモ」ですね。


本日はここまで。

Python 学習は続く、・・・



見ていただいた序でとは厚かましい限りですが、
お帰りに投票して頂けるとなお嬉しいです。 ⇒ blogram投票ボタン


140320
関連記事
スポンサーサイト

コメントの投稿

管理者にだけ表示を許可する

おきてがみ/blogram
blogram投票ボタン



おきてがみ

最新記事
カレンダー
09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
月別アーカイブ
カテゴリ
最新コメント
検索フォーム
リンク
プロフィール

<紙>

Author:<紙>
ようこそ。
「パソコンヲタクの雑記帳」
もろもろなことを綴っています。
パソコン ヲタクってねくら?
画像は kami でなく kani です。

カウンター(fc2、i2i) /Google Analytics


i2i(from 2010-08-24)
Total =
Today  =  
Yesterday=
アンチエイジング

Google Analytics
ブックマーク