【Python】人口動態統計のExcelデータから出生数・死亡数だけを取得してみた

この記事をシェアする

 

はじめに

エクセルデータを取り扱うことが多いと思うので、今回はPythonを使用してExcelデータを抜き取ってきたいと思います。

今回使用するExcelデータは厚労省の「人口動態統計」です。

www.mhlw.go.jp

f:id:Medicmed:20180609210324p:plain

データを開くとこのような形になっています。

今回は都道府県別で男女別の出生数と死亡数のデータを扱います。

 

 

ターミナルを起動させよう!

f:id:Medicmed:20180609210646p:plain

今回もnanoエディタでPythonコードを書いていきたいと思います。

 

 

完成したコードがコチラ!

f:id:Medicmed:20180609210833p:plain

PythonExcelデータを扱うには"openpyxl"モジュールを使用していきます。

anacondaを使用しているひとは既に入っていると思います。

今回は取得してきたデータを'popu.py'というPythonデータで保存しています。

こうすることでPythonを走らせているときに今回取得してデータが利用できるからです。

ということで、作ったプログラムをターミナルで実行してみます。

 

プログラムを実行!

f:id:Medicmed:20180609211411p:plain

ちゃんとプロンプトが返ってきているので、"popu.py"ファイルが無事に作成されています。

テキスト形式で保存してあるとため、中身を確認してみます。

f:id:Medicmed:20180609211616p:plain

辞書型で、都道府県別の出生数・死亡数が男女別でちゃんと取得できていることが確認できました。

Pythonを使用すると、ワンクリックでデータ取得が可能になりました。

Python凄い()

ターミナルでPythonを起動させて、作成した"popu.py"をインポートします。

このように「import popu」としてインポートすることができます。

"all_data"という属性に取得したデータが格納されているので、出力するとこのようになります。

f:id:Medicmed:20180609211932p:plain

このままだと、分かりにくいので、

f:id:Medicmed:20180609212203p:plain

このように見やすい形で出力することもできます。

「東京」のデータを取り出したいと思った時には、このようにすると欲しいデータを取得することができます。

f:id:Medicmed:20180609212644p:plain

 

ぜひ参考にしてみてください。

終わり。

 

 

合わせて読みたい記事!

www.medicalmed.press

www.medicalmed.press

www.medicalmed.press

www.medicalmed.press

 

今回参考にした書籍はコチラ!
退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング