Dragon Arrow written by Tatsuya Nakaji, all rights reserved animated-dragon-image-0164

Kaggle 住宅価格予測 (回帰分析)

updated on 2019-10-10

Kaggle 住宅価格予測 (回帰分析)


環境


python 3.7.3

pandas 0.25.1 (数表や時系列データを操作するためのライブラリ)

matplotlib 3.0.3 (グラフ描画の為のライブラリ)

グラフの種類

  • 折れ線グラフ
  • 散布図
  • ヒストグラム
  • ヒートマップ
  • 3Dグラフ

seaborn 0.9.0 (Matplotlibの機能をより美しく、またより簡単に実現するためのライブラリ)

グラフの種類

  • 折れ線グラフ
  • 散布図
  • ヒストグラム
  • ヒートマップ

numpy 1.16.3 (Pythonにおいて数値計算を効率的に行うためのライブラリ)

scikit-learn '0.21.3' (Pythonのオープンソース機械学習ライブラリ。 Pythonの数値計算ライブラリのNumPyとSciPyとやり取りするよう設計されている)


データセット


Kaggleが提供しているデータセットを使用します。

ダウンロード先のurlを掲示しておきます。

https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data


モデル作成



(真下にjupyter notebookが表示されてなかったらリロードしてください)

最後に


スコアはどうやら、対数平均二乗誤差(RMSLE)のようなので、この値が0に近ければちかほど、良いモデルが作れたということになります。

変数を正規化したり、回帰分析でしようする変数の数をもっと増やすなど、改善の余地はまだまだありますが、今回の提出結果は4453位/4612でした。