updated on 2019-10-10
python 3.7.3
pandas 0.25.1 (数表や時系列データを操作するためのライブラリ)
matplotlib 3.0.3 (グラフ描画の為のライブラリ)
seaborn 0.9.0 (Matplotlibの機能をより美しく、またより簡単に実現するためのライブラリ)
numpy 1.16.3 (Pythonにおいて数値計算を効率的に行うためのライブラリ)
scikit-learn '0.21.3' (Pythonのオープンソース機械学習ライブラリ。 Pythonの数値計算ライブラリのNumPyとSciPyとやり取りするよう設計されている)
Kaggleが提供しているデータセットを使用します。
ダウンロード先のurlを掲示しておきます。
https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data
(真下にjupyter notebookが表示されてなかったらリロードしてください)
スコアはどうやら、対数平均二乗誤差(RMSLE)のようなので、この値が0に近ければちかほど、良いモデルが作れたということになります。
変数を正規化したり、回帰分析でしようする変数の数をもっと増やすなど、改善の余地はまだまだありますが、今回の提出結果は4453位/4612でした。