kaggle

kaggle定番のタイタニックから勉強する

スポンサーリンク

今更こんなの書いても

そう思いつつも定着にはいくらか必要な気がする。

覚書き

意味のある特徴量を作って検証しつつ。submitして成果を確認していく。
タイタニックはデータが軽いが本当のコンペはかなり重い。気軽な提出ができるか否か。
pandasはすごいseabornもすごい
Fareを特徴量として、Survivedを確認したかったがなかなかできなかった。
sns.catplot(x=”Fare”, hue=”Survived”,data=data, kind=”count”,height=4, aspect=7)
にてひとまずそれっぽく有意な差が見えた。
LightGBMはすごそうだがよくわからない。機械学習アルゴリズム自体よくわからんが。
コードが増えてくると再開した際などに選んでる行まで一括で実行したい場面がある。その場合はRun→beforeRunで選んでいるところの前まで一気に実行できる

現状

ベストスコアが0.67辺りから一気に0.77272までいった。1の人が無茶苦茶多いので上位はみんな1なんだと思ったが、上位500位くらいまでだった(過去5か月のランキング?)ひとまず0.8くらいまで伸ばしたい。

コメント

タイトルとURLをコピーしました