kaggle定番のタイタニックから勉強する

kaggle

2021.05.132021.05.16

今更こんなの書いても

そう思いつつも定着にはいくらか必要な気がする。

覚書き

意味のある特徴量を作って検証しつつ。submitして成果を確認していく。
タイタニックはデータが軽いが本当のコンペはかなり重い。気軽な提出ができるか否か。
pandasはすごいseabornもすごい
Fareを特徴量として、Survivedを確認したかったがなかなかできなかった。
sns.catplot(x=”Fare”, hue=”Survived”,data=data, kind=”count”,height=4, aspect=7)
にてひとまずそれっぽく有意な差が見えた。
LightGBMはすごそうだがよくわからない。機械学習アルゴリズム自体よくわからんが。
コードが増えてくると再開した際などに選んでる行まで一括で実行したい場面がある。その場合はRun→beforeRunで選んでいるところの前まで一気に実行できる