とりあえず、何か自分の中で整理していかないと、進まない気がする。
ある程度何らかのソフトウェア開発経験があれば、スムーズに理解できるのかもしれないが、あまりにもわからないことだらけのため、系統建てて整理しないと前に進んでいる気がしない。また、方向性や目標に向けステップを細かく踏んでいかないとちょっと達成できる気がしないというか、ランクの障障壁が大きいというか、まずスタート地点に立つ(コンペでひとまずsubmitする)ことができない。まあ昨日まではこのスタートすらわかっていなかったのですが…
自分の中でのkaggleの理解と誤解
世の中の実際にある課題を機械学習によって解決する。そのための良いモデルを作成し、競う。0から作成していく必要があるのかと思っていたが、終了近いものは先人の作ったものが使えるらしい。使うだけである程度の順位に行けるものなのだろうか?ひとまず試してみたい。
コードで提出するコンペと成果物で提出するコンペがあるようだ。2021/05/12現在ちょうど終了まで3週間ほどのコンペが二つあり片方がコード、片方が成果物のよう。
kaggleと実務の違い
このスライドがわかりやすい。うちの偉い人たちはここら辺考えているのだろうか?
API:Application Programming Interface ソフトウェア同士でやり取りするためのプログラム
PoC:Proof of Concept 概念の検証。当初検討していた理論があっていたかの検証
デプロイ:deploy ソフトを実際使える状態にする
kernelで提出し、ひとまずランキングに載ってみる
コードの方に登録し、最もvoteの多く、スコアが高いnoteをcopy and editしてそのままsubmitした。同じ得点に150人くらい(参加者の25%)が並んでいるが、上位は異次元のスコアをたたき出している。あとデータが重い(40GB)。1点上がればブロンズ圏内(実質は提出順の関係もありそうなので2点?)と見た目には近いが、じゃあどうすればこのkernelもしくはこれを参考にしつつ自力で2点あげれるのかはわからないというより凄まじく絶壁であろう(ブロンズ圏内なら何らかの裏技もある気はするが、それは機械学習を勉強という意味はない)
これからやること
①コンペのkernelが何をやっているのかを理解する。(⓪何やってるコンペなのか理解する)
②kaggleでの立ち回りと、機械学習の流れを理解する。
⓪このコンペで何をやっているのか(参加したのはBirdCLEF 2021 – Birdcall Identification)
ぱっと見とつたない英語力では鳥の鳴き声を分類して何の鳴き声か当てるぽい。あってました(deepl翻訳すごいですね)
コメント