python機械学習画像認識

妻か私かの2択の画像認識プログラム②

スポンサーリンク

あれから9か月がたったらしい

kaggleに取り組みだしたこともあり、一番最初のそれっぽく作りたかったものである画像認識を今回強化することとした。

現状と課題

 過去の記事がこちら。本番検証用の写真11枚中8枚正解というのは実質ほとんど上限で、残り3枚はまず当てようがないというか訓練時に見たこともかすりもしないデータの為、さすがにこれが当てれれば優秀だがさすがにという3枚だった。
 課題としては
①運よくできた学習モデル
数百回と回して、良かった回のモデルを使った。再現性と、安定感がない
②単純なモデル
俗にいうニューラルネットワークが使ってみたい
③画像の加工が手動
本気でめんどくさい。
④2択より多くしたい
娘も生まれたので3択にしたい

進捗 

②単純なモデルの改修はそこらのサンプル的なニューラルネットワークを拾ってくることですぐにできた。kerasすごいな
③についてはopenCVで画像認識のライブラリを用いて顔を自動判定してトリミングしようかと思ったが、検索した上位リンクが参照するものが8年前の物の為、日進月歩のこの業界だし最新のものが使いたいなと思い、retinafaceというものを利用した。これは強力で、向きが横向いてようと90度回転していようと検出してくれる。
引っかかったのはトリミングのところだが、
image=image[bbox[1]:bbox[3],bbox[0]:bbox[2]]
とすることでトリミングできた。順番がわかりにくい。

コメント

タイトルとURLをコピーしました