【GCP】Cloud AutoML Visionでポケモンの画像を学習させてみた（モデル作成編）

2020年4月12日

画像をCloud Storageへアップロード

Cloud Storageの作成

バケットに名前を付けます。
バケット名の形式は、$PROJECT_ID-vcm にする必要があり、
例えば「something-project-id-vcm」といった感じになります。
データのデフォルトのストレージクラスは「Standard」にします。

画像をアップロードする際に「gsutil のリンク」の情報が必要になります。

画像のアップロード

下記のコマンドで画像をアップロードできます。

gsutil -m cp -r [アップロード元] gs://[gsutil のリンク]/[アップロード先]

例えば、

gsutil -m cp -r "C:\temp\images" gs://something-project-id-vcm/images

という感じになります。
今回はポケモン1匹に対して約500枚の画像（計75000枚）をアップロードして、約70分程掛かりました。

正解ラベルの作成

画像に対して正解ラベルを定義するファイルを作成してあげる必要があります。
今回は以下のようにしました。

gs://something-project-id-vcm/images/1/1.png,1
gs://something-project-id-vcm/images/1/2.png,1
gs://something-project-id-vcm/images/2/1.png,2
gs://something-project-id-vcm/images/2/2.png,2
...
gs://something-project-id-vcm/images/151/1.png,151
...

imagesの次の数字がポケモンの図鑑Noでフォルダ分けしています。
1：フシギダネ、2：フシギソウ…
カンマの次の数字が正解ラベルです。ここも図鑑Noです。
以下のようなバッチファイルを作っておくと正解ラベルを作るのが楽になります。

gsutil ls gs://something-project-id-vcm/images/1 >> "C:\temp\label.txt" && ^
gsutil ls gs://something-project-id-vcm/images/2 >> "C:\temp\label.txt" && ^
...
gsutil ls gs://something-project-id-vcm/images/151 >> "C:\temp\label.txt"

作成した正解ラベルのcsvはCloud Storageにアップロードします。