はじめに

SIGNATEの練習問題：手書き文字認識をDataikuでやってみました。

URL：https://signate.jp/competitions/100

本記事では、Dataikuを使用して、ノーコードで手書き文字認識を行うための実装手順について解説します。

概要

手書き数字の画像データに対して、10種類のラベルの1つを割り当てるモデルを作成する

データ

種別：画像
サンプル数：60,000

使用データ(データのダウンロードはこちら)

学習用画像データ
学習用画像データとラベルIDの対応表
評価用画像データ

評価指標

正解率(Accuracy)

投稿方法

１列目に評価用画像データのファイル名、２列目に予測したラベルIDを記入したファイル。
ヘッダなしの.tsv形式で提出。

使用するレシピ

Visual recipes

List Folder Contents：フォルダー内のファイルパス、ファイル名などを取得

Prepare：様々なデータ処理が可能

Concatenate columns：指定した列をConcatする

Join：結合

Lab

Image Classification：画像分類

Other receipes

Score：testデータに対するスコアリング

使用するモデル(Image Classification)

畳み込みニューラルネットワーク(CNN)を用いて、画像分類を行いました。

<CNNとは?>

主に、畳み込み・プーリング・全結合という３つの層からなり、画像分類の際に用いられます。

畳み込み
画像の小さな領域ごとに特徴を抽出します。(例：色、形、模様など)

プーリング
抽出した特徴を圧縮して、データのサイズを小さくします。

全結合
画像が何を表しているか判断し、分類します。

ハンズオン

前準備

Folderの作成

DATASETからFolderを選択して、train用とtest用のFolderをそれぞれ作成します。

Folderへのデータ追加

作成したFolderに、それぞれtrainデータとtestデータを加えます。 train_Folder：train.zip

test_Folder：test.zip

Folder Contentsの取得

それぞれのFolderに対して、List Folder Contentsレシピを用いてpath情報などを読み込みます。まず、List Folder Contentsを選択します。

次に、再度List Folder Contentsを実行します。

出力結果：train_folder_files

train_masterの読み込み

DATASETの「Upload your files」からtrain_masterを読み込みます。

実装

train_masterとの結合処理

train_Folder内の.pngファイルに対して、train_masterを結合しCategory_idを付与します。（※Prepareレシピを用いて、結合句を作成します。train_masterのfile_name列は「ファイル名+.png」のため、その形式に整形する必要があります。）まず、Concatenate columnsを用いて「ファイル名+.png」の値を作成します。

column to concatenate：basename、extension
Delimiter to use：.
Output column：file_name

出力結果：train_folder_files_prepared

Joinレシピによる結合

Joinレシピを用いて、train_folder_files_preparedとtrain_masterを結合します。

Join設定

Left：train_folder_files_prepared(file_name)
Right：train_master(file_name)
How：内部結合

出力結果

最終出力：train_folder_files_joine

LabによるImage Classificationでのモデル構築

LabのImage Classificationを用いて、画像分類モデルを構築

まず、Labをクリックします。

次に、Image Classificationを選択します。

Image Classificationの設定

select target：category_id
Image folder：train_Folder

Basic設定（Target設定）

*filter displayed classesを選択すると、category_id毎にフィルターをかけることができます。（例：3でフィルター）

Train（データ量が多いためサンプリングしています）

Summary画面

EXPLAINABILITY：Confusion matrix

デプロイ

作成したモデルをデプロイ

まず、DEPLOYをクリックします。

次に、CREATEをクリックします。

Scoreを選択します。

Input dataset、Managed folderを選択して、CREATE RECIPEをクリックします。

最後に、RUNをクリックします。

出力結果：test_folder_files

提出

提出する列の絞り込み

まず、Prepareをクリックします。

次に、Concatenate columnsを用いて「ファイル名+.png」の値を作成します。

column to concatenate：basename、extension
Delimiter to use：.
Output column：file_name

不要な列を削除します。

出力結果：test_folder_files_scored_prepared

Export

Export処理を実行します。

次に、DOWNLOAD設定を行います。

Format：csv(*.csv)
Separator：\t
With header：チェックを外す

最後に、ファイル名を.tsvに変更して保存します。

SIGNATEでの提出

提出するファイルを選択して、投稿をクリックします。

スコアの確認

結果として、46％の手書き数字を正しく分類するモデルをノーコードで作成することができました。

改善案

モデルを構築する際に、Data Augmentationタブで以下の項目を変更すると、精度向上につながる可能性があります。

Color：色の拡張を有効にする（色相、コントラスト、明るさを変更）
Affine：画像の反転を適用
Crop：画像をランダムに切り抜く

また、トレーニングデータはサンプリングして使用していましたが、データ量を増やすことでさらなる精度向上が期待できると思います。

その他、クラスリバランスを行い、全ての数字が教師データに均等に含まれるようにするなど、試すことができることはたくさんあります。

感想

Dataikuで画像分類モデルを完全ノーコードで構築できるため、コーディングするよりも簡単に実行できます。特に初学者にとっては、手軽に機械学習を体験できる点が魅力だとおもいます。

今回の全量データでモデルを構築する際、インストール版では約2日かかりました。そのため、モデル構築の際にTrainingタブのPretrained modelでEfficientNet B0を選択したり、Cloud版を利用することで、学習時間を短縮できるかもしれません。

画像分類は、物体検知や顔認証、部品の異常検知などの様々な業務に応用可能な分野です。

みなさまもこの記事をきっかけに、Dataikuで画像分類を試してみてはいかがでしょうか？

【Dataiku】手書き文字画像認識をノーコードでやってみる