ディープラーニングG検定を取得し、現在Pythonという言語を用いて
ディープラーニングを使った画像識別に挑戦しています。
本記事では画像認識手法についてまとめてみましたので、
それぞれの手法の特徴を紹介します。
手法 | 分類 | 分類(アノマリー検出) | 物体検出 | 領域抽出 |
---|---|---|---|---|
特徴 | 画像ごとに被写体が何か識別 | 少数画像で評価できる 普段と違うものが写っている場合に検知したい時 |
物体検出結果を矩形や球形で表示 | 領域検出結果を様々な色の濃淡で表示可能 |
メリット | 画像の準備はとてもシンプルで、簡単に導入できる | たくさんの画像を用意する必要が無い | 一枚の画像に複数の対象が写っていても分類可能 位置情報を扱える |
画像のピクセルサイズで識別可能、領域抽出後に数値解析で大きさなどもわかる |
主な用途 | 検査工程の仕分け、商品検索 | 検査工程、異常検知 | 顔認証、防犯、無人コンビニ、 医療、農業、自動運転 等 |
医療、農業、自動運転 等 |
■特徴:
・ 画像ごとに被写体が何か識別
分類のイメージはこちらの記事を参考にしてください。
■メリット
・ 画像の準備はとてもシンプルで、簡単に導入できる。
⇒ 猫、犬、馬など分類したい画像をひたすら集めるて分けて準備するだけ
■デメリット
・ 1枚の写真の中に猫と犬が写っていた場合に対応できない
⇒ 他に物体は無い?、正解が猫だった場合に・・別の猫はいない?
といったように複雑な画像の場合に対応できない場合があります。
■特徴:
・ 少数画像で評価できる、普段と違うものが写っている場合に検知したい時
(⇒ この例ではヒビの画像も学習させています)
■メリット
・ たくさんの画像を用意する必要が無い。
・ 分類では各種類の画像をそれぞれ大量に準備する必要がある。
⇒ 検査工程での不良など、普段ほとんど発生しない・どんな不良が発生するか、わからない場合に良い
異常検出の分野でよく使用されている
■デメリット
・境界を引くのが難しい(1種とそれ以外の判断は人が閾値を決めてやることが必要)
・1枚の写真の中に猫と犬が写っていた場合に対応できない
⇒ 他に物体は無い?、正解が猫だった場合に・・別の猫はいない?
といったように複雑な画像の場合に対応できない場合があるので注意が必要です
■特徴:
・ 物体検出結果を矩形や球形で表示
クラス分類結果も表示するのが一般的
■メリット
・ 一枚の画像に複数の対象が写っていても分類可能
⇒ 優れた物体認識CNNに位置情報を扱う機能を付与することで分類+位置情報を扱える
■デメリット
・ 学習時にひと工夫必要
⇒ データセット作成ツールの使用がおすすめ
■特徴:
・ 領域検出結果を様々な色の濃淡で表示可能。
クラス分類結果も表示するのが一般的
■メリット
・ 一枚の画像に複数の対象が写っていても分類可能
⇒ 画像のピクセルサイズで識別可能、領域抽出後に数値解析で大きさなどもわかる
■デメリット
・ 学習時にひと工夫必要(ピクセル単位で答えを教える必要あり)
⇒ データセット作成ツールの使用がおすすめ
こちらの記事でディープラーニングに関する知識を勉強した参考書を
紹介しています。ぜひ読んでいってください。