人工知能,

139 views

画像認識技術の定義や歴史や仕組みや機能について

さまざまなシーンでAI(人工知能)による画像認識が活用されています。 画像認識技術の定義や歴史や仕組みや機能について これから考えてみましょう。

画像認識とは?

画像認識

画像認識とは、画像から特徴をつかみ、対象物を識別するパターン認識技術の一つです。
画像データから対象物となる輪郭を洗い出し、背景から分離した上で特徴を抽出し、マッチングや変換を行い、目的となるオブジェクトや特徴を特定して認識する仕組みで、その対象物が何であるかを分析します。
たとえば、人間は猫などの画像を見れば、猫だと絶対に認識しているはずです。しかしながら、コンピュータはは人間のように記憶や経験を持っていませんので、コンピュータに「猫」の画像をただ見せても、コンピュータはそれを「猫」だと認識してくれません。


そこで、画像認識ではコンピュータにデータベースから大量の画像を与え、対象物の特徴をコンピュータに自動的に「学習」してもらいます。そうすると、コンピュータは画像データから猫の特徴を「理解」し、同じ特徴を持った画像が与えられれば、それを「猫」だと判断することができます。

画像認識の仕組み

画像認識の仕組み

ピクセル画像からモノを抽出


コンピュータが画像認識を行うためには、前段階として、画像から対象物を抽出する必要がある。

コンピュータは、画像データを「デジタル画像を構造する最小の要素となるピクセル単位情報の集合体」として捉えるため、ノイズだらけの混沌とした情報の中から対象物を認識しなければなりません。

画像認識では、ピクセル集合である画像データから、ある種のパターンを取り出し、そこから意味の読み取りをするという処理を通じて、画像に何が写っているかなどの特徴をコンピュータが理解してもらいます。

画像処理

画像認識の前に、コンピューターが画像を認識しやすくするために画像処理を行う。

画像処理は一般的に以下のような手順で行われる。

1.画像のノイズ/歪みなどを取り除く

2.明るさや色合いを調整

3.オブジェクトの輪郭を強調

4.領域抽出—画像からオブジェクトの領域を切り出す

領域抽出を行うことで、オブジェクトを一定の大きさで扱うことができるようになり、画像認識を行いやすくなります。
データベースを構築し、特徴のマッチングを利用して類似度を計算する等の方法です。

画像認識の歴史

像認識の歴史

画像認識のはじまり

もっとも古い画像認識としては、1940年代の「バーコード」があげられます。バーコード(英: barcode)は、縞模様状の線の太さによって数値や文字を表す識別子。数字、文字、記号などの情報を一定の規則に従い一次元のコードに変換し、レジスターなどの機械が読み取りやすいデジタル情報として入出力できるようにしています。これをバーコードスキャナと呼ばれる光学認識装置を使って読み取ります。見かけは画像と呼ぶにはシンプルすぎると感じるかもしれませんが、画像のパターンから情報を読み取っている点ではこれも立派な画像認識といえます。

画像認識技術の一般への普及:2000年以降

その後、1990年代の後半から2000年代にかけてデジタル機器の技術革新が進むと同時に

インターネットの普及を背景に画像認識技術も一般的な存在として幅広い範囲に応用されています。その実例が「デジタルカメラ」や「ネットでの画像検索」などです

画像認識技術のブレイクスルー「Deep Learning」の登場

そして画像認識の進化において歴史的となった出来事が2012年に起こります。世界的な画像認識のコンペティションである「ILSVRC(Imagenet Large Scale VisualRecognition)2012」で、トロント大学の研究チームが開発をした「Super Vision」というシステムが圧倒的な勝利を収めたのです。このコンペでは、対象物が何かをコンピューターが自動で判別、認識をする正答率を競うもので、1000万枚の画像データから、15万枚の画像を使用して実施されました。実際のコンペでは「エラー率の低さ」が評価されますが、トロント大学以外のエラー率が26%台であったのに対して、トロント大学は15%台と10%以上もエラー率を改善したのです。このときにトロント大学が使用していた技術が「Deep Learning」です。翌年以降は、各チームがDeep Learningを用いることとなり、エラー率は年々低下を続け、現在では5%以下と既に人間のレベルを超える領域に達しています。

ディープラーニングを利用する画像認識

ディープラーニングを利用する画像認識では、大量の画像データを読み込んで、その中で特徴を細かく抽出していく処理を行ないます。特徴の識別が難しい画像認識の分野だからこそ、ディープラーニングはその学習能力を発揮し、物体認識率が上がるという成果を生み出していています

画像認識の種類と機能

画像認識の種類と機能

一言に画像認識技術といっても、画像の種類によって対象の形状や色、複雑さ、データの数などで差が生じます。そのため扱う画像データによって技術領域を分類することができます。ここではその代表的なものを簡単に紹介していきます。

物体認識

Wikipediaによると、物体認識(ぶったいにんしき、英: Object Recognition)とは、画像や動画の中から与えられた物体を検出することと定義されています。

物体認識は画像やビデオ内の物体を識別するためのコンピュータビジョンの手法です。 ディープラーニングや機械学習の重要な成果のひとつが物体認識と言えます。 … このタスクにおいては、画像特徴などを利用してデータベースを構築し、特徴のマッチングを利用して類似度を計算する等の方法が用いられてきました。

顔認識

顔認識は顔画像から目立つ特徴を抽出し、人間が普段相手を判別する手段をシステムで実現した最も身近な認証方式です。顔の目、鼻、口などの特徴点の位置や顔領域の位置や大きさをもとに照合を行います。なりすましが困難なためセキュアであり、物理的なカギを持ったり、パスワードを設定する必要がありません。専用装置が不要で導入しやすく、利便性に優れるなどの特長を持っています。

文字認識

文字認識とは、紙に書かれた手書きの文字や、印刷文字などを判別する技術です。これにより、例えば画像内のテキストを抽出することができます。古くから研究されている分野ですが、最近では翻訳技術と合わせたシステムが実現されるなど、利用用途の多い技術でもあります。

まとめ

画像認識に関する基礎的な知識を理解していただきましたね。今後も、AIの発展とともに、画像認識がさらに、活用されいると期待されています。そこで、画像認識は実際にどのように活用されているかを知りたい方には、画像認識の実社会への応用方法という記事がおすすめです。

前の記事
次の記事

#関連キーワード