私の研究分野は類似画像検索で、画像の類似性について研究しています。ある1枚の画像をキー画像として選んだ時に、蓄積されている画像データベースの中から似ている順に表示するのが類似画像検索です。例えばNo.1とNo.2の画像が類似しているとは、どの程度似ているかを類似度という評価尺度を用い、0~1までの定量的な数字で計算し、No.1とNo.2の画像の類似度は0.91...などと表現します。AIでは、なぜNo.1とNo.2の画像が類似しているかの理由が分からないけれども、確かに似ている画像を選択します。結果が良ければ良いではないかという向きもありましょうが、私には理由が分からないのはいささか気持ちが悪いです。
画像同士が類似しているか否かを判断するのが類似画像評価です。比較したい類似性評価の観点と測定する類似尺度を画像に適用して、その類似度によって類似度合いを評価します。したがって、類似画像評価では、類似性評価の観点と、その観点を評価する評価尺度の設定が重要となります。類似していると一言でいっても、様々な異なる観点が存在します。
例えば、観点Aは、赤い林檎と赤い苺で、色(赤)が類似しています。
観点Bは、丸い林檎と丸い梨で、形(丸い)が類似しています。
観点Cは、2個の梨と2本のバナナで、数(2つ)が類似しています。
といった具合です。
画像処理の際には、観点Aは、HSV色空間の色相により赤み度合を数値化します。観点Bでは、真円度を計算し丸み度合を判定します。観点Cでは、ラベリングを用いて領域数を計測します。いずれの場合でも、対象となる領域の抽出が必要であり、比較対象となる類似画像領域が正しく抽出されることが重要となります。
今日もそんなことを考えながら、愛車に乗車すると、インターネットと繋がっているカーナビが、「ドライバーの顔識別により、田邊勝義さんと認識しました」と言ってきました。AI技術の進歩に敬服する今日この頃です。
田邊 勝義(国際学群 経営情報教育研究学系 教授) 【好きなこと】 |