セミナーレポート

コンピュータが「画像を理解する」仕組み

第83回ロボット工学セミナーを取材

2014/6/16

 最近注目を集めている自動運転システムを始め、ロボットの自動走行の実現を支えているのは、画像処理技術だ。第83回ロボット工学セミナーでは、画像処理の技術を中心に講演が行われた。

ロボット車いすのデモ展示も行われた
ロボット車いすのデモ展示も行われた

「背景」と「人」を区別する方法


 コンピュータによる画像処理技術は、1970年代頃から工場での部品組み立て時のパーツ認識などで利用されていた。その後、工場内を走行するロボットや監視カメラ、そして臓器の位置や境界などを検出する医療用の画像処理まで活用が広がっていった。


 こうした画像処理の技術で立ちはだかるのが「検知エラー」だ。画像処理の基本は、ほとんど変化のない「背景」と、人や自動車など、動きに変化のある「前景」に分ける「背景差分技術」だ。一見人間の目からすれば簡単にできる判断なのだが、コンピュータに区別をつけさせるには課題がいくつもある。


 人通りの絶えない場所だと、道路の状態や電柱、自動販売機など、背景が取得できないため、コンピュータに前景である「人」を認識させることが困難になる。また、風で揺れ動く木や、画面の中に入ってくる虫や鳥を、「前景」と間違えて検出する可能性も出てくる。昼と夜、晴天と豪雨時など、背景の環境変化もエラーの原因となる。


 様々な原因で発生する検知エラーを分類すると、背景だと思ってしまう「見逃し」タイプと、背景なのに「人」と認識する「過検出」タイプに分けられる。青山学院大学教授の鷲見(すみ)和彦氏は、「『見逃し』を少なくしようとすると『過検出』が増える」と、2つのエラーがトレードオフであることを解説した。


 こうしたエラーを下げるためのアルゴリズム(手法)は数多く開発されている。また、こうしたアルゴリズムをWEB上で利用できる環境も整っているという。鷲見氏は「画像処理に携わる研究者にとって、自分の開発したアプリケーションが、既存のものに比べてどのくらいの性能を持っているか、簡単にテストできるようになった」と、現在の開発環境が向上していることを紹介した。

研究機関・企業を問わず参加者が集まった   東芝の篠原雄介氏
研究機関・企業を問わず参加者が集まった   東芝の篠原雄介氏

動くものを追跡する「パーティクルフィルタ」


 背景と「動くもの」を区別するだけでなく、画像処理には動くものを「追跡(トラッキング)」する技術も求められる。東芝研究開発センターの篠原雄介氏は、トラッキング技術の1つである「パーティクルフィルタ」について解説した。


 パーティクルフィルタとは、動くものが次にどこへ向かうか、複数の仮説(パーティクル)を立てて予測し、実際の動きと一致した仮説を評価するアルゴリズムだ。これに沿って次の動きについても複数の仮説を立てて予測…ということを繰り返して、物体を追跡する。1秒30フレーム(30枚の画像を使う)映像であれば、1フレームごとに予測が行われる。


 埼玉大学准教授の小林貴訓氏は、パーティクルフィルタの活用例を、「顔の追跡」で紹介した。


 コンビニの防犯カメラで人物の顔を追跡する実験映像では、カメラに映る人物の顔を自動追跡する難しさが解説された。顔が横や下を向いたときに追跡が不可能になる場合や、店舗内にある多数の商品によって背景が複雑になり、「人の顔」と誤検知してしまう事例なども発生したという。


 こうした問題を解決するため、正面や横顔など、顔の角度による判別基準を複数用意して、人の顔の追跡精度を上げた。また、「人の顔」以外のデータを学習させて、誤検知を減らした。


画像処理のこれから


 膨大なデータ処理が可能になったことで、画像処理技術に関する研究は飛躍的に進歩している。冒頭で紹介した「背景差分」のアルゴリズムも、鷲見氏によれば、500件以上あるという。この中でも「混合ガウス分布モデル」「適応的背景差分」などが高い評価を受けているという。


 画像処理は膨大なデータを扱う。ハードウェアの進化で力技の分析も可能だが、ロボットに搭載するとなると、スペックは限られてくるため、おのずと効率的な処理が求められる。効率的なハードウェアのリソース活用をしつつ、適切な画像処理が可能なアルゴリズムの研究がこれからも期待されるだろう。

(中西 啓)

【セミナーデータ】

イベント名
:第83回ロボット工学セミナー
主催   
:日本ロボット学会(RSJ)
開催日  
:2014年5月23日
開催場所 
:東京大学本郷キャンパス(東京都文京区)

【関連カテゴリ】

その他