林秀明(はやしひであき)氏 による JTPAギークサロン
「オープンソース画像処理ライブラリ OpenCV について語る」が
パロアルト(Palo Alto)にある 弁護士事務所 Wilson Sonsini Goodrich Rosati (WSGR) にて
行われた。
今までのギークサロンは MUSEで行われてきたが、
今回は 弁護士事務所 WSGR で行われた。
会場に空間的余裕ができたので、
今まであった人数制限をなくして募集をしてみたが
結果的に、約20人の方々がご参加された。
さて、
「
OpenCV」
とは何ぞや、ということだが、
Intel が公開しているオープンソースのコンピュータビジョン向けライブラリだそうだ。
正式名称は「Open Source Computer Vision Library」と言うらしい。
今回のギークサロンの進め方として
「ひたすらデモとその解説」ということで、
いろいろなデモを実際に見せていただき、
それに林さんが技術的解説をする、というパターンで進んでいった。
初めに、デモの基本となる
カメラからのデータを取り込み、
それを画面上にリアルタイムに表示させる
C言語の50行たらずのサンプル・プログラムを紹介された。
「OpenCV」のライブラシを呼び出すと、
このように短いプログラムでも、動画処理が簡単にできてしまう。
話を進めてゆくと、実際にデモが沢山あった。
例えば、
- 「移動点の認識」
映っている人にマウスで点をつけ、その後、その人が移動すると付けた点も一緒に移動する
- 「ジェスチャーによる描画」
体の前に手で四角形を作ると画面上ではその四角形を緑色のラインで描画する
- 「エッジの検出」
モノとモノとの境目を検出する。(Canny Edge Detector)
- 「人の顔の認識」
人の顔だけ赤い四角で囲む。最近のデジカメによく搭載されている技術
- 「領域の認識」
どの領域がそのモノなのかを認識する技術。たとえば、いろいろな果物が映っている場合に、その中でオレンジの領域は何処なのか
などなど。
これらのいろいろな画像処理を行うためにいくつかのアルゴリズムが紹介されたが、
その中でも印象的だったのが
「Pyramid Iteration」というアルゴリズムである。
これは 大きな画像データを適当な大きさに分割し、
それぞれの領域内のピクセル値の平均を計算して別のメモリ領域に画像用配列データとして保存。
さらに、そのデータを分割・平均をとって 別メモリの画像用配列データへ......
というように概念的にデータ構造をピラミッド状にしてから
画像処理を行ってゆくアルゴリズム。
これにより、処理の高速化ができる。
例えば、画像全体の内の、どの部分に変化があったのか、とか
その部分が どの方向に移動したのか、とかの検出が早くできる。
休憩を挟んでのサロンは、11時前に無事終了した。
その後、いつものごとくネットワーキングとなったが、
結局、最終的なお開きは午前2時過ぎだった。
【参考リンク】
カテゴリー:
JTPA
2007年8月10日 22:00
トラックバック
このエントリーのトラックバックURL:
http://www.skymerica.com/blog/yotsumoto/mt/mt-tb.cgi/887
コメントしてください