GCOE CEDI Osaka Univ.

大阪大学グローバルCOEプログラム Center for Electronic Devices Innovation

大阪大学グローバルCOEプログラム 次世代電子デバイス教育研究開発拠点

HOME> 拠点目的・概要 > グローバルCOE研究紹介 > 工学研究科 馬場口研究室 馬場口 登 教授
  • 国際シンポジウムグローバルセミナー
  • 各種セミナー
  • 研究ハイライト
  • 実績報告
  • 公募情報
  • 各種募集

人と人との関係に応じて見せる画像を変える

プライバシー情報をユーザー間の関係に依って処理する技術

マルチメディア、特に音声、画像、映像に対する様々な信号処理・情報処理を研究しています。ここ15年程は、画像を見やすくする処理、数時間にわたる映像の中のいい場面を自動的に探し編集する技術の他、情報ハイディングやウォーターマーキングという技術を使い、画像データに埋め込んだ情報を、暗号の鍵を持つ受け手だけが取り出せるという処理にも取り組んでいます。封切り前の映画の海賊版を販売されると映画会社は大きな損害を受けますが、私達は音声に埋め込んだウォーターマークから、どの映画館のどの位置で盗撮したか判定する技術も開発しました。このようにマルチメディアの信号処理に取り組む我々の研究室では、様々なことをやっています。中でもプライバシー情報保護処理、パーソナル情報の問題は、情報処理分野のかなりホットな研究テーマです。

プライバシー情報とは、例えば名前のようにそれから個人が特定できる情報です。また、画像情報の中の顔、姿、歩き方、発話情報から誰かが分かれば、データベースまでたどり、特定の人の年収、職業、家族までわかる可能性があります。さらに、偶然写った家や表札などの文字情報から、その持ち主や家の中のことまでわかってしまうのです。このように撮影画像には個人の情報にたどり着ける情報が散在しています。それを、見せたい人には見せ、見せたくない人には隠す処理が必要になります。

「プライバシー感覚」は個人、状況、相手にもよるものです。自分をさらすことに抵抗がない人と、苦痛を感じる人がいます。また、例えば幼稚園にいるわが子を遠隔地から見たい時もある。そのような時に、親には子供の顔はしっかり見えて他の子はぼかす、別の父兄には自分の子供はよく見えないようにする技術を開発しました。全員の写真を撮っても、見る人によって「画面A」に映る画像と「画面B」に表示される画像を変えるわけです(添付fig1)。そのためには、画像の中に誰が映っているか、そして誰が見ているかを判断しなければなりません。そこからどのような画像処理をすべきかを決めます。

 その開示レベルのルールは、映っている被写体に対する観察者の親密度や見守り義務感に大きく影響されます。私達は、親しい人から見ず知らずの人まで、親密度に応じ、各種の状況にどのような表示画像を設定したいかアンケート調査を実施しました。その結果を反映させたプライバシーポリシーを設定し、画像表示を状況に応じて変えます。固定カメラで四六時中撮影して把握した背景の上に、前景の物体1、物体2が重なるという画像生成モデルをベースに、被写体(前景)と背景との差から自動的に判断し画像処理をします。現れた前景の領域だけ切り取ればプライバシー保護のための抽象化の処理は比較的簡単に実現できます。

抽象化には、処理しない実写以外に、シースルー、モノトーン、モザイク、シルエット、バー、ドット、透明など抽象度により様々な方法があります(添付fig2)。透明とは、本当は人がいても、抜き取ってあたかもいないかのように処理します。また、輪郭だけ表示する「エッジ」や、モザイクをかける「ぼかし」と呼ばれる方法もあり、Google Street Viewでも使われています。

p>

被写体の背景は静止していない場合、この種の画像処理は難しいのですが、長時間観測すると背景の統計的なモデルが得られます。木立が風で揺れていても、四六時中この画像を撮っておくと、統計的にここのあたりの葉っぱはどの程度揺れるかが分かります。他方、人間が現れて画像が大きく変われば、高い精度で、その判断ができます。

現われた物体が誰であるかは、顔、動き、歩き方などから認識し、判断します。実はこのような認識は、前景と背景に分ける技術よりはるかに難しい。例えばデジカメは、撮影時に顔のところにピッと枠が出てくるでしょう。あの”顔”認識は、フレームの中である程度顔が大きいと上手くできるのですが、監視カメラのように上の方から撮影し、映った顔が小さいと、認識ができないことが多い。そこで我々は、顔画像や動きで個人を認識する精度を高めるため、RF-IDタグと画像処理を併用して、画面に映っている人を特定する研究に取り組んでいます。RF-IDタグを併用すると誰がそのエリア内にいるかという情報がわかります。それを組み入れた我々のシステムをPriSurvと呼んでいます。構成メンバーがある程度固定している場合に、柔軟にポリシーを設定でき、表示のコントロールが容易になります。

他方で、メンバー間の関係の規定が難しい公共空間で利用できる、デジタルジオラマという実世界を反映したコンテンツも作成しました。公共空間にいる人のプライバシーを考え、人を”棒”で表示します(添付fig3)。さらに人をグループ化し、グループメンバーが画像を見る時には”棒”の色を変え、”棒”を実画像に代えるなど様々なやり方があります。

背景が固定されないモバイルカメラの場合には、定点カメラで背景のモデルが精密に定義できないため、取り扱いがとても難しい。背景を中心としたPriSurvの画像処理とは対照的に、ターゲットの物体を追跡する、被写体を中心とした画像処理の考え方をします。

馬場口 登 教授
馬場口 登 教授
Fig.1 「プライバシー感覚」は個人、状況、相手にもよる
「プライバシー感覚」は個人、状況、相手にもよる
Fig.2 抽象化処理
抽象化処理
Fig.3 デジタルジオラマ
デジタルジオラマ

情報開示の対象、レベルを、自分でコントロールする

以前は「プライバシー」はテリトリー(個人のいる空間)の話でしたが、現代の法的観点ではプライバシー権とは、「自己情報のコントロール権」と考えられています。顔、健康などの生理情報、あるいは年収などの社会的な情報まで、全て自分で開示範囲をコントロールできる権利が、プライバシー権とされます。このPrisurvは、被写体として自分の見せ方を人間関係によりコントロールできるという意味で、「プライバシー権」を反映したシステムになっています。

マルチメディア情報を利用したシステムの普及に伴い、誰もが思いがけず被写体となる時代を迎え、プライバシー侵害の危険性にさらされる問題が顕在化してきました。ただし、状況によっては自分の大変なプライバシー情報でも開示したい場合もあるかもしれません。例えば、適切な医療行為をすばやく受けるために血圧や体温などの健康状態を開示したいこともある。福祉施設や保育園などでは、家族にとっては画像情報を開示してほしいこともある。今まではプラバシ―情報は何でも隠してきたけれど、開示対象によってはメリットがある場合もあります。この考え方で、Prisurvは人に応じて表示を変えるシステムにしています。

カメラに囲まれた監視社会の恐ろしさがある一方で、使い道次第ではここから食堂の混み具合や道の混み具合がわかると、とても便利になります。負の面と正の面があるのです。この種の情報もセキュリティ対策として期待されますが、そこが強調され過ぎると、人間の悪行対策のようで、せっかくの技術も夢がないように感じられます。技術の明るい側面にも期待したいものです。

小学生のときにゲルマニウムラジオに衝撃を受け、電気に興味を持ちました。あまり研究者志向ではなかったのですが、大学の研究室に入って、知らない間にどんどん研究の自由さ、奥深さにはまりました。
仕事で研究しているという意識があまりありませんね。