DICOMO2015 プログラム

(セッション表へ)

マルチメディア，分散，協調とモバイル(DICOMO2015)シンポジウム

セッション 5C 動画像システム
日時: 2015年7月9日(木) 10:30 - 12:10
部屋: 花輪
座長: 佐藤永欣 (岩手県立大学)

5C-1 (時間: 10:30 - 10:50)

題名	ドライバの曖昧な撮影位置要求に対するコンテキスト情報に基づく車載カメラ画像の撮影位置決定方式
著者	*伊藤亮輔 (静岡大学大学院工学研究科数理システム工学専攻), 石原進 (静岡大学学術院工学領域)
ページ	pp. 995 - 1002
キーワード	カーナビ, コンテキスト情報, 音声入力, ドライバの意図解釈
アブストラクト	ドライバが目視できない地点の風景画像を取得することは，ドライバの経路選択や安全運転の手助けになるだろう．筆者らは，ドライバが興味のある地点を走行する他車両の撮影画像をドライバへ提供するリアルタイム画像カーナビを開発している．ドライバが本システムを用いる場合，興味のある地点の位置座標や撮影方向などがカーナビへ明確に入力されることが望ましい．しかし，音声入力やタッチ操作などの運転を妨げない簡便な入力方法では，ドライバが，画像の撮影条件を詳細に入力することは容易ではない．そのため，システムはドライバの要求を自動的に解釈し，ドライバの意図する画像の撮影条件を決定する必要がある．本稿では，リアルタイム画像カーナビを実現するための一要素技術として，自車両の走行状況やデジタル地図などから得られるコンテキスト情報からドライバが現在置かれている状況を推測し，その状況に応じた画像の撮影時の位置座標と撮影方向などの撮影条件を決定する方式を提案し，その具体的な設計と基礎的実装について示す．

5C-2 (時間: 10:50 - 11:10)

題名	フレーム損失の影響を緩和するマルチパスマルチビュービデオ伝送手法について
著者	*大友伊織, 藤橋卓也, 廣田悠介, 渡辺尚 (大阪大学大学院情報科学研究科ネットワーク学専攻渡辺研究室)
ページ	pp. 1003 - 1009
キーワード	多視点動画, マルチパス, エンコード, データ損失抑制, 映像品質
アブストラクト	3次元映像，自由視点映像などの次世代の映像技術を支える要素技術として，複数のカメラ映像から構成されるマルチビュービデオが注目されている．マルチビュービデオは複数のカメラ映像を同時に扱うため，従来のシングルビュービデオと比較してデータ量が非常に大きくなる．近年では，データ量削減を目的としたH.264/AVC Multi-view Video Coding (MVC) に代表されるエンコード方式が開発されているが，伝送時にデータ損失が発生した場合，複数のビデオフレームが一斉に欠落し，映像品質の劣化，映像再生の一時停止を招く．本研究では，マルチビュービデオ伝送におけるデータ量の増加を抑えるとともに，伝送中のデータ損失によって発生する映像品質劣化ならびに映像再生の一時停止を抑制する手法を提案する．提案方式は，エンコード時にカメラ間の相関情報を用いることで，データ量を削減する．また，映像データを複数の独立した伝送路（パス）を用いてユーザに伝送する．このとき，映像データに対してパス数に合わせた分割エンコード構造を用いることで，ある映像フレームの損失によって引き起こされる品質劣化の範囲を狭める．

5C-3 (時間: 11:10 - 11:30)

題名	複数カメラで撮影したスポーツ映像ストリームの実時間自動編纂システムの提案
著者	*藤澤和輝, 平部裕子, 諏訪博彦, 荒川豊, 安本慶一 (奈良先端科学技術大学院大学)
ページ	pp. 1010 - 1018
キーワード	情報流, マルチ映像ストリームキュレーション, 実時間コンテンツ編纂, 最適化学習, スポーツライブ中継
アブストラクト	本稿では，一般のスポーツの観戦者が撮影した複数映像ストリームの編纂作業を機械学習により自動で行うシステムを提案する．TV局の放送するスポーツ中継の映像を教師データとして，シーンに基づく最適化学習によりカメラを切替えるタイミングを学習し，複数の映像ストリームの編纂を最適化する．入力データは各映像ストリーム中の各フレームに対する画像特徴を表すメタ情報と，イニング数や打順等の試合進行情報を用いる．出力データは，各時刻における，TVで放送される映像に近い映像を撮影している一般の観戦者のカメラのID，すなわちカメラの切替えタイミングである．評価実験として，高校野球を題材に，阪神甲子園球場で撮影した7台のカメラ映像に付与されたメタ情報とその試合の進行情報，テレビ局の放送映像を対象としてRandom Forestsを用いて識別モデルを構築した．提案手法を用いて，1～3イニング目のカメラの切替えタイミングを学習させたところ，カメラマンの独自性が反映されない決められたルールに則ったベースカメラ間の切替えについては加重平均で72.53%，固定カメラワークの切替えについては92.1%のF値を得た．

5C-4 (時間: 11:30 - 11:50)

題名	ファットクライアント型リアルタイム動画像解析アプリケーションフレームワークの提案
著者	*黒崎裕子 (お茶の水女子大学), 竹房あつ子, 中田秀基 (産業技術総合研究所), 小口正人 (お茶の水女子大学)
ページ	pp. 1019 - 1023
キーワード	ストリーム処理, ファットクライアント
アブストラクト	一般家庭でカメラやセンサ等によりライフログを取得して，防犯対策やセキュリティ，お年寄りや子供のための安全サービスを目的としたライフログ解析アプリケーションが数多く開発されている．それらのアプリケーションを一般家庭で採用する場合，サーバやストレージを設置して解析までを行うことは難しいため，クラウドでの処理が必要となる．しかし，センサとクラウド間のネットワーク帯域やクラウド側の資源の制限により，クラウドに動画像を含む多数のセンサデータを送信し，特徴量抽出等の前処理から解析までの全ての工程をクラウド側でリアルタイムに行うことは困難である．我々は，ファットクライアントの概念を取り入れ，センサ側で画像から特徴量抽出し，前処理済みの小さいデータをクラウドに収集して解析する動画像データ解析アプリケーションフレームワークを提案しているが，動画像解析ではセンサ側での前処理により多くの時間がかかってしまうことが明らかになった．本研究では，前処理をセンサ側とクラウド側で負荷分散させることで，動画像解析処理全体の高速化を図る．提案するアプリケーションフレームワークはリアルタイム分散処理システムのApache Stormを用いて実装し，実際に画像データをセンサ側とクラウド側で分散処理した場合の画像1枚あたりの処理時間と一定時間内に処理できるジョブ数を調査した．実験結果より，処理スレッド数を増やすことによって画像1枚当たりの処理時間は増加するが，一定経過時間に処理できる総画像数が増加し，ファットクライアントとクラウドを連携させた分散処理の有用性が示された．