(セッション表へ)

平成20年度 電気・情報関連学会中国支部第59回連合大会

部門: セッション 1303  22. パターン認識・画像処理-(3)
日時: 2008年10月25日(土) 13:00 - 14:31
部屋: 共通教育棟 E31教室 (→地図)
座長: 李 仕剛 (鳥取大学)

22-14 (時間: 13:00 - 13:13)
題名視線を用いたコミュニケーションシステムの構築−顔領域の抽出−
著者*青木 星也, 黒崎 正裕, 薮木 登, 井上 浩行 (津山工業高等専門学校), 鷲見 育亮 (鳥取環境大学), 築谷 隆雄 (松江工業高等専門学校)
Pagep. 425
Keyword視線, 画像, 視線インターフェース
Abstract本研究はカメラから入力された画像を解析し視線を検出,電化製品を操作するというシステムを構築するものである.従来から視線検出の研究が行われている.しかし装置のコスト等,課題が多く実用にはたえない.よって安価で利用者の負担を軽減するシステムを構築することを目指し,顔領域の抽出とカメラ制御について検討する.視線コミュニケーションシステムを提案し,顔領域の抽出方法の検討を行った.これにより顔領域を抽出し,顔領域の重心座標と面積を求めることができるようになった.

22-15 (時間: 13:13 - 13:26)
題名視線を用いたコミュニケーションシステムの構築 - 非接触方式による視線検出 -
著者*黒崎 正裕, 青木 星也, 薮木 登, 井上 浩行 (津山工業高等専門学校), 鷲見 育亮 (鳥取環境大学), 築谷 隆雄 (松江工業高等専門学校)
Pagep. 426
Keyword視線検出

22-16 (時間: 13:26 - 13:39)
題名トラジェクトリ特徴量を用いたリアルタイム単語認識
著者*加藤 友哉, 齊藤 剛史, 小西 亮介 (鳥取大学 大学院 工学研究科)
Pagepp. 427 - 428
Keyword読唇, 単語認識, リアルタイム, トラジェクトリ特徴量, Active Appearance Model
Abstract本稿では,トラジェクトリ特徴量を用いたリアルタイム単語認識を提案する.トラジェクトリ特徴量とは,フレーム毎に計測される特徴量の時間的変化を軌道として表現したものである.トラジェクトリ特徴量には,動的輪郭モデルの一種であるActive Appearance Modelにより抽出した口内領域の面積とアスペクト比を用いる.認識実験の結果,車椅子制御用14単語(A群)で94.3%,都道府県名47単語(B群)で89.6%の認識率を得た.また,A群では平均認識時間0.45s,B群では2.78sを得た.単語により認識率の差は生じるが,リアルタイムで単語を認識できることを確認した.

22-17 (時間: 13:39 - 13:52)
題名読唇における発話シーンからの音節の自動検出
著者*森下 和敏, 齊藤 剛史, 小西 亮介 (鳥取大学 大学院 工学研究科)
Pagepp. 429 - 430
Keyword読唇, 単語認識, 音節検出
Abstract本稿では音節ベースの単語認識の前処理として,音節発話フレームの自動検出手法を検討する.音節発話時に唇の動きが小さくなることに注目し,口部形状の時間変化量を解析することで音節の検出を試みる.Active Appearance Modelにより抽出した唇領域から内側唇輪郭内領域の面積とアスペクト比を計測する.それらを特徴量空間上にプロットしたときの各点のフレーム間距離に対して正規分布関数を適用し音節強調波形を定義することにより,波形の極大点から音節発話フレームを求めることができる.日本語5母音のうち異なる2母音を連続で発話するシーンを撮影した動画像を用いて実験を行ったところ,検出成功率81.0%を得た.

22-18 (時間: 13:52 - 14:05)
題名VQによるサブバンド分解フィルタを用いた単母音認識における汎化誤差
著者*塩谷 昌宏, 山根 延元, 森川 良孝 (岡山大学 大学院 自然科学研究科)
Pagepp. 431 - 432
Keyword音声認識, ベクトル量子化, サブバンド分解フィルタ
Abstract一般に音声認識では,音声信号から音声の統計的性質を運ぶ特徴ベクトルを抽出し,特徴ベクトルをクラスタリングして認識を行う.また,現在の音声認識では,音声を単語ごとに区切って認識を行う場合が多い.しかし,これでは事前に学習されずに辞書登録されていない単語の認識は不可能で,これを解決するには膨大な語句が辞書登録されている必要がある.他の解決方法としては,単語ごとではなく,音素ごとの認識を十分な精度 で行うことが考えられる.この方法が実現すれば,辞書登録するのは音素情報だけで,非常に少なくてすみ,音声認識技術の汎用性が非常に増す.また,音素認識結果の情報を付加して単語認識に引き渡すことにより,単語認識の認識率向上も望める.

22-19 (時間: 14:05 - 14:18)
題名画像の可逆符号化におけるMMAE予測器の予測次数と予測誤差分布
著者*上野 浩和, 森川 良孝 (岡山大学大学院自然科学研究科)
Pagepp. 433 - 434
Keyword可逆符号化, MMAE予測器, 予測次数, 予測誤差分布, 分布整形効果
Abstractこの論文では可逆符号化における平均絶対値誤差を最小とする予測器(MMAE予測器)の予測次数と予測誤差分布の関係について検討 した.MMAE予測器を設計する問題はある線形計画問題に帰着するので,一つの予測器に含まれる係数の数(予測次数)をkとすると,線形計画問題の解の性質により少なくともk個の予測誤差は0となることが分かっている.さらにkは予測の精度にもかかわってくるので,予測次 数kには予測誤差分布の形状を決める分布整形効果があると考えられる.この論文では,kがそのような効果を持つことを計算機シミュレーションを用いて確かめた.

22-20 (時間: 14:18 - 14:31)
題名色の違いを考慮した明度変換による弁別困難色の修正
著者*田中 豪, 末竹 規哲, 内野 英治 (山口大学大学院理工学研究科)
Pagepp. 435 - 436
Keyword色覚異常, 弁別困難色, カラー画像, 明度変換
Abstract色覚異常者の多くは,三種類の錐体のうちいずれか一つの錐体を欠いており,特定の範囲の色について色の差を感じにくいという色覚特性をもつ.このような色覚特性をもつ人に対して,カラー画像中の弁別困難色を弁別が容易な色に変換し,視認性の良い画像を提供することは非常に重要である.本報告では,弁別困難色を解消する色変換手法を提案する.具体的には,色の違いを反映したモノクロ画像(明度情報)を色覚異常者の感じる明度成分に埋め込むことで,視認性の良いカラー画像を作成する.更に,色変換に際して,原画像のもつ色度を保存する条件を課し,一般色覚者に対する印象を保つようにする.実験により,提案手法の有効性を示す.