RENTAI2008 プログラム

平成20年度電気・情報関連学会中国支部第59回連合大会

部門: セッション 1303 22. パターン認識・画像処理-(3)
日時: 2008年10月25日(土) 13:00 - 14:31
部屋: 共通教育棟 E31教室 (→地図)
座長: 李仕剛 (鳥取大学)

22-14 (時間: 13:00 - 13:13)

題名	視線を用いたコミュニケーションシステムの構築－顔領域の抽出－
著者	*青木星也, 黒崎正裕, 薮木登, 井上浩行 (津山工業高等専門学校), 鷲見育亮 (鳥取環境大学), 築谷隆雄 (松江工業高等専門学校)
Page	p. 425
Keyword	視線, 画像, 視線インターフェース
Abstract	本研究はカメラから入力された画像を解析し視線を検出，電化製品を操作するというシステムを構築するものである．従来から視線検出の研究が行われている．しかし装置のコスト等，課題が多く実用にはたえない．よって安価で利用者の負担を軽減するシステムを構築することを目指し，顔領域の抽出とカメラ制御について検討する．視線コミュニケーションシステムを提案し，顔領域の抽出方法の検討を行った．これにより顔領域を抽出し，顔領域の重心座標と面積を求めることができるようになった．

22-15 (時間: 13:13 - 13:26)

題名	視線を用いたコミュニケーションシステムの構築 - 非接触方式による視線検出 -
著者	*黒崎正裕, 青木星也, 薮木登, 井上浩行 (津山工業高等専門学校), 鷲見育亮 (鳥取環境大学), 築谷隆雄 (松江工業高等専門学校)
Page	p. 426
Keyword	視線検出

22-16 (時間: 13:26 - 13:39)

題名	トラジェクトリ特徴量を用いたリアルタイム単語認識
著者	*加藤友哉, 齊藤剛史, 小西亮介 (鳥取大学大学院工学研究科)
Page	pp. 427 - 428
Keyword	読唇, 単語認識, リアルタイム, トラジェクトリ特徴量, Active Appearance Model
Abstract	本稿では，トラジェクトリ特徴量を用いたリアルタイム単語認識を提案する．トラジェクトリ特徴量とは，フレーム毎に計測される特徴量の時間的変化を軌道として表現したものである．トラジェクトリ特徴量には，動的輪郭モデルの一種であるActive Appearance Modelにより抽出した口内領域の面積とアスペクト比を用いる．認識実験の結果，車椅子制御用14単語（A群）で94.3%，都道府県名47単語（B群）で89.6%の認識率を得た．また，A群では平均認識時間0.45s，B群では2.78sを得た．単語により認識率の差は生じるが，リアルタイムで単語を認識できることを確認した．

22-17 (時間: 13:39 - 13:52)

題名	読唇における発話シーンからの音節の自動検出
著者	*森下和敏, 齊藤剛史, 小西亮介 (鳥取大学大学院工学研究科)
Page	pp. 429 - 430
Keyword	読唇, 単語認識, 音節検出
Abstract	本稿では音節ベースの単語認識の前処理として，音節発話フレームの自動検出手法を検討する．音節発話時に唇の動きが小さくなることに注目し，口部形状の時間変化量を解析することで音節の検出を試みる．Active Appearance Modelにより抽出した唇領域から内側唇輪郭内領域の面積とアスペクト比を計測する．それらを特徴量空間上にプロットしたときの各点のフレーム間距離に対して正規分布関数を適用し音節強調波形を定義することにより，波形の極大点から音節発話フレームを求めることができる．日本語5母音のうち異なる2母音を連続で発話するシーンを撮影した動画像を用いて実験を行ったところ，検出成功率81.0%を得た．

22-18 (時間: 13:52 - 14:05)

題名	VQによるサブバンド分解フィルタを用いた単母音認識における汎化誤差
著者	*塩谷昌宏, 山根延元, 森川良孝 (岡山大学大学院自然科学研究科)
Page	pp. 431 - 432
Keyword	音声認識, ベクトル量子化, サブバンド分解フィルタ
Abstract	一般に音声認識では，音声信号から音声の統計的性質を運ぶ特徴ベクトルを抽出し，特徴ベクトルをクラスタリングして認識を行う．また，現在の音声認識では，音声を単語ごとに区切って認識を行う場合が多い．しかし，これでは事前に学習されずに辞書登録されていない単語の認識は不可能で，これを解決するには膨大な語句が辞書登録されている必要がある．他の解決方法としては，単語ごとではなく，音素ごとの認識を十分な精度で行うことが考えられる．この方法が実現すれば，辞書登録するのは音素情報だけで，非常に少なくてすみ，音声認識技術の汎用性が非常に増す．また，音素認識結果の情報を付加して単語認識に引き渡すことにより，単語認識の認識率向上も望める．

22-19 (時間: 14:05 - 14:18)

題名	画像の可逆符号化におけるMMAE予測器の予測次数と予測誤差分布
著者	*上野浩和, 森川良孝 (岡山大学大学院自然科学研究科)
Page	pp. 433 - 434
Keyword	可逆符号化, MMAE予測器, 予測次数, 予測誤差分布, 分布整形効果
Abstract	この論文では可逆符号化における平均絶対値誤差を最小とする予測器（MMAE予測器）の予測次数と予測誤差分布の関係について検討した．MMAE予測器を設計する問題はある線形計画問題に帰着するので，一つの予測器に含まれる係数の数（予測次数）をkとすると，線形計画問題の解の性質により少なくともk個の予測誤差は0となることが分かっている．さらにkは予測の精度にもかかわってくるので，予測次数kには予測誤差分布の形状を決める分布整形効果があると考えられる．この論文では，kがそのような効果を持つことを計算機シミュレーションを用いて確かめた．

22-20 (時間: 14:18 - 14:31)

題名	色の違いを考慮した明度変換による弁別困難色の修正
著者	*田中豪, 末竹規哲, 内野英治 (山口大学大学院理工学研究科)
Page	pp. 435 - 436
Keyword	色覚異常, 弁別困難色, カラー画像, 明度変換
Abstract	色覚異常者の多くは，三種類の錐体のうちいずれか一つの錐体を欠いており，特定の範囲の色について色の差を感じにくいという色覚特性をもつ．このような色覚特性をもつ人に対して，カラー画像中の弁別困難色を弁別が容易な色に変換し，視認性の良い画像を提供することは非常に重要である．本報告では，弁別困難色を解消する色変換手法を提案する．具体的には，色の違いを反映したモノクロ画像（明度情報）を色覚異常者の感じる明度成分に埋め込むことで，視認性の良いカラー画像を作成する．更に，色変換に際して，原画像のもつ色度を保存する条件を課し，一般色覚者に対する印象を保つようにする．実験により，提案手法の有効性を示す．