(セッション表へ)

平成21年度 電気・情報関連学会中国支部第60回連合大会

部門: セッション 1602  24. ファジィ・AI・GA-(1)
日時: 2009年10月17日(土) 10:30 - 11:35
部屋: 講義棟 601室 (→地図)
座長: 杉井 学 (山口大学)

24-1 (時間: 10:30 - 10:43)
題名2次割当問題に対するk-opt局所探索法の有効性
著者*北田 雅享 (岡山理科大学大学院 工学研究科), 片山 謙吾, 南原 英生, 成久 洋之 (岡山理科大学工学部情報工学科)
Pagep. 529
Keyword組合せ最適化, 2次割当問題, k-opt局所探索法
Abstract2次割当問題(Quadratic Assignment Problem,QAP)は,NP困難な組合せ最適化問題として知られている.本研究では,QAPに対してk-opt局所探索法(k-opt Local Search,KLS)を提案し,代表的なメタ戦略の一つである反復局所探索法(Iterated Local Search, ILS)の枠組みに導入する.そして,KLSとQAPに対して一般的に使用されている局所探索法(Don't Look Bit, DLB)の2種類の局所探索法と,2種類のKickをそれぞれ組み合わせた4種類の反復局所探索法の検証結果をもとに,KLSの有効性を示す.

24-2 (時間: 10:43 - 10:56)
題名最大クリーク問題に対する反復局所探索法の局所解脱出法の検討
著者*幸村 明典 (岡山理科大学大学院 工学研究科 情報工学専攻 片山研究室), 片山 謙吾, 南原 英生, 成久 洋之 (岡山理科大学 工学部 情報工学科)
Pagep. 530
Keyword反復局所探索法, 組合せ最適化, 最大クリーク問題
Abstract反復局所探索法は代表的なメタ戦略アルゴリズムの一つであり,局所探索法と局所最適解から脱出する操作であるKick法から構成される.本論文では,最大クリーク問題に対して,我々が提案しているk-opt局所探索法(k-opt local search, KLS)にもとづく反復局所探索法(iterated KLS, IKLS)の局所解脱出法に関して検討する.複数の局所解脱出法を示し,DIMACSベンチマーク問題例への適用を通して,それぞれのKick法を有するIKLSの性能を評価する.

24-3 (時間: 10:56 - 11:09)
題名Improving Sensitivity for Parameter-Settings of an Action-Selection Strategy in Reinforcement Learning
著者*小野 兼嗣, 岩田 一貴, 林 朗 (広島市立大学)
Pagepp. 531 - 532
KeywordReinforcement Learning, Softmax Method, Markov Decision Process
AbstractMarkov decision processes are one of the most popular frameworks for reinforcement learning. The entropy of probability density functions of Markv decision processes is referred to as the stochastic complexity. The stochastic complexity is helpful for tuning the parameters of an action-selection strategy to alleviate the exploration-exploitation dilemma. In this paper, we improve an action-selection strategy to make it insensitive to parameter-settings by using the stochastic complexity. This gives better policies for alleviating the above dilemma in most parameter-settings.

24-4 (時間: 11:09 - 11:22)
題名部分観測環境におけるモジュール型強化学習の予測機能の実現
著者*兼平 龍, 小林 邦和, 呉本 尭, 大林 正直 (山口大学大学院 理工学研究科)
Pagepp. 533 - 534
Keyword強化学習, マルチエージェント, 追跡問題, 予測機能, 非観測状態
AbstractZhouらはマルチエージェント強化学習(MARL)において,モジュール型Q学習,他エージェントの政策推定,Profit Sharingを組み合わせた強化学習システムを提案し,追跡問題を用いて,その有効性を示している.本論文ではZhouらのシステムにおいて,見失った獲物に対して,その位置を推定する手法を提案し,性能向上を図ることを目的としている.計算機シミュレーションにおいて,ステップ数の収束状況,各エピソード数における平均ステップ数,メモリ使用量といった側面から,Zhouらの手法と性能を比較し,検証を行った.また,提案手法において,推定値の更新方法をいくつか提案し,その性能を検証した.その結果,提案手法ではZhouら手法に比べ収束が早く,かつ各エピソード数における平均ステップ数も小さくすることができ,提案手法が有効に作用することが確認できた.

24-5 (時間: 11:22 - 11:35)
題名双方向マンハッタンストリートネットワークにおけるノード配置問題に対するアント最適化法の検討
著者*大倉 慶一 (岡山理科大学 工学部 情報工学科), 北田 雅享 (岡山理科大学 大学院 工学研究科), 片山 謙吾, 南原 英生, 成久 洋之 (岡山理科大学 工学部 情報工学科)
Pagep. 535
Keyword組合せ最適化, ノード配置問題, 局所探索法, アント最適化法
Abstractマルチホップシステムである双方向マンハッタンストリートネットワークにおけるノード配置問題(Node Placement Problem, NPP) を対象に,代表的なメタ戦略アルゴリズムである遺伝的アルゴリズムやタブサーチ,アニーリング法,反復局所探索法などが提案されている.その他,代表的なメタ戦略としてアント最適化法(Ant Colony Optimization, ACO)があるが,NPPに対する適用例は報告されていない.よって本研究では,NPP に対して既に提案しているk-swap 局所探索法をACO に組み込んだメタ戦略を提案し,その性能について検討する.