ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 学術雑誌論文
  2. IEEE Transactions on Neural Networks

A statistical property of multiagent learning based on Markov decision process

https://hiroshima-cu.repo.nii.ac.jp/records/1275
https://hiroshima-cu.repo.nii.ac.jp/records/1275
9b7eda39-c930-4acf-8679-4b587e53be97
名前 / ファイル ライセンス アクション
NN17_4_829.pdf NN17_4_829.pdf (613.0 kB)
Item type 学術雑誌論文 / Journal Article(1)
公開日 2023-02-28
タイトル
タイトル A statistical property of multiagent learning based on Markov decision process
言語
言語 eng
キーワード
主題 Asymptotic equipartition property (AEP)
キーワード
主題 Markov decision process (MDP)
キーワード
主題 multiagent system
キーワード
主題 reinforcement learning (RL)
キーワード
主題 stochastic complexity (SC)
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者 IWATA, Kazunori

× IWATA, Kazunori

IWATA, Kazunori

ja-Kana イワタ, カズノリ

Search repository
IKEDA, Kazushi

× IKEDA, Kazushi

IKEDA, Kazushi

ja-Kana イケダ, カズシ

Search repository
SAKAI, Hideaki

× SAKAI, Hideaki

SAKAI, Hideaki

ja-Kana サカイ, ヒデアキ

Search repository
岩田, 一貴

× 岩田, 一貴

en 岩田, 一貴

Search repository
抄録
内容記述タイプ Abstract
内容記述 We exhibit an important property called the asymptotic equipartition property (AEP) on empirical sequences in an ergodic multiagent Markov decision process (MDP). Using the AEP which facilitates the analysis of multiagent learning, we give a statistical property of multiagent learning, such as reinforcement learning (RL), near the end of the learning process. We examine the effect of the conditions among the agents on the achievement of a cooperative policy in three different cases: blind, visible, and communicable. Also, we derive a bound on the speed with which the empirical sequence converges to the best sequence in probability, so that the multiagent learning yields the best cooperative result.
書誌情報 IEEE Transactions on Neural Networks

巻 17, 号 4, p. 829-842, 発行日 2006-07
出版者
出版者 IEEE
ISSN
収録物識別子タイプ ISSN
収録物識別子 1045-9227
権利
権利情報 ©2006 IEEE. Personal use of this material is permitted. However, permission to reprint/republish this material for advertising or promotional purposes or for creating new collective works for resale or redistribution to servers or lists, or to reuse any copyrighted component of this work in other works must be obtained from the IEEE.
フォーマット
内容記述タイプ Other
内容記述 application/pdf
著者版フラグ
出版タイプ VoR
出版タイプResource http://purl.org/coar/version/c_970fb48d4fbd8a85
戻る
0
views
See details
Views

Versions

Ver.1 2023-07-25 10:48:45.568606
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3