学习自动机

概述

学习自动机(Learning Automata)是通过与随机环境不断的交互来调整自己,也就是说,其通过与环境不断的交流获得经验用来改善自己的行为,从而在可选择的动作中选择在该环境下最优的动作,而最优的动作也就是在当前的环境下,能得到环境奖励的概率最大的动作。

2百科释义

学习自动机(Learning Automata)是通过与随机环境不断的交互来调整自己,也就是说,其通过与环境不断的交流获得经验用来改善自己的行为,从而在可选择的动作中选择在该环境下最优的动作,而最优的动作也就是在当前的环境下,能得到环境奖励的概率最大的动作。

9词语组词

相关词条

本词条最后更新于 2026-07-01 10:12:02