策略迭代法

概述

策略迭代法（policy iteration method）是动态规划中求最优策略的基本方法之一。它借助于动态规划基本方程，交替使用“求值计算”和“策略改进”两个步骤，求出逐次改进的、最终达到或收敛于最优策略的策略序列。

2百科释义

本词条最后更新于 2026-06-29 21:59:01

策略迭代法

本站说明

欢迎来到词帮网！我们专注于汉语词语词典服务，提供成语、近义词、反义词、组词等全面查询。海量词库，专业释义，助您轻松掌握中文词汇。如有问题，欢迎反馈！

热门组词