懲罰的日文
例句与用法
- 例えば,図3ではルールxaとyaは罰ルールであり,状態yは罰状態である.
例如在图3中,规则xa和ya是惩罚规则,状态y为惩罚状态。 - 例えば,図3ではルールxaとyaは罰ルールであり,状態yは罰状態である.
例如在图3中,规则xa和ya是惩罚规则,状态y为惩罚状态。 - 罰を回避するためには,まずルール集合の中から罰ルールを排除することが必要である.
为了回避惩罚,首先必须要从规则集合中排出惩罚规则。 - 罰を回避するためには,まずルール集合の中から罰ルールを排除することが必要である.
为了回避惩罚,首先必须要从规则集合中排出惩罚规则。 - 罰ルールが排除された後には,合理的政策をどのようにして形成するかが問題となる.
在排出惩罚规则之后,如何形成合理性策略成为一个问题。 - 一般に強化学習の実行結果は,報酬および罰の設計方法に大きく依存する.
一般来说,强化学习的实行结果,大大地依存于报酬及惩罚的设计方法。 - 以上を繰り返すことで,2次記憶領域に罰を回避する合理的政策が形成される.
重复上述步骤,直到在2次记忆领域中形成回避惩罚的合理性策略。 - 選択可能なルールが罰ルールまたは非合理的ルールのみである状態を罰状態と呼ぶ.
可以选择的规则只有惩罚规则或不合理规则的状态称为惩罚状态。 - 選択可能なルールが罰ルールまたは非合理的ルールのみである状態を罰状態と呼ぶ.
可以选择的规则只有惩罚规则或不合理规则的状态称为惩罚状态。 - 罰回避政策形成アルゴリズムでは,環境探査戦略としてランダム選択を用いた.
在惩罚回避策略的形成算法中,作为环境探查策略,采取了随机选择。
用"懲罰"造句