ignition-monorepo / backend-tfjs/src / PPOAgent
Class: PPOAgent
Defined in: backend-tfjs/src/agents/ppo.ts:96
Implements
Constructors
Constructor
new PPOAgent(
config):PPOAgent
Defined in: backend-tfjs/src/agents/ppo.ts:132
Parameters
config
Returns
PPOAgent
Methods
getAction()
getAction(
state,greedy?):Promise<number>
Defined in: backend-tfjs/src/agents/ppo.ts:177
Sélectionner une action par échantillonnage stochastique depuis π_θ. Stocke lastLogProb et lastValue pour le prochain remember().
Parameters
state
number[]
greedy?
boolean
Returns
Promise<number>
Implementation of
remember()
remember(
experience):void
Defined in: backend-tfjs/src/agents/ppo.ts:209
Stocker une transition dans le buffer de rollout. Doit être appelé immédiatement après getAction() pour que lastLogProb et lastValue correspondent bien à cet état.
Parameters
experience
Returns
void
Implementation of
train()
train():
Promise<void>
Defined in: backend-tfjs/src/agents/ppo.ts:223
Mettre à jour l’acteur et le critic sur les données collectées. Vide le buffer de rollout à la fin (algorithme on-policy).
Appelé typiquement à la fin de chaque épisode ou après N steps.
Returns
Promise<void>
Implementation of
getState()
getState():
Record<string,unknown>
Defined in: backend-tfjs/src/agents/ppo.ts:427
Serialize internal state (epsilon, stepCount, etc.) for checkpointing.
Returns
Record<string, unknown>
Implementation of
setState()
setState(
state):void
Defined in: backend-tfjs/src/agents/ppo.ts:434
Restore internal state from a serialized object.
Parameters
state
Record<string, unknown>
Returns
void
Implementation of
save()
save(
modelId,metadata?):Promise<string>
Defined in: backend-tfjs/src/agents/ppo.ts:439
Save the agent’s model and state. Returns URI or void.
Parameters
modelId
string
metadata?
Record<string, unknown>
Returns
Promise<string>
Implementation of
load()
load(
modelId):Promise<void>
Defined in: backend-tfjs/src/agents/ppo.ts:452
Load a previously saved model and state.
Parameters
modelId
string
Returns
Promise<void>
Implementation of
dispose()
dispose():
void
Defined in: backend-tfjs/src/agents/ppo.ts:464
Release TF/GPU/WASM resources held by the agent
Returns
void