Skip to Content
API Reference@ignitionai/backend-tfjsSrcClassesClass: PPOAgent

ignition-monorepo


ignition-monorepo / backend-tfjs/src / PPOAgent

Class: PPOAgent

Defined in: backend-tfjs/src/agents/ppo.ts:96 

Implements

Constructors

Constructor

new PPOAgent(config): PPOAgent

Defined in: backend-tfjs/src/agents/ppo.ts:132 

Parameters

config

PPOConfig

Returns

PPOAgent

Methods

getAction()

getAction(state, greedy?): Promise<number>

Defined in: backend-tfjs/src/agents/ppo.ts:177 

Sélectionner une action par échantillonnage stochastique depuis π_θ. Stocke lastLogProb et lastValue pour le prochain remember().

Parameters

state

number[]

greedy?

boolean

Returns

Promise<number>

Implementation of

AgentInterface.getAction


remember()

remember(experience): void

Defined in: backend-tfjs/src/agents/ppo.ts:209 

Stocker une transition dans le buffer de rollout. Doit être appelé immédiatement après getAction() pour que lastLogProb et lastValue correspondent bien à cet état.

Parameters

experience

Experience

Returns

void

Implementation of

AgentInterface.remember


train()

train(): Promise<void>

Defined in: backend-tfjs/src/agents/ppo.ts:223 

Mettre à jour l’acteur et le critic sur les données collectées. Vide le buffer de rollout à la fin (algorithme on-policy).

Appelé typiquement à la fin de chaque épisode ou après N steps.

Returns

Promise<void>

Implementation of

AgentInterface.train


getState()

getState(): Record<string, unknown>

Defined in: backend-tfjs/src/agents/ppo.ts:427 

Serialize internal state (epsilon, stepCount, etc.) for checkpointing.

Returns

Record<string, unknown>

Implementation of

AgentInterface.getState


setState()

setState(state): void

Defined in: backend-tfjs/src/agents/ppo.ts:434 

Restore internal state from a serialized object.

Parameters

state

Record<string, unknown>

Returns

void

Implementation of

AgentInterface.setState


save()

save(modelId, metadata?): Promise<string>

Defined in: backend-tfjs/src/agents/ppo.ts:439 

Save the agent’s model and state. Returns URI or void.

Parameters

modelId

string

metadata?

Record<string, unknown>

Returns

Promise<string>

Implementation of

AgentInterface.save


load()

load(modelId): Promise<void>

Defined in: backend-tfjs/src/agents/ppo.ts:452 

Load a previously saved model and state.

Parameters

modelId

string

Returns

Promise<void>

Implementation of

AgentInterface.load


dispose()

dispose(): void

Defined in: backend-tfjs/src/agents/ppo.ts:464 

Release TF/GPU/WASM resources held by the agent

Returns

void

Implementation of

AgentInterface.dispose

Last updated on