Skip to main content

State-machine's group workspace

Timestamps visible
2024-05-05 11:51:24
Progress: 22.7MB [00:01, 20.1MB/s]
2024-05-05 11:51:34
/usr/local/lib/python3.10/dist-packages/orbax/checkpoint/type_handlers.py:1475: UserWarning: Couldn't find sharding info under RestoreArgs. Populating sharding info from sharding file. Please note restoration time will be slightly increased due to reading from file instead of directly from RestoreArgs. Note also that this option is unsafe when restoring on a different topology than the checkpoint was saved with.
2024-05-05 11:51:34
  warnings.warn(
2024-05-05 11:51:34
Loaded pre-trained checkpoint as initial params!
2024-05-05 11:51:34
Checkpoint Config: {'action_emb_dim': 16, 'benchmark_id': 'medium-1m', 'checkpoint_path': '/workspace/xminigrid-datasets/checkpoints/medium-1m-R4-pretrained-extended-long-v12-XLand-MiniGrid-Extended-R4-13x13', 'clip_eps': 0.2, 'context_dropout': 0.0, 'context_emb_dim': 16, 'context_hidden_dim': 64, 'dataset_name': None, 'dataset_num_histories': 1, 'dataset_path': None, 'decay_lr': False, 'ent_coef': 0.0001, 'env_id': 'XLand-MiniGrid-Extended-R4-13x13', 'eval_episodes': 1024, 'eval_seed': 42, 'gae_lambda': 0.999, 'gamma': 0.995, 'group': 'xland-multi-task-test-v1', 'head_hidden_dim': 64, 'lr': 0.0006788652208039325, 'max_grad_norm': 0.5, 'name': 'ppo-rnn-multi-task-medium-XLand-MiniGrid-Extended-R4-13x13-medium-1m-65651', 'num_envs': 65536, 'num_minibatches': 64, 'num_steps': 256, 'obs_emb_dim': 16, 'pretrain_multitask': True, 'pretrained_checkpoint_path': None, 'project': 'xminigrid', 'rnn_hidden_dim': 512, 'rnn_num_layers': 1, 'ruleset_id': 65651, 'seed': 0, 'total_timesteps': 20000000000, 'update_epochs': 1, 'upload_to_hf_repo': None, 'use_bf16': True, 'vf_coef': 0.005, 'wandb_logging': True}
2024-05-05 11:51:34
Number of parameters: 1466103
2024-05-05 11:51:34
Compiling...
2024-05-05 11:52:08
Done in 34.39s.
2024-05-05 11:52:08
Training...
2024-05-05 13:12:07
Done in 4798.35s
2024-05-05 13:12:07
Final return:  0.0