mlcommons
diff --git a/‎DOCUMENTATION.md‎
Lines changed: 1 addition & 0 deletions b/‎DOCUMENTATION.md‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎algorithmic_efficiency/spec.py‎
Lines changed: 2 additions & 0 deletions b/‎algorithmic_efficiency/spec.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎prize_qualification_baselines/external_tuning/jax_nadamw_full_budget.py‎
Lines changed: 2 additions & 0 deletions b/‎prize_qualification_baselines/external_tuning/jax_nadamw_full_budget.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎prize_qualification_baselines/external_tuning/jax_nadamw_target_setting.py‎
Lines changed: 2 additions & 0 deletions b/‎prize_qualification_baselines/external_tuning/jax_nadamw_target_setting.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎prize_qualification_baselines/external_tuning/pytorch_nadamw_full_budget.py‎
Lines changed: 3 additions & 1 deletion b/‎prize_qualification_baselines/external_tuning/pytorch_nadamw_full_budget.py‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎prize_qualification_baselines/external_tuning/pytorch_nadamw_target_setting.py‎
Lines changed: 3 additions & 1 deletion b/‎prize_qualification_baselines/external_tuning/pytorch_nadamw_target_setting.py‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎prize_qualification_baselines/self_tuning/jax_nadamw_full_budget.py‎
Lines changed: 2 additions & 0 deletions b/‎prize_qualification_baselines/self_tuning/jax_nadamw_full_budget.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎prize_qualification_baselines/self_tuning/jax_nadamw_target_setting.py‎
Lines changed: 2 additions & 0 deletions b/‎prize_qualification_baselines/self_tuning/jax_nadamw_target_setting.py‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎prize_qualification_baselines/self_tuning/pytorch_nadamw_full_budget.py‎
Lines changed: 3 additions & 1 deletion b/‎prize_qualification_baselines/self_tuning/pytorch_nadamw_full_budget.py‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎prize_qualification_baselines/self_tuning/pytorch_nadamw_target_setting.py‎
Lines changed: 3 additions & 1 deletion b/‎prize_qualification_baselines/self_tuning/pytorch_nadamw_target_setting.py‎
Lines changed: 3 additions & 1 deletion
@@ -199,6 +199,7 @@ def update_params(
     batch: Dict[str, Tensor],
     loss_type: LossType,
     optimizer_state: OptimizerState,
+    train_state: Dict[str, Any],
     eval_results: List[Tuple[int, float]],
     global_step: int,
     rng: RandomState
 
@@ -401,6 +401,7 @@ def init_optimizer_state(workload: Workload,
     Dict[str, Tensor],
     LossType,
     OptimizerState,
+    Dict[str, Any],
     List[Tuple[int, float]],
     int,
     RandomState
@@ -422,6 +423,7 @@ def update_params(workload: Workload,
                   batch: Dict[str, Tensor],
                   loss_type: LossType,
                   optimizer_state: OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: RandomState) -> UpdateReturn:
 
@@ -260,12 +260,14 @@ def update_params(workload: spec.Workload,
                   batch: Dict[str, spec.Tensor],
                   loss_type: spec.LossType,
                   optimizer_state: spec.OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: spec.RandomState) -> spec.UpdateReturn:
   """Return (updated_optimizer_state, updated_params, updated_model_state)."""
   del current_params_types
   del loss_type
+  del train_state
   del eval_results
 
   optimizer_state, opt_update_fn = optimizer_state
 
@@ -260,12 +260,14 @@ def update_params(workload: spec.Workload,
                   batch: Dict[str, spec.Tensor],
                   loss_type: spec.LossType,
                   optimizer_state: spec.OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: spec.RandomState) -> spec.UpdateReturn:
   """Return (updated_optimizer_state, updated_params, updated_model_state)."""
   del current_params_types
   del loss_type
+  del train_state
   del eval_results
 
   optimizer_state, opt_update_fn = optimizer_state
 
@@ -1,7 +1,7 @@
 """Submission file for an NAdamW optimizer with warmup+cosine LR in PyTorch."""
 
 import math
-from typing import Dict, Iterator, List, Tuple
+from typing import Dict, Iterator, List, Tuple, Any
 
 from absl import logging
 import torch
@@ -232,12 +232,14 @@ def update_params(workload: spec.Workload,
                   batch: Dict[str, spec.Tensor],
                   loss_type: spec.LossType,
                   optimizer_state: spec.OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: spec.RandomState) -> spec.UpdateReturn:
   """Return (updated_optimizer_state, updated_params, updated_model_state)."""
   del current_params_types
   del loss_type
+  del train_state
   del eval_results
 
   current_model = current_param_container
 
@@ -1,7 +1,7 @@
 """Submission file for an NAdamW optimizer with warmup+cosine LR in PyTorch."""
 
 import math
-from typing import Dict, Iterator, List, Tuple
+from typing import Dict, Iterator, List, Tuple, Any
 
 from absl import logging
 import torch
@@ -232,12 +232,14 @@ def update_params(workload: spec.Workload,
                   batch: Dict[str, spec.Tensor],
                   loss_type: spec.LossType,
                   optimizer_state: spec.OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: spec.RandomState) -> spec.UpdateReturn:
   """Return (updated_optimizer_state, updated_params, updated_model_state)."""
   del current_params_types
   del loss_type
+  del train_state
   del eval_results
 
   current_model = current_param_container
 
@@ -272,12 +272,14 @@ def update_params(workload: spec.Workload,
                   batch: Dict[str, spec.Tensor],
                   loss_type: spec.LossType,
                   optimizer_state: spec.OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: spec.RandomState) -> spec.UpdateReturn:
   """Return (updated_optimizer_state, updated_params, updated_model_state)."""
   del current_params_types
   del loss_type
+  del train_state
   del eval_results
   del hyperparameters
 
 
@@ -272,12 +272,14 @@ def update_params(workload: spec.Workload,
                   batch: Dict[str, spec.Tensor],
                   loss_type: spec.LossType,
                   optimizer_state: spec.OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: spec.RandomState) -> spec.UpdateReturn:
   """Return (updated_optimizer_state, updated_params, updated_model_state)."""
   del current_params_types
   del loss_type
+  del train_state
   del eval_results
   del hyperparameters
 
 
@@ -1,7 +1,7 @@
 """Submission file for an NAdamW optimizer with warmup+cosine LR in PyTorch."""
 
 import math
-from typing import Dict, Iterator, List, Tuple
+from typing import Dict, Iterator, List, Tuple, Any
 
 from absl import logging
 import torch
@@ -244,12 +244,14 @@ def update_params(workload: spec.Workload,
                   batch: Dict[str, spec.Tensor],
                   loss_type: spec.LossType,
                   optimizer_state: spec.OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: spec.RandomState) -> spec.UpdateReturn:
   """Return (updated_optimizer_state, updated_params, updated_model_state)."""
   del current_params_types
   del loss_type
+  del train_state
   del eval_results
   del hyperparameters
 
 
@@ -1,7 +1,7 @@
 """Submission file for an NAdamW optimizer with warmup+cosine LR in PyTorch."""
 
 import math
-from typing import Dict, Iterator, List, Tuple
+from typing import Dict, Iterator, List, Tuple, Any
 
 from absl import logging
 import torch
@@ -244,12 +244,14 @@ def update_params(workload: spec.Workload,
                   batch: Dict[str, spec.Tensor],
                   loss_type: spec.LossType,
                   optimizer_state: spec.OptimizerState,
+                  train_state: Dict[str, Any],
                   eval_results: List[Tuple[int, float]],
                   global_step: int,
                   rng: spec.RandomState) -> spec.UpdateReturn:
   """Return (updated_optimizer_state, updated_params, updated_model_state)."""
   del current_params_types
   del loss_type
+  del train_state
   del eval_results
   del hyperparameters