huggingface · NathanHB · May 21, 2025 · May 20, 2025 · May 20, 2025 · May 20, 2025
diff --git a/src/lighteval/models/transformers/transformers_model.py b/src/lighteval/models/transformers/transformers_model.py
@@ -137,8 +137,8 @@ class TransformersModelConfig(ModelConfig):
     subfolder: str | None = None
     revision: str = "main"
     batch_size: PositiveInt | None = None
-    generation_size: PositiveInt = 256
     max_length: PositiveInt | None = None
+    model_loading_kwargs: dict = {}
     add_special_tokens: bool = True
     model_parallel: bool | None = None
     dtype: str | None = None
@@ -384,9 +384,8 @@ def _create_auto_model(self) -> transformers.PreTrainedModel:
 
         pretrained_config = self.transformers_config
 
-        kwargs = {}
         if "quantization_config" not in pretrained_config.to_dict():
-            kwargs["quantization_config"] = quantization_config
+            self.config.model_loading_kwargs["quantization_config"] = quantization_config
 
         model = AutoModelForCausalLM.from_pretrained(
             self.config.model_name,
@@ -395,7 +394,7 @@ def _create_auto_model(self) -> transformers.PreTrainedModel:
             device_map=device_map,
             torch_dtype=torch_dtype,
             trust_remote_code=self.config.trust_remote_code,
-            **kwargs,
+            **self.config.model_loading_kwargs,
         )
         # model.to(self.device)
         model.eval()