ff

ManuelFay · ManuelFay · commit 487085deb8aa · 2025-02-21T18:07:49.000+01:00
diff --git a/scripts/configs/qwen2/train_colqwen2_gradcache_model.yaml b/scripts/configs/qwen2/train_colqwen2_gradcache_model.yaml
@@ -30,7 +30,7 @@ config:
   run_eval: true
   loss_func:
     (): colpali_engine.loss.gradcache_late_interaction_losses.GradCacheColbertPairwiseCELoss # GradCacheColbertLoss #
-    mini_batch_size: 64
+    mini_batch_size: 32
   tr_args:
     (): transformers.training_args.TrainingArguments
     output_dir: null
@@ -44,7 +44,7 @@ config:
     # gradient_accumulation_steps: 4
     per_device_eval_batch_size: 16
     eval_strategy: "steps"
-    dataloader_num_workers: 8 # 4
+    dataloader_num_workers: 4 # 4
     # bf16: true
     save_steps: 500
     logging_steps: 10