Using the same weight_pointers key, added a TODO for a missing torch tensor conversion for is_dora

amitz-nv · amitz-nv · commit d59876ecdca2 · 2025-08-19T11:55:58.000Z
Signed-off-by: Amit Zuker &lt;203509407+amitz-nv@users.noreply.github.com&gt;
diff --git a/tensorrt_llm/_torch/pyexecutor/model_engine.py b/tensorrt_llm/_torch/pyexecutor/model_engine.py
@@ -2052,7 +2052,7 @@ def _get_lora_params_from_requests(self,
                                  module_id)] = {
                                      'adapter_size': [module.adapter_size],
                                      'is_dora': [scaling_vec_pointer == 0],
-                                     'weights_pointer': [
+                                     'weight_pointers': [
                                          module.weights_in_pointer,
                                          module.weights_out_pointer,
                                          scaling_vec_pointer
@@ -2087,11 +2087,13 @@ def _get_lora_params_from_requests(self,
                                 'is_dora'] += current_tmp_lora_params['is_dora']
                             current_lora_params[
                                 'weight_pointers'] += current_tmp_lora_params[
-                                    'weights_pointer']
+                                    'weight_pointers']
 
         for layer_id in lora_params:
             for module_id in lora_params[layer_id]:
                 current_lora_params = lora_params[layer_id][module_id]
+                # TODO: When lora_grouped_gemm supports DoRA: convert 'is_dora' to a bool tensor.
+                #       Until it's supported, that would just slow down this function, so better not to do it.
                 current_lora_params['adapter_size'] = torch.IntTensor(
                     current_lora_params['adapter_size'])
                 current_lora_params['weight_pointers'] = torch.LongTensor(