Print KV Cache available memory and block memory usage in GB format (#4148)

qw86972190 · web-flow · commit b52971749c4e · 2025-09-17T20:01:55.000+08:00
diff --git a/fastdeploy/worker/worker_process.py b/fastdeploy/worker/worker_process.py
@@ -382,7 +382,7 @@ def initialize_kv_cache(self) -> None:
             if num_blocks_local > 40000:
                 logger.info(f"------- Reset num_blocks_local {num_blocks_local} to 40000")
                 num_blocks_local = min(40000, num_blocks_local)
-            logger.info(f"------- model_block_memory_used:{model_block_memory_used} --------")
+            logger.info(f"------- model_block_memory_used:{model_block_memory_used / 1024**3} GB --------")
             logger.info(f"------- num_blocks_local:{num_blocks_local} --------")
 
             if num_blocks_local <= 0: