fix use-after-free

ngxson · ngxson · commit 105e2f3cf67c · 2025-12-20T19:38:20.000+01:00
diff --git a/tools/server/server-context.cpp b/tools/server/server-context.cpp
@@ -809,14 +809,11 @@ struct server_context_impl {
             batch = llama_batch_init(std::max(n_batch, params_base.n_parallel), 0, 1);
         }
 
-        if (is_resume) {
-            return true;
+        // preserve metric state across resumes
+        if (!is_resume) {
+            metrics.init();
         }
 
-        // everything below this line is only for fresh model load
-
-        metrics.init();
-
         if (params_base.cache_ram_mib != 0) {
             if (params_base.cache_ram_mib < 0) {
                 SRV_WRN("prompt cache is enabled, size limit: %s\n", "no limit");