fix: auto-reload model for remote engine (#1971)

vansangpfiev · sangjanai · web-flow · commit c18c65050da9 · 2025-02-15T06:07:18.000+07:00
Co-authored-by: sangjanai &lt;sang@jan.ai&gt;
diff --git a/engine/controllers/engines.cc b/engine/controllers/engines.cc
@@ -379,19 +379,21 @@ void Engines::UpdateEngine(
           metadata = (*exist_engine).metadata;
         }
 
-        (void) engine_service_->UnloadEngine(engine);
+        (void)engine_service_->UnloadEngine(engine);
 
         auto upd_res =
             engine_service_->UpsertEngine(engine, type, api_key, url, version,
                                           "all-platforms", status, metadata);
         if (upd_res.has_error()) {
           Json::Value res;
           res["message"] = upd_res.error();
+          CTL_WRN("Error: " << upd_res.error());
           auto resp = cortex_utils::CreateCortexHttpJsonResponse(res);
           resp->setStatusCode(k400BadRequest);
           callback(resp);
         } else {
           Json::Value res;
+          CTL_INF("Remote Engine update successfully!");
           res["message"] = "Remote Engine update successfully!";
           auto resp = cortex_utils::CreateCortexHttpJsonResponse(res);
           resp->setStatusCode(k200OK);
@@ -400,6 +402,7 @@ void Engines::UpdateEngine(
       } else {
         Json::Value res;
         res["message"] = "Request body is empty!";
+        CTL_WRN("Error: Request body is empty!");
         auto resp = cortex_utils::CreateCortexHttpJsonResponse(res);
         resp->setStatusCode(k400BadRequest);
         callback(resp);
diff --git a/engine/services/inference_service.cc b/engine/services/inference_service.cc
@@ -38,7 +38,7 @@ cpp::result<void, InferResult> InferenceService::HandleChatCompletion(
     LOG_WARN << "Engine is not loaded yet";
     return cpp::fail(std::make_pair(stt, res));
   }
- 
+
   if (!model_id.empty()) {
     if (auto model_service = model_service_.lock()) {
       auto metadata_ptr = model_service->GetCachedModelMetadata(model_id);
@@ -72,7 +72,6 @@ cpp::result<void, InferResult> InferenceService::HandleChatCompletion(
     }
   }
 
-
   CTL_DBG("Json body inference: " + json_body->toStyledString());
 
   auto cb = [q, tool_choice](Json::Value status, Json::Value res) {
@@ -217,10 +216,9 @@ InferResult InferenceService::LoadModel(
     std::get<RemoteEngineI*>(engine_result.value())
         ->LoadModel(json_body, std::move(cb));
   }
-  if (!engine_service_->IsRemoteEngine(engine_type)) {
-    auto model_id = json_body->get("model", "").asString();
-    saved_models_[model_id] = json_body;
-  }
+  // Save model config to reload if needed
+  auto model_id = json_body->get("model", "").asString();
+  saved_models_[model_id] = json_body;
   return std::make_pair(stt, r);
 }
 

Original file line number	Diff line number	Diff line change
`@@ -38,7 +38,7 @@ cpp::result<void, InferResult> InferenceService::HandleChatCompletion(`
`38`	`38`	`LOG_WARN << "Engine is not loaded yet";`
`39`	`39`	`return cpp::fail(std::make_pair(stt, res));`
`40`	`40`	`}`
`41`		`-`
	`41`	`+`
`42`	`42`	`if (!model_id.empty()) {`
`43`	`43`	`if (auto model_service = model_service_.lock()) {`
`44`	`44`	`auto metadata_ptr = model_service->GetCachedModelMetadata(model_id);`
`@@ -72,7 +72,6 @@ cpp::result<void, InferResult> InferenceService::HandleChatCompletion(`
`72`	`72`	`}`
`73`	`73`	`}`
`74`	`74`
`75`		`-`
`76`	`75`	`CTL_DBG("Json body inference: " + json_body->toStyledString());`
`77`	`76`
`78`	`77`	`auto cb = [q, tool_choice](Json::Value status, Json::Value res) {`
`@@ -217,10 +216,9 @@ InferResult InferenceService::LoadModel(`
`217`	`216`	`std::get<RemoteEngineI*>(engine_result.value())`
`218`	`217`	`->LoadModel(json_body, std::move(cb));`
`219`	`218`	`}`
`220`		`- if (!engine_service_->IsRemoteEngine(engine_type)) {`
`221`		`- auto model_id = json_body->get("model", "").asString();`
`222`		`- saved_models_[model_id] = json_body;`
`223`		`- }`
	`219`	`+ // Save model config to reload if needed`
	`220`	`+ auto model_id = json_body->get("model", "").asString();`
	`221`	`+ saved_models_[model_id] = json_body;`
`224`	`222`	`return std::make_pair(stt, r);`
`225`	`223`	`}`
`226`	`224`