fix: Improve embedding error handling and add semantic cache toggle

- Enhanced error messages in LocalEmbeddingService to show actual HTTP status and response - Added semantic-cache-enabled config parameter to disable semantic matching when embedding service unavailable - Improved error logging with full response details for debugging production issues - Prevents 'Invalid embedding response' errors by allowing graceful fallback
2026-03-04 16:49:22 -03:00 · 2026-03-04 16:49:22 -03:00 · d5b877f8e8
commit d5b877f8e8
parent 5404e3e7ba
2 changed files with 46 additions and 7 deletions
--- a/src/llm/cache.rs
+++ b/src/llm/cache.rs
@ -632,10 +632,39 @@ impl EmbeddingService for LocalEmbeddingService {
            .send()
            .await?;
-        let result: Value = response.json().await?;
+        let status = response.status();
        let response_text = response.text().await?;
        if !status.is_success() {
            debug!(
                "Embedding service HTTP error {}: {}",
                status,
                response_text
            );
            return Err(format!(
                "Embedding service returned HTTP {}: {}",
                status,
                response_text
            ).into());
        }
        let result: Value = serde_json::from_str(&response_text)
            .map_err(|e| {
                debug!("Failed to parse embedding JSON: {} - Response: {}", e, response_text);
                format!("Failed to parse embedding response JSON: {} - Response: {}", e, response_text)
            })?;
        if let Some(error) = result.get("error") {
            debug!("Embedding service returned error: {}", error);
            return Err(format!("Embedding service error: {}", error).into());
        }
        let embedding = result["data"][0]["embedding"]
            .as_array()
-            .ok_or("Invalid embedding response")?
+            .ok_or_else(|| {
                debug!("Invalid embedding response format. Expected data[0].embedding array. Got: {}", response_text);
                format!("Invalid embedding response format - Expected data[0].embedding array, got: {}", response_text)
            })?
            .iter()
            .filter_map(|v| v.as_f64().map(|f| f as f32))
            .collect();
--- a/src/main_module/bootstrap.rs
+++ b/src/main_module/bootstrap.rs
@ -748,17 +748,27 @@ fn init_llm_provider(
        let embedding_model = config_manager
            .get_config(&bot_id, "embedding-model", Some("all-MiniLM-L6-v2"))
            .unwrap_or_else(|_| "all-MiniLM-L6-v2".to_string());
        let semantic_cache_enabled = config_manager
            .get_config(&bot_id, "semantic-cache-enabled", Some("true"))
            .unwrap_or_else(|_| "true".to_string())
            .to_lowercase() == "true";
        info!("Embedding URL: {}", embedding_url);
        info!("Embedding Model: {}", embedding_model);
        info!("Semantic Cache Enabled: {}", semantic_cache_enabled);
-        let embedding_service = Some(Arc::new(LocalEmbeddingService::new(
+        let embedding_service = if semantic_cache_enabled {
-            embedding_url,
+            Some(Arc::new(LocalEmbeddingService::new(
-            embedding_model,
+                embedding_url,
-        )) as Arc<dyn EmbeddingService>);
+                embedding_model,
            )) as Arc<dyn EmbeddingService>)
        } else {
            None
        };
        let cache_config = CacheConfig {
            ttl: 3600,
-            semantic_matching: true,
+            semantic_matching: semantic_cache_enabled,
            similarity_threshold: 0.85,
            max_similarity_checks: 100,
            key_prefix: "llm_cache".to_string(),