Standardize AI model response temperature across provider specific ranges

debanjum · debanjum · commit d1df9586ca3f · 2025-03-23T18:09:22.000+05:30
- Anthropic expects a 0-1 range. Gemini &amp; OpenAI expect a 0-2 range
- Anneal temperature to explore reasoning trajectories but respond factually
- Default send_message_to_model and extract_question temps to the same
diff --git a/src/khoj/processor/conversation/anthropic/anthropic_chat.py b/src/khoj/processor/conversation/anthropic/anthropic_chat.py
@@ -35,7 +35,6 @@ def extract_questions_anthropic(
     conversation_log={},
     api_key=None,
     api_base_url=None,
-    temperature=0.7,
     location_data: LocationData = None,
     user: KhojUser = None,
     query_images: Optional[list[str]] = None,
@@ -101,7 +100,6 @@ def extract_questions_anthropic(
         messages=messages,
         system_prompt=system_prompt,
         model_name=model,
-        temperature=temperature,
         api_key=api_key,
         api_base_url=api_base_url,
         response_type="json_object",
@@ -242,7 +240,7 @@ def converse_anthropic(
         compiled_references=references,
         online_results=online_results,
         model_name=model,
-        temperature=0,
+        temperature=0.2,
         api_key=api_key,
         api_base_url=api_base_url,
         system_prompt=system_prompt,
diff --git a/src/khoj/processor/conversation/anthropic/utils.py b/src/khoj/processor/conversation/anthropic/utils.py
@@ -56,7 +56,7 @@ def anthropic_completion_with_backoff(
     messages,
     system_prompt,
     model_name: str,
-    temperature=0,
+    temperature=0.4,
     api_key=None,
     api_base_url: str = None,
     model_kwargs=None,
diff --git a/src/khoj/processor/conversation/google/gemini_chat.py b/src/khoj/processor/conversation/google/gemini_chat.py
@@ -35,7 +35,6 @@ def extract_questions_gemini(
     conversation_log={},
     api_key=None,
     api_base_url=None,
-    temperature=0.6,
     max_tokens=None,
     location_data: LocationData = None,
     user: KhojUser = None,
@@ -103,7 +102,6 @@ def extract_questions_gemini(
         model,
         api_base_url=api_base_url,
         response_type="json_object",
-        temperature=temperature,
         tracer=tracer,
     )
 
@@ -130,7 +128,6 @@ def gemini_send_message_to_model(
     api_base_url=None,
     response_type="text",
     response_schema=None,
-    temperature=0.6,
     model_kwargs=None,
     tracer={},
 ):
@@ -153,7 +150,6 @@ def gemini_send_message_to_model(
         model_name=model,
         api_key=api_key,
         api_base_url=api_base_url,
-        temperature=temperature,
         model_kwargs=model_kwargs,
         tracer=tracer,
     )
@@ -168,7 +164,7 @@ def converse_gemini(
     model: Optional[str] = "gemini-2.0-flash",
     api_key: Optional[str] = None,
     api_base_url: Optional[str] = None,
-    temperature: float = 0.6,
+    temperature: float = 0.4,
     completion_func=None,
     conversation_commands=[ConversationCommand.Default],
     max_prompt_size=None,
diff --git a/src/khoj/processor/conversation/google/utils.py b/src/khoj/processor/conversation/google/utils.py
@@ -73,7 +73,7 @@ def get_gemini_client(api_key, api_base_url=None) -> genai.Client:
     reraise=True,
 )
 def gemini_completion_with_backoff(
-    messages, system_prompt, model_name, temperature=0, api_key=None, api_base_url=None, model_kwargs=None, tracer={}
+    messages, system_prompt, model_name, temperature=0.8, api_key=None, api_base_url=None, model_kwargs=None, tracer={}
 ) -> str:
     client = gemini_clients.get(api_key)
     if not client:
diff --git a/src/khoj/processor/conversation/openai/gpt.py b/src/khoj/processor/conversation/openai/gpt.py
@@ -63,7 +63,6 @@ def extract_questions(
     today = datetime.today()
     current_new_year = today.replace(month=1, day=1)
     last_new_year = current_new_year.replace(year=today.year - 1)
-    temperature = 0.7
 
     prompt = prompts.extract_questions.format(
         current_date=today.strftime("%Y-%m-%d"),
@@ -99,7 +98,6 @@ def extract_questions(
         model,
         response_type="json_object",
         api_base_url=api_base_url,
-        temperature=temperature,
         tracer=tracer,
     )
 
@@ -127,7 +125,6 @@ def send_message_to_model(
     response_type="text",
     response_schema=None,
     api_base_url=None,
-    temperature=0,
     tracer: dict = {},
 ):
     """
@@ -146,7 +143,6 @@ def send_message_to_model(
         messages=messages,
         model_name=model,
         openai_api_key=api_key,
-        temperature=temperature,
         api_base_url=api_base_url,
         model_kwargs=model_kwargs,
         tracer=tracer,
@@ -162,7 +158,7 @@ def converse_openai(
     model: str = "gpt-4o-mini",
     api_key: Optional[str] = None,
     api_base_url: Optional[str] = None,
-    temperature: float = 0.2,
+    temperature: float = 0.4,
     completion_func=None,
     conversation_commands=[ConversationCommand.Default],
     max_prompt_size=None,
diff --git a/src/khoj/processor/conversation/openai/utils.py b/src/khoj/processor/conversation/openai/utils.py
@@ -48,7 +48,7 @@
 def completion_with_backoff(
     messages,
     model_name: str,
-    temperature=0,
+    temperature=0.8,
     openai_api_key=None,
     api_base_url=None,
     model_kwargs: dict = {},

Original file line number	Diff line number	Diff line change
`@@ -73,7 +73,7 @@ def get_gemini_client(api_key, api_base_url=None) -> genai.Client:`
`73`	`73`	`reraise=True,`
`74`	`74`	`)`
`75`	`75`	`def gemini_completion_with_backoff(`
`76`		`- messages, system_prompt, model_name, temperature=0, api_key=None, api_base_url=None, model_kwargs=None, tracer={}`
	`76`	`+ messages, system_prompt, model_name, temperature=0.8, api_key=None, api_base_url=None, model_kwargs=None, tracer={}`
`77`	`77`	`) -> str:`
`78`	`78`	`client = gemini_clients.get(api_key)`
`79`	`79`	`if not client:`