chore(version): bump to v0.11.1 (gpt-5 defaults, timeouts, global stats, editor fix)v0.11.1

author: Paul Buetow <paul@buetow.org> 2025-09-17 22:49:13 +0300
committer: Paul Buetow <paul@buetow.org> 2025-09-17 22:49:13 +0300
commit: d059ae333fa1c89cb58d7fb56ead79cdba15d5db (patch)
tree: ae65ad59c8590f71232a6abefee312b72ddf6d3e /internal/llm/openai.go
parent: 88103657fb230bb41217a06aa5602ae23e7acb8b (diff)
1 files changed, 20 insertions, 7 deletions
diff --git a/internal/llm/openai.go b/internal/llm/openai.go
index e9a1fdc..8b00335 100644
--- a/internal/llm/openai.go
+++ b/internal/llm/openai.go
@@ -26,12 +26,13 @@ type openAIClient struct {
 }
 
 type oaChatRequest struct {
-	Model       string      `json:"model"`
-	Messages    []oaMessage `json:"messages"`
-	Temperature *float64    `json:"temperature,omitempty"`
-	MaxTokens   *int        `json:"max_tokens,omitempty"`
-	Stop        []string    `json:"stop,omitempty"`
-	Stream      bool        `json:"stream,omitempty"`
+	Model               string      `json:"model"`
+	Messages            []oaMessage `json:"messages"`
+	Temperature         *float64    `json:"temperature,omitempty"`
+	MaxTokens           *int        `json:"max_tokens,omitempty"`
+	MaxCompletionTokens *int        `json:"max_completion_tokens,omitempty"`
+	Stop                []string    `json:"stop,omitempty"`
+	Stream              bool        `json:"stream,omitempty"`
 }
 
 type oaMessage struct {
@@ -208,7 +209,11 @@ func buildOAChatRequest(o Options, messages []Message, defaultTemp *float64, str
 		req.Temperature = &t
 	}
 	if o.MaxTokens > 0 {
-		req.MaxTokens = &o.MaxTokens
+		if requiresMaxCompletionTokens(o.Model) {
+			req.MaxCompletionTokens = &o.MaxTokens
+		} else {
+			req.MaxTokens = &o.MaxTokens
+		}
 	}
 	if len(o.Stop) > 0 {
 		req.Stop = o.Stop
@@ -216,6 +221,14 @@ func buildOAChatRequest(o Options, messages []Message, defaultTemp *float64, str
 	return req
 }
 
+// requiresMaxCompletionTokens reports whether the given model prefers the
+// new parameter name "max_completion_tokens" instead of "max_tokens". Newer
+// models (e.g., gpt-5 family) expect this per OpenAI's API error guidance.
+func requiresMaxCompletionTokens(model string) bool {
+	m := strings.ToLower(strings.TrimSpace(model))
+	return strings.HasPrefix(m, "gpt-5")
+}
+
 func (c openAIClient) doJSON(ctx context.Context, url string, body []byte, headers map[string]string) (*http.Response, error) {
 	req, err := http.NewRequestWithContext(ctx, http.MethodPost, url, bytes.NewReader(body))
 	if err != nil {
author	Paul Buetow <paul@buetow.org>	2025-09-17 22:49:13 +0300
committer	Paul Buetow <paul@buetow.org>	2025-09-17 22:49:13 +0300
commit	d059ae333fa1c89cb58d7fb56ead79cdba15d5db (patch)
tree	ae65ad59c8590f71232a6abefee312b72ddf6d3e /internal/llm/openai.go
parent	88103657fb230bb41217a06aa5602ae23e7acb8b (diff)