extend chat completion response

michal.zyga · michal.zyga · commit b25fd4c11efc · 2025-03-03T08:53:55.000+01:00
diff --git a/core/src/main/scala/sttp/openai/requests/completions/Usage.scala b/core/src/main/scala/sttp/openai/requests/completions/Usage.scala
@@ -2,8 +2,60 @@ package sttp.openai.requests.completions
 
 import sttp.openai.json.SnakePickle
 
-case class Usage(promptTokens: Int, completionTokens: Int, totalTokens: Int)
+/** @param promptTokens
+  *   Number of tokens in the prompt.
+  * @param completionTokens
+  *   Number of tokens in the generated completion.
+  * @param totalTokens
+  *   Total number of tokens used in the request (prompt + completion).
+  * @param completionTokensDetails
+  *   Breakdown of tokens used in a completion.
+  * @param promptTokensDetails
+  *   Breakdown of tokens used in the prompt.
+  */
+case class Usage(
+    promptTokens: Int,
+    completionTokens: Int,
+    totalTokens: Int,
+    completionTokensDetails: CompletionTokensDetails,
+    promptTokensDetails: PromptTokensDetails
+)
 
 object Usage {
   implicit val choicesR: SnakePickle.Reader[Usage] = SnakePickle.macroR[Usage]
 }
+
+/** @param acceptedPredictionTokens
+  *   When using Predicted Outputs, the number of tokens in the prediction that appeared in the completion.
+  * @param audioTokens
+  *   Audio input tokens generated by the model.
+  * @param reasoningTokens
+  *   Tokens generated by the model for reasoning.
+  * @param rejectedPredictionTokens
+  *   When using Predicted Outputs, the number of tokens in the prediction that did not appear in the completion. However, like reasoning
+  *   tokens, these tokens are still counted in the total completion tokens for purposes of billing, output, and context window limits.
+  */
+case class CompletionTokensDetails(
+    acceptedPredictionTokens: Int,
+    audioTokens: Int,
+    reasoningTokens: Int,
+    rejectedPredictionTokens: Int
+)
+
+object CompletionTokensDetails {
+  implicit val completionTokensDetailsR: SnakePickle.Reader[CompletionTokensDetails] = SnakePickle.macroR[CompletionTokensDetails]
+}
+
+/** @param audioTokens
+  *   Audio input tokens present in the prompt.
+  * @param cachedTokens
+  *   Cached tokens present in the prompt.
+  */
+case class PromptTokensDetails(
+    audioTokens: Int,
+    cachedTokens: Int
+)
+
+object PromptTokensDetails {
+  implicit val promptTokensDetailsR: SnakePickle.Reader[PromptTokensDetails] = SnakePickle.macroR[PromptTokensDetails]
+}
diff --git a/core/src/main/scala/sttp/openai/requests/threads/runs/ThreadRunsResponseData.scala b/core/src/main/scala/sttp/openai/requests/threads/runs/ThreadRunsResponseData.scala
@@ -1,7 +1,6 @@
 package sttp.openai.requests.threads.runs
 
 import sttp.openai.json.SnakePickle
-import sttp.openai.requests.completions.Usage
 import sttp.openai.requests.completions.chat.message.{Tool, ToolResources}
 
 object ThreadRunsResponseData {
@@ -442,4 +441,17 @@ object ThreadRunsResponseData {
   object ListRunStepsResponse {
     implicit val listRunStepsResponseR: SnakePickle.Reader[ListRunStepsResponse] = SnakePickle.macroR[ListRunStepsResponse]
   }
+
+  /** @param promptTokens
+    *   Number of tokens in the prompt.
+    * @param completionTokens
+    *   Number of tokens in the generated completion.
+    * @param totalTokens
+    *   Total number of tokens used in the request (prompt + completion).
+    */
+  case class Usage(promptTokens: Int, completionTokens: Int, totalTokens: Int)
+
+  object Usage {
+    implicit val choicesR: SnakePickle.Reader[Usage] = SnakePickle.macroR[Usage]
+  }
 }
diff --git a/core/src/test/scala/sttp/openai/fixtures/ChatFixture.scala b/core/src/test/scala/sttp/openai/fixtures/ChatFixture.scala
@@ -151,7 +151,17 @@ object ChatFixture {
       |  "usage": {
       |    "prompt_tokens": 10,
       |    "completion_tokens": 10,
-      |    "total_tokens": 20
+      |    "total_tokens": 20,
+      |    "prompt_tokens_details": {
+      |      "cached_tokens": 1,
+      |      "audio_tokens": 2
+      |    },
+      |    "completion_tokens_details": {
+      |      "reasoning_tokens": 4,
+      |      "accepted_prediction_tokens": 3,
+      |      "rejected_prediction_tokens": 2,
+      |      "audio_tokens": 1
+      |    }
       |  },
       |  "choices": [
       |    {
diff --git a/core/src/test/scala/sttp/openai/fixtures/CompletionsFixture.scala b/core/src/test/scala/sttp/openai/fixtures/CompletionsFixture.scala
@@ -17,7 +17,17 @@ object CompletionsFixture {
                      |  "usage": {
                      |    "prompt_tokens": 5,
                      |    "completion_tokens": 8,
-                     |    "total_tokens": 13
+                     |    "total_tokens": 13,
+                     |    "prompt_tokens_details": {
+                     |      "cached_tokens": 1,
+                     |      "audio_tokens": 2
+                     |    },
+                     |    "completion_tokens_details": {
+                     |      "reasoning_tokens": 4,
+                     |      "accepted_prediction_tokens": 3,
+                     |      "rejected_prediction_tokens": 2,
+                     |      "audio_tokens": 1
+                     |    }
                      |  }
                      |}""".stripMargin
 
@@ -43,7 +53,17 @@ object CompletionsFixture {
                     |  "usage":{
                     |    "prompt_tokens":11,
                     |    "completion_tokens":14,
-                    |    "total_tokens":25
+                    |    "total_tokens":25,
+                    |    "prompt_tokens_details": {
+                    |      "cached_tokens": 1,
+                    |      "audio_tokens": 2
+                    |    },
+                    |    "completion_tokens_details": {
+                    |      "reasoning_tokens": 4,
+                    |      "accepted_prediction_tokens": 3,
+                    |      "rejected_prediction_tokens": 2,
+                    |      "audio_tokens": 1
+                    |    }
                     |  }
                     |}
                     |
diff --git a/core/src/test/scala/sttp/openai/requests/completions/CompletionsDataSpec.scala b/core/src/test/scala/sttp/openai/requests/completions/CompletionsDataSpec.scala
@@ -31,7 +31,14 @@ class CompletionsDataSpec extends AnyFlatSpec with Matchers with EitherValues {
       usage = Usage(
         promptTokens = 5,
         completionTokens = 8,
-        totalTokens = 13
+        totalTokens = 13,
+        completionTokensDetails = CompletionTokensDetails(
+          acceptedPredictionTokens = 3,
+          audioTokens = 1,
+          reasoningTokens = 4,
+          rejectedPredictionTokens = 2
+        ),
+        promptTokensDetails = PromptTokensDetails(audioTokens = 2, cachedTokens = 1)
       )
     )
 
@@ -97,7 +104,14 @@ class CompletionsDataSpec extends AnyFlatSpec with Matchers with EitherValues {
       usage = Usage(
         promptTokens = 11,
         completionTokens = 14,
-        totalTokens = 25
+        totalTokens = 25,
+        completionTokensDetails = CompletionTokensDetails(
+          acceptedPredictionTokens = 3,
+          audioTokens = 1,
+          reasoningTokens = 4,
+          rejectedPredictionTokens = 2
+        ),
+        promptTokensDetails = PromptTokensDetails(audioTokens = 2, cachedTokens = 1)
       )
     )
 
diff --git a/core/src/test/scala/sttp/openai/requests/completions/chat/ChatDataSpec.scala b/core/src/test/scala/sttp/openai/requests/completions/chat/ChatDataSpec.scala
@@ -6,9 +6,9 @@ import org.scalatest.matchers.should.Matchers
 import sttp.openai.fixtures
 import sttp.openai.json.{SnakePickle, SttpUpickleApiExtension}
 import sttp.openai.requests.completions.Stop.SingleStop
-import sttp.openai.requests.completions.Usage
 import sttp.openai.requests.completions.chat.ChatRequestBody.Format.Mp3
 import sttp.openai.requests.completions.chat.ChatRequestBody.Voice.Ash
+import sttp.openai.requests.completions.{CompletionTokensDetails, PromptTokensDetails, Usage}
 import sttp.openai.utils.ChatCompletionFixtures._
 
 class ChatDataSpec extends AnyFlatSpec with Matchers with EitherValues {
@@ -23,7 +23,14 @@ class ChatDataSpec extends AnyFlatSpec with Matchers with EitherValues {
     val usage: Usage = Usage(
       promptTokens = 10,
       completionTokens = 10,
-      totalTokens = 20
+      totalTokens = 20,
+      completionTokensDetails = CompletionTokensDetails(
+        acceptedPredictionTokens = 3,
+        audioTokens = 1,
+        reasoningTokens = 4,
+        rejectedPredictionTokens = 2
+      ),
+      promptTokensDetails = PromptTokensDetails(audioTokens = 2, cachedTokens = 1)
     )
 
     val message: Message = Message(
diff --git a/core/src/test/scala/sttp/openai/requests/threads/runs/ThreadRunsDataSpec.scala b/core/src/test/scala/sttp/openai/requests/threads/runs/ThreadRunsDataSpec.scala
@@ -6,13 +6,18 @@ import org.scalatest.matchers.should.Matchers
 import sttp.openai.fixtures
 import sttp.openai.json.{SnakePickle, SttpUpickleApiExtension}
 import sttp.openai.requests.completions.chat.message.Tool.{CodeInterpreterTool, FileSearchTool, FunctionTool}
-import sttp.openai.requests.completions.Usage
 import sttp.openai.requests.completions.chat.message.ToolResource.CodeInterpreterToolResource
 import sttp.openai.requests.completions.chat.message.ToolResources
 import sttp.openai.requests.threads.ThreadsRequestBody.CreateThreadBody
 import sttp.openai.requests.threads.messages.ThreadMessagesRequestBody.CreateMessage
 import sttp.openai.requests.threads.runs.ThreadRunsRequestBody.ToolOutput
-import sttp.openai.requests.threads.runs.ThreadRunsResponseData.{ListRunStepsResponse, ListRunsResponse, MessageCreation, RunStepData}
+import sttp.openai.requests.threads.runs.ThreadRunsResponseData.{
+  ListRunStepsResponse,
+  ListRunsResponse,
+  MessageCreation,
+  RunStepData,
+  Usage
+}
 import ujson.{Arr, Obj, Str}
 
 class ThreadRunsDataSpec extends AnyFlatSpec with Matchers with EitherValues {
@@ -119,8 +124,8 @@ class ThreadRunsDataSpec extends AnyFlatSpec with Matchers with EitherValues {
   }
 
   "Given list runs response as Json" should "be properly deserialized to case class" in {
-    import sttp.openai.requests.threads.runs.ThreadRunsResponseData.RunData
     import sttp.openai.requests.threads.runs.ThreadRunsResponseData.ListRunsResponse._
+    import sttp.openai.requests.threads.runs.ThreadRunsResponseData.RunData
 
     // given
     val jsonResponse = fixtures.ThreadRunsFixture.jsonListRunsResponse