Update TogetherAI costs (#2380)

* update groq costs * update togetherai costs
Helicone · Aug 5, 2024 · b308ff0 · b308ff0
1 parent 99cb9ec
commit b308ff0
Show file tree

Hide file tree

Showing 5 changed files with 287 additions and 0 deletions.
diff --git a/costs/__tests__/ensureOnlyOne.ts b/costs/__tests__/ensureOnlyOne.ts
@@ -375,6 +375,13 @@ WHEN (request_response_log.model = 'meta-llama/Llama-3-8b-chat-hf') THEN 200 * r
 WHEN (request_response_log.model = 'NousResearch/Nous-Hermes-llama-2-7b') THEN 200 * request_response_log.prompt_tokens + 200 * request_response_log.completion_tokens
 WHEN (request_response_log.model = 'NousResearch/Nous-Hermes-Llama2-13b') THEN 225 * request_response_log.prompt_tokens + 225 * request_response_log.completion_tokens
 WHEN (request_response_log.model = 'togethercomputer/Llama-2-7B-32K-Instruct') THEN 200 * request_response_log.prompt_tokens + 200 * request_response_log.completion_tokens
+WHEN (request_response_log.model = 'meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo') THEN 880 * request_response_log.prompt_tokens + 880 * request_response_log.completion_tokens
+WHEN (request_response_log.model = 'meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo') THEN 180 * request_response_log.prompt_tokens + 180 * request_response_log.completion_tokens
+WHEN (request_response_log.model = 'meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo') THEN 5000 * request_response_log.prompt_tokens + 5000 * request_response_log.completion_tokens
+WHEN (request_response_log.model = 'meta-llama/Meta-Llama-3-70B-Instruct-Turbo') THEN 880 * request_response_log.prompt_tokens + 880 * request_response_log.completion_tokens
+WHEN (request_response_log.model = 'meta-llama/Meta-Llama-3-8B-Instruct-Turbo') THEN 180 * request_response_log.prompt_tokens + 180 * request_response_log.completion_tokens
+WHEN (request_response_log.model = 'meta-llama/Meta-Llama-3-70B-Instruct-Lite') THEN 540 * request_response_log.prompt_tokens + 540 * request_response_log.completion_tokens
+WHEN (request_response_log.model = 'meta-llama/Meta-Llama-3-8B-Instruct-Lite') THEN 100 * request_response_log.prompt_tokens + 100 * request_response_log.completion_tokens
 WHEN (request_response_log.model = 'zero-one-ai/Yi-34B') THEN 800 * request_response_log.prompt_tokens + 800 * request_response_log.completion_tokens
 WHEN (request_response_log.model = 'zero-one-ai/Yi-6B') THEN 200 * request_response_log.prompt_tokens + 200 * request_response_log.completion_tokens
 WHEN (request_response_log.model = 'google/gemma-2b') THEN 100 * request_response_log.prompt_tokens + 100 * request_response_log.completion_tokens

diff --git a/costs/src/providers/togetherai/chat/llama.ts b/costs/src/providers/togetherai/chat/llama.ts
@@ -137,4 +137,74 @@ export const costs: ModelRow[] = [
       completion_token: 0.0000002,
     },
   },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000088,
+      completion_token: 0.00000088,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000018,
+      completion_token: 0.00000018,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.000005,
+      completion_token: 0.000005,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-70B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000088,
+      completion_token: 0.00000088,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-8B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000018,
+      completion_token: 0.00000018,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-70B-Instruct-Lite",
+    },
+    cost: {
+      prompt_token: 0.00000054,
+      completion_token: 0.00000054,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-8B-Instruct-Lite",
+    },
+    cost: {
+      prompt_token: 0.0000001,
+      completion_token: 0.0000001,
+    },
+  },
 ];
diff --git a/valhalla/jawn/src/packages/cost/providers/togetherai/chat/llama.ts b/valhalla/jawn/src/packages/cost/providers/togetherai/chat/llama.ts
@@ -137,4 +137,74 @@ export const costs: ModelRow[] = [
       completion_token: 0.0000002,
     },
   },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000088,
+      completion_token: 0.00000088,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000018,
+      completion_token: 0.00000018,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.000005,
+      completion_token: 0.000005,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-70B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000088,
+      completion_token: 0.00000088,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-8B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000018,
+      completion_token: 0.00000018,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-70B-Instruct-Lite",
+    },
+    cost: {
+      prompt_token: 0.00000054,
+      completion_token: 0.00000054,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-8B-Instruct-Lite",
+    },
+    cost: {
+      prompt_token: 0.0000001,
+      completion_token: 0.0000001,
+    },
+  },
 ];
diff --git a/web/packages/cost/providers/togetherai/chat/llama.ts b/web/packages/cost/providers/togetherai/chat/llama.ts
@@ -137,4 +137,74 @@ export const costs: ModelRow[] = [
       completion_token: 0.0000002,
     },
   },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000088,
+      completion_token: 0.00000088,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000018,
+      completion_token: 0.00000018,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.000005,
+      completion_token: 0.000005,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-70B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000088,
+      completion_token: 0.00000088,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-8B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000018,
+      completion_token: 0.00000018,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-70B-Instruct-Lite",
+    },
+    cost: {
+      prompt_token: 0.00000054,
+      completion_token: 0.00000054,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-8B-Instruct-Lite",
+    },
+    cost: {
+      prompt_token: 0.0000001,
+      completion_token: 0.0000001,
+    },
+  },
 ];
diff --git a/worker/src/packages/cost/providers/togetherai/chat/llama.ts b/worker/src/packages/cost/providers/togetherai/chat/llama.ts
@@ -137,4 +137,74 @@ export const costs: ModelRow[] = [
       completion_token: 0.0000002,
     },
   },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000088,
+      completion_token: 0.00000088,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000018,
+      completion_token: 0.00000018,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.000005,
+      completion_token: 0.000005,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-70B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000088,
+      completion_token: 0.00000088,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-8B-Instruct-Turbo",
+    },
+    cost: {
+      prompt_token: 0.00000018,
+      completion_token: 0.00000018,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-70B-Instruct-Lite",
+    },
+    cost: {
+      prompt_token: 0.00000054,
+      completion_token: 0.00000054,
+    },
+  },
+  {
+    model: {
+      operator: "equals",
+      value: "meta-llama/Meta-Llama-3-8B-Instruct-Lite",
+    },
+    cost: {
+      prompt_token: 0.0000001,
+      completion_token: 0.0000001,
+    },
+  },
 ];