braintrustdata · jasonhp · Dec 27, 2024 · Jan 27, 2025
diff --git a/README.md b/README.md
@@ -2,7 +2,7 @@
 
 The Braintrust AI proxy offers a unified way to access the world's leading AI models through a single API, including
 models from [OpenAI](https://platform.openai.com/docs/models), [Anthropic](https://docs.anthropic.com/claude/reference/getting-started-with-the-api), [LLaMa 2](https://ai.meta.com/llama/),
-[Mistral](https://mistral.ai/), and more. The benefits of using the proxy include:
+[Mistral](https://mistral.ai/), [Novita AI](https://novita.ai/models/llm?utm_source=github_braintrustdata&utm_medium=github_readme&utm_campaign=github_link) and more. The benefits of using the proxy include:
 
 - **Code Simplification**: Use a consistent API across different AI providers.
 - **Cost Reduction**: The proxy automatically caches results, reusing them when possible.

diff --git a/packages/proxy/schema/index.ts b/packages/proxy/schema/index.ts
@@ -30,6 +30,7 @@ export const ModelEndpointType = [
   "fireworks",
   "cerebras",
   "mistral",
+  "novita",
   "ollama",
   "groq",
   "xAI",
@@ -221,6 +222,41 @@ export const AvailableEndpointTypes: { [name: string]: ModelEndpointType[] } = {
   "amazon.nova-lite-v1:0": ["bedrock"],
   "amazon.nova-micro-v1:0": ["bedrock"],
   "grok-beta": ["xAI"],
+
+  "deepseek/deepseek-r1": ["novita"],
+  "deepseek/deepseek_v3": ["novita"],
+  "meta-llama/llama-3.3-70b-instruct": ["novita"],
+  "meta-llama/llama-3.1-8b-instruct": ["novita"],
+  "meta-llama/llama-3.1-8b-instruct-max": ["novita"],
+  "meta-llama/llama-3.1-70b-instruct": ["novita"],
+  "meta-llama/llama-3.1-405b-instruct": ["novita"],
+  "meta-llama/llama-3-8b-instruct": ["novita"],
+  "meta-llama/llama-3-70b-instruct": ["novita"],
+  "gryphe/mythomax-l2-13b": ["novita"],
+  "google/gemma-2-9b-it": ["novita"],
+  "mistralai/mistral-nemo": ["novita"],
+  "microsoft/wizardlm-2-8x22b": ["novita"],
+  "mistralai/mistral-7b-instruct": ["novita"],
+  "openchat/openchat-7b": ["novita"],
+  "nousresearch/hermes-2-pro-llama-3-8b": ["novita"],
+  "sao10k/l3-70b-euryale-v2.1": ["novita"],
+  "cognitivecomputations/dolphin-mixtral-8x22b": ["novita"],
+  "jondurbin/airoboros-l2-70b": ["novita"],
+  "lzlv_70b": ["novita"],
+  "nousresearch/nous-hermes-llama2-13b": ["novita"],
+  "teknium/openhermes-2.5-mistral-7b": ["novita"],
+  "sophosympatheia/midnight-rose-70b": ["novita"],
+  "Sao10K/L3-8B-Stheno-v3.2": ["novita"],
+  "sao10k/l3-8b-lunaris": ["novita"],
+  "qwen/qwen-2-vl-72b-instruct": ["novita"],
+  "meta-llama/llama-3.2-1b-instruct": ["novita"],
+  "meta-llama/llama-3.2-11b-vision-instruct": ["novita"],
+  "meta-llama/llama-3.2-3b-instruct": ["novita"],
+  "meta-llama/llama-3.1-8b-instruct-bf16": ["novita"],
+  "qwen/qwen-2.5-72b-instruct": ["novita"],
+  "sao10k/l31-70b-euryale-v2.2": ["novita"],
+  "qwen/qwen-2-7b-instruct": ["novita"],
+  "qwen/qwen-2-72b-instruct": ["novita"],
 };
 
 export function getModelEndpointTypes(model: string): ModelEndpointType[] {
@@ -242,6 +278,7 @@ export const AISecretTypes: { [keyName: string]: ModelEndpointType } = {
   FIREWORKS_API_KEY: "fireworks",
   GOOGLE_API_KEY: "google",
   MISTRAL_API_KEY: "mistral",
+  NOVITA_API_KEY: "novita",
   OLLAMA_API_KEY: "ollama",
   GROQ_API_KEY: "groq",
   CEREBRAS_API_KEY: "cerebras",
@@ -258,6 +295,7 @@ export const EndpointProviderToBaseURL: {
   together: "https://api.together.xyz/v1",
   google: "https://generativelanguage.googleapis.com/v1beta",
   mistral: "https://api.mistral.ai/v1",
+  novita: "https://api.novita.ai/v3/openai",
   ollama: "http://127.0.0.1:11434/v1",
   groq: "https://api.groq.com/openai/v1",
   lepton: "https://<model>.lepton.run/api/v1/", // As far as I can tell, this works for all models

diff --git a/packages/proxy/schema/models.ts b/packages/proxy/schema/models.ts
@@ -1088,4 +1088,244 @@ export const AvailableModels: { [name: string]: ModelSpec } = {
     flavor: "completion",
     displayName: "Text-block",
   },
+
+  // Novita AI Models
+  "meta-llama/llama-3.3-70b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.39,
+    output_cost_per_mil_tokens: 0.39,
+    displayName: "Llama 3.3 70B Instruct",
+  },
+  "meta-llama/llama-3.1-8b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.05,
+    output_cost_per_mil_tokens: 0.05,
+    displayName: "Llama 3.1 8B Instruct",
+  },
+  "meta-llama/llama-3.1-8b-instruct-max": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.05,
+    output_cost_per_mil_tokens: 0.05,
+    displayName: "Llama3.1 8B Instruct Max",
+  },
+  "meta-llama/llama-3.1-70b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.34,
+    output_cost_per_mil_tokens: 0.39,
+    displayName: "Llama 3.1 70B Instruct",
+  },
+  "meta-llama/llama-3.1-405b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 2.75,
+    output_cost_per_mil_tokens: 2.75,
+    displayName: "Llama 3.1 405B Instruct",
+  },
+  "meta-llama/llama-3-8b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.04,
+    output_cost_per_mil_tokens: 0.04,
+    displayName: "Llama 3 8B Instruct",
+  },
+  "meta-llama/llama-3-70b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.51,
+    output_cost_per_mil_tokens: 0.74,
+    displayName: "Llama3 70b Instruct",
+  },
+  "gryphe/mythomax-l2-13b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.09,
+    output_cost_per_mil_tokens: 0.09,
+    displayName: "Mythomax L2 13B",
+  },
+  "google/gemma-2-9b-it": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.08,
+    output_cost_per_mil_tokens: 0.08,
+    displayName: "Gemma 2 9B",
+  },
+  "mistralai/mistral-nemo": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.17,
+    output_cost_per_mil_tokens: 0.17,
+    displayName: "Mistral Nemo",
+  },
+  "microsoft/wizardlm-2-8x22b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.62,
+    output_cost_per_mil_tokens: 0.62,
+    displayName: "Wizardlm 2 8x22B",
+  },
+  "mistralai/mistral-7b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.059,
+    output_cost_per_mil_tokens: 0.059,
+    displayName: "Mistral 7B Instruct",
+  },
+  "openchat/openchat-7b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.06,
+    output_cost_per_mil_tokens: 0.06,
+    displayName: "OpenChat 7B",
+  },
+  "nousresearch/hermes-2-pro-llama-3-8b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.14,
+    output_cost_per_mil_tokens: 0.14,
+    displayName: "Hermes 2 Pro Llama 3 8B",
+  },
+  "sao10k/l3-70b-euryale-v2.1": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 1.48,
+    output_cost_per_mil_tokens: 1.48,
+    displayName: "L3 70B Euryale V2.1",
+  },
+  "cognitivecomputations/dolphin-mixtral-8x22b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.90,
+    output_cost_per_mil_tokens: 0.90,
+    displayName: "Dolphin Mixtral 8x22B",
+  },
+  "jondurbin/airoboros-l2-70b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.50,
+    output_cost_per_mil_tokens: 0.50,
+    displayName: "Airoboros L2 70B",
+  },
+  "lzlv_70b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.58,
+    output_cost_per_mil_tokens: 0.78,
+    displayName: "lzlv_70b",
+  },
+  "nousresearch/nous-hermes-llama2-13b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.17,
+    output_cost_per_mil_tokens: 0.17,
+    displayName: "Nous Hermes Llama2 13B",
+  },
+  "teknium/openhermes-2.5-mistral-7b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.17,
+    output_cost_per_mil_tokens: 0.17,
+    displayName: "Openhermes2.5 Mistral 7B",
+  },
+  "sophosympatheia/midnight-rose-70b": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.80,
+    output_cost_per_mil_tokens: 0.80,
+    displayName: "Midnight Rose 70B",
+  },
+  "Sao10K/L3-8B-Stheno-v3.2": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.05,
+    output_cost_per_mil_tokens: 0.05,
+    displayName: "L3 8B Stheno V3.2",
+  },
+  "sao10k/l3-8b-lunaris": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.05,
+    output_cost_per_mil_tokens: 0.05,
+    displayName: "Sao10k L3 8B Lunaris",
+  },
+  "qwen/qwen-2-vl-72b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.45,
+    output_cost_per_mil_tokens: 0.45,
+    displayName: "Qwen 2 VL 72B Instruct",
+  },
+  "meta-llama/llama-3.2-1b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.02,
+    output_cost_per_mil_tokens: 0.02,
+    displayName: "Llama 3.2 1B Instruct",
+  },
+  "meta-llama/llama-3.2-11b-vision-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.06,
+    output_cost_per_mil_tokens: 0.06,
+    displayName: "Llama 3.2 11B Vision Instruct",
+  },
+  "meta-llama/llama-3.2-3b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.03,
+    output_cost_per_mil_tokens: 0.05,
+    displayName: "Llama 3.2 3B Instruct",
+  },
+  "meta-llama/llama-3.1-8b-instruct-bf16": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.06,
+    output_cost_per_mil_tokens: 0.06,
+    displayName: "Llama 3.1 8B Instruct BF16",
+  },
+  "qwen/qwen-2.5-72b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.38,
+    output_cost_per_mil_tokens: 0.40,
+    displayName: "Qwen 2.5 72B Instruct",
+  },
+  "sao10k/l31-70b-euryale-v2.2": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 1.48,
+    output_cost_per_mil_tokens: 1.48,
+    displayName: "L31 70B Euryale V2.2",
+  },
+  "qwen/qwen-2-7b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.054,
+    output_cost_per_mil_tokens: 0.054,
+    displayName: "Qwen 2 7B Instruct",
+  },
+  "qwen/qwen-2-72b-instruct": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.34,
+    output_cost_per_mil_tokens: 0.39,
+    displayName: "Qwen2 72B Instruct",
+  },
+  "deepseek/deepseek-r1": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 4.0,
+    output_cost_per_mil_tokens: 4.0,
+    displayName: "DeepSeek R1",
+  },
+  "deepseek/deepseek_v3": {
+    format: "openai",
+    flavor: "chat",
+    input_cost_per_mil_tokens: 0.89,
+    output_cost_per_mil_tokens: 0.89,
+    displayName: "DeepSeek V3",
+  },
 };
diff --git a/packages/proxy/schema/secrets.ts b/packages/proxy/schema/secrets.ts
@@ -59,6 +59,7 @@ export const APISecretSchema = z.union([
         "replicate",
         "together",
         "mistral",
+        "novita",
         "ollama",
         "groq",
         "lepton",