Completes OPEN-5690 Create Openlayer callback handler for LangChain support

gustavocidornelas · whoseoyster · commit 172bf1d4f746 · 2024-03-29T10:38:33.000-07:00
diff --git a/examples/monitoring/llms/langchain/langchain_callback.ipynb b/examples/monitoring/llms/langchain/langchain_callback.ipynb
@@ -0,0 +1,157 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "id": "2722b419",
+   "metadata": {},
+   "source": [
+    "[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/openlayer-ai/examples-gallery/blob/main/monitoring/llms/langchain/langchain_callback.ipynb)\n",
+    "\n",
+    "\n",
+    "# <a id=\"top\">Openlayer LangChain callback handler</a>\n",
+    "\n",
+    "This notebook illustrates how use Openlayer's callback handler to monitor LLMs/chains built with LangChain."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "020c8f6a",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "!pip install openlayer"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "75c2a473",
+   "metadata": {},
+   "source": [
+    "## 1. Set the environment variables"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "f3f4fa13",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import os\n",
+    "import openai\n",
+    "\n",
+    "# OpenAI env variable\n",
+    "os.environ[\"OPENAI_API_KEY\"] = \"YOUR_OPENAI_API_KEY_HERE\"\n",
+    "\n",
+    "# Openlayer env variables\n",
+    "os.environ[\"OPENLAYER_API_KEY\"] = \"YOUR_OPENLAYER_API_KEY_HERE\"\n",
+    "os.environ[\"OPENLAYER_PROJECT_NAME\"] = \"YOUR_PROJECT_NAME_HERE\""
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "9758533f",
+   "metadata": {},
+   "source": [
+    "## 2. Instantiate the `OpenlayerHandler`"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "e60584fa",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from openlayer.integrations import langchain_callback\n",
+    "\n",
+    "openlayer_handler = langchain_callback.OpenlayerHandler()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "72a6b954",
+   "metadata": {},
+   "source": [
+    "## 3. Use LangChain"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "76a350b4",
+   "metadata": {},
+   "source": [
+    "Now, you can pass the `openlayer_handler` as a callback to LLM's or chain invokations."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "e00c1c79",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from langchain_core.messages import HumanMessage\n",
+    "from langchain_openai import ChatOpenAI"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "abaf6987-c257-4f0d-96e7-3739b24c7206",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "chat = ChatOpenAI(max_tokens=25, callbacks=[openlayer_handler])"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "4123669f-aa28-47b7-8d46-ee898aba99e8",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "chat.invoke([HumanMessage(content=\"What's the meaning of life?\")])"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "9a702ad1-da68-4757-95a6-4661ddaef251",
+   "metadata": {},
+   "source": [
+    "That's it! Now your data is being streamed to Openlayer after every invokation."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "a3092828-3fbd-4f12-bae7-8de7f7319ff0",
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.9.18"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}
diff --git a/openlayer/integrations/__init__.py b/openlayer/integrations/__init__.py
diff --git a/openlayer/integrations/langchain_callback.py b/openlayer/integrations/langchain_callback.py
@@ -0,0 +1,184 @@
+"""Module with the Openlayer callback handler for LangChain."""
+
+# pylint: disable=unused-argument
+import time
+from typing import Any, Dict, List, Optional, Union
+
+from langchain import schema as langchain_schema
+from langchain.callbacks.base import BaseCallbackHandler
+
+from .. import constants
+from ..tracing import tracer
+
+LANGCHAIN_TO_OPENLAYER_PROVIDER_MAP = {"openai-chat": "OpenAI"}
+PROVIDER_TO_STEP_NAME = {"OpenAI": "OpenAI Chat Completion"}
+
+
+class OpenlayerHandler(BaseCallbackHandler):
+    """LangChain callback handler that logs to Openlayer."""
+
+    def __init__(
+        self,
+        **kwargs: Any,
+    ) -> None:
+        super().__init__()
+
+        self.start_time: float = None
+        self.end_time: float = None
+        self.prompt: List[Dict[str, str]] = None
+        self.latency: float = None
+        self.provider: str = None
+        self.model: Optional[str] = None
+        self.model_parameters: Dict[str, Any] = None
+        self.cost: Optional[float] = None
+        self.prompt_tokens: int = None
+        self.completion_tokens: int = None
+        self.total_tokens: int = None
+        self.output: str = None
+        self.metatada: Dict[str, Any] = kwargs or {}
+
+    def on_llm_start(
+        self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any
+    ) -> Any:
+        """Run when LLM starts running."""
+
+    def on_chat_model_start(
+        self,
+        serialized: Dict[str, Any],
+        messages: List[List[langchain_schema.BaseMessage]],
+        **kwargs: Any,
+    ) -> Any:
+        """Run when Chat Model starts running."""
+        self.model_parameters = kwargs.get("invocation_params", {})
+
+        provider = self.model_parameters.get("_type", None)
+        if provider in LANGCHAIN_TO_OPENLAYER_PROVIDER_MAP:
+            self.provider = LANGCHAIN_TO_OPENLAYER_PROVIDER_MAP[provider]
+            self.model_parameters.pop("_type")
+
+        self.model = self.model_parameters.get("model_name", None)
+        self.output = ""
+        self.prompt = self._langchain_messages_to_prompt(messages)
+        self.start_time = time.time()
+
+    @staticmethod
+    def _langchain_messages_to_prompt(
+        messages: List[List[langchain_schema.BaseMessage]],
+    ) -> List[Dict[str, str]]:
+        """Converts Langchain messages to the Openlayer prompt format (similar to
+        OpenAI's.)"""
+        prompt = []
+        for message in messages:
+            for m in message:
+                if m.type == "human":
+                    prompt.append({"role": "user", "content": m.content})
+                elif m.type == "system":
+                    prompt.append({"role": "system", "content": m.content})
+                elif m.type == "ai":
+                    prompt.append({"role": "assistant", "content": m.content})
+        return prompt
+
+    def on_llm_new_token(self, token: str, **kwargs: Any) -> Any:
+        """Run on new LLM token. Only available when streaming is enabled."""
+
+    def on_llm_end(self, response: langchain_schema.LLMResult, **kwargs: Any) -> Any:
+        """Run when LLM ends running."""
+        self.end_time = time.time()
+        self.latency = (self.end_time - self.start_time) * 1000
+
+        if response.llm_output and "token_usage" in response.llm_output:
+            self.prompt_tokens = response.llm_output["token_usage"].get(
+                "prompt_tokens", 0
+            )
+            self.completion_tokens = response.llm_output["token_usage"].get(
+                "completion_tokens", 0
+            )
+            self.cost = self._get_cost_estimate(
+                num_input_tokens=self.prompt_tokens,
+                num_output_tokens=self.completion_tokens,
+            )
+            self.total_tokens = response.llm_output["token_usage"].get(
+                "total_tokens", 0
+            )
+
+        for generations in response.generations:
+            for generation in generations:
+                self.output += generation.text.replace("\n", " ")
+
+        self._add_to_trace()
+
+    def _get_cost_estimate(
+        self, num_input_tokens: int, num_output_tokens: int
+    ) -> float:
+        """Returns the cost estimate for a given model and number of tokens."""
+        if self.model not in constants.OPENAI_COST_PER_TOKEN:
+            return None
+        cost_per_token = constants.OPENAI_COST_PER_TOKEN[self.model]
+        return (
+            cost_per_token["input"] * num_input_tokens
+            + cost_per_token["output"] * num_output_tokens
+        )
+
+    def _add_to_trace(self) -> None:
+        """Adds to the trace."""
+        name = PROVIDER_TO_STEP_NAME.get(self.provider, "Chat Completion Model")
+        tracer.add_openai_chat_completion_step_to_trace(
+            name=name,
+            provider=self.provider,
+            inputs={"prompt": self.prompt},
+            output=self.output,
+            cost=self.cost,
+            tokens=self.total_tokens,
+            latency=self.latency,
+            start_time=self.start_time,
+            end_time=self.end_time,
+            model=self.model,
+            model_parameters=self.model_parameters,
+            prompt_tokens=self.prompt_tokens,
+            completion_tokens=self.completion_tokens,
+            metadata=self.metatada,
+        )
+
+    def on_llm_error(
+        self, error: Union[Exception, KeyboardInterrupt], **kwargs: Any
+    ) -> Any:
+        """Run when LLM errors."""
+
+    def on_chain_start(
+        self, serialized: Dict[str, Any], inputs: Dict[str, Any], **kwargs: Any
+    ) -> Any:
+        """Run when chain starts running."""
+
+    def on_chain_end(self, outputs: Dict[str, Any], **kwargs: Any) -> Any:
+        """Run when chain ends running."""
+
+    def on_chain_error(
+        self, error: Union[Exception, KeyboardInterrupt], **kwargs: Any
+    ) -> Any:
+        """Run when chain errors."""
+
+    def on_tool_start(
+        self, serialized: Dict[str, Any], input_str: str, **kwargs: Any
+    ) -> Any:
+        """Run when tool starts running."""
+
+    def on_tool_end(self, output: str, **kwargs: Any) -> Any:
+        """Run when tool ends running."""
+
+    def on_tool_error(
+        self, error: Union[Exception, KeyboardInterrupt], **kwargs: Any
+    ) -> Any:
+        """Run when tool errors."""
+
+    def on_text(self, text: str, **kwargs: Any) -> Any:
+        """Run on arbitrary text."""
+
+    def on_agent_action(
+        self, action: langchain_schema.AgentAction, **kwargs: Any
+    ) -> Any:
+        """Run on agent action."""
+
+    def on_agent_finish(
+        self, finish: langchain_schema.AgentFinish, **kwargs: Any
+    ) -> Any:
+        """Run on agent end."""