support prompt caching token tracking in langchain #1250

colinbennettbrain · 2026-01-09T20:30:41Z

Extract cache_read and cache_creation from LangChain's nested input_token_details object
Map to Braintrust's standard metric names (prompt_cached_tokens, prompt_cache_creation_tokens)

Problem

The LangChain callback handler only extracts top-level fields from usage_metadata (input_tokens, output_tokens, total_tokens) but not the nested input_token_details containing cache metrics. This causes:

Cache tokens showing as 0 in the experiments UI
Costs calculated at full uncached rate instead of discounted cache rate

Extract cache_read and cache_creation from LangChain's nested input_token_details object and map them to Braintrust's standard metric names (prompt_cached_tokens, prompt_cache_creation_tokens). This enables accurate cache token tracking in the UI and correct cost calculations for cached prompts. Fixes Pylon #10400 Co-Authored-By: Claude Opus 4.5 <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

support prompt caching token tracking in langchain #1250

support prompt caching token tracking in langchain #1250

Uh oh!

colinbennettbrain commented Jan 9, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

support prompt caching token tracking in langchain #1250

Are you sure you want to change the base?

support prompt caching token tracking in langchain #1250

Uh oh!

Conversation

colinbennettbrain commented Jan 9, 2026

Problem

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants