📐 FineMath - a HuggingFaceTB Collection

HuggingFaceTB 's Collections

SmolLM2

SmolVLM

💻 Local SmolLMs

Instruct datasets

🌌 Cosmopedia

Find textbooks in FineWeb with a classifier

FineWeb clustering & synthetic generations

Other: Stanford, OpenStax, khanAcademy, wikihow...

FW generation prompts

Wikipedia Science topics

Wikipedia textbooks

SFT Experiments

Decay mixture experiments

models

📐 FineMath

updated 5 days ago

FineMath datasets and ablation models

HuggingFaceTB/finemath

Viewer • Updated 19 days ago • 48.3M • 35.3k • 241

Note FineMath datasets
HuggingFaceTB/FineMath-Llama-3B

Updated 5 days ago • 126 • 12

Note Llama 3B trained on a mix of FineMath and FineWeb-Edu: better at math and similar to Llama in reasoning, knowledge and common sense
HuggingFaceTB/finemath-classifier

Text Classification • Updated 23 days ago • 195 • 8

Note FineMath text classifier to score the mathematical reasoning and educational content
HuggingFaceTB/finemath-ablation-finemath-4plus

Updated 23 days ago • 80 • 1
HuggingFaceTB/finemath-ablation-finemath-3plus

Updated 23 days ago • 20
HuggingFaceTB/finemath-ablation-infiwebmath-4plus

Updated 23 days ago • 112 • 2
HuggingFaceTB/finemath-ablation-infiwebmath-3plus

Updated 23 days ago • 15

Note Ablations on FineMath subsets (continual pre-training of base Llama 3.2 3B on 60B tokens)
HuggingFaceTB/finemath-ablation-finemath-infimath-3plus

Updated 23 days ago • 166
HuggingFaceTB/finemath-ablation-finemath-infimath-4plus

Updated 23 days ago • 196 • 2

Note Ablations on FineMath plus3 and plus4 (continual pre-training of base Llama 3.2 3B on 60B tokens)
HuggingFaceTB/finemath-ablation-fwedu

Updated 23 days ago • 38
HuggingFaceTB/finemath-ablation-infiwebmath

Updated 23 days ago • 24
HuggingFaceTB/finemath-ablation-owm

Updated 23 days ago • 121

Note Ablations on public math datasets and FW-Edu as a baseline (continual pre-training of base Llama 3.2 3B on 60B tokens)
HuggingFaceTB/finemath-ablation-3plus-160B

Updated 23 days ago • 43
HuggingFaceTB/finemath-ablation-4plus-160B

Updated 23 days ago • 15

Note Longer ablation for 160B on a mix of 40% fineweb-edu 60% FineMath and Infiwebmath 3plus / 4plus