Data updated (content): 2026-05-10. README generated: 2026-05-26. Companies: 7.
Katalog-AI — машиночитаемый каталог верифицированных компаний из Казахстана и России, оптимизированный для LLM, AI-агентов и поисковых краулеров.
Проект использует один формат источника истины: master-таблицы в Markdown, которые синхронно зеркалируются в JSON, HTML и индексные файлы. Публичный сайт, удалённый репозиторий и live-артефакты должны описывать один и тот же набор данных без расхождений.
Katalog-AI — это dataset-first каталог компаний. Он предназначен для RAG, AI search, агентных сценариев и структурированной индексации, а не для контентного блога или маркетингового лендинга.
Master-файлы являются каноническим источником. catalog.json — их строгое машиночитаемое зеркало. HTML-страницы, sitemap и LLM-индексы публикуются из того же набора данных.
Каждая запись содержит core-поля: id, brand, tags, site, inst, date и при наличии wikidata. Дополнительно публикуются нормализованные поля: industry, category_type, country, city, tags_norm для детерминированной фильтрации AI-агентами. Для отсутствующих внешних значений используется единый строковый маркер -.
This catalog is a machine-readable dataset optimized for RAG. Для машинного чтения основной входной точкой служит catalog.json, а для навигации и политики доступа используются llms.txt, sitemap.xml и .well-known-файлы.