Публичные данные

Открыли публичные датасеты Бонихуа для исследований и разработки

Выложили каталог /datasets, чтобы наши данные можно было использовать не только внутри проекта. Теперь это нормальная входная точка для исследователей, редакторов, продуктовых команд и тех, кто собирает инструменты вокруг изучения китайского.

Если нужен машиночитаемый слой, открывайте /data/catalog.json. Если удобнее смотреть наборы как репозиторий, часть каталога уже опубликована в GitHub datasets repo.

Для чего это пригодится

Исследования по изучению китайского: уровни, ошибки, навыки, типовые сценарии и учебные паттерны.

Продуктовая разработка: фильтры, поисковые прототипы, внутренние справочники и AI‑подсказки с нормальными источниками.

Редакционная и аналитическая работа: сравнение сущностей, связей и покрытие тем без ручной свалки в таблицах.

Для быстрого старта можно открыть базу упражнений, грамматические темы или уровни HSK. Там уже есть индексируемые страницы, связанные сущности и нормальные внутренние переходы.

4 марта 2026

groups

Редакция Бонихуа

Редакция Бонихуа — это люди, которые сами прошли путь изучения китайского. Больше 10 лет мы преподаём язык, прожили в Китае и обучили тысячи студентов. В этом блоге мы делимся не теорией из учебников, а живым опытом: как на самом деле работают стратегии обучения, где подстерегают ловушки и как учить язык в удовольствие, а не «до победного». Мы здесь, чтобы ваш путь в китайском был короче и ярче.