Датасет

Ошибки в тонах по контекстам — вопрос, покупка, перенос, длинный ответ

Где тон плывёт в реальной речи: вопросы, цены, переносы и длинные ответы.

Каталог данных: /ai·JSON: catalog.json

Тон в китайском ломается не только по уровню, но и по контексту. На отдельных словах всё ещё может быть прилично, но стоит войти в вопрос, разговор о цене, перенос встречи или длинный ответ, и управление тоном внезапно испаряется. Этот каталог как раз про такие контекстные поломки.

Контекстный слой полезен тем, кто уже понимает базовую фонетику, но не переносит её в живую речь. Здесь важны не только сами тоны, но и когнитивная нагрузка: нужно держать смысл, скорость, вежливость, числа или длинную мысль. Поэтому мы разбираем именно режимы речи, а не абстрактные ошибки.

Как пользоваться: найдите сценарий, в котором тон у вас стабильно сползает, и работайте по нему отдельно. Китайская речь любит конкретику: не «чиню тоны», а «чиню тоны в вопросах» или «в длинном ответе».

Последняя редакторская проверка: Редакция Бонихуа, 12 марта 2026 г..

Проверил: Дмитрий Петренко, главный редактор; Анна Смирнова, фактчек и валидация данных.

Методология и стандарты редакции: /editorial-policy

Trust и методология

Источник: datasets/learning/tone-errors-by-context.jsonl

Проверка: Валидация схемой Zod, проверка связей related_ids и статическая сборка маршрутов.

Частота обновления: При каждом обновлении датасета и пересборке manifest.

Ограничения: Данные носят справочный характер и не являются публичной офертой.

Лицензия: CC-BY-NC-SA-4.0. Условия использования.

Коммерческое использование — по запросу на hello.bonihua@gmail.com.

Quality score: 96%.

Битые related_ids: 48. Последняя проверка: 12 марта 2026 г..

Отчёт: reports/dataset-audit-2026-02-13.md

Примеры записей

Ниже несколько реальных записей из набора. Это удобно и для SEO-цитирования, и для быстрой оценки, подойдёт ли датасет под ваш урок, исследование или AI pipeline.

Вопросы: 2-й и 3-й тон сползают, как только появляется темп
{
  "id": "tonectx:questions-2-vs-3",
  "slug": "questions-2-vs-3",
  "name": "Вопросы: 2-й и 3-й тон сползают, как только появляется темп",
  "desc": "В коротких вопросах ученик часто теряет контраст 2-го и 3-го тона. На карточке всё слышно, а в реальной реплике вопрос превращается в ровную тональную кашу.",
  "when": "В бытовых вопросах, уточнениях, коротких репликах с 吗 и в первых фразах разговора.",
  "how": "Берите пару контрастных вопросов и прогоняйте их на темпе разговора, а не как чтение по слогам. Полезно делать короткий echo-повтор сразу после эталона.",
  "tags": [
    "tones",
    "questions",
    "context",
    "hsk1"
  ]
}
Длинный ответ: тон умирает там, где заканчивается дыхание
{
  "id": "tonectx:long-answer-breath-loss",
  "slug": "long-answer-breath-loss",
  "name": "Длинный ответ: тон умирает там, где заканчивается дыхание",
  "desc": "На длинном ответе ученик теряет не только тон, но и ощущение опоры. В начале реплика ещё управляемая, а ближе к концу всё превращается в ровную, усталую линию.",
  "when": "Пересказ, аргументативный ответ, HSKK, объяснение причины, развернутый комментарий на уроке.",
  "how": "Берите один короткий ответ на 15–25 секунд, режьте его на опорные чанки и затем собирайте обратно. Смысл в том, чтобы не терять тон на длинной дистанции, а не только красиво стартовать.",
  "tags": [
    "tones",
    "long-answer",
    "fluency",
    "context"
  ]
}
Перенос встречи: тон разваливается, когда нужно звучать мягко, а не рубить
{
  "id": "tonectx:reschedule-softening",
  "slug": "reschedule-softening",
  "name": "Перенос встречи: тон разваливается, когда нужно звучать мягко, а не рубить",
  "desc": "При переносе времени и мягких отказах ученик одновременно держит в голове вежливость, сроки и новую дату. Из-за этой нагрузки тоны и ритм часто становятся грубее или площе, чем нужно.",
  "when": "Перенос урока, встречи, звонка, мягкий отказ или предложение другого времени.",
  "how": "Тренируйте готовые рамки переноса и отказа в коротких парах: сначала эталон, затем вариация под свои даты и условия. Важно проговаривать не только слова, но и мягкий ритм фразы.",
  "tags": [
    "tones",
    "reschedule",
    "soft-skills",
    "context"
  ]
}
Покупки и цены: тоны едут там, где мозг уже считает деньги
{
  "id": "tonectx:shopping-numbers-prices",
  "slug": "shopping-numbers-prices",
  "name": "Покупки и цены: тоны едут там, где мозг уже считает деньги",
  "desc": "В сценах с ценами и количествами ученик переключает внимание на цифры и смысл, из-за чего тональный контроль уезжает первым. На слух и в речи это даёт ощущение суеты и неточности.",
  "when": "Магазин, заказ еды, оплата, разговор о скидке, уточнение цены или количества.",
  "how": "Тренируйте цены и числа в маленьком диалоге, где есть вопрос, ответ и переспрос. Числа без контекста слишком стерильны и не ловят реальную проблему.",
  "tags": [
    "tones",
    "shopping",
    "numbers",
    "context"
  ]
}

Популярные элементы

Вопросы: 2-й и 3-й тон сползают, как только появляется темп

В коротких вопросах ученик часто теряет контраст 2-го и 3-го тона. На карточке всё слышно, а в реальной реплике вопрос превращается в ровную тональную кашу.

tonesquestionscontexthsk1

Длинный ответ: тон умирает там, где заканчивается дыхание

На длинном ответе ученик теряет не только тон, но и ощущение опоры. В начале реплика ещё управляемая, а ближе к концу всё превращается в ровную, усталую линию.

toneslong-answerfluencycontext

Перенос встречи: тон разваливается, когда нужно звучать мягко, а не рубить

При переносе времени и мягких отказах ученик одновременно держит в голове вежливость, сроки и новую дату. Из-за этой нагрузки тоны и ритм часто становятся грубее или площе, чем нужно.

tonesreschedulesoft-skillscontext

Покупки и цены: тоны едут там, где мозг уже считает деньги

В сценах с ценами и количествами ученик переключает внимание на цифры и смысл, из-за чего тональный контроль уезжает первым. На слух и в речи это даёт ощущение суеты и неточности.

tonesshoppingnumberscontext
Страница 1 из 1 · элементов: 4

Смотрите также

Связанный каталог
Ошибки в тонах по уровням HSK — где и почему всё плывёт

Практический датасет о тональных ошибках по уровням HSK: что ломается на HSK1, где появляется sandhi, почему ритм рассыпается на HSK3 и что делать с длинной фразой на HSK4+. Подходит для диагностики, микро-дриллов и точечной коррекции.

Связанный каталог
Ловушки аудирования по китайскому — где ломается понимание

Практический датасет о том, почему аудирование по китайскому разваливается даже у тех, кто знает слова. Числа, сроки, тоны на скорости, частицы, сегментация фразы и смысловые ловушки разобраны как отдельные карточки с признаками и микро-дриллами.

Связанный каталог
Микро-дриллы по китайскому — 4–7 минут пользы без героизма

Короткие дриллы по тону, ритму, sandhi, длинной фразе и другим узким задачам. Это reusable dataset для тех, кто хочет делать маленькие, но работающие сессии вместо редких подвигов на два часа.

Связанный каталог
Шаблоны диалогов на китайском — по уровням

Готовые сценарии диалогов: знакомство, заказ, перенос встречи. Помогают быстро говорить по делу, а не строить фразу в голове каждую минуту.

FAQ

Зачем нужен отдельный датасет по контекстам, если уже есть ошибки по уровням?

Потому что один и тот же ученик может держать тон в словаре, но терять его в конкретном режиме речи. Контекст показывает, где именно навык не переносится в живую коммуникацию.

Это больше про speaking или про pronunciation?

На практике и про то и про другое. В реальной речи тон, ритм, дыхание и смысл работают вместе, особенно на среднем уровне и выше.

Цитирование

Цитирование и интеграция

https://www.bonihua.by/datasets/tone-errors-by-context

Прямая ссылка на этот ресурс. Используйте для шеринга.

Скачать

Используйте этот датасет в исследованиях, приложениях или для обучения ИИ. Данные доступны в JSON.

groups
Доверие и опыт

Редакция Бонихуа

Мы — люди, которые сами прошли путь изучения китайского. Больше 10 лет мы преподаём язык, жили в Китае и обучили тысячи студентов. В этом блоге мы делимся не теорией из учебников, а живым опытом. Мы здесь, чтобы ваш путь в китайском был короче и ярче.