Открытый датасет Бонихуа по произношению китайского: тоновые ошибки, путаница pinyin и ловушки, которые особенно часто мешают русскоязычным ученикам.
Каталог данных: /ai·JSON: catalog.json
Это открытый датасет Бонихуа о типичных фонетических ошибках русскоязычных в китайском. Внутри не абстрактные советы, а конкретные ловушки: путаница тонов, финалей, согласных и ритма фразы. Мы фиксируем, где именно ломается произношение, почему это мешает пониманию и каким упражнением ошибку лучше чинить.
Набор полезен сразу в двух сценариях. Репетитор по китайскому может быстро собрать фонетическую диагностику, выбрать минимальные пары и объяснить ученику, почему «почти правильно» в китайском часто означает другое слово. Ученик получает короткие, практичные карточки для самостоятельной отработки: что слушать, что проговаривать и на чём держать внимание.
Как использовать: не хватайтесь за всё сразу. Возьмите одну ловушку на 3–4 дня, проговорите пары медленно, затем в коротких фразах и только потом ускоряйтесь. Лучше 7 минут в день без геройства, чем 40 минут раз в неделю с драмой и кашей в ушах.
Последняя редакторская проверка: Редакция Бонихуа, 12 мая 2026 г..
Проверил: Дмитрий Петренко, главный редактор; Анна Смирнова, фактчек и валидация данных.
Методология и стандарты редакции: /editorial-policy
Лицензия: CC-BY-NC-SA-4.0. Условия использования.
Коммерческое использование — по запросу на hello.bonihua@gmail.com.
Источник данных: структурированный датасет Бонихуа и редакционный реестр страницы.
Внешний архив: Zenodo / DOI
Проверка: Валидация схемой Zod, проверка связей related_ids и статическая сборка маршрутов.
Частота обновления: При каждом обновлении датасета и пересборке manifest.
Ограничения: Данные носят справочный характер и не являются публичной офертой.
Последняя проверка данных: 12 мая 2026 г..
Репетитору по китайскому: Используйте записи как готовую карту диагностики: на первом уроке отмечайте 3–5 ловушек ученика, затем собирайте из них короткий фонетический маршрут на две недели.
Ученику китайского: Используйте датасет как чек-лист практики: берите одну ошибку, повторяйте минимальные пары, затем вставляйте их в короткие бытовые фразы и записывайте себя на диктофон.
idstringСтабильный идентификатор записи в формате `prontrap:<slug>`.
slugstringЧитаемый slug для URL, GitHub и внутренней перелинковки.
name.rustringКороткое название ловушки человеческим русским языком.
desc.rustringЧто именно путают русскоязычные ученики и почему это мешает.
when.rustringВ какой ситуации ошибка всплывает чаще всего: чтение, диалог, диктант, скоростная речь.
how.rustringПрактический способ коррекции для урока или самостоятельной тренировки.
pairstringКраткое обозначение конфликтующей пары тонов, звуков или ритмических паттернов.
minimal_pairsarrayМинимальные пары или микроконтрасты для отработки слуха и артикуляции.
tagsarrayТеги для фильтров, SEO и сценариев использования в уроках.
related_idsarrayСвязанные записи внутри датасета для последовательной отработки.
Ниже несколько реальных записей из набора. Это удобно и для SEO-цитирования, и для быстрой оценки, подойдёт ли датасет под ваш урок, исследование или AI pipeline.
{
"id": "prontrap:tone-2-vs-3-in-questions",
"slug": "tone-2-vs-3-in-questions",
"name": "Второй и третий тон в коротких вопросах",
"desc": "Во фразах вроде nǐ, hǎo, mǎi, měi русскоязычные часто смешивают второй и третий тон, особенно когда спешат.",
"when": "Ошибка регулярно всплывает в вопросах и коротких диалогах: nǐ qù ma, mǎi ma, hǎo ma.",
"how": "Тренируйте не отдельный слог, а короткую фразу: nǐ hǎo, nǐ mǎi ma, nǐ qù ma. Второй тон идёт вверх, третий сначала ныряет вниз.",
"tags": [
"tones",
"questions",
"speaking"
],
"pair": "2-й тон ↔ 3-й тон",
"minimal_pairs": [
{
"bad": "mái",
"good": "mǎi",
"note": {
"ru": "Не пытайтесь «петь» третий тон слишком глубоко; важен контраст движения."
}
},
{
"bad": "hái",
"good": "hǎi",
"note": {
"ru": "Полезно сопровождать тон жестом рукой."
}
}
]
}{
"id": "prontrap:russian-stress-overrides-tones",
"slug": "russian-stress-overrides-tones",
"name": "Русское ударение перебивает китайские тоны",
"desc": "Даже когда ученик знает тоны по отдельности, русская привычка ставить одно главное ударение ломает весь тональный рисунок слова.",
"when": "Ошибка слышна в длинных словах, связках и мини-диалогах: péngyou, shénme shíhou, bù kěyǐ.",
"how": "Дробите слово на ритмические блоки и следите, чтобы каждый слог сохранял свой контур. Полезно читать под метроном и делать запись.",
"tags": [
"rhythm",
"tones",
"connected-speech"
],
"pair": "китайский тональный рисунок ↔ русское силовое ударение",
"minimal_pairs": [
{
"bad": "péngyou",
"good": "PENGyou",
"note": {
"ru": "Во втором варианте русское ударение съедает тональную картину."
}
},
{
"bad": "bù kěyǐ",
"good": "bu KEyi",
"note": {
"ru": "Держите тоны на каждом слоге, а не один главный акцент."
}
}
]
}{
"id": "prontrap:third-tone-sandhi-before-third-tone",
"slug": "third-tone-sandhi-before-third-tone",
"name": "Третий тон перед третьим тоном",
"desc": "Русскоязычные знают правило sandhi теоретически, но в речи всё равно произносят два полных третьих тона подряд.",
"when": "Проблема звучит в 你好, 很好, 可以吗, 老板好 и в устойчивых бытовых сочетаниях.",
"how": "Тренируйте пары как готовые блоки: ní hǎo, hén hǎo, xiǎng mǎi. Не разбирайте их каждый раз заново по слогам.",
"tags": [
"tones",
"sandhi",
"connected-speech"
],
"pair": "3-й тон + 3-й тон",
"minimal_pairs": [
{
"bad": "nǐ hǎo",
"good": "ní hǎo",
"note": {
"ru": "Полезно услышать обе версии подряд, чтобы ошибка стала заметной."
}
},
{
"bad": "hěn hǎo",
"good": "hén hǎo",
"note": {
"ru": "Отрабатывайте именно в частотных связках."
}
}
]
}{
"id": "prontrap:an-vs-ang-final",
"slug": "an-vs-ang-final",
"name": "Финали an и ang",
"desc": "Русскоязычные часто не дотягивают носовой хвост в ang и получают слишком короткое an.",
"when": "Ошибка заметна в словах hǎn/hǎng, lán/láng, bàn/bàng и при чтении списков без записи.",
"how": "На ang оставляйте звук дольше и давайте ощущение заднего носового резонанса. Полезно петь пары на одном тоне: an-an-ang-ang.",
"tags": [
"pronunciation",
"finals",
"nasals"
],
"pair": "an ↔ ang",
"minimal_pairs": [
{
"bad": "lán",
"good": "láng",
"note": {
"ru": "В ang не обрывайте слог слишком рано."
}
},
{
"bad": "bān",
"good": "bāng",
"note": {
"ru": "Слушайте именно хвост финали, а не начальный согласный."
}
}
]
}Русскоязычные часто сглаживают границу между L и N, особенно в знакомых словах и именах.
Звук ü отсутствует в русском, поэтому его заменяют на обычный u или на русское «ю» без нужной позиции языка.
Русскоязычные часто слышат эти ряды как одно семейство, хотя в китайском это разные зоны артикуляции и другой смысл.
Найдено: 45
Фонетическая ошибка часто не слышна изнутри, и ученик уверен, что произносит чисто, пока не послушает запись.
Во фразах вроде nǐ, hǎo, mǎi, měi русскоязычные часто смешивают второй и третий тон, особенно когда спешат.
Слог yī часто читают всегда одинаково, хотя его тон зависит от следующего слова.
Необходимая мелочь, которую часто знают глазами, но забывают ртом: перед четвёртым тоном 不 меняет контур.
Звук r в китайском часто «растворяется» у русскоязычных, потому что не совпадает ни с русским р, ни с ж.
В устойчивых формулах вежливости русскоязычные ученики нередко произносят каждый слог полнотонно, и фраза звучит тяжёлой.
Русскоязычные часто дают частицы ma полноценный тон, и фраза начинает звучать тяжело и неестественно.
Русскоязычные ученики часто читают китайский как набор карточек: слог, пауза, слог, пауза. Речь становится неестественной.
Русскоязычные нередко держат первый тон ровным, но слишком низким, из-за чего он перестаёт звучать как китайский первый.
Связка 2→4 часто ломается: голос не успевает подняться и резко упасть, поэтому оба слога звучат смазанно.
На скорости русскоязычные часто теряют носовой хвост, и an/en/in начинают звучать как открытые гласные.
Частотные отрицательные связки звучат неестественно, если произносить их как два тяжёлых полноценных слога без связи.
Вопрос в китайском русскоязычные часто поднимают всей фразой вверх, и тоны при этом теряют свой рисунок.
Даже когда ученик знает тоны по отдельности, русская привычка ставить одно главное ударение ломает весь тональный рисунок слова.
Русскоязычные ученики часто ускоряются слишком рано и закрепляют ошибочное произношение как привычку.
Ученик может чисто сказать слог отдельно, но в длинной фразе тональные контуры распадаются на «островки».
Русскоязычные знают правило sandhi теоретически, но в речи всё равно произносят два полных третьих тона подряд.
Русскоязычные часто делают третий тон как длинную драму, и в живой речи он начинает тормозить всю фразу.
Русскоязычные часто тянут ai слишком широко или, наоборот, выпрямляют ei до непонятного среднего звука.
Русскоязычные часто не дотягивают носовой хвост в ang и получают слишком короткое an.
Пара ao/ou часто смазывается, особенно если ученик читает pinyin глазами и не проверяет себя на слух.
Пара en/eng кажется мелочью, но в китайском это разные финали и разное восприятие слова на слух.
В быстрой речи русскоязычные часто теряют различие между ian и iang, особенно если слово уже знакомо по иероглифам.
Русскоязычные нередко делают in слишком коротким или, наоборот, размывают ing до неопределённого «ин».
Первые заметные улучшения приходят через 2–3 недели регулярной практики. Полная автоматизация — это месяцы, но она реалистична.
Да, если вы записываете себя и сравниваете с эталоном. Но корректный фидбек ускоряет процесс в разы.
Практические методики обучения: shadowing, интервальные повторения, фразовые блоки и микро‑дриллы. Каждая карточка объясняет, кому метод подходит, как его внедрять и какой результат ждать.
Упражнения по навыкам и уровням: фонетика, говорение, письмо, чтение. Каждое упражнение помечено по времени и цели, чтобы легко собрать урок или план практики.
Список ошибок, которые чаще всего совершают русскоязычные: тоны, порядок слов, счётные слова. Каждая карточка показывает, почему ошибка возникает и как её исправить на практике.
Прямая ссылка на этот ресурс. Используйте для шеринга.
Используйте этот датасет в исследованиях, приложениях или для обучения ИИ. Данные доступны в JSON.