Численный пример — Иван и скобки
Задача: проследить, как меняется навыка «раскрытие скобок» у Ивана после каждой задачи.
Стартовое состояние
Заголовок раздела «Стартовое состояние»Иван открывает первую задачу с раскрытием скобок. Раньше он эту тему не проходил.
- — априорная уверенность («скорее не знает»).
- , , — литературные дефолты.
Задача 1 — решил верно
Заголовок раздела «Задача 1 — решил верно»Применяем формулу posterior для correct:
Learning step:
0.20 → 0.58. Уверенность подскочила почти втрое после одной задачи. Это правильно: априорно мы почти не знали, теперь у нас есть сильный позитивный сигнал.
Задача 2 — решил верно
Заголовок раздела «Задача 2 — решил верно»Теперь .
0.58 → 0.87. Ещё одна правильная — модель почти уверена.
Задача 3 — ошибся
Заголовок раздела «Задача 3 — ошибся». Применяем formula для wrong:
0.87 → 0.49. Заметное падение, но не до нуля. Модель видит ошибку и говорит:
Был на 0.87 — это могла быть невнимательность (slip). Снижаю до 0.49. Жду следующей задачи.
Задача 4 — решил верно
Заголовок раздела «Задача 4 — решил верно».
0.49 → 0.83. Реабилитация.
Задача 5 — ошибся (вторая ошибка подряд после восстановления)
Заголовок раздела «Задача 5 — ошибся (вторая ошибка подряд после восстановления)».
0.83 → 0.42. Снова падение.
Задача 6 — ошибся (третья за 6 задач)
Заголовок раздела «Задача 6 — ошибся (третья за 6 задач)».
0.42 → 0.17. Третья ошибка подряд — модель уверенно говорит: ученик навыком не владеет, slip объясняет одну ошибку, не три.
Это и есть «понимание не случайной ошибки vs реального пробела».
Все 6 шагов одной таблицей
Заголовок раздела «Все 6 шагов одной таблицей»| Шаг | Ответ | до | posterior | после |
|---|---|---|---|---|
| 0 | — | — | — | 0.200 |
| 1 | ✓ | 0.200 | 0.529 | 0.576 |
| 2 | ✓ | 0.576 | 0.859 | 0.873 |
| 3 | ✗ | 0.873 | 0.433 | 0.490 |
| 4 | ✓ | 0.490 | 0.812 | 0.831 |
| 5 | ✗ | 0.831 | 0.353 | 0.418 |
| 6 | ✗ | 0.418 | 0.074 | 0.166 |
График по шагам
Заголовок раздела «График по шагам»P(L) 1.0 ┤ 0.9 ┤ ● 0.8 ┤ 0.7 ┤ 0.6 ┤● ● 0.5 ┤ 0.4 ┤ ● ● 0.3 ┤ 0.2 ┤● ● 0.1 ┤ 0.0 ┴──┬──┬──┬──┬──┬──┬──┬───── 0 1 2 3 4 5 6 шагЧто мы из этого видим
Заголовок раздела «Что мы из этого видим»- Серия правильных (1-2) → быстро поднимает уверенность.
- Одна ошибка на высокой уверенности → объясняется как slip, модель «не теряет голову».
- Серия ошибок (5-6) → модель уверенно опускает оценку, потому что slip двух подряд маловероятен.
- Volatility в районе — это правильно, у модели мало уверенности.
В главе 8 мы посмотрим, как из этой истории выбирается следующая задача для Ивана. Скорее всего, после такой картины — задача попроще на тот же навык, чтобы закрепить, а не идти дальше.
Хочешь сам проверить?
Заголовок раздела «Хочешь сам проверить?»Эти числа точно совпадают с реализацией в
web/lib/bkt.ts.
Полный прогон в Python с графиком — будет в
Notebook 1 — BKT from scratch.