Вот подробный рассказ на русском языке о расшифровке клинописи (в первую очередь аккадской и шумерской) с акцентом на роль ИИ (искусственного интеллекта) и самые свежие разработки по состоянию на январь 2026 года.
Краткий фон: от ручной расшифровки к ИИКлинопись — одна из древнейших систем письма (ок. 3200–3000 гг. до н.э., создана шумерами). Она использовалась для шумерского (язык-изолят), аккадского (семитский, включая вавилонский и ассирийский диалекты), эламского, хеттского и других языков. Полная расшифровка заняла почти 200 лет (с 1802 по ~2022 гг. для основных языков).
ИИ превращает то, что было «работой на всю жизнь» для одного учёного, в задачу на недели-месяцы для команды + машины. Это действительно квантовый скачок — как будто у нас появился новый «Розеттский камень», но цифровой и бесконечно масштабируемый.Если хочешь углубиться (примеры переводов ИИ, сравнение до/после, или конкретные статьи/проекты) — скажи! 
- 1802–1857: прорыв в староперсидской → эламской → аккадской (Бехистунская надпись как «Розеттский камень»).
- 1869–1870-е: признание шумерского как отдельного языка (Оппертом), благодаря билингвам (двуязычным словарям шумерский–аккадский из Ниневии).
- До 2020-х: переводы делали вручную сотни специалистов по всему миру. Из миллионов табличек (возможно, >1 млн) переведено лишь ~10–20 %.
- 2023: Первый «Google Translate» для аккадского
Команда из Тель-Авивского университета (TAU) и Университета Ариэль (Израиль) создала нейросетевую модель машинного перевода (neural machine translation).- Две версии:
- Перевод из транслитерации (латинские буквы для клинописи) → английский.
- Прямой перевод из изображений клинописи → английский.
- Точность: BLEU ~36–37 (не идеально, но уже полезно для черновиков).
- Цель: перевести десятки тысяч уже оцифрованных, но непереведённых табличек (административные, письма, хозяйственные записи).
- Важно: ИИ не заменяет ассириологов, а ускоряет их работу в 10–100 раз и помогает находить ошибки/нюансы.
- Две версии:
- 2024–2025: Улучшения и новые инструменты
- Babylonian Engine — онлайн-инструмент: загружаешь транслитерацию — получаешь перевод + анализ.
- Проекты ORACC + CDLI: огромные базы оцифрованных текстов (сотни тысяч строк) стали тренировочными данными для ИИ.
- TLHdig (Университет Вюрцбурга): к концу 2025 вышла версия 1.0 с почти полным покрытием опубликованных текстов (~400 000 строк транслитерации). Это база для дальнейшего обучения ИИ.
- 2025: Прорыв ProtoSnap (Корнелл + Тель-Авив)
Самая свежая и крутая разработка (март–апрель 2025, представлена на ICLR 2025).- Название: ProtoSnap: Prototype Alignment for Cuneiform Signs.
- Авторы: Hadar Averbuch-Elor (Корнелл), Rachel Mikulinsky (TAU) и др.
- Что делает: использует диффузионные модели (типа тех, что генерируют картинки) для «привязки» (snap) реального знака на табличке к «прототипу» (идеальной форме).
- Почему важно: один и тот же знак меняется по эпохам, регионам, даже по почерку писца — тысячи вариаций! Старые OCR-системы путались. ProtoSnap справляется с редкими и сильно искажёнными знаками гораздо лучше.
- Результат: улучшенный OCR (распознавание знаков по фото/3D-сканам) → точная транслитерация → затем перевод.
- Применение: ускоряет работу с повреждёнными табличками, помогает музеям оцифровывать коллекции.
- 2026 (январь – текущее состояние)
- ProtoSnap уже используется в исследованиях: улучшает downstream-модели (те, что переводят после распознавания).
- Первые эксперименты с шумерским: сложнее (меньше текстов, меньше параллельных билингв), но прогресс идёт.
- Новые нюансы: ИИ находит диалектные вариации, редкие идиомы, стилистические особенности, которые люди могли пропустить.
- Масштаб: потенциально переведёт сотни тысяч табличек за годы вместо веков.
- Ограничения: поэзия, сложные религиозные/философские тексты всё равно требуют человека. ИИ даёт «черновик + подсказки».
Год | Разработка / Инструмент | Кто сделал | Что даёт / прорыв |
|---|---|---|---|
2023 | Нейросеть-переводчик аккадского | TAU + Ариэль (Gutherz, Sáenz, Gordin) | Первый автоматический перевод клинописи → английский; BLEU ~36–37 |
2024 | Babylonian Engine (онлайн) | Израильские команды + ORACC | Доступный инструмент: транслит → перевод мгновенно |
2025 (март) | ProtoSnap | Корнелл + TAU | «Привязка» вариаций к прототипу; лучший OCR для редких/повреждённых знаков |
2025 (конец) | TLHdig 1.0 | Университет Вюрцбурга | Почти 100% опубликованных текстов в базе (~400 тыс. строк) — топливо для ИИ |
2026 | Улучшенные модели + первые опыты с шумерским | TAU, Ариэль, Корнелл, LMU | Массовый перевод, новые нюансы, ускорение в десятки раз |

תגובות