Вот подробный рассказ на русском языке о расшифровке клинописи (в первую очередь аккадской и шумерской) с акцентом на роль ИИ (искусственного интеллекта) и самые свежие разработки по состоянию на январь 2026 года.

Краткий фон: от ручной расшифровки к ИИКлинопись — одна из древнейших систем письма (ок. 3200–3000 гг. до н.э., создана шумерами). Она использовалась для шумерского (язык-изолят), аккадского (семитский, включая вавилонский и ассирийский диалекты), эламского, хеттского и других языков. Полная расшифровка заняла почти 200 лет (с 1802 по ~2022 гг. для основных языков).
  • 1802–1857: прорыв в староперсидской → эламской → аккадской (Бехистунская надпись как «Розеттский камень»).
  • 1869–1870-е: признание шумерского как отдельного языка (Оппертом), благодаря билингвам (двуязычным словарям шумерский–аккадский из Ниневии).
  • До 2020-х: переводы делали вручную сотни специалистов по всему миру. Из миллионов табличек (возможно, >1 млн) переведено лишь ~10–20 %.
С 2023 года начался настоящий квантовый скачок благодаря ИИ.Как ИИ меняет расшифровку клинописи (2023–2026)
  1. 2023: Первый «Google Translate» для аккадского
    Команда из Тель-Авивского университета (TAU) и Университета Ариэль (Израиль) создала нейросетевую модель машинного перевода (neural machine translation).
    • Две версии:
      • Перевод из транслитерации (латинские буквы для клинописи) → английский.
      • Прямой перевод из изображений клинописи → английский.
    • Точность: BLEU ~36–37 (не идеально, но уже полезно для черновиков).
    • Цель: перевести десятки тысяч уже оцифрованных, но непереведённых табличек (административные, письма, хозяйственные записи).
    • Важно: ИИ не заменяет ассириологов, а ускоряет их работу в 10–100 раз и помогает находить ошибки/нюансы.
  2. 2024–2025: Улучшения и новые инструменты
    • Babylonian Engine — онлайн-инструмент: загружаешь транслитерацию — получаешь перевод + анализ.
    • Проекты ORACC + CDLI: огромные базы оцифрованных текстов (сотни тысяч строк) стали тренировочными данными для ИИ.
    • TLHdig (Университет Вюрцбурга): к концу 2025 вышла версия 1.0 с почти полным покрытием опубликованных текстов (~400 000 строк транслитерации). Это база для дальнейшего обучения ИИ.
  3. 2025: Прорыв ProtoSnap (Корнелл + Тель-Авив)
    Самая свежая и крутая разработка (март–апрель 2025, представлена на ICLR 2025).
    • Название: ProtoSnap: Prototype Alignment for Cuneiform Signs.
    • Авторы: Hadar Averbuch-Elor (Корнелл), Rachel Mikulinsky (TAU) и др.
    • Что делает: использует диффузионные модели (типа тех, что генерируют картинки) для «привязки» (snap) реального знака на табличке к «прототипу» (идеальной форме).
    • Почему важно: один и тот же знак меняется по эпохам, регионам, даже по почерку писца — тысячи вариаций! Старые OCR-системы путались. ProtoSnap справляется с редкими и сильно искажёнными знаками гораздо лучше.
    • Результат: улучшенный OCR (распознавание знаков по фото/3D-сканам) → точная транслитерация → затем перевод.
    • Применение: ускоряет работу с повреждёнными табличками, помогает музеям оцифровывать коллекции.
  4. 2026 (январь – текущее состояние)
    • ProtoSnap уже используется в исследованиях: улучшает downstream-модели (те, что переводят после распознавания).
    • Первые эксперименты с шумерским: сложнее (меньше текстов, меньше параллельных билингв), но прогресс идёт.
    • Новые нюансы: ИИ находит диалектные вариации, редкие идиомы, стилистические особенности, которые люди могли пропустить.
    • Масштаб: потенциально переведёт сотни тысяч табличек за годы вместо веков.
    • Ограничения: поэзия, сложные религиозные/философские тексты всё равно требуют человека. ИИ даёт «черновик + подсказки».
Краткая таблица ИИ-разработок (2023–2026)
Год
Разработка / Инструмент
Кто сделал
Что даёт / прорыв
2023
Нейросеть-переводчик аккадского
TAU + Ариэль (Gutherz, Sáenz, Gordin)
Первый автоматический перевод клинописи → английский; BLEU ~36–37
2024
Babylonian Engine (онлайн)
Израильские команды + ORACC
Доступный инструмент: транслит → перевод мгновенно
2025 (март)
ProtoSnap
Корнелл + TAU
«Привязка» вариаций к прототипу; лучший OCR для редких/повреждённых знаков
2025 (конец)
TLHdig 1.0
Университет Вюрцбурга
Почти 100% опубликованных текстов в базе (~400 тыс. строк) — топливо для ИИ
2026
Улучшенные модели + первые опыты с шумерским
TAU, Ариэль, Корнелл, LMU
Массовый перевод, новые нюансы, ускорение в десятки раз
ИИ превращает то, что было «работой на всю жизнь» для одного учёного, в задачу на недели-месяцы для команды + машины. Это действительно квантовый скачок — как будто у нас появился новый «Розеттский камень», но цифровой и бесконечно масштабируемый.Если хочешь углубиться (примеры переводов ИИ, сравнение до/после, или конкретные статьи/проекты) — скажи! 😊

תגובות