antony_w (antony_w) wrote,
antony_w
antony_w

Categories:

В MIT создали алгоритм автоматической дешифровки мертвых языков



Исследователи из MIT приблизились к разгадке тайн древних языков, разработав систему машинного обучения, способную разобраться в мертвом языке, не зная о его связях с другими языками. Система способна самостоятельно определять отношения между языками.

Утерянные языки — не просто лингвистический курьез. Без них человечество лишается массива знаний о людях, которые некогда говорили на них. К сожалению, большинство из них настолько мало представлены в письменном виде, что алгоритмы машинного обучения вроде Google Translate не могут расшифровать их. У некоторых нет хорошо изученных родственных языков, с которыми их можно было бы сравнить. Часто они бывают лишены привычных знаков препинания и пробелов.

Тем не менее, специалисты из лаборатории искусственного интеллекта (CSAIL) MIT совершили прорыв в этой области, разработав систему автоматической дешифровки мертвых языков без наличия хорошо изученных родственных языков. Система способна самостоятельно определять связи между языками, пишет MIT News.

Система основана на нескольких принципах, взятых из исторического языкознания. К примеру, что у языка есть несколько предсказуемых путей развития. Так, язык редко приобретает или лишается целого звука, но способен заменять одни звуки другими. Звук [п] может измениться на [б], но вряд ли на [к] из-за значительной разницы в произношении.

Получившийся алгоритм смог обрабатывать большой объем возможных трансформаций языка. Он учился преобразовывать язык в многомерное пространство, в котором разница в произношении отражалась в виде дистанции между соответствующими векторами. В итоге модель смогла сегментировать слова древних языков и сопоставить их с родственными языками.

Таким образом, алгоритм может оценить сходство двух языков. Тесты на известных языках показали, что он точно идентифицирует языковые семьи. Конечная цель исследователей — расшифровать мертвые языки, над которыми лингвисты ломают головы десятки лет, имея в своем распоряжении всего несколько тысяч слов.

Tags: технологии, язык
Subscribe

Posts from This Journal “технологии” Tag

promo antony_w august 17, 2014 11:48 18
Buy for 10 tokens
Есть блог, в котором написано много постов про роботов: ссылка И там есть несколько статей о замене рабочих мест человека роботами: Уже к 2018 году роботы отберут у человека часть профессий Рабский труд без зарплаты Армия роботов: зачем она нужна обильной людьми Поднебесной и кому может…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 2 comments