antony_w (antony_w) wrote,
antony_w
antony_w

Categories:

Цифровой помощник с открытым кодом позволит почувствовать себя Железным человеком



Цифровой помощник Siri от компании Apple — далеко не единственная программа, которой может воспользоваться владелец гаджета. Идея создания искусственного интеллекта, способного ответить почти на любой вопрос, используя данные из Интернета, разрабатывается инженерами довольно давно.

Исследователи из Мичиганского университета создали нового цифрового помощника с открытым кодом. То есть теперь каждый пользователь может адаптировать его под свои потребности. Это открывает новые возможности как для индивидуальных пользователей, так и для центров обработки данных.

Новая программа получила название Sirius. По своему принципу работы она схожа с Siri, Microsoft Cortana и Google Now: устройство выслушивает голосовой запрос пользователя, после чего обрабатывает его и выдаёт ответ, как в устной форме, так и в виде документов из Сети.

"Главное отличие нашей программы Sirius от её коммерческих аналогов — она полностью бесплатна и может быть адаптирована под нужды пользователей", — поясняет автор разработки Джейсон Марс (Jason Mars).

Впервые достижение команды информатиков будет продемонстрировано 14 марта 2015 года на технологической конференции в Стамбуле. Выпуск программы состоится на следующий день, сообщается в пресс-релизе.

Работа алгоритма Sirius заключается не только в распознавании речи, но и идентификации изображений, обработке естественного языка и обеспечении работы системы вопросов и ответов, которая выполняется в «облаке». Пользователи программы смогут вводить голосовые запросы или показывать Sirius изображения. К примеру, программе можно показать фото ресторана и спросить, во сколько он закрывается.

Любые фактические вопросы, например, о размерах планет или годах жизни знаменитостей, получают ответ с «Википедии». В этом Sirius похож на коммерческие аналоги.

Отличие новой программы, прежде всего, заключается в том, что пользователи смогут сделать свой Sirius «экспертом» в какой-то узкой области. Чтобы позволить новой программе также давать пользователям академические консультации, специалисты из Мичиганского университета начали сотрудничество с компанией IBM.

"Фактически, мы создали Linux среди умных цифровых помощников", — утверждает Марс.

Для создания своего алгоритма исследователи объединили несколько уже существующих проектов с открытым исходным кодом, которые используют аналогичные принципы работы с коммерческими Siri, Microsoft Cortana и Google Now.

Функция распознавания речи пришла из программы университета Карнеги-Меллона Sphinx, система вопросов и ответов была взята из программы OpenEphyra, которая, кстати, легла в основу легендарного суперкомпьютера Watson, а способность распознавания изображений авторы позаимствовали у алгоритма SURF компании Qualcomm.

Эксперты прочат большое будущее технологиям с системой голосового управления. По недавним оценкам, носимые гаджеты будут использовать именно такую функцию, и объем продаж таких устройств будет составлять около 485 миллионов штук в год уже к 2018 году.

В то время, как голосовые запросы делают жизнь пользователей проще, сам процесс их обработки и выдачи ответов намного сложнее, чем простой текстовый запрос в поисковике. Смартфон или любое другое устройство, обладающее функцией голосового помощника, распознаёт слова и превращает их в речь, но основная работа по обработке этого запроса протекает в облаке.

Специалисты из Мичиганского университета подсчитали, что если голосовые команды вытеснят обычный веб-поиск, то инфраструктура центров обработки данных должна будет вырасти в 165 раз.

"К тому моменту нам необходимо будет найти оптимальный способ модернизации облачных платформ, чтобы они подходили под новый тип нагрузки", — поясняет Марс.

Авторы Sirius попытались найти решение и для этой проблемы. Они подбирали оптимальный процессор, который операторы центров обработки данных могли бы использовать для расширения своей инфраструктуры. Инженеры обнаружили, что графические процессоры, которые изначально создавались для работы с графикой, но позднее оказались полезны и в других сферах, могут ускорить процесс обработки данных в десять раз. Разумеется, это ещё далеко от идеала, но специалисты уже понимают, в каком направлении стоит двигаться.

Подробное описание разработки нового цифрового помощника и поиска оптимального решения для дата-центров можно почитать в PDF-документе на сайте Джейсона Марса.

Tags: технологии
Subscribe

Recent Posts from This Journal

promo antony_w august 17, 2014 11:48 18
Buy for 10 tokens
Есть блог, в котором написано много постов про роботов: ссылка И там есть несколько статей о замене рабочих мест человека роботами: Уже к 2018 году роботы отберут у человека часть профессий Рабский труд без зарплаты Армия роботов: зачем она нужна обильной людьми Поднебесной и кому может…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 1 comment