antony_w (antony_w) wrote,
antony_w
antony_w

Categories:

Новый алгоритм обучается через вознаграждения



Новый алгоритм обучается решать задачи с помощи системы вознаграждения. Он поможет биологам понять, как мотивация и психическое здоровье влияет на решения человека.

Исследователи отмечают, что им только предстоит выяснить механизмы, которые позволяют животным учиться с помощи системы вознаграждения. Ученые надеются, что если имитировать поведение в рамках развития искусственного интеллекта, то они смогут более детально выяснить и механизмы мозга человека.

DeepMind, дочерняя компания Alphabet’s, предложила новую теорию о механизмах вознаграждения в нашем мозгу. Эта гипотеза, подкрепленная первоначальными экспериментальными выводами, могла бы не только улучшить наше понимание психического здоровья и мотивации, ученые отмечают, что она также могла бы подтвердить нынешнее направление исследований ИИ для создания интеллекта, похожего на человеческий.

Усиливающее обучение учит комплексным, новым задачам через положительные и отрицательные обратные связи. Алгоритм начинает усваивать задание, случайным образом предсказывая, какое действие может принести ему вознаграждение. Затем он совершает действие, наблюдает за реальной наградой и корректирует свое предсказание, основываясь на пределе погрешности.

После миллиарда предположений алгоритм сводит ошибки предсказания к нулю, и в этот момент он точно знает, какие действия нужно предпринять, чтобы максимизировать свою награду и тем самым может эффективно выполнять задания.

Tags: искусственный интеллект
Subscribe

Posts from This Journal “искусственный интеллект” Tag

promo antony_w august 17, 2014 11:48 18
Buy for 10 tokens
Есть блог, в котором написано много постов про роботов: ссылка И там есть несколько статей о замене рабочих мест человека роботами: Уже к 2018 году роботы отберут у человека часть профессий Рабский труд без зарплаты Армия роботов: зачем она нужна обильной людьми Поднебесной и кому может…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 1 comment