Навчання зміцненню

Відеоролик: УКРЕПЛЕНИЕ Натуральных ногтей Гелем / Гели Cosmoprofi / Татьяна Бугрий

Зміст

Визначення - Що означає навчання підсилення?
Вступ до Microsoft Azure та Microsoft Cloud | У цьому посібнику ви дізнаєтеся, що стосується хмарних обчислень та як Microsoft Azure може допомогти вам мігрувати та вести свій бізнес із хмари.
Техопедія пояснює навчання з посилення

Визначення - Що означає навчання підсилення?

Навчання підкріпленню, відповідно до штучного інтелекту, - це тип динамічного програмування, який здійснює підготовку алгоритмів за допомогою системи винагороди та покарання.

Алгоритм навчання або агент, який навчається, вивчає, взаємодіючи зі своїм оточенням. Агент отримує винагороду за правильне виконання та штраф за неправильне виконання. Агент вчиться без втручання людини, максимізуючи свою винагороду і зводячи до мінімуму свою кару.

Вступ до Microsoft Azure та Microsoft Cloud | У цьому посібнику ви дізнаєтеся, що стосується хмарних обчислень та як Microsoft Azure може допомогти вам мігрувати та вести свій бізнес із хмари.

Техопедія пояснює навчання з посилення

Підсилення навчання - це підхід до машинного навчання, який надихається психологією біхевіоризму. Це схоже на те, як дитина вчиться виконувати нове завдання. Навчання підсилення контрастує з іншими підходами машинного навчання тим, що алгоритм не вказує прямо, як виконувати завдання, але працює над проблемою самостійно.

Як агент, який може бути автомобілем, що керує автомобілем, або програмою, що грає в шахи, взаємодіє зі своїм оточенням, отримує стан винагороди залежно від того, як це виконує, наприклад безпечно їхати до місця призначення або виграти гру. І навпаки, агент отримує штраф за неправильне виконання робіт, наприклад, за вихід з дороги або за перевірку.

Агент з часом приймає рішення щодо максимізації своєї винагороди та мінімізації штрафу за допомогою динамічного програмування. Перевага такого підходу до штучного інтелекту полягає в тому, що він дозволяє програмі AI навчатися без програміста, який чітко визначає, як агент повинен виконувати завдання.