Марківський процес прийняття рішень (MDP)

Відеоролик: МАС КПІ. Лекція 6. MDP та їх розв’язок

Зміст

Визначення - Що означає процес рішення Маркова (MDP)?
Вступ до Microsoft Azure та Microsoft Cloud | У цьому посібнику ви дізнаєтеся, що стосується хмарних обчислень та як Microsoft Azure може допомогти вам мігрувати та вести свій бізнес із хмари.
Техопедія пояснює процес прийняття рішень Маркова (MDP)

Визначення - Що означає процес рішення Маркова (MDP)?

Процес прийняття рішення Маркова (МДП) - це те, що професіонали називають "дискретним процесом стохастичного контролю часу". Його основою є математика, яку створив російський академік Андрій Марков наприкінці 19 - початку 20 століть.

Вступ до Microsoft Azure та Microsoft Cloud | У цьому посібнику ви дізнаєтеся, що стосується хмарних обчислень та як Microsoft Azure може допомогти вам мігрувати та вести свій бізнес із хмари.

Техопедія пояснює процес прийняття рішень Маркова (MDP)

Один із способів пояснення процесу прийняття рішення Маркова та пов'язаних з ним ланцюгів Маркова полягає в тому, що це елементи сучасної теорії ігор, що базуються на більш простих математичних дослідженнях російського вченого кількасот років тому. Опис процесу рішення Маркова полягає в тому, що він вивчає сценарій, коли система знаходиться в певному наборі станів, і переходить до іншої держави на основі рішень того, хто приймає рішення.

Ланцюжок Маркова як модель показує послідовність подій, коли ймовірність даної події залежить від раніше досягнутого стану. Професіонали можуть говорити про «лічильний простір стану», описуючи процес прийняття рішення Маркова - деякі асоціюють ідею моделі рішення Маркова з моделлю «випадкової прогулянки» або іншою стохастичною моделлю, заснованою на ймовірностях (модель випадкової прогулянки, часто цитується на Уолл Вулиця, моделює рух власного капіталу вгору або вниз, відповідно до ймовірності ринку).

Загалом, процеси прийняття рішень Маркова часто застосовуються до деяких найскладніших технологій, над якими сьогодні працюють професіонали, наприклад, в моделях робототехніки, автоматики та досліджень.