Q-навчання

Автор: Roger Morrison
Дата Створення: 24 Вересень 2021
Дата Оновлення: 11 Травень 2024
Anonim
!!!СУПЕР ПАМЯТЬ!!! Музыка для Обучения и улучшения Памяти
Відеоролик: !!!СУПЕР ПАМЯТЬ!!! Музыка для Обучения и улучшения Памяти

Зміст

Визначення - Що означає Q-навчання?

Q-навчання - це термін для структури алгоритму, що представляє навчальне підкріплення без моделей. Оцінюючи політику та використовуючи стохастичне моделювання, Q-навчання знаходить найкращий шлях вперед у процесі рішення Маркова.


Вступ до Microsoft Azure та Microsoft Cloud | У цьому посібнику ви дізнаєтеся, що стосується хмарних обчислень та як Microsoft Azure може допомогти вам мігрувати та вести свій бізнес із хмари.

Техопедія пояснює Q-навчання

Технічний склад алгоритму Q-навчання включає агент, набір станів і набір дій на стан.

Функція Q використовує ваги для різних етапів у поєднанні з коефіцієнтом знижки, щоб оцінити винагороду.

Хоча це може здатися простою ідеєю, Q-навчання має першорядне значення у багатьох типах моделей навчання та глибокого навчання. Один з найкращих прикладів - це глибоке Q-навчання, яке допомагає програмам машинного навчання вивчати стратегії ігрових ігор у різних видах відеоігор, наприклад, в іграх Atari 1980-х років. Тут згорнута нейронна мережа бере зразки гри, щоб розробити стохастичну модель, яка допоможе комп’ютеру знати, як краще грати в гру з часом.

Q-навчання має великий потенціал для сприяння просуванню штучного інтелекту та машинного навчання.