Як компанії можуть використовувати випадкові лісові моделі для прогнозування?

Відеоролик: The Great Gildersleeve: Gildy’s New Car / Leroy Has the Flu / Gildy Needs a Hobby

Зміст

Q:

A:

Компанії часто використовують випадкові лісові моделі для того, щоб робити прогнози з процесами машинного навчання. Випадковий ліс використовує кілька дерев рішень для більш цілісного аналізу заданого набору даних.

Єдине дерево рішень працює на основі відокремлення певної змінної чи змінних відповідно до бінарного процесу. Наприклад, при оцінці наборів даних, що стосуються набору автомобілів чи транспортних засобів, одне дерево рішень може сортувати та класифікувати кожний окремий транспортний засіб за вагою, розділяючи їх на важкі або легкі транспортні засоби.

Випадковий ліс будується на моделі дерева рішень і робить його більш досконалим. Експерти говорять про випадкові ліси як про «стохастичну дискримінацію» або про метод «стохастичного відгадування» щодо даних, застосованих до багатовимірних просторів. Стохастична дискримінація, як правило, є способом поліпшити аналіз моделей даних за межами того, що може зробити одне дерево рішень.

В основному випадковий ліс створює безліч індивідуальних дерев рішень, що працюють на важливих змінних із застосуванням певного набору даних. Одним з ключових факторів є те, що у випадкових лісах набір даних та змінний аналіз кожного дерева рішень зазвичай перетинаються. Це важливо для моделі, тому що випадкова лісова модель бере середні результати для кожного дерева рішень, і враховує їх зважене рішення. По суті, аналіз бере на себе всі голоси різних дерев рішень і створює консенсус, щоб запропонувати результативні та логічні результати.

Один приклад ефективного використання алгоритму випадкових лісів доступний на сайті R-blogger, де письменниця Тея Кодалі бере приклад визначення якості вина за допомогою таких факторів, як кислотність, цукор, рівень діоксиду сірки, значення рН та вміст алкоголю. Кодалі пояснює, як алгоритм випадкового лісу використовує невеликий випадковий набір функцій для кожного окремого дерева, а потім використовує отримані середні значення.

Зважаючи на це, підприємства, які хочуть використовувати алгоритми навчання випадкових лісових машин для прогнозного моделювання, спочатку виділять прогнозні дані, які необхідно звести до набору виробництв, а потім застосувати їх до випадкової лісової моделі, використовуючи певний набір навчання дані. Алгоритми машинного навчання приймають ці дані навчання та працюють з ними, щоб розвиватися поза межами їх початкового програмування. Що стосується випадкових лісових моделей, технологія вчиться формувати більш досконалі прогнозні результати, використовуючи ці індивідуальні дерева рішень для побудови свого випадкового лісового консенсусу.

Один із способів цього застосувати до бізнесу - це взяти різні змінні властивості продукту та використовувати випадковий ліс, щоб вказати на потенційний інтерес клієнта. Наприклад, якщо існують відомі фактори зацікавленості клієнтів, такі як колір, розмір, довговічність, портативність або все інше, до чого клієнти виявили зацікавленість, ці атрибути можуть бути передані в набори даних і проаналізовані на основі їх власного унікального впливу на багатофакторність аналіз.