Аналітика великих даних із відкритим кодом

Автор: Laura McKinney
Дата Створення: 1 Квітень 2021
Дата Оновлення: 14 Травень 2024
Anonim
Юлия Латынина /Христо Грозев: сводка о войне/ 04.03.2022/ LatyninaTV /
Відеоролик: Юлия Латынина /Христо Грозев: сводка о войне/ 04.03.2022/ LatyninaTV /

Зміст

Визначення - Що означає аналітика великих даних із відкритим кодом?

Аналітика великих даних із відкритим кодом стосується використання програмного забезпечення та інструментів з відкритим кодом для аналізу величезної кількості даних для збору відповідної та корисної інформації, яку може використовувати організація для досягнення своїх бізнес-цілей. Найбільшим гравцем в аналітиці великих даних з відкритим кодом є Apaches Hadoop - це найпоширеніша бібліотека програмного забезпечення для обробки величезних наборів даних через кластер комп'ютерів, що використовують розподілений процес для паралелізму.


Вступ до Microsoft Azure та Microsoft Cloud | У цьому посібнику ви дізнаєтеся, що стосується хмарних обчислень та як Microsoft Azure може допомогти вам мігрувати та вести свій бізнес із хмари.

"Техопедія" пояснює відкриті джерела аналізу великих даних

Аналітика великих даних із відкритим кодом використовує програмне забезпечення та інструменти з відкритим кодом, щоб виконувати аналітику великих даних, використовуючи цілу програмну платформу або різні інструменти з відкритим кодом для виконання різних завдань у процесі аналізу даних. Apache Hadoop - найвідоміша система для аналізу великих даних, але інші компоненти потрібні для того, щоб реальна система аналітики змогла бути складена разом.

Hadoop - це реалізація алгоритму MapReduce з відкритим кодом, який запроваджено Google та Yahoo, тому він є основою більшості аналітичних систем сьогодні. Багато інструментів для аналізу великих даних використовують відкритий код, включаючи надійні системи баз даних, такі як MongoDB з відкритим кодом, складну і масштабовану базу даних NoSQL, що дуже підходить для великих програм даних, а також інші.


Послуги з аналітики великих даних із відкритим кодом охоплюють:

  • Система збору даних
  • Центр управління для адміністрування та моніторингу кластерів
  • Бібліотека машинного навчання та обміну даними
  • Служба координації додатків
  • Обчислювальний двигун
  • Виконання рамки