Дані вчені: нові рок-зірки в світі технологій

Автор: Robert Simon
Дата Створення: 24 Червень 2021
Дата Оновлення: 1 Липня 2024
Anonim
INSCIENCE. Автостопом по Галактиці: технології космічних досліджень. Якуб Бохинський
Відеоролик: INSCIENCE. Автостопом по Галактиці: технології космічних досліджень. Якуб Бохинський

Зміст


Джерело: Onradio / iStockphoto

Винос:

Роль вченого даних швидко стає найбільш затребуваною кар'єрою в світі технологій. Ми запитали найвищого вченого даних Джейка Порвея з The New York Times про те, як він влаштувався на роботу та про поради щодо успіху в цій галузі.

Роль вченого даних швидко стає найбільш затребуваною кар'єрою в світі технологій. Такі компанії, як Google, Amazon та LinkedIn, використовують вчені даних, щоб допомогти їм підтримувати цю інноваційну перевагу в епоху цифрових даних. І тепер ентузіасти даних та технологій прагнуть стати науковцями даних так само, як деякі музиканти прагнуть стати рок-зірками. Можливо, тому деякі люди називають вчених-даними новими рок-зірками епохи технології.

На жаль, ця роль все ще настільки нова, що все ще залишається незрозумілим щодо цього, а це означає, що багато вчених, які хочуть отримати дані, ведуть свої туристичні автобуси неправильною дорогою.Чи заслуговують дані вчені за репутацією рок-зірки? Ми занурилися у світ науки про дані за допомогою інтерв'ю з Джейком Порвей, науковцем з досліджень у галузі науково-дослідних досліджень у The New York Times.


Дані вчені: Технічні рок-зірки?

То чому ж науковців даних називають новими рок-зірками світу технологій? Ця аналогія насправді йде глибше, ніж бажання даних оскаржити ультраохолодження. Як і рок-зірка, кар'єра вчених даних включає різноманітність, художню свободу та пристосованість. І подібно до рок-зірок світу розваг, найкращі науковці з даними, як правило, здобувають цілий перелік людей з усіх галузей індустрії даних та технологій.

Те, що робить вчений, дуже різноманітно; подібно до того, як музиканти використовують різні інструменти, інструменти та методи для відтворення музичних стилів, настільки ж розрізнених, як джаз та дет-метал, науковець з даних також опановує певний інструмент та сферу. У них також задіяний стиль. І немає правильного чи неправильного способу виконувати роботу - це стосується впливу роботи на інших людей.

Коли "Бітлз" писали свої пісні, не одна людина диктувала, як слід грати кожну ноту на кожному інструменті. Вони зійшлися і заклинили; завдяки творчому відкриттю вони знайшли пісні, які працювали. Це те ж саме для науковців даних. Вони повинні відчути ритм, потрапити в паз і гармонізувати рішення. Це можливо лише за умови достатньої кількості мистецької свободи спробувати будь-які підходи, інструменти та прийоми, які можуть прийти до тями в даний момент, - і спритність вносити зміни, коли щось здається не ключовим.


Як тільки науковець даних освоїть основні основи, він або вона стає адаптованим і завойовує впевненість у наданні рішень в інших сферах. Про ці основні основи ми поговоримо пізніше. Сенс, який потрібно зробити тут, полягає в тому, що коли ви освоїте науку про дані, ви можете взяти на себе роль у будь-якому полі, яке вам потрібно, адже дані є скрізь.

Кінцева мета вченого - створити велику кількість цінної для якомога більшої кількості людей. Хоча науковець працює за лаштунками, це не на відміну від гри для широкої аудиторії: чим краще ви виконуєте роботу, тим більше людей досягаєте - і тим більше нагород ви бачите.

Дані, що вчені роблять?

То що ж роблять дані вчені? Давайте розглянемо це на прикладі, до якого ми всі можемо мати відношення.

Ні помилок, ні стресу - покроковий посібник зі створення програмного забезпечення, що змінює життя, не руйнуючи ваше життя

Ви не можете покращити свої навички програмування, коли ніхто не піклується про якість програмного забезпечення.

Скажімо, ви зрозуміли, що одного разу у вас немає такої ж кількості енергії, як раніше. Отже ви поставили собі за мету: мати більше енергії протягом дня. Тепер це досить широка і неоднозначна мета. Отже, перший крок, як науковець даних, - це усунути частину цієї неоднозначності та кількісно оцінити вимірюваність цих цілей. Для цього є методи. Ми не хочемо тут розбиратися в деталях, але давайте просто скажемо, що ви теоретизуєте, що ви не висипаєтесь, і, таким чином, даєте собі підзавдання отримувати вісім годин сну щовечора.

Незважаючи на те, що ця мета трохи вимірніша і менш неоднозначна, вона має свої виклики. Ви не можете по-справжньому запустити таймер, коли ви засинаєте, і навіть якщо ви запускаєте таймер після того, як скакаєте в ліжко, ви можете не засинати відразу. Крім того, важко врахувати час, коли ви прокидаєтесь посеред ночі. Нарешті, існують різні види сну, такі як глибокий сон і легкий сон. Суть полягає в тому, що її важко точно виміряти сном, а тому ще складніше виміряти його вплив на рівень енергії.

Отже, що ти можеш зробити? Що ж, як науковець ви шукаєте новітні технології та виявляєте, що є пристрої для моніторингу сну. І якщо ви використовували такий пристрій для вимірювання та цифрового запису сну, ви зможете отримати більш точні дані про сон і збирати ці дані з часом, щоб скласти графік.

Це одне лише може дати вам більше розуміння того, що відбувається. Візуальне зображення надасть вам усвідомлення, чіткість та спрямованість. Ви зможете побачити, чи досягаєте ви своєї мети вісім годин сну на ніч і, що ще важливіше, зможете вжити заходів, якщо ви цього не зробите.

Це основна робота науковця даних: довести нові способи вимірювання та відображення даних, щоб забезпечити більше поінформованості, чіткості та спрямованості для тих, хто дивиться на них.

Але хороший науковець не зупиняється на цьому. Після збору даних вони можуть бути інтегровані з будь-якою іншою вимірюваною діяльністю, яку ви робите протягом дня. Інтегруйте його зі своєю продуктивністю на основі даних вашої системи управління завданнями. Інтегруйте його зі своїм настроєм на основі твітів та оновлень статусу. Інтегруйте його зі своїм здоров’ям на основі відвідування тренажерного залу або схуднення. Оскільки кількість доступних даних та легкість, з якою вони можуть бути захоплені, можливості нескінченні.

Як бути науковцем даних

Цікавитесь кар'єрою в галузі даних про дані? Оскільки наука даних є такою новою, ми попросили найкращого вченого з питань даних про розуміння цієї галузі. Джейк Порвей - науковець з даних The New York Times і засновник DataKind (спочатку відомий як Дані без кордонів), який відповідає неприбутковим організаціям, які потребують науки в галузі даних, і фрілансерам. Порвей має досвід інформатики та доктор наук. в статистиці з UCLA. Ось, що він мав сказати про те, як потрапити в науку про дані, як добре працювати та як уникнути ключових помилок у цій галузі.

1. Отримати правильні навички

За словами Порвей, потрапляння в поле зводиться до трьох ключових речей:

  • Практичні навички обчислення
  • Статистичні навички
  • Бажання вчитися

"Вам потрібно вміти писати сценарії для скребки даних, а також кодувати алгоритми, які ви створюєте в голові", - говорить Порвей. "Ви повинні знати свої основні статистичні дані (і більше, в ідеалі), якщо ви дійсно зможете оцінити, чи створюються вами моделі чи алгоритми, які ви пишете, які ви хочете".

2. Зв’яжіть

Перш ніж приєднатися до лабораторії науково-дослідної роботи New York Times, Порвей працював у машинному навчанні та комп’ютерному зорі і витратив багато часу на отримання роботів для виявлення мін та польотів літаків (наскільки це круто що?). До того, як він не влаштувався на роботу в The New York Times, він розширився на більш широкі завдання з вивчення даних, а саме на проект Cascade, який відстежує посилання з публікації в соціальних мережах.

Найважливіше дістатися в цій галузі, каже Порвей, - це навчитися.

"Приступайте до проекту з наукових даних!" Порвей каже. "Завантажте деякі дані, візьміть трохи R та починайте грати ... Я скажу, щоб зосередитись на використанні чогось типу R поряд із базовою книгою статистики, щоб провести вас шляхом вивчення деяких даних. Машинне машинне навчання та обчислювальна техніка постануть із цим Звичайно, це залежить від вашого минулого досвіду - якщо ви вже є статистиком, підберіть трохи Python!) "

Тоді прийшов час зробити деякі зв’язки. Porway рекомендує місцеву групу зустрічей - адже бути частиною спільноти наукових даних - це "найшвидший спосіб дізнатися, що ти не знаєш". І в галузі, яка постійно розвивається, це має значення.

3. Вступайте в гру

У Порвей є доктор наук. в статистиці з UCLA, але він підкреслює, що вам не потрібен один, щоб зробити гарну роботу.

"Це може допомогти, але не думайте, що вам доведеться піти і робити ще п’ять років школи, щоб мати можливість називати себе науковцем даних", - сказав Порвей.

Наука даних - це відносно нова галузь. Це означає, що тим, хто хоче вийти на поле, потрібно підходити до нього відкрито.

"Вчений з даних Foursquare буде виглядати набагато інакше, ніж вчений з даних Goldman Sachs", - говорить Порвей.

4. Рок ваша нова роль

Наука даних - це все про уточнення цілей, вивчення припущень, оцінку доказів та оцінку висновків. Але це один маленький шматочок головоломки, який багато людей не помічають. Ви можете здогадатися, що це таке? За словами Порвей, секретним інгредієнтом є критичне мислення.

"Це насправді відрізняє хакерів від справжніх вчених", - каже Порвей. "Ви були б вражені тим, скільки разів я бачив, як хтось створює модель і повідомляє про результати, не розуміючи, що вони не критично думали про те, звідки беруться дані, або якщо їх експеримент був розроблений правильно. Ви повинні ПОВИННО мати можливість ставити під сумнів кожен крок вашого процесу та кожного номера, який ви придумали ".

Шлях до великих даних

Порвей каже, що коли він зрозумів здатність використовувати величезну кількість даних, щоб навчати машини самостійно, це підірвало його розум. Саме ця пристрасть - і його освіта та навички - допомогли йому стати найкращою роботою в галузі даних. Якщо ви хочете розгорнути великі дані, згорніть книжки, завантажте деякі дані і починайте грати. Ніколи не знаєш, що з’явиться купа сирих даних.

Щоб отримати повну стенограму інтерв'ю, перейдіть до DataScientists.Net.