Чим відрізняється мовлення від тексту та чатів?

Автор: Roger Morrison
Дата Створення: 26 Вересень 2021
Дата Оновлення: 10 Травень 2024
Anonim
Мова та мовлення
Відеоролик: Мова та мовлення

Зміст

Q:

Яка різниця між мовою та чатами?


A:

Численні суттєві відмінності між технологіями промовлення та чатботами є частиною того, що вивчається у швидкій еволюції проектів чатботів та голосових роботів.

Технологія мовлення - це просто те, що перетворює словесне мовлення на цифрову сторінку. Це його повноцінна функція, але не одна проста у дизайні. Для того, щоб перетворити словесне мовлення, технологія повинна розбивати слова та речення на окремі фонеми та працювати з ними за складними алгоритмами, щоб створити це точно та відображати те, що сказав мовець.

З іншого боку, чати - це технології, що досягають мети спілкування з людиною. Існує два типи чатів: чати та голосові роботи. чат-ботів існує набагато довше, тому що їм не потрібен елемент мовлення, який використовують голосові роботи.

Основна відмінність між мовленнєвими технологіями та чат-ботами - це масштаб. Як вже було сказано, все, що потрібно зробити, - це переписати усне мовлення. З іншого боку, чат-бот повинен виступити з мовою в будь-якій формі, для якої це зроблено, зрозуміти, та надати відповіді, які прагнуть пройти тест Тьюрінга - тест на те, чи може технологія обдурити людину думати, що він чи вона розмовляючи з іншою людиною.


Зважаючи на це, чатові створювати набагато простіше, ніж голосові. Чатбот приймає людей і забезпечує відповідь. Навіть відносно прості чати змогли забезпечити цікаві та приємні результати для людини з кінця 1980-х та початку 1990-х.

З іншого боку, голосовий робочий апарат повинен прийняти словесну промову, перетворити її, перевірити її на точність, створити відповідь і побудувати цю відповідь з машинної мови в чутну мову. Ця велика кількість досить значущих завдань означає, що голосовий робочий апарат вимагає великої кількості обчислювальної потужності та багато дизайну.

Такі проекти, як Siri, Cortana та Alexa, демонструють частину авангарду технологій голосових роботів. Вони також ілюструють, що ця технологія ще знаходиться в зародковому стані. Хоча Alexa та інші технології можуть відповідати словесно на людську мову, вони не надто здатні в тому сенсі, який ми асоціюємо з словесною людською промовою в цілому. Іншими словами, існує досить обмеження у відповідях, які ці технології можуть надати. Існує навіть обмежена здатність сьогоднішнього покоління особистих помічників реально створювати мовлення, наприклад, для транскрибування чи допомоги комусь у написанні реферату, не користуючись руками. Деякі конкретні програми, що виступають на ринку, роблять це краще, ніж Siri або Cortana, ймовірно, завдяки розподілу ресурсів. Однак є ознаки того, що незабаром відбудеться прогрес голосових роботів - наприклад, платформа Amazons Lex, яка дозволяє студійному середовищу будувати такі технології.


У розумному та повчальному нарисі на цю тему Тобіас Гебель розповідає про різницю між цими технологіями, протиставляючи процес «транскрипції», який мова йде, до роботи з розумінням, яку чат-боти повинні робити.

"Хоча усунення потреби в розпізнаванні мовлення полегшує роботу чатботу, головне завдання побудови функціонуючих ботів полягає в розумінні природної мови", - пише Гебель.

Goebel також визначає багатьох сучасних гравців у галузі:

Лідером на ринку розпізнавання мовлення є Nuance, який стоїть за відомими системами, такими як Dragon NaturallySpeaking за диктантом на ПК, який існує вже з дев'яностих років, але також і Siri: завдання розпізнавання / транскрипції мовлення, що використовується в хмарі Apple, використовує Нюансова технологія за кадром. Інші - LumenVox, Verbio або Interactions, але розпізнавання мовлення тепер також пропонується як хмарна послуга через API, схожі на Amazon, Google, Microsoft та IBM.

По мірі розвитку чатових програм, передбачається, що їх розуміння буде продовжувати зростати на певній траєкторії - а також багато в чому передбачається, що більше бот-технологій перейде від інтерфейсів до словесних інтерфейсів, що вимагатиме додаткових обчислювальних потужностей.