• Главная <
  • Галерея
  • Карта сайта
  • Наши контакты
  • Обратная связь

Mobile-review.com Голосові сервіси і їх майбутній розвиток на прикладі Alexa від Amazon

  1. Посилання по темі

Голосові команди з'явилися давним-давно, але так і не стали революцією, яка назавжди змінила наш світ, а колись здавалося, що саме так і станеться. Навіщо натискати на кнопки телефону, якщо можна вимовити команду і він тут же виконає її? В ті часи здавалося, що голосовий інтерфейс - це майбутнє, за яке варто поборотися, і в цій гонці брали участь багато компаній. Але вони швидко усвідомили, що сам по собі інтерфейс не дає рівним рахунком нічого, люди соромляться розмовляти зі своїми пристроями, їм це здається ненормальним. Голосовий набір став чимось звичним, але особливо не використовуваним в повсякденному житті, поки не стався повторний розквіт, в першу чергу за рахунок голосового пошуку і розпізнавання на Android, в другу чергу за рахунок Siri від Apple. Люди стали частіше використовувати голосовий набір, команди для установки будильників і нагадувань, причому відбувається це вже на природній мові. Досить сказати фразу «OK, Google, постав будильник на 7 ранку», щоб ваш смартфон це зробив. Такого роду команд величезна кількість, і вони дозволяють обходитися без рук, з телефоном можна спілкуватися голосом, і він непогано розпізнає всі команди. Десять років тому про таке можна було тільки мріяти, а сьогодні це вже звична деталь сучасних пристроїв, яка не викликає ніякого подиву, а сприймається якоїсь повсякденною нормою. Поступово незвичність цього інтерфейсу зникає, все частіше ми задаємо пошукові запити голосом, так як це швидше, ніж набирати текст на сенсорній клавіатурі. Так само як і телефони починають нам відповідати голосом, а не просто показувати сторінки. Це дуже зручно в машині, коли немає часу дивитися на екран, а дізнатися щось необхідно, або потрібно внести замітки про зустріч в свій календар.

Першою компанією, що спробувала перенести ці напрацювання в домашню обстановку і досягла успіху в цьому, стала компанія Amazon. Пару років назад вони випустили помічника - Amazon Echo, невелику колонку, яка розпізнає голосові команди і дозволяє отримувати відповіді на свої питання, додавати інформацію в свій календар, ставити будильники, одним словом, робити все те, що ви можете зробити на смартфоні. Відносно недавно вийшла друга версія пристрою - Echo Dot, вона стала менше, а голосовий помічник, якого звуть Alexa, став трішки розумнішими. Подивіться ролик про Alexa, щоб зрозуміти, що вона вміє сьогодні. Переклад не потрібно, зміст оповідання зрозумілий і так.

У Google є аналогічний пристрій, яке називається Google Home, і воно має приблизно тими ж можливостями, що і Echo. Зазначу, що в Google Home краще працює розпізнавання голосу, можна говорити складні фрази, а ось Echo приблизно на рівні Siri, часто складні питання ставлять систему в глухий кут. Зате у Echo є підтримка багатьох пристроїв розумного будинку, які можна контролювати голосом, це перевага того, що Echo з'явився дещо раніше. Часто ці системи порівнюють між собою за поточними можливостями і параметрами, що, на мій погляд, дещо передчасно.

Голосові команди з'явилися давним-давно, але так і не стали революцією, яка назавжди змінила наш світ, а колись здавалося, що саме так і станеться

Ми знаходимося в самому початку розвитку голосових помічників і еволюції їх інтерфейсів, і говорити про те, що хтось уже виграв цю гонку, не можна. Якість роботи голосового помічника буде залежати від декількох моментів, спробую перерахувати їх у випадковому порядку:

  • Якість розпізнавання мови;
  • Якість синтезу мови;
  • Можливість «розуміння» як простих команд, так і складних питань, заданих в довільній формі.

Перші два пункти носять суто технічний характер, шляхи вирішення для цих питань зрозумілі, і щорічно якість розпізнавання мови на різних мовах зростає. Більш того, той же Google вже навчився розпізнавати вкраплення слів, сказаних на інших мовах, наприклад, сказавши «хочу послухати Deep Purple», ви побачите правильну розшифровку назви групи на англійській мові. Система розпізнавання поступово навчається тому, що не завжди люди в одній фразі користуються виключно своєю рідною мовою, даючи оригінальні імена явищ, музичним групам, так багато чого.

Складніше ситуація з розумінням складних речень, наприклад, ставити Alexa або Siri довгі питання не варто, відповідь швидше за все вас розчарує. А ось спробувати поспілкуватися з Google про те, чому Толстой вибрав таких героїв для роману «Війна і мир», можна спробувати. Корінна відмінність підходу Google від того ж Amazon або Apple полягає в тому, що голосовий інтерфейс не є для компанії чимось окремим, він частина більшої системи пошукового гіганта. Фактично, маючи постійно вдосконалюваний пошук, в Google переносять його в голосовий інтерфейс, що дозволяє домогтися набагато кращих результатів, ніж у конкурентів. У цій гонці виграє не той, хто створює кращу технологію розпізнавання голосу або синтезу мови, а той, хто може створити систему, яка вміє вгадувати бажання користувачів і створювати для них додатковий комфорт. Умовно ідеологію Google наступного десятиліття можна описати так: «відповідати на питання людей, які вони ще не встигли задати». У той же час Amazon, Apple і інші компанії планують і створюють системи, що геть-чисто позбавлені прогнозної частини, а вміють лише відповідати на чітко поставлені питання. Типовий сценарій, наприклад, прогноз погоди або маршрут до роботи, вважати складним прогнозом можна, це банально і нецікаво. Хоча для когось, може, і створює видимість «інтелекту» машини.

Проблема успішного помічника полягає в необхідності доступу до великого обсягу інформації, як до ваших особистих даних, так і до різних сервісів. Наведу такий приклад. Щороку у мене є традиційні поїздки на виставки, в січні я вирушаю на CES в Лас-Вегас, в лютому-березні - в Барселону на MWC, у вересні їжу в Берлін на IFA. Щороку маршрути приблизно однакові, так само як і та інформація, яка мені потрібна як до поїздок, так і під час них. Як може визначити мою поїздку той же Amazon або Siri? За фактом листів, в яких містяться квитки, бронь на готель, або відповідних пошуків, які зроблені через пристрої цих компаній. У разі Google компанія «бачить» мою історію переміщень і може проаналізувати її, причому такий аналіз може бути багатоплановим - це історія геометок, аналіз фотографій і того, що на них зображено, пошта з листами і так далі. Не варто недооцінювати смартфони на Android, так як вони дають повну інформацію про те, що ми робимо, коли і як. Аналізуючи ці дані, можна зрозуміти наші уподобання в їжі (скільки ви провели часу в ресторанах, які вам подобаються більше, якісь менше, скільки часу ви нудьгували за столом і сиділи в телефоні). Та ж Alexa нічого цього не знає і ніякої можливості дізнатися не має, вона відрізана від світу і заточена в вашому домі. А значить, прогнозування для неї - це таємниця за сімома печатками, забезпечити високий рівень система не зможе. Унікальність положення Google полягає в тому, що це одночасно пошуковий гігант і виробник платформи, що встановлена ​​на більшості мобільних пристроїв в світі. Той же Apple в теорії може спробувати збирати рівно ті ж дані, але їх якість буде помітно нижче, у них просто немає аналогічних можливостей по обробці даних, що добре видно на прикладі карт від Apple: число POI, їх якість і подробиці залишають бажати кращого. У теорії вони зможуть поліпшити ці параметри до рівня поточного Google за 4-5 років, але за цей час і Google піде вперед.

У Amazon ще менше даних, ніж у Apple, тому у них перспектив на цьому ринку і того менше. З великих гравців можна і потрібно згадати Microsoft, які страждають від відсутності даних з полів, у них немає мобільних пристроїв на своїй ОС. А є ще Facebook, який максимально близький до Google зі збору інформації про те, що роблять його користувачі щодня, але також страждає через відсутність пошукової інформації у великій кількості. Будь-яка компанія, яка захоче стати сильним гравцем на ринку голосових помічників, буде змушена вирішувати дуже складне питання: де взяти пошукову інформацію, яка зможе підвищити точність прогнозів та зробити їх корисними.

У моєму прикладі це буде означати необхідність надати мені найкращі квитки в інші міста, підказати на підставі історичних даних, коли їх краще всього купити, а також подивитися ті готелі, в яких я вже зупинявся, і запропонувати найкращі ціни. Можливо, в автоматичному режимі написати в готель і запросити знижку для постійного клієнта. Фантастика? Повірте, ця фантастика трапиться з нами набагато швидше, ніж вам здається, це справа найближчого десятиліття. Автоматизація нашому житті відбудеться моментально, і нам вона напевно сподобається, хоча не обійдеться і без шишок під час становлення технології. Наприклад, поточні голосові помічники не ідентифікують своїх власників по голосу, досить сказати команду, і вони починають працювати. Доходить до смішного, люди дивляться на телевізорі або комп'ютері ролик про проблему Alexa із замовленням ляльок для дітей без відома власників, і їх Alexa також розпізнає команду на покупку і відправляє таке замовлення! Це кумедна ілюстрація того, що в майбутньому ідентифікація господаря по голосу стане необхідною частиною таких систем, вони поки на самому початку свого шляху.

З комерційної точки зору лідер сьогоднішнього ринку помічників для будинку - це Amazon. У компанії не стали тримати Alexa тільки для себе, а ліцензують цю технологію всім бажаючим. На CES 2017 більше десятка компаній показали свої продукти з вбудованим помічником Alexa, це як прямі копії домашнього помічника Echo від Amazon, так і інтеграція Alexa в телевізори, холодильники, пральні машини і навіть навушники.

Мабуть, саме цей факт і змушує багатьох думати, що настає час Amazon на цьому ринку, але у мене є своя думка про це. Засилля Alexa в продуктах інших компаній пов'язане з тим, що в Google не дають свого асистента зовні, так як не вважають його готовим. Він ще проходить обкатку в різних продуктах компанії, наприклад, ви можете завантажити месенджер Allo і поспілкуватися з помічником в ньому, побачите досить нетривіальні варіанти взаємодії (поки, на жаль і ах, тільки англійською мовою).

Як показує історія, в Google випускають свої технології на широкий ринок і не прагнуть створювати самостійно залізо, так трапиться і з умовним Google Home, він буде доступний усім бажаючим, як тільки технологію вважатимуть готової для масового ринку. Це означає, що у Alexa є не так багато часу, щоб закріпитися на ринку. Тим більше що працює Alexa поверх того ж Android, тобто заміна цього помічника на такий від Google може відбуватися легко і просто. Швидше за все, ми побачимо аналоги Google Home від різних компаній в кінці 2017 - початку 2018 року.

В якійсь мірі це поки дуже вузька ніша, отаке пристрій для управління розумним будинком і пошуку, позбавлене екрану на корпусі (смартфон - ось його віддалений екран) і з голосовим інтерфейсом. Зверніть увагу, що голосових інтерфейсів в нашому житті незаслужено мало, їх майже немає. Я зміг згадати ліфти, які відраховують поверхи і кажуть, куди вони рухаються, машину, яка повідомляє важливі новини голосом, і, мабуть, все. Телефони в розрахунок не беру, тут все зрозуміло, інтерфейс присутній, і ми ним користуємося. Можливо, що ця тема стане модною на короткий проміжок часу. Можливо, що ні. Це не грає ролі, так як голосові інтерфейси стануть стандартними для безлічі пристроїв, вони виглядають природно і дозволяють уникнути необхідності додавати на корпус купу клавіш і керуючих елементів, багато з яких зайві. Приклад з іншої області - це навушники The Dash від компанії Bragi. У них є голосовий помічник, який допомагає їх налаштувати і керувати навушниками в різних ситуаціях. Щось подібне є у різних виробників, але саме в цих навушниках помічник став не просто зручним, а приємним у використанні і виглядає природно.

Голосові інтерфейси вилізли з пелюшок, технологія стала дорослою. Але якщо у Google вони приєднана до всього, що робить компанія в інших областях, і буде використана для прогнозування того, що вам потрібно, то у інших компаній все набагато простіше. У цьому відмінність, і тому я вірю в те, що Google в кінцевому підсумку буде дуже популярний на цьому ринку, повторить успіх Android. Власне голосові помічники стануть похідним від Android для Google. Паралельно треба сказати, що отримають розвиток звичайні голосові інтерфейси для управління великим числом пристроїв, це будуть прості або навіть складні команди. Наприклад, ви зможете поговорити зі своїм чайником і сказати, що щось таке: «Спар воду до вечірніх новин і нагадай мені про це свистком». Але це просто управління, а не прогнозування, і не варто плутати ці дві області. Чайник в Google Home, навпаки, скипить за хвилину до того, як ви вирішите прийти на кухню і включити його. Але це станеться не завтра, а трохи пізніше, коли такі системи отримають широке поширення. Ми вже рухаємося до цього семимильними кроками.

Посилання по темі

Поділитися:

Ми в соціальних мережах:


Є, що додати ?! Пишіть ... [email protected]

Навіщо натискати на кнопки телефону, якщо можна вимовити команду і він тут же виконає її?
Як може визначити мою поїздку той же Amazon або Siri?
Фантастика?
Новости