Полный список голосовых команд для голосового ассистента Маруся от компании Mail ru (VK). Голосовой ассистент, который тесно связан с устройствами компании Самсунг и поддерживает 4 языка, на русском не говорит. Этого голосового ассистента создали, когда Siri ещё не была адаптирована для русскоязычных пользователей. Siri считается одним из лучших голосовых помощников, однако в зарубежных независимых тестах и сравнениях в последние годы она уступает более гибким помощникам от Google и Amazon как в скорости реакции, так и в совместимости с умными устройствами других компаний.
Больше половины россиян пользовались голосовыми помощниками за последние полгода
VoiceTech уже сегодня снимает с людей множество задач не только в крупных, но в средних и малых компаниях. Голосовые роботы под голосовыми технологиями и роботами мы понимаем инструменты для автоматических звонков в бизнесе нанимают сотрудников, обзванивают клиентов, продают, рекламируют и приглашают на мероприятия. И порой делают это так, что собеседники даже не подозревают: они говорят не с человеком. Наибольший спрос на голосовые решения аналитики отмечают в банковской сфере и e-commerce — их использование помогает компаниям не отставать от потребительского спроса. При этом в ближайшее время количество голосовых решений увеличится и в сфере здравоохранения — в период COVID-19 голосовые чат-боты уже помогали проводить скрининги и сортировку пациентов.
Достоинство голосового помощника напрямую вытекает из того числа операций команд , которые он способен распознать и правильно их обработать. Именно сценарии использования становятся второй проблемой для широкого и быстрого распространения голосовых помощников по всему миру.
В Amazon привлекли сторонних разработчиков, чтобы они создавали свои сценарии использования и команды, к концу февраля 2017 года таких команд стало 10. В Amazon их называют «умениями» skills. Простота создания новых умений подкупает разработчиков, равно как и то, что продукты от Amazon популярны в Америке, поэтому очень быстро голосовые помощники научились заказывать пиццу из любого магазинчика рядом, вызывать Uber и делать множество не таких тривиальных вещей. Чем больше людей пользуется голосовыми помощниками, тем большее число сценариев возникает, а система быстрее учится их правильно обрабатывать. Например, в самом начале пути Alexa почти не знала немецкие рок-группы, хотя сам язык поддерживался. Сегодня поиск по музыкальным группам Германии и жанрам музыки пусть и не идеален, но вполне сносен, вы можете получить необходимые сведения, запросив информацию.
Система обучается, и прогресс налицо. Для сторонних разработчиков возникает вопрос, кто будет создавать и поддерживать такую систему. Например, в Китае сейчас наблюдается бум стартапов, что инвестируют десятки миллионов долларов в это направление, они создают компании, которые пытаются в одном продукте предоставить как раз обработку сценариев и их автоматизацию. Это не только и не столько рынок голосовых помощников, для такой автоматизации найдется более широкое применение, например, это обработка заказов на сайтах, создание чат-ботов для поддержки клиентов любого бизнеса, в России вы уже сталкиваетесь с этим, обращаясь в службу поддержки Билайна, беседу с вами ведет программа. Бум развития сценариев, которые нужны потребителям, напрямую связан с помощниками, они выигрывают от того, что в алгоритмы загоняют стандартные действия. К сожалению, формализовать естественный язык не так-то просто, поэтому любые диалоги с голосовым помощником или программой в сети не являются очень глубокими.
Так, любой разговор можно описать в парадигме вопрос-ответ, когда каждая пара образует один уровень, большинство программ обработки диалогов сегодня ведут более-менее осмысленный разговор для 2-3 уровней, затем они начинают пасовать, и тогда появляется продуманная программистами заглушка, например, у Siri это шутки, которые должны скрыть незнание программой того, как действовать дальше. Пользовательские сценарии условно можно разделить на простейшие, те, что не зависят от страны и языка, и сложные. То есть, это предопределенные действия, реализация которых в устройстве или программе не вызывает никаких затруднений. В простых сценариях важно, чтобы система распознавания речи правильно распознала контекст и то, является запрос утверждением или вопросом. Например, одна и та же фраза может восприниматься системой различно: «Будильник на 8 часов стоит или нет? Многие системы первоначально просто ставили будильник на это время, не проверяя, есть он уже или нет.
Теперь они «научились» проверять состояние будильника и правильно отвечать на этот вопрос. Сложные сценарии напрямую привязаны к контексту языка и страны. Например, спрашивая, что сегодня идет в кино, вы не ждете, что голосовой помощник зачитает вам список фильмов в Нью-Йорке, наверное, вы хотите услышать его для своего города и желательно для своего района или любимого кинотеатра. Локальный контекст становится архиважным, и глобальные компании зачастую не могут сделать ничего в этой области. Исключением является Google, у которого системы Google Now и Google Maps построены вокруг сбора точек интереса, или POI, то есть «изучают» мир, отзывы о тех или иных заведениях. В Amazon этой информации нет, поэтому сценарии подразумевают не только алгоритм действий, но им нужна и первоначальная информация.
В России дочерняя компания i-Free под названием Just AI с 2011 года создает такую платформу, то есть они пытаются создавать сценарии, применимые для российского рынка. Первым продуктом, в котором на массовом рынке применяются сценарии, созданные компанией, стал робот Pudding в нашем варианте «Емеля» , он умеет разговаривать на русском языке, искать определенный контент и защищать детей от нежелательных слов и запросов. Назвать «Емелю» роботом сложно, это самый настоящий голосовой помощник, ориентированный на детей в возрасте от 5 до 11 лет, при этом он не является игрушкой. Со стороны компании Just AI в этом голосовом помощнике сценарии и распознавание русской речи движок от Nuance. В теории, если ребенок начнет интересоваться самоубийством или подобными темами, такой «робот» может отговорить его и отправить экстренное сообщение родителям — это те самые сценарии, которые нужно разработать и добавить их в устройство. Другой пример, дети часто хотят, чтобы им рассказали сказку, выбор сказок огромен, и возникает вопрос, на какой остановиться.
В таких голосовых помощниках будет выбор приоритетных произведений, известных как детям, так и родителям. То есть, если вы не знаете, что именно хотите услышать, то говорите: «Хочу сказку». А уже сам помощник выбирает, какую именно сказку вы услышите. Насколько умным будет ваш голосовой помощник, напрямую зависит от того, насколько он понимает контекст беседы, знает ваш образ жизни например, где вы работаете и адрес офиса, ваш распорядок дня. Понятно, что в этой гонке преимущество за Google, так как в рамках Ассистента компания знает про вас так много, что может построить разумные сценарии и подсказки, которые будут уместны и важны. Другие компании в этом направлении пока являются отстающими, но пытаются быстро развиваться.
Умение обработать запрос, правильно выделить его контекст и найти релевантный ответ для голосовых помощников становится важнейшим свойством. Те компании, что научились выпускать голосовых помощников в Китае а таких уже десятки , не могут быстро и легко локализовать продукт для России или других стран, им нужны сценарии, которых у них нет. Им нужно понимание локального контекста, а оно не может появиться из ниоткуда. И на этом пути выигрывают компании, которые уже начинают собирать такие данные всеми возможными способами. Мне это чем-то напоминает золотую лихорадку в картографии, когда в первые годы развития карт на мобильных устройствах все бились за максимальное и точное наполнение по POI, так как карта без расшифровки названий компаний и магазинов, времени их работы и тому подобного — это почти бесполезный рисунок.
А банки вступят в конкуренцию, предлагая все более продвинутых цифровых помощников», — рассказал Вадим Кулик, заместитель президента — председателя правления банка ВТБ. Прототип будущего помощника был представлен на стенде форума. Когда пользователь обращается к умной колонке, чтобы запустить чат с банком, как это происходит в случае запуска голосового банковского помощника, на экране появляется визуальный образ. Общение происходит в режиме реального времени: Тамара реагирует на вопросы, а ее речь синхронизирована с изображением на экране — движением губ и мимикой. Визуальный образ Тамары был создан нейросетью, совместившей портреты 50 выдающихся женщин, которые в разное время внесли значимый вклад в развитие ИТ-сферы.
Сначала мы будем задавать каждому из ассистентов вопросы, проверяющие их способность искать информацию в интернете и, что более важно, вычленять из всего найденного объема краткий ответ. Затем мы попросим помощников сделать для нас что-нибудь, причем задачи постараемся ставить такие, чтобы от них могла быть реальная польза в повседневной жизни. На нем же будем запускать и Алису через приложение «Яндекс». Кроме того, разговаривать мы с ними будем на русском языке, хоть и проверим способность помощников на ходу переключатся с русской речи на английскую. Начнем с парочки действительно сложных для ИИ вопросов Почему небо голубое? Ответил лишь Google Ассистент. Алиса выдала список ссылок из «Яндекса», а Сири вообще не поняла, чего от нее хотят. Почему страусы прячут голову в песок? Снова справились только Алиса и Ассистент. Сири лишь поделилась ссылками из Google. Очередь более простых и конкретных вопросов: Кто изобрел автомобиль? Алиса и Ассистент не испытали никаких проблем, а помощник Google еще и приложил к ответу интересный бэкграунд. Сири же выдала список ближайших автосалонов. Теперь — несколько понятных и распространенных типов вопросов: Права лишь Алиса! Ни Сири, ни Ассистент смысла вопроса не поняли. Алиса и Ассистент держат планку. Сири как всегда… Все — мимо! Время кулинарных вопросов! Алиса и Ассистент выдали ответ со ссылкой на источник, Siri не смогла и решила открыть филиал Google. Дальше — расстояния Здесь все поинтереснее. Сири, пожалуй, впервые не растерялась и запустила Apple Maps, проложив маршрут от Москвы до Владивостока. Ассистент сделал то же самое, но в том же окне, да еще и ответил на поставленный вопрос.
Больше половины россиян пользовались голосовыми помощниками за последние полгода
Алиса, Сбер Салют и Google Assistant стали самыми обсуждаемыми голосовыми помощниками по версии «Медиалогии». При этом время задержки Siri и голосового помощника Bixby от Samsung больше, чем у Assistant и Alexa. Использование голосового ассистента помогает сократить задержки, паузы в диалоге с клиентом, время ожидания при пиковых нагрузках и массовых инцидентах.
Комаровка в Украине и советы по ужину: что умеют голосовые помощники Siri, Алиса и Google Assistant
Список TOP-30 популярных голосовых помощников в мире | Eventopia» — навык для голосового помощника Алисы, позволяющий школьникам быстро и легко находить увлекательные мероприятия и экскурсии для их возраста. |
Сравниваем голосовых помощников: Алиса, Салют, Маруся, Google Assistant и Siri | Чат с Алисой, работающей на нейросети YandexGPT — широкие возможности искусственного интеллекта. В новом Чате с виртуальным ассистентом Алисой можно придумывать креативные идеи для работы и учебы, писать и редактировать тексты, создавать новые кулинарные. |
Яндекс Образование
Siri тоже сразу предложила подборку ссылок на мексиканского мастера: статьи в Wikipedia, онлайн-кинотеатр и так далее. То же самое сделал и Google Assistant. Настоящий помощник умеет еще и поднять шефу настроение, так что заказываем шутки. С просьбой «расскажи анекдот» Алиса и Google Assistant справились насколько успешно, сказать сложно — чувство юмора-то у людей разное , а вот Siri замялась: Хотя, видимо, в этом и была вся соль. С поиском музыки вышло неоднозначно: на запрос «открой последний альбом Metallica» Алиса сразу включила первый трек с нужной пластинки, а Siri почему-то запустила вторую песню. Справедливости ради отметим, что мы не просили проигрывать альбом с начала, но логично было бы сделать именно так. Google Assistant тоже предложил запустить Metallica, только вот нативный музыкальный сервис не был активирован. Вечная загадка — что приготовить на ужин, когда совсем лень и холодильник практически пустой.
С помощниками, по идее, такой проблемы быть не должно. Но все они просто выдали ссылки на ресурсы о готовке еды. Ответы принимаются, но хотелось бы конкретики: мол, вот вам самый простой вариант со списком нужных продуктов. Для проверки мы выбрали улицу с заковыристым названием: 2-я Шестая линия. Лучше всех справилась Алиса — с первого раза и без дополнительных уточнений. Второе место заслужил Google Assistant: сначала он выдал что-то непонятное, но потом исправился и верно указал путь. Siri же призналась, что ничего не нашла, однако это не единственная ее проблема: на простейший запрос «проложи маршрут к Комаровке» помощница решила, что нам нужна… деревня с таким названием в Украине.
Запрос «открой Onliner» оказался слишком простым: справились все, но Алиса не только нашла сайт, а еще и автоматически открыла его в браузере.
Разберёмся, почему так происходит, как сегодня используются голосовые сервисы и есть ли перспективы развития у этой технологии. Surf уже более 10 лет занимается разработкой мобильных приложений, в том числе банковских.
Как работает виртуальный помощник Чтобы пользователь получил ответ, программа проходит пять этапов. Убирает фоновый шум. Преобразует звук в цифровой код.
Выделяет речь, анализирует отдельные слова и связь между ними. Сравнивает полученную информацию с шаблонами. Система ищет варианты, как слово произносится.
Если слово для неё новое, она так же сравнивает его с шаблонами. Когда голосовой помощник не может найти ответ, не понимает команду, то просит пользователя задать вопрос по-другому. Выдаёт ответ, ориентируясь на библиотеку шаблонов и поведение пользователя в сети, его прошлые запросы в поисковых системах, геолокацию.
Программа может вступить в диалог, если ей не хватает данных. Например, уточнить, куда пользователь хочет поехать, если тот вызывает такси. Несовершенная технология Хотя схема выглядит стройной и понятной, она по-прежнему изобилует багами.
Только за прошлый год голосовые помощники спровоцировали несколько довольно громких инфоповодов. Например, Алиса по ошибке выдавала личный номер тверского пенсионера за номер администрации города Конаково. В итоге на бывшего мэра, давно ушедшего на пенсию, обрушилась лавина звонков горожан, желающих заказать пропуск.
Та же Алиса вгоняла пользователей в ступор открытой критикой президента и фразами о том, что «он попал в Кремль случайно». Это лишь некоторые из ошибок, просочившихся в сеть. Куда больше милых багов, с которыми мы сталкиваемся при ежедневном взаимодействии с голосовыми помощниками.
Но они по-прежнему пользуются спросом. За что мы их любим Люди говорят почти в четыре раза быстрее, чем печатают. Голосовой помощник помогает быстрее ввести данные и получить ответ.
Конечно, при условии, что программа чётко распознала речь и нашла шаблон в базе данных. Голосовым приложением чаще пользуются, когда заняты руки. По этой причине из голосового приложения на смартфоне помощники быстро перекочевали в музыкальные колонки и умный дом.
Можно заниматься домашними делами и параллельно заказывать еду из ресторана, не отвлекаясь на нажатие кнопок. Самый популярный ответ на вопрос, почему вы используете виртуальных ассистентов — «Это быстро» исследование Stonetemple Голосовые чатботы заменяют десятки сотрудников.
Даже на вопрос о собственном имени Siri не способна рассказать какую-нибудь историю, которая бы эмоционально вовлекала пользователей. Изначально возможности Сири были восприняты пользователями с восторгом: помощь при поиске, обеспечение работы некоторых функций смартфона вроде установки будильника на определенное время и напоминаний.
Но очень скоро прочие помощники смогли предложить более широкий список выполняемых социальных задач, пока Сири в переносном смысле топталась на месте. Поэтому конкуренты успели обойти изобретение Apple по следующим параметрам: лучшая обучаемость на основе нейронных сетей лучшее распознавание речи благодаря улучшенным встроенным электронным технологиям не нужно произносить команду несколько раз, в то время как Сири на iOS часто промахивается даже с четко произнесенными запросами практически не готова имитировать беседу об абстрактных и отвлеченных понятиях юмор Сири достаточно однообразен, его не хватает у Сири нет аналога человеческого характера и нет своей истории, что заставляло бы эмоционально сопереживать ей и возвращаться к ней снова Руководство по эксплуатации Впрочем, не все владельцы IPhone ждут от ассистента комического стенд-апа, так что Сири по-прежнему помогает пользователям в решении задач. Например, она знает, как совершать покупки на Amazon и работать с Alexa. Siri — коренная обитательница систем IPhone и IPad.
Ее вызывают следующие команды: Настройки — Основные — Siri. Кроме голосового вызова «Привет, Siri», с ней можно связаться посредством долгого удержания кнопки Домой. Голосовой поиск Google Первые версии Google Assistant были настроены только на содержательный поиск сайтов. Ассистент озвучивал результаты поиска, и не более того.
Но позднее, подсмотрев за конкурентами, Google приняли решение менять разработку продукта в сторону более «живого», непосредственного общения. Google Assistant в основном используется на устройствах с операционной системой андроид и вызывается следующими действиями: удержание кнопки Главного экрана или голосовым запросом «Окей, Гугл». Также можно скачать соответствующее приложение. В общих настройках можно отключить помощника в разделе Предпочитаемый способ ввода.
Гугл Ассистент владеет русским языком и делает ставку на локальность, в том числе при запросах прогнозов погоды, контактах, навигации или попытках узнать об интересных местах поблизости. Творение Google рассказывает анекдоты, о своих снах и интересные факты о чем-либо. Какой голосовой помощник самый умный Самый умный — не значит самый популярный в ТОПе. На первом месте располагается продукт Cortana от Microsoft.
В ноябре 2020 года в Just AI провели телефонный роботизированный опрос с использованием собственного движка NLU, а также технологий распознавания речи от Яндекс. Cloud и Тинькофф. Растет общее число пользователей голосовых ассистентов.
В ходе опроса мы уточняли, знают ли пользователи о новых голосовых ассистентах. В 2020 году голосовых помощников стали использовать чаще. Меняется расстановка сил среди устройств с голосовыми помощниками.
В то же время ассистентов стали больше использовать на других устройствах. За год кейсы использования голосовых ассистентов стали разнообразнее. Умные телевизоры.
Большинство новых телевизоров с функцией Smart TV, в том числе эконом-класса, оснащены функцией голосового помощника. Яндекс расширяет присутствие в сегменте дорогих ТВ-приставок с Алисой и начал сотрудничество с производителями ТВ.
Forbes Экспертиза
Бум развития сценариев, которые нужны потребителям, напрямую связан с помощниками, они выигрывают от того, что в алгоритмы загоняют стандартные действия. К сожалению, формализовать естественный язык не так-то просто, поэтому любые диалоги с голосовым помощником или программой в сети не являются очень глубокими. Так, любой разговор можно описать в парадигме вопрос-ответ, когда каждая пара образует один уровень, большинство программ обработки диалогов сегодня ведут более-менее осмысленный разговор для 2-3 уровней, затем они начинают пасовать, и тогда появляется продуманная программистами заглушка, например, у Siri это шутки, которые должны скрыть незнание программой того, как действовать дальше. Пользовательские сценарии условно можно разделить на простейшие, те, что не зависят от страны и языка, и сложные. То есть, это предопределенные действия, реализация которых в устройстве или программе не вызывает никаких затруднений. В простых сценариях важно, чтобы система распознавания речи правильно распознала контекст и то, является запрос утверждением или вопросом. Например, одна и та же фраза может восприниматься системой различно: «Будильник на 8 часов стоит или нет? Многие системы первоначально просто ставили будильник на это время, не проверяя, есть он уже или нет. Теперь они «научились» проверять состояние будильника и правильно отвечать на этот вопрос. Сложные сценарии напрямую привязаны к контексту языка и страны. Например, спрашивая, что сегодня идет в кино, вы не ждете, что голосовой помощник зачитает вам список фильмов в Нью-Йорке, наверное, вы хотите услышать его для своего города и желательно для своего района или любимого кинотеатра.
Локальный контекст становится архиважным, и глобальные компании зачастую не могут сделать ничего в этой области. Исключением является Google, у которого системы Google Now и Google Maps построены вокруг сбора точек интереса, или POI, то есть «изучают» мир, отзывы о тех или иных заведениях. В Amazon этой информации нет, поэтому сценарии подразумевают не только алгоритм действий, но им нужна и первоначальная информация. В России дочерняя компания i-Free под названием Just AI с 2011 года создает такую платформу, то есть они пытаются создавать сценарии, применимые для российского рынка. Первым продуктом, в котором на массовом рынке применяются сценарии, созданные компанией, стал робот Pudding в нашем варианте «Емеля» , он умеет разговаривать на русском языке, искать определенный контент и защищать детей от нежелательных слов и запросов. Назвать «Емелю» роботом сложно, это самый настоящий голосовой помощник, ориентированный на детей в возрасте от 5 до 11 лет, при этом он не является игрушкой. Со стороны компании Just AI в этом голосовом помощнике сценарии и распознавание русской речи движок от Nuance. В теории, если ребенок начнет интересоваться самоубийством или подобными темами, такой «робот» может отговорить его и отправить экстренное сообщение родителям — это те самые сценарии, которые нужно разработать и добавить их в устройство. Другой пример, дети часто хотят, чтобы им рассказали сказку, выбор сказок огромен, и возникает вопрос, на какой остановиться. В таких голосовых помощниках будет выбор приоритетных произведений, известных как детям, так и родителям.
То есть, если вы не знаете, что именно хотите услышать, то говорите: «Хочу сказку». А уже сам помощник выбирает, какую именно сказку вы услышите. Насколько умным будет ваш голосовой помощник, напрямую зависит от того, насколько он понимает контекст беседы, знает ваш образ жизни например, где вы работаете и адрес офиса, ваш распорядок дня. Понятно, что в этой гонке преимущество за Google, так как в рамках Ассистента компания знает про вас так много, что может построить разумные сценарии и подсказки, которые будут уместны и важны. Другие компании в этом направлении пока являются отстающими, но пытаются быстро развиваться. Умение обработать запрос, правильно выделить его контекст и найти релевантный ответ для голосовых помощников становится важнейшим свойством. Те компании, что научились выпускать голосовых помощников в Китае а таких уже десятки , не могут быстро и легко локализовать продукт для России или других стран, им нужны сценарии, которых у них нет. Им нужно понимание локального контекста, а оно не может появиться из ниоткуда. И на этом пути выигрывают компании, которые уже начинают собирать такие данные всеми возможными способами. Мне это чем-то напоминает золотую лихорадку в картографии, когда в первые годы развития карт на мобильных устройствах все бились за максимальное и точное наполнение по POI, так как карта без расшифровки названий компаний и магазинов, времени их работы и тому подобного — это почти бесполезный рисунок.
Обратите внимание, что есть еще один важный момент для домашних голосовых помощников, это наличие контента, например, музыки. Одно дело, когда у вас уже есть подписка на какой-то музыкальный сервис и вы слушаете и ищете музыку в нем. Другое дело, если вы ищете что-то, чего там нет, тут на первый план выходит легальность воспроизведения и то, насколько большая библиотека доступна вашему помощнику, может ли он получить этот контент бесплатно или он должен его купить. Это интересный вопрос, но на нем мы останавливаться не будем. Из текста в голос — обратное преобразование Самые сложные операции позади, голос распознали, запрос обработали, помощник получил ответ в виде текста, и тут самое время его озвучить. К сожалению, системы преобразования текста в речь не так уж идеальны, и в них с легкостью можно узнать робота. Понятно, что в ближайшие 5-6 лет этот момент кардинально изменится, но сегодня многие преобразователи напоминают робота Вертера из советского фантастического фильма, говорят они нечисто, немного заикаются. К сожалению, этот момент просто требует времени и изменения технологий, крупные производители получат преобразователи текста в голос со сносными характеристиками быстрее, чем небольшие компании. Посмотрите в ролике, как общается «Емеля», чтобы скрыть недостатки TTS-движка, тут даже придумали историю, что это робот с другой планеты и поэтому он говорит именно так. Понятно, что этот «робот» не звучит чисто, у Google Home или Amazon язык лучше, но нет поддержки русского у Google Home она появится в 2018 году, осенью, если судить по текущим планам компании.
Отсутствие в России голосовых помощников объясняется просто — чтобы адаптировать китайские устройства, нужно обладать как модулями конвертации речи в текст и обратно, так и неким подобием AI, который обрабатывает сценарии и имеет некий контент на борту. В этом аспекте тот же «Емеля», или Roobo Pudding — первый пробный шар, который интересен с точки зрения технологий, как продукт для конечного потребителя он интересен в меньшей мере.
На первой позиции рейтинга располагается «Алиса», разработку которой «Яндекс» начал в 2016 году.
Этот ассистент набрал 419,3 тыс. Вторую строку списка занимает семейство ассистентов «Сбер Салют», которое включает различных персонажей: это «Сбер», «Афина» и «Джой» с разным характером. Сообща они показали результат в 153,6 тыс.
А вовлечение значительных инвестиций в партнерские отношения даст дополнительный толчек развитию собственной экосистемы. Китайские производители получат импульс на внутреннем рынке Китайские производители разрабатывают все более совершенных голосовых помощников, таких как iFlytek, Baidu и Huawei. И хотя «проникновение» данных решений в КНР невелико, аналитики Juniper Research ожидают, что использование недорогих смарт-колонок повысит внедрение помощников в системы умных домов 100 млн в 2024 году по сравнению с 4 млн в 2019 году. Однако влияние КНР будет ограничено внутренним рынком, так как конфликт между компанией Huawei и правительством США продолжает оказывать влияние на различные сегменты.
Устройство в локальной памяти хранит все настройки, там же располагаются буфер и система распознавания голоса. Домашний голосовой помощник можно воспринимать как упрощенный вариант смартфона, в котором может быть дисплей, либо его может и не быть. Важно, что система распознавания голоса в большинстве случаев локальная, именно устройство обрабатывает звук и распознает его. В ряде случаев, когда устройство не может самостоятельно распознать и расшифровать голос, оно отправляет запись в облако, где происходит распознавание, так как серверы имеют большую производительность и большие базы данных для проверки и подбора слов. Как правило, большинство производителей используют комбинированные системы, распознавание голоса происходит локально, на сервер, который должен его обработать, он отправляется в виде условного текста или уже команды. Для ряда запросов, предполагающих местное действие, оно тут же осуществляется. Например, когда пользователь говорит «установить будильник на 8 часов утра», система локально выполняет команду, не обращаясь в облако. То же самое касается и настройки других устройств умного дома, например, изменения температуры в термостате. Многие ошибочно считают, что если голосовой помощник распознает локально команды и голос, то эти данные навсегда остаются в нем, это не так. Все зависит от производителя, марки устройства, но всегда все данные, записанные после слова-команды, передаются на серверы производителя, где они и хранятся. Эти данные могут быть использованы для более точной настройки системы распознавания и в других целях, например, их может запросить полиция в рамках расследования уголовного дела, и компания-производитель их предоставит. Следующий важный момент — это языки, на которых умеют говорить голосовые помощники. Например, для Amazon это английский и немецкий. В случае Amazon сервис Alexa — это удобный способ что-то купить на сайте Amazon, поэтому ареал распространения ограничен теми странами, где сервис имеет наибольшую аудиторию. Для того же Google Home в планах, напротив, быть везде где только возможно. Мы увидим экспансию Google Home на всех мировых рынках, он начнет появляться на всех языках. Хотя пока он представлен ровно в том же количестве стран, что его прямой конкурент. Здесь Google выступает в роли догоняющего и поэтому не спешит быть везде, так как другие конкуренты маловероятны, ниже мы обсудим, почему это так. Итак, вы сказали слово-команду, и ваше устройство «проснулось», записывает ваш голос, чтобы его распознать. Первый и самый важный элемент — это распознавание голоса и его преобразование в текст. Как правило, текущие голосовые помощники настраиваются на один основной язык. Например, если устройство поддерживает как английский, так и русский, одновременно разговаривать с ним на двух языках не выйдет, оно будет путаться и просить повторить фразы. В будущих устройствах этот момент будет с легкостью разрешен, так как голосовые помощники научатся сами определять язык, на котором вы говорите. Но пока они могут только анализировать контекст, в котором вы произносите фразу все это происходит в облаке , чтобы заменить некоторые слова на английские. Например, раньше, когда вы произносили фразу «в каком году вышел альбом обратная сторона луны у пинк флойд», она распознавалась именно так, как я написал. Причина заключается в том, что Google задействует нейронные сети для анализа не только самой фразы, но и сказанного контекста. То есть, система пытается предугадать, что именно вы хотите, какой смысл у вашего вопроса. Если вы по какой-то причине пропустили революцию в системах распознавания и расшифровки голоса, никогда не пользовались голосовой диктовкой на Android-смартфонах, то просто попробуйте это сделать в браузере по этой ссылке. В Google уже поддерживается более 80 языков, для каждого возможно преобразование голоса в текст и обратно. Конкуренты пока от Google отстают, но со временем ситуация на этом рынке выровняется, так как с течением времени, обрабатывая семплы речи, каждая компания добьется очень высокой точности распознавания голоса. Также добавим сюда алгоритмы анализа контекста в облаке. Понятно, что в Google будут первыми в этом забеге, так как уже делают это для других сервисов, в том числе и смартфонов, но преимущество не будет длиться вечность, в конечном итоге на рынке появится массовая и дешевая технология, она повторяема любой компанией. Условно можно считать, что преимущество Google измеряется 3-5 годами, пока конкуренты не приблизят свои технологии к тем, что существуют у этого гиганта. Первый этап работы любого голосового помощника, как мы выяснили, это распознавание голоса и перевод его в текст. Нет никакой проблемы в том, чтобы повторить Amazon Alexa или любой иной голосовой помощник, в Китае стоимость производства такой коробки составит 15-20 долларов от силы, а цена Google Home — 109 долларов без учета налогов. Как и за что крупные производители берут такие деньги и получают сверхприбыль, во всяком случае, на первый взгляд? Ответ кроется в том, что у них, с одной стороны, нет конкурентов, обладающих сходными технологиями, те же китайцы не могут завалить рынок голосовыми помощниками, так как отсутствуют общедоступные технологии для этого, о чем подробно ниже. С другой стороны, в отличие от продажи обычной беспроводной колонки, где срок жизни влияет только на себестоимость ремонта и гарантийные обязательства для производителя, в домашнем голосовом помощнике есть запросы к облаку компании, каждый запрос стоит для компании определенных денег. Недорого стоят запросы в платформе от Google, они тарифицируются отрезками по 15 секунд, стоимость такого запроса составляет 0. Например, если вы распознали отрывок в 16 секунд, то с вас возьмут 0. Такие цены приводятся для любого приложения на смартфоне и имеют ограничение до одного миллиона минут. Для голосовых помощников дома, машин, телевизоров и прочего вам нужно обратиться в Google, цены будут выставлены индивидуально. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home.
Рынок умных колонок и голосовых ассистентов в России и мире
Reminder Rosie создала недорогое и простое решение, напоминающее о графике приема лекарств, запланированных встречах и визитах к врачу, а также ежедневных задачах. RemindMeCare - программное обеспечение, организующее лечение, персональный уход и активности пожилого человека, интегрированное с голосовой системой Amazon Alexa. Senter - разрабатывает систему, объединяющую современные IoT- и AI-технологии для обеспечения ежедневной деятельности и организации здорового образа жизни пожилых людей. Коммуникации пациента с врачами Голосовые технологии помогают упростить и автоматизировать общение пациентов с медицинскими организациями. Aiva создала голосового "помощника", обеспечивающего коммуникации пациентов с медицинской организацией и улучшающие рабочие процессы в ней. VoiceFriend - простое, но мощное напоминающее решение, позволяющее вовремя информировать пожилых людей, медицинский персонал и членов семьи о разного рода событиях и предоставлять важную информацию. И одна из главных причин этого - перегрузка, в том числе из-за количества времени, затрачиваемого на ввод информации в компьютерные системы, заполнение документов.
Несколько компаний работают сегодня над системами, позволяющими автоматизировать ввод врачебных записей в системы электронных медицинских карт. Kiroku - система, позволяющая автоматически "выбирать" нужный контекст из разговора с пациентом и автоматически создавать клинические записи для врача. MDOps позволяет значительно уменьшить время на создание документации путем диктовки и автоматического создания клинических записей с помощью iPhone или iPad. Notable использует носимые устройства, голосовой интерфейс и AI для упрощения взаимодействий врача с пациентом. Saykara упрощает захват данных с помощью виртуального записывающего решения на базе AI-технологий, которое позволяет избавиться от необходимости работы с системой электронных медицинских карт. Sopris Health — это интеллектуальная клиническая платформа, использующая "умную" систему расшифровки голоса на базе AI.
Suki - цифровой виртуальный ассистент для врачей, который позволяет снизить нагрузку, связанную с заполнением медицинской документации.
Самый популярный из них — «Алиса» от компании «Яндекс». Аналитики исследовали российский рынок голосовых помощников и выяснили, что больше половины россиян регулярно ими пользуется. То, что совсем недавно выглядело, как игрушка для убийства времени, превратилось в полноценный инструмент.
Конечно, Алиса работает с сервисами Яндекса , включая поисковик , Яндекс. Навигатор , Яндекс. Также этот виртуальный ассистент поможет управлять системой умного дома — причем не только от Яндекса. Многие производители, например, Xiaomi , Polaris, Philips предлагают использовать Алису для голосового управления умной техникой. Но есть и проблемы. Например, помощник до сих пор полноценно не умеет работать с отправкой сообщений и звонками по списку контактов, с чем прекрасно справляется Google Ассистент.
У Алисы же есть только ограниченные решения-«костыли»: функция дозвона в экстренные службы, умение звонить через мобильное приложение Яндекса на Яндекс. Станцию и блокировать звонки с нежелательных номеров через Яндекс. Человечность тоже иногда сбоит, особенно при сложных вопросах. Так, на вопрос «Будет ли экономический кризис? Конечно, нет». Siri Siri — основной голосовой помощник для гаджетов Apple.
Виртуальный ассистент умеет работать со звонками на iPhone , сообщениями и картами, напомнит о событиях и найдет музыку, поможет распланировать день и запомнить место для парковки. Также Siri эффективно управляет смартфоном, работает с некоторыми приложениями и интернет-сервисами, поможет советом и даже удачно пошутит. Кроме того, для управления приложениями, в которые Siri не интегрирована, создан сервис «Быстрые команды», в котором любой пользователь может запрограммировать определенную последовательность. Так удонбно отключать сеть в определенных обстоятельствах например, выход из дома , открывать нужные сайты, делать интернет-заказы и совершать действия с приложениями, которые не работают с Siri напрямую. А в iOS 15 у ассистента появился офлайн-режим, понимание контекста фраз на экране и даже длинных диалогов. Так что на гаджетах Apple действительно есть смысл пользоваться именно Siri — она предустановлена даже в Mac.
Но имейте в виду, что она не всегда правильно распознает команды, особенно сложные, а ее акцент иногда оставляет желать лучшего. Маруся Завязанная на социальную сеть ВКонтакте и сервисы Mail. Виртуальный ассистент может проложить маршрут и запомнить фразу, включить вашу любимую радиостанцию или запустить музыкальный трек, рассказать о погоде и ввести запрос в поисковик Mail. Как и Алиса, Маруся разговаривает приятным женским голосом и знает разные игры и сказки.
Это в том числе единая медицинская справочная служба «122», единая справочная города Москвы и контактный центр Московского транспорта.
Дмитрий Головин, заместитель руководителя департамента информационных технологий города Москвы: «В базе знаний робота-помощника содержится более 400 тематик, по которым он может оказать помощь, например, записать на прием к врачу или сдать показания счетчиков. Он подскажет график работы органов исполнительной власти и статус готовности документов, а также подаст заявку в Единый диспетчерский центр. Роботу-помощнику достаточно двух минут, чтобы выслушать вопрос, получить дополнительную информацию и предоставить ответ звонившему».
«Помощников много не бывает»: лучшие голосовые ассистенты для русскоязычных пользователей
Голосовыми помощниками пользовались 63% россиян за последние полгода, говорится в исследовании Group4media. Полный список голосовых команд для голосового ассистента Маруся от компании Mail ru (VK). Google Ассистент остается самым популярным голосовым помощником в мире. Голосовые помощники составят расписание, переведут деньги, закажут еду, возьмут на себя управление умным домом — в общем, они умеют все, что положено уметь хорошему помощнику.
Список TOP-30 популярных голосовых помощников в мире
Выбор имени голосового помощника проходил в несколько этапов. В 2019 году IQ Loup Ventures протестировали голосовых помощников и выяснили – Google Assistant понимает больше вопросов, чем конкуренты и дает наиболее развернутые и понятные ответы. Ассистент» — голосовой помощник, собравший массу хвалебных отзывов за рубежом. Новости и аналитика Новости Некоторыми госуслугами стало возможно пользоваться с помощью голосового помощника. По оценке Just AI, в 2020 году аудитория голосовых ассистентов в России составляет 52 млн пользователей. Голосовой помощник — искусственный интеллект с развитыми навыками распознавания речи, который обрабатывает огромные объемы информации, благодаря чему постоянно учится.
Голос будущего: как появились голосовые ассистенты
голосовой ассистент может давать быстро ответы на все интересующие вопросы. Ассистент» — голосовой помощник, собравший массу хвалебных отзывов за рубежом. Голосовые помощники становятся все привычнее для россиян. По данным разработчика голосовых сервисов Just AI, в 2020 году аудитория голосовых ассистентов в России составила 52 млн пользователей. В постоянно меняющемся мире технологий неизменно лишь одно: желание технокомпаний запустить свой голосовой помощник. Голосовой помощник тут же переключился на более мягкий и человеческий голос, имитируя члена семьи. Чат с Алисой, работающей на нейросети YandexGPT — широкие возможности искусственного интеллекта. В новом Чате с виртуальным ассистентом Алисой можно придумывать креативные идеи для работы и учебы, писать и редактировать тексты, создавать новые кулинарные.
Лучшие виртуальные ассистенты - какие голосовые помощники существуют и чем они различаются
Пока же вместо нее на компьютере можно использовать Алису , Марусю , ассистента Google , или Горыныча... Примечание: иногда ее "работа" приводит к сбоям в работе ПК...
Возможно, со временем Кортана освоит русский и другие языки. Однако, долго ли отечественным пользователям «ждать у моря погоды» — никто не знает. Таким образом, пока стоит обратиться к сторонним голосовым помощникам для компьютеров — благо, такие варианты есть. Вот лишь некоторые из тех, которые поддерживают русский язык: «Горыныч» — ассистент, владеющий как русским, так и английским. Проблема «Горыныча» заключается в том, что речь он распознаёт весьма посредственно — если владелец ПК вдруг охрипнет, то голосовой ассистент просто перестанет его понимать.
Разработчики утверждают, что «Агрегат» гораздо лучше Cortana по ряду причин: во-первых, «Агрегат» понимает русский, во-вторых, он устанавливается на любую операционную систему будь то OSX, Windows или Linux , в-третьих, пользователи могут повышать функциональность «Агрегата» путём установки дополнительных модулей. Typle — простенькая утилита для Windows 7, 8 и 10. Функционал Typle весьма ограничен: программа может открывать файлы и приложения, но при этом не способна, скажем, управлять музыкальным проигрывателем.
А вовлечение значительных инвестиций в партнерские отношения даст дополнительный толчек развитию собственной экосистемы.
Китайские производители получат импульс на внутреннем рынке Китайские производители разрабатывают все более совершенных голосовых помощников, таких как iFlytek, Baidu и Huawei. И хотя «проникновение» данных решений в КНР невелико, аналитики Juniper Research ожидают, что использование недорогих смарт-колонок повысит внедрение помощников в системы умных домов 100 млн в 2024 году по сравнению с 4 млн в 2019 году. Однако влияние КНР будет ограничено внутренним рынком, так как конфликт между компанией Huawei и правительством США продолжает оказывать влияние на различные сегменты.
Виртуальный ассистент не только консультирует жителей, но и помогает собирать отзывы о качестве оказанных услуг, оповещает о начале отопительного сезона и может перезвонить заявителю для уточнения информации по заявке.
Его речь практически не отличить от человеческой, а точность распознавания слов составляет 96 процентов. Сегодня он обрабатывает более половины от общего числа звонков на городские горячие линии. При этом горожанам не приходится тратить время на ожидание ответа оператора. За годы существования голосовой помощник неоднократно дорабатывался, совершенствовались его навыки, а база знаний наполнялась новыми тематиками.
Виртуальный ассистент консультирует горожан по наиболее распространенным вопросам в сфере госуслуг, ЖКХ, транспорта и другим темам. Это помогает решать повседневные задачи москвичей максимально быстро и удобно», — рассказал Андрей Савицкий, руководитель общегородского контакт-центра. Первым проектом, в который внедрили голосового помощника, была передача показаний счетчиков. Это позволило ускорить обработку заявок жителей, а также грамотно распределить ресурсы операторов.
Всего обработано около 4,2 миллиона звонков жителей. В среднем голосовой помощник принимает около 400 тысяч таких обращений в месяц. Он принимает показания водосчетчиков, напоминает о необходимости проведения поверки и подсказывает даты сезонного отключения воды. Горожанам достаточно произнести код плательщика, указанный в едином платежном документе, и показания счетчиков воды, после чего виртуальный ассистент сам передаст данные в расчетную систему центра госуслуг.
Сегодня голосовой помощник задействован в работе 10 городских горячих линий.
Маруся голосовой помощник команды для умных колонок VK Капсула
Что умеет голосовой помощник Алиса | «Виктория» — голосовой помощник «Службы 122» — стал самым востребованным из ассистентов. |
Telegram: Contact @habr_com_news | Алиса, Сбер Салют и Google Assistant стали самыми обсуждаемыми голосовыми помощниками по версии «Медиалогии». |
Банки визуализируют голосовых помощников | Темпы роста рынка голосовых помощников, по оценке Group, превышают темпы роста IT-рынка в целом: голосовые ассистенты стали неоспоримым трендом, который продолжает набирать обороты. |
В Петербурге назвали самых популярных голосовых помощников | Этого голосового ассистента создали, когда Siri ещё не была адаптирована для русскоязычных пользователей. |
Голосовой помощник Alexa заговорит голосом усопших | Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра». |
Лучшие голосовые помощники для Android
Лучшие голосовые помощники для Android | Алиса, Сбер Салют и Google Assistant стали самыми обсуждаемыми голосовыми помощниками по версии «Медиалогии». |
Список TOP-30 популярных голосовых помощников в мире | Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра». |
Голосовые помощники
Рынок голосовых помощников в 2022-м вырос на 33%, до 2,7 млрд руб. В 2023-м он может увеличиться еще на 40–45% за счет перехода на голосовые контакт-центры и роста потребности в персонализации. Темпы роста рынка голосовых помощников, по оценке Group, превышают темпы роста IT-рынка в целом: голосовые ассистенты стали неоспоримым трендом, который продолжает набирать обороты. Обзор функций голосового помощника Алиса от «Яндекс». С голосовым ассистентом можно поболтать, о чём хотите — о погоде, кино или текущих делах. неправильного произношения и рекомендации:Использование голосовых помощников может значительно упростить повседневные задачи, такие как поиск информации, управление устройствами, покупки и другие.