Использование голосового ассистента помогает сократить задержки, паузы в диалоге с клиентом, время ожидания при пиковых нагрузках и массовых инцидентах. Темпы роста рынка голосовых помощников, по оценке Group, превышают темпы роста IT-рынка в целом: голосовые ассистенты стали неоспоримым трендом, который продолжает набирать обороты. Расскажем о 10 главных голосовых помощниках на текущий момент и поможем понять их плюсы и минусы, а также то, какой из них подходит именно вам. Siri считается одним из лучших голосовых помощников, однако в зарубежных независимых тестах и сравнениях в последние годы она уступает более гибким помощникам от Google и Amazon как в скорости реакции, так и в совместимости с умными устройствами других компаний.
6 самых популярных голосовых помощников в мире
- Углубляясь в историю
- Что входит в стоимость разработки голосового помощника
- Углубляясь в историю
- 37 компаний, создающих голосовые приложения для медицины
- Алиса от «Яндекса»
Голосовыми помощниками пользуются более половины россиян
Рейтинг пополняет отличный голосовой помощник для пользователей смартфонов на базе Android, которые много времени проводят в пути. Десятилетняя эволюция умных устройств, которые от стандартных голосовых помощников, выполняющих простые бытовые задачи, доросли до технологий, способных запоминать предпочтения пользователя и находить ответы на самые неожиданные вопросы, — яркий. В этой заметке я привожу подборку лучших голосовых помощников для компьютера и телефона. К озвучке данных голосовых помощников были привлечены российские актеры: Даниил Щебланов, Татьяна Ермилова, Анастасия Чернобровина. Алиса, первый российский голосовой помощник, предназначенный для массового использования, появилась в 2017 году. Согласно данным ВЦИОМ, голосовыми сообщениями пользуются 64% россиян.
Русскоговорящие голосовые помощники: кто умнее?
Forbes Экспертиза | К 2024 году более 90% голосовых помощников будут осуществлять поддержку и управлять девайсами умного дома. |
Голосовой помощник общегородского контакт-центра принял почти 75 миллионов звонков | Голосовой помощник тут же переключился на более мягкий и человеческий голос, имитируя члена семьи. |
Больше половины россиян пользовались голосовыми помощниками за последние полгода | Aiva создала голосового "помощника", обеспечивающего коммуникации пациентов с медицинской организацией и улучшающие рабочие процессы в ней. |
Некоторыми госуслугами стало возможно пользоваться с помощью голосового помощника
Команда LinDeal исследовала известных голосовых помощников и составила свой топ-20 для Android и iOS, честно расписав все плюсы и минусы. Множество полезных навыков для голосового помощника ждут вас в Каталоге навыков Алисы. Один из первопроходцев среди голосовых помощников, ставший неотъемлемой частью экосистемы устройств работающих на операционной системе iOS.
Топ-6 лучших голосовых помощников. Разбираемся, какой лучше управляет всем на свете
В 2019 году IQ Loup Ventures протестировали голосовых помощников и выяснили – Google Assistant понимает больше вопросов, чем конкуренты и дает наиболее развернутые и понятные ответы. Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра». Обзор функций голосового помощника Алиса от «Яндекс». При этом время задержки Siri и голосового помощника Bixby от Samsung больше, чем у Assistant и Alexa.
Голосовой помощник общегородского контакт-центра принял почти 75 миллионов звонков
Этот ассистент набрал 419,3 тыс. упоминаний за указанный период, став самым обсуждаемым голосовым помощником в российском сегменте интернета. Согласно данным ВЦИОМ, голосовыми сообщениями пользуются 64% россиян. Множество полезных навыков для голосового помощника ждут вас в Каталоге навыков Алисы. При этом время задержки Siri и голосового помощника Bixby от Samsung больше, чем у Assistant и Alexa.
Голосовых помощников станет больше, чем людей
Запускать каждый раз приложение, чтобы Маруся зачитала новости или позвонила кому-то из телефонной книги — та еще затея с учетом того, что Google Assistant позволяет делать все это без запуска программы через фразу «OK, Google». Частично обойти ограничения можно, если сделать ассистента от VK Group основным: Откройте настройки телефона. Перейдите в раздел «Приложения», а затем — «Все приложения». Нажмите на «три точки». Откройте вкладку «Приложения по умолчанию». Выберите Марусю в пунктах «Голосовой помощник», а также «Помощник и голосовой ввод». Голосовым помощником по умолчанию является Google Assistant, и это нужно исправить Эти настройки помогут вам запустить Марусю через любой приложение, воспользовавшись комбинацией кнопок или кратковременным нажатием на кнопку питания. Предварительно на вашем смартфоне должна быть включена соответствующая опция в разделе «Функции кнопок». Без этой функции быстрый запуск не сработает Сколько бы разрешений Марусе я ни выдал, она никак не хочет запускаться голосом. Таковы ограничения Google, которые тот же Яндекс обходит при помощи собственного лончера.
Но давайте по порядку, и узнаем, с чего все началось. Работая в России, он создал аппарат, который мог воспроизводить всего несколько гласных звуков а, э, и, о, у. На фоне нынешних технологий — это всего ничего, но для того времени и с учетом того, что это не программный, а механический синтезатор речи, можно со всей уверенностью считать это революцией и первым шагом в развитии существующих фонетических систем. К сожалению, фотографии и схемы устройства не дошли до наших дней. Аппарат Voder был представлен в 1937 году. Интонация речи вводились ассистентом с клавиатуры, напоминающей таковую у музыкальных инструментов, на презентации в видео, слышно, что аппарат умеет «выговаривать» лишь одно имя, но с разными интонациями. Советский физик Лев Мясников как раз был занят таким исследованием с 1939 года в рамках диссертации «Техническая фонетика». В 1942 году, несмотря на войну и ужасы блокадного Ленинграда, ученый защитил свой проект, продемонстрировав фокус-группе аппарат, умеющий распознавать несколько гласных и согласных звуков. Размеры аппарата были внушительными даже для того времени. Его высота составляла порядка 180 сантиметров. Работа с распознавателем чисел происходила с помощью телефона: абонент произносил число в трубку, система распознавала звук, как электрический сигнал и сопоставляла его с загруженными ранее в систему голосовыми референсами фраз. Система могла распознавать кроме 16 заложенных слов и 6 цифр еще и 10 математических команд. Семейства, представляемых в тот период времени «речевиков», мало чем отличались друг от друга, и соответственно прогресс шел семимильными шагами, без особого развития, породив потерю надежды и доверия к разрабатываемой технологии. Стагнация После публикации в 1969 году открытого письма американского инженера Джона Пирса, в котором он обосновал свое сомнение относительно исследованиям в области фонетических технологий, лидирующая тогда команда Bell, потеряла интерес со стороны инвесторов и на несколько лет осталась без финансовой поддержки. Говорящая кукла Джулия Julie the talking doll появилась на прилавках американских магазинов в 1987 году. Её уникальность состояла в том, что ребенок мог научить куклу распознавать его речь. За семь лет до выпуска игрушки, в научном обществе произошел переворот, который по важности безусловно превосходит вышеупомянутую Джулию. В 1980 году инженеры впервые научились применять методы «Скрытой Модели Маркова», разработанной отечественным ученым в области математики Андреем Марковым. Скрытая Модель Маркова, Марковские цепи Немного отойдя от темы, постараюсь объяснить что это за такая математическая модель. По сути это описание вероятностей перехода объекта из одного состояние в другое. То есть будущая вариация объекта не зависит от прошлого, а зависит от настоящего — от того, в каком состоянии объект находится в данный момент времени. Выходит, это матричная система генерации случайных событий в рамках заданного аргумента. Для примера рассмотрим такую модель графа с возможными физическими состояния человека: По картинке мы можем определить, что человек может находиться в четырех состояниях, причем не в каждое может перейти сразу. Например, если человек лежит, то он не может просто взять и пойти, для этого ему нужно пройти цепочку последовательности — сесть, встать и только потом уже пойти. Алгоритмы марковской модели в распознавании речи работают примерно по тому же принципу матричного графа. А благодаря наличию нейросетей, любой желающий при должных знаниях может «научить» свой сервис обучаться, то есть чем больше люди будут пользоваться теми или иными функциями, тем лучше будут оптимизированы алгоритмы работы распознавания речи, благодаря улучшению генерирующей работы Марковской модели, расширением словарного запаса и пополнением библиотеки голосовых паттернов. Так, например, в 1990 году увидела свет одна из первых коммерческих программ по распознаванию речи — Dragon Dictate, ориентированная на массовый рынок потребителей. За эту космическую сумму денег пользователь получал возможность писать текст, просто проговаривая его в микрофон. К сожалению, программа не всегда работала корректно, и допускала даже по тем меркам достаточно серьезные ошибки.
Яндекс Алиса Если вы и не пользовались этим виртуальным ассистентом, то наверняка о нем слышали. Разработчики Яндекса делают ставку на разнообразие устройств и сфер жизни, где можно применить Алису, совмещают ее со всеми своими сервисами — Яндекс Музыкой, Лавкой, Маркетом, Такси, Навигатором, Браузером и другими. Серьезную популярность Алисе прибавляет и возможность обучить ее новым навыкам — попробовать себя в роли учителя для искусственного интеллекта может любой разработчик. Многие навыки сыроваты, но их совершенство и точность лишь вопрос времени. Алиса живет в смартфонах и браузере, но одно из самых удобных для пользователя мест ее обитания — умные колонки и станции. Смартфон может функционально делать почти все, что может умная колонка. Но даже с маленькой колонкой гораздо удобнее разговаривать — из-за чувствительных микрофонов. Маленькие колонки очень симпатичные по исполнению и цветам, — капучино , мятные , фиолетовые — и у каждой свой характер. Полноразмерные же станции могут выступать в роли диск-жокея для вечеринок и пульта управления для умного дома, совмещая в себе несколько устройств. По прогнозам компании Just AI, к концу 2023 года на Земле появится миллиард умных колонок, и Яндекс старается стать частью этого развивающегося рынка. Ранее мы рассказывали: Мини, Макс или обычная — какую «Яндекс. Станцию» выбрать? Маруся от VK Появившись всего 4 года назад, персональный ассистент от VK активно набирает популярность. Умная колонка «Капсула» с Марусей глубоко интегрирована в сервисы VK, умеет искать плейлисты друзей, похожую музыку, может заказать такси. VK много внимания уделяет детским сервисам и развивает системы умного дома. С Марусей можно позаниматься английским языком, поиграть в развивающие игры, задать ей самые разные вопросы. Это лучший голосовой помощник для активных пользователей VK и меломанов. Ставим ее в рейтинге на второе место как самую перспективную и универсальную. Большие колонки сопоставимы по цене с Яндекс Станциями, но количество устройств умного дома, которые могут интегрироваться с Марусей, меньше. Так что выбирать следует, отталкиваясь от тех сервисов, которыми вы чаще пользуетесь. У мини-капсул узнаваемый дизайн и очень хороший звук для маленькой колонки — 5 Вт , они умеют мило подмигивать и мурлыкать, что очень нравится детям. И котика заводить не надо!
Сегодня такие достижения звучат наивно, но в прошлом веке появление технологии стало прорывом. Помимо универсальности, важна и корректная работа сервисов. Обеспечить ее помогают следующие технологии. Автоматическое распознавание речи ASR. Процесс, позволяющий услышать и понять запрос пользователя. Для этого необходим микрофон и интернет-соединение, по которому аудиосигнал передается на серверы для последующего анализа и конвертации в текст. Понимание естественного языка NLU. Когда голос преобразован в текст, искусственному интеллекту необходимо понять его смысл и определить ключевые детали запроса. Выполнение задачи через интерфейсы программирования приложений API. Сюда входит умение найти информацию в Сети, передать команду сопряженным устройствам экосистемы, набрать номер из списка контактов и другие действия. Взаимодействие с пользователем. К нему относятся ответы через динамик устройства, текстом или с помощью световых индикаторов. Самообучение и обновление.
37 компаний, создающих голосовые приложения для медицины
Они дают бизнесу возможность решать широкий спектр бизнес-задач: от автоматизации рутинных повторяющихся процессов до создания уникального голоса бренда для персонализированного общения с аудиторией. На сегодняшний день МТТ входит в цифровую экосистему МТС успешно запустил сотни голосовых ассистентов в различных отраслях, высокий интерес мы видим у игроков в самых разных сферах — от онлайн-торговли и доставки до газовой промышленности. Один из множества нетривиальных кейсов — компания «Лэнд-Сервис», которая обслуживает дорогостоящее холодильное оборудование. Мы сделали для них кастомизированное комплексное решение, которое самостоятельно распознает и присваивает степень критичности аварийных заявок, а дальше обзванивает всех ответственных лиц, от инженера до генерального директора, если ситуация действительно критична.
Мы тоже не стоим на месте, постоянно ищем новые рынки, а наши ассистенты тем временем стремительно умнеют. Продвинутая версия VoiceBox мгновенно анализирует ответы, не делает пауз в диалоге с абонентами, обращается к клиенту по имени, уточняет адрес, состав заказа и другие переменные данные. К тому же совершенствовались и упростились сценарии их использования, поэтому сейчас мы все чаще видим среди клиентов представителей малого и среднего бизнеса.
Согласно глобальному исследованию , в 2021 году был зафиксирован значительный рост интереса к голосовым технологиями со стороны малого и среднего бизнеса, который превзошел среднегодовой прогноз рынка. В отчете утверждается, что бизнес увидел в голосовых технологиях большой потенциал для сокращения своих издержек, к тому же рынок голосовых приложений стал предлагать гибкое ценообразование, что значительно упростило интеграцию технологии в бизнес-процесс.
Ассистент с Алисой как всегда не подвели. Задачи Начнем с самых простых и полезных. Сообщения: А вот здесь подводит уже Алиса. Siri и Ассистент отправляют сообщения, Алиса отшучивается. Никому она ничего, конечно, не передала.
Скорее всего, это связано с тем, что и Сири, и Google Ассистент — нативные помощники для своих систем, тогда как Алиса — стороннее приложение. К слову о них: сообщения в сторонних приложениях: Siri в этот раз не подвела — все четко. Ассистент тоже. Алиса опять отшутилась. И опять неудачно. Теперь — музыка: Обидно, что несмотря на встроенный в iOS Apple Music Сири испытывает большие проблемы с тем, чтобы включать песни западных исполнителей. Грамотно отличать русский от английского помощник Apple пока так и не умеет.
Музыку» соответственно. С английским у русской Siri полная катастрофа. Алиса выдала ссылку на клип в «Яндексе», Google. Ассистент сразу открыл видео на YouTube. Посмотрим, как обстоят дела с российскими исполнителями: Тут Сири выступила на уровне Алисы — поделилась ссылками на ролик из поисковика. Ассистент снова сразу же открыл на YouTube нужное видео. Переходим к еде: И вот тут Алиса удивила.
Если Сири и Google Ассистент просто открыли список ближайших пиццерий, помощник «Яндекса» вызвал карточку «Папа Джонс», где можно полностью сформировать заказ. Кафе: Тут все без сюрпризов — все помощники справились. А вот еще одна задачка про кафе, но посложнее: Первый раунд, в котором выйграла Сири.
Поисковые запросы Голосовые помощники позволяют пользователям выполнять поисковые запросы в интернете, не используя руки для ввода команд на клавиатуре или сенсорном экране. Они могут отвечать на широкий спектр вопросов, предоставлять сведения о погоде, новостях, географических объектах, исторических событиях и многом другом.
Организация задач и напоминаний Голосовые помощники помогают в организации задач и напоминаний. Пользователи могут создавать списки дел, устанавливать напоминания о важных событиях, деловых встречах. Управление умным домом С помощью голосовых помощников пользователи имеют возможность управлять умным домом, включая регулирование освещения, температуры, мультимедийных систем, безопасности и других функций. Отправка сообщений и управление контактами Голосовые помощники позволяют пользователям отправлять сообщения и управлять контактами, использовать голосовые команды для отправки текстовых сообщений, электронных писем. Навигация и планирование поездок Голосовые помощники предоставляют навигационные и планировочные услуги, позволяя пользователям составлять маршруты, получать информацию о дорожной обстановке, бронировать транспорт, заказывать такси и многое другое.
И это лишь малая часть того, что могут делать современные голосовые помощники. С развитием технологий искусственного интеллекта и машинного обучения, голосовые помощники становятся все более умными и адаптивными, открывая новые возможности. Как работает голосовой помощник Голосовые помощники, такие как Siri, Google Assistant, Amazon Alexa и другие, представляют собой программные приложения, которые позволяют пользователям взаимодействовать с устройствами с помощью голосовых команд. Они работают при помощи сложных алгоритмов распознавания голоса и искусственного интеллекта, которые позволяют им понимать и обрабатывать различные варианты голосовых команд и запросов пользователей. Процесс работы голосового помощника начинается с захвата звукового сигнала от микрофона устройства.
Затем звуковой сигнал преобразуется в цифровой формат с помощью аналого-цифрового преобразователя, чтобы компьютер мог его обработать. С этого момента начинается процесс распознавания голоса. После преобразования аудиосигнала в цифровой формат, алгоритмы голосового помощника начинают анализировать и обрабатывать голосовую команду. Сначала происходит фоновое шумоподавление, устраняющее нежелательные шумы, которые могут повлиять на точность распознавания.
В 2020 году голосовых помощников стали использовать чаще. Меняется расстановка сил среди устройств с голосовыми помощниками. В то же время ассистентов стали больше использовать на других устройствах. За год кейсы использования голосовых ассистентов стали разнообразнее. Умные телевизоры. Большинство новых телевизоров с функцией Smart TV, в том числе эконом-класса, оснащены функцией голосового помощника. Яндекс расширяет присутствие в сегменте дорогих ТВ-приставок с Алисой и начал сотрудничество с производителями ТВ. Ставка на производителей телевизоров является важным стратегическим шагом, так как это очень внушительный рынок: по оценкам М. Заметим, что в оценках российского рынка мы пока не учитываем сегмент Smart TV как платформу для голосовых помощников, так как в данном случае они используются в основном для управления устройством и поиска видеоконтента. Мы сотрудничаем с компаниями в Китае, США и в России, помогаем разрабатывать скиллы и контент для ассистентов, создаем инструменты, помогающие разработчикам в решении их задач на этом молодом и динамичном рынке.