«Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении». Друзья Алисы и пользователи сервисов Яндекса, общаясь с Алисой, смогут узнавать актуальные новости из мира мотоциклов. Теперь навыки смогут отправлять короткий регулярный контент в утреннее шоу Алисы.
Утренняя Алиса. У голосового помощника Яндекса теперь своё шоу
Умная лампочка Яндекс с Алисой, цоколь E27, белая (YNDX-00501). Как включить новости в Яндекс Браузере. Утреннее шоу представляет собой некий “винегрет” из интересных публикаций и новостей с различных сайтов, навыков Алисы и музыки. В конце 2020 года утреннее шоу Алисы стало персонализированным. Какие новости нужно выбирать, чтобы быть в курсе последних событий, но не утомляться излишним потоком информации?
Алиса запустила утреннее шоу с персональными рекомендациями
Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. Чтобы запустить программу, нужно сказать: «Алиса, включи утреннее шоу!». Паузы между новостями и песнями голосовой помощник заполняет актуальной информацией. Навык «Утреннее шоу» Алисы идеально подходит для людей, которые хотят быть в курсе всех новостей и интересных мероприятий. «Утреннее шоу» и новости радиостанций доступны во всех умных колонках с поддержкой «Алисы». Голосовой помощник «Алиса» научили проводить утренние шоу, которые подстраиваются под определённого пользователя.
Как взглянуть на «Алису» по-новому? 5 необычных навыков для «Яндекс.Станции»
Новый формат контента в утреннем шоу Алисы: истории от навыков | Теперь навыки смогут отправлять короткий регулярный контент в утреннее шоу Алисы. |
Команды и сценарии для Алисы: покоряем умного помощника | К слову, Алиса теперь умеет вести "утренние шоу". |
Алиса запустила утреннее шоу с персональными рекомендациями
Чтобы запустить программу, нужно сказать: «Алиса, включи утреннее шоу!». Паузы между новостями и песнями голосовой помощник заполняет актуальной информацией. Для этого достаточно открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей». О сервисе Прессе Авторские права Связаться с нами Авторам Рекламодателям Разработчикам.
Новые функции «Алисы» и «Яндекс Станций» за апрель 2024 года
Роутер переключил канал и Алиса молчит. Сказал продолжить - в момент отключения играла музыка, Алиса начала играть просто музыку. С начала слушать не интересно. Алексей Киваков.
Здесь можно выбрать мероприятия, которые хотели бы видеть у себя в рекомендациях. Радионяня mode on Теперь где бы вы ни были — в соседней комнате или отошли по делам, оставив ребенка с бабушкой, няней и т. Активируйте функцию «Радионяни» на «Яндекс Станции», чтобы слушать звуки из детской прямо на своем смартфоне, где бы вы ни находились. Пригласите в «Дом с Алисой» всех, кто сможет включать этот режим — для этого в приложении выберите нужную «Станцию» и зайдите в раздел «Радионяня». Точное место отправителя сообщения Теперь Алиса перед тем, как прочитать текст сообщения, которые родные отправили на вашу «Станцию», будет озвучивать и место, откуда пришло сообщение: из какой комнаты или «Дома». Звонки без постороннего шума С помощью «Станций» можно не только отправлять сообщения, но и звонить.
Проблема стандартных регрессионных методов глубокого обучения в том, что они ищут одну моду — «хорошее среднее» — и попадают в такие «провалы неестественности». В результате оказывается, что лучше случайно выбрать один из двух способов, чем попасть в среднее между ними. Впрочем, даже если акустическая модель и смогла бы разобраться в контексте и выдать обогащённое информацией промежуточное состояние, то с ним уже не мог справиться примитивный вокодер. Поэтому мы не остановились и стали искать более совершенные решения. Конкатенативный синтез: рождение Алисы В 2016 году мы решили создать Алису — сразу было понятно, что это более амбициозная задача, чем всё, чем занимались раньше.
Дело в том, что в отличие от простых TTS-инструментов, голосовой помощник должен звучать человечно, иначе люди просто не станут с ним или с ней общаться. Предыдущая архитектура совершенно не подходила. К счастью, был и другой подход. Точнее, даже два. Тогда как раз набирал обороты нейропараметрический подход, в котором задачу вокодера выполняла сложная нейросетевая модель.
Например, появился проект WaveNet на базе свёрточной нейросети, которая могла обходиться и без отдельной акустической модели. На вход можно было загрузить простые лингвистические данные, а на выходе получить приличную речь. Первым импульсом было пойти именно таким путём, но нейросети были совсем сырые и медленные, поэтому мы не стали их рассматривать как основное решение, а исследовали эту задачу в фоновом режиме. На генерацию секунды речи уходило до пяти минут реального времени. Это очень долго: чтобы использовать синтез в реальном времени, нужно генерировать секунду звука быстрее, чем за секунду.
Что же делать? Если нельзя синтезировать живую речь с нуля, нужно взять крошечные фрагменты речи человека и собрать из них любую произвольную фразу. Напомню, что в этом суть конкатенативного синтеза, который обычно ассоциируется с методом unit selection. Пять лет назад он уже давал наилучшее качество при достаточном количестве данных в задачах, где была нужна качественная речь в реальном времени. И здесь мы смогли переиспользовать нейросети нашей старой параметрики.
Работало это следующим образом: На первом шаге мы использовали нейросетевую параметрику, чтобы синтезировать речь с нуля — подобному тому, как делали раньше. Напомню, что по качеству звучания результат нас не устраивал, но мог использоваться как референс по содержанию. На втором шаге другая нейросеть подбирала из базы фрагментов записанной речи такие, из которых можно было собрать фразу, достаточно близкую к сгенерированной параметрикой. Вариантов комбинаций фрагментов много, поэтому модель смотрела на два ключевых показателя. Первый — target-cost, точность соответствия найденного фрагмента гипотезе, то есть сгенерированному фрагменту.
Второй показатель — join-cost, насколько два найденных соседних фрагмента соответствуют друг другу. По сути, нужно было выбрать вариант, для которого сумма target-cost и join-cost минимальна. Эти параметры можно считать разными способами — для join-cost мы использовали нейросети на базе Deep Similarity Network, а для target-cost считали расстояние до сгенерированной параметрикой гипотезы. Сумму этих параметров, как и принято в unit selection, оптимизировали динамическим программированием. Кстати, подобный подход использовался и при создании Siri 2.
Схема конкатенативного синтеза У такого подхода тоже есть плюсы и минусы. Среди достоинств — более естественное звучание голоса, ведь исходный материал не синтезирован, а записан вживую. Правда, есть и обратная сторона: чем меньше данных, тем более грубо будут звучать места склейки фрагментов. Для шаблонных фраз всё более-менее хорошо, но шаг влево или вправо — и вы замечаете склейку. Поэтому нужно очень много исходного материала, а это требует многих часов записи голоса диктора.
К примеру, в первые несколько лет работы над Алисой нам пришлось записать несколько десятков часов. Это несколько месяцев непрерывной работы с актрисой Татьяной Шитовой в студии. При этом нужно не просто «прочитать текст по листочку». Чем более нейтрально будет звучать голос, тем лучше. Обычно от актёров ждут эмоциональности, проявления темперамента в своей речи.
У нас ровно обратная задача, потому что нужны универсальные «кубики» для создания произвольных фраз. Вот характерный пример работы синтеза: В этом главный недостаток метода unit selection: несмотря на все усилия, фрагменты речи не будут идеально соответствовать друг другу по эмоциям и стилю. Из-за этого сгенерированная речь Алисы постоянно «переключалась» между ними. На коротких фразах это не всегда заметно, но если хотите услышать произвольный ответ длиной хотя бы в пару предложений например, быстрый ответ из поиска , то недостатки подхода становятся очевидны. В общем, unit selection перестал нас устраивать и нужно было развиваться дальше.
Иногда они возвращаются: опять параметрический синтез В результате мы вернулись к архитектуре из двух последовательных блоков: акустическая модель и вокодер. Правда, на более низком уровне обновилось примерно всё. Акустическая модель В отличие от старой параметрики, новую модель мы построили на основе seq2seq-подхода с механизмом внимания. Помните проблему с потерей контекста в нашей ранней параметрике? Если нет нормального контекста, то нет и нормальной интонации в речи.
Решение пришло из машинного перевода. Дело в том, что в машинном переводе как раз возникает проблема глобального контекста — смысл слов в разных языках может задаваться разным порядком или вообще разными структурами, поэтому порой для корректного перевода предложения нужно увидеть его целиком. Для решения этой задачи исследователи предложили механизм внимания — идея в том, чтобы рассмотреть всё предложение разом, но сфокусироваться через softmax-слой на небольшом числе «важных» токенов. При генерации каждого нового выходного токена нейросеть смотрит на обработанные токены фонемы для речевого синтеза или символы языка для перевода входа и «решает», насколько каждый из них важен на этом шаге. Оценив важность, сеть учитывает её при агрегировании результатов и получает информацию для генерации очередного токена выхода.
Таким образом нейросеть может заглянуть в любой элемент входа на любом шаге и при этом не перегружается информацией, поскольку фокусируется на небольшом количестве входных токенов. Для синтеза важна подобная глобальность, так как интонация сама по себе глобальна и нужно «видеть» всё предложение, чтобы правильно его проинтонировать.
Новости Что нового в апреле у Алисы и умных устройств Теперь, если захотите подпеть любимому исполнителю и увидите кнопку «Т» в музыкальном плеере на ТВ Станции, просто скажите: «Алиса, покажи текст песни». На экране появятся слова, которые автоматически синхронизируются с текущим треком. Отличное решение для караоке-вечеринки.
Алиса запустила утреннее шоу с персональными рекомендациями
Навык «Аудиокниги ЛитРес» позволяет включать купленные в сервисе произведения, а также около 10 тысяч бесплатных аудиокниг и подкастов. Насчитывается 140 тысяч аудиокниг и подкастов из крупнейшего каталога, включая новинки и бестселлеры. Чтобы совершить покупку, достаточно выбрать понравившееся произведение и сказать: «Алиса, купи эту книгу» или «Оплати ЛитРес». После этого навык запускает сценарий оплаты, а пользователь получает на смартфон уведомление для ее подтверждения. Огромный плюс — синхронизация прогресса между всеми устройствами. Если на умной колонке поставить аудиокнигу на паузу и позже включить на смартфоне, то воспроизведение продолжится на том же месте. А позже «Алису» хотят научить не только находить, оплачивать и включать нужные книги, но и давать рекомендации на основе пользовательских вкусов.
А на закуску — милейшая и одна из самых новых коллабораций: «Алиса» и Whiskas Дома есть коты и кошки? А может, вы только готовитесь к их появлению? Тогда говорим вот какую команду: «Алиса, запусти навык «Больше мурррчаний с Whiskas». Это поможет котородителям сделать так, чтобы питомец был счастлив. Навык включает в себя пять разделов с рекомендациями по уходу и заботе: котокухня, котомузыка, котоигры, котоуход и котомассаж.
А мы теперь посмотрим, как Алиса показывает новости из предварительно выбранных источников. Как Алиса отображает последние новости После того как мы дадим команду «новости», Алиса выдаст заголовки из тех источников, которые мы отобрали. Вот так это будет выглядеть на панели Яндекс. Браузера: Если вы включаете ленту новостей в телефоне, то отображение будет примерно таким: Удобно, что новости выдаёт списком, и мы можем кликнуть на заинтересовавший нас заголовок, чтобы почитать подробности. В одной из статей я рассказывал, как настроить и включить Яндекс. Новости после 12 сентября 2022 года, когда они перестали отображаться на главной Яндекса и переехали на отдельный домен dzen.
Да, здесь она может прийти на помощь, и это будет гораздо удобнее, чем открывать Дзен и читать новости там. Только нужно предварительно выполнить некоторые манипуляции. Все объяснения буду сопровождать скриншотами, которые сделал и с телефона, и с ноутбука. Как настроить новости в Алисе Можно дать ей обычную команду «Алиса, настрой новости». Если же мы просто напишем «новости» без предварительной настройки, то голосовой помощник нам выдаст такое сообщение: Дополню, что настроить Алису можно не только в приложении Яндекса с 12 сентября оно называется Яндекс. Старт , но и через Яндекс. Браузер на телефоне или компьютере.
Управлять можно голосом: поставить на паузу, продолжить, перемотать назад, выбрать качество или включить субтитры. Новое на Станциях — Выбирайте, что и в каком порядке слушать в Утреннем шоу Алисы: подкасты на избранные темы, прогноз погоды, навыки, треки или новости из определённых источников. Позже функция станет доступна и на других колонках.
Утреннее шоу Алисы – получайте новости и полезную информацию каждое утро
Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости. После работы можно послушать вечернее шоу — Алиса поделится новостями и погодой на следующий день и поставит расслабляющую музыку. Для настройки новостей на колонке Алиса Яндекс, найдите раздел «Новости» или «Информация» и выберите его. Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Теперь голосовой помощник может запускать новостные блоки с девяти станций, включая «Хит ФМ» и «Коммерсантъ FM». Утренние шоу впервые появились в апреле этого года.