Команды и сценарии для Алисы: покоряем умного помощника. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении», — говорит руководитель продукта Андрей Законов. Для этого достаточно открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей». Сделать это можно в приложении «Дом с Алисой»: Настройки → Контент → Шоу с Алисой. Афиша мероприятий и новости.
«Алиса» научилась вести утренние шоу
Утреннее шоу Алисы теперь можно настроить на свой вкус. Для этого пользователь может сам выбрать тематику новостей и подкастов. «Алиса, включи шоу» — для начала воспроизведения выбранного видео. Для настройки новостей на колонке Алиса Яндекс, найдите раздел «Новости» или «Информация» и выберите его.
Место под большое лого и рекламу навыков
Управлять можно голосом: поставить на паузу, продолжить, перемотать назад, выбрать качество или включить субтитры. Персонализируйте утреннее шоу Теперь пользователи сами смогут решать, каким будет их утреннее шоу. Например, выбрать, какой контент и в каком порядке они хотят слушать: подкасты на разные темы, прогноз погоды, конкретные навыки, музыкальные треки или новости из определённых источников. Афиша мероприятий и новости Анонсы интересных мероприятий будут отображаться на главном экране «Станции Дуо Макс». Чтобы узнать о предстоящем событии больше, надо нажать на кнопку «Подробнее», и «Алиса» покажет все детали во встроенном «Браузере».
У нас ровно обратная задача, потому что нужны универсальные «кубики» для создания произвольных фраз. Вот характерный пример работы синтеза: В этом главный недостаток метода unit selection: несмотря на все усилия, фрагменты речи не будут идеально соответствовать друг другу по эмоциям и стилю. Из-за этого сгенерированная речь Алисы постоянно «переключалась» между ними.
На коротких фразах это не всегда заметно, но если хотите услышать произвольный ответ длиной хотя бы в пару предложений например, быстрый ответ из поиска , то недостатки подхода становятся очевидны. В общем, unit selection перестал нас устраивать и нужно было развиваться дальше. Иногда они возвращаются: опять параметрический синтез В результате мы вернулись к архитектуре из двух последовательных блоков: акустическая модель и вокодер. Правда, на более низком уровне обновилось примерно всё. Акустическая модель В отличие от старой параметрики, новую модель мы построили на основе seq2seq-подхода с механизмом внимания. Помните проблему с потерей контекста в нашей ранней параметрике? Если нет нормального контекста, то нет и нормальной интонации в речи.
Решение пришло из машинного перевода. Дело в том, что в машинном переводе как раз возникает проблема глобального контекста — смысл слов в разных языках может задаваться разным порядком или вообще разными структурами, поэтому порой для корректного перевода предложения нужно увидеть его целиком. Для решения этой задачи исследователи предложили механизм внимания — идея в том, чтобы рассмотреть всё предложение разом, но сфокусироваться через softmax-слой на небольшом числе «важных» токенов. При генерации каждого нового выходного токена нейросеть смотрит на обработанные токены фонемы для речевого синтеза или символы языка для перевода входа и «решает», насколько каждый из них важен на этом шаге. Оценив важность, сеть учитывает её при агрегировании результатов и получает информацию для генерации очередного токена выхода. Таким образом нейросеть может заглянуть в любой элемент входа на любом шаге и при этом не перегружается информацией, поскольку фокусируется на небольшом количестве входных токенов. Для синтеза важна подобная глобальность, так как интонация сама по себе глобальна и нужно «видеть» всё предложение, чтобы правильно его проинтонировать.
На тот момент для синтеза была хорошая seq2seq-архитектура Tacotron 2 — она и легла в основу нашей акустической модели. Мел-спектрограмма Параметрическое пространство можно сжать разными способами. Более сжатые представления лучше работают с примитивными акустическими моделями и вокодерами — там меньше возможностей для ошибок. Более полные представления позволяют лучше восстановить wav, но их генерация — сложная задача для акустической модели. Кроме того, восстановление из таких представлений у детерминированных вокодеров не очень качественное из-за их нестабильности. С появлением нейросетевых вокодеров сложность промежуточного пространства стала расти и сейчас в индустрии одним из стандартов стала мел-спектрограмма. Она отличается от обычного распределения частоты звука по времени тем, что частоты переводятся в особую мел-частоту звука.
Другими словами, мел-спектрограмма — это спектрограмма, в которой частота звука выражена в мелах , а не герцах. Мелы пришли из музыкальной акустики, а их название — это просто сокращение слова «мелодия». Строение улитки уха из Википедии Эта шкала не линейная и основана на том, что человеческое ухо по-разному воспринимает звук различной частоты. Вспомните строение улитки в ухе: это просто канал, закрученный по спирали. Высокочастотный звук не может «повернуть» по спирали, поэтому воспринимается достаточно короткой частью слуховых рецепторов. Низкочастотный же звук проходит вглубь. Поэтому люди хорошо различают низкочастотные звуки, но высокочастотные сливаются.
Мел-спектрограмма как раз позволяет представить звук, акцентируясь на той части спектра, которая значимо различается слухом. Это полезно, потому что мы генерируем звук именно для человека, а не для машины. Вот как выглядит мел-спектрограмма синтеза текста «Я — Алиса»: У мел-спектрограммы по одному измерению [X на рисунке выше] — время, по другому [Y] — частота, а значение [яркость на рисунке] — мощность сигнала на заданной частоте в определенный момент времени. Проще говоря, эта штуковина показывает, какое распределение по мощностям было у различных частот звука в конкретный момент. Мел-спектрограмма непрерывна, то есть с ней можно работать как с изображением. А так звучит результат синтеза: 3. Новый вокодер Вероятно, вы уже догадались, что мы перешли к использованию нового нейросетевого вокодера.
Именно он в реальном времени превращает мел-спектрограмму в голос. Наиболее близкий аналог нашего первого решения на основе нейросетей, которое вышло в 2018 году — модель WaveGlow. Архитектура WaveGlow основана на генеративных потоках — довольно изящном методе создания генеративных сетей, впервые предложенном в статье про генерацию лиц. Сеть обучается конвертировать случайный шум и мел-спектрограмму на входе в осмысленный wav-сэмпл. За счёт случайного шума на входе обеспечивается выбор случайной wav-ки — одной из множества соответствующих мел-спектрограмме. Как я объяснил выше, в домене речи такой случайный выбор будет лучше детерминированного среднего по всем возможным wav-кам. В отличие от WaveNet, WaveGlow не авторегрессионен, то есть не требует для генерации нового wav-сэмпла знания предыдущих.
Его параллельная свёрточная архитектура хорошо ложится на вычислительную модель видеокарты, позволяя за одну секунду работы генерировать несколько сотен секунд звука. Главное отличие, за счёт которого HiFi-GAN обеспечивает гораздо лучшее качество, заключается в наборе подсетей-дискриминаторов. Они валидируют натуральность звука, смотря на сэмплы с различными периодами и на различном масштабе. Как и WaveGlow, HiFi-GAN не имеет авторегрессионной зависимости и хорошо параллелится, при этом новая сеть намного легковеснее, что позволило при реализации ещё больше повысить скорость синтеза. Кроме того, оказалось, что HiFi-GAN лучше работает на экспрессивной речи, что в дальнейшем позволило запустить эмоциональный синтез — об этом подробно расскажу чуть позже. Схема HiFi-GAN из статьи авторов модели Комбинация этих трёх компонентов позволила вернуться к параметрическому синтезу голоса, который звучал плавно и качественно, требовал меньше данных и давал больше возможностей в кастомизации и изменении стиля голоса. Параллельно мы работали над улучшением отдельных элементов синтеза: Летом 2019 года выкатили разрешатор омографов homograph resolver — он научил Алису правильно ставить ударения в парах «зАмок» и «замОк», «белкИ» и «бЕлки» и так далее.
Здесь мы нашли остроумное решение. В русском языке эти слова пишутся одинаково, но в английском написание отличается, например, castle и lock, proteins и squirrels. Из этого представления легко выделить информацию о том, как произносить омограф, ведь перевод должен различать формы для корректного подбора английского варианта. Буквально на 20 примерах можно выучить классификатор для нового омографа, чтобы по эмбеддингу перевода понимать, какую форму нужно произнести. Летом 2020 года допилили паузер для расстановки пауз внутри предложения.
Обратите внимание: В приложении Яндекс нужно авторизоваться с того аккаунта, к которому привязана Яндекс Станция. Здесь можно настроить информацию, которая будет попадать в утреннее шоу. Отметим, что настроить можно 3 типа информации: Новости. Новостной блок длится до 3 минут в рамках шоу.
Тематический блок длится до 3 минут в рамках шоу. Навыки длятся до 1 минуты в рамках шоу. Активируйте и деактивируйте переключатели около тех пунктов контента, которые вы хотите или не хотите слышать в рамках утреннего шоу.
Несмотря на то, что голосовой помощник Алиса присутствует на многих устройствах, включить шоу от него получится только на колонке. Обратите внимание: Утреннее шоу доступно на любой Яндекс Станции.
Но для его работы необходимо иметь подписку на Яндекс Плюс. Можно сказать, что утреннее шоу от Алисы — это некая замена радиостанциям. Обратите внимание: В отличие от радиостанций, в утреннем шоу Алисы нет рекламы. Отметим, что включить утреннее шоу от Алисы можно не только утром. Оно доступно в любое время дня.
Больше нельзя установить iOS 13.4
- Голосовой помощник Алиса начала вести свое утреннее шоу
- Утреннее шоу Алисы теперь можно настроить на свой вкус
- «Алиса» научилась вести утренние шоу
- Что такое сценарии и чем они отличаются от команд?
- Telegram: Contact @alice_yndx
Как настроить новости в Алисе
- Утреннее шоу Алисы стало персональным
- Как взглянуть на «Алису» по-новому? 5 необычных навыков для «Яндекс.Станции»
- Примечание
- Новости — подборка навыков Алисы, голосового помощника от Яндекса.
- Утреннее шоу Алисы теперь можно настроить на свой вкус
- Утреннее шоу Алисы теперь можно настроить на свой вкус
Что такое сценарии и чем они отличаются от команд?
- Топовые фишки Яндекс.Станции, о которых вы могли не знать
- Артём Баусов
- Утреннее шоу — бодрящий навык Алисы
- Алиса (голосовой помощник) — Википедия
Утреннее шоу Алисы стало персональным
«Алиса» научилась вести утренние шоу | Яндекс Станция включает Шоу Алисы (погода, новости, музыка и т.п.). Об этом я рассказываю ниже. Для утреннего сценария использую автоматизацию охлаждения кухни кондиционером. |
8 новых фишек «Яндекс Станций» и «Яндекс ТВ Станций», которые появились в апреле | Теперь навыки смогут отправлять короткий регулярный контент в утреннее шоу Алисы. |
Утреннее шоу от Алисы на Яндекс Станции | Как настроить новости Яндекс Алиса. «Алиса» научилась персонализировать «Утреннее шоу». |
Утреннее шоу Алисы - YouTube | Шоу и новости доступны в «и», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса». |
Утренняя Алиса. У голосового помощника Яндекса теперь своё шоу | В умных колонках с Алисой появилось персональное утреннее шоу: теперь можно слушать полезную информацию и музыку, подобранную специально для слушателя. |
Топовые фишки Яндекс.Станции, о которых вы могли не знать
Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. Обновление Алисы также включает в себя улучшенное утреннее шоу: теперь там не только новости и музыка, но и короткие подкасты, даты в истории, мудрости и комплименты. Чтобы выбрать тематику новостей и подкастов, нужно просто открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей».
Утреннее шоу «Алисы» стало персональным
В «Яндексе» говорят, что «Алиса» станет личным диджеем, поставит и прокомментирует треки из персонального плейлиста дня на «Яндекс. Музыке», где собрана специально отобранная музыка для пользователя. Персональное утреннее шоу уже доступно в «Яндекс.
Слушателей ждут новости, прогноз погоды, музыка и короткие подкасты — например, о том, способны ли животные обманывать или как влияет шоколад на здоровье. Алиса выступает диджеем: ставит и комментирует песни из персонального плейлиста дня на Яндекс. Музыке — в нём собраны треки, отобранные для пользователя. Алиса прекрасно ориентируется в происходящем и говорит о том, что волнует людей.
Пока моетесь Вы заметили, что в ванной повысилась влажность и вентиляционная вытяжка в ванной заработала. Время отдыха и чиллить. Куранты на Яндекс Станциях пробили 11 часов. Голосовым управлением запустили телевизор я обычно включаю когда нахожусь на кухне и собираюсь спать и включаю китайскую светодиодную ленту. Пока телевизор запускается - можно пошарить экранчики с графиками. Время просмотра фильмов, но экран слишком яркий? Голосовым управлением или с помощью телефона запустился сценарий "яркость для ночного режима". День закончился, голосом или возможно установленной кнопкой возле кровати - вы выключили все в квартире. Вам снятся электроовцы. Наступил следующий день. Вас разбудил будильник установленный заранее на Яндекс Станции. Можно поставить и какую-то определенную музыку для пробуждения. Не хватает здесь настройки будильников через приложение Умный Дом Яндекса. Кажется, мы уже проснулись? Вы говорите "Алиса, доброе утро" Яндекс Станции 2. Она вас также приветствует, и под музыку начинается новый день. Зачитывает новости моего маленького города. Здесь не хватает автоматизации для открытия штор и заварки кофе - но и этого хватит. Началась ежедневная рутина. Когда Вы сказали "доброе утро" - на кухне включился кондиционер автоматизации нет, если температура за окном минус 35 градусов, придется ручками заранее отключать работу кондиционера в данном моём сценарии. Вы направились на кухню, время готовить. На балконе в закрытом шкафу лежит спрятанный пакетик листиков для заварки чая. Как только Вы открыли дверь балкона - кондиционер автоматически выключился. Пришлось запускать голосом. Время отправляться на работу. Вы приняли душ под энергичную музыку которую включила умная станция по потоку рекомендаций. Геля для душа осталось не так много. Вы говорите «Алиса, добавь в список покупок: гель для душа и зубную пасту». Когда будете возвращаться домой после работы — не забудьте открыть список покупок на телефоне. Вытяжка работает исправна. Закончив водные процедуры - время идти в коридор и одеваться. Как только вы подошли к шкафу — свет в коридоре включился. Вы собрались уходить, но заметили невыключенный свет в некоторых комнат. Возле входной двери нас ждала умная кнопка. Умные выключатели освещения для круглых подрозетников подключены через zigbee к УДЯ. Созданные мною сценарии в приложении УДЯ позволили связать все это между собой. Сценарий: Как Яндекс управляет самым простым кондиционером? Для этого сценария используется Умный Пульт Яндекса я его приобрел за 600 рублей - вы сделали запрос и Пульт Яндекса отправил ИК сигнал на кондиционер. Яндекс Пульт поддерживает множество производителей или можно самому обучить Яндекс Пульт. Ранее: На улице жара и вы направляетесь домой.
Почему я выбрал Яндекс Станцию 2 Я насмотрелся множества рекламы. Но это оказалось не так.. Как только вы открываете дверь - срабатывает датчик открытия входной двери, включается свет в коридоре. Дополнительно в коридоре установлена умная кнопка, нажимаете один раз - включается свет на кухне, это помогает сразу занести пакеты с продуктами. В коридоре дополнительно висит датчик движения - если нет движения, то через некоторое время свет в коридоре выключится. Вы прошли на кухню, разгружаете пакеты с продуктами - стало жарко. Вы голосом попросили Алису Яндекс Станцию Мини которая расположена на кухне включить кондиционер. Она запускает кондиционер. Вы также могли этого избежать - если бы заранее установили сценарий температура в комнате выше 26, включается кондиционер на 20 минут. После того как вы расставили продукты по местам - время принять душ. Был тяжелый день, пришло время немного расслабиться. Вы заходите в ванную комнату, свет включился самостоятельно. Попросили Алису Яндекс Станцию Мини которая расположена в ванной включить музыку. Пока моетесь Вы заметили, что в ванной повысилась влажность и вентиляционная вытяжка в ванной заработала. Время отдыха и чиллить. Куранты на Яндекс Станциях пробили 11 часов. Голосовым управлением запустили телевизор я обычно включаю когда нахожусь на кухне и собираюсь спать и включаю китайскую светодиодную ленту. Пока телевизор запускается - можно пошарить экранчики с графиками. Время просмотра фильмов, но экран слишком яркий? Голосовым управлением или с помощью телефона запустился сценарий "яркость для ночного режима". День закончился, голосом или возможно установленной кнопкой возле кровати - вы выключили все в квартире. Вам снятся электроовцы. Наступил следующий день. Вас разбудил будильник установленный заранее на Яндекс Станции. Можно поставить и какую-то определенную музыку для пробуждения. Не хватает здесь настройки будильников через приложение Умный Дом Яндекса. Кажется, мы уже проснулись? Вы говорите "Алиса, доброе утро" Яндекс Станции 2. Она вас также приветствует, и под музыку начинается новый день. Зачитывает новости моего маленького города. Здесь не хватает автоматизации для открытия штор и заварки кофе - но и этого хватит. Началась ежедневная рутина. Когда Вы сказали "доброе утро" - на кухне включился кондиционер автоматизации нет, если температура за окном минус 35 градусов, придется ручками заранее отключать работу кондиционера в данном моём сценарии. Вы направились на кухню, время готовить. На балконе в закрытом шкафу лежит спрятанный пакетик листиков для заварки чая. Как только Вы открыли дверь балкона - кондиционер автоматически выключился. Пришлось запускать голосом. Время отправляться на работу. Вы приняли душ под энергичную музыку которую включила умная станция по потоку рекомендаций. Геля для душа осталось не так много.
Новые функции «Алисы» и «Яндекс Станций» за апрель 2024 года
Сейчас в голосовом помощнике доступны 11 новостных тематик и 21 рубрика для подкастов. Всего у Алисы больше двух тысяч подкастов на разные темы. Выбрать тематику довольно просто. Для этого достаточно открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей» - С умной колонкой можно слушать что угодно. А утреннее шоу — это такой формат, который позволяет собрать воедино то, что любишь.
Например, выбрать, какой контент и в каком порядке они хотят слушать: подкасты на разные темы, прогноз погоды, конкретные навыки, музыкальные треки или новости из определённых источников. Афиша мероприятий и новости Анонсы интересных мероприятий будут отображаться на главном экране «Станции Дуо Макс». Чтобы узнать о предстоящем событии больше, надо нажать на кнопку «Подробнее», и «Алиса» покажет все детали во встроенном «Браузере». Радионяня для каждого в семье Теперь на «Яндекс Станции» можно включить режим радионяни и получать звуки из детской прямо на телефон. Для этого надо пригласить близких в свой «Дом» и указать, кто может включать режим радионяни.
В списке есть музыкальные темы, полезная информация, интересные данные и так далее. В частности, система ориентируется на персональный плейлист на «Яндекс. Также голосовой помощник понимает контекст и рассказывает, к примеру, о том, как провести время дома.
Чтобы перейти к следующему шагу, нужно сказать: «Дальше». В этом режиме Алиса будет сама ставить таймер. Например, если нужно что-то запекать или варить определенное время. Так вы точно не забудете, когда переходить к следующему шагу.
Читает ли Алиса последние новости? Настраиваем её на телефоне и на компьютере
Утренняя Алиса. У голосового помощника Яндекса теперь своё шоу | Персонализированное «Утреннее шоу» с «Алисой» (не все знают о его настройке). |
Утреннее шоу Алисы стало персональным 😎 | В гостях у Алисы | Дзен | В умных колонках с Алисой появилось персональное утреннее шоу: теперь можно слушать полезную информацию и музыку, подобранную специально для слушателя. |
Утреннее шоу Алисы теперь можно настроить на свой вкус | О сервисе Прессе Авторские права Связаться с нами Авторам Рекламодателям Разработчикам. |
Утреннее шоу Алисы – получайте новости и полезную информацию каждое утро
Новости — подборка навыков Алисы, голосового помощника от Яндекса. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей. Выбрать тематику новостей и подкастов можно в приложении «Яндекс», сказав «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей». Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека.