Персонализированное «Утреннее шоу» с «Алисой» (не все знают о его настройке). «Алиса» научилась персонализировать «Утреннее шоу» и включать новости радиостанций. «Алиса, включи шоу» — для начала воспроизведения выбранного видео.
Читает ли Алиса последние новости? Настраиваем её на телефоне и на компьютере
В конце 2020 года утреннее шоу Алисы стало персонализированным. Какие новости нужно выбирать, чтобы быть в курсе последних событий, но не утомляться излишним потоком информации? Что сказать: «Алиса, запусти утреннее шоу», «Алиса, включи утреннее шоу». Эти программы помогают узнать нужную информацию в начале дня или рассказать о том, что вы могли пропустить. Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. «Яндекс» добавил возможность персональной настройки утреннего шоу голосового помощника «Алиса». Функция появилась в ассистенте в апреле этого года. «Алиса» по-прежнему умеет зачитывать по утрам актуальные новости. Множество полезных навыков для голосового помощника ждут вас в Каталоге навыков Алисы. Больше настроек для моего Утреннего шоу: выбирайте комфортный порядок из подкастов на интересные темы, прогноза погоды, рассказа о навыках, музыки и новостей из выбранных источников. Запущу, как обычно, по фразе: «Алиса, доброе утро!» Радионяню смогут.
Как взглянуть на «Алису» по-новому? 5 необычных навыков для «Яндекс.Станции»
Например, сейчас в паузах между новостями и песнями "Алиса" рассказывает, как с пользой и удовольствием провести время дома. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу - первый шаг в этом направлении", - отметил руководитель продукта Андрей Законов. Утреннее шоу доступно в "Яндекс. Станции", "Станции Мини" и других умных колонках с "Алисой".
Алиса направит жалобу на дороги, благоустройство или здравоохранение в местный орган власти, отвечающий за ее решение. Как посчитать калории для себя Не знаете, сколько калорий в пище? Скажите Алисе: она посчитает все за вас и даже подскажет меню на следующий день Яндекс.
Станция — хороший помощник для тех, кто следит за своей фигурой. Скажите Алисе «Попроси умный счетчик калорий записать» и уточните блюдо. В ответ ассистент вам расскажет о содержании белков, жиров и углеводов в пище. Если фиксировать с помощью Алисы съеденное за день, то вечером она сообщит, сколько калорий вы употребили за день и даже рассчитает меню на следующий день. Алиса точно знает названия блюд и подскажет, что употреблять из напитков. Остались вопросы по статье?
Задать их можете в нашем Telegram-чате! Как начать тренироваться дома Тренажерный зал — это круто, но кто сказал, что тренировки дома чем-то хуже? Скажите: «Алиса, запусти навык фитнес-наставник«. Голосовой помощник заменит вам тренера: Алиса расскажет, как сделать упражнение, включит музыку и посчитает примерное количество сожженных калорий. А какие классные навыки Алисы знаете вы?
Чтобы запустить программу, достаточно сказать: "Алиса, включи утреннее шоу! И в этот же момент к слушателям придут новости, прогноз погоды, музыка и короткие подкасты - например, о том, способны ли животные обманывать или как влияет шоколад на здоровье. Еще до шоу Алиса выступала диджеем: она ставит и комментирует песни из персонального плейлиста дня на Яндекс.
Музыке - в нем собраны треки, отобранные для пользователя. Создатели подчеркивают, что Алиса прекрасно ориентируется в происходящем и говорит о том, что волнует людей.
Здесь можно настроить информацию, которая будет попадать в утреннее шоу.
Отметим, что настроить можно 3 типа информации: Новости. Новостной блок длится до 3 минут в рамках шоу. Тематический блок длится до 3 минут в рамках шоу.
Навыки длятся до 1 минуты в рамках шоу. Активируйте и деактивируйте переключатели около тех пунктов контента, которые вы хотите или не хотите слышать в рамках утреннего шоу. Приведем простой пример настройки утреннего шоу через приложение.
«Яндекс» научил «Алису» вести персональное утреннее шоу
Новости Что нового в апреле у Алисы и умных устройств Теперь, если захотите подпеть любимому исполнителю и увидите кнопку «Т» в музыкальном плеере на ТВ Станции, просто скажите: «Алиса, покажи текст песни». На экране появятся слова, которые автоматически синхронизируются с текущим треком. Отличное решение для караоке-вечеринки.
Сейчас же в умных колонках с Алисой появилось ее персональное утреннее шоу. Люди могут слушать полезную информацию, музыку и интересные истории, подобранные специально для них. Чтобы запустить программу, достаточно сказать: "Алиса, включи утреннее шоу! И в этот же момент к слушателям придут новости, прогноз погоды, музыка и короткие подкасты - например, о том, способны ли животные обманывать или как влияет шоколад на здоровье. Еще до шоу Алиса выступала диджеем: она ставит и комментирует песни из персонального плейлиста дня на Яндекс.
Утренние шоу впервые появились в апреле этого года. Пользователи могут сказать «Алисе» соответствующую голосовую команду, и она будет подбирать новостные сводки, прогноз погоды, музыку и подкасты, основываясь на их предпочтениях.
Что ещё появилось на ТВ Станциях? Управлять можно голосом: поставить на паузу, продолжить, перемотать назад, выбрать качество или включить субтитры. Новое на Станциях — Выбирайте, что и в каком порядке слушать в Утреннем шоу Алисы: подкасты на избранные темы, прогноз погоды, навыки, треки или новости из определённых источников.
8 новых фишек «Яндекс Станций» и «Яндекс ТВ Станций», которые появились в апреле
Для настройки новостей на Яндекс Алисе необходимо открыть раздел «Интеграция» в настройках приложения. О сервисе Прессе Авторские права Связаться с нами Авторам Рекламодателям Разработчикам. Чтобы выбрать источник новостей, откуда Алиса будет зачитывать информацию, воспользуйтесь одним из следующих способов: скажите голосовой помощнице в приложении Яндекс фразу «Алиса, настрой новости» — выберите источник вручную в приложении Яндекс.
Команды и сценарии для Алисы: покоряем умного помощника
Утреннее шоу Алисы теперь можно настроить на свой вкус. Для настройки новостей на умной колонке необходимо выполнить несколько простых шагов. Что сказать: «Алиса, запусти утреннее шоу», «Алиса, включи утреннее шоу». Эти программы помогают узнать нужную информацию в начале дня или рассказать о том, что вы могли пропустить. Умная лампочка Яндекс с Алисой, цоколь E27, белая (YNDX-00501). Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. Утреннее шоу Алисы – получайте новости и полезную информацию каждое утро.
Утреннее шоу Алисы стало персональным
Футбол», что позволит наслаждаться прямыми трансляциями важнейших спортивных событий. Расширенные возможности видео Видео, найденные через поиск, теперь можно сразу же воспроизводить на «ТВ Станции». Управление воспроизведением осуществляется голосом, что включает команды паузы, перемотки и выбора качества видео. Пользователи могут использовать команды, такие как: «Алиса, включи шоу» — для начала воспроизведения выбранного видео. Персонализация «Утреннего шоу» Пользователи могут настраивать порядок и тип контента, который будет воспроизводиться в «Утреннем шоу». Афиша мероприятий на главном экране «Станция Дуо Макс» научилась отображать анонсы мероприятий, проходящих в городе пользователя.
Кроме того, оказалось, что HiFi-GAN лучше работает на экспрессивной речи, что в дальнейшем позволило запустить эмоциональный синтез — об этом подробно расскажу чуть позже. Схема HiFi-GAN из статьи авторов модели Комбинация этих трёх компонентов позволила вернуться к параметрическому синтезу голоса, который звучал плавно и качественно, требовал меньше данных и давал больше возможностей в кастомизации и изменении стиля голоса. Параллельно мы работали над улучшением отдельных элементов синтеза: Летом 2019 года выкатили разрешатор омографов homograph resolver — он научил Алису правильно ставить ударения в парах «зАмок» и «замОк», «белкИ» и «бЕлки» и так далее. Здесь мы нашли остроумное решение.
В русском языке эти слова пишутся одинаково, но в английском написание отличается, например, castle и lock, proteins и squirrels. Из этого представления легко выделить информацию о том, как произносить омограф, ведь перевод должен различать формы для корректного подбора английского варианта. Буквально на 20 примерах можно выучить классификатор для нового омографа, чтобы по эмбеддингу перевода понимать, какую форму нужно произнести. Летом 2020 года допилили паузер для расстановки пауз внутри предложения. Язык — хитрая штука. Не все знаки препинания в речи выражаются паузами Например, после вводного слова «конечно» на письме мы ставим запятую, но в речи обычно не делаем паузу. А там, где знаков препинания нет, мы часто делаем паузы. Если эту информацию не передавать в акустическую модель, то она пытается её выводить и не всегда успешно. Первая модель Алисы из-за этого могла начать вздыхать в случайных местах длинного предложения.
Для этого мы взяли датасет, разметили его детектором активности голоса, сгруппировали паузы по длительности, ввели класс длины паузы, на каждое слово навесили тэг и на этом корпусе обучили ещё одну голову внимания из тех же нейросетевых эмбеддингов, что использовались для детекции омографов. Осенью 2020 года мы перевели на трансформеры нормализацию — в синтезе она нужна, чтобы решать сложные случаи, когда символы читаются не «буквально», а по неким правилам. Например, «101» нужно читать не как «один-ноль-один», а как «сто один», а в адресе yandex. Обычно нормализацию делают через комбинацию взвешенных трансдьюсеров FST — правила напоминают последовательность замен по регулярным выражениям, где выбирается замена, имеющая наибольший вес. Мы долго писали правила вручную, но это отнимало много сил, было очень сложно и не масштабируемо. Тогда решили перейти на трансформерную сеть, «задистиллировав» знания наших FST в нейронку. Теперь новые «правила раскрытия» можно добавлять через доливание синтетики и данных, размеченных пользователями Толоки, а сеть показывает лучшее качество, чем FST, потому что учитывает глобальный контекст. Итак, мы научили Алису говорить с правильными интонациями, но это не сделало ее человеком — ведь в нашей речи есть еще стиль и эмоции. Работа продолжалась.
С чувством, толком, расстановкой: стили голоса Алисы Один и тот же текст можно произнести десятком разных способов, при этом сам исходный текст, как правило, никаких подсказок не содержит. Если отправить такой текст в акустическую модель без дополнительных меток и обучить её на достаточно богатом различными стилями и интонациями корпусе, то модель сойдёт с ума — либо переусреднит всё к металлическому «голосу робота», либо начнёт генерировать случайный стиль на каждое предложение. Это и произошло с Алисой: в начале она воспроизводила рандомные стили в разговоре. Казалось, что у неё менялось настроение в каждом предложении. Вот пример записи с явными перебоями в стилях: Чтобы решить проблему, мы добавили в акустическую модель стили: в процессе обучения нейросети специально ввели «утечку». Суть в том, что через очень lossy-пространство всего 16 чисел на всё предложение разрешаем сетке посмотреть на ответ — истинную мел-спектрограмму, которую ей и нужно предсказать на обучении. За счёт такой «шпаргалки» сеть не пытается выдумывать непредсказуемую по тексту компоненту, а для другой информации не хватит размерности шпаргалки. На инференсе мы генерируем стилевую подсказку, похожую на те, что были в обучающем сете. Это можно делать, взяв готовый стиль из обучающего примера или обучив специальную подсеть генерировать стили по тексту.
Если эту подсеть обучить на особом подмножестве примеров, можно получить специальные стили для, скажем, мягкого или дружелюбного голоса. Или резкого и холодного. Или относительно нейтрального. Чтобы определиться со стилем по умолчанию, мы устроили турнир, где судьями выступали пользователи Толоки. Там не было разметки, мы просто нашли кластеры стилей и провели между ними соревнование. Победил кластер с очень мягкой и приятной интонацией. Дальше началось самое интересное. Мы взяли образцы синтезированной «мягкой» речи Алисы и фрагменты речи актрисы Татьяны Шитовой, которые относились к более резкому стилю. Затем эти образцы с одним и тем же текстом протестировали вслепую на толокерах.
Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. В принципе, этого можно было ожидать: уверен, многие предпочтут более ласковый разговор по телефону то есть с потерей в качестве живому, но холодному общению. К примеру, так звучал резкий голос: А так — мягкий: Результаты турниров позволили нам выделить во всем обучающем датасете данные, которые относятся к стилю-победителю, и использовать для обучения только их. Благодаря этому Алиса по умолчанию стала говорить более мягким и дружелюбным голосом. Этот пример показывает, что с точки зрения восприятия важно работать не только над качеством синтеза, но и над стилем речи. После этого оставалось только обогатить Алису новыми эмоциями. Бодрая или спокойная: управляем эмоциями Алисы Когда вы включаете утреннее шоу Алисы или запускаете автоматический перевод лекции на YouTube, то слышите разные голоса — бодрый в первом случае и более флегматичный в другом. Эту разницу сложно описать словами, но она интуитивно понятна — люди хорошо умеют распознавать эмоции и произносить один и тот же текст с разной эмоциональной окраской. Мы обучили этому навыку Алису с помощью той же разметки подсказок, которую применили для стилей.
У языка есть интересное свойство — просодия , или набор элементов, которые не выражаются словами. Это особенности произношения, интенсивность, придыхание и так далее. Один текст можно произнести со множеством смыслов. Как и в случае со стилями речи, можно, например, выделить кластеры «веселая Алиса», «злая Алиса» и так далее. Поскольку стилевой механизм отделяет просодию «как говорим» от артикуляции «что говорим» , то новую эмоцию можно получить буквально из пары часов данных. По сути, нейросети нужно только выучить стиль, а информацию о том, как читать сочетания фонем, она возьмёт из остального корпуса. Прямо сейчас доступны три эмоции. Например, часть пользователей утреннего шоу Алисы слышат бодрую эмоцию.
Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу - первый шаг в этом направлении", - отметил руководитель продукта Андрей Законов. Утреннее шоу доступно в "Яндекс. Станции", "Станции Мини" и других умных колонках с "Алисой".
Теперь у них появилась возможность выбирать темы новостей и подкастов. На данный момент в базе ассистента 11 рубрик для новостей и 21 рубрика для подкастов. Telegram-канал создателя Трешбокса про технологии «С умной колонкой можно слушать что угодно.