Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. «Яндекс» представил апрельское обновление «Алисы» и своих умных устройств.
Утренняя Алиса. У голосового помощника Яндекса теперь своё шоу
Для настройки новостей на колонке Алиса Яндекс, найдите раздел «Новости» или «Информация» и выберите его. Утреннее шоу представляет собой некий “винегрет” из интересных публикаций и новостей с различных сайтов, навыков Алисы и музыки. Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Утренние шоу впервые появились в апреле этого года. «Утреннее шоу» и новости радиостанций доступны во всех умных колонках с поддержкой «Алисы». первый шаг в этом направлении". Чтобы запустить программу, нужно сказать: «Алиса, включи утреннее шоу!». Паузы между новостями и песнями голосовой помощник заполняет актуальной информацией.
«Яндекс» научил «Алису» вести персональное утреннее шоу
Как настроить новости Яндекс Алиса. «Алиса» научилась персонализировать «Утреннее шоу». «Утреннее шоу» и новости радиостанций доступны во всех умных колонках с поддержкой «Алисы». Утреннее шоу Алисы теперь можно настроить на свой вкус, указав тематику новостей и подкастов.
Больше нельзя установить iOS 13.4
- Что умеет «Яндекс-станция»: 17 полезных функций и команд для Алисы
- Новые спортивные каналы по подписке
- Новые функции «Алисы» и «Яндекс Станций» за апрель 2024 года
- Что нового в апреле у Алисы и умных устройств
- Как запустить Утреннее шоу Алисы | Как спросить, фишки навыка
- Голосовой помощник Алиса начала вести свое утреннее шоу
Как Алиса отображает последние новости
- Настроить шоу Алисы
- Утреннее шоу от Алисы на Яндекс Станции
- Новые функции Яндекс Станции
- Читает ли Алиса последние новости? Необходимые настройки
- Утреннее шоу Алисы теперь можно настроить на свой вкус
- Как я делаю почти умный дом с Яндекс Станцией 2 — Железо на DTF
«Алиса» научилась вести утренние шоу
Алиса запустила утреннее шоу с персональными рекомендациями 17 апреля 2020 1 мин В умных колонках с Алисой появилось персональное утреннее шоу: теперь можно слушать полезную информацию и музыку, подобранную специально для слушателя. Слушателей ждут новости, прогноз погоды, музыка и короткие подкасты. Алиса выступает диджеем: ставит и комментирует песни из персонального плейлиста дня на Яндекс.
Правда, только если он от «Яндекса». Источник: yandex. После каждого этапа Алиса будет делать паузу, чтобы вы успели выполнить ее советы. Чтобы перейти к следующему шагу, нужно сказать: «Дальше». В этом режиме Алиса будет сама ставить таймер.
Также голосовой помощник понимает контекст и рассказывает, к примеру, о том, как провести время дома. По словам руководителя продукта Андрея Законова, проведение утренних шоу — это первый шаг, чтобы сделать «Алису» не только помощником, но и другом, с которым приятно проводить время. Новая функция доступна пока что на умных колонках с голосовым помощником.
Длительность истории не должна превышать одной минуты. Чтобы подключить навык к утреннему шоу Алисы, оставьте заявку через форму: А теперь — подробнее о работе функциональности. Диалогов: он содержит состояния, поверхность запуска и другие важные параметры.
Еще по теме
- Умные колонки с "Алисой" научились вести персонализированные утренние шоу
- Утреннее шоу Алисы теперь можно настроить на свой вкус
- Ранний параметрический синтез: эпоха до Алисы
- Топовые фишки Яндекс.Станции, о которых вы могли не знать
Вышло большое обновление Алисы. Смотри, что теперь умеет твоя Яндекс Станция
Утреннее шоу — бодрящий навык Алисы | Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. |
Новый формат контента в утреннем шоу Алисы: истории от навыков | Больше настроек для моего Утреннего шоу: выбирайте комфортный порядок из подкастов на интересные темы, прогноза погоды, рассказа о навыках, музыки и новостей из выбранных источников. Запущу, как обычно, по фразе: «Алиса, доброе утро!» Радионяню смогут. |
Вышло апрельское обновление Алисы и умных устройств Яндекса | The GEEK | «Алиса» научилась персонализировать «Утреннее шоу». Как настроить новости в Алисе Можно дать ей обычную команду «Алиса, настрой новости». |
Утреннее шоу «Алисы» стало персональным | Умные колонки с голосовым помощником "Алиса" научились проводить утренние шоу, которые подбираются под конкретных пользователей. |
На колонках с Алисой появилась функция Утреннего шоу | В конце 2020 года утреннее шоу Алисы стало персонализированным. Это означает, что вы можете настроить его в соответствии с вашими интересами, указав предпочтительные темы новостей и подкастов. |
Утреннее шоу Алисы стало персональным 😎
Музыке — в нём собраны треки, отобранные для пользователя. Алиса прекрасно ориентируется в происходящем и говорит о том, что волнует людей. Например, сейчас в паузах между новостями и песнями Алиса рассказывает, как с пользой и удовольствием провести время дома. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении», — говорит руководитель продукта Андрей Законов.
И иногда добавляет к ним подкасты.
Звучит живо и увлекательно. Интереснее, чем на многих новостных ТВ-каналах. Для запуска функции достаточно сказать «Алиса, включи утреннее шоу».
Общение с ассистентом возможно голосом и вводом запросов с клавиатуры. Алиса отвечает или прямо в диалоговом интерфейсе, либо же показывает поисковую выдачу по запросу или нужное приложение. Анализ запроса и формирование ответа Распознать голосовой запрос Алисе помогает технология SpeechKit.
На этом этапе происходит отделение голоса от фоновых шумов. Разобраться с акцентами, диалектами, сленгами и англицизмами алгоритмам позволяет накопленная Яндексом база из миллиарда произнесённых в разных условиях фраз [11] [12]. На следующем этапе наделить запрос смыслом и подобрать правильный ответ позволяет технология Turing, своим названием отсылающая к Алану Тьюрингу и его тесту. Благодаря ей «Алиса» может не только давать ответы на конкретные вопросы, но и общаться с пользователем на отвлечённые темы. Для этого текст запроса дробится на токены, как правило, это отдельные слова, которые в дальнейшем отдельно анализируются. Для максимально точного ответа Алиса учитывает историю взаимодействия с ней, интонацию запроса, предыдущие фразы и геопозицию.
Это объясняет тот факт, что на один вопрос разные пользователи могут получить разные ответы [11] [12]. Первоначально нейросеть Алисы обучали на массиве текстов из классики русской литературы , включая произведения Льва Толстого , Фёдора Достоевского , Николая Гоголя , а затем — на массивах живых текстов из Интернета [13]. Как рассказывал глава управления машинного обучения Яндекса Михаил Биленко в интервью изданию Meduza , в ходе ранних тестов в манере общения Алисы появилась дерзость, которая удивляла и забавляла пользователей. Чтобы дерзость не перешла в хамство и чтобы ограничить рассуждения Алисы на темы, связанные с насилием, ненавистью или политикой, в голосового помощника была внедрена система фильтров и стоп-слов [14]. Последний этап — озвучивание ответа — реализуется с помощью технологии Text-to-speech. Основой служат записанные в студии 260 тысяч слов и фраз, которые затем были «порезаны» на фонемы.
Из этой аудиобазы нейросеть собирает ответ, после чего интонационные перепады в готовой фразе сглаживаются нейросетью, что приближает речь «Алисы» к человеческой [11] [12] [15]. Навыки Помимо сервисов Яндекса, в Алису могут быть интегрированы сторонние сервисы. В 2018 году компания расширила возможности Алисы через систему навыков, использующих платформу голосового помощника для взаимодействия с пользователем. Навыки — это чат-боты и другие интернет-сервисы, активирующиеся по ключевой фразе и работающие в интерфейсе «Алисы». В марте 2018 Яндекс открыл для сторонних разработчиков платформу Яндекс. Диалоги , предназначенную для публикации новых навыков и их подключения к Алисе.
Уже к апрелю 2018 года на платформе Яндекс. Диалогов были опубликованы более 3 тысяч навыков, более 100 прошли модерацию [17]. Благодаря навыкам Алису обучили работе диктором: голосовая помощница Яндекса приняла участие в апрельской акции по проверке грамотности « Тотальный диктант » и прочитала диктант в Новосибирском государственном университете [18]. В конце мая на Yet Another Conference 2018 Яндекс сообщил, что благодаря навыкам Алиса научилась понимать, что изображено на фотографии, и распознает марку машины, породу кошки или собаки, незнакомое здание или памятник, способна назвать знаменитость или произведение искусства.
В её рамках компания планировала ежемесячно награждать авторов лучших навыков и до конца года выплатить более миллиона рублей [21]. По данным компании, с марта по ноябрь 2018 года разработчики создали 33 тысячи навыков [12]. В начале ноября Яндекс дал возможность авторам навыков выбирать голос Алисы для озвучивания сообщений, добавив четыре новых варианта: Джейн, Эрмила, Захара и Эркана Явас [22]. В августе 2019 года Tele2 совместно с Яндекс запустила навык для Алисы, позволяющий абонентам любых операторов бесплатно найти потерянный дома или в офисе телефон. Пользователь может воспользоваться голосовой командой «Алиса, попроси Tele2 найти мой телефон» на любом гаджете, где есть Алиса, и Tele2 позвонит на номер, привязанный к устройству [23] [24]. Устройства с «Алисой» В середине апреля 2018 года газета « Коммерсантъ » опубликовала статью о находящейся в разработке аппаратной платформе Yandex. Список производителей, с которыми велись переговоры, компания не раскрывала [17]. Первой аппаратной разработкой на базе Yandex. Станция , которую компания представила в конце мая на конференции Yet another Conference 2018 в Москве [25]. В колонку встроено пять динамиков совокупной мощностью 50 Вт и семь микрофонов. Яндекс установил цену на «Станцию» в 9990 рублей [26]. В августе 2018 производитель носимой электроники Elari выпустил детские «умные» часы Elari KidPhone 3G со встроенной «Алисой». Часы стали первым устройством со встроенным голосовым помощником Яндекса, выпущенным сторонней компанией [27]. От Яндекс. Станции за 9990 рублей колонки отличаются втрое меньшей ценой 3290 рублей , менее мощным звуком у Irbis A только один динамик мощностью 2 Вт и два микрофона и меньшими размерами [26]. В его интерфейсе Алиса заняла центральное место. Её информер на главном экране может показывать информацию о погоде, пробках и т. Голосовой помощник может ответить на запрос и при заблокированном экране телефона [28]. Станцию Мини. Станции за 9990 рублей колонка отличалась меньшей ценой 3990 рублей , а также с ней можно взаимодействовать с помощью жестов [29]. Портативная модель защищена от воды и работает до восьми часов без подзарядки. С помощью док-станции её можно сделать стационарной [30]. Станция Макс». Она сохранила корпус предыдущей модели, получила LED-экран, трехполосный звук совокупной мощностью 65 Вт и поддерживает видео в 4k [31]. Станцию Лайт.
Утреннее шоу Алисы теперь можно настроить на свой вкус
Кроме того, в голосовом помощнике появились новости радиостанций. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей. Она читает новости, ставит людям музыку и развлекает историями на разные темы — почти как настоящий диджей. Чтобы она включала наиболее подходящий контент, нужно указать свои предпочтения в настройках. Сейчас в голосовом помощнике доступны 11 новостных тематик и 21 рубрика для подкастов.
Буквально на 20 примерах можно выучить классификатор для нового омографа, чтобы по эмбеддингу перевода понимать, какую форму нужно произнести. Летом 2020 года допилили паузер для расстановки пауз внутри предложения. Язык — хитрая штука.
Не все знаки препинания в речи выражаются паузами Например, после вводного слова «конечно» на письме мы ставим запятую, но в речи обычно не делаем паузу. А там, где знаков препинания нет, мы часто делаем паузы. Если эту информацию не передавать в акустическую модель, то она пытается её выводить и не всегда успешно. Первая модель Алисы из-за этого могла начать вздыхать в случайных местах длинного предложения. Для этого мы взяли датасет, разметили его детектором активности голоса, сгруппировали паузы по длительности, ввели класс длины паузы, на каждое слово навесили тэг и на этом корпусе обучили ещё одну голову внимания из тех же нейросетевых эмбеддингов, что использовались для детекции омографов. Осенью 2020 года мы перевели на трансформеры нормализацию — в синтезе она нужна, чтобы решать сложные случаи, когда символы читаются не «буквально», а по неким правилам. Например, «101» нужно читать не как «один-ноль-один», а как «сто один», а в адресе yandex.
Обычно нормализацию делают через комбинацию взвешенных трансдьюсеров FST — правила напоминают последовательность замен по регулярным выражениям, где выбирается замена, имеющая наибольший вес. Мы долго писали правила вручную, но это отнимало много сил, было очень сложно и не масштабируемо. Тогда решили перейти на трансформерную сеть, «задистиллировав» знания наших FST в нейронку. Теперь новые «правила раскрытия» можно добавлять через доливание синтетики и данных, размеченных пользователями Толоки, а сеть показывает лучшее качество, чем FST, потому что учитывает глобальный контекст. Итак, мы научили Алису говорить с правильными интонациями, но это не сделало ее человеком — ведь в нашей речи есть еще стиль и эмоции. Работа продолжалась. С чувством, толком, расстановкой: стили голоса Алисы Один и тот же текст можно произнести десятком разных способов, при этом сам исходный текст, как правило, никаких подсказок не содержит.
Если отправить такой текст в акустическую модель без дополнительных меток и обучить её на достаточно богатом различными стилями и интонациями корпусе, то модель сойдёт с ума — либо переусреднит всё к металлическому «голосу робота», либо начнёт генерировать случайный стиль на каждое предложение. Это и произошло с Алисой: в начале она воспроизводила рандомные стили в разговоре. Казалось, что у неё менялось настроение в каждом предложении. Вот пример записи с явными перебоями в стилях: Чтобы решить проблему, мы добавили в акустическую модель стили: в процессе обучения нейросети специально ввели «утечку». Суть в том, что через очень lossy-пространство всего 16 чисел на всё предложение разрешаем сетке посмотреть на ответ — истинную мел-спектрограмму, которую ей и нужно предсказать на обучении. За счёт такой «шпаргалки» сеть не пытается выдумывать непредсказуемую по тексту компоненту, а для другой информации не хватит размерности шпаргалки. На инференсе мы генерируем стилевую подсказку, похожую на те, что были в обучающем сете.
Это можно делать, взяв готовый стиль из обучающего примера или обучив специальную подсеть генерировать стили по тексту. Если эту подсеть обучить на особом подмножестве примеров, можно получить специальные стили для, скажем, мягкого или дружелюбного голоса. Или резкого и холодного. Или относительно нейтрального. Чтобы определиться со стилем по умолчанию, мы устроили турнир, где судьями выступали пользователи Толоки. Там не было разметки, мы просто нашли кластеры стилей и провели между ними соревнование. Победил кластер с очень мягкой и приятной интонацией.
Дальше началось самое интересное. Мы взяли образцы синтезированной «мягкой» речи Алисы и фрагменты речи актрисы Татьяны Шитовой, которые относились к более резкому стилю. Затем эти образцы с одним и тем же текстом протестировали вслепую на толокерах. Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. В принципе, этого можно было ожидать: уверен, многие предпочтут более ласковый разговор по телефону то есть с потерей в качестве живому, но холодному общению. К примеру, так звучал резкий голос: А так — мягкий: Результаты турниров позволили нам выделить во всем обучающем датасете данные, которые относятся к стилю-победителю, и использовать для обучения только их. Благодаря этому Алиса по умолчанию стала говорить более мягким и дружелюбным голосом.
Этот пример показывает, что с точки зрения восприятия важно работать не только над качеством синтеза, но и над стилем речи. После этого оставалось только обогатить Алису новыми эмоциями. Бодрая или спокойная: управляем эмоциями Алисы Когда вы включаете утреннее шоу Алисы или запускаете автоматический перевод лекции на YouTube, то слышите разные голоса — бодрый в первом случае и более флегматичный в другом. Эту разницу сложно описать словами, но она интуитивно понятна — люди хорошо умеют распознавать эмоции и произносить один и тот же текст с разной эмоциональной окраской. Мы обучили этому навыку Алису с помощью той же разметки подсказок, которую применили для стилей. У языка есть интересное свойство — просодия , или набор элементов, которые не выражаются словами. Это особенности произношения, интенсивность, придыхание и так далее.
Один текст можно произнести со множеством смыслов. Как и в случае со стилями речи, можно, например, выделить кластеры «веселая Алиса», «злая Алиса» и так далее. Поскольку стилевой механизм отделяет просодию «как говорим» от артикуляции «что говорим» , то новую эмоцию можно получить буквально из пары часов данных. По сути, нейросети нужно только выучить стиль, а информацию о том, как читать сочетания фонем, она возьмёт из остального корпуса. Прямо сейчас доступны три эмоции. Например, часть пользователей утреннего шоу Алисы слышат бодрую эмоцию. Кроме того, её можно услышать, спросив Алису «Кем ты работаешь?
Флегматичная эмоция пригодилась для перевода видео — оказалось, что голос по умолчанию слишком игривый для этой задачи. Наконец, радостная эмоция нужна для ответов Алисы на специфические запросы вроде «Давай дружить» и «Орёл или решка? Ещё есть негативная эмоция, которую пока не знаем, как использовать — сложно представить ситуацию, когда людям понравится, что на них ругается робот. Первый корпус эмоций мы записали ещё при WaveGlow, но результат нас не устроил и выкатывать его не стали. С переходом на HiFi-GAN стало понятно, что он хорошо работает с эмоциями, это позволило запустить полноценный эмоциональный синтез.
Это не умный дом. Я называю это - удобным домом. В данный опыт инвестировал 41100 руб. Когда только начал изучать как у других устроены умные дома увидел на ютубе множество подобных решений от 200000 руб. Никогда не думал, что в этой квартире буду делать умный дом. Следовательно: у меня не было нулей в выключателях, квадратных подрозетников и т. Да и сейчас нет. Вступление Всем привет. Сразу после анонса и просмотра множества рекламных видео - я купил Яндекс Станцию 2 подарок на день рождения После покупки принял решение, что надо начать делать удобный умный дом на экосистеме "Умный Дом Яндекса". Почему я выбрал Яндекс Станцию 2 Я насмотрелся множества рекламы. Но это оказалось не так.. Как только вы открываете дверь - срабатывает датчик открытия входной двери, включается свет в коридоре. Дополнительно в коридоре установлена умная кнопка, нажимаете один раз - включается свет на кухне, это помогает сразу занести пакеты с продуктами. В коридоре дополнительно висит датчик движения - если нет движения, то через некоторое время свет в коридоре выключится. Вы прошли на кухню, разгружаете пакеты с продуктами - стало жарко. Вы голосом попросили Алису Яндекс Станцию Мини которая расположена на кухне включить кондиционер. Она запускает кондиционер. Вы также могли этого избежать - если бы заранее установили сценарий температура в комнате выше 26, включается кондиционер на 20 минут. После того как вы расставили продукты по местам - время принять душ. Был тяжелый день, пришло время немного расслабиться. Вы заходите в ванную комнату, свет включился самостоятельно. Попросили Алису Яндекс Станцию Мини которая расположена в ванной включить музыку. Пока моетесь Вы заметили, что в ванной повысилась влажность и вентиляционная вытяжка в ванной заработала. Время отдыха и чиллить. Куранты на Яндекс Станциях пробили 11 часов. Голосовым управлением запустили телевизор я обычно включаю когда нахожусь на кухне и собираюсь спать и включаю китайскую светодиодную ленту. Пока телевизор запускается - можно пошарить экранчики с графиками. Время просмотра фильмов, но экран слишком яркий? Голосовым управлением или с помощью телефона запустился сценарий "яркость для ночного режима". День закончился, голосом или возможно установленной кнопкой возле кровати - вы выключили все в квартире. Вам снятся электроовцы. Наступил следующий день. Вас разбудил будильник установленный заранее на Яндекс Станции. Можно поставить и какую-то определенную музыку для пробуждения. Не хватает здесь настройки будильников через приложение Умный Дом Яндекса. Кажется, мы уже проснулись? Вы говорите "Алиса, доброе утро" Яндекс Станции 2. Она вас также приветствует, и под музыку начинается новый день. Зачитывает новости моего маленького города. Здесь не хватает автоматизации для открытия штор и заварки кофе - но и этого хватит.
По событиюСценарий запускается при срабатывании определенного датчика или устройства. Например, «Включить свет в коридоре, если датчик движения обнаружит движение». По уведомлениюСценарий запускается, если на телефон пользователя приходит уведомление от системы. Например, «Включить камеру, если на датчик движения поступил сигнал». По звукуСценарий запускается, если система распознает определенный звук. Например, «Включить музыку, если в доме слышен плач ребенка». Ранее мы рассказывали: Как усилить Wi-Fi сигнал в квартире или доме? Примеры интересных сценариев для голосового помощника Алисы Интересные сценарии для Алисы могут быть разными. Важно, чтобы у пользователя были необходимые приборы, которые могут быть задействованы в выполнении сценария. Вы не сможете настроить включение света в определенной комнате, если у вас не установлены лампы, которые подключены к системе умного дома. Вы также не сможете регулировать уровень освещения, если лампы не позволяют это делать.
Алиса запустила утреннее шоу с персональными рекомендациями
— Выбирайте, что и в каком порядке слушать в Утреннем шоу Алисы: подкасты на избранные темы, прогноз погоды, навыки, треки или новости из определённых источников. Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Теперь голосовой помощник может запускать новостные блоки с девяти станций, включая «Хит ФМ» и «Коммерсантъ FM». Утренние шоу впервые появились в апреле этого года. О сервисе Прессе Авторские права Связаться с нами Авторам Рекламодателям Разработчикам. Умные колонки с голосовым помощником "Алиса" научились проводить утренние шоу, которые подбираются под конкретных пользователей. «Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении».
Голосовой помощник Алиса начала вести свое утреннее шоу
«Утреннее шоу» — это развлекательная программа с «Алисой» в роли ведущей. Виртуальный помощник читает новости, включает музыку и зачитывает истории на разные темы. Шоу и новости доступны в «и», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса». Умная лампочка Яндекс с Алисой, цоколь E27, белая (YNDX-00501). «Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении».
Вышло большое обновление Алисы. Смотри, что теперь умеет твоя Яндекс Станция
Утреннее шоу от Алисы на Яндекс Станции: как включить и настроить | первый шаг в этом направлении". |
Команды и сценарии для Алисы: покоряем умного помощника | Кроме того, в голосовом помощнике появились новости радиостанций. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей. |
Утреннее шоу Алисы теперь можно настроить на свой вкус | Шоу и новости доступны в «и», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса». |
Голосовой помощник Алиса начала вести свое утреннее шоу - Российская газета | Друзья Алисы и пользователи сервисов Яндекса, общаясь с Алисой, смогут узнавать актуальные новости из мира мотоциклов. |
Утреннее шоу от Алисы на Яндекс Станции | Обновление Алисы также включает в себя улучшенное утреннее шоу: теперь там не только новости и музыка, но и короткие подкасты, даты в истории, мудрости и комплименты. |
Новые функции «Алисы» и «Яндекс Станций» за апрель 2024 года
Утреннее шоу Алисы поможет настроиться на день и не забыть о важном. Алиса расскажет о погоде, представит персональную подборку новостей, включит короткий подкаст, специально подобранный трек или плейлист. «Алиса» научилась персонализировать «Утреннее шоу». Настройка частоты получения новостей позволит вам сделать использование навыка Алисы более удобным и эффективным, подстроив его под ваш ритм жизни. «Алиса» научилась персонализировать «Утреннее шоу». Как настроить новости на Яндекс Алисе: шаг за шагом. Настройка новостей в Яндекс Алисе позволяет получать свежие новости по интересующим вас темам. «Алиса» научилась персонализировать «Утреннее шоу» и включать новости радиостанций Вслед за появлением интерактивных рецептов голосовой помощник «Алиса». Как настроить новости Яндекс Алиса. «Алиса» научилась персонализировать «Утреннее шоу». «Яндекс» представил апрельское обновление «Алисы» и своих умных устройств.
Читает ли Алиса последние новости? Настраиваем её на телефоне и на компьютере
Это можно делать, взяв готовый стиль из обучающего примера или обучив специальную подсеть генерировать стили по тексту. Если эту подсеть обучить на особом подмножестве примеров, можно получить специальные стили для, скажем, мягкого или дружелюбного голоса. Или резкого и холодного. Или относительно нейтрального. Чтобы определиться со стилем по умолчанию, мы устроили турнир, где судьями выступали пользователи Толоки. Там не было разметки, мы просто нашли кластеры стилей и провели между ними соревнование. Победил кластер с очень мягкой и приятной интонацией. Дальше началось самое интересное. Мы взяли образцы синтезированной «мягкой» речи Алисы и фрагменты речи актрисы Татьяны Шитовой, которые относились к более резкому стилю.
Затем эти образцы с одним и тем же текстом протестировали вслепую на толокерах. Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. В принципе, этого можно было ожидать: уверен, многие предпочтут более ласковый разговор по телефону то есть с потерей в качестве живому, но холодному общению. К примеру, так звучал резкий голос: А так — мягкий: Результаты турниров позволили нам выделить во всем обучающем датасете данные, которые относятся к стилю-победителю, и использовать для обучения только их. Благодаря этому Алиса по умолчанию стала говорить более мягким и дружелюбным голосом. Этот пример показывает, что с точки зрения восприятия важно работать не только над качеством синтеза, но и над стилем речи. После этого оставалось только обогатить Алису новыми эмоциями. Бодрая или спокойная: управляем эмоциями Алисы Когда вы включаете утреннее шоу Алисы или запускаете автоматический перевод лекции на YouTube, то слышите разные голоса — бодрый в первом случае и более флегматичный в другом.
Эту разницу сложно описать словами, но она интуитивно понятна — люди хорошо умеют распознавать эмоции и произносить один и тот же текст с разной эмоциональной окраской. Мы обучили этому навыку Алису с помощью той же разметки подсказок, которую применили для стилей. У языка есть интересное свойство — просодия , или набор элементов, которые не выражаются словами. Это особенности произношения, интенсивность, придыхание и так далее. Один текст можно произнести со множеством смыслов. Как и в случае со стилями речи, можно, например, выделить кластеры «веселая Алиса», «злая Алиса» и так далее. Поскольку стилевой механизм отделяет просодию «как говорим» от артикуляции «что говорим» , то новую эмоцию можно получить буквально из пары часов данных. По сути, нейросети нужно только выучить стиль, а информацию о том, как читать сочетания фонем, она возьмёт из остального корпуса.
Прямо сейчас доступны три эмоции. Например, часть пользователей утреннего шоу Алисы слышат бодрую эмоцию. Кроме того, её можно услышать, спросив Алису «Кем ты работаешь? Флегматичная эмоция пригодилась для перевода видео — оказалось, что голос по умолчанию слишком игривый для этой задачи. Наконец, радостная эмоция нужна для ответов Алисы на специфические запросы вроде «Давай дружить» и «Орёл или решка? Ещё есть негативная эмоция, которую пока не знаем, как использовать — сложно представить ситуацию, когда людям понравится, что на них ругается робот. Первый корпус эмоций мы записали ещё при WaveGlow, но результат нас не устроил и выкатывать его не стали. С переходом на HiFi-GAN стало понятно, что он хорошо работает с эмоциями, это позволило запустить полноценный эмоциональный синтез.
Наконец, мы решили внедрить шёпот. Когда люди обращаются к Алисе шёпотом, она должна и отвечать шёпотом — это делает её человечнее. При этом шёпот — не просто тихая речь, там слова произносятся без использования голосовых связок. Спектр звука получается совсем другим. С одной стороны, это упрощает детекцию шёпота: по «картинке» мел-спектрограммы можно понять, где заканчивается обычная речь и начинается шепот. С другой стороны, это усложняет синтез шёпота: привычные механизмы обработки и подготовки речи перестают работать. Поэтому шёпотный синтез нельзя получить детерминированным преобразованием сигнала из речи. Так выглядят мел-спектрограммы обычной речи и шёпота при произнесении одной и той же фразы: Так звучит обычная речь: А так — шёпот: Сначала мы научили Алису понимать шёпот.
Для этого обучили нейросеть различать спектры звука для обычного голоса и шёпота. Система смотрит на спектр звука и решает, когда говорят шёпотом, а когда — голосом. В процессе обучения оказалось, что спектры шёпота и речи курильщиков похожи, так что пришлось научить нейросеть их различать. Для этого собрали больше пограничных данных с речью курильщиков и простуженных людей и донастроили нейросеть на них. Чтобы научить Алису говорить шёпотом, мы записали несколько часов шёпота речи в исполнении Татьяны Шитовой. Сложности начались уже на предобработке данных: наш VAD детектор тишины в речи сломался на шёпотных гласных — трудно отличить сказанное шёпотом «а! Починить его удалось, только совместив признаки энергии сигнала и данные от распознавания речи, при этом под шёпот конструкцию пришлось калибровать отдельно. Затем записанные данные добавили в обучающий корпус акустической модели.
Мы решили рассматривать шёпот как еще один «стиль» речи или, в терминах нашего синтеза, «эмоцию». Добавив данные в трейнсет, мы дали акустической модели на вход дополнительную информацию — шёпот или эмоцию она сейчас проигрывает. По этому входу модель научилась по команде пользователя переключаться между генерацией речи и шёпота. Сгенерированный шёпот по качеству не отличался от обычной речи. Оказалось, что ряд ошибок интонации в шёпотной речи были значительно менее ярко выражены. Этот голос будет полезен при общении с Алисой ночью, чтобы не мешать близким. Можно задавать вопросы тихим голосом и Алиса будет отвечать шёпотом. Кроме того, такой стиль ещё и звучит очень приятно — поклонники ASMR оценят.
Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Утренние шоу впервые появились в апреле этого года. Пользователи могут сказать «Алисе» соответствующую голосовую команду, и она будет подбирать новостные сводки, прогноз погоды, музыку и подкасты, основываясь на их предпочтениях.
Расширенные возможности видео Видео, найденные через поиск, теперь можно сразу же воспроизводить на «ТВ Станции».
Управление воспроизведением осуществляется голосом, что включает команды паузы, перемотки и выбора качества видео. Пользователи могут использовать команды, такие как: «Алиса, включи шоу» — для начала воспроизведения выбранного видео. Персонализация «Утреннего шоу» Пользователи могут настраивать порядок и тип контента, который будет воспроизводиться в «Утреннем шоу». Афиша мероприятий на главном экране «Станция Дуо Макс» научилась отображать анонсы мероприятий, проходящих в городе пользователя.
Радионяня для каждого Режим радионяни на «Яндекс Станции» теперь доступен для каждого члена семьи.
Точнее, навык «Говорящая почта». Это удобный способ отправить сообщение в прямом смысле без рук. Для этого скажите колонке «Алиса, запусти навык Говорящая почта»: запомните свой идентификатор и отправляйте сообщение другому пользователю. Послушать войс можно на смартфоне, компьютере или колонке. Еще вы можете познакомиться с кем-либо, отправив голосовое сообщение на специальный номер — об этом Алиса подробно рассказывает при запуске навыка. Куда жаловаться на управляющую компанию Пожаловаться на работу местных служб можно с помощью Яндекс.
Станции То, что у Алисы есть навык, позволяющий пожаловаться на социально-бытовые проблемы — настоящее открытие для меня. Запустите навык «Инцидент менеджмент» и далее следуйте инструкциям. Алиса направит жалобу на дороги, благоустройство или здравоохранение в местный орган власти, отвечающий за ее решение. Как посчитать калории для себя Не знаете, сколько калорий в пище? Скажите Алисе: она посчитает все за вас и даже подскажет меню на следующий день Яндекс. Станция — хороший помощник для тех, кто следит за своей фигурой. Скажите Алисе «Попроси умный счетчик калорий записать» и уточните блюдо.
В ответ ассистент вам расскажет о содержании белков, жиров и углеводов в пище. Если фиксировать с помощью Алисы съеденное за день, то вечером она сообщит, сколько калорий вы употребили за день и даже рассчитает меню на следующий день.
Читает ли Алиса последние новости? Настраиваем её на телефоне и на компьютере
Новости — подборка навыков Алисы, голосового помощника от Яндекса. | Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Утренние шоу впервые появились в апреле этого года. |
Что нового в апреле у Алисы и умных устройств | В конце 2020 года утреннее шоу Алисы стало персонализированным. Какие новости нужно выбирать, чтобы быть в курсе последних событий, но не утомляться излишним потоком информации? |