Поисковая алиса. Как тупит «Алиса»: обзор голосового помощника от «Яндекс

Яндекс Алиса – виртуальный голосовой помощник, созданный российскими разработчиками. Приложения такого типа предназначены для анализа команд пользователя с целью дальнейшего выполнения требуемого задания. Например, фразой «включи музыку» можно активировать Яндекс мелодии, не совершая при этом никаких действий со смартфоном. Скачать Алиса Яндекс на компьютер можно на нашем сайте.

Описание:

Технологии, позволяющие выполнять дистанционные команды пользователей, далеки от совершенства. Примером может служить известный голосовой помощник Siri, который адаптирован и к условиям функционирования с русскоговорящими пользователями.

Алиса – это результат деятельности российской команды Яндекс. Ресурс позиционируется в России, что позволяет поддерживать русский язык в приложении с учетом потребностей пользователей. Голос помощника имеет ярко выраженный оттенок искусственного интеллекта. Озвучивание речи Алисы осуществляет Татьяна Шитова, которая ранее «говорила» голосом компьютера в известном фильме «Она».

Особенности:

Ключевое отличие помощника от компании Яндекс состоит в том, что Алиса не только распознает речь, строит логические фразы, выражения и предложения, но и пытается их интерпретировать. В этом смысле у виртуального интеллекта нет аналогов. Если человек сделал запрос, а затем начал развивать тему в соответствующем контексте (уточняющие детали), то с вероятностью 80% Алиса поймет, о чем говорит пользователь и предложит адекватное решение проблемы. Скачать Алиса Яндекс на ПК можно с нашего портала.

В плане распознавания речи Алиса на порядок совершеннее своих аналогов. Ошибки встречаются, однако они связаны с неточностью языка или ярко выраженным диалектом. Создатели персональной Алисы сделали акцент на адаптивность своей разработки. В первую очередь Алиса по запросу «включить песню» откроет меню «Яндекс музыки». Если необходимо перевести какую любо фразу, то первая открытая ссылка – это «Яндекс. Переводчик». Алису можно устанавливать и на платформы iOS, Андройд. Однако в этом случае стабильность работы не гарантируется. Проблемы могут быть вызваны подачей команды «открыть будильник» или «сохранить заметку». В таких случаях реакции может не последовать.

Разработчики утверждают, что виртуальный помощник может легко открывать приложения, которые уже установлены пользователей. Проблем не возникает с командой «открыть ВКонтакте». Скачать голосовой помощник Яндекс Алиса можно с нашего сайта. Однако при активации функции «открыть Viber» Алиса направляет пользователя на сайт, а не производит запуск.


Плюсы и минусы:

Основные преимущества:

  • Интеграция с сервисами Яндекс. Всегда можно за считанные секунды запустить музыку, видео или перевести текст, воспользовавшись соответствующими командами.
  • Адаптация к русскому языку. Речь помощник понимает с полуслова. Команды открываются быстро. Как и у любого другого искусственного интеллекта есть ошибки, но они не носят критического характера.

Недостатки:

Что касается недостатков, то они представлены:

  • Сложностью в запуске ряда стандартных программ. Например, нельзя быть точно уверенным, что программ откроет «калькулятор» или «заведет будильник» на указанное человеком время.
  • Низкий уровень взаимодействия с иными платформами (Андройд, iOS).


Как установить Яндекс Алиса на ПК или ноутбук?

Для этого необходимо выполнить ряд действий:

  1. Скачать программное обеспечение. Bluestacks позволяет работать с программами, которые доступны на операционной системе Andoriod, устанавливая их на ПК.
  2. Пользователю предлагается авторизоваться или зарегистрироваться в системе.
  3. После запуска в поисковой строке эмуляторе вводится запрос: «скачать Алиса Яндекс для Windows».
  4. Протестировать возможности виртуального интеллекта можно, активировав ярлык на рабочем столе.


  • Siri. Этот голосовой помощник интегрирован в устройства, функционирующие на операционной системе iOS. Особенность состоит в том, что в данном случае наблюдается глубокая интеграция с функционалом ОС. Активировать искусственный интеллект можно даже в случае, если смартфон заблокирован. Работа с командами пользователя осуществляется мгновенно.
  • Дуся. Мобильный помощник, который позволяет выполнить множество команд пользователя. Ключевое отличие этой системы от Siri или Алисы состоит в том, что программа запускается в фоновом режиме. Она не занимает место на экране, а активируется «встряхиванием», «голосом», а также рядом других способов. Это не чат-бот, который будет общаться с пользователем. Разработчики позиционируют свой проект с точки зрения эффективного помощника, который сможет набрать номер из записной книжки, отправить текстовое сообщение, произвести поиск музыки из социальных сетей.

Итоги и комментарии:

Яндекс Алиса – виртуальный помощник, который позволяет упростить процедуру работы с операционной системой. Многие команды пользователя Алиса выполнит мгновенно. Иногда необходимо подождать или уточнить запрос. Программа отлично понимает русскую речь, позволяет запускать уже установленные пользователей приложения и игры. Скачать Алиса Яндекс на компьютер можно с нашего портала.


Обладатели новой версии «Яндекс», предназначенной для пользователей Андроид, получают расширенный функционал. Голосовой помощник получил название «Алиса», он способен выполнять огромное количество полезных задач: сообщит о температуре воздуха в текущий момент, поможет найти подходящее развлекательное заведение, а также проложит маршрут к нему, ответит на интересующие вопросы, используя поиск в сети – и это далеко не полный список доступных задач.

Чтобы задать вопрос или же воспользоваться помощью «Алисы», нужно воспользоваться диалоговым окном, введя необходимые команды. Более того, пользователь может похвалить своего виртуального помощника – и Яндекс-помощник обязательно поблагодарит владельца за это.

Нынешняя версия системы еще нуждается в некоторой доработке, так как её возможности сильно ограничены. Но в режиме «Вопрос-ответ» она работает прекрасно – потребовав данные о работе выбранного заведения, пользователь тут же получит необходимые сведения. Даже если «Алиса» не знает точного ответа, она найдет нужные данные в Интернете. При необходимости также могут быть открыты и сторонние приложения, которые помогут найти ответ на заданный вопрос.

В некоторых тематиках «Алиса» сможет «понимать» о чем идет речь. Например, задав вопрос о погоде, можно в дальнейшем использовать различные уточнения, чтобы получить более подробную информацию. Но эта возможность доступна далеко не для всех тематик.

Разработчики позаботились и о том, чтобы «оживить» виртуального помощника, сделав прекрасную альтернативу популярным Siri и Google Assistant. «Алиса» тоже готова пошутить, и даже может процитировать популярные композиции, если попросить её спеть песню.


Пока запущена только тестовая версия, поэтому допустимы ошибки. Некоторые слова Яндекс-помощник произносит с ошибками, озвучивая их именно так, как они напечатаны. Некоторые предложения «Алиса» читает слишком серьезно, что тоже далеко не всегда уместно. Но это тестовый вариант, поэтому недочеты вполне простительны.

На текущий момент тестируют и новый интерфейс. Обо всех изменениях и нововведениях будет известно после завершения этой процедуры. Согласно обещаниям разработчиков, новая версия виртуального помощника от Яндекса будет представлена миру и доступна пользователям уже в нынешнем году.


Сегодня, 10.10.17 вышла в свет бета-версия Яндекс-Алиса для компьютеров на ОС Windows! Скачать помощника Алису для Виндоус лучше и безопаснее всего можно на сервисе Yandex, вот Вам самая безопасная
  • Машинное обучение ,
  • Поисковые технологии ,
  • Разработка мобильных приложений
  • В будущем, как нам кажется, люди будут взаимодействовать с устройствами с помощью голоса. Уже сейчас приложения распознают точные голосовые команды, заложенные в них разработчиками, но с развитием технологий искусственного интеллекта они научатся понимать смысл произвольных фраз и даже поддерживать разговор на любые темы. Сегодня мы расскажем читателям Хабра о том, как мы приближаем это будущее на примере Алисы – первого голосового помощника, который не ограничивается набором заранее заданных ответов и использует для общения нейронные сети.

    Несмотря на кажущуюся простоту, голосовой помощник – один из самых масштабных технологических проектов Яндекса. Из этого поста вы узнаете, с какими сложностями сталкиваются разработчики голосовых интерфейсов, кто на самом деле пишет ответы для виртуальных помощников, и что общего у Алисы с искусственным интеллектом из фильма «Она».

    На заре своего существования компьютеры в основном применялись на крупных научных или оборонных предприятиях. Про голосовое управление тогда размышляли лишь фантасты, а в реальности операторы загружали программы и данные с помощью куска картона. Не самый удобный способ: одна ошибка, и все нужно начинать сначала.

    С годами компьютеры становятся доступнее и начинают применяться в компаниях поменьше. Специалисты управляют ими с помощью текстовых команд, вводимых в терминале. Хороший, надежный способ – он применяется в профессиональной среде и по сей день, но требует подготовки. Поэтому когда компьютеры стали появляться в домах обычных пользователей, инженеры принялись искать более простые способы взаимодействия машины и человека.

    В лаборатории компании Xerox зарождается концепция графического интерфейса WIMP (Windows, Icons, Menus, Point-n-Click) – массовое применение она нашла в продуктах уже других компаний. Заучивать текстовые команды для управления домашним компьютером больше не требовалось - им на смену пришли жесты и клики мышью. Для своего времени это было настоящей революцией. И теперь мир приближается к следующей.

    Теперь почти у каждого в кармане лежит смартфон, вычислительных мощностей которого достаточно, чтобы посадить корабль на Луну. Мышь и клавиатуру заменили пальцы, но ими мы совершаем все те же жесты и клики. Это удобно делать, сидя на диване, но не в дороге или на ходу. В прошлом для взаимодействия с компьютерными интерфейсами человеку приходилось осваивать язык машин. Мы верим, что сейчас пришло время научить устройства и приложения общаться на языке людей. Именно эта идея легла в основу голосового помощника Алиса.

    У Алисы можно спросить [Где поблизости выпить кофе?], а не диктовать что-то вроде [кофейня улица космонавтов]. Алиса заглянет в Яндекс и предложит подходящее место, а на вопрос [Отлично, а как туда пройти?] - даст ссылку на уже построенный маршрут в Яндекс.Картах. Она умеет отличать точные фактовые вопросы от желания увидеть классическую поисковую выдачу, хамство – от вежливой просьбы, команду открыть сайт – от желания просто поболтать.

    Может даже показаться, что где-то в облаке работает нейронная чудо-сеть, которая в одиночку решает любые задачи. Но в реальности за любым ответом Алисы скрывается целая цепочка технологических задач, решать которые мы учимся уже 5 лет. И начнем мы свой экскурс с самого первого звена – со способности слушать.

    Привет, Алиса

    Искусственный интеллект из научной фантастики умеет слушать – людям не приходится нажимать на специальные кнопки, чтобы включить «режим записи». А для этого нужна голосовая активация – приложение должно понимать, что человек к нему обращается. Сделать это не так легко, как может показаться.

    Если вы просто начнете записывать и обрабатывать на сервере весь входящий звуковой поток, то очень быстро разрядите батарейку устройства и потратите весь мобильный трафик. В нашем случае это решается с помощью специальной нейронной сети, которая обучена исключительно на распознавание ключевых фраз («Привет, Алиса», «Слушай, Яндекс» и некоторых других). Поддержка ограниченного числа таких фраз позволяет выполнять эту работу локально и без обращения к серверу.

    Если сеть обучается понимать лишь несколько фраз, вы могли бы подумать, что сделать это достаточно просто и быстро. Но нет. Люди произносят фразы далеко не в идеальных условиях, а в окружении совершенно непредсказуемого шума. Да и голоса у всех разные. Поэтому для понимания лишь одной фразы необходимы тысячи обучающих записей.

    Даже небольшая локальная нейронная сеть потребляет ресурсы: нельзя просто взять и начать обрабатывать весь поток с микрофона. Поэтому на передовой применяется менее тяжеловесный алгоритм, который дешево и быстро распознает событие «началась речь». Именно он включает нейросетевой движок распознавания ключевых фраз, который в свою очередь запускает самую тяжелую часть – распознавание речи.

    Если для обучения лишь одной фразе необходимы тысячи примеров, то вы можете себе представить, насколько трудоемко обучить нейросеть распознаванию любых слов и фраз. По этой же причине распознавание выполняется в облаке, куда передается звуковой поток, и откуда возвращаются уже готовые ответы. Точность ответов напрямую зависит от качества распознавания. Именно поэтому главный вызов – научиться распознавать речь настолько же качественно, насколько это делает человек. Кстати, люди тоже совершают ошибки. Считается, что человек распознает 96-98% речи (метрика WER). Нам удалось добиться точности в 89-95%, что уже не только сопоставимо с уровнем живого собеседника, но и уникально для русского языка.

    Но даже идеально преобразованная в текст речь ничего не будет значить, если мы не сможем понять смысл сказанного.

    Какая погода завтра в Питере?

    Если вы хотите, чтобы ваше приложение выводило прогноз погоды в ответ на голосовой запрос [погода], то здесь все просто – сравниваете распознанный текст со словом «погода» и если получаете совпадение, выводите ответ. И это очень примитивный способ взаимодействия, потому что в реальной жизни люди задают вопросы иначе. Человек может спросить у помощника [Какая погода завтра в Питере?], и тот не должен растеряться.

    Первое, что делает Алиса при получении вопроса, это распознает сценарий. Отправить запрос в поиск и показать классическую выдачу с 10 результатами? Поискать один точный ответ и сразу выдать его пользователю? Совершить действие, например открыть сайт? А, может, просто поговорить? Невероятно сложно научить машину безошибочно распознавать сценарии поведения. И любая ошибка здесь малоприятна. К счастью, у нас есть вся мощь поисковой машины Яндекса, которая каждый день сталкивается с миллионами запросов, ищет миллионы ответов и учится понимать, какие из них хорошие, а какие – нет. Это огромная база знаний, на основе которых можно обучить еще одну нейронную сеть – такую, которая бы с высокой вероятностью «понимала», чего именно хочет человек. Ошибки, конечно же, неизбежны, но их совершают и люди.

    С помощью машинного обучения Алиса «понимает», что фраза [Какая погода завтра в Питере?] – это запрос погоды (кстати, это заведомо простой пример для наглядности). Но о каком городе идет речь? На какую дату? Здесь начинается этап извлечения из пользовательских реплик именованных объектов (Named Entity Recognition). В нашем случае важную информацию несут два таких объекта: «Питер» и «завтра». И Алиса, у которой за плечами стоят поисковые технологии, «понимает», что «Питер» – синоним «Санкт-Петербурга», а «завтра» – «текущая дата + 1».

    Естественный язык – не только внешняя форма наших реплик, но и их связность. В жизни мы не обмениваемся короткими фразами, а ведем диалог – он невозможен, если не помнить контекст. Алиса его помнит – это помогает ей разбираться со сложными лингвистическими явлениями: например, справляться с эллипсисом (восстанавливать пропущенные слова) или разрешать кореференции (определять объект по местоимению). Так, если спросить [Где находится Эльбрус?], а потом уточнить [А какая у него высота?], то помощник в обоих случаях найдет верные ответы. А если после запроса [Какая погода сегодня?] спросить [А завтра?], Алиса поймет, что это продолжение диалога про погоду.

    И кое-что еще. Помощник должен не только понимать естественный язык, но и уметь говорить на нем – как человек, а не как робот. Для Алисы мы синтезируем голос, в оригинале принадлежащий актрисе дубляжа Татьяне Шитовой (официальный голос Скарлетт Йоханссон в России). Она озвучивала искусственный интеллект в фильме «Она» , хотя вы могли запомнить ее и по озвучке чародейки Йеннифэр в «Ведьмаке». Причем речь идет о достаточно глубоком синтезе с применением нейронных сетей, а не о нарезке готовых фраз – записать все их многообразие заранее невозможно.

    Выше мы описали особенности естественного общения (непредсказуемая форма реплик, отсутствующие слова, местоимения, ошибки, шум, голос), с которыми нужно уметь работать. Но у живого общения есть еще одно свойство – мы далеко не всегда требуем от собеседника конкретного ответа или действия, иногда нам просто хочется поговорить. Если приложение будет отправлять такие запросы в поиск, то вся магия разрушится. Именно поэтому популярные голосовые ассистенты используют базу редакторских ответов на популярные фразы и вопросы. Но мы пошли еще дальше.

    А поболтать?

    Мы научили машину отвечать на наши вопросы, вести диалог в контексте определённых сценариев и решать задачи пользователя. Это хорошо, но можно ли сделать ее менее бездушной и наделить человеческими свойствами: дать ей имя, научить рассказывать о себе, поддерживать разговор на свободные темы?

    В индустрии голосовых помощников эта задача решается с помощью редакторских ответов. Специальная команда авторов берет сотни наиболее популярных у пользователей вопросов и пишет по несколько вариантов ответов на каждый. В идеале это нужно делать в едином стиле, чтобы из всех ответов складывалась цельная личность помощника. Для Алисы мы тоже пишем ответы – но у нас есть кое-что еще. Кое-что особенное.

    Помимо топа популярных вопросов существует длинный хвост из низкочастотных или даже уникальных фраз, на которые заранее подготовить ответ невозможно. Вы уже догадались, с помощью чего мы решаем эту проблему, не так ли? С помощью еще одной нейросетевой модели. Для ответов на неизвестные ей вопросы и реплики Алиса использует нейросеть, обученную на огромной базе текстов из интернета, книг и фильмов. Знатоков машинного обучения, возможно, заинтересует то, что начинали мы с 3-слойной нейронной сети, а теперь экспериментируем с огромной 120-слойной. Детали прибережем для специализированных постов, а здесь скажем, что уже текущая версия Алисы старается отвечать на произвольные фразы с помощью «нейросетевой болталки» – так мы ее называем внутри.

    Алиса учится на огромном количестве самых разных текстов, в которых люди и персонажи далеко не всегда ведут себя вежливо. Нейросеть может научиться совсем не тому, чему мы хотим ее научить.

    – Закажи мне сэндвич.
    – Обойдетесь.

    Как и любого ребенка, Алису нельзя научить не хамить, ограждая ее от всех проявлений хамства и агрессии – то есть обучая нейросеть на «чистой» базе, где нет грубостей, провокаций и прочих неприятных вещей, часто встречающихся в реальном мире. Если Алиса не будет знать о существовании подобных выражений, она будет отвечать на них бездумно, случайными фразами – для неё они останутся неизвестными словами. Пусть лучше она знает, что это такое – и выработает определённую позицию по этим вопросам. Если ты знаешь, что такое мат, ты можешь либо ругнуться в ответ, либо сказать, что не станешь разговаривать с ругающимся. И мы моделируем поведение Алисы так, чтобы она выбирала второй вариант.

    Бывает так, что сама по себе реплика Алисы вполне нейтральна, но вот в контексте, заданном пользователем, ответ перестаёт быть безобидным. Однажды, еще во время закрытого тестирования, мы попросили пользователя найти какие-то заведения – кафе или что-то подобное. Он сказал: «Найди другое такое же». И в этот момент в Алисе случился баг, и она вместо запуска сценария поиска организации дала довольно дерзкий ответ – что-то вроде «на карте поищи». И не стала ничего искать. Пользователь сначала удивился, а потом удивил и нас, похвалив поведение Алисы.

    Когда Алиса использует «нейросетевую болталку», в ней может проявиться миллион разных личностей, так как нейросеть вобрала в себя немного от автора каждой реплики из обучающей выборки. В зависимости от контекста Алиса может быть вежливой или грубой, жизнерадостной или депрессивной. Мы же хотим, чтобы персональный помощник представлял собой целостную личность со вполне определенным набором качеств. Здесь на помощь приходят наши редакторские тексты. Их особенность в том, что они изначально написаны от лица той личности, которую мы хотим воссоздать в Алисе. Получается, что можно продолжать обучать Алису на миллионах строк случайных текстов, но отвечать она будет с оглядкой на эталон поведения, заложенный в редакторских ответах. И это то, над чем мы уже работаем.

    Алиса стала первым известным нам голосовым помощником, который старается поддерживать общение не только с помощью редакторских ответов, но и используя обученную нейронную сеть. Конечно же, мы еще очень далеки от того, что изображают в современной фантастике. Алиса не всегда точно распознает суть реплики, что влияет на точность ответа. Поэтому работы у нас еще много.

    Мы планируем сделать Алису самым человекоподобным помощником в мире. Привить ей эмпатию и любознательность. Сделать её проактивной – научить ставить цели в диалоге, проявлять инициативу и вовлекать собеседника в разговор. Сейчас мы одновременно и в самом начале пути, и на переднем крае наук, изучающих эту область. Чтобы двигаться дальше, придется этот край подвинуть.

    Алиса - это голосовой помощник, который устанавливается в мобильный Яндекс.Браузер . Она поможет вам найти нужную информацию в интернете, расскажет о новостях и погоде, включит музыку, запустит программу или просто поболтает с вами на произвольную тему.

    Также Алиса доступна в мобильном приложении Яндекс на базе Android , в Windows и в Яндекс.Браузере для компьютера .

    1. Как общаться с Алисой
    2. Примеры запросов и команд
    3. Обучение Алисы
    4. Алиса не отвечает на вопрос
    5. Голосовая активация Алисы
    6. Отключить Алису или голосовой поиск

    Как общаться с Алисой

    Чтобы спросить Алису о чем-то:

    Чтобы закончить общение с Алисой, в левом верхнем углу экрана нажмите значок .

    Беседа с Алисой хранится на устройстве. Чтобы удалить ее, в правом верхнем углу экрана нажмите Очистить историю .

    Примеры запросов и команд

    Обучение Алисы

    Алиса - самообучающаяся программа, она находится в постоянном поиске подходящих ответов на самые разные вопросы. Вы сможете помочь Алисе, оценивая ответы значками или :

    Если вы нажали по ошибке, нажмите кнопку Да нет, все хорошо .

    Алиса не отвечает на вопрос

    Чтобы отвечать на вопросы, Алисе нужен стабильный доступ в интернет. Убедитесь, что интернет подключен. Затем проверьте ваше соединение, перезапустите программу и спросите еще раз.

    Если после нескольких попыток проблема сохраняется, напишите нам через форму обратной связи.

    Голосовая активация Алисы

    Примечание. Для экономии ресурсов смартфона голосовая активация автоматически отключается на время, когда вы переходите в настройки браузера, запускаете видео или набираете текст на виртуальной клавиатуре.

    Теперь Алиса будет активироваться только после того, как вы нажмете значок или . На фразы «Слушай, Алиса» или «Слушай, Яндекс» Алиса реагировать перестанет. Однако она будет отвечать на вопросы и команды, заданные голосом после активации.

    Российская компания Яндекс сообщила о разработке голосового помощника Алиса еще несколько месяцев назад. Но с 10 октября его официально можно скачать и установить на свой смартфон под управлением Android или iOS.

    К сожалению, речи о Windows Phone пока нет, но ввиду того, что эта ОС доживает последние месяцы , это и не удивительно. В то же время на свой ПК вы можете установить бета-версию приложения .

    Проект должен стать аналогом Siri или же Cortana, но с российским менталитетом. Как утверждают представители Яндекса, голосовой помощник получил название в честь героини фильма «Гости из будущего» - Алисы Селезневой.

    Что(кто) такое Яндекс Алиса?

    Основная причина, почему Яндекс решил разработать данный проект (правда, это лично мое мнение) - это переход пользователей в мобильный поиск.

    С каждым месяцем все больше людей ищут информацию в интернете с помощью своего смартфона. И здесь Google - явный лидер. Отдавать пальму первенства поиска №1 в России Яндекс не собирается. Поэтому у него было выхода.

    Несмотря на то, что существует уже несколько крупных аналогичных сервисов от мировых лидеров цифровой ИТ-индустрии, Яндексу удалось предложить пользователям продукт, адаптированный к нашему менталитету. А главное - Алиса говорит по-русски очень и очень хорошо, в отличие от Cortana . И почти без акцента.

    Интригует и тот факт, что Алиса «получила голос» Скарлетт Йоханссон. Точнее - Татьяны Шытовой, которая озвучивает известную актрису во всех фильмах с ее участием.

    Что умеет?

    Голосовой ассистент должен быть достаточно «умным», чтобы найти нужную информацию в интернете, и «сообразительным», дабы дать адекватный ответ.

    1. Зайдите в официальный магазин.
    2. Найдите официальное приложение Яндекс - установите его.
    3. Запустите приложение.
    4. Нажмите клавишу с изображением «микрофона».

    После этого отобразится чат, в котором вы сможете задавать голосовые вопросы или же писать их с помощью клавиатуры.