Оригинал материала находится по адресу http://ibusiness.ru/blogs/3826
12.10.2011

Мастер разговорного жанра: Siri как жемчужина нового Айфона

Сформулировав шестьдесят лет назад свой знаменитый тест, Алан Тьюринг, вероятно, сам того не желая, указал дорогу, по которой двинулась впоследствии вся индустрия искусственного интеллекта. По Тьюрингу, искусственный разум вовсе не обязан быть разумом в полном смысле этого слова. Достаточно уметь обмануть человека, заставить его принять вычислительную машину за мыслящий организм. Отсюда и предубеждение, с которым встречаем мы каждую, начиная с «Элизы», претендующую на звание «умной» компьютерную разработку: под красивой оболочкой наверняка прячется очередной псевдоинтеллект, способный пусть и на хитрый, но всего лишь обман.

И тем приятней наблюдать за попытками — и успехами! — создать всамделишный AI. О том, какие ресурсы требуются для решения этой задачи, можно судить по нашумевшей в феврале схватке человека и машины в американской телевикторине Jeopardy: электронным игроком, посрамившим чемпионов из плоти и крови, был суперкомпьютер IBM Watson, специализирующийся на обработке естественных языков.

Могли ли мы мечтать тогда, что полгода спустя что-то похожее, по-настоящему интеллектуальное, сможет уместиться в нашем кармане? А ведь случилось! iPhone 4S, представленный Apple на минувшей неделе (см. «Пятёрки не будет. Кук»), не может похвастаться новой внешностью, но содержит как минимум один действительно уникальный компонент: виртуального помощника Siri. И в отличие от множества внешне похожих решений, этот продукт действительно стоит того, чтобы о нём поговорить.

В Apple мечтали о чём-то подобном ещё четверть века назад. В конце 80-х, Джон Скалли — тот самый, которого привёл Стив Джобс, и который заставил Джобса уйти — заказал несколько видеороликов, демонстрирующих концепт портативного устройства, способного общаться с пользователем на естественном языке. Ролики (их можно посмотреть и сегодня) освещают два ключевых момента. Во-первых, Knowledge Navigator (так назвали вымышленное устройство — букв. навигатор знаний) способен усваивать смысл сказанного человеком, а не просто извлекать из речи отдельные команды. Во-вторых, воображаемая машина поддерживала диалог.

По тем временам идея, конечно же, была технически неосуществимой и Скалли раскритиковали за фантазёрство. С тех пор микроэлектроника шагнула вперёд невообразимо, но вот голосовые интерфейсы остались в общем там же, где и десять, и двадцать лет назад, продолжая вычленять команды без попыток уловить смысл или принять во внимание контекст ситуации. Но тут-то и вступает в игру Siri — живое воплощение старой мечты.

Едва закончилась презентация, Siri стал героем бесчисленных анекдотов (по пути на работу, Вы: Айфон, включи-ка последнюю речь Володи Путина! Siri: читаю сообщение от Валечки Распутиной — ты забыл свои носки! Супруга: $%# ?!). Но и скептикам, и оптимистам стоит дождаться начала продаж: по-настоящему сильные и слабые стороны подобных разработок всегда выясняются в жизни. О том, как будут использовать Siri владельцы новых Айфонов, скорее всего не догадываются даже в Apple.

Как известно, картинка стоит тысячи слов, поэтому если вы ещё не видели демонстрации Siri, восполните это упущение немедленно. Представляя смартфон как мобильный телефон в квадрате, следует признать, что Siri возводит его в третью степень. Пользователь iPhone 4S может управлять своим смартфоном, почти не прикасаясь к дисплею, формулируя задачи в свободной форме, при необходимости вступая в диалог. Но собственно распознавание и синтез речи в данном случае не главное. Изюминка глубже: Siri не просто ищет ключевые слова или их комбинации, а понимает смысл сказанного и соотносит услышанное с имеющейся косвенной информацией о текущих моменте и месте. Он помнит о чём шла речь за минуту до того, он знает, что подразумевает человек, говоря «поблизости», он в состоянии сделать логический вывод из вопроса «брать ли мне зонт?» и дать осмысленный ответ.

При всём уважении к Apple, решить такую задачу в одиночку ей было бы не под силу. Но Apple и не пыталась. Siri — купленный проект: компания приобрела его в 2010, заплатив 200 млн. долл. за одноимённый стартап, а оттуда корни уходят к масштабной многолетней AI-инициативе CALO, выросшей в недрах Агентства перспективных оборонных разработок США (DARPA). Проект CALO, успешно завершённый несколько лет назад, предусматривал создание комплексной системы искусственного интеллекта нового поколения, которая стала бы мозгом мыслящего электронного помощника, способного действовать бок о бок с человеком и демонстрировать присущие только человеку качества (самообучаемость, адекватная реакция в неожиданных ситуациях, умение обосновать свои действия и т.п.). Siri — попытка коммерциализации небольшой части полученных результатов, затрагивающих главным образом проблему общения.

Фантастическая биография легко объясняет, почему все прочие, имеющиеся на массовом рынке ассистент-решения, смотрятся на фоне Siri бледно. К примеру, встроенный в Android гугловский Voice Actions формально предназначен для того же самого — управления стандартными (встроенными) приложениями смартфона: сообщения, звонки, заметки, контакты, планы, навигация и т.п. Но Voice Actions не поймёт задачи, сформулированной свободно, и тем более — уж простите за избитый пример — не ответит на вопрос, стоит ли прихватить зонт.

Насколько можно судить по презентации Apple, из Siri пока недоступны сторонние приложения, а список поддерживаемых языков ограничен английским, французским и немецким. Но даже в таком виде он уникален, ничего подобного на мобильных устройствах ещё не было. До переход под крыло Apple, Siri существовал в виде iOS-приложения и разработчики даже планировали его перенос на другие платформы. Теперь он доступен только в виде компоненты iOS 5 для iPhone 4S (что отчасти обусловлено высокими системными требованиями и более мощным процессором нового Айфона).

Интерфейс Voice Actions присутствует в операционной системе Android начиная с версии 2.2 — но ещё недавно казавшийся идеальным, сегодня он едва дотягивает до сравнения с Siri. Неудивительно, что именно от Google ждут следующего прорыва в голосовом направлении. Поисковый гигант собрал впечатляющий коллектив специалистов, возглавляемый Майком Коэном, автором знаменитой системы предикативного текстового ввода T9 (фото: Johan Larsson).

Конечно, сам факт доступности инновационной технологии ещё не гарантирует её успеха (вспомните как трудно пробиваются WiMAX или NFC). Как только модель 4S появится на прилавках, наверняка выявятся недостатки. Об одном из них, психологическом, скептики вспоминают без передышки: мы не привыкли общаться с телефоном. Представьте себя в людном месте, заставляющим свой смартфон сделать что-нибудь полезное, и вы поймёте о чём речь (программисты Apple постаралась сгладить этот нюанс, автоматически включая Siri, когда смартфон подносится к уху). Но и не глупо ли замыкаться на одним лишь «минусах», когда отчётливо забрезжила надежда в корне изменить наши привычки обращения с мобильной электроникой?

Отзывы немногочисленных счастливчиков, которые пробовали iPhone 4S в действии, в основном благожелательны. Они подтвердили практическую пригодность Siri (не переспрашивает, не искажает смысл) и обозначили приятные последствия его применения. Так, время, необходимое для создания текстовой заметки, сокращается в разы. А привыкнув к голосовому интерфейсу, пользователь с большей охотой обращается к помощи смартфона по мелочам — чего раньше избегал, инстинктивно уклоняясь от необходимости продираться сквозь меню и опции. Тестеры ещё и охотно мечтают о дне, когда через Siri будет возможно взаимодействие с любыми (не только стандартными) приложениями iPhone, а сам интеллектуальный ассистент мигрирует на планшетку, компьютеры и умное ТВ. Умение понять человека с полуслова пригодится везде и всегда, когда руки оказываются заняты.

Наконец, возможно, именно Siri следует благодарить за парадоксальный эффект: iPhone 4S, первая реакция на который граничила с разочарованием, уже поставил мировой рекорд по количеству заказов, за первые сутки после анонса превысившее один миллион. Обновлённая «четвёрка» оснащена новым процессором и новой камерой, но интеллектуальный помощник — это намного больше, это следующий виток эволюции интерфейсов.

Под руководством Стива Джобса Apple поочерёдно популяризовала все применяемые сегодня массово способы взаимодействия компьютера с человеком, начав с клавиатуры, продолжив мышью, тач-интерфейсом, а теперь обратившись к голосу. Siri можно считать последним подарком ушедшего CEO, и — очень хочется — вестником новой революции.


Siri,мобильные_устройства,тест_Тьюринга,ИИ,Apple,iPhone




Евгений Золотов, 1999-2018. Личный архив. Некоторые права защищены