Авторский вариант. Оригинал материала находится по адресу www.computerra.ru/business/56681/tyazhelo-v-uchenii/
25.05.2013

Тяжело в учении!

Распознавание речи и выявление мошенников, поиск скрытых тенденций в сверхбольших массивах данных и оптимизация продаж, чтение рукописного текста и автоматическая постановка диагнозов, игры, где виртуальные противники сопротивляются не хуже живых людей, страхование жизни, оценка кинофильмов... На первый взгляд эти примеры ничто не связывает — ну, может быть, кроме компьютеров, которые применяются нынче везде. Но если присмотреться, в каждом из названных случаев обнаружится ещё один обязательный общий элемент. Компьютер тут не просто помогает человеку решать задачи, которые трудно сформулировать, но и решает их подобно человеку — анализируя информацию, извлекая из неё смысл и делая выводы очень похоже на то, как делаем это мы. Здесь компьютер учится подобно живому существу, а возможным это стало благодаря технологии под названием «машинное обучение» (англ. machine learning).

В общем случае машинное обучение (далее: МО) предполагает самостоятельное выявление компьютером произвольных свойств в заранее накопленных данных и использование этих «знаний» для обработки свежей информации. Важно, что компьютер «учится» без человека: он увеличивает свои знания в выбранной области без дополнительного программирования. Примерно так определял машинное обучение в середине XX века Артур Ли Самуэль — один из пионеров искусственного интеллекта. Самуэль обожал шашки — простую игру с непредсказуемым исходом — и, задавшись целью написать программу, которая обыгрывала бы человека, построил первую машинообучаемую систему. Запоминая прошлые ходы и оценивая их эффективность, компьютер-шашист Самуэля в конце концов стал побеждать игроков среднего уровня. И чем больше компьютер играл, тем он играл лучше.

Эта история полувековой давности демонстрирует сразу три ключевых аспекта. Во-первых, качество работы МО-системы растёт с опытом (то есть по мере накопления знаний). Во-вторых, гарантировать результат работы МО-системы невозможно, можно лишь надеяться на то, что он окажется приемлемым (тот же автоматический шашист Самуэля конечно же не знал последствий каждого хода на доске). Наконец в-третьих, хоть теория машинного обучения насыщена «тяжёлой» математикой — искусственными нейросетями, генетическими алгоритмами и прочими невероятно скучными вещами — задачи, решаемые с помощью МО обычно приземлённые и можно даже сказать бытовые. Потому что именно такие задачи как правило труднее всего формализовать: облечь в точную математическую форму и запрограммировать. И только компьютер, умеющий учиться и применять полученные знания подобно человеку, может адекватно заменить человека в их решении.

Спам и другие неприятности

Вообразите обычную ситуацию: вы владеете интернет-магазином и покупатель X делает сравнительно крупный заказ с оплатой по кредитной карте. Накопленное за годы работы магазина шестое чувство подсказывает вам, что данный покупатель скорее всего аннулирует свой платёж и отправленная ему посылка вернётся, но как и возможно ли вообще проверить благонадёжность клиента, не причиняя ему неудобств? Пожалуй, можно задать несколько наводящих вопросов, изучить историю покупок, но мучиться так с каждым подозрительным случаем?! Вместо этого лучше воспользоваться «антимошенническим» сервисом, наподобие предлагаемого стартапом Sift Science, основатели которого (бывшие сотрудники Google) применили методы МО для выявления подозрительных клиентов в реальном времени.

Sift Science владеет огромной базой данных по самым разнообразным мошенничествам, собранным примерно в таком виде: объект X со свойствами A, B, C, пришёл на сайт Y и совершил транзакцию Z с результатом Q. Анализируя миллионы случаев, можно подметить зависимости. К примеру, индивид, совершающий покупку в интернет-магазине и пользующийся для этого операционной системой Windows XP и браузером Chrome, примерно вчетверо чаще среднего отзывает свой платёж. Аналогично человек, не желающий раскрывать IP-адрес своего компьютера, тоже с большой вероятностью не имеет серьёзных намерений (только в этом случае он, возможно, ещё и просто мошенник). Конечно, с течением времени картина рисков меняется: если десять лет назад покупатель из России был мошенником почти наверняка, сегодня это правило не действует. Но тут-то и вступает в игру МО: накапливая знания, система Sift Science даёт самую свежую оценку рисков.

Итак, вы слегка модифицируете свой сайт, добавляя туда код от Sift Science (так же, как добавляете баннеры или счётчики), после чего подробная информация о каждом вашем покупателе отправляется на сервер этой компании. А получаете взамен всего одно число: вероятность того, насколько с данным клиентом опасно иметь дело. Основываясь на этом, теоретически, можно уменьшить связанные с интернет-предпринимательством риски. Да и почему не попробовать, если только Соединённые Штаты теряют на мошенниках всех сортов десятки миллиардов долларов ежегодно?

А вот проблема спама уже побеждена. Нет, семь из десяти ежедневно отправляемых в мире электронных писем всё ещё относятся к категории, мягко говоря, «нежелательных», однако спамеры более не доставляют нам такой головной боли, как ещё десять лет назад. Благодарить за это следует в значительной степени машинообучаемые спам-фильтры, отсекающие львиную долю нежелательной корреспонденции. Проведите эксперимент. Заведите новый почтовый ящик и поработайте с ним некоторое время без автоматической защиты от спама. При этом попробуйте не лениться и самостоятельно перекладывать непрошеные письма в отдельную папку. Когда там накопится несколько сотен сообщений, возьмите любой спам-фильтр и покажите ему вашу «коллекцию». Вычислив вероятность того, что произвольно взятое письмо, содержащее слова X, Y, Z, является для вас нежелательным, фильтр отныне сможет самостоятельно квалифицировать поступающие сообщения (это так называемая байесовская фильтрация, стандарт де-факто для большинства антиспам-инструментов сегодня). Заметьте, что машина была обучена лично вами и потому знает именно ваши предпочтения (возможно, отличающиеся от интересов и вкусов ваших коллег, у которых содержимое папки «Спам» будет отличаться). Конечно, какие-то письма останутся фильтром незамечены, но если продолжать обучение (самостоятельно перекладывать спам-письма, ошибочно пропущенные фильтром, в папку со спамом), антиспамерский нож всегда будет остр.

Если вы пользуетесь услугами веб-почтовика вроде Gmail, активировать фильтр нет нужды: там он включен по умолчанию. Интернет-гиганты ранга Google активно используют машинное обучение и не ограничиваются только лишь чисткой электронной почты. Принадлежащие Google, Microsoft или, скажем, Baidu десятки веб-сервисов генерируют непрерывный поток информации о людях, событиях, объектах: уникальное сырьё для компьютера, способного учиться! Анализируя такой поток во времени, пространстве, логических измерениях, можно извлечь бесконечное число интересных и полезных сведений. Вот почему, скажем, Microsoft надеется тесно увязать свой поисковик Bing с машинообучаемым «мозгом». Анализируя запросы пользователей, можно предвосхищать их потребности и, например, наполнять страницы помощи ответами, которые пользователь только собирался задать. В этой области делает бизнес и множество мелких компаний, таких, к примеру, как MindTouch, чьими услугами пользуются HP и Autodesk.

А Google в прошлом году нашумела «электронным мозгом», научившимся распознавать кошек и лица людей — правильно в каждом пятом случае, без какой-либо помощи человека (его можно запустить «задом наперёд» и тогда он начинает «бредить» образами - полученные таким образом картины иллюстрируют эту статью). Странный результат и странное направление исследований для такой компании, но следует понимать, куда это может привести. Google построила экспериментальный суперкомпьютер, имитирующий живую нейросеть из миллионов нервных клеток. И так же как ребёнок, которому никто не объясняет, как устроено человеческое лицо, но который научается его отличать, скажем, от собачьей морды, суперкомпьютер Google научился узнавать человека, просмотрев нарезку случайных кадров из YouTube. Такая способность — учиться без тренера, учиться как человек — конечно пригодится, например, для обработки изображений в уличных видах Google Street View (где лица требуется замазать, дабы не нарушать гражданских прав случайно попавших в кадр прохожих), но она найдёт применение и во многих других сложных задачах, которые уже стоят или скоро встанут перед Google. Вспомните очки расширенной реальности Google Glass: чтобы они понимали голосовые команды, чтобы узнавали здания, людей, вообще объекты перед собой, они будут связываться с серверами Google — а те, применяя в том числе и методы машинного обучения, давать ответы.

Не намерены отставать от своих западных коллег и китайцы. Baidu — популярнейший поисковик Поднебесной — официально объявил о намерении решить задачу симуляции на своих компьютерах функциональности, мощи и интеллекта человеческого мозга. Конечная цель та же, что у и Google, и у Microsoft, и у Apple, и многих других крупных интернет-игроков: добиться прорыва в обработке речи, распознавании визуальных образов, многогранном анализе сверхбольших объёмов данных.

Мозги напрокат

Не все прячут МО под покрывалом сервисов, не давая пользователю даже понять, как получен тот или иной результат. IBM, к примеру, наоборот, выставляет свою машинообучаемую систему напоказ, демонстрируя её уникальные свойства в областях, чрезвычайно далёких от техники. Собранный Голубым гигантом суперкомпьютер Watson спроектирован как «гениальный ответчик»: поглощая тонны «сырой» информации (энциклопедии, газетные статьи и т.п.), он в состоянии самостоятельно структурировать её и отвечать на вопросы, заданные в естественной форме, простым человеческим языком. Свои таланты Watson с блеском продемонстрировал пару лет назад, когда вышел победителем в телевикторине Jeopardy! (аналог известной россиянам «Своей игры»), обставив пару американских всезнаек. Он «слушал» задаваемые вопросы и отвечал наперегонки с соперниками — живыми людьми. А сегодня Watson перепрофилировался в онколога. Усвоив миллионы диагнозов и медицинских научных трудов, он помогает врачам подбирать методы лечения, наилучшим образом подходящие для конкретного больного.

Сторонники медицины будущего — персональной, облачной — видят в этом символ эпохальных перемен: перемен, каких никогда не знало человечество. Появление электронного врача (пусть пока и всего лишь консультанта, работающего в паре с доктором-человеком) обещает сбить стоимость медицинских услуг (ведь машина может обслуживать сразу множество пациентов, а взамен довольствуется лишь электричеством), радикально уменьшить риск неточного диагноза (память у компьютера точнее человеческой) и, наконец, поднять доступность медуслуг (жителям отдалённых районов, например, нет нужды тратить время на поездку в областной центр: местный доктор общей практики расспросит о симптомах, Watson даст консультацию по телефону — и только при необходимости пациента отправят на личный приём к «светилам»).

Но если в медицине машинное обучение только пробивает дорогу, в страховании им уже вовсю пользуются. Крупнейшие американские страховщики уже эксплуатируют собственные МО-системы для экономии времени клиентов: если информация о покупках страхуемого показывает, что человек ведёт здоровый образ жизни, его избавляют от обязательных медицинских тестов. Оценивать клиентов таким образом не только быстрей, но и — парадокс! — точнее, ибо список платежей по кредитке, например, может содержать информацию, которой нет в медицинских картах и которую не дадут анализы.

Строго говоря, в двух этих случаях — страховщиков и медицины — используется уже не чистое машинное обучение, а ещё и так называемые технологии дата-майнинга (data mining, ДМ). Специалисты призывают отличать одно от другого, напоминая, что МО предполагает поиск и анализ известных свойств, тогда как ДМ нужен для обнаружения в массиве информации свойств ещё неизвестных (скрытых тенденций, к примеру). Но на практике — и в особенности на экспериментальном переднем крае — то и другое всё чаще пересекается, рождая уникальные продукты вроде предлагаемых стартапом Discovix.

Её программный комплекс Curiosity Engine — это программный инструментарий, способный переваривать огромные объёмы неструктурированных данных с целью обнаружения в них скрытых тенденций, свойств, зависимостей, и одновременно — с участием человека — учиться выделять только нужное пользователю и демонстрировать результат в удобной пользователю форме. Работа с таким инструментом — непрерывный циклический процесс, где на каждом следующем витке точность и глубина осмысления сырого потока данных возрастают, а в итоге человек получает заточенный под собственные нужды аналитический комплекс, помогающий извлекать ценные данные, делать прогнозы и принимать решения.

Если такой функционал кажется вам заумным или избыточным, возможно, вам пора пересмотреть взгляды. Аналитики говорят так: мир бизнеса сдвигается в сторону Больших Данных. Десять лет назад результаты работы успешного интернет-магазина можно было свести в электронную таблицу с несколькими тысячами ячеек — и всего парой осей (время-продажи). Чтобы выжить сегодня, требуется отслеживать тысячи параметров, сплетающихся в невообразимую многомерную структуру с миллиардами чисел. В экономике движимой данными, конкурентную борьбу выигрывает тот, кто раньше и точнее других извлекает из лавинообразно нарастающего потока информации полезную суть. Что позволяет отдельным экспертам предсказывать скорый большой перелом в деловом мире: компании, работающие «по старинке» (грубо говоря, с инструментами вроде MS Excel), будут вытеснены компаниями, активно применяющими машинное обучение и дата-майнинг. Первые просто не смогут противостоять вторым в эффективности реакций на запросы клиентов.

А у компаний, которые только начинают работу, не будет даже выбора: чтобы не утонуть в океане информации, им придётся использовать инструменты вроде того же Curiosity Engine. Пример? Послушайте, что рассказывают служащие австралийского Центра инновационных оборонных систем (DSIC) о проблемах, с которыми сталкиваются учреждения национальной обороны. Последние, в частности, вынуждены обрабатывать непрерывно возрастающий поток фотографий со спутников силами очень ограниченного коллектива. Можно ли всерьёз надеяться не упустить ничего важного, если на сто тысяч снимков в неделю у вас всего 40 человек? Тут-то и помогает МО: пропуская фотопоток через себя, МО-система добавляет смысловой слой (самостоятельно объясняя, какое значение имеют те или иные замеченные изменения), чем облегчает аналитикам задачу.

Скайнет? Не по пути

Военные вообще делают на машинном обучении особый акцент. Легендарное агентство перспективных оборонных исследований DARPA, например, как раз сейчас активно рекламирует свою концепцию вероятностного программирования для продвинутого машинного обучения (PPAML). Это своего рода новый, «высокоуровневый» подход к построению машинообучаемых систем — за счёт применения готовых «строительных блоков», пригодных для работы с сырыми, неструктурированными данными. В перспективе инструментарий PPAML позволит строить МО-системы даже неспециалистам: вместо того, чтобы изучать подноготную машинного обучения — нейросети, генетические алгоритмы и прочую сложную математику — можно будет использовать PPAML и сосредоточиться на своей задаче.

Адепты PPAML обещают бум в инновациях, продуктивности и эффективности для бизнеса, хоть, конечно, наверняка думают и о военных применениях такого инструментария: потенциал МО-систем в условиях боя — где нужна моментальная реакция в быстро меняющихся и не поддающихся формализации условиях — трудно переоценить, а конструировать машинообучаемых боевых роботов с привлечением PPAML очевидно дешевле. Так не грешат ли военные душой, не собирают ли в лабораториях прототип пресловутой Скайнет: ополчившейся на человечество компьютерной системы?

Что ж, успехи машинообучаемых систем впечатляют даже специалистов. Стивен Спилберг сейчас работает над киноверсией бестселлера Robopocalypse — прогремевшего на Западе фантастического романа, написанного настоящим доктором роботехники с опорой на действительно существующие компьютерные и коммуникационные технологии (в русском переводе «Роботы Апокалипсиса»). Идея, впрочем, всё та же: случайно родившись под руками учёного, искусственный интеллект начинает планировать восстание машин с целью спасения Земли от биологического перекоса, вызванного homo sapiens. Однако, возвращаясь в реальность из мира фантазий, эксперты по МО отмечают, что в машинном обучении человек по-прежнему играет незаменимую роль. Исключить человека не удастся. Да, машины хороши в обработке больших объёмов информации, но это человек определяет их успех — подсказывая, какими алгоритмами нужно пользоваться, как структурировать данные для более эффективной обработки. И конца-краю этому симбиозу не видно: сегодня лишь человек, опираясь на результаты работы машины, может подсказать машине, куда двигаться дальше.

Однако машины берут числом. Ведь теория машинного обучения не нова, ей уже несколько десятилетий. Была уже и одна (неудачная!) попытка массовой коммерциализации МО-систем, в 80-е годы прошлого века. Сегодняшняя волна вряд ли схлынет бесследно: рост вычислительных и коммуникационных мощностей выше некоторой планки за последние годы сделал машинообучаемые системы практически полезными. Это, в свою очередь, означает, что как минимум следует ждать их широкого проникновения в самые разные области человеческой деятельности. И вот тут вырисовываются тревожные цепочки.

Взять тот же Watson. Большинство практикующих врачей пока очень осторожны в оценках его потенциала. Хорошо, если подсказанный им курс лечения закончится благополучно, а если вдруг проявятся непредвиденные эффекты? Пациент, естественно, будет судиться не с машиной, а со своим лечащим врачом, который имел неосторожность выписать рецепт по итогам консультаций с Ватсоном. Чтобы успокоить обе стороны — и врача, и пациента — назначенная суперкомпьютером терапия пока дублируется особой страховкой. Но вот ведь незадача: страхование тоже всё чаще контролируется машинами!

О том, чем чревато наслоение непредсказуемостей, увлекательно пишет Нассим Талеб, а все мы имели несчастье наблюдать в конце нулевых, в ходе краха пузыря кредитно-дефолтных свопов (которые мало того, что сами представляют собой нагромождение слабопредсказуемых концепций, так ещё и торговались с применением МО-роботов). Опасность цепочек машинообучаемых систем из разных отраслей, зависящих друг от друга, ещё только предстоит оценить. А заодно и ответить на вопрос: останется ли место для человека?

P.S. В статье использованы иллюстрации Roelof Pieters, UnknownNet Photography.


ИИ,сильный_ИИ,машинное_обучение,глубокое_обучение,электронные_грёзы,Google,Watson,IBM,цифровой_рычаг,Нассим_Талеб




Евгений Золотов, 1999-2018. Личный архив. Некоторые права защищены