Оригинал: www.computerra.ru/179929/kto-pustil-ii-v-dom-umnaya-kamera-kak-predvestnik-apokalipsisa/
18.04.2018

Кто пустил ИИ в дом? «Умная» камера как предвестник апокалипсиса

С началом весны Google запустила продажи Google Clips. Это родоначальник нового класса устройств, именуемых «умными» камерами. Цена ему определена в 249 долларов. На вопрос, можно ли его приобрести, впрочем, отвечу: нет, ибо доступна новинка пока только в континентальных США. Но в данном случае намного важнее: а захотите ли? Потому что вопрос этот, при всей его простоте, скрывает такую страшную подноготную, что грех не изложить её подробно.

На случай, если вы не читали обзоров: Google Clips — портативная цифровая камера, размером буквально чуть больше крупной монеты. Конструкторы поставили во главу угла минимализм — и выдали интересное даже внешне устройство. Фиксированный широкоугольный объектив (задуманный для съёмки сцен на расстоянии от метра до нескольких), единственная кнопка с той же стороны, но ни видоискателя, ни дисплея с обратной. Камера привязана по Wi-Fi к смартфону хозяина, так что через специальное приложение ракурс перед съёмкой всё-таки оценить можно. Но изюминка в том, что человеку снимать и не предполагается: Google Clips сама определит наиболее удачный момент и нажмёт на «спуск»!

Всё, что требуется от пользователя, это подыскать удачное место, укрепить камеру (в том числе пристяжной клипсой, откуда, вероятно, и название) и не забыть забрать её после того, как действие, которое планировалось отснять (вечеринка, отдых с ребёнком, кормёжка питомца — что угодно с участием вас и ваших близких людей и/или зверей), завершится.

Как печально заметил Элон Маск, комментируя выпуск Google Clips и выражая главное общее опасение, с ней связанное, «эту штуку даже не пытались замаскировать под безобидную». Но на самом деле главная угроза вовсе не в возможном ущербе для приватности...

Результат работы Google Clips — некоторое количество коротких (обычно 7 секунд) роликов, из которых впоследствии, уже на телефоне или компьютере, можно вырезать удачные кадры, либо сохранить ролики целиком в форме анимаций. Таким образом, вооружившись ею, вы наконец тоже сможете присутствовать в кадре и переживать приятные моменты с дорогими вам людьми, а не торчать «по ту сторону» объектива, нервничая, как бы чего не пропустить. Плюс, не придётся продираться сквозь сотни однотипных снимков после: кадров-кандидатов, которые камера предложит вам на рассмотрение, предположительно должно получаться немного — потому что Google Clips не снимает всё подряд, а именно выбирает самое интересное.

Как она это делает? С помощью искусственного интеллекта. Google Clips — это самодостаточный (интернет не требуется) самообучающийся программно-аппаратный комплекс, оптимизированный для распознавания людей и домашних животных. Хозяина он знает в лицо — как и всех тех, кто появляется с хозяином: чем чаще те или иные лица будут рядом с ним мелькать, тем чаще их станут фотографировать. Процесс обучения можно подстегнуть или направить в нужном направлении, предоставив камере доступ к персональной коллекции фотографий Google Photos, а также время от времени нажимая «спуск» собственноручно.

Однако помимо распознавания лиц Google Clips натренирована и самостоятельно определять потенциально наиболее удачные, то есть запоминающиеся, кадры. Этому её учила группа профессиональных фотографов ещё на этапе проектирования: что забраковать сразу (рука в кадре, расфокус и т.п.), что предпочесть (лицо крупным планом против лица с краю, например, или значительное число знакомых лиц в толпе, или высоко ценимые человеческим глазом эстетические свойства, вроде широкой палитры). В результате она не только избавляет человека от необходимости караулить «у окуляра», но и предположительно способна поймать больше искренних, не постановочных сцен. Без этого у Google получилась бы просто очередная экшн-камера, которых и так уже полно — от пресловутой GoPro до экзотической PetCube (специально для слежки за братьями меньшими).

Примерно так снимает Google Clips.

Важно, что всё отснятое остаётся исключительно в памяти камеры или привязанного к ней смартфона — по крайней мере до тех пор, пока поделиться этим не решит сам хозяин. Так устраняется главное опасение, связанное с (почти) постоянно включенным цифровым оком: вторжение в личную жизнь. Этим же ограничиваются и 99% обзоров Google Clips. Тон их, поначалу неумеренно восторженный, после начала продаж, кстати, подувял: как и следовало ожидать, качество снимков (во всех смыслах) оказалось невысоким — ИИ ловит слишком много всего и хуже ожидаемого угадывает запоминающиеся моменты.

Однако вовсе не возможная утечка снимков в чужие руки — самая страшная угроза, которую таит «умная» камера. Важно понимать, что «в лице» Google Clips искусственный интеллект, до сих пор ограничивавшийся осторожными пробными подходами, начал полномасштабное вторжение в быт.

Зачем нам ИИ в быту, почему мы не можем обойтись простыми автоматами? А потому и для того, что человек мечтает разгрузить себя от рутинных операций. И везде, где операции эти не ограничены чисто механическим повторением, требуется машина, обладающая интеллектом, способная принимать решения за нас. Четыре года назад скандал (среди людей понимающих) вызвала написанная всё той же Google функция «фотографического автокреатива»: ИИ научили «улучшать» фотографии — вплоть до компоновки событий, которых на самом деле не происходило (вспомните: «ИИ «улучшает» историю»). Уже тогда «неосторожное» поведение машины способно было навредить человеку — бросив тень подозрения на индивида, якобы оказавшегося в выдуманной ситуации. Сегодня Google Clips переводит проблему на следующий уровень.

Устройства с встроенным ИИ вводят новый термин: VPU — vision processing unit, процессор машинного зрения. Это чип, предназначенный для аппаратного ускорения работы алгоритмов машинного зрения. Google Clips использует нейросетевой Movidius Myriad 2 от Intel. Он же, кстати, стоит и в дронах DJI.

Чем на самом деле опасна камера, самостоятельно решающая, когда нажимать на «спуск»? Вовсе не тем, что личные фотографии утекут в АНБ, будут проданы рекламным партнёрам Google или украдены злобными хакерами. Нет, всё это действительно может случиться, но всё это меркнет на фоне новой угрозы. Давайте сформулируем в абстрактных характеристиках: впервые в человеческой истории наша документальная память начинает наполняться документами, созданными не нами самими.

Вообразите фотоальбом, обычный семейный фотоальбом, хранящий фотографическую летопись отдельно взятой ячейки общества. До сих пор фотографии для него делались только людьми. Родители, например, сами решали, что в какой-то момент в какой-то ситуации следует запечатлеть ребёнка — так что если двадцать лет спустя он спросит, почему то или иное фото было сделано, они в состоянии сформулировать причину. Необыкновенная улыбка, двухколёсный велосипед как первое большое достижение, первый осмысленный контакт с противоположным полом... Но с Google Clips всё иначе.

Ценность момента, удачность фотографии определяются здесь не субъективным ощущением, присущим зачастую лишь близким людям, а набором чётко сформулированных логических критериев. И когда те же двадцать лет спустя, недоумённо взирая на странный снимок из альбома, отснятого «умной» камерой, ребёнок спросит «Почему?», родителям будет нечего ответить, кроме «Так решила машина!».

А как именно она решила? Да суммировав параметры, которые можно объективно измерить и постановив, что, поскольку сумма больше значения X, данный момент достоин запечатления! Скажем, относительное число улыбающихся лиц к общему числу лиц, присутствующих в кадре, плюс белизна улыбки объекта А-02 к среднестатистической, плюс степень приближения позы домашнего животного Б-1 к ранее натренированному множеству «Няшный котик».

И если вас сейчас не пробрало, если волосы не шевелятся на голове от страха, вы просто не включили воображение. Потому что с тем же энтузиазмом, с которым машина «щёлкнет» гугукающего младенца на руках у хозяина, она, уж простите за резкость сравнения, «щёлкнет» и самого хозяина, если он, например, решит удавиться перед объективом. Оценит величину его выкаченных глаз, необыкновенность цвета вывалившегося языка, близость позы извивающегося в агонии тела к какому-нибудь подмножеству «Юмористическое селфи», и — щёлкнет. Готов даже поспорить, случится это в следующие год или два — и будет случаться с той же регулярностью, с которой нынче вышибают себе мозги перед камерой в фейсбуках.

Вот так, сквозь набор заученных атрибутов, искусственные нейросети «видят» мир (здесь: пример из арсенала Amazon Rekognition).

Ограниченность ИИ, непонимание им контекста — огромная проблема, имеющая множество проявлений: от невозможности гарантированно фильтровать спам до неспособности уверенно выявлять порнографию. Связанная с этим дискуссия тянется уже десятилетия: обыватели, бизнесмены, политики любят время от времени наступить на старые грабли — любят забыть, что вычислительные машины не только не всемогущи, а и очень ограничены в возможностях. Но до сих пор ИИ работал только с ведома человека, по нашему приказу. Google Clips, повторюсь, проводит черту: отныне ИИ начал массово работать параллельно с нами и над задачами, которые непосредственно влияют на наше понимание самих себя.

Происходящее сейчас хорошо вписывается в картину проникновения ИИ в быт, которую любят рисовать его, искусственного интеллекта, сторонники. На мой вкус лучше многих это сформулировал текущий главный юрист Microsoft и её же президент Брэдфорд Смит. Вспомните, предлагает он, как начинался обычный день двадцать лет назад. Скорее всего тогда вы вообще не имели дела с цифровыми устройствами: выключали аналоговый будильник, включали аналоговый телевизор, перелистывали бумажный календарь. И предположить, что однажды всё это будет чем-то заменено, да ещё и чем-то одним, вместо целой кучи вещей и устройств, было... ну, как минимум, смело.

Однако же это произошло и сегодня вы начинаете день со смартфона или компьютера — то есть цифрового устройства, вобравшего все важные функции. Что будет через 20 лет? Произойдёт ещё одна большая замена: день будет начинаться с общения с ИИ-помощником! ИИ сделает пользование теми же функциями ещё проще: он сам решит, какая информация для нас важнее в конкретной ситуации, сам решит, в какой форме её наиболее удобно подать...

Впрочем у нас как будто бы всё ещё есть выбор. Мы ведь можем и не захотеть иметь рядом с собой такого помощника — бездушного, ограниченного, но прячущегося под маской человека, делающего вид, что понимает нас, что разделяет наши ценности. Так захотим ли? Что ж, рынок ответ уже дал. В магазине Google аншлаг, первая партия Google Clips распродана без остатка.

Не просто захотим — уже захотели!


ИИ,Google_Clips,умная_вещь,сингулярность,неолуддизм,автоматизация,VPU




Евгений Золотов, 1999-2018. Личный архив. Некоторые права защищены