Чтение по алгоритму

Вы могли и не заметить: делая покупки в Интернете, вы следуете рекомендациям компьютера. Математический алгоритм суммирует всю информацию о вас – предыдущие покупки, запросы в поисковиках, поведение в соцсетях – и подбирает то, что вам заведомо приглянется. Упрощенно говоря, это сметливый продавец-робот, который знает о ваших вкусах побольше, чем мать родная. Иногда крупные интернет-магазины создают собственный отдел из математиков и программистов и сами разрабатывают рекомендательные системы. Но все чаще обращаются к внешним компаниям. На Западе крупнейшие сервисы таких «просчитанных» товарных рекомендаций – Rich Relevance и Gravity; у нас, навскидку, Retail Rocket, Crosss и E-Contenta. Они работают не с вами лично (вы о них и не подозреваете), а с тем, кто вам продает. Система интернет-магазина объединяется с рекомендательным движком – и через месяц-два уже можно наблюдать реакцию покупателей на нововведение. Реакция очевидна, потому что выражается в покупках и «лайках» – или их отсутствии. E-Contenta только что завершил пилотный проект вместе с крупным книжным сайтом (полмиллиона книг, полтора миллиона пользователей ежемесячно). Ну что... Не очень хорошие новости для человечества: «машинную» подборку книг покупатель выбирал вдвое чаще, чем редакторскую, т. е. человеческую. О том, как эта штуковина работает, а также о том, куда катится мир, мы беседовали с гендиректором сервиса рекомендаций Зоей НИКИТИНОЙ.

Чтение по алгоритму | РИСУНОК Виктора БОГОРАДА

РИСУНОК Виктора БОГОРАДА

– Зоя, на многих сайтах после выбора той или иной вещи (книги, зонта, путешествия) тут же вылезает реклама: вам может понравиться еще и «то» и «это».

– Скорее всего, в этом случае очередную покупку вам рекомендует как раз машина.

Вообще есть два источника рекомендаций. Если говорить о книгах или фильмах, первый источник – эксперты, редакторы. Они следят за трендами и прогнозируют, хоть и «не персонально», что вам может понравиться. Но человек субъективен: эксперт, допустим, обожает Маринину и будет проталкивать ее книги. И не факт, что такой выбор понравится аудитории.

Второй способ – некий математический алгоритм. Вот с крупным интернет-магазином мы проводили исследование: смотрели, какую книжную подборку, «человеческую» или «машинную», выберет покупатель – у машины перевес был в два раза.

Сейчас с другим сервисом проводим исследование: разделили аудиторию сайта на две группы, тысяч по 30 человек. Одни получают рекомендации от редакторов, другим подборку предлагает алгоритм. Результаты будут где-то через месяц, но уже видно, что побеждает компьютер.


– Восстание машин какое-то. Как работает этот механизм?

– На сухом математическом языке это звучит так: наш алгоритм построен на принципах коллаборативной фильтрации и машинного обучения, и основной принцип – схожесть субъектов и их читательских предпочтений.

А теперь человеческим языком. Для нас важно собрать как можно более подробную информацию о читателях (пол, возраст, образование, профессия и так далее) и их предпочтениях. В результате единомышленники будут рекомендовать книги таким же единомышленникам, только опосредованно, через нашу систему.

Например, вы: живете в Петербурге, закончили СПбГУ, говорите по-английски, недавно были в Париже, подписаны «ВКонтакте» на группу «История» и, допустим, «Котики». Я – живу в Петербурге, закончила ЛЭТИ, тоже говорю по-английски и была в Лондоне, а в соцсети подписана на группу «Котики». Видите, мы с вами похожи, значит, скорее всего, и книги нам понравятся одинаковые. Вы зашли на сайт продающего ресурса, прочитали там книжки про Антарктиду и что-нибудь из Достоевского. Система помнит ваш выбор. Я тоже прочитала на этом сайте книги про Антарктиду. И система предложит мне Достоевского. Это очень упрощенно, но как-то так.

Вообще в рекомендациях есть два подхода: по схожести продукта – скажем, вы читаете Жюля Верна и машина будет вам подбирать что-то еще из Верна или более-менее близкое. А можно опираться на схожесть людей: допустим, у нас с вами много общего, и хотя вы в отличие от меня не читаете исторические романы, система их вам порекомендует. И вы, возможно, выйдете за рамки привычного круга чтения.

Чем больше мы знаем о человеке – тем более точная будет рекомендация. Система способна за миллисекунды анализировать тысячи и тысячи признаков и формировать индивидуальный список предпочтений.


– Какое самое говорящее знание получает обо мне система?

– Мы несколько удивились, но очень сильно влияют группы по интересам, на которые вы подписаны в соцсетях. Как только мы добавили к нашему алгоритму эти данные – «клики» выросли в несколько раз. Но и элементарное «мужчина» или «женщина» или возраст – определяет многое.

А вообще выводы из вашего поведения в соцсетях могут быть самые неожиданные. Например, чем больше вы читаете новостей, тем вы, как оказывается, более позитивный человек. А если вдруг неожиданно поменяли аватарку – значит трудности в личной жизни и налицо потребность во внимании противоположного пола. Среди подписчиков странички Обамы в «Фейсбуке» довольно много геев... Ну и так далее. Все это можно тем или иным образом использовать в целях интернет-продаж.


– Некоторые люди не состоят в социальных сетях.

– Но они заходят в Интернет, а там, как известно, записывается каждый чих. Есть пласт компаний, которые собирают данные по людям, по их движению в глобальной Сети. А потом перепродают для различных маркетинговых и рекламных целей. Такие компании называются DMP (Data Management Platforms). Они предоставляют нам недостающие данные о пользователях.


– У вас сегмент благородный, книги. Если машина что-то рекомендует, это как бы просветительская миссия. А если бы сумочки подбирали, это бы называлось «впариваете», к тому же узнав обо мне что-то личное.

– Это машина узнает о вас что-то, а не мы. Математический алгоритм можно подключать к самым разным продающим сайтам, в том числе универсальным – «Озону» или «Юлмарту». То, что мы сосредоточились на контентных сервисах (это все, что связано с информационным содержанием, – книги, видео, СМИ, онлайн-обучение) – это у меня личное: я переезжала с места на место и всякий раз думала – ну вот, опять перевозить книги! И понятно, что книги – скорее прекрасная декорация, когда еще будешь перечитывать? А электронные книги всегда с собой. Мировой рынок контента вообще переходит из офлайна в онлайн.

Судя по всему, бумажная книга станет чем-то из разряда роскоши. Массовый рынок – это все-таки то, что удобно и дешево, а это электронные носители. Не надо рубить дерево, делать бумагу, печатать, не надо обращаться в издательство, договариваться с магазинами. Я месяца три назад была во Франкфурте на крупнейшей книжной ярмарке – все специалисты говорили об одном: ужас, люди не ходят в книжные магазины, даже крупные сети закрываются. На российском рынке уже 5 лет подряд наблюдается падение – каждый год объемы продаж сокращаются примерно на 5 – 10%, магазины закрываются. С одной стороны – плохо, с другой – начинается новая электронная эра.

Насчет «впариваете». Сколько, как вы думаете, тратит Amazon на исследования аудитории? Несколько миллионов долларов в год, весомую часть своего бюджета. Его рекомендательная система тоже на алгоритмах, она чуть ли не самая сильная в мире. Вы заходите на сайт посмотреть кофточку, а вам предлагают ряд кофточек и к ним ряд туфель и ряд сумочек. Подборка основана на ваших предыдущих действиях в Сети и выборе людей, в чем-то на вас похожих. Можно относиться к этому как «Большой Брат следит», а можно так: ого, сразу подобрался полный комплект одежды, не надо тратить время.

Но я понимаю этот тревожный звоночек внутри. Когда в шахматы играет человек с компьютером, всегда болеешь за человека. Мы придаем машине нечто демоническое. Но ведь она делает то, что мы ей велим. И за то, что система знает о вас что-то, она вам многое и дает. Вы, когда пользуетесь бесплатным Интернетом, читаете соглашение, которое появляется на экране?


– Да ну, кто ж его читает?

– Вот именно. А там как раз написано, что в обмен на пользование какими-то сервисами вы отдаете информацию о себе.


– Сервисы персональных рекомендаций помогают продавать. Но в том что касается книг, кино, музыки, большинство россиян – благородные пираты.

– Для производителей и дистрибьюторов контента пиратство – главный враг, с ним идет борьба, и ставка делается на лень, любовь к удобству и дешевизну. В Сети можно скачать бесплатно все – но для этого нужно потрудиться, поискать. В противовес легальные продавцы книг и видео дают удобный онлайн-сервис: все быстро, не всплывает посторонняя реклама, компьютер не заразят вирусами. Опять же – персональные рекомендации. Да и цена доступная. Сейчас все больше и больше сервисов работают по подписке – за 200 – 300 рублей в месяц вы читаете всю библиотеку, без ограничений.


– Качество персональных рекомендаций зависит от качества алгоритма. Кто его писал в вашей компании?

– Ребят-программистов и математиков я искала несколько лет – мои коллеги ранее работали в «Яндексе», Mail.ru, делали проекты для Сбербанка, занимались большими данными, миллионными аудиториями. Мне повезло. Не многие в России способны построить систему, которая справлялась бы с такими объемами и нагрузками. Команда у нас российская, и пилотные проекты пока делаем здесь, но планируем выйти и на мировой рынок.

Не могу сказать, что интернет-магазины легко идут на контакт – надо доказать, что мы им выгодны. Но мне это просто очень интересно. Это ведь на грани фантастики, будто из кино о будущем. И я хочу быть к этому причастной.

Эту и другие статьи вы можете обсудить и прокомментировать в нашей группе ВКонтакте

Материал опубликован в газете «Санкт-Петербургские ведомости» № 016 (5389) от 02.02.2015.


Комментарии