На прошедшей вчера конференции Яндекса «Yet another Conference on Marketing» большинство докладчиков так или иначе коснулось темы развития рекомендательных сервисов и их роли в интернет-маркетинге. «Бизнес-газета» в ходе эксклюзивного интервью обсудила этот вопрос с заместителем руководителя направления медиасервисов компании «Яндекс» Виктором Ламбуртом.
—
В каких сферах и для каких целей чаще всего используются рекомендательные сервисы?
— Если говорить аналогиями, то рекомендательные системы — это такой суперпрофессиональный консультант с феноменальным кругозором, который знает всё о своём ассортименте и хорошо знает потребительские паттерны. Такие люди встречались раньше в видеосалонах: на основании ваших предпочтений они рекомендовали фильмы, которые вам было бы интересно посмотреть.
Рекомендательные системы действуют похожим способом и применяются в тех случаях, когда человек выбирает что-то с чем он еще не сталкивался.
—
«Яндекс» ведь тоже использует рекомендательные системы в результатах персональной поисковой выдачи…
— Да, мы используем персонализацию поисковой выдачи, что помогает улучшить её качество. Если пользователь делает запрос «опера», то в зависимости от его предыдущих предпочтений, мы показываем ему либо браузер Opera, либо информацию о жанре музыкально-драматического искусства.
—
Для этого используются данные о поведении и запросах пользователя. Откуда они берутся у поисковой системы и как хранение такой информации коррелируется с законом о защите персональных данных?
— Рекомендательные сервисы не существуют абстрактно, они прилагаются к какому-то продукту и используют информацию, которую пользователь оставляет, пользуясь этим продуктом. Например, для персонализации выдачи в Яндексе мы используем историю его поисковых запросов. Ну, и других пользователей со схожими интересами тоже. Сами по себе поисковые запросы — это не персональная информация, так как по закону персональной информацией являются лишь те данные, которые позволяют идентифицировать пользователя. Например. ФИО, телефон, паспортные данные и т. д.
В любом случае персонализированный поиск — это продукт лучшего качества, нежели поиск неперсонализированный, так как он учитывает предпочтения пользователя и показывает не всё подряд, а только то, что ему интересно.
—
Есть ведь и обратная сторона. С накоплением большого массива информации о пользователе есть риск образования «пузыря фильтров», который ограничит возможности поиска информации исключительно сферой интересов человека.
— Действительно, у не очень сложных алгоритмов есть такая проблема. Однако современные алгоритмы стараются сочетать результаты которые пользователю точно понравятся, плюс добавляют к ним что-то новенькое. Это делается для того, чтобы, с одной стороны расширить пользовательский кругозор, а с другой — узнать об этом человеке что-то еще.
—
Зачастую для накрутки рейтингов некоторые компании используют ботов, которые пишут позитивные отзывы или ставят положительные оценки. Подобные вещи иногда можно увидеть в том же Яндекс. Маркете. Сказывается ли это на коллаборативной фильтрации, ведь у ботов тоже есть свои предпочтения, которые могут совпадать с предпочтениями обычных живых людей?
— Подобного рода накрутка особенно хорошо работает не в коллаборативной фильтрации, а в рейтингах. Накрутить таким способом рекомендательную систему намного сложнее. А кроме того есть способы отлова подобных подозрительных пользователей. При помощи машинного обучения можно выявить такие типовые фродовые паттерны и либо вообще их не учитывать, либо занижать их влияние.
—
С другой стороны существует проблема «белых ворон»: людей с непредсказуемыми паттернами, чьи интересы могут бросаться из крайности в крайность и их очень сложно предугадать.
— Проблема «белой вороны» справедлива для коллаборативной фильтрации, то есть алгоритмов построенных по принципу «вот что нравится людям, которым нравится тоже, что и вам». То есть система ищет пользователей, чьи интересы схожи с вашими, и выдает вам то, что эти пользователи оценили высоко, а вы еще не видели.
Большие системы используют много разных алгоритмов, запущенных параллельно. Над ними находится некий решающий алгоритм, который смотрит какая из инструкций побеждает и, соответственно, её результаты выдает.
—
Насколько сегодня рекомендательные сервисы в принципе развиты на локальном рынке?
— В России наблюдает некоторое отставание от западного рынка в связи с тем, что потребность в рекомендациях была осознана не так давно. Поэтому сильных игроков действительно не так много. Однако сейчас появляются не только локальные, но и зарубежные компании, такие как RichRelevance или Gravity. И это хороший повод нашим российским ребятам начать шевелиться быстрее, тем более, что потенциал у отечественных игроков очень хороший. Потому что главными в рекомендациях являются две вещи: хорошее знание математики и умение обрабатывать большие данные. И та, и другая компетенция на российском рынке есть и позволяет, например, нам выдерживатьь конкуренцию с западными игроками.
—
Раз уже заговорили о конкуренции. Существует ли на локальном рынке особая специфика, возможно построенная на российском менталитете, которая не позволит использовать зарубежные образцы рекомендательных систем, что называется «из коробки», без определенной адаптации.
— Специфика есть в поведенческих паттернах. То есть система обученная, например, в Швеции, на российской почве работать не будет.
С точки зрения алгоритмов, различий мало. Но есть специфика в данных, которые вы в эти алгоритмы поставляете и в том, как вы эти данные обрабатываете. Есть методы очистки данных, методы борьбы с фродом и, может быть, эти вещи надо адаптировать.
—
У вас есть какие-то данные о том насколько увеличивается конверсия с применением и без применения рекомендательных систем?
— Эти данные очень сильно варьируются в зависимости от отрасли. Например, OZON озвучивал цифру в 25%.
—
Речь идет о продажах?
— Коллеги говорили не так. Речь шла о том, что 25% товаров добавляется в «Корзину» из рекомендательных блоков. Это не совсем тоже самое.
—
Какие прогнозы по отраслям применения рекомендательных систем? Где они будут применяться в будущем?
— Если говорить о сферах применения, то в первую очередь это будет eCommerce, сферы потребления контента — фильмы, музыка, книги, компьютерные игры, и, конечно, медиа.