Борис, вы наверняка слышали о недавнем исследовании Microsoft, которое показало, что российские руководители используют возможности искусственного интеллекта (ИИ) для бизнеса активнее, чем их иностранные коллеги: 30% в России против 22% в среднем по миру. При этом, глядя на работу потребительских бизнесов, вроде так не скажешь. А что вам говорит ваш опыт?
— Если речь идет о результатах опросов, а не о конкретной практике, то под искусственным интеллектом респонденты могут понимать разные вещи. Например, некоторые причисляют к ИИ того же самого чат-бота, но по сути это ошибка. Сегодня ИИ, как говорится, на пике хайпа. Некоторые компании-провайдеры пользуются моментом и стараются продать обычный сценарный чат-бот как искусственный интеллект. Впрочем, цифры вполне реалистичны. Исследовательская компания Gartner среди трендов ближайшего времени называет демократизацию ИИ. То есть для того, чтобы начать использовать ИИ, не нужно большого количества данных, серьезной команды специалистов по обработке, анализу и хранению больших массивов данных (data scientist). Можно просто купить готовый продукт и внедрить его в работу — это понижает порог входа для компаний в разы, если не на порядок.

Справка

Борис Вольфсон начал карьеру программистом в компании «Систем-Софт» в Оренбурге. С 2008 года руководил проектами и региональным отделом разработки в компании Softline. В 2011 году Борис возглавил департамент веб-разработки Softline. С начала апреля 2012 года назначен техническим директором HeadHunter, в мае 2015 года перешел на должность директора по развитию компании. Борис Вольфсон занимается развитием сервисов для пользователей мобильных устройств, созданием платформы для взаимодействия соискателей друг с другом, а также глубокой интеграцией сайта с корпоративными HR-системами. 



Вы сказали, что под ИИ каждый понимает что-то свое. Насколько это проблемно?
— Это большая проблема, причем характерна она абсолютно для любой инновации. Когда какая-то технология достигает пика популярности, обязательно появляются компании, которые этим хайпом пользуются. Иногда это делается целенаправленно. Например, когда в продукте нет ничего инновационного, в ход идет активный маркетинг — взять тот же чат-бот. Но бывает и так, что происходит это не злонамеренно, просто компания разработала какую-то модель с машинным обучением, при этом она не дает значимого эффекта. В таком случае получается, что ИИ — «для галочки»: data scientists поработали, модель есть, какие-то нейросети или деревья решений тоже есть, но главного — экономического эффекта нет. В моем понимании это тоже определенное введение в заблуждение. Как же отличить ИИ от того, что выдается за него? Должна быть база больших данных, модель и экономический эффект. Например, мы внедряем ИИ для модерации резюме в hh.ru. Сначала мы измеряли точность модерации, она должна была быть как у человека. 

Сейчас у нас 2/3 всех резюме модерируются автоматически. То есть если резюме, как мы говорим, «хорошие» — соответствуют определенным критериям, то с помощью технологии ИИ мы их автоматически подтверждаем, если у «машины» возникают сомнения, резюме попадают к модератору. Экономический эффект легко измерить — достаточно посчитать экономию от содержания штата модераторов.

Вы назвали параметры, по которым можно понять, действительно ли об ИИ идет речь, с точки зрения разработчика. А как понять потребителю, компании-заказчику, что перед ним то, что это ИИ, а не то, что продается как ИИ?
— Здесь нужно смотреть на метрики экономической эффективности в двух режимах — офлайн и онлайн. Приведу пример из нашей работы. Берем 1 млн резюме, которые уже прошли модерацию, их можно разделить на две части — одну взять для обучения модели, другую — для проверки точности этой самой модели. И речь, понятно, идет об офлайне. Второй этап проверки — в онлайне, когда у нас уже есть модель, проверенная в офлайне. Мы тестируем модель на одной половине аудитории, наблюдая за экономическим эффектом, а вторая у нас остается «нетронутой», чтобы было с чем сравнивать.

Еще конкретнее: мы сделали очередную версию модели для поиска вакансий и резюме, которую нужно проверить и подтвердить, что она работает лучше, чем предыдущая. Data scientists придумали такую гипотезу, что в выдачу вакансий (соискателям) и резюме (работодателям) нужно включать предложения о работе и резюме из соседних регионов, даже если ни те, ни другие напрямую этого не просили. Соответственно, мы «зашиваем» гипотезу в модель, а потом проверяем, способна ли такая поисковая выдача или, иначе говоря, рекомендательная система «генерить» больше откликов. Одной половине аудитории мы показываем старую модель, другой половине — новую, и сравниваем, какое количество откликов получено от первой и второй аудитории. Если от новой модели есть желаемый эффект, проверяем статистическую значимость (нет ли вероятности случайности в таких результатах), а затем уже используем ее на 100% аудитории. Но это работает только в том случае, если в итоге есть математически и статистически доказанные результаты.

Вспоминая недавние трагические истории с «Боингами», упавшими из-за программного сбоя, как все-таки быть с риском ошибки машины?
— С одной стороны, кажется, что те технологии, которые внедрены, вполне безопасны. Потому что до этапа широкого распространения они проходят огромное количество тестирований. Если посмотреть на проекты, реализованные в тех же автомобилях, будь то автопарковка, удержание полосы движения, а в дальнейшем и автопилот, все элементы внедряются постепенно. 

С другой стороны, ошибки случаются и, к сожалению, их цена может быть очень велика, и здесь вопрос скорее к предварительным этапам — разработке, тестированию и т.п.

Сейчас много говорят о том, что роботы заменят многие профессии. Что вы думаете по этому поводу? Насколько это актуально для ретейла, общепита?
— С заменой людей роботами все более-менее понятно. Есть работа, которая завязана на когнитивных функциях нашего мозга. Пока кажется, что ИИ будет постепенно, профессия за профессией, область за областью брать на себя сначала возможность давать рекомендации людям, которые принимают решения, затем ответственность делать это за человека. Со временем модели становятся более точными, они не требуют зарплаты, грубо говоря, им нужен лишь сервер и немного электричества.

И есть работа, где нужны физические усилия. Там уже усилий ИИ не хватает, там пригодятся физические интерфейсы, например роботы. Конечно, это не роботы из «Звездных войн». Все куда проще. К примеру, одна из сфер, которую ждут кардинальные перемены в ближайшее время, — это транспорт. Речь идет о беспилотных автомобилях. Применение ИИ и роботов в сфере транспорта дает потрясающий синергетический экономический эффект. Такие машины попадают в аварии на порядок меньше, чем под управлением человека. Возможно, мы увидим будущее, в котором законы будут запрещать людям водить машины.

К вопросу о том, попадает ли ретейл или общепит в зону опасности: если работодателю будет выгоднее, то есть дешевле, применять человеческие ресурсы, то он будет использовать их. Но сможете ли вы так же дешево масштабировать знания и навыки людей? Безусловно, если мы говорим об одном магазине, то условный кассир Мария, наверное, обойдется дешевле, чем ИИ. Однако ситуация меняется, если у вас тысяча таких Марий.

Чтобы масштабировать ИИ, практически ничего не нужно, ну, возможно, пригодится еще один сервер. У нас, например, на hh.ru постоянно растет количество соискателей, и есть два варианта — либо все время нанимать новых модераторов, при этом бизнес, очевидно, не очень хорошо масштабируется, либо автоматизировать процесс с помощью ИИ, что, конечно, дешевле.

По данным опроса, проведенного Службой исследований HeadHunter среди специалистов в области HR, вероятность замены человека ИИ по 10-балльной шкале в сфере розничной торговли составляет 5,1. Для сравнения: в банковской сфере этот же показатель, по мнению опрошенных, составляет 6,6, а в профобласти искусства и культуры — 1,8.

Машинное обучение в России применяется не только в подборе вакансий и резюме, но и при анализе сотрудников для продвижения. Как это устроено? Какие еще области HR можно улучшить за счет автоматизации и позволить принимать решения с минимальным участием человека, основываясь на данных?
— Есть очень много примеров. Я видел разные проекты, в том числе направленные на продвижение. Одна ретейл-компании, в которой есть грейды продавцов-кассиров, решила применить машинное обучение для кластеризации сотрудников. Что это такое? Это история, когда в работе сотрудников есть определенные критерии, которые касаются, например, финансовых показателей работы — выручки, продолжительности работы и т.п. Мы берем ИИ и систему машинного обучения, ставим задачу разделить всех кассиров-продавцов на группы так, как «машина» сочтет нужным. Предсказуемо получились кластеры по грейдам: старший кассир, средний и начинающий. С другой стороны, вышло так, что в группе старших кассиров по всем комплексным показателям оказались сотрудники из младших категорий. В компании их стали внимательно изучать с целью повышения. Плюс в том, что выводы делает «машина» непредвзято на основе имеющихся показателей.

С обучением другой механизм — здесь можно использовать рекомендательную систему. В чем она заключается? У вас есть сотрудник, которому нужно подобрать программу обучения в e-learning. Эту задачу хорошо решает ИИ. Он на основе big data находит сотрудников, похожих на нашего «подопечного», анализирует, какие курсы те проходили, и рекомендует их новичку. Это самый простейший алгоритм машинного обучения. Он, например, используется в интернет-магазине для подбора подходящих товаров, только вместо товаров можно подбирать курсы для сотрудников.

И третий проект — это предсказание увольнения. Смотрим профиль сотрудника, определяем критерии, например скорость и частоту ответов на электронные письма и прочее, и накапливаем данные в соответствии с этими критериями по предыдущим увольнениям сотрудников. Здесь машина учится делать предсказания, через какое время тот или иной сотрудник может покинуть компанию. Соответственно, если мы говорим о работниках, по которым есть performance review (обсуждение результатов работы за прошедший период между сотрудником и его непосредственным руководителем. — Ред.), мы можем сделать такое двухмерное ранжирование. Понимая, что ценный специалист готов уйти, работодатель может изменить его мотивацию и в итоге повлиять на решение остаться. Но есть сотрудники, которые работают плохо, и это уже другая история. Благодаря таким предсказаниям можно более четко и осознанно управлять персоналом.

Примеров может быть и больше. Главное, не пытаться в частных случаях находить закономерности вроде той, что, если человек медленно отвечает на входящие письма, это показатель грядущего увольнения. Наверное, с точки зрения подачи информации это очень круто звучит. Но я бы относился к таким выводам очень аккуратно. Все-таки нужна база. В системе, которую используем мы, учтены 500-600 критериев оценки. Они встроены в сложные блок-схемы, собственно, «машина», обучаясь, создает новые блок-схемы. Если говорить, например, про прогнозирование увольнения, то алгоритм выглядит примерно так: есть набор показателей, которые связаны между собой, будь то частота, с которой сотрудник пишет письма, если она меньше пяти писем — иди налево; или сроки работы — если специалист работает больше 3 лет — иди направо. И таких блок-схем свыше 10 тыс. с глубиной более 100 элементов. Пойди разберись, какая здесь закономерность.

Какие еще HR-функции уже взял или может освоить ИИ?
— Уже освоено все, что относится к верхней части воронки найма — привлечение, прескрининг и даже скрининг кандидатов. Исторически так сложилось, потому что это рутинные действия, там работает много людей и понятен экономический эффект от такого внедрения ИИ. Мой прогноз, что ИИ будет спускаться вниз воронки и захватывать отдельные этапы вплоть до отслеживания прохождения испытательного срока и выхода на перформанс.

Возможно ли то же самое с наймом топ-менеджеров?
— В hh.ru ИИ работает по трем сегментам — массовый, средний и топовый. Но наиболее эффективно, если судить по отзывам компаний, ИИ работает в отношении массового подбора. У федеральных компаний бюджет на массовый подбор может доходить до сотен миллионов рублей. Представьте, что этот процесс по какой-то метрике можно улучшить на десяток процентов, соответственно, можно сократить издержки на несколько миллионов рублей в год как минимум. Поэтому в массовом сегменте внедрение ИИ идет хорошо.

При найме middle- и senior-менеджеров ИИ в текущем виде применяется довольно слабо, только в самой верхушке воронки, то есть на этапе привлечения. В executive-подборе ИИ пока практически нет, это та область HR, где экспертиза людей просто незаменима, потому что данных, на основе которых может работать ИИ, очень мало. Даже с учетом того, что в нашей базе собраны тысячи резюме топ-менеджеров, сделать машинное обучение на этих данных сложно.

Каков минимальный объем данных, на основе которых можно делать машинное обучение?
— Начиная от 10 тыс. элементов. Чем меньше элементов, тем больше неточности в данных. Афоризм «Размер имеет значение» в данном случае на 100% оправдан. Чем больше данных, тем точнее модель. Так, федеральная ретейл-компания, через которую проходят 10 тыс. соискателей, может самостоятельно заняться машинным обучением и создавать свои модели.

В каких случаях важно, чтобы был свой отдел разработки ИИ, а в каких можно покупать готовые решения?
— Мои рекомендации такие: если та часть ИИ и машинного обучения, которую вы хотите заменить или усилить, относится к корпоративным компетенциям, то есть к конкурентным преимуществом компании, то все работы нужно делать внутри компании. Соответственно, если ИИ относится скорее к деятельности вспомогательной — можно смело использовать готовые продукты или аутсорсинг.

Поскольку у вас большая база персональных данных, то она представляет интерес для третьих лиц. В одном из интервью вы говорили, что компания получала такие коммерческие запросы и отказывала в них. Как защищаете информацию от кражи внутри компании?
— Сейчас таких запросов со стороны сторонних компаний немного, раньше они поступали, например, от банков, которые хотели получить данные наших клиентов для решения своих задач. Нам эта история неинтересна. Более того, мы блокируем компании, которые предпринимают противозаконные действия на нашем сайте, не связанные с подбором персонала, вплоть до судебных разбирательств. Внутри информацию мы тоже защищаем. Сами разработчики работают с обезличенными копиями данных.