Владимир Арлазаров, Smart Engines: Наш ИИ оформляет 100 новых сотрудников за 60 секунд
В России кадровая сфера активно переходит на цифровые рельсы: с 2020 года действуют электронные трудовые книжки, а документооборот с сотрудниками ведётся в рамках кадрового ЭДО. Однако ручной перенос информации из бумажных документов в учётные системы оставался трудоёмким рубежом. Именно эту проблему решает новое решение Smart Engines: искусственный интеллект на серверном процессоре автоматически распознаёт и загружает 100 пакетов кадровых документов всего за минуту. О том, как ИИ завершает цифровизацию кадровых процессов и повышает продуктивность HR-служб, в беседе с CNews рассказал генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
CNews: Сегодня на HR-рынке представлено множество ИИ-инструментов для анализа резюме и проведения собеседований. Чем уникально ваше решение? Какую функцию оно выполняет в процессе трудоустройства?
Владимир Арлазаров: Действительно, сейчас существует обширный спектр HR-технологий для поиска кандидатов. Но после утверждения кандидатуры перед отделом кадров встаёт следующая важная задача — официальное оформление нового работника. Требуется обработать множество документов: паспорт, дипломы, трудовую книжку, военный билет и другие. Ручной ввод информации занимает много времени — как у специалиста по кадрам, так и у самого сотрудника.
Именно с этой задачей справляется Smart Document Engine. Он автоматически идентифицирует и извлекает информацию из любых кадровых документов, включая сканы и нечеткие фотографии, а также бланки, заполненные от руки. В отличие от традиционных OCR-технологий, мы не останавливаемся на простом распознавании символов. Наш искусственный интеллект анализирует структуру документа в целом, а не только текст, что позволяет получать данные, полностью готовые к импорту в систему кадрового документооборота. Решение обрабатывает полный пакет документов за доли секунды и мгновенно возвращает извлеченную и упорядоченную информацию.
CNews: Какие виды и форматы документов уже способна обрабатывать ИИ-система Smart Engines, и возникала ли необходимость быстро добавлять совершенно новые типы?
Владимир Арлазаров: На текущий момент наша система поддерживает распознавание около 4,5 тысяч шаблонов документов со всего мира. Прежде всего, это российские удостоверения личности — паспорт, СНИЛС, ИНН, свидетельства о гражданском состоянии, а также обширный перечень образовательных документов — от школьных аттестатов и дипломов ВУЗов до ученых степеней, выданных в СССР и России, включая документы из соседних стран, являющихся источниками миграции.
Система также работает с бумажными трудовыми книжками и электронными формами СТД-Р, которые зачастую все равно распечатываются. По сути, охвачен весь спектр документов, необходимых для оформления трудовых отношений: от стандартных удостоверений до специализированных бумаг для отдельных профессий, таких как медики, педагоги, сварщики или машинисты.
При необходимости можно настроить обработку и собственных типовых бланков — например, согласий на обработку персональных данных или внутренних корпоративных анкет. Такие индивидуальные документы часто требуются при приеме на работу, и для упрощения этой задачи мы разработали конструктор форм. С его помощью настроить распознавание нового типа документа сможет любой сотрудник, не обладающий навыками программирования и без обращения к нашей поддержке.
CNews: Какие преимущества получает бизнес от внедрения вашего решения? Для каких отраслей оно наиболее востребовано?
Владимир Арлазаров: Мы сотрудничаем с заказчиками из различных отраслей. В первую очередь, это банковский сектор, страховые компании, розничная торговля, телекоммуникации, крупные промышленные предприятия и другие сферы с огромным документооборотом и штатом в сотни и тысячи человек. С экономической точки зрения наш ИИ выгоден всем средним и крупным компаниям, но чаще всего к нам обращаются в период активного роста. Например, когда необходимо быстро набрать большое число сотрудников, а отдел кадров не справляется с потоком документов. В такие моменты проблема оперативного ввода данных становится критической — для ее решения и создан Smart Document Engine.
После запуска платформы вся информация о кандидате заносится в базу данных. Это значительно увеличивает продуктивность HR-отдела, позволяя бизнесу развиваться без сбоев и бюрократических сложностей. Что касается финансовой выгоды, то заказчики видят ее практически сразу: расходы сокращаются, а удобство и надежность процессов заметно возрастают.
CNews: Насколько производительно ваше решение? Если специалисту по кадрам на внесение данных требуется, допустим, тридцать минут, то сколько времени займет обработка вашей системой?
Владимир Арлазаров: Наша команда проводила тестирование на стандартных пакетах документов, которые обычно нужны при оформлении сотрудника в типичных ситуациях. Такой пакет состоит из 12 документов: разворот паспорта с фотографией, страница с регистрацией, СНИЛС, права на вождение, свидетельства о заключении брака и о рождении, ИНН, трудовая книжка и СТД-Р, военный билет, заграничный паспорт и диплом о высшем образовании. Наша система на основе искусственного интеллекта продемонстрировала отличные результаты: 100 подобных комплектов она обрабатывает за 1 минуту без использования графических ускорителей. Время отклика составляет несколько секунд даже при максимальной нагрузке.
CNews: Благодаря чему достигается такая высокая производительность системы? Какие технологии лежат в основе платформы?
Владимир Арлазаров: Мы принципиально не применяем и не применяли готовые сторонние продукты при создании системы. Все математические модели и алгоритмы для распознавания были полностью разработаны нашими специалистами с нуля. Это основа нашего успеха. За каждой технологической составляющей стоят фундаментальные научные изыскания в сфере ИИ и современные методы анализа изображений. Наши исследователи являются авторами научных публикаций и патентов, среди них 5 докторов и 15 кандидатов наук. Именно этот глубокий профессиональный опыт позволил нам совершить прорыв и установить новые отраслевые стандарты.
CNews: Сможет ли система работать с документами, где информация внесена от руки?
Владимир Арлазаров: Пять лет назад, в 2020 году, мы выпустили первую версию системы, способную читать паспорта с рукописными записями. Нам пришлось решать сложнейшие исследовательские задачи, и мы по праву гордимся полученными итогами. Нами была создана нейросетевая архитектура «Да Винчи», которая сегодня корректно обрабатывает все страницы с рукописным текстом, включая штампы о регистрации. В профессиональной среде даже шутят, что кошмар для любой системы распознавания — это рукописное слово «шиншилла»: в отличие от печатного шрифта, в небрежном почерке зачастую непонятно, какие элементы относятся к какой букве. Напишите слитно слово «шиш», и вы увидите, в чем сложность. Однако мы нашли надежный способ справляться даже с этой задачей.
Наша технология позволяет распознавать рукописный текст в документах любого типа. Алгоритм считывает именно то, что написано от руки. В отличие от подходов, опирающихся на языковой контекст, мы не занимаемся «предположениями» или интерпретациями, а точно фиксируем содержание документа. В итоговый результат должно попасть только то, что было на физическом носителе, и наша цель — гарантировать предельно точное и безошибочное чтение даже самых трудных образцов.
CNews: Может ли ваша разработка быть полезна при оформлении на работу иностранных специалистов?
Владимир Арлазаров: Безусловно, и это касается не только стран СНГ. Наш искусственный интеллект умеет обрабатывать документы из Китая, Индии, Пакистана и любых других уголков планеты. Smart Document Engine работает более чем со ста языками, в том числе со сложными системами письма — грузинской, армянской, греческой графикой, ивритом, а также рядом азиатских — хинди, иероглифическими системами Китая и Японии.
Это становится критически важным при внесении и верификации документов, выданных за рубежом: здесь бизнес сталкивается с серьезной проблемой. Для сотрудника незнакомая форма, язык и расположение полей представляют собой существенное препятствие: где находится номер, где дата выдачи, как отличить имя от фамилии, что является серией, а что — кодом подразделения? Наша система снимает эту сложность: она «понимает», где в конкретном виде документа расположен каждый реквизит, и автоматически извлекает необходимые сведения.
CNews: Сейчас отмечается увеличение числа мошеннических операций с фальшивыми документами — подделывают как удостоверения личности, так и документы на обычных листах, например, дипломы или аттестаты. Помогает ли ваш продукт противостоять этим рискам?
Владимир Арлазаров: Да, подобные инциденты действительно обнаруживаются. Наша платформа включает специальную мультимодальную ИИ-модель «Шерлок 2o». Она может одновременно анализировать изображения документов в оптическом, ультрафиолетовом и инфракрасном диапазонах, видеозаписи с документом, текстовые поля, информацию с бесконтактной RFID-микросхемы, штрих-коды, метаданные и сигнатуры. В сумме модель проводит проверку по 600 параметрам и выявляет попытки подлога с минимальным процентом ложных тревог.
«Шерлок 2о» в комплекте с мультиспектральным сканером для паспортов уже используется, в частности, в аэропортах Шереметьево, Внуково и Кольцово, демонстрируя уровень, отвечающий государственным требованиям. Эти же решения мы предлагаем кадровым службам и компаниям, где необходим особенно строгий контроль при проверке соискателей.
CNews: Насколько трудоемка интеграция вашей системы с решениями для кадрового делопроизводства и электронного документооборота? Каков обычно средний срок внедрения?
Владимир Арлазаров: Встраивание нашего решения в системы кадрового электронного документооборота, как правило, проходит гладко. Мы изначально создали автономный модуль, который предлагает разнообразные варианты взаимодействия — от базовых протоколов до веб-сервисов. К примеру, платформу можно разместить в корпоративном ИТ-окружении и подключить к веб-интерфейсу для сотрудников отдела кадров. Способов интеграции хватает, чтобы оперативно адаптироваться под текущую ИТ-архитектуру заказчика.
Для ускорения внедрения мы предлагаем кроссплатформенный веб-сервер с REST API; Для глубокой работы с нашим API доступны библиотеки для Java, Swift/Objective C, Python, C#, JavaScript (WebAssembly), PHP, а также C/C++. Предоставляется Mobile SDK для iOS и Android с возможностью распознавания непосредственно на устройстве, WebAssembly SDK для работы в мобильном браузере без отправки изображений на внешние серверы. Также мы предлагаем готовые пакеты для React-Native и Flutter.
Мы обеспечиваем поддержку всех ключевых российских операционных систем — как для мобильных устройств, так и для серверов — и сохраняем совместимость с отечественными аппаратно-программными комплексами, включая платформу «Эльбрус».
CNews: Почему клиенту стоит предпочесть ваше on-premise решение с обработкой данных на своей стороне, учитывая, что текущий рыночный тренд смещается в сторону облачных технологий? Что является более корректным с позиции безопасности и соблюдения законодательства о персональных данных?
Владимир Арлазаров: Локальная обработка информации обладает преимуществом перед облачными сервисами, в первую очередь, с правовой точки зрения. Законодательство прямо обязывает получать согласие гражданина на передачу его персональных данных внешнему оператору, и право отказаться от такой передачи всегда сохраняется за человеком. Особенно в современной обстановке, на фоне участившихся инцидентов с утечками, кандидат может просто не дать разрешения на обработку своих данных третьей стороне.
При перемещении сведений в облако вся полнота ответственности за потенциальные утечки переходит к вам — к работодателю: вы фактически передаете информацию неизвестному внешнему исполнителю. В условиях ужесточения правовых норм и обсуждения введения уголовной ответственности подобные риски становятся особенно значимыми. Внутри организации данные в любом случае должны надлежащим образом храниться и защищаться, и у большинства заказчиков уже созданы соответствующие системы безопасности. Привлечение же внешнего сервиса по сути означает нарушение целостности защитного периметра.
Кроме того, во многих сервисах распознавания задействованы люди, которые вручную проверяют результаты работы искусственного интеллекта — а это создает дополнительный фактор риска. Их необходимость обусловлена недостаточно высоким качеством автоматической обработки. Наша же система построена согласно принципу «Только ИИ — без лишних участников».
CNews: Ваша система ориентирована на сокращение бюрократических процедур. Как, по вашему мнению, должен выглядеть идеальный процесс приема на работу?
Владимир Арлазаров: Оптимальное оформление сотрудников должно происходить предельно оперативно и удобно — без утомительного повторного ввода информации из бумажных носителей, административных задержек и других досадных моментов. Именно для этого и создан Smart Document Engine. Наша технология построена так, что единственным ограничением по скорости становится не обработка системой, а время, необходимое для загрузки сканов.
На деле это значит: стоит лишь сделать снимок документа, как информация сразу же готова к использованию, что существенно повышает продуктивность HR-специалистов и минимизирует риски неточностей. Такой подход гарантирует бесперебойную работу кадровых служб, позволяя сотрудникам действовать с наибольшей отдачей и уделять внимание ключевым задачам — общению с соискателями, адаптации новичков. Если же ваши HR-менеджеры всё ещё заполняют системы кадрового учёта вручную и переписывают документы при приёме на работу, вы неизбежно расходуете драгоценное время и средства.
■ Рекламаerid:2W5zFGnJXuiРекламодатель: ООО "СМАРТ ЭНДЖИНС СЕРВИС"ИНН/ОГРН: 7728328449/1167746085297Сайт: https://smartengines.com/