Роль искусственного интеллекта в автоматизации документооборота
Автоматизация работы с документами традиционно представляла собой сложную задачу в рамках цифровизации бизнес-процессов. Системы, основанные на жёстких правилах, часто оказывались недостаточно гибкими, чтобы справляться с огромным разнообразием неструктурированных файлов. Множество форматов, видов и вариантов текста препятствовало созданию по-настоящему эффективных решений.
С приходом технологий искусственного интеллекта обработка документов вышла на качественно новый уровень, а на рынке появились поставщики, предлагающие уникальные программные инструменты.
Например, в текущем году ИТ-компания «Дом.рф Технологии» представила инновационную платформу Dom.IDP. Её разработка основана на принципиально новом подходе, который объединяет сильные стороны двух технологических направлений: точность и скорость классических машинных алгоритмов для извлечения информации с глубоким контекстным анализом, который обеспечивают современные большие языковые модели.
Благодаря этому решению организациям уже удалось достичь следующих результатов:
- ускорить бизнес-процессы на 17%
- поднять производительность труда на 15%
- снизить операционные расходы на 11%
- повысить точность данных на 7%
О том, как устроена эта платформа и какие бизнес-задачи она помогает решать, читайте в материале CNews.
Развитие технологий для автоматизированной обработки документов
Дорога к автоматизации документооборота была длительной и постепенной. Изначально вся обработка выполнялась вручную: сотрудники тратили много времени на изучение сканированных или цифровых документов, чтобы перенести нужные сведения в корпоративные системы. Этот процесс отличался низкой скоростью, высокой стоимостью и значительным количеством ошибок.
С появлением цифровых технологий начали создаваться первые автоматизированные системы, основанные на фиксированных правилах (rule-based). Такие решения могли обнаруживать в тексте конкретные слова, заданные последовательности символов по четким шаблонам (скажем, «ИНН» или «кадастровый номер») или информацию в строго определенных позициях. Это был прогресс, однако у метода обнаружился существенный минус — его неустойчивость. Малейшее отклонение от ожидаемого формата: измененный вид документа, перегруппировка разделов, иная формулировка — вызывало ошибку. Система не «осмысливала» содержимое, а лишь механически выполняла заложенные инструкции.
Подлинный скачок вперед обеспечило машинное обучение (Machine Learning, ML). Вместо ручного прописывания правил, специалисты стали обучать ML-модели, которые сами выявляют закономерности, изучая обширные коллекции размеченных документов. Алгоритмы обрели способность определять тип документа, находить и выделять необходимые поля (даты, суммы, реквизиты) даже в неструктурированных текстах, став гораздо более гибкими к вариациям в оформлении. Но и у ML есть свои ограничения: для обучения необходимы крупные массивы данных, а модель может не распознать документ, радикально отличающийся от примеров в обучающей выборке. Для ситуаций, когда информацию нужно извлекать из документов моментально, без длительной подготовки, применяются большие языковые модели (LLM) по технологии RAG (Retrieval-Augmented Generation). Ее сильная сторона — отсутствие необходимости в предварительном обучении или разметке данных. Модель самостоятельно интерпретирует содержание документа и извлекает из него требуемые сведения, следуя лишь пользовательскому запросу. Это решение «на лету» для оперативной работы с документами любого вида.
Таким образом, ML незаменим для обработки значительных массивов данных, гарантируя:
- Оперативность и результативность.
- Экономичность и удобство применения.
- Точность и возможность тонкой настройки.
- Прогнозируемость и полный контроль над итогом.
LLM предоставляют уникальные преимущества:
- Смысловое глубокое понимание текста, включая эмоциональную окраску и цели.
- Ответы на комплексные вопросы, к примеру, об условиях прекращения соглашения.
- Мгновенное выделение сущностей без этапа предобучения.
Выбор между ML и LLM определяется конкретной задачей, требуемой скоростью и имеющимися ресурсами. Умелое комбинирование этих технологий — залог достижения наивысшей продуктивности в документообороте.
Dom.IDP предлагает всеобъемлющий набор сервисов для автоматизации работы с документами, интегрируя возможности как машинного обучения, так и больших языковых моделей.
«Даже в условиях активного перехода в цифровой формат, многие бизнес-задачи по-прежнему требуют работы с неструктурированной текстовой информацией. Обработка текстовых файлов, их отсканированных копий или фотографий остается неотъемлемой частью практически любого рабочего процесса. Именно поэтому мы определили Dom.IDP и технологии обработки естественного языка как одно из ключевых стратегических направлений нашей деятельности», — подчеркнул Григорий Грязнов, руководитель исследовательского и конструкторского подразделения «ДОМ.РФ Технологии».
Dom.IDP: инновационный подход к работе с документами
Платформа Dom.IDP представляет собой не просто набор отдельных утилит, а комплексную экосистему, охватывающую полный цикл взаимодействия с документом.
Она выполняет анализ, категоризацию и преобразование информации, отправляя упорядоченные данные во внешние системы в автоматическом режиме. Система эффективно работает с широким перечнем документов, в том числе с бухгалтерской первичной документацией, договорами долевого участия (ДДУ) и купли-продажи (ДКП), а также с личными документами граждан, включая паспорта РФ, а в перспективе — СНИЛС и свидетельства о рождении. При этом гибкость платформы дает возможность адаптировать ее под обработку даже самых нестандартных типов документов, что делает ее универсальным инструментом для автоматизации документооборота в компаниях любого профиля.
«Платформа извлекает данные из документов различных форматов, позволяет внедрить интеллектуального ИИ-ассистента и удобного чат-бота, автоматизирует обработку документов всех видов, систематизирует и организует информацию, а также легко встраивается в действующие CRM и ERP-системы. Это решение, которое помогает компаниям достичь качественно нового уровня эффективности в управлении информацией», — заявил генеральный директор «ДОМ.РФ Технологии» Александр Лукьянов.
На сегодняшний день система включает в себя ряд сервисов, предназначенных для решения различных задач и поддержки бизнес-процессов.
Сервис для точного извлечения данных из документов сложной структуры
Dom.IDP предоставляет предварительно обученные высокоточные модели для выделения ключевых полей из неструктурированных и распространенных типов документов. Например:
- Договоры долевого участия (ДДУ): автоматически распознаются сведения о строящемся объекте, покупаемом помещении, его стоимости и сроках завершения строительства. Это ускоряет обработку данных в процессах, связанных с ипотечным кредитованием и покупкой объектов на этапе строительства.
- Паспорта РФ: извлечение необходимых данных со скана или фотографии документа: ФИО, пол, серия и номер, дата и место рождения, дата выдачи, код и название выдавшего подразделения.
- Первичные бухгалтерские документы (счета-фактуры, УПД, акты): сервис позволяет получить следующую информацию: номер и дату документа, реквизиты договора, общие суммы (включая НДС), размер НДС, наименования организаций и ФИО ответственных лиц.
Сервис автоматической категоризации документов
Система с высокой точностью распознает тип загружаемого документа, что служит ключевым первоначальным этапом для его последующей автоматизированной обработки. После анализа документ относится к одному из заданных классов, таких как «паспорт РФ», «ДДУ», «счет-фактура», «счет», «договор», «УПД», «акт», «акт-сверки», «дополнительное соглашение», «справка о стоимости», «спецификация» или «приложение». Это дает возможность автоматически распределять документы по нужным бизнес-процессам, исключая ручной труд и существенно увеличивая производительность.
Сервис «ИИ-помощник» (режим RAG)
Это современный инструмент для интерактивного взаимодействия с документами, основанный на больших языковых моделях (LLM) в парадигме RAG (Retrieval-Augmented Generation). Пользователь может загрузить документ, например, объемный договор на 30-50 страниц, и задать вопрос простыми словами: «Какие штрафные меры применяются к заказчику при задержке платежа?». Система не ограничивается поиском по ключевым словам, а интерпретирует суть запроса, находит соответствующие фрагменты в тексте и предоставляет ясный, содержательный ответ на естественном языке. Сервис позволяет мгновенно извлекать нужные сведения из больших документов без необходимости их детального изучения. Предварительная настройка модели под конкретные типы документов не требуется.
Станция проверки (Human-in-the-Loop)
Удобный и мощный пользовательский интерфейс, созданный для контроля качества результатов работы алгоритмов платформы. Оператор видит исходный документ и итоги его автоматической обработки (извлеченные данные, классификацию). Он может оперативно проверить и, если нужно, скорректировать работу искусственного интеллекта. Это гарантирует стопроцентную точность выходных данных благодаря быстрой проверке и правкам. Корректировки, внесенные оператором, используются для дальнейшего обучения моделей, повышая их интеллект с каждым циклом. Для проверки результатов не нужны специальные навыки.
Универсальный API-интерфейс
Гибкий программный интерфейс обеспечивает интеграцию возможностей Dom.IDP в любые корпоративные системы и бизнес-процессы. Через API можно отправлять документы на обработку и получать структурированные, машиночитаемые данные в формате JSON.
От бухгалтерии до отдела кадров
Интеллектуальная платформа обработки документов — это универсальное решение, которое автоматизирует рутинные задачи и повышает эффективность работы с информацией в различных департаментах компании.
Для бухгалтерских и финансовых подразделений система обеспечивает автоматическое считывание данных из счетов, актов и банковских выписок, что существенно ускоряет работу с финансовой документацией. Юристам она предоставляет эффективный сервис для изучения контрактов и оперативного выявления важных положений, экономя время на правовой оценке и минимизируя потенциальные риски. В области закупок и логистики решение позволяет результативно работать с накладными, чеками и ТТН, совершенствуя управление поставками и отслеживание перемещения товаров. Службы по персоналу получают возможность автоматизировать обработку резюме и трудовых соглашений, облегчая найм и оформление сотрудников. Кроме того, для транзакционного бизнеса платформа даёт функцию автоматизированной работы с договорами долевого участия и актами приёма-передачи, ведения реестров недвижимости с автообновлением информации, а также проверки арендных договоров, что крайне важно для организаций, активно работающих с объектами недвижимости.
«Наша платформа интеллектуальной обработки документов — это инновационное предложение, которое объединяет передовые технологические разработки и ощутимую практическую ценность для компаний, — подчёркивает Николай Козак, управляющий директор по ИТ и цифровой трансформации ДОМ.РФ. — В ДОМ.РФ она превратилась в ключевой инструмент для работы с документацией. Изначально платформа была запущена в Банке ДОМ.РФ для ускорения обработки ДДУ в ипотечных операциях. Это помогло резко уменьшить долю ручных операций и исключить неточности при оформлении заявок. В настоящее время мы расширяем сферу применения ИИ-платформы на другие бизнес-задачи, и она уже способна анализировать множество разнообразных документов».
Перспективы автоматизации — в объединении технологий
Современные системы обработки документов подошли к критической черте, когда ни один отдельно взятый метод — ни традиционное машинное обучение, ни новейшие большие языковые модели — не способен гарантировать безупречный итог. Гибридная концепция, реализованная в Dom.IDP, наглядно показывает, что дальнейшее развитие лежит не в конкуренции технологий, а в их грамотном объединении и взаимном усилении. Платформа гармонично совмещает точность, простоту и быстроту ML-алгоритмов с глубоким смысловым анализом текстов, характерным для LLM, находя для каждого подхода наилучшее применение в общем цикле работы с документами.
Dom.IDP является закономерным шагом вперёд в эволюции Intelligent Document Processing (IDP). Такой метод даёт возможность не только компенсировать собственные недостатки каждого из подходов по отдельности, но и вывести автоматизацию бизнес-процессов на принципиально более высокий уровень.
■ Материал подготовлен при поддержкеerid:2W5zFJSUfQCОрганизация: АО «ДОМ.РФ»Реквизиты: ИНН 7729355614 / ОГРН 1027700262270Перейти на сайт: www.domrf.ru