Перейти к содержанию

Мастер настройки реестра

После загрузки файла Excel на экране «Реестры» программа открывает мастер настройки реестра. Здесь нужно объяснить программе, как устроена ваша таблица, какие колонки с какими полями документов сравнивать и по каким правилам искать совпадения.

Мастер состоит из двух вкладок, которые проходятся последовательно:

  1. Лист и парсинг --- выбор листа Excel, указание строк заголовков и данных, настройка фильтрации строк, импорт данных.
  2. Маппинг и поиск --- привязка колонок реестра к полям документа, выбор способа сравнения, настройка весов и правил, запуск поиска.

Мастер настройки реестра: общий вид

Заголовок мастера

В верхней части экрана расположены:

  • Кнопка «Назад» --- возврат к списку реестров.
  • Имя файла --- название загруженного файла Excel.
  • Подпись --- «Настройка импорта реестра» и пометка «Оригинал сохранён», означающая, что исходный файл хранится в системе и к нему можно будет вернуться.

Вкладки мастера

Под заголовком расположены две вкладки:

Вкладка Что делает Когда доступна
Лист и парсинг Выбор листа, настройка чтения таблицы, импорт строк Всегда
Маппинг и поиск Привязка полей, настройка правил, запуск сверки После успешного импорта

Текущая вкладка подчёркнута цветной линией. Завершённая вкладка помечается зелёной галочкой.


Вкладка Лист и парсинг

На этой вкладке вы указываете программе, как правильно прочитать загруженный файл Excel: какой лист использовать, где начинаются заголовки, где начинаются данные, какие строки пропустить.

Вкладка «Лист и разбор»

Основные настройки

В верхней части вкладки расположена строка с основными настройками:

Поле Назначение Как заполнить
Лист Выбор листа из файла Excel Выберите нужный лист из выпадающего списка. Рядом с каждым листом указано количество строк
Сумма Колонка с денежной суммой Если в реестре есть колонка с суммами, укажите её. Программа будет использовать эти значения при формировании итоговой таблицы
Результат Колонка для записи результата Если в реестре есть колонка, куда нужно записать итог сверки, укажите её. Эта колонка будет заполнена при выгрузке результатов
Заголовки Номер строки с заголовками колонок Укажите номер строки, в которой записаны названия колонок. Обычно это строка 1, но бывают реестры, где заголовки начинаются со строки 2 или 3
Данные с Номер строки, с которой начинаются данные Укажите номер первой строки с данными. Значение автоматически устанавливается на единицу больше строки заголовков

Заполнение пустых ячеек сверху вниз

Под основными настройками расположен ряд кнопок с названиями колонок. Это функция «заполнение пустых ячеек сверху вниз».

Заполнение пустых ячеек

Во многих реестрах значение в ячейке не повторяется на каждой строке, а записывается один раз для целой группы строк. Например, номер договора может быть записан только в первой строке, а следующие пять строк --- это акты по тому же договору, и ячейка с номером договора у них пустая.

Если включить заполнение для колонки, программа при импорте будет копировать значение из предыдущей непустой ячейки в пустые ячейки ниже. Так каждая строка получит полный набор данных, и сверка будет точнее.

Чтобы включить заполнение:

  1. Найдите нужную колонку среди кнопок.
  2. Нажмите на неё --- кнопка станет выделенной.
  3. Чтобы отключить, нажмите повторно.

Выделенные кнопки означают, что для этих колонок заполнение включено.

Переопределение строки заголовка для отдельной колонки

Иногда в реестре заголовки разных колонок находятся на разных строках --- например, основные заголовки на строке 3, а у одной колонки заголовок на строке 2 (потому что колонка объединена с соседней).

Чтобы указать другую строку заголовка для конкретной колонки:

  1. Нажмите на заголовок колонки в таблице предпросмотра.
  2. В появившемся окне укажите номер строки, откуда нужно взять заголовок.
  3. Нажмите «OK».

Колонка с переопределённым заголовком подсвечивается оранжевым цветом, а рядом с названием показывается номер строки в скобках.

Чтобы сбросить переопределение, нажмите на заголовок и затем кнопку «Сброс».

Фильтрация строк

Под настройками заполнения расположен блок фильтрации строк. Он позволяет исключить из импорта строки, которые не являются данными, --- например, строки с промежуточными итогами, подзаголовками разделов или примечаниями.

Фильтрация строк

Настройка Назначение Пример
Пропускать строки со словами Если строка содержит любое из перечисленных слов, она будет пропущена при импорте Введите через запятую: ИТОГО, стр., Всего
Обязательная колонка Если указана, строки с пустой ячейкой в этой колонке будут пропущены Выберите колонку с номером документа --- строки без номера будут исключены
Мин. ячеек Минимальное количество заполненных ячеек в строке. Строки с меньшим количеством считаются пустыми и пропускаются Укажите 2 или 3, чтобы отсеять почти пустые строки

Предпросмотр данных

В нижней части вкладки расположена таблица предпросмотра. Она показывает, как программа прочитает ваш файл с текущими настройками.

Предпросмотр данных из Excel

До импорта в таблице отображается содержимое файла Excel. Заголовок области показывает «Предпросмотр Excel» и размер листа (количество строк и колонок).

После импорта таблица переключается на отображение импортированных данных: она показывает «Импортированные данные» и число импортированных строк с зелёной галочкой.

Если при импорте были исключены строки (по правилам фильтрации), под основной таблицей появляется отдельная жёлтая область «Исключённые строки при импорте». В ней перечислены все строки, которые программа пропустила, --- можно проверить, что ничего нужного не потерялось.

Импорт и переход к следующему шагу

Под таблицей предпросмотра расположены кнопки действий:

Кнопка Что делает
Импортировать Сохраняет настройки чтения и загружает строки реестра в базу данных программы. Во время импорта отображается полоса прогресса
Переимпортировать Если данные уже были импортированы, кнопка позволяет повторить импорт с новыми настройками. Старые данные будут заменены
Далее Переход на вкладку «Маппинг и поиск». Доступна только после завершения импорта

Рядом с кнопками расположена подсказка «Импортируется один выбранный лист», напоминающая, что программа работает только с одним листом за раз.

Если импорт завершился ошибкой, появляется красное сообщение с описанием проблемы. Во время импорта кнопки недоступны, а под ними отображается полоса прогресса с процентом выполнения.


Вкладка «Маппинг и поиск»

На этой вкладке вы настраиваете правила, по которым программа будет сравнивать строки реестра с документами из архива.

Вкладка «Маппинг и поиск»

Пример данных

В верхней части вкладки показана небольшая таблица с примером данных из реестра --- первые несколько строк. Это помогает вспомнить, какие колонки есть в реестре и какие значения в них содержатся.

Правила сопоставления

Основная часть вкладки --- блок «Правила сопоставления». Правило --- это набор указаний программе: какие колонки реестра с какими полями документа сравнивать и насколько каждое сравнение важно.

Правила сопоставления

Можно создать несколько правил. Это полезно, когда в одном реестре собраны документы разных типов, и каждый тип нужно искать по-своему. Например, для договоров важны номер и дата, а для счетов --- номер и сумма.

Заголовок правила

Каждое правило отображается в виде карточки с заголовком:

Элемент Назначение
Флажок включения Включает или выключает правило. Выключенное правило не участвует в поиске, но сохраняется для дальнейшего использования
Название правила Произвольное имя для удобства. При редактировании можно изменить
Сводка Количество полей и минимальный порог совпадения
Кнопка «Изменить» Открывает правило для редактирования
Кнопка удаления (x) Удаляет правило. Нельзя удалить последнее активное правило

В свёрнутом виде под заголовком правила показана краткая сводка: список колонок, по которым идёт поиск. Если у правила есть подправила, рядом отображается их количество.

Редактирование правила

При нажатии на «Изменить» правило раскрывается, и появляются настройки.

Редактирование правила

Минимальный балл совпадения

Ползунок «Мин. score» задаёт порог: если итоговый балл совпадения для документа окажется ниже этого значения, документ не будет считаться подходящим. По умолчанию порог установлен в 70%.

Как выбрать правильный порог:

  • Если установить слишком высокий порог (например, 90%), программа будет находить только очень точные совпадения и может пропускать документы с небольшими расхождениями (опечатка в номере, другой формат даты).
  • Если установить слишком низкий порог (например, 30%), программа будет показывать много ложных совпадений --- документы, которые на самом деле не подходят.
  • Рекомендуемое значение --- 60--80%, в зависимости от качества данных.
Таблица полей

Ниже расположена таблица, в которой перечислены поля правила --- каждое поле описывает одну пару «колонка реестра -- поле документа»:

Колонка таблицы Что означает
Поле документа Какое поле распознанного документа сравнивать. Можно выбрать из списка готовых полей (режим «Пресет») или указать конкретные атрибуты вручную (режим «Свой»)
Колонка реестра Из какой колонки реестра брать значение для сравнения
Вес Насколько важно это поле при подсчёте итогового балла (число от 0 до 100)
Метод Способ сравнения значений

Под таблицей показана сумма весов всех полей. Рекомендуется, чтобы сумма составляла 100, но это необязательно. Если сумма весов ниже минимального порога, появляется предупреждение красным цветом.

Кнопки под таблицей:

  • + Добавить поле --- добавляет новую строку в таблицу полей.
  • + Подправило --- добавляет подправило (подробнее ниже).

Что такое «вес поля» и «минимальный балл совпадения»

Вес поля --- это число, которое показывает, насколько важно совпадение по этому полю по сравнению с другими. Чем больше вес, тем сильнее это поле влияет на итоговый балл.

Пример. Допустим, вы настроили три поля:

Поле Вес
Номер договора 40
Дата 30
Контрагент 30

Программа нашла документ, у которого совпали номер и контрагент, но дата отличается. Итоговый балл составит 40 + 30 = 70 из 100. Если минимальный порог установлен в 70%, документ будет считаться найденным. Если порог --- 75%, документ не пройдёт.

Другой пример. Если у поля «номер договора» вес 40, а у «даты» --- 20, то совпадение по номеру важнее, чем по дате. Документ с правильным номером, но неточной датой получит более высокий балл, чем документ с правильной датой, но другим номером.

Минимальный балл совпадения --- это порог, ниже которого программа не считает документ подходящим. Если итоговый балл документа оказался ниже порога, этот документ отбрасывается и не попадает в результаты.

Режимы выбора поля документа

Для каждого поля в правиле можно выбрать один из двух режимов:

Режим «Пресет»

В этом режиме вы выбираете поле из заранее настроенного списка. Каждый пресет --- это заранее заданная конфигурация, которая определяет, в каких атрибутах документа искать значение и как его сравнивать. Список пресетов настраивается на экране «Настройки» в разделе «Поля для поиска».

При выборе пресета автоматически подставляются рекомендуемые значения веса и метода сравнения.

Режим «Свой»

В этом режиме вы самостоятельно указываете, в каких атрибутах документа искать значение. При нажатии на кнопку «Атрибуты» открывается всплывающее окно со списком всех доступных атрибутов, разбитых на две группы:

  • Из содержимого --- поля, извлечённые программой при распознавании документа: номер, дата, стороны договора, контрагент, суммы, номер договора, системный номер, месторождение, название проекта, название позиции.
  • Из имени файла --- поля, извлечённые из имени файла по специальному шаблону: тип реестра, бухгалтерский номер, СПП-элемент, контрагент, договор, дата, номер акта.

Отметьте галочками нужные атрибуты. Рядом с кнопкой «Атрибуты» показывается число выбранных атрибутов.

Способы сравнения (методы)

Для каждого поля в правиле нужно указать способ сравнения --- как именно программа будет сопоставлять значение из реестра со значением из документа.

Метод Описание Когда использовать
Точное Значения должны совпасть полностью (с учётом приведения к единому виду) Для номеров документов, номеров договоров и других точных реквизитов
Нечёткое Учитывает небольшие расхождения: опечатки, пропущенные символы, разный порядок слов Для названий контрагентов, наименований, текстовых полей
Диапазон Значения считаются совпавшими, если разница между ними не превышает заданного допуска Для дат (допуск в днях) и сумм (допуск в процентах)
Пересечение Одно значение содержится внутри другого как подстрока Для случаев, когда в документе записано полное название, а в реестре --- сокращённое, или наоборот

При выборе метода «Диапазон» под выпадающим списком появляется дополнительное поле --- допуск. Оно задаёт величину допустимого расхождения:

  • Для дат --- это количество дней. Например, если допуск равен 3, то даты, отличающиеся не более чем на 3 дня, будут считаться совпавшими.
  • Для сумм --- это процент. Например, если допуск равен 5, то суммы, отличающиеся не более чем на 5%, будут считаться совпавшими.

Подправила

Подправила --- это дополнительные условия, которые кандидат должен выполнить помимо основного правила. Документ должен пройти проверку по основному правилу и хотя бы по одному из подправил.

Подправила полезны, когда нужно добавить уточняющее условие. Например, основное правило ищет по номеру и дате, а подправило дополнительно проверяет совпадение по сумме или по контрагенту.

Подправила

Каждое подправило имеет:

  • Флажок включения --- можно временно отключить подправило.
  • Название --- произвольное имя.
  • Минимальный балл --- отдельный порог для подправила.
  • Таблицу полей --- аналогичную основному правилу, но обычно с меньшим числом полей.

Кнопки управления подправилами:

  • + Подправило --- добавить новое подправило к текущему правилу.
  • Кнопка удаления (x) --- удалить подправило.
  • + Поле --- добавить поле в подправило.

Несколько правил

Можно создать несколько правил, нажав кнопку «+ Добавить правило» под списком правил. Это полезно, когда в одном реестре перечислены документы разных типов, и каждый тип нужно искать по своему набору полей.

Рядом с кнопкой добавления расположен выбор режима работы нескольких правил:

Режим Как работает
Все подходящие Программа проверяет каждое правило и собирает все найденные совпадения. Если один документ подошёл по нескольким правилам, он появится в результатах с указанием каждого правила. Это режим по умолчанию
Первое сработавшее Программа проверяет правила по порядку и останавливается на первом, по которому нашлось совпадение. Остальные правила для этой строки не проверяются

Как выбрать режим:

  • Все подходящие --- используйте, если хотите увидеть полную картину, какие документы подходят по каким правилам. Подходит для большинства задач.
  • Первое сработавшее --- используйте, если правила упорядочены от более строгого к менее строгому, и вас интересует только лучшее совпадение.

Сохранение и запуск поиска

В нижней части вкладки расположены две кнопки:

Кнопка Что делает
Назад Возврат к вкладке Лист и парсинг
Запустить поиск Сохраняет настроенные правила и запускает сверку строк реестра с документами из архива. После запуска программа переходит на экран «Результаты по реестру»

Кнопка «Запустить поиск» доступна только при выполнении следующих условий:

  • Есть хотя бы одно активное правило.
  • У каждого активного правила хотя бы одно поле используется для поиска.
  • Сумма весов у каждого активного правила больше нуля.

При нажатии на кнопку программа сначала сохраняет правила на сервер, а затем запускает поиск. Во время сохранения и запуска кнопка становится неактивной и показывает вращающийся значок.


Типичный порядок действий

  1. На вкладке Лист и парсинг выберите нужный лист.
  2. Проверьте, что номер строки заголовков и начала данных указаны правильно --- таблица предпросмотра должна показывать корректные данные.
  3. Если в колонках есть объединённые ячейки, включите заполнение сверху вниз для этих колонок.
  4. Если в реестре есть строки с итогами или заголовками разделов, настройте фильтрацию: укажите ключевые слова, обязательную колонку или минимальное число заполненных ячеек.
  5. Нажмите «Импортировать» и дождитесь завершения. Проверьте число импортированных строк и убедитесь, что в исключённых строках нет нужных данных.
  6. Нажмите «Далее» для перехода к настройке правил.
  7. На вкладке «Маппинг и поиск» нажмите «Изменить» на первом правиле.
  8. Для каждого поля выберите колонку реестра, поле документа, вес и метод сравнения.
  9. При необходимости добавьте дополнительные поля, подправила или новые правила.
  10. Настройте минимальный балл совпадения.
  11. Выберите режим работы нескольких правил, если создали больше одного.
  12. Нажмите «Запустить поиск».