Для работы Нужно создать скрипт по распознаванию отсканированных pdf файлов, для того чтобы удалить те листы из файла, где встречается та или иная фраза, которую скрипт будет запрашивать.Текст русский. Прошу сразу заметить файл не в OCR формате, но нужно допустить и такой вариант. Как я это вижу 1. выбор файла 2. запрос на слово или словосочетание, например “привет“ 3. запрос на выпор пути для сохранения уже отработаноного файла и автоматическое создание файла именно удалённых листов. (допустим файл на 10 страниц, это слово встречается на 2,5,6 страницах, после всех махинации создаётся два файла, один на 7 страниц, где нет этого словосочетания, и один на 3 страницы, где оно есть. второй файл нужен для отслеживания удалённых страниц из основного файла)