Ау кто шарит в спецификации формата pdf

Ау кто шарит в спецификации формата pdf
Задача: есть набор файлов формата pdf.
Часть из них с текстовым слоем. Часть без текстового слоя. Вперемешку.
Нужно их рассортировать, чтобы потом те, что без текстового слоя прогнать через Файн Ридер.

Сейчас это делается вручную – открывается файл Фокситом и осуществляется попытка запустить поиск по тексту.

Задолбался уже. Вторую неделю сижу. Может кто знает где там в спецификации pdf метка наличия текстового слоя? Можно ли эту метку увидеть например Тоталом или может есть какой плагин к Тоталу?

Помогите – глаза уже вылазят а еще 2000 файлов.
Была ли полезна информация?
Если тока в свойства файла залазить - закладка "PDF" (в виндовз командере по крайней мере есть такое), и параметр "Fast Web View" - "yes" - с текстом, "no" - без
Оно ?
Была ли полезна информация?
А нельзя просто перевести с помощью CORELDRAW все файлы в векторный или точечный формат, а затем вернуть в PDF ? (ахинея какая-то :oops: )
Была ли полезна информация?
Сергей, попробуйте программами тестового поиска типа Архивариуса или Яндекс Десктопа. Если создать базу только из папки с пдф"ами и задать поиск простого слова ?предлога?, то будет выдан список всех книг с текстовым слоем. Архивариус предоставляет возможность экспорта списка в файл, можно сразу в xml.
Делаете список всех файлов в каталоге командой dir /b >c:\list.txt (из командной строки, вызывается пуск-выполнить-cmd :D ), открываете этот файл и сохраняете его в виндозную кодировку (Total'овским Alkel Pad'ом - он изначально в досовской 866). Открываете этот файл Excel'ем - получаем название книги - строка первой колонки.
Во вторую колонку (или как Вам нравиться) вставляете список книг с текстовым слоем.
Создаем новый лист с командой для каждой ячейки =ГИПЕРССЫЛКА('Список книг'!A1) и т.п, клонируем обе колонки. Теперь, щелкая мышкой книга будет открываться в программе по умолчанию для пдфов.
Далее, экспортируем файл в Access, там есть возможность сортировок колонок по алфавиту (или так как понравиться).
Или сразу сравниваете колонки. Или можно еще другими программами. Главное на выходе получить список файлов без текстового слоя и дело в шляпе.

Извиняюсь за запутанность пути, заумность, излишний детализм и т.д, т.к. пишу на коленке на производстве.
Метод по крайней мере рабочий.
Была ли полезна информация?
Читают тему (гостей: 2)