У меня есть книга в формате PDF, созданная с помощью LATEXa. Текст поидее должен быть распознан. Но при попытке скопировать текст в ворд выдает абракабадру. Пробовал все виды Шрифтов в ворде, не получилось. Попробовал каким то левым редактором (в Origine Label) поменять (шрифт или кодировку) получилось, Но при копировании снова в ворд опять проблемы. При попытке сохранить весь PDF документ в doc выдает также ерунду. Как узнать в какой кодировке был записан PDF файл и побороть непонимание?
Acrobat Pro 7
В книге много формул
Если книга в PDF растровая, то пробуйте следующую процедуру:
1. Убедитесь что у вас установлен принтер ADOBE PDF;
2. Смените стандартные настройки принтера на свои, чтобы исключить сжатие любых объектов и обеспечте встраивание в текст фонтов TrueType и OpenType (хорошо бы Вам иметь современную библиотеку фонтов Adobe);
3. Распечатайте книгу с новыми настройками;
4. Распечатанный текст конвертируйте в Word.
P.S.
Acrobat 7 устарел, лучше пользоваться Acrobat 9.