Я тоже решил проверить, не впал ли я в маразм
.
Недавно отсканил книжку по газодинамике - 376 стр., подготовленна в кромсаторе, ч/б тифы в 600 dpi общим объемом 50 946 940 байт.
Кодирование профилем по умолчанию bitonal(600), размер выходного файла 6 997 743 байт.
Кодирование на основе тогоже профиля, но словарь один на всю книгу - 5 166 760 байт.
Разница более чем в треть
. Что я сделал не правильно
.
Для очистки совести, тоже самое, но один словарь на 200 стр. - 5 302 001 байт.
Как тут правильно заметили, результат очень сильно зависит от исходного материала. Например, просили тут книжку по суперструнам, ничего в них не понимаю, но была она в пределах доступности, вот и сделал,
посмотреть можно здесь, размер книги получился 6 615 678 байт на 642 стр., и это с учетом внедренного распознанного текстового слоя и двух жирных обложек. А все почему, да потому что книга была напечатана на бумаге типа офисной 80 гр/м^2, что для книг до 95 года издания, как мне кажется редкость. Хотя есть люди, которые специально немного ужирняют результат, что приводит к заметно лучшей степени сжатия.