2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2, 3, 4, 5, 6, 7 ... 9  След.
 
 
Сообщение21.05.2006, 13:35 
Аватара пользователя
Ленинград
Просто, интереса ради, перекодировал Вашу книгу. Т.е. распустил ее на тифы, для этого можно использовать программу DjvuOCR в режиме Djvu Decoder (обложку сохранил отдельно), и перекодировал с одним словарем на всю книгу. Было 5 336 493 байта, стало 3 923 972 (если кодировать из оригинальных тифов, размер наверное будет +- Х байт, что не существенно). На треть меньше. Как говорится, хозяйке на заметку.
А вот с иллюстрациями это конечно беда.
С одной стороны, наличие фотографий волей не волей заставляет Вас переходить на сканирование в сером, не отвертеться!
С другой стороны, дополнительный труд.
То как я делал в таких случаях (очень у меня редких) не может служить примером. Для примера привожу одну страничку 150 кб. Тут можно выделить два аспекта, по-видимому, можно сделать и получше, и главное это размер! Хотя в данном случае, размер это зло с которым приходится мириться. Но что-то мне подсказывает, что есть рецепты (в том же кромсаторе надо бы порыться, недаром же bolega над этим работал).
Еще раз повторяю, Вам с фотографиями надо как-то бороться, это же иллюстрации в учебнике!
Вот еще, после раскодирования Вашей книги, обратил внимание на плавающий размер страниц. Вы это в ручную нарезали? Т.е. делали превью, выделяли область сканирования, сканировали? Если все было так, то это жуткое растрачивание времени, минимум в 2 раза! Скорость, при правильной организации процесса, практически ограничивается только физической скоростью сканера, каретка должна ходить без пауз.

 
 
 
 
Сообщение21.05.2006, 13:53 
vadimir писал(а):
каретка должна ходить без пауз.

Это Вы, батенька, загнули... А если книга "толстая"? Пока лист перевернуть, "приладить" к стеклу, прижать, на кнопку нажать... Время возврата каретки явно меньше.

 
 
 
 
Сообщение21.05.2006, 14:17 
Аватара пользователя
Judge_AK
Что, и у Вас OpticBook 3600 :shock:?

 
 
 
 
Сообщение21.05.2006, 14:52 
vadimir
Пока нет(надеюсь, что пока) :)
И для обычных сканеров надо быть "метеором", чтобы успеть выполнить все операции за время возврата каретки.

 
 
 
 
Сообщение21.05.2006, 18:14 
Judge_AK писал(а):
"контраст" и "порог" для меня такая же загадка, как и для Вас :) Играюсь только яркостью. Летом надеюсь ликвидировать этот пробел.
А точно 1-нопиксельные? Мне интересно как это на бумаге смотрится.
Чтобы они не пропадали в СК надо отключить despeckle для таких страниц или же попробовать поставить режим Safe.
Если ч/б страницы в 600 дпи, то можно с помощью закладок Convert и Quality "ужирнить" буквы. В этом направление "готовых рецептов" дать пока не могу - ещё только опыты провожу :roll:

О, я наоборот, яркость не трогаю вообще, контраст - редко, а в основном мучаю порог. Яркость я не понял на что влиять должна, я на глаз ничего не вижу. Порог наиболее понятный, больше порог - тоньше линии. Контраст - наоборот, но для хорошей бумаги если немного увеличить и контраст, и порог - больше мелких деталей сохраняется.
В кромсаторе я вчера попробовал не выключая Despeckle, включить Sand Despeckle, в enhance поставил Smooth=1, Blur=1, Sharpen=5 - сносно получилось.
А Convert разве влияет на изначально ч/б изображения?

Как эти тонкие линии на бумаге выглядят - завтра в институте посмотрю. Может быть, имеет смысл книгу пересканировать с более правильными настройками.

 
 
 
 
Сообщение21.05.2006, 19:42 
Извините, сейчас отвечаю впопыхах, нет времени.
vadimir Если не сложно скиньте эту страницу на Webfile, ну или посредством ПС.
Judge_AK спасибо за совет попробую.

 
 
 
 
Сообщение21.05.2006, 19:46 
sonte
Цитата:
А Convert разве влияет на изначально ч/б изображения?

Влияет-влияет(сам не так давно узнал) - если стоит Normal, то фильтры сделают своё дело на данном тексте особо его не измения, если поставить LowDark, то ещё и ужирнят.
А что за "Sand Despeckle"?
Я Sharpen пока не использовал, хватало Smooth и Blur.

 
 
 
 
Сообщение22.05.2006, 08:54 
Аватара пользователя
Judge_AK писал(а):
Цитата:
И вопрос на засыпку - а книга, из которой был дан разворот, будет доделана?

Эта книга сделана.

 
 
 
 
Сообщение22.05.2006, 09:10 
Аватара пользователя
Полностью согласен с vadimir
Цитата:
Скорость, при правильной организации процесса, практически ограничивается только физической скоростью сканера, каретка должна ходить без пауз.

Сканировать желательно в режиме "Сканировать несколько страниц". Если что можно ведь и остановиться. Хотя я где-то читал, что есть сканер(модель не была указана) время прохождения которого туда и обратно 16 сек. при 300 dpi b/w. Вот с этим бы поработать :)

 
 
 
 
Сообщение23.05.2006, 09:07 
Аватара пользователя
Выкладываю для тренировки, если кому трафика не жалко, один исходный разворот с последующими результатами.
testforkromsator.rar (5598 KB)
Сделано строго по инструкции, резаки установленны кромсатором по умолчанию. Ничего не чистилось.
Попробуйте повторить обработку и сравните, если получится не хуже, то все в порядке, если лучше то делитесь опытом.
Как выясняется многие сканируют с помощью файнридера. У меня такое впечатление, что у него настройка по умолчанию жать тифы, причем методом jpg. Если это так, то это одна из причин заметного ухудшения результата.

 
 
 
 
Сообщение23.05.2006, 09:21 
Аватара пользователя
Возникла проблема: пытался "распотрашить" книгу из djvu(пользовал DjVuDecode), но почему-то получились не все страницы :? Экспорт по одной страничке дело утомительное для книги в 1078 стр.

 
 
 
 
Сообщение23.05.2006, 09:24 
Аватара пользователя
reader_st
Попробуй программу от Генчо DjvuOCR, там есть режим Djvu Decoder. В принципе, как мне кажется, все они используют утилиту djvused от Lizzard.

 
 
 
 
Сообщение23.05.2006, 09:41 
Аватара пользователя
Мой вариант обработки

 
 
 
 
Сообщение23.05.2006, 10:52 
Аватара пользователя
reader_st
Только одно замечание, на второй странице в верхнем левом углу видна грязь от разворота, это признак того, что не сработал grey enhance. Надо обязательно его включать, иначе проблемы с черными полосами по бокам не избежать.
З.Ы. Ни в коем случае, выложенный мной результат обработки, нельзя принимать за эталон. Там явно есть над чем еще поработать.
Основная цель показать, что стандартными средствами можно получить удовлетворительный результат.

 
 
 
 
Сообщение23.05.2006, 12:48 
Аватара пользователя
Я не пробовал, но может вы сразу скажете: Скажется ли заметно на выходном качестве 600 b/w, если сканировать 300 GrayScale не 8 бит, а 16?

Я проверил: действительно, FR сжимает tiff-файлы, только я не знаю, как определить способ сжатия. Интересно, что, если использовать те tiff-файлы, которые создаются FR в процессе сканирования, то они сжатые, а если сказать "Сохранить изображение как" несжатый tiff, то он действительно несжатый. Это все я говорил о FR6.0

 
 
 [ Сообщений: 126 ]  На страницу Пред.  1, 2, 3, 4, 5, 6, 7 ... 9  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group