2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4, 5, 6, 7 ... 9  След.
 
 
Сообщение21.05.2006, 13:35 
Заслуженный участник
Аватара пользователя


06/08/05
408
Dolgopa
Ленинград
Просто, интереса ради, перекодировал Вашу книгу. Т.е. распустил ее на тифы, для этого можно использовать программу DjvuOCR в режиме Djvu Decoder (обложку сохранил отдельно), и перекодировал с одним словарем на всю книгу. Было 5 336 493 байта, стало 3 923 972 (если кодировать из оригинальных тифов, размер наверное будет +- Х байт, что не существенно). На треть меньше. Как говорится, хозяйке на заметку.
А вот с иллюстрациями это конечно беда.
С одной стороны, наличие фотографий волей не волей заставляет Вас переходить на сканирование в сером, не отвертеться!
С другой стороны, дополнительный труд.
То как я делал в таких случаях (очень у меня редких) не может служить примером. Для примера привожу одну страничку 150 кб. Тут можно выделить два аспекта, по-видимому, можно сделать и получше, и главное это размер! Хотя в данном случае, размер это зло с которым приходится мириться. Но что-то мне подсказывает, что есть рецепты (в том же кромсаторе надо бы порыться, недаром же bolega над этим работал).
Еще раз повторяю, Вам с фотографиями надо как-то бороться, это же иллюстрации в учебнике!
Вот еще, после раскодирования Вашей книги, обратил внимание на плавающий размер страниц. Вы это в ручную нарезали? Т.е. делали превью, выделяли область сканирования, сканировали? Если все было так, то это жуткое растрачивание времени, минимум в 2 раза! Скорость, при правильной организации процесса, практически ограничивается только физической скоростью сканера, каретка должна ходить без пауз.

 Профиль  
                  
 
 
Сообщение21.05.2006, 13:53 


22/07/05
96
vadimir писал(а):
каретка должна ходить без пауз.

Это Вы, батенька, загнули... А если книга "толстая"? Пока лист перевернуть, "приладить" к стеклу, прижать, на кнопку нажать... Время возврата каретки явно меньше.

 Профиль  
                  
 
 
Сообщение21.05.2006, 14:17 
Заслуженный участник
Аватара пользователя


06/08/05
408
Dolgopa
Judge_AK
Что, и у Вас OpticBook 3600 :shock:?

 Профиль  
                  
 
 
Сообщение21.05.2006, 14:52 


22/07/05
96
vadimir
Пока нет(надеюсь, что пока) :)
И для обычных сканеров надо быть "метеором", чтобы успеть выполнить все операции за время возврата каретки.

 Профиль  
                  
 
 
Сообщение21.05.2006, 18:14 


09/11/05
40
Judge_AK писал(а):
"контраст" и "порог" для меня такая же загадка, как и для Вас :) Играюсь только яркостью. Летом надеюсь ликвидировать этот пробел.
А точно 1-нопиксельные? Мне интересно как это на бумаге смотрится.
Чтобы они не пропадали в СК надо отключить despeckle для таких страниц или же попробовать поставить режим Safe.
Если ч/б страницы в 600 дпи, то можно с помощью закладок Convert и Quality "ужирнить" буквы. В этом направление "готовых рецептов" дать пока не могу - ещё только опыты провожу :roll:

О, я наоборот, яркость не трогаю вообще, контраст - редко, а в основном мучаю порог. Яркость я не понял на что влиять должна, я на глаз ничего не вижу. Порог наиболее понятный, больше порог - тоньше линии. Контраст - наоборот, но для хорошей бумаги если немного увеличить и контраст, и порог - больше мелких деталей сохраняется.
В кромсаторе я вчера попробовал не выключая Despeckle, включить Sand Despeckle, в enhance поставил Smooth=1, Blur=1, Sharpen=5 - сносно получилось.
А Convert разве влияет на изначально ч/б изображения?

Как эти тонкие линии на бумаге выглядят - завтра в институте посмотрю. Может быть, имеет смысл книгу пересканировать с более правильными настройками.

 Профиль  
                  
 
 
Сообщение21.05.2006, 19:42 


15/02/06
51
Извините, сейчас отвечаю впопыхах, нет времени.
vadimir Если не сложно скиньте эту страницу на Webfile, ну или посредством ПС.
Judge_AK спасибо за совет попробую.

 Профиль  
                  
 
 
Сообщение21.05.2006, 19:46 


22/07/05
96
sonte
Цитата:
А Convert разве влияет на изначально ч/б изображения?

Влияет-влияет(сам не так давно узнал) - если стоит Normal, то фильтры сделают своё дело на данном тексте особо его не измения, если поставить LowDark, то ещё и ужирнят.
А что за "Sand Despeckle"?
Я Sharpen пока не использовал, хватало Smooth и Blur.

 Профиль  
                  
 
 
Сообщение22.05.2006, 08:54 
Заслуженный участник
Аватара пользователя


03/03/06
648
Judge_AK писал(а):
Цитата:
И вопрос на засыпку - а книга, из которой был дан разворот, будет доделана?

Эта книга сделана.

 Профиль  
                  
 
 
Сообщение22.05.2006, 09:10 
Заслуженный участник
Аватара пользователя


03/03/06
648
Полностью согласен с vadimir
Цитата:
Скорость, при правильной организации процесса, практически ограничивается только физической скоростью сканера, каретка должна ходить без пауз.

Сканировать желательно в режиме "Сканировать несколько страниц". Если что можно ведь и остановиться. Хотя я где-то читал, что есть сканер(модель не была указана) время прохождения которого туда и обратно 16 сек. при 300 dpi b/w. Вот с этим бы поработать :)

 Профиль  
                  
 
 
Сообщение23.05.2006, 09:07 
Заслуженный участник
Аватара пользователя


06/08/05
408
Dolgopa
Выкладываю для тренировки, если кому трафика не жалко, один исходный разворот с последующими результатами.
testforkromsator.rar (5598 KB)
Сделано строго по инструкции, резаки установленны кромсатором по умолчанию. Ничего не чистилось.
Попробуйте повторить обработку и сравните, если получится не хуже, то все в порядке, если лучше то делитесь опытом.
Как выясняется многие сканируют с помощью файнридера. У меня такое впечатление, что у него настройка по умолчанию жать тифы, причем методом jpg. Если это так, то это одна из причин заметного ухудшения результата.

 Профиль  
                  
 
 
Сообщение23.05.2006, 09:21 
Заслуженный участник
Аватара пользователя


03/03/06
648
Возникла проблема: пытался "распотрашить" книгу из djvu(пользовал DjVuDecode), но почему-то получились не все страницы :? Экспорт по одной страничке дело утомительное для книги в 1078 стр.

 Профиль  
                  
 
 
Сообщение23.05.2006, 09:24 
Заслуженный участник
Аватара пользователя


06/08/05
408
Dolgopa
reader_st
Попробуй программу от Генчо DjvuOCR, там есть режим Djvu Decoder. В принципе, как мне кажется, все они используют утилиту djvused от Lizzard.

 Профиль  
                  
 
 
Сообщение23.05.2006, 09:41 
Заслуженный участник
Аватара пользователя


03/03/06
648
Мой вариант обработки

 Профиль  
                  
 
 
Сообщение23.05.2006, 10:52 
Заслуженный участник
Аватара пользователя


06/08/05
408
Dolgopa
reader_st
Только одно замечание, на второй странице в верхнем левом углу видна грязь от разворота, это признак того, что не сработал grey enhance. Надо обязательно его включать, иначе проблемы с черными полосами по бокам не избежать.
З.Ы. Ни в коем случае, выложенный мной результат обработки, нельзя принимать за эталон. Там явно есть над чем еще поработать.
Основная цель показать, что стандартными средствами можно получить удовлетворительный результат.

 Профиль  
                  
 
 
Сообщение23.05.2006, 12:48 
Экс-модератор
Аватара пользователя


23/12/05
11637
Я не пробовал, но может вы сразу скажете: Скажется ли заметно на выходном качестве 600 b/w, если сканировать 300 GrayScale не 8 бит, а 16?

Я проверил: действительно, FR сжимает tiff-файлы, только я не знаю, как определить способ сжатия. Интересно, что, если использовать те tiff-файлы, которые создаются FR в процессе сканирования, то они сжатые, а если сказать "Сохранить изображение как" несжатый tiff, то он действительно несжатый. Это все я говорил о FR6.0

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 126 ]  На страницу Пред.  1, 2, 3, 4, 5, 6, 7 ... 9  След.

Модератор: Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group