2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Алгоритм очистки вот такого грязного скана.
Сообщение29.05.2006, 15:51 
Аватара пользователя
Имеется 80 Мб pdf, 550 страниц. Качество вот такое:
Изображение
Размытие именно такое, как на картинке (видимо, pdf из jpg был сделан). Я так понимаю, надо бы разодрать на куски и почистить кромсатором. Так вот как лучше разбить pdf на картинки (тиффы? гифы?) и какой алгоритм действий в кромсаторе?

 
 
 
 
Сообщение29.05.2006, 17:25 
Аватара пользователя
Я думаю, что разницы особой нет что тифф, что гиф, можно попробовать применить метод, обсуждаемый активно в данном топике(разбить на чати исх. файл преобразовать в серый и попробовать методу). Выложите страничку, попробуем.

 
 
 
 
Сообщение29.05.2006, 17:38 
В Acrobat Pro есть меню batch processing (BP), там нужно создать свою последовательность, включив в нее только export image. Там же указывается формат тифа для разных типов картинок (для цветных, для ч/б, для серых). Эта последовательность навсегда останется в Вашем акробате, так что ее можно будет вызывать когда угодно. Какой файл потрошить, - она сама будет предлагать диалог выбора файла.
Только не используйте для потрошения команды меню File (save as, export), т.к. они, в отличие от BP, не извлекают картинки, а рендерят их, причем как правило с ухудшением качества.

 
 
 
 
Сообщение29.05.2006, 18:44 
Аватара пользователя
Выложил 3 странички:
http://cepesh.mexmat.ru/files/page01.tif
http://cepesh.mexmat.ru/files/page02.tif
http://cepesh.mexmat.ru/files/page03.tif

 
 
 
 
Сообщение29.05.2006, 21:05 
Аватара пользователя
Тут надо к Arcand с руборда обращатся, он спец по сложным случаям.

 
 
 
 
Сообщение30.05.2006, 12:51 
Аватара пользователя
А вот мой результат. Согласен с картинкой получилось не важно, но текст довольно приятный. Округлить только буквы.

 
 
 
 
Сообщение30.05.2006, 21:13 
Вот мой результат
http://rapidshare.de/files/21788229/0002.djvu.html
В целом терпимо. Возможно, методикой Arcand удастся сделать лучше, но качество оригинала не стоит того, чтобы тратить на него много времени. Проще пересканировать (кажется, эта книга с medigo).
Эти файлы еще раз доказывают, что в FR ни в коем случае не стоит выравнивать сканы - поворот там реализован примитивнейшим образом - некоторые строки текста словно пьяные (а именно в тех местах, где ошибки округления накапливаются и приводят к скачку, т.е. сдвигу пиксельных строк. Страница выравнивается, а строки текста, наоборот, заваливаются на бочок. Это не только неприятно, но и отрицательно сказывается на степени сжатия ввиду раздувания djvu-словаря. Кроме того, получающиеся italic-подобные строки создают ложное ощущение, что автор в этим местах делает таким образом логическое ударение, чтобы привлечь внимание читателя).

 
 
 
 
Сообщение30.05.2006, 23:20 
Аватара пользователя
А вот один человек предложил такой вариант

 
 
 
 
Сообщение30.05.2006, 23:39 
Аватара пользователя
agb, мне кажется, это хороший результат для такого дерьмого сырца. вы много потратили времени на возню с картинкой?

 
 
 
 
Сообщение31.05.2006, 08:52 
Аватара пользователя
Человек с руборда сделал: тут
А это мой вариант, но он плох размером, я не освоил :( еще технологию перевода картинок в фон: тут

 
 
 
 
Сообщение01.06.2006, 22:11 
Аватара пользователя
еще один вариант с руборда, сделано с помощью RasterID.

 
 
 
 
Сообщение20.01.2007, 10:25 
vadimir
Мечта user'а: Может быть, когда-то найдете время, чтобы составить инструкцию наподобие ScanAndShare для работы в SK (новой версии) с картинками, а то методом профессора Тыкова что-то не очень-то получается. Думаю, это всем интересно.

 
 
 
 
Сообщение20.01.2007, 11:00 
Аватара пользователя
В новй версии, как мне кажется, было уделено основное внимание на работе с цветными сканами и обработкой фото и полутоновых иллюстраций, а так, внешне, для стандартных книг все то же самое (я имею ввиду не интерфейс, он стал красочнее :D ). И еще, что важно, улучшился алгоритм расстановки резаков при черновом кромсании.
Потом, bolega, как мне опять кажется, сам готовит документацию.
А что бы понять основные принципы работы с картинками в новой версии, скачайте пример с сайтика кромсатора.

 
 
 [ Сообщений: 13 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group