2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 
Сообщение28.08.2008, 18:23 
Аватара пользователя


28/06/08
1706
Цитата:
Ищу единомышленников. Задача - катологизация электронных книг в основном технического и научного содержания. Решение данной задачи вижу в накоплении открытой, свободно распространяемой, текстовой базы данных примерно следующего формата:

Хеш_типа_А=значение, Хеш_типа_Б=значение,... Хеш_типа_Я =значение, Автор=значение, НазваниеКниги=значение, Год_издания=значение, Страниц=значение, ISBN=значение .

Где Хеш- это значение нек. Фунции над содержимым файла электронного документа. Может быть любой- Осла, StrongDC-а или даже CRC32+длина_файла (наличие CRC32+длина_файла обязательно, т.к. легко реализуемо везде). Наличие ISBN по возможности «очень обязательно».Т.к. ISBN это автоматический «шлюз» в электронные каталоги библиотек, издательств и обратно. Большой фактический материал можно заимствовать на озоне, там есть партнерская программа. Они распространяют свою базу данных книг в XML формате. Весит 38 метров в архиве и очень содержательна. Нет только Хешей Smile .

Желающие объединиться в благом деле для всего рунета прошу писать а Игорю на (spacelib [собачка] .narod.ru ).


отличная идея !!!!!!!!!!!!!!!!
я написал прогу для обзора диска в поисках книг, сортировки, и создание списка в html

можно подумать как раcшарить например с помощью пиринговых сетей , наверняка многие имеют доступ к университетским сетям и интернет каналам, дело за малым наити старый компьютер поставить на него нормальную ос и пускаи трудится на благо человечества

Нужно придумать систему по дублированию, чтобы одна книга хранилась много где, при этом возможно что на одном компе удастся хранить лиш малую часть общей коллекции

 Профиль  
                  
 
 
Сообщение17.09.2008, 21:41 


18/08/08
3
просто охренеть, неужели никому неинтересно?

 Профиль  
                  
 
 
Сообщение21.09.2008, 19:38 
Заслуженный участник
Аватара пользователя


03/03/06
648
bookwarrior

лично я надеюсь, что мы здесь не только ради книг.

Вы чего собственно говоря хотите:
1. Чтобы поддержали заливкой --- по мере сил выкладываем;
2. Сканированием --- также не останемся, по мере сил и возможностей, в стороне.

Добавлено спустя 9 минут 19 секунд:

мельком просмотрел дисскусию на ru.board и мысль одного из собеседников выношу сюда: сканы практически закончились и пополнения ведутся из закрытых зон --- примерно так. На мой взгляд, следует подумать как развить что-то вроде электронного МБА. Это было бы кое-что.

 Профиль  
                  
 
 
Сообщение27.09.2008, 23:50 


18/08/08
3
http://gen.lib.rus.ec/

 Профиль  
                  
 
 Программа для каталогизации научных статей и книг
Сообщение27.10.2009, 13:50 
Аватара пользователя


18/09/07
28
ННГУ
Думаю, что у всех на компьютере скопилось немереное количество скачанных из разных мест научных статей, в которых из-за количества сложно что-то нужное найди.. Про электронные книги, думаю, и говорить не надо - зачастую ловил себя на том, что качал книгу из инета, хотя она была у меня на диске, но я не смог ее найти.

Наткнулся недавно на программу для каталогизации статей - Mendeley (http://www.mendeley.com/) и всерьез озадачился вопросом управления своей библиотекой.. Менделей хорош (к тому же бесплатный), но понимает только pdf'ы, т.е. для книг его не получится использовать.. Да и прежде чем приступать к разбору своей огромной библиотеки хочется посмотреть на альтернативы..

Собственно, вопрос - кто как управляется со своими библиотеками статей и книг?

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение27.10.2009, 19:06 
Аватара пользователя


18/09/07
28
ННГУ
С книгами более-менее ясно... А кто как упорядочивает свои статьи?

И еще вопрос - кто-нибудь пользовал Google Desktop для поиска статей и книг на винте?

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение28.10.2009, 09:57 


04/02/08
325
Буково
Цитата:
С книгами более-менее ясно... А кто как упорядочивает свои статьи?

Статьи упорядочить тяжеловато: 99% статей - pdf'ы без распознавания (так их в основном и выкладывают на adsabs'е).
Поэтому приходится продуманно организовывать структуру директорий, в которых эти статьи хранятся. Но, к сожалению, многие статьи однозначной классификации не поддаются. И приходится скачивать статью заново, несмотря на то, что она уже где-то на диске хранится :(

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение16.01.2010, 18:15 
Аватара пользователя


01/02/09
206
http://alexandria.rubyforge.org/index.html

Под винду версии нет, но можно попробовать собрать из исходников.

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение17.01.2010, 12:02 


22/09/09
275
.Serj. в сообщении #281067 писал(а):
http://alexandria.rubyforge.org/index.html

Под винду версии нет, но можно попробовать собрать из исходников.

Для каталогизации я готов предоставить огромное количество книг!
Я давно собираю и научно-техническую литературу и журналы и худлит.
С хранением нет проблем (7.5 Тбайт на винчестерах). Проблема с обработкой объема приходящей каждый день литературы (на сегодня уже более 1.4 млн наименований). Все крупные библиотеки (Колхоз, Мехмат, Либрусек, Ингсат у меня есть, там более-менее все в порядке) а вот новые поступления идут обычно с произвольным поименованием, что затрудняет их каталогизацию. Готов обсудить все вопросы пересылки книг и проведения работы.

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение08.03.2010, 19:22 
Заблокирован


04/03/10

618
давно пользуюсь "Where Is It?"
она подходит под все файлы и создаёт свой образ диска (только ссылки и описания)
также поддерживает авторкие списки это когда вы делаете тематический список по произвольному
признаку - но список файлов по этому признаку отдельный
также содержит очень мощный поисковик внутри своих образов
например общий обьём ваших дисков 1Тб
то полный поиск по всем файлам займёт секунд 10 !
что еще очень важно программа делает поиск и на внешних носителях CD DVD
в том числе на чужих!

позволяет обмениваться образами и искать в чужих образах нужную вам инфу
коэфициэнт сжатия примерно 1000 (для музыки и видео существенно больше)
поддерживает контрольные суммы
поддерживает несколько языков интерфейса в том числе русский

для просмотра файлов в папках пользуюсь программой "ST Thumbnails Explorer 1.5"
открывает и делает читабельную мозаику из первых страниц файлов в папке
размеры и количество мини окон легко настраивается
также позволяет перемешать или удалять файлы
открывает практически все файлы (в том числе pdf) в отличии от винды.
единственный минус несколько тормознутая и английский интерфейс.

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение09.03.2010, 11:46 


22/09/09
275
SvetovBoris в сообщении #295920 писал(а):
давно пользуюсь "Where Is It?"
она подходит под все файлы и создаёт свой образ диска (только ссылки и описания)
также поддерживает авторкие списки это когда вы делаете тематический список по произвольному
признаку - но список файлов по этому признаку отдельный
также содержит очень мощный поисковик внутри своих образов
например общий обьём ваших дисков 1Тб
то полный поиск по всем файлам займёт секунд 10 !
что еще очень важно программа делает поиск и на внешних носителях CD DVD
в том числе на чужих!

позволяет обмениваться образами и искать в чужих образах нужную вам инфу
коэфициэнт сжатия примерно 1000 (для музыки и видео существенно больше)
поддерживает контрольные суммы
поддерживает несколько языков интерфейса в том числе русский

для просмотра файлов в папках пользуюсь программой "ST Thumbnails Explorer 1.5"
открывает и делает читабельную мозаику из первых страниц файлов в папке
размеры и количество мини окон легко настраивается
также позволяет перемешать или удалять файлы
открывает практически все файлы (в том числе pdf) в отличии от винды.
единственный минус несколько тормознутая и английский интерфейс.

А как быть с файлами DJVU? Что сможет программа "вытащить" из таких файлов?
И что еще "ужмет" эта прога в файлах DJVU?

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение09.03.2010, 12:39 


04/02/08
325
Буково
Когда cuneiform наконец-то "допилят", можно будет делать даже индексацию содержимого djvu-файлов без слоя OCR (а также в автоматическом режиме этот слой вставлять). Пока, несмотря на более-менее приличное качество распознавание, плоховато работают алгоритмы определения текстовых блоков (путают текст с формулами, например, или пытаются распознать текст внутри рисунков).

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение09.03.2010, 16:10 


22/09/09
275
Ed_Em в сообщении #296061 писал(а):
Когда cuneiform наконец-то "допилят", можно будет делать даже индексацию содержимого djvu-файлов без слоя OCR (а также в автоматическом режиме этот слой вставлять). Пока, несмотря на более-менее приличное качество распознавание, плоховато работают алгоритмы определения текстовых блоков (путают текст с формулами, например, или пытаются распознать текст внутри рисунков).

Да, в светлом будущем, все будет само распознаваться и складываться на полочку.

 Профиль  
                  
 
 Re: Каталогизация электронных книг
Сообщение29.05.2011, 11:18 
Заблокирован
Аватара пользователя


03/03/10

4558
Игорь П в сообщении #96032 писал(а):
Хеш_типа_А=значение, Хеш_типа_Б=значение,... Хеш_типа_Я =значение, Автор=значение, НазваниеКниги=значение, Год_издания=значение, Страниц=значение, ISBN=значение .
Вы никогда не думали, что есть стандарты для подобных библиотечых записей?

Посмотрите в сторону http://invenio-software.org/ - на этом решении сделан церновский сервер документов, http://inspirebeta.net/ и многое другое. Вот еще достаточно популярное решение: http://www.eprints.org/software/

В качестве "домашнего" варианта: http://icculus.org/referencer/index.html

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 29 ]  На страницу Пред.  1, 2

Модератор: Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group