2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
 
Сообщение28.08.2008, 18:23 
Аватара пользователя
Цитата:
Ищу единомышленников. Задача - катологизация электронных книг в основном технического и научного содержания. Решение данной задачи вижу в накоплении открытой, свободно распространяемой, текстовой базы данных примерно следующего формата:

Хеш_типа_А=значение, Хеш_типа_Б=значение,... Хеш_типа_Я =значение, Автор=значение, НазваниеКниги=значение, Год_издания=значение, Страниц=значение, ISBN=значение .

Где Хеш- это значение нек. Фунции над содержимым файла электронного документа. Может быть любой- Осла, StrongDC-а или даже CRC32+длина_файла (наличие CRC32+длина_файла обязательно, т.к. легко реализуемо везде). Наличие ISBN по возможности «очень обязательно».Т.к. ISBN это автоматический «шлюз» в электронные каталоги библиотек, издательств и обратно. Большой фактический материал можно заимствовать на озоне, там есть партнерская программа. Они распространяют свою базу данных книг в XML формате. Весит 38 метров в архиве и очень содержательна. Нет только Хешей Smile .

Желающие объединиться в благом деле для всего рунета прошу писать а Игорю на (spacelib [собачка] .narod.ru ).


отличная идея !!!!!!!!!!!!!!!!
я написал прогу для обзора диска в поисках книг, сортировки, и создание списка в html

можно подумать как раcшарить например с помощью пиринговых сетей , наверняка многие имеют доступ к университетским сетям и интернет каналам, дело за малым наити старый компьютер поставить на него нормальную ос и пускаи трудится на благо человечества

Нужно придумать систему по дублированию, чтобы одна книга хранилась много где, при этом возможно что на одном компе удастся хранить лиш малую часть общей коллекции

 
 
 
 
Сообщение17.09.2008, 21:41 
просто охренеть, неужели никому неинтересно?

 
 
 
 
Сообщение21.09.2008, 19:38 
Аватара пользователя
bookwarrior

лично я надеюсь, что мы здесь не только ради книг.

Вы чего собственно говоря хотите:
1. Чтобы поддержали заливкой --- по мере сил выкладываем;
2. Сканированием --- также не останемся, по мере сил и возможностей, в стороне.

Добавлено спустя 9 минут 19 секунд:

мельком просмотрел дисскусию на ru.board и мысль одного из собеседников выношу сюда: сканы практически закончились и пополнения ведутся из закрытых зон --- примерно так. На мой взгляд, следует подумать как развить что-то вроде электронного МБА. Это было бы кое-что.

 
 
 
 
Сообщение27.09.2008, 23:50 
http://gen.lib.rus.ec/

 
 
 
 Программа для каталогизации научных статей и книг
Сообщение27.10.2009, 13:50 
Аватара пользователя
Думаю, что у всех на компьютере скопилось немереное количество скачанных из разных мест научных статей, в которых из-за количества сложно что-то нужное найди.. Про электронные книги, думаю, и говорить не надо - зачастую ловил себя на том, что качал книгу из инета, хотя она была у меня на диске, но я не смог ее найти.

Наткнулся недавно на программу для каталогизации статей - Mendeley (http://www.mendeley.com/) и всерьез озадачился вопросом управления своей библиотекой.. Менделей хорош (к тому же бесплатный), но понимает только pdf'ы, т.е. для книг его не получится использовать.. Да и прежде чем приступать к разбору своей огромной библиотеки хочется посмотреть на альтернативы..

Собственно, вопрос - кто как управляется со своими библиотеками статей и книг?

 
 
 
 Re: Каталогизация электронных книг
Сообщение27.10.2009, 19:06 
Аватара пользователя
С книгами более-менее ясно... А кто как упорядочивает свои статьи?

И еще вопрос - кто-нибудь пользовал Google Desktop для поиска статей и книг на винте?

 
 
 
 Re: Каталогизация электронных книг
Сообщение28.10.2009, 09:57 
Цитата:
С книгами более-менее ясно... А кто как упорядочивает свои статьи?

Статьи упорядочить тяжеловато: 99% статей - pdf'ы без распознавания (так их в основном и выкладывают на adsabs'е).
Поэтому приходится продуманно организовывать структуру директорий, в которых эти статьи хранятся. Но, к сожалению, многие статьи однозначной классификации не поддаются. И приходится скачивать статью заново, несмотря на то, что она уже где-то на диске хранится :(

 
 
 
 Re: Каталогизация электронных книг
Сообщение16.01.2010, 18:15 
Аватара пользователя
http://alexandria.rubyforge.org/index.html

Под винду версии нет, но можно попробовать собрать из исходников.

 
 
 
 Re: Каталогизация электронных книг
Сообщение17.01.2010, 12:02 
.Serj. в сообщении #281067 писал(а):
http://alexandria.rubyforge.org/index.html

Под винду версии нет, но можно попробовать собрать из исходников.

Для каталогизации я готов предоставить огромное количество книг!
Я давно собираю и научно-техническую литературу и журналы и худлит.
С хранением нет проблем (7.5 Тбайт на винчестерах). Проблема с обработкой объема приходящей каждый день литературы (на сегодня уже более 1.4 млн наименований). Все крупные библиотеки (Колхоз, Мехмат, Либрусек, Ингсат у меня есть, там более-менее все в порядке) а вот новые поступления идут обычно с произвольным поименованием, что затрудняет их каталогизацию. Готов обсудить все вопросы пересылки книг и проведения работы.

 
 
 
 Re: Каталогизация электронных книг
Сообщение08.03.2010, 19:22 
давно пользуюсь "Where Is It?"
она подходит под все файлы и создаёт свой образ диска (только ссылки и описания)
также поддерживает авторкие списки это когда вы делаете тематический список по произвольному
признаку - но список файлов по этому признаку отдельный
также содержит очень мощный поисковик внутри своих образов
например общий обьём ваших дисков 1Тб
то полный поиск по всем файлам займёт секунд 10 !
что еще очень важно программа делает поиск и на внешних носителях CD DVD
в том числе на чужих!

позволяет обмениваться образами и искать в чужих образах нужную вам инфу
коэфициэнт сжатия примерно 1000 (для музыки и видео существенно больше)
поддерживает контрольные суммы
поддерживает несколько языков интерфейса в том числе русский

для просмотра файлов в папках пользуюсь программой "ST Thumbnails Explorer 1.5"
открывает и делает читабельную мозаику из первых страниц файлов в папке
размеры и количество мини окон легко настраивается
также позволяет перемешать или удалять файлы
открывает практически все файлы (в том числе pdf) в отличии от винды.
единственный минус несколько тормознутая и английский интерфейс.

 
 
 
 Re: Каталогизация электронных книг
Сообщение09.03.2010, 11:46 
SvetovBoris в сообщении #295920 писал(а):
давно пользуюсь "Where Is It?"
она подходит под все файлы и создаёт свой образ диска (только ссылки и описания)
также поддерживает авторкие списки это когда вы делаете тематический список по произвольному
признаку - но список файлов по этому признаку отдельный
также содержит очень мощный поисковик внутри своих образов
например общий обьём ваших дисков 1Тб
то полный поиск по всем файлам займёт секунд 10 !
что еще очень важно программа делает поиск и на внешних носителях CD DVD
в том числе на чужих!

позволяет обмениваться образами и искать в чужих образах нужную вам инфу
коэфициэнт сжатия примерно 1000 (для музыки и видео существенно больше)
поддерживает контрольные суммы
поддерживает несколько языков интерфейса в том числе русский

для просмотра файлов в папках пользуюсь программой "ST Thumbnails Explorer 1.5"
открывает и делает читабельную мозаику из первых страниц файлов в папке
размеры и количество мини окон легко настраивается
также позволяет перемешать или удалять файлы
открывает практически все файлы (в том числе pdf) в отличии от винды.
единственный минус несколько тормознутая и английский интерфейс.

А как быть с файлами DJVU? Что сможет программа "вытащить" из таких файлов?
И что еще "ужмет" эта прога в файлах DJVU?

 
 
 
 Re: Каталогизация электронных книг
Сообщение09.03.2010, 12:39 
Когда cuneiform наконец-то "допилят", можно будет делать даже индексацию содержимого djvu-файлов без слоя OCR (а также в автоматическом режиме этот слой вставлять). Пока, несмотря на более-менее приличное качество распознавание, плоховато работают алгоритмы определения текстовых блоков (путают текст с формулами, например, или пытаются распознать текст внутри рисунков).

 
 
 
 Re: Каталогизация электронных книг
Сообщение09.03.2010, 16:10 
Ed_Em в сообщении #296061 писал(а):
Когда cuneiform наконец-то "допилят", можно будет делать даже индексацию содержимого djvu-файлов без слоя OCR (а также в автоматическом режиме этот слой вставлять). Пока, несмотря на более-менее приличное качество распознавание, плоховато работают алгоритмы определения текстовых блоков (путают текст с формулами, например, или пытаются распознать текст внутри рисунков).

Да, в светлом будущем, все будет само распознаваться и складываться на полочку.

 
 
 
 Re: Каталогизация электронных книг
Сообщение29.05.2011, 11:18 
Аватара пользователя
Игорь П в сообщении #96032 писал(а):
Хеш_типа_А=значение, Хеш_типа_Б=значение,... Хеш_типа_Я =значение, Автор=значение, НазваниеКниги=значение, Год_издания=значение, Страниц=значение, ISBN=значение .
Вы никогда не думали, что есть стандарты для подобных библиотечых записей?

Посмотрите в сторону http://invenio-software.org/ - на этом решении сделан церновский сервер документов, http://inspirebeta.net/ и многое другое. Вот еще достаточно популярное решение: http://www.eprints.org/software/

В качестве "домашнего" варианта: http://icculus.org/referencer/index.html

 
 
 [ Сообщений: 29 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group