2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
 Re: Не могу найти файл
Сообщение08.11.2016, 20:36 
Sinoid в сообщении #1167278 писал(а):
Dmitriy40 в сообщении #1166912 писал(а):
в поле ProductName
Вы, наверное, имели ввиду Process Name.
Нет, именно ProductName. Но это не принципиальный момент.

Sinoid в сообщении #1167278 писал(а):
Dmitriy40 в сообщении #1166912 писал(а):
А файлик у меня имеет размер 1.3 мегабайта
А у меня почему-то 1,26 мб.
А кто вам сказал что у нас одинаковые версии офиса?! :mrgreen: Кроме того, 1.3МБ это я округлил, ну если вам зачем-то надо до байта, то 1328782 байта.

Sinoid в сообщении #1167278 писал(а):
Слушайте, а какая там кодировка?
Судя по шумоподобности данных - они упакованы (правда слабо, сжимаются ещё раза в два, а то и в три), соответственно вопрос о кодировке смысла не имеет.
С другой стороны, в файле MSTH3RU.LEX довольно много частей (корни, суффиксы, окончания) русских слов в кодировке DOS (CP866) (для моей версии офиса!). Чем это вам поможет без понятия. Для доступа к данным надо пользоваться функциями из MSTH3RU.DLL.

 
 
 
 Re: Не могу найти файл
Сообщение08.11.2016, 20:39 
Sinoid в сообщении #1167300 писал(а):
А какие ограничения у меня есть? Скорость Интернета?
Честно говоря, я уже плохо помню. Видимо, скорость, если с ней действительно не всё хорошо.

 
 
 
 Re: Не могу найти файл
Сообщение08.11.2016, 21:20 
Послушайте, вот тут не удается открыть ни один адрес ftp с th_ru_Ru.idx через проводник. Это потому что у меня руки кривые или в самом деле они не работают?

 
 
 
 Re: Не могу найти файл
Сообщение08.11.2016, 21:33 
(А зачем через проводник? Браузеры понимают ссылки с протоколом FTP.)

-- Вт ноя 08, 2016 23:39:55 --

Например, здесь ссылка downloads приводит сюда, где по верхней же ссылке скачивается архив, в котором в lib/libreoffice/share/extensions/dict-ru сидят интересующие, как понял, файлы. Ещё и питоновский скрипт, который, видимо, как раз содержит функции для работы с ними (не проверял).

-- Вт ноя 08, 2016 23:42:45 --

Там, конечно, куча файлов, специфичных для программы, из которой этот архив выдернут, а в скрипте куча функций, специфических для связи с ней, кажется (теперь глянул внутрь).

 
 
 
 Re: Не могу найти файл
Сообщение09.11.2016, 15:15 
arseniiv в сообщении #1167320 писал(а):
(А зачем через проводник? Браузеры понимают ссылки с протоколом FTP.)

Спасибо, я это выяснил вчера, после своего сообщения. Все заработало. По вашей, arseniiv, ссылке скачал. В файле .dat (где слова тезауруса) 21640 строк. В той папке, похоже, собраны лингвистические файлы из разных программ. Слушайте, а никто не видел файла с таким расположением слов:

UTF-8
а|1
(синоним)|но|однако же|только
абонировать|2
(синоним)|нанимать|брать в наем|брать внаймы
(сходный термин)|нанимать
абракадабра|2
(синоним)|нелепость|нелепица|абсурд|ахинея|бессмыслица|белиберда|вздор|галиматья|дичь|дребедень|ерунда|несообразность|околесина|околесица|околесная|чепуха|чушь
(синоним)|сапоги всмятку

я бы еще больше тезаурус сделал. Когда орфографический словарь подключал, так родной словарь всего 1,8 мб был, каждое (почти) слово подчеркивал. А я из большого словаря переделал, так красота просто. Может, и с тезаурусом бы такое прокатило.

 
 
 
 Re: Не могу найти файл
Сообщение12.11.2016, 16:41 
Спасибо большое за помощь.

 
 
 [ Сообщений: 21 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group