2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Изменение содержания гиперссылок
Сообщение07.06.2017, 15:16 
Аватара пользователя
Обнаружил, что данная мною когда-то ссылка на книгу Александры Мадунц теперь ведёт на раздачу порно :-( Заменил ссылку на другую, ведущую вновь на книгу Мадунц, но уже на другом ресурсе: post963212.html#p963212
Вопрос, собственно, вот в чём. Насколько я понимаю, изменение содержания ссылки с течением времени - не такая уж редкость. А существует ли какая-то возможность контролировать это изменение в автоматическом режиме? Скажем, внедрить на форум программу, которая следила бы за подобными изменениями? Чтобы не мониторить когда-то данные ссылки вручную.
Заранее прошу прощения, если этот вопрос окажется глупым.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 15:34 
Технически это, наверное, можно сделать, но практически нет особого смысла, и вот почему.

Вариант первый. Пусть программа обнаружила изменение содержимого ссылки и оно оказалось существенным. Восстановить старое содержимое она все равно не сможет, потребуется ручное вмешательство для удаления ссылки (как минимум). Результат: специально обученные люди (сиречь модераторы) будут носиться по древним сообщениям и править ссылки, которые будут портиться, вообще говоря, примерно с той же скоростью, что и появляться в сообщениях (т.е. десятки в день). Ну и поскольку основная часть этих ссылок давно никого не интересует, 99% этой работы будет, помимо прочего, еще и совершенно бесполезной.

Вариант второй, более неприятный. Программа обнаружила изменение какой-нибудь хэш-суммы содержимого (проверять-то она сможет только это), вызванное не содержательным изменением, а особенностями хостинга. Т.е. файл, например, полностью сохранился, но в его многосимвольном внутреннем названии поменялась какая-то буковка. Или хостинг сменил IP, или еще что-нибудь. Все подобные "изменения" тоже приведут к срабатыванию, а дальше см.п.1.

В общем, мне кажется, что жалобы при обнаружении неудачно изменившейся ссылки более чем достаточно. Это хотя бы означает, что ссылкой кто-то поинтересовался.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 15:35 
В общем случае это вообще говоря даже теоретически невозможно: ссылки могут вести на динамически создаваемые страницы; не все сайты/серверы сообщают сразу размер запрашиваемого файла; даже известный размер не гарантирует идентичность содержания, а контрольные суммы (типа MD5 и аналогичные) поддерживаются ещё намного реже размера файла. В итоге для определения идентичности файла его надо скачать весь ... Слишком накладный механизм выходит. Но даже это не даст гарантии с динамическими страницами (ссылками на сайты, а не конкретные файлы), там ещё и реклама может быть, и прочее. Проверить автоматически контент в таких условиях намного сложнее.
В каких-то сугубо частных случаях организовать можно, но сильно сомневаюсь что на уровне форума, скорее лично у себя запустить еженедельную проверку ссылок по списку. Для этого есть готовые решения.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 15:37 
Аватара пользователя
Pphantom, Dmitriy40, ясно, спасибо.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 15:45 
Аватара пользователя
Естественное решение - по возможности давать ссылки на места, где не будут раздавать порно. Если книга - то на twirpx.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 15:56 
Аватара пользователя
Ссылка это ещё цветочки. А внешняя графика может оказаться порно "с доставкой на дом".

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 16:59 
Аватара пользователя
Поэтому нужно не лениться и пересохранять все картинки на доверенный хостинг, а не просто вставлять ссылку на оригинал. Это относится также и картинкам, ссылки на которые со временем перестают куда-либо вести.
...Пришла тут же в голову интересная идея. Полез проверять и таки да: мой любимый хостинг Postimage предлагает инструменты, облегчающие эту работу (кому интересно, ссылки внизу их главной страницы). Эх, не заработать мне миллионы на этой идее.
Ну а ЗУ к тому же могут прикреплять картинки к своим сообщениям.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 17:55 
Аватара пользователя
Anton_Peplov в сообщении #1222972 писал(а):
Естественное решение - по возможности давать ссылки на места, где не будут раздавать порно. Если книга - то на twirpx.

Изображение
Ага, там вообще не раздают. Только кукиш показывают.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 23:29 
Аватара пользователя
Munin в сообщении #1223012 писал(а):
Ага, там вообще не раздают. Только кукиш показывают.
Ну, не знаю. Я залил на сайт 7 книжек и с тех пор стабильно имею несколько сотен баллов, которого хватит на единомоментное скачивание нескольких десятков книжек.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 23:38 
Аватара пользователя
А у меня не было 7 книжек, чтобы заливать. И у подавляющего большинства тоже нет.

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 23:42 
Аватара пользователя
Тот же, например, Рутрекер, где можно скачивать всё подряд без необходимости иметь какие-то баллы, — вполне надёжный ресурс с хорошей модерацией. Можно быть уверенным в том, что если сегодня, к примеру, вот здесь раздают Пенроуза, то и через год там либо будет тот же Пенроуз либо не будет ничего вообще (скорее — первое).

 
 
 
 Re: Изменение содержания гиперссылок
Сообщение07.06.2017, 23:53 
Аватара пользователя
Munin в сообщении #1223177 писал(а):
А у меня не было 7 книжек, чтобы заливать. И у подавляющего большинства тоже нет.
Все залитые книжки я скачал из vk (раздел "документы"). Книжки банальные: Колмогоров-Фомин, какой-то из томов ФЛФ и прочее в том же духе. Залиты в 2015 г.
Просто-напросто на twirpx явный дефицит pdf по сравнению с djvu, в то время как людей, предпочитающих именно pdf, немало. Вот я туда закинул семь в два клика найденных в vk pdf-ок и всё.

 
 
 [ Сообщений: 12 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group