2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 19:40 
Заслуженный участник
Аватара пользователя


20/08/14
8062
30 апреля в сообществе Постнауки в vk появилось следующее сообщение:
Цитата:
В этом году все дипломные работы студентов будут проверены на заимствования Рособрнадзором, и Ассоциация интернет-издателей призывает выпускников принять участие в формировании общего открытого архива на платформе http://nauchkor.ru и опубликовать свои учебные и научные работы, чтобы защитить свои права на произведения.

Лучшие работы будут анонсированы в новостном разделе «Научного корреспондента», а также получат DOI, что облегчит их цитирование в научных исследованиях и облегчит поиск в базах знания.

Полные базы первоисточников будут использованы при проверке общего массива работ всех вузов на плагиат. Предполагается, что тотальная проверка будет проведена в июле-августе этого года.

Вопросы к преподавателям, студентам и сочувствующим:
1. Вы что-нибудь об этом знаете?
2. Как думаете, что выйдет из тотальной проверки на плагиат? Понятно, что существенная часть студенческих дипломов делается методом "копировать-вставить" (кстати, сколько, по-вашему? 50%? 90%?). Что будет? Руководители будут, не доводя до позора, сами проверять их на плагиат (благо нужный софт доступен) и отправлять переписывать? Или "пока гром не грянет, мужик не перекрестится"? Или в Рособрнадзоре, взглянув на вал липовых дипломных работ, махнут рукой и скажут "Эксперимент не удался"? Кстати, а какие за плагиат в дипломе предусмотрены санкции?
3. Если эта практика станет постоянной, как вы думаете, какая часть студентов таки начнет писать дипломы самостоятельно, а какая часть будет платить ботанам, чтобы писали за них (но так и так будет какая-то польза, родному ботану приработок не лишний же :-))?
4. О чем существенном я еще не упомянул?

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 19:49 
Заслуженный участник


27/04/09
28128
О ложных срабатываниях. Их точно будет достаточно мало?

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 20:05 
Аватара пользователя


28/11/08
659
Тамбовская губерня.
племянница писала диплом по медицине.Честно обложилась книгами. При проверке на плагиат, вылезли упоминания на те самые книги и ещё 100500 совпадений.
Как плагиат присутствуют чисто медицинские термины.
Сердечные ритмы, температура,артерии и аорты, названия медицинских манипуляций...

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 20:09 
Заслуженный участник


25/02/11
1786
Anton_Peplov в сообщении #1122072 писал(а):
Полные базы первоисточников будут использованы при проверке общего массива работ всех вузов на плагиат. Предполагается, что тотальная проверка будет проведена в июле-августе этого года.

Санкции к кому? Выпускники к июлю уже получат свои дипломы.

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 20:33 
Заслуженный участник


09/05/12
25179
Anton_Peplov в сообщении #1122072 писал(а):
1. Вы что-нибудь об этом знаете?
То же самое заявление.
Anton_Peplov в сообщении #1122072 писал(а):
2. Как думаете, что выйдет из тотальной проверки на плагиат?
Ничего особенного. Судя по предварительным попыткам, они считают, что дипломы бывают только в формате Microsoft Word. :facepalm:

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 20:43 
Заслуженный участник
Аватара пользователя


20/08/14
8062
IRINA-22 в сообщении #1122081 писал(а):
При проверке на плагиат, вылезли упоминания на те самые книги и ещё 100500 совпадений.
Как плагиат присутствуют чисто медицинские термины.
Сердечные ритмы, температура,артерии и аорты, названия медицинских манипуляций...
Программа была настроена не через голову. Там регулируется минимальная длина строки, при совпадении которой выдается сообщение. Она всяко должна быть больше трех слов, чтобы не вылезали "артерии и аорты".
Как будут настроены программы Рособрнадзора - вот вопрос...

-- 08.05.2016, 21:03 --

Vince Diesel в сообщении #1122083 писал(а):
Санкции к кому? Выпускники к июлю уже получат свои дипломы.
Там не указано, какие дипломы будут проверять - только магистерские или бакалаврские тоже. Если бакалаврские тоже, то уличенному в плагиате в бакалаврской работе при поступлении в магистратуру при желании можно устроить печаль. Вопрос, возникнет ли такое желание.

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 22:57 
Заслуженный участник
Аватара пользователя


18/01/13
12044
Казань
А! Я как раз с прошлого года ответственна на кафедре за "антиплагиат"... Ну, у математиков его трудно обнаружить: формулы же! :-)

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 23:14 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
А как они будут pdf-документы проверять? Путём игр с кодировкой в tex-документе можно добиться того, что любой Ctrl-C — Ctrl-V оттуда приведёт к кракозябрам (во всяком случае, у меня такое получалось, но не произвольно).

Да и вообще, в принципе, пока мне, как студенту, по барабану. Ибо до диплома ещё учиться и учиться.

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 23:30 
Заслуженный участник
Аватара пользователя


20/08/14
8062
StaticZero в сообщении #1122133 писал(а):
А как они будут pdf-документы проверять?
По идее можно исходники затребовать. А вообще, думаю, в подавляющем большинстве вузов все-таки Word.

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 23:39 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Anton_Peplov в сообщении #1122136 писал(а):
в подавляющем большинстве вузов все-таки Word.

Погодите. Изготовление дипломов в формате Word означает, что для этого студенты должны иметь доступ к Microsoft Office. С фактическим доступом проблем нет,

(Оффтоп)

— Ты Office купил давно?
— А он платный?..

но с точки зрения нормативных вузовских документов требовать установки платных пакетов от студентов слишком самонадеянно.

Короче говоря, как можно заставлять делать Word?

-- 09.05.2016, 00:39 --

Anton_Peplov в сообщении #1122136 писал(а):
По идее можно исходники затребовать.

Обнаружен плагиат: \begin{document}

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 23:49 
Заслуженный участник
Аватара пользователя


20/08/14
8062
StaticZero в сообщении #1122138 писал(а):
Короче говоря, как можно заставлять делать Word?
Зачем заставлять, когда практически все и так его юзают и будут юзать?

StaticZero в сообщении #1122138 писал(а):
Обнаружен плагиат: \begin{document}
Anton_Peplov в сообщении #1122095 писал(а):
Программа была настроена не через голову. Там регулируется минимальная длина строки, при совпадении которой выдается сообщение. Она всяко должна быть больше трех слов, чтобы не вылезали "артерии и аорты".

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение08.05.2016, 23:54 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
Anton_Peplov в сообщении #1122142 писал(а):
Зачем заставлять, когда практически все и так его юзают и будут юзать?

А. Вы о том, что многие студенты делают именно в Word. Тогда ладно.

Только вопрос касался не "всех", а "элитных $\TeX$-ников". В принципе тогда это подразумевает дополнительную коммуникацию со студентами, которые сдают PDF. Ну, тоже можно, ладно.

Anton_Peplov в сообщении #1122142 писал(а):
StaticZero в сообщении #1122138

писал(а):
Обнаружен плагиат: \begin{document} Anton_Peplov в сообщении #1122095

писал(а):
Программа была настроена не через голову. Там регулируется минимальная длина строки, при совпадении которой выдается сообщение. Она всяко должна быть больше трех слов, чтобы не вылезали "артерии и аорты".

(Оффтоп)

Извините, я шутить не умею.

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение09.05.2016, 00:21 


17/10/08

1313
Классика жанра состоит в создании плагиаторного репозитория, которая содержит пары документов с указанием, есть ли заимствование одного документа из другого или нет.

Далее дело техники. Множество из репозитория делится на обучающее и проверочное. На обучающем настраивают алгоритм / модель, а на проверочном определяют качество работы (какой-нибудь AUC или что-то в этом духе).

В обработке тестов сейчас имеет место видимый прогресс. Например, с помощью Wiki, толковых словарей, и т.д. программы могут проходить тесты или даже отвечать на вопросы. Например, в недавнем конкурсе KAGGLE победивший алгоритм для "ЕГЭ" восьмого грейда (США), судя по доске лидеров, дал около 60% правильных ответов (при случайном ответах было бы 25%):
https://www.kaggle.com/c/the-allen-ai-science-challenge
Там же море ПОЛЕЗНЫХ ссылок, весьма интересных - можно оценить, до чего дошел прогресс:
https://www.kaggle.com/c/the-allen-ai-s ... repository

Другой пример, это выигрыш IBM Watson в игре "Jeopardy!". Легко находится с помощью поиска.

Так что не нужно представлять себе, что антиплагиат как нечто тупое и примитивное. Если, конечно, его делали всерьез. Антипримеры, которые приводились выше, не представляют собой проблемы.
* В "артерии и аорты" при поиске "и", скорее всего, будет отброшено как "шумовое слово" (stopword). Поэтому длина здесь не 3 слова, а 2. Также могут обнаруживаться "стандартные обороты", словосочетания и т.п., которые преувеличиваются меру плагиата.
* Если программа обнаруживает в качестве источников плагиата медицинские книги - то тоже нет проблем, если в дипломной работе указаны ссылки на эти книги. А если не указаны - это и есть плагиат.
...

Нормальная практика применения мне видится следующей. Антиплагиатор находит заимствования и ставит им индексы (типа "вероятность" плагиата). В процессе приемки диплома делается выборочная "ручная" проверка на предмет плагиата с несколькими работами с наивысшим индексом. Решение в любом случае должно остаться за человеком. Можно считать, что антиплагиатор - это просто система поиска.

P.S. что касается форматов - если нет специальных настроек документов, то конвертация word/pdf вроде не вызывает проблем... по крайне мере, для антиплагиатора искажения конвертации не столь важны... Что касается Word, то бесплатный продукт "Open Office" более/менее создает/читает данные документы.

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение09.05.2016, 01:11 
Заслуженный участник
Аватара пользователя


09/09/14
6328
Anton_Peplov в сообщении #1122072 писал(а):
Как думаете, что выйдет из тотальной проверки на плагиат?
    Vince Diesel в сообщении #1122083 писал(а):
    Санкции к кому? Выпускники к июлю уже получат свои дипломы.
Я надеюсь, что текущая цель -- собрать адекватные статистические показатели для принятия соответствующих управленческих решений верхнего уровня. А не затеять "гонку вооружений" дипломников и проверяющих -- это пока рано, имхо.

 Профиль  
                  
 
 Re: Публикация и проверка на плагиат студенческих дипломов
Сообщение09.05.2016, 13:58 
Аватара пользователя


11/06/12
10390
стихия.вздох.мюсли
Минутка конспирологии: не кажется ли вам, что это ответ государства (в лице Федеральной службы по надзору в сфере образования и науки) на деятельность «Диссернета»?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 19 ]  На страницу 1, 2  След.

Модераторы: Модераторы, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group