Интернет-издательство «Контрольный листок»
Четверг, 28.03.2024, 12:38
Меню сайта
Наш опрос
Оцените мой сайт
Всего ответов: 1163
Статистика

Онлайн всего: 2
Гостей: 2
Пользователей: 0
Форма входа

Контрольный листок, 2015, № 10
 
Актуальная тема
 
Использование систем антиплагиата в образовании

 

© Е. С.Чиркин

 

Страница 1, перейти на страницу 2

 

Введение

 

К настоящему времени в мире идет усиление борьбы с неправомерным использованием чужой интеллектуальной собственности. Последний виток этой борьбы вызван повсеместным проникновением широкополосного Интернета, удешевлением доступа к нему, ростом количества сервисов и услуг, которые можно получить удаленно, доступностью систем электронной коммерции; последние два пункта форсируют совершенствованием законодательства в данной сфере.

 

Основная часть

 

Определение понятия «плагиат». У плагиата существует множество определений [1], одинаковых с точностью до формулировок. В данной работе под плагиатом, как и везде [1], подразумевается умышленное присвоение авторства чужой работы или ее части. Соответственно, плагиат находится в сфере действия авторского права. Следует отметить, что возможен и «неумышленный плагиат», который наиболее известен по музыкальным произведениям. Сложность проблемы последнего заключается в возможном действии объективных факторов - в свойствах и/или расстройствах человеческой памяти (например, криптомнезия - «забывание источника» информации [2]), стилизации - подгоне произведения под принятые в данной отрасли нормы, банальных совпадениях, превращает проблему определения плагиата в отдельных случаях в нетривиальную задачу.

Ответственность за плагиат в РФ, действующее законодательство. Правовое поле ответственности за плагиат - авторские и смежные права. Ответственность за неправомерное использование чужой интеллектуальной собственности в Российской Федерации регулируется (по действующим на 23 сентября 2013 г. редакциям):

- ГК РФ: ст. 1250-1253, в т. ч. 1253.1;

- КоАП РФ, ст. 7.12 «Нарушение авторских и смежных прав, изобретательских и патентных прав»;

- УК РФ, ст. 146 «Нарушение авторских и смежных прав».

Вкратце, содержание этих статей можно свести к следующим пунктам:

- по ст. 1251 ГК РФ: в случае нарушения личных неимущественных прав автора их защита осуществляется, в частности, путем признания права, восстановления положения, существовавшего до нарушения права, пресечения действий, нарушающих право или создающих угрозу его нарушения, компенсации морального вреда, публикации решения суда о допущенном нарушении;

- по ст. 7.12 КоАП РФ: нарушение авторских и смежных прав в целях извлечения дохода влечет за собой наложение административного штрафа на граждан в размере от 1500 до 2000 руб. с конфискацией контрафактных экземпляров произведений и фонограмм;

- по ч. 1 ст. 146 УК РФ: если «присвоение авторства (плагиат) причинило крупный ущерб автору или иному правообладателю, то оно наказывается штрафом в размере до 200 тыс. рублей или в размере заработной платы или иного дохода осужденного за период до 18 месяцев, либо обязательными работами на срок от 180 до 240 часов, либо арестом на срок от 3 до 6 месяцев».

Таким образом:

1) административная ответственность наступает только в том случае, если доказана цель плагиата - извлечение дохода;

2) уголовная ответственность - только если доказано причинение крупного ущерба;

3) считается, что плагиат в научных работах не связан с целью извлечения доходов и не причиняет крупного ущерба.

Вывод: присвоение авторства на научную работу реально влечет только гражданско-правовую ответственность.

Правомерное использование чужой интеллектуальной собственности. Правомерное использование чужой интеллектуальной собственности в Российской Федерации, без согласия автора и без выплаты ему

вознаграждения регулируется гражданским кодексом РФ, ст. 1274 «Свободное использование произведения в информационных, научных, учебных или культурных целях» [3].

В применении к сфере обучения и образования, ее положения можно свести к следующим (разумеется, приведенная трактовка не претендует на юридическую полноту, корректность и непротиворечивость, все детали и неупомянутые здесь нюансы следует смотреть в первоисточнике или [3]):

1) цитируемое произведение должно быть правомерно обнародовано и/или введено в гражданский оборот;

2) допускается без согласия автора или иного правообладателя и без выплаты вознаграждения, но с обязательным указанием имени автора, произведение которого используется, и источника заимствования:

а) цитирование в объеме, оправданном целью цитирования;

б) как иллюстрация в произведениях учебного характера с учетом цели;

3) возможно передавать произведения во временное безвозмездное пользование в библиотеках; произведения в цифровой форме - только в помещениях библиотек при условии исключения возможности создать копии этих произведений.

Следует обратить внимание в тексте закона на формулировки «объеме, оправданном целью цитирования» и «с учетом цели» - понятие о «целях» и «объемах» заимствования могут не совпадать у заимствующего, правообладателя и суда.

Возможная в (ближайшем) будущем ответственность за плагиат. В настоящее время во всех странах мира существует тенденция по ужесточению наказаний за правонарушения в области авторского права. Ниже перечислены факты, говорящие о подобном тренде в России и о возможных наказаниях.

1. «На заседании комиссии по координации деятельности Открытого правительства министр внутренних дел Владимир Колокольцев выступил с предложением о введении уголовной ответственности за плагиат в научных работах» [4].

2. «Министерство культуры России подготовило новый законопроект о борьбе с пиратством в Интернете <...> он распространяется, в отличие от уже вступившего в силу закона, не только на фильмы, но и на остальные объекты авторских и смежных прав - музыку, тексты, фотографии и другое <...> предполагается распространить и на сайты со ссылками на нелицензионный контент. Минкульт предлагает также добавить статью «Нарушение порядка ограничения доступа к информации в случае нарушения авторского права и смежных прав» в Кодекс об административных право-нарушениях. Эта статья предусматривает штрафы в размере 300 тысяч рублей для граждан, 600 тысяч - для должностных лиц и миллиона - для юридических» [5].

3. Упомянутый в предыдущем пункте законопроект в формулировках [6] внесен на обсуждение в Государственную Думу. С высокой долей вероятности он будет принят в изложенной форме в кратчайшие сроки.

Плагиат: современное состояние, общественное мнение. В последний год в РФ произошло несколько скандалов, связанных с обнаружением плагиата.

1. «Российская государственная библиотека проверила диссертации по истории, которые были защищены с 2000 года <...> Проверка показала, что почти 10 % работ почти полностью плагиат. По словам директора РГБ Александра Вислого, около полутора тысяч диссертаций по истории, защищенных за последние 13 лет, более чем на 70 % заимствованы из других работ. Каждая работа проверялась на наличие некорректных заимствований из той же базы диссертаций, и если бы ревизоры взяли для сравнения другие тексты, например, монографии и статьи, то объем плагиата был бы значительно больше» [7].

2. «Ректор МПГУ допустил многолетнее функционирование в своем вузе совета Д212.154.01 - «фабрики фальшивых диссертаций», - отметили в прессслужбе Минобрнауки» [8].

3. Общественное мнение по поводу плагиата в науке и среди должностных лиц: «Москва, 15 августа - АиФ-Москва. Данные опроса, проведенного социологами «Левада-центра» в конце июля среди 1,6 тыс. человек в 45 регионах России: за обнаружение плагиата в научной работе чиновники и депутаты должны лишаться должностей (83 %), ученые - своих степеней (82 %)» [9].

4. Сетевое сообщество на добровольных началах «Диссернет» [10] осуществляет проверку на плагиат диссертаций должностных лиц государства, депутатов, чиновников, преподавателей и администрации различных вузов. Несмотря на то, что сообщество явно преследует политические цели и что на данный момент результаты приводятся [10], но системно не интерпретируются, нет оснований полагать, что ситуация с плагиатом в диссертациях проверенных ими лиц лучше, чем в научной среде. Любопытно, что отдельные фрагменты текстов проверенных работ с плагиатом (причем, как фрагмент плагиата, так и фрагмент «источника») содержат специфичные искажения, появление которых иначе, чем попытками обойти именно автоматизированную проверку на плагиат назвать нельзя.

Борьба с плагиатом в системе образования. В настоящее время борьба с плагиатом в науке и образовании не выходит на рамки отельных случаев, известны лишь события (например, [7]), имеющие определенный общественный резонанс. Началом системной борьбы с плагиатом можно назвать 2013-2015 гг.: «Минобрнауки обяжет все высшие учебные заведения размещать в открытом доступе на своих сайтах квалификационные, курсовые, дипломные, докторские, кандидатские и диссертационные работы каждого студента и аспиранта» [11].

Ключевые этапы создания системного подхода по повышению качества научных и квалификационных работ можно извлечь из статьи «Система открытой публикации» [12] и документа «Стратегия развития системы подготовки рабочих кадров и формирования прикладных квалификаций в Российской Федерации на период до 2020 года» [13]. Согласно им, основные этапы:

1) создание базы экземпляров всех работ: квалификационных работ обучающихся, кадров высшей квалификации и современных учебников, ее интеграция с ЕИС ВАК (2013 г.);

2) обеспечение доступа частных производителей программного обеспечения к базе контрольных экземпляров работ и их текстам, предоставление образовательным и научным учреждениям доступа к системам контроля заимствований на любых приемлемых, в т. ч. коммерческих условиях, при этом право выбора соответствующих информационных систем должно остаться исключительно за самим учреждением (2014 г.);

3) уточнение правового определения термина «недобросовестное заимствование» (плагиат) в контексте проверки квалификационных работ. Создание организационно-методической базы для построения системы антиплагиата в научных и образовательных учреждениях. Разработка методик установления фактов неправомочного заимствования, регламентов процедур рассмотрения спорных вопросов неправомочного заимствования, системы моральных и административных санкций (срок - декабрь 2013 г.);

4) изменение требований к промежуточной и итоговой аттестации в образовательных учреждениях. Изменение процедуры регламентированного контроля качества образования в части обязательных требований к использованию систем контроля заимствований (2015 г.), аналогично диссоветы - 2015 г.;

5) реализация возможности открытого опубликования работ (квалификационных) (6 мес. с поправок в ГК), распределенных библиотек текстов работ (2014 г.), поисковые системы по ним - 2014 г.;

6) создание механизмов заинтересованности обучающихся в самостоятельной работе и развитии творческой активности через интеграцию открытых баз работ с социальными сетями (2014 г.), взаимное цитирование студентов студентами с премированием авторов самых цитируемых (2015 г.).

Всего данный этап развития состоит из 3-х периодов по одному году каждый (2013-2015 гг.).

Методы плагиата. Основные методы плагиата: полное заимствование (собственно плагиат), замаскированный плагиат, пересказ, перевод, плагиат идей. На рис. 1 представлена условная шкала сравнения методов плагиата и сложности их обнаружения. Следует отметить, что методы с левой половинки рис. 1 обычно характерны для работ в областях по телекоммуникации и информатике, естественнонаучных, правая - в основном, гуманитарных.

 

 

Рис. 1. Условная шкала сравнения методов плагиата и сложности их обнаружения [14]

 

Методы антиплагиата. Единственный в РФ способ установления плагиата - экспертиза. Как имеющая правовые последствия для научных работ это должна быть судебно-лингвистическая экспертиза. Данная

процедура для заинтересованных лиц является достаточно дорогой (от 20000 руб. [15]) и длительной во времени (от 5 рабочих дней [15]). При экспертизе обычно сравнивают множества используемых слов, последовательности фраз, стилистику текста, особенности речи и другие методы на усмотрение эксперта.

Однако с развитием средств вычислительной техники, Интернета и сетевых поисковых систем появилась возможность установления факта плагиата более простым и техничным способом - посредством поиска соответствующего фрагмента в сети. Данная процедура является сравнительно быстрой и не затратной.

К настоящему времени появились специализированные поисковые системы, направленные на поиск плагиата, т. н. «системы антиплагиата». Слово «антиплагиат» является нарицательным, в русском языке появилось при разработке системы «Антиплагиат» от ЗАО «Форексис» [16].

Принципы работы систем антиплагиата. Все системы, которые можно использовать для целей поиска заимствований, можно разделить на три больших класса:

1) поисковые системы сети Интернет. Не предназначены для поиска заимствований, но: а) с их помощью можно искать заимствования вручную; б) один из представителей - поиск от Google распознает некоторые научные работы и цитирования в них, в т. ч. и не обозначенные как заимствования (точнее, весьма обширный проект GoogleScholar постепенно интегрируется в поиск Google);

2) метапоисковые системы и системы антиплагиата, не имеющие значимой собственной базы документов. Работают посредством формирования вызовов на основе проверяемого документа к популярным поисковым машинам сети Интернет, интерпретируют их результаты. Для ускорения работы оперируют стопсловами и проводят непоследовательную проверку документа (метод выборок) и др.;

3) специализированные системы антиплагиата с собственными алгоритмами поиска совпадений и собственными базами документов.

Особенность метапоисковых систем антиплагиата - их «базы» всегда актуальны, они не имеют доступа к документам, не размещенным в свободном доступе, либо документы в сети могут быть размещены в сводном доступе, но находиться в формате, поиск в которых не поддерживается. Скорость работы на клиенте обычно предельно низкая, возможно блокирование по IP поисковой системой (обычно - всегда и быстро блокируется) как неправомерное использование поисковой системы автоматизированными средствами, т. е. проверка будет невозможная или ее результаты будут искажены.

Особенность самодостаточных систем антиплагиата - специализированные алгоритмы поиска, собственные базы с, возможно, уникальным содержимым, не представленным в свободном доступе, относительно высокая скорость работы по сравнению с метапоисковыми системами.

Принципы работы специализированных систем антиплагиата:

1) преобразование проверяемого документа в текст;

2) индексирование полученного текста. Стадия индексирования может включать в себя:

а) выделение элементарных фрагментов текста и уменьшение их количества: исключение коротких слов, стоп-слов, слов, которых нет в словаре, приведение слов к базовой форме (например, лемматизация или стеммизация) и др.;

б) собственно, построение индекса;

3) при поиске аналогично преобразовывает проверяемый документ и происходит поиск совпадающих фрагментов, сортировка результата.

Чтобы правильно интерпретировать результаты работы автоматизированных систем антиплагиата, необходимо знать принципы их работы.

Принципы работы систем антиплагиата: морфология. При точном поиске изменение даже одного бита сказывается на результатах поиска. В поисковых системах обычно слова используются не в оригинальной форме, а преобразованными в некую базовую форму (например, для существительных это форма слова в единственном числе и именительном падеже, для глаголов - инфинитив). Данный механизм называется «поиск с учетом морфологии». Возможны следующие варианты (пример: «Кроха упала со стола на табуретку»):

1) нет морфологии + удаление коротких слов:

«кроха», «упала», «со», «стола», «на», «табуретку».

Проблема: омонимы, одинаковое написание разных словоформ разных слов (ср. «горе» (беда) и «на горе» (место));

2) стемматизация слов (самый известный алгоритм - стеммер Портера):

«крох», «упал», «с», «стол», «н», «табурет».

Проблема: стемминги словоформ отличаются. Например, «кошка» ^ «кош», «кот» ^ «кот», «котенок» ^ «котен», в то время как обычно половые и возрастные характеристики объекта должны быть незначимыми;

3) лемматизация слов (лемма - базовая грамматическая категория):

«крошка», «упасть», «со», «стол», «на», «табуретка».

Проблема: синонимы и омонимы. Например, затруднено восстановление базовой формы у: «замок», «замок», «замок»; «эти типы стали есть в литейном цехе»; «косой косойкосой косил косой».

Общая проблема для всех алгоритмов «морфологии»: аббревиатуры и сокращения, особенно - контекстные. Например, слово «ПО» может быть предлогом «по» либо аббревиатурой «ПО» с одним из 8141 значений (по [27]).

Принципы работы систем антиплагиата: нечеткий поиск. Задача нечеткого поиска заключается в поиске неточно совпадающих слов или фрагментов текста. Чаще всего для нечетного поиска используется метод N-грамм (N - количество подряд идущих символов из текста в элементе) или его вариации. Например, для слова «защищающийся» будут построены следующие биграммы (N = 2): «за», «ащ», «щи», «ищ», «ща», «аю», «ющ», «щи» (повторно), «ий», «йс», «ся». Сравнение можно вести, например, по количеству совпавших биграмм. Например, при односимвольной ошибке: «защЕщающийся»изменятся две биграммы: «щи» ^ «щЕ» и «ищ» ^ «Ещ», остальные 9 биграмм - совпадают, что дает 9/11 = 82 % совпадения.

Принципы работы систем антиплагиата: шинг- лы и пассажи. Пословный поиск совпадений текстов - чрезвычайно ресурсоемкая операция, ее можно упростить, осуществляя каким-либо образом поиск не слов, а отдельных фрагментов. Например, предложений. Что дает очень низкую эффективность поиска, стоит лишь разбить одно из них на несколько или соединить соседние, поэтому обычно используют последовательности слов, извлеченных из текста. При последовательном извлечении данные фрагменты называются «шинглами» (характерная величина - L - длина шингла в словах), при непоследовательном (по какому-либо другому закону) - «пассажами» (характеризуется законом деления текста на пассажи). Например, пусть существует фраза «специалистов, которые занимаются копирайтингом, называют копирайтерами». Шинглы (L = 2) для нее следующие: «специалистов которые», «которые занимаются», «занимаются копирайтингом», «копирайтингом, называют», «называют копирайтерами». Для нормализации шингла, например, его составляющие можно упорядочивать (например, отсортировать по алфавиту). Для этой же фразы пассажи (согласно принципу деления - по знакам препинания): «специалистов», «которые занимаются копирайтингом», «называют копирайтерами». Удобство метода выделения пассажей по сравнению с шинглами - они более крупные элементы текста, поэтому их меньше, что значительно повышает скорость работы с ними. Недостаток - при переработке текста пассажи более подвержены изменениям, чем шинглы.

Проблемы пассажений и шинглов: речевые обороты, имена собственные и пр.: «несмотря на то, что» (L = 5), «в свою очередь, нельзя не заметить того факта, что» (L = 9), «Северный Ледовитый океан» (L = 3), «Министерство образования и науки Российской Федерации» (L = 6).

Известные характеристики систем антиплагиата. В общем случае принципы работы каждой из систем антиплагиата неизвестны, однако для каждой из них можно сделать обоснованные предположения.

еТх1Антиплагиату3.0.8.0. Согласно окну настроек, это метапоисковая система, используется метод выборок (выборок 20 шт. на каждую 1000 слов, размер выборки - 10 слов), выборки проверяются по шинглам (L = 3).

AdvegoPlagiatus 1.3.0.61. Согласно окну настроек, это метапоисковая система, используется метод выборок (размер выборки - 5 слов), выборки проверяются по шинглам (L = 4).

 

Страница 1, перейти на страницу 2

 

В оглавление номера

Поиск
Календарь
«  Март 2024  »
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
25262728293031
Архив записей
Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Издательство «Контрольный листок» © 2024 Бесплатный хостинг uCoz