Вы находитесь на начальной странице системы поиска схожих фрагментов в текстах (потенциального плагиата). Пользоваться системой очень просто: сначала загрузите файл с текстом, который необходимо проверить, затем один или несколько файлов с потенциальными источниками. Система производит сравнение и выдаёт похожие (с точки зрения системы) фрагменты, раскрашивая их прямо в тексте.
Некоторые общие замечания:
- Воспринимаются файлы любых текстовых форматов (DOC, DOCX, PDF, RTF, TXT, ODT, HTML, DjVu и пр.). Файлы с изображениями или нераспознанные PDF не принимаются.
- Поддерживаемые языки - русский, украинский и немного английский. Вы можете сравнивать тексты на одном или на двух языках, выявляя не только прямой, но и переводной плагиат!
- Модель ищет не только точно совпадающие фрагменты, но и фрагменты с перефразами (то есть с разнообразными заменами).
- Сервис восстанавливает структуру документа и его оглавление автоматически, что иногда может не совпадать с реальным оглавлением.
- Сервис не ищет плагиат в Интернете или по базе диссертаций (которой у нас, увы, пока нет). Документы для сравнения пользователь предоставляет свои. Но если база, по которой можно искать плагиат, имеется, то можно доработать сервис в этом направлении...
- Есть сервис анализа связей диссертантов - можно загрузить информацию о диссертациях, авторах, научных консультантах и оппонентах для поиска взаимосвязей (фабрик диссертаций).
- Система создаётся в рамках проекта Диссернет на базе движка Pullenti и находится в активной разработке, поэтому информацию об ошибках и неточностях, а также пожелания и предложения отправляйте на k.smith@mail.ru (по технической части) или mihail.kopotev@gmail.com (по научной части);
А теперь за дело! Загрузите свои файлы или воспользуйтесь демонстрационным примером №1 .
Огромная просьба!
Поскольку мы в начале пути, то обо всех случаях некорректных загрузок, неправильных кодировок,
неправильного восстановления структуры просьба сигнализировать на k.smith@mail.ru,
прилагая сами файлы и описание некорректности.
История изменений:
Версия | Дата | Доработки |
---|---|---|
0.23 | 20.12.2020 | Улучшена работа с PDF-файлами |
0.22 | 01.08.2020 | Поддержан новый формат (docx) загрузки информации о диссертациях (для построения связей) |
0.21 | 31.07.2019 | Улучшен алгоритм загрузки разных форматов |
0.20 | 12.05.2018 | Добавлена поддержка английского языка. Теперь можно искать межязыковой плагиат и на английском. ВНИМАНИЕ! Это только первых "подход к снаряду", планируется дальнейшее развитие и включение других языков. |
0.19 | 23.09.2017 | Улучшены алгоритмы сравнения. Добавлена поддержка формата DjVu. |
0.17 | 18.05.2016 | При загрузке вторых документов, с которыми производится сравнение, можно до 30 файлов заархивировать и на вход подавать файл ZIP, RAR или 7z. |
0.16 | 17.05.2016 | Добавлена ещё одна форма представления плагиата в виде 3-х колоночной таблицы, ссылка под названием "сравнительная таблицы №2 (параллельность)". |
0.15 | 04.05.2016 | Усовершенствованы алгоритмы сравнения. |
0.14 | 21.04.2016 | Добавлена статистика загрузки информации о диссертациях, а также возможность просмотра списка диссертация по месяцам. |
0.12 | 22.03.2016 | Добавлен сервис загрузки информации о дисертантах и поиска связей между ними. |
0.11 | 13.03.2016 | Добавлена возможность сравнения документа с самим собой, то есть ищутся повторы, а не плагиат. Для этого добавьте один и тот же файл. Отметим, что повторы внутри главы не ищутся - только между главами. |
0.10 | 09.03.2016 | Теперь можно сравнивать сразу с несколькими документами. |
0.9 | 07.03.2016 | Добавлено табличное представление схожих участков - гиперссылка на странице с основным документом становится доступной, если был загружен хотя бы один документ для сравнения. Данная форма представления может быть полезна для отчёта. |
Для удобства навигации документы (не PDF) принудительно разбиваются на страницы примерно по 1600 знаков. Следует иметь в виду, что это может не совпадать с тем, как MS Word или другие средства работы с документами производят разбивку на страницы. | ||
0.8 | 05.03.2016 | Первая версия сайта. |