Как антиплагиат определяет сгенерированный текст — 12 признаков, 2 бесплатных детектора и 12 приёмов исправления искусственного текста
Здравствуйте, мой уважаемый читатель.
В этой статье поделюсь с вами информацией о 12 свойствах искусственного текста, по которым можно понять, как антиплагиат определяет сгенерированный текст.
Я покажу, чем отличается сгенерированный текст от текста, написанного человеком, расскажу, какие бесплатные детекторы можно использовать и как можно исправить искусственные свойства сгенерированного текста.
Эта статья является дополнением статьи о честном рабочем способе обхода такого выявления, о котором я рассказываю вот в этой статье: как убрать сгенерированный текст в антиплагиат вуз.
Я буду рассказывать о способах, которыми, на мой взгляд, генерацию текста определяет не только АП Вуз, но и другие детекторы сгенерированного контента.
Соответственно, очевидно, что для того чтобы детекторы ИИ не находили сгенерированный текст, нужно убрать признаки сгенерированного текста.
- 1 Бесплатные детекторы сгенерированного текста
- 2 Пример сгенерированного текста
-
3
Сгенерированный текст — 12 признаков
- 3.1 Повторение словосочетаний и слов
- 3.2 Повторение смысла в разных предложениях
- 3.3 Лексическое однообразие
- 3.4 Монотонность изложения
- 3.5 Неуверенное изложение
- 3.6 Несвязанность текста в разных параграфах
- 3.7 Отсутствие конкретных примеров
- 3.8 Отсутствие естественных ошибок и исправлений
- 3.9 Отсутствие информации после определённой даты
- 3.10 Крайне высокая оригинальность текста
- 3.11 Отсутствие ссылок
- 3.12 Отсутствие цитат
- 4 Как исправить сгенерированный текст в антиплагиате — 12 приёмов
Бесплатные детекторы сгенерированного текста
Чтобы лучше изучить, как убрать признаки генерации в работе, есть смысл сразу же проверять на практике — что работает и что нет.
Я могу вам посоветовать пару сервисов для определения сгенерированного текста: https://copyleaks.com/ru/ai-content-detector и https://www.zerogpt.com/.
На них вы можете бесплатно попрактиковаться менять и проверять сгенерированный текст так, чтобы его не определяли системы антиплагиата.
Пример сгенерированного текста
Давайте посмотрим на пример сгенерированного текста по теме «финансовая устойчивость предприятия» (как писать работу по данной теме) и выделим из этого текста признаки, что он сгенерирован.
Давайте посмотрим на сгенерированный текст примера и сделаем вывод, что в нём может увидеть система антиплагиата:
«Финансовая устойчивость предприятия – это ключевой аспект его успешной деятельности. Она означает способность предприятия эффективно управлять своими финансовыми ресурсами и обеспечивать стабильность своих финансовых показателей в долгосрочной перспективе. Финансовая устойчивость включает в себя не только наличие достаточных финансовых средств для покрытия текущих расходов, но и способность генерировать прибыль, справляться с долгами и рисковать для достижения долгосрочных целей.
Одним из основных аспектов финансовой устойчивости является наличие достаточных финансовых ресурсов, которые позволяют предприятию справиться с возникающими затратами и обязательствами в любых экономических условиях. Это включает наличие достаточного капитала, управление оборотным капиталом и способность привлекать финансирование по надлежащим условиям.
Одним из ключевых аспектов финансовой устойчивости является эффективное управление денежными потоками предприятия. Это включает в себя умение планировать и контролировать поступления и расходы, а также умение управлять рабочим капиталом. Предприятие должно иметь достаточную ликвидность для покрытия своих текущих обязательств, чтобы избежать проблем с платежеспособностью. Кроме того, финансовая устойчивость требует разумного уровня задолженности, чтобы предприятие могло выполнять свои финансовые обязательства и сохранять свою независимость и гибкость».
Сгенерированный текст — 12 признаков
Изучая признаки сгенерированного текста в выпускных квалификационных работах, важно учесть, что не все такие признаки плохи с точки зрения именно дипломных работ и проектов.
Например, у сгенерированного текста есть такое свойство — отсутствие эмоций и личного опыта. Но именно для учебных работ — так и должно быть: они пишутся безлично (например, не «я установил» или «я определила», а «в работе было установлено».
Это важно ещё и потому, что предполагается, что студенческая работа пишется под руководством преподавателя или научного руководителя, а значит, в ней будут конструкции типа «на наш взгляд», «мы полагаем» и т.п.
Поэтому дальше я сделаю акцент на тех особенностях, которые важны именно для учебных работ (типа курсовиков и ВКР).
Повторение словосочетаний и слов
Посмотрите на текст примера. В нём постоянно повторяется словосочетание финансовая устойчивость предприятия.
Чтобы это убрать — нужно использовать синонимы, местоимения и т.п.
Например, устойчивость финансового состояния коммерческой организации.
Повторение смысла в разных предложениях
Посмотрите на конец примера. Последние два предложения — об одном и том же.
Выполнение финансовых обязательств — как раз и характеризуется платёжеспособностью.
Такие повторные элементы стоит объединить, а лишнее — удалить.
Лексическое однообразие
Из предыдущих пунктов следует, что нейросети стремятся генерировать текст, близкий к поставленному запросу, не используя синонимы и синонимичные выражения.
Нужно сделать текст более пёстрым и разнообразным. Если в голову ничего не приходит, можно воспользоваться бесплатным сервисом https://quillbot.com/. Не забудьте выбрать для текста русский язык.
Монотонность изложения
Текст, созданный ИИ, — семантически однородный, монотонный. Когда его читаешь — он просто скучный. Вроде, всё примерно по делу, но взгляд ни за что не цепляется.
Вот прочитайте пример — его очень сложно воспринимать, когда читаешь середину — уже забываешь, что там было в начале.
Самый простой, хотя и сравнительно долгий способ это исправить — просто перепечатать текст так, как это указано в статье про избавление от сгенерированного текста.
Неуверенное изложение
Модель искусственного интеллекта предсказывает текст, а значит, она часто использует слова «возможно, может, вероятно» и т.д.
Чтобы это убрать — нужно добавить конкретики и уверенности в тексте.
Несвязанность текста в разных параграфах
Текст, который написан в начале главы, не согласуется с текстом в конце главы.
Искусственный интеллект не может помнить весь контекст работы, поэтому смысл меняется.
Чтобы с этим справиться, нужно просмотреть текст работы и дописать выводы в параграфах о связи с темой работы
Отсутствие конкретных примеров
Чатгпт, например, обычно не приводит примеров, не упоминает названий организаций, имён людей и т.д.
Соответственно, в текст можно добавить примеры.
Отсутствие естественных ошибок и исправлений
Тексты, созданные ChatGPT и аналогичными моделями не содержат естественных ошибок. Например, человек может написать «специалисты рекомендую», на заметив эту опечатку. И проверка в редакторе тоже может её пропустить.
Нейросети такого не допускают. Но зато делают свои собственные ошибки. Например, в сгенерированном тексте примера словосочетание «финансирование по надлежащим условиям» звучит крайне странно. Заметно чаще такая фраза звучит как «финансирование на выгодных условиях».
Чтобы это исправить — можно просто прочитать работу и поправить то, что кажется неестественным и бросается в глаза.
Отсутствие информации после определённой даты
Многие модели обучены на сравнительно старых данных. Так, первые версии чатгпт обучались на данных до 2021 года. Поэтому они не знают, что было после этой даты.
Для исправления данного момента — следует дополнить работу свежими данными
Крайне высокая оригинальность текста
Нейросети могут генерировать текст, оригинальность которого близка к 100%. Это, естественно, подозрительно для систем проверки.
Чтобы исправить данную ситуацию, можно разбавить текст копированием из источников в открытом доступе (например, с сайтов, где находятся образцы курсовых и дипломных работ по вашей теме).
Я советую вам для себя помечать, где вы добавили скопированный текст, потому что если его недостаточно, то Антиплагиат пометит и этот текст, и текст вокруг как сгенерированный — разобраться будет сложно.
Отсутствие ссылок
Общее правило для нормальных курсовых и выпускных квалификационных работ — 2-3 ссылки на страницу текста в теоретической части.
Для исправления работы следует добавить ссылки на источники литературы в её текст.
Отсутствие цитат
Несмотря на то, что от цитат в работе пользы особо нет (они занижают уровень оригинальности), тем не менее, их отсутствие также признак сгенерированного текста.
Разумно добавить хотя бы несколько правильных цитат, оформив их согласно требованиям Антиплагиата (как оформлять цитаты)
Как исправить сгенерированный текст в антиплагиате — 12 приёмов
Чтобы исправить сгенерированный текст в антиплагиате нужно сделать следующее:
- убрать повторения словосочетаний и слов;
- удалить или объединить предложения с одинаковым смыслом;
- разнообразить лексику с помощью quillbot.com
- сокращать монотонность изложения — делая маленькие выводы после каждой пары абзацев;
- добавить уверенности — заменить фразы типа «может способствовать» на «способствует»;
- упомянуть в следующих параграфах некоторые выводы из предыдущих;
- добавить примеры — названия компаний, имена людей, даты, периоды, события и т.д.;
- уберите искусственные ошибки — если какая-то фраза вызывает сомнения — просто напишите её так, как обычно люди говорят;
- добавьте актуальные данные последних лет и месяцев;
- разбавьте сгенерированный текст копипастом;
- добавьте ссылок на литературу — пару штук на каждую страницу;
- добавьте цитаты в теоретическую часть — по одной на 2-3 страницы.
Чтобы не заниматься этим всем по отдельности, я советую вам воспользоваться методом, представленным в уже упомянутой статье про избавление от сгенерированного текста.
В целом, на мой взгляд, это основные способы как разные антиплагиаты определяют сгенерированный текст в дипломных и курсовых работах.
Желаю вам удачи в исправлении вашего текста.
Александр Крылов, diplom35.ru.