Галина Аксенова Мастер

Что такое уникальность текста и как ее проверить?

Вы наверняка уже не раз слышали, что поисковые системы особенно ценят уникальные тексты, и потому, создавая свой сайт или какой-либо интернет-проект, искренне намерены наполнять его только оригинальными произведениями мастеров пера.

Интуитивно вы уже понимаете, что уникальный текст — это текст, написанный с нуля и непохожий на другие, то есть он такой один. Без копий, без повторений. Когда вы пишете текст сами, вы уверены, что ваш текст уникален. Однако каково же бывает удивление, когда вдруг обнаруживается, что текст, который вы сами сочинили, отнюдь не уникален с точки зрения поисковых систем.

Простой пример. Вы придумали название статьи, забиваете его в поисковик и вдруг видите, что его до вас уже придумали…

На практике уникальность текстов проверяется с помощью специальных онлайн-сервисов или устанавливаемых на компьютере программ, которые работают по принципу поисковых систем. Ими пользуются и редакторы сайтов, и студии интернет-сайтов, и сами авторы.

Однако оказывается, что ничего непогрешимого нет, и идеальных приложений по оценке уникальности текстов тоже. Так, взяв одну давно опубликованную на проекте статью (а следовательно, уже имеющую немало дубликатов), я решила проверить, насколько сходными окажутся результаты. Так, сервис copyscape.ru показал 9 копий, miratools.ru обнаружил 39 дубликатов, istio.com — 23, программа DСF — более 50. Я заинтересовалась, почему же результаты столь различны.

Если объяснять простыми словами, то, с точки зрения роботов, уникальным будет тот текст, в котором порядок слов не совпадает ни с одним из имеющихся в арсенале вариантов. Именно поэтому одним из самых простых и быстрых способов сделать текст оригинальным является перестановка предложений или замена некоторых слов синонимами. И там, где человек заметит явный плагиат, робот, возможно, одобрительно пройдет мимо.

Уникальность текста проверяется поисковыми системами на основе сложных алгоритмов, смысл работы которых заключается в том, чтобы проанализировать разбитые на кусочки цепочки слов проверяемых текстов и сравнить полученные результаты. Чем короче отрезки текста, тем точнее выходит результат.

Текст разбивается на отрезки из пяти-шести слов, которые преобразуются в двоичный код. Во время проверки каждому участку текста присваивается некое уникальное число, и результат вычисляется по заданному алгоритму в виде контрольной суммы. У разных текстов контрольные числа не могут совпадать. Причем в процессе подобного «сканирования» текста конечное слово одного отрезка является первым для нового отрезка, и, следовательно, ни одно слово не теряется. Этот метод называют методом шинглов. Чем короче будут проверяемые отрезки текста, тем точнее результат. Обнаружатся не только точные копии вашего текста, но и его «легкие» переделки.

Метод пассажей предполагает разбивку текста на более крупные участки: проверка идет уже не на уровне словосочетаний, а на уровне предложений. Например, если из десяти слов одного предложения пять слов совпадут с составом другого предложения, его уникальность будет оценена в 50 процентов.

В основе большинства приложений, созданных для проверки уникальности текста, лежит метод шинглов. Однако, наряду с высокой эффективностью поиска дубликатов, у метода есть свой минус.

Надо быть очень осторожным с подобными приложениями, если вы, например, используете цитаты: тексты в кавычках могут значительно уменьшить показатель уникальности текста. То же касается и различных распространенных выражений: поговорки, пословицы, фразеологические обороты, придавая тексту оригинальность, могут существенно поубавить его уникальность.

Поэтому не стоит удивляться, если ваш собственноручно написанный оригинальный текст вдруг забракует программа: ей не до изысков стиля, все дело — в математике.

Обновлено 16.05.2011
Статья размещена на сайте 20.12.2010

Комментарии (21):

Чтобы оставить комментарий зарегистрируйтесь или войдите на сайт

Войти через социальные сети:

  • Александр Бирюков Читатель 30 июня 2017 в 11:50 отредактирован 23 мая 2018 в 10:46

    супер

  • Пётр Осипович Читатель 7 марта 2016 в 13:14 отредактирован 24 мая 2018 в 12:32

    При помощи сервиса АнтиПЛАГ регулярно в режиме онлайн повышаю уникальность студенческих работ. После обработки проверка проходит с отличным результатом. Курсовая была с уникальностью 34% а после обработки стала 78%. Повышает уникальность текста по всем существующим системам проверки класс! Рекомендую!!!

  • Алексей Маслий Читатель 24 декабря 2015 в 17:04 отредактирован 25 мая 2018 в 06:41

    Купил готовую работу в интернете – проверил на антиплагиат – оказалось полностью ворованная – показало всего 7% уникальности. Нашел случайно сервис: antiplag ru Обработал и у меня теперь 76%. А в институте требуют 75% так что думаю, что пройдет.

  • Карен Саркисян Читатель 21 января 2015 в 02:27 отредактирован 26 мая 2018 в 17:22

    Ну я например на своем сайте стараюсь брать тексты из книг или журналов, и за частую он уникален на все 100% и написан очень правильно и умно. Ибо самому написать текст такой же как и редакторы журналов за частую нереально, ну или очень затруднительно...

  • Алексей Баранов Читатель 26 ноября 2014 в 12:56 отредактирован 26 мая 2018 в 17:53

    Я поняла, что если писать самой, то это пустая трата времени, а мне необходимо быстро и качественно застраховать от плагиата свою работу.<удалено модератором>

  • Галина Аксенова, а какая же программа считается лучшей?

  • Александр Рогов Александр Рогов Читатель 27 мая 2011 в 14:24 отредактирован 25 мая 2018 в 08:54
    программка

    А я проверяю тексты на уникальность с помощью простой и удобной программки - Advego Plagianus. В своем роде считают одной из лучших.

  • Татьяна Гусева Татьяна Гусева Дебютант 16 мая 2011 в 09:37 отредактирован 16 мая 2011 в 09:39

    Галина Аксенова, странно: Именно поэтому одним из самых простых и быстрых способов сделать текст оригинальным является перестановка предложений или замена некоторых слов синонимами . Или я не поняла, или вы перед этим писали о том, почему собсственноручно и только что написанная статья оказывается неуникальной.И тут же предлагаете перестанавливать предложения, заменять слова. Как это вылядит технически: Вы пишите свою уникальную статью и тут же все меняете и перестанавливаете? Или речь все же не об авторской статье, а о копирайте? И еще, мне кажется, нельзя говорить "редактора" - редакторы.

  • Галина Аксенова, Для всего этого есть программа антиплагиат, которой сейчас пользуются все наши издательства.

    • Марианна Власова Марианна Власова Бывший главный редактор 15 мая 2011 в 22:48

      владимир сиротенко, база программы Антиплагиат ограничена, так как формируется по базам рефератов, курсовых и прочих студенческих работ, а не по данным поисковых систем. Поэтому, например, она покажет, что текст, скопированный с нашего сайта - уникален, хотя он уже разошелся по другим сайтам и блогам. Мы пользуемся Антиплагиатом как одной из программ проверки, но верить только ей нельзя.

  • Люба Мельник Бывший модератор 15 мая 2011 в 12:20

    Так, сервисы copyscape.ru показал 9 копий, miratools.ru обнаружил 39 дубликатов, istio.com – 23, - сервис, в ед. числе.

    • Владимир Белый Владимир Белый Дебютант 15 мая 2011 в 13:45 отредактирован 25 мая 2018 в 08:46

      Advego Plagiatus - еще один сервис для проверки уникальности

      Оценка статьи: 5

      • Марианна Власова Марианна Власова Бывший главный редактор 15 мая 2011 в 22:43 отредактирован 15 мая 2011 в 22:44

        Владимир Белый, некоторое время назад мы пробовали этой программой пользоваться - она неудобная. А DCFinder от биржи статей textbroker.ru мы используем в работе. И то, и другое - не онлайн-сервисы, а программы, требующие установки на компьютер. Вот здесь о них подробнее.

  • Галина Аксенова, для новичков полезная статья.
    Может вы подскажите или кто еще в теме: если записать подкаст отрывка книги - это будет уникальный контент на сайте?
    Что анализируется: сам материал или тут как с картинкой: один и тот же футбольный мяч можно уникально сфотографировать несколько раз?

  • Галина Аксенова, в принципе всё правильно, всё сходится. Однако, думается мне, что многое зависит от словарного запаса копирайтера-рерайтера. Даже я берусь отрерайтить любой текст сразу до уникального. Без дополнительных проверок. Что уж о профи говорить. А начинающим оно, конечно, да, полезная инфа.

    Оценка статьи: 5

  • Галина Аксенова, отличная и полезная статья, особенно для тех (вроде меня), кто только учится писать тексты. С совпадениями сталкиваюсь регулярно. Но так даже лучше, исправляя иногда можно написать более интересный текст. Без сомнения 5!

    Оценка статьи: 5

  • в цитатник

    спасибо...особенно за ссылки полезные и название программы

    Оценка статьи: 5