Определяем уникальность текста: 3 сервиса — 3 результата


Снежинки уникальны, тексты — не всегда. Кому верить при проверке и так ли на самом деле важны показатели уникальности? Проверяем один и тот же текст тремя сервисами и смотрим, что из этого получается.

Advego Plagiatus

Он популярен даже несмотря на устаревший метод проверки. Advego Plagiatus проверяет текст методом шинглов. Шингл — часть текста из 2-9 последовательных слов без учета служебных слов и знаков препинания. Начало каждого следующего — последние слова из предыдущего. Приложение, использующее метод шинглов, делит текст на одинаковые отрезки внахлест и ищет соответствия в других текстах из поиска. По умолчанию шингл там равен 4 словам. Настраивайте, если не нравится.

Advego Plagiatus

Проверка advego plagiatus показала уникальность 96%.

Часто в списке страниц, на которых найдены совпадения, можно найти сайты, тематика которых не совпадает с темой текста. Технически это понижает процент уникальности, практически — скорее всего нет.

Ни орфографию, ни SEO-характеристики текста по дефолту программа не проверяет. В колонке справа от рабочего поля есть предложения по SEO-анализу и проверке на орфографию. Но у меня ими воспользоваться не получилось:

Advego Plagiatus не работает

text.ru

По заявлению разработчиков, сервис text.ru не использует метод шинглов при определении уникальности текста. Они утверждают, что сервис работает на более современном алгоритме, который существенно отличается от устаревшего метода шинглов. Подробней о принципе работы администрация сервиса не распространяется.

Как бы то ни было, сервис распознает примитивный рерайт (перестановку слов, изменение по числам, падежам, синонимичные замены отдельных слов).

Такой результат показал text.ru при проверке того же текста:

text.ru

Что удобно в этом сервисе — автоматическая проверка орфографии и SEO-анализ. Правда, часто за ошибку признаются названия организаций. Но это детали словаря. Синтаксис сервис не правит, зато помогает обнаружить опечатки и случайные ошибки.

Что не удобно — нельзя игнорировать домен, если проверяете уже размещенный на сайте текст. Конкретный адрес или весь домен можно исключить только после проверки.

content-watch.ru

Этот сервис показал самый низкий процент уникальности. По заверениям разработчиков, метод шинглов при проверке они не используют, а работают на алгоритмах собственной разработки. Как и в случае с text.ru, подробностей об алгоритме «ручной сборки» нет.

content-watch.ru

Что удобно в content-watch — можно проверять уникальность текстов на сайте в автоматическом режиме и следить, кто и что уволок. Причем, в отличие от text. ru, при проверке до 5 страниц в день это бесплатно.

Что не удобно — редактировать текст, когда хочется на пару процентов поднять уникальность, «не отходя от кассы». В режиме редактирования метки с не уникальных фрагментов пропадают. Можно по памяти, но неудобно.

Почему результаты отличаются?

  • Различие в алгоритмах проверки. Отличие Advego Plagiatus от двух других сервисов очевидно — он точно использует метод шинглов. Сontent-watch и text.ru пользуются собственными разработками. Возможно, между собой они тоже отличаются по способу оценки текста.
  • Количество проверенных страниц. При низкой скорости подключения Адвего делает меньшую выборку, чтобы сократить время проверки.
  • Отсутствие доступа к ресурсу во время проверки. Если сайт с таким контентом недоступен во время проверки текста, его содержание не учитывается при формировании результата.

Из-за этих причин могут отличаться результаты проверок одним сервисом, но сделанные с разницей в 2 часа.

Что с этим делать и как определить настоящий процент уникальности текста?

Сервис по проверке уникальности — это не воплощение Правосудия и не истина в последней инстанции. Не полагайтесь слепо на результаты и оценивайте их критически.

  1. Проверяйте работу сервисов. Думайте головой, не воспринимайте результат оценки текста как истину в последней инстанции. Иногда они находят совпадения в текстах других тематик. Пройдите по ссылкам и почитайте, что написано на странице. Если вы пишете о дверях, а программа видит совпадения в тексте про материнство — это сомнительные выводы.
  2. Следите за языком. Из-за штампов текст кажется шаблонным. А это проблема похуже низкой уникальности. Если видите замусоленное выражение — убирайте. Текст станет живее и интереснее. Эти «в современном мире», «в настоящее время», «команда квалифицированных специалистов» не трогают читателя и не вызывают доверия к тексту.

Определитесь, что вам нужно

Сама по себе уникальность текста — это не самоцель. Давайте признаемся: никому не нужна уникальность как таковая. Она нужна, потому что на нее (в том числе) ориентируется поисковая система при анализе сайта и ранжировании. Она нужна, чтобы не получить пинка и не вылететь из индекса. В чем ваша цель: добиться абстрактного показателя уникальности в 95% или написать материал, который будет полезен и востребован пользователями (а значит — понравится поисковикам)?

Да, поисковые системы банят за неуникальные тексты. Но не всегда. Если вы скопировали материал, проставили ссылку на источник и разместили его у себя, среди собственных текстов — Google не обрушится на вас с санкциями.

Вы используете в своем материале цитату и указываете ссылку на источник — техническая уникальность понижается (алё, у вас же кусок чужого текста в материале), но никто не будет вас за это банить. А если материал интересный и актуальный для читателей — это улучшит ваши отношения с поисковиком.

Зато, если вы делаете механический рерайт (пусть и на 100%), но не даете ничего нового в своих материалах — это не улучшит ни отношение к вам со стороны пользователей, ни ранжирование сайта. Потому что актуальность и востребованность контента важнее, чем просто уникальность. Строго говоря, если единственное достоинство материала — уникальность выше 95%, то ерунда это, а не полезный текст.

Рассказывайте в своем тексте что-то новое и интересное для аудитории. Анализируйте проблему с другой точки зрения, иллюстрируйте текст собственными материалами — повышайте его смысловую уникальность. Поисковые алгоритмы совершенствуются, они умеют анализировать поведение пользователей, которые читают текст. Рерайт со 100% уникальностью не интересен пользователям и все менее интересен поисковикам. То, что им нравится — информация, которую вы даете. Такой контент принесет пользу и вам, и сайту.

Это я все к чему: не нужно огульно отказываться проверять уникальность или бездумно копипастить чужие материалы. Это чревато проблемами с ПС. Особенно, если сайт молодой и своего, интересного и полезного контента у него с гулькин нос. Я к тому, что любой сервис дает вам приблизительные результаты, на которые вы можете ориентироваться, но не слепо следовать. Нет никакой «истинной» или «ложной» технической уникальности. Все, что вы видите по окончании проверки — оценка, которую дает программа в данный момент, используя доступные ей средства. Вы не найдете точной информации о том, какой алгоритм используют сами поисковые системы при проверке и оценке текста. Поэтому — не перегибайте, относитесь к этому проще. Не перепроверяйте текст по 10 раз в разных сервисах и не режьте абзацы бездумно каждый раз, когда видите неуникальное предложение. Здраво оценивайте и результаты, и собственный текст. Используйте content-watch. ru, text. ru, Advego Plagiatus и иже с ними как подспорье, но не пишите текст «чтобы прошел проверку». Следите за содержанием, смыслом и логикой изложения.


+ Нет комментариев

Добавить комментарий