Дорвеи рулят, а проф-контент хоронит выдачу Яндекс

Задача оценки качества контента столь же многослойна как и торт «Наполеон». Количественные методики оценки смысловых единиц и акцентов документа уже давно не актуальны, но и качественные методики не реализуемы без создания полноценного искусственного интеллекта (ИИ). Самообучающийся алгоритм с участием асессоров — максимум, который сейчас доступен поисковым системам.

Дорвеи рулят, а проф-контент хоронит выдачу Яндекс

Даже рекомендации поисковых систем по улучшению качества сайтов, их фильтры и санкции, есть ничто иное, как латки на брешах алгоритмов. Чего только стоит признание Google о влиянии контекста на алгоритмы автоматического перевода:

Автоматический перевод — это очень сложная система, поскольку значение слов зависит от контекста, в котором они используются. Поэтому бывают ошибки и неправильные переводы, которые мы стараемся исправить как можно быстрее, как только узнаем о них

Другими словами, используя контекст, можно вполне себе накрутить (пусть даже временно) уровень качества сайта.

Выдача Яндекс с 1 по 10 позицию по НЧ

Но спустимся от Google к Яндекс и посмотрим на его выдачу. Для своего исследования, я взял небольшую выборку из 30 низко-частотных поисковых запросов по теме «качественный контент» и вручную просмотрел и оценил все 300 сайтов из ТОП-10. Надеюсь, вы оцените мой подвиг без вовлечения в процесс гнилых помидоров.

Выдача Яндекс с 1 по 10 позицию по НЧ
Выдача Яндекс с 1 по 10 позицию по НЧ

В результате я выделил 5-ть основных групп сайтов:

  • статейники и блоги (19,7%) — с более-менее качественным контентом;
  • Форумы, порталы, QA и т. п. (13%) — в основном с пользовательским контентом;
  • другие сайты (23,7%) — эдакие серенькие мышки, которые прилепились «левым боком»;
  • рефераты, библиотеки и т. п. (22,3%) — сплошной копипаст, но часто научный и даже профессиональный контент;
  • дорвеи (21,3%) — на самом деле, под это понятие попало несколько больше сайтов, но я не хотел сильно злобствовать.

Мои выводы таковы:

  • Пользовательскому контенту не тягаться с другими видами «заточенного» контента.
  • Всегда есть возможность пробиться по НЧ «левым боком».
  • Дорвеи рулят, особенно если это профессиональный контент.

Но главное это то, что ждёт нас в будущем. А там разворачивается Google Phantom и планирует вдарить Яндекс Ижевск. Как я понимаю, эти алгоритмы ударят, в первую очередь, по любительскому контенту, который имеет мало общего с реальностью, но зато работает и написан понятным обычным людям языком.

Выбить из выдачи дорвеи и псевдо-профессиональный контент поисковикам пока не удаётся. Поэтому единственное спасение я вижу в курсах «молодого специалиста», когда любительский контент будет отбивать трафик своей весовой категорией.

Выдача Яндекс с 11 по 20 позицию по НЧ

Копнём глубже и посмотрим вторую страницу выдачи, с 11 по 20 позицию. Существует предположение, что (из-за сеошников) смотреть ТОП-10 нет смысла, весь нормальный контент начинается со второй страницы.

Результаты исследования говорят об обратном. Число статейников и (особенно) сервисов пользовательского контена — падает, а вот присутствие левых сайтов, всяких библиотек и дорвеев — растёт.

Выдача Яндекс с 11 по 20 позицию по НЧ
Выдача Яндекс с 11 по 20 позицию по НЧ

Соотношение сил здесь таково:

  • статейники и блоги (18,7%);
  • форумы, порталы, QA и т. п. (9%);
  • другие сайты (24,6%);
  • рефераты, библиотеки и т. п. (24,6%);
  • дорвеи (23%).

Ещё несколько наблюдений:

  • Львиную долю дорвеев составляют ГСы конторок перевода, копирайта и прочего низкокачественного сервиса.
  • Серые кардиналы Интернета — новостники, которые собирают событийный трафик и часто лепятся по НЧ запросам.
  • Похоже век варезников на исходе, они (как когда-то каталоги сайтов) ещё способны окупить себя и дать прибыль, но уже не торт.
  • Если о первой страница выдачи это: «всё те же знакомы лица», — то вот вторая больше напоминает разношерстную компанию — собрали всего по немного и подали пользователю на пробу.
  • Убирайте с сайтов нецензурную лексику и шоковый контент, похоже за это реально топят.

Ну и главное дополнение — спасибо сеошником за красивые сайты, которые приятно посещать. Пусть контент — шлак, но зато обёртка часто симпатичная.

Короткая ссылка: http://goo.gl/ChCsJp

kiovo
kiovo комментирует...

Помню запрос "качественный контент" продвигали в SEO-марафоне "Пощупаем Пингвина". В ТОПах до сих пор полно конкурсных сайтов. Ну и методы для продвижения использовались разные, так что статистика может быть немного смазана. Но это не меняет основного вывода, что от новых алгоритмов могут пострадать в большей степени нормальные сайты и блоги.

Unknown
Unknown комментирует...

Думаю, з таким трафіком можна і самому потрапити під фільтр ПС.
Витяг з Вікіпедії: https://uk.wikipedia.org/wiki/%D0%94%D0%BE%D1%80%D0%B2%D0%B5%D0%B9
Час існування дорвея.
З часом пошукова система оброблює дані й бачить, що дорвей - це штучний сайт й виключає його сторінки з основного індексу. Таким чином середній час існування дорвеїв - 1-3 місяці.

wmascat
wmascat комментирует...

2kiovo Уже сейчас страдает сама выдача… от дорвеев с «профессиональным» контентом, а в будущем под раздачу может попасть и любительский контент, как не имеющий профессиональной основы, он даже в соцсетях не удержится.

wmascat
wmascat комментирует...

2Пєсков Ігор Такое понятие как «дорвей» всё сложнее определить количественными методиками, которыми и используют поисковики. Если дорвей имеет профессиональный контент, пусть даже копипаст, он вполне может себе жить, очень должно и счастливо :D

Артис72
Артис72 комментирует...

По НЧ часто для выдачи не хватает качественных релевантных сайтов и соответственно данных для норм ранжирования, поэтому и легко туда дорвеи попадают. Скажем в "пластиковых окнах" много накопленно и там нет "мусора". Т.е. обоюдное влияние и интерес-конкуренция в запросе выравнивают.

wmascat
wmascat комментирует...

2Исаев Артем Сайтов хватает, но в ТОП сплошные дорвеи. Вообще, наверное, надо попробовать исследовать ТОП 10-20 и сравнить с текущими результатами. Думаю, это будет интересно.

Unknown
Unknown комментирует...

"обвёртка"? Или так и задумано?

Gro
Gro комментирует...

>Автоматический перевод — это очень сложная система, поскольку значение слов >зависит от контекста, в котором они используются. Поэтому бывают ошибки и >неправильные переводы, которые мы стараемся исправить как можно быстрее, как >только узнаем о них — источник BBS русская служба
>Другими словами, используя контекст, можно вполне себе накрутить (пусть даже >временно) уровень качества сайта.

Откуда такой вывод? у слова "контекст" несколько значений. И в данном заявлении Гугла он говорил явно не про контекстную рекламу.

wmascat
wmascat комментирует...

Unknown и я тоже не про контекстную рекламу.

seoonly.ru
seoonly.ru комментирует...

Доры непобедимы))))

Лиля Вежеватова
Лиля Вежеватова комментирует...

Давно не заходила, а тут, оказывается, не только картинки к статьям интересные стали, но и полезного прибавилось :)
По статье.
Первое. Google однозначно имел ввиду контекст в котором используется слово в документах, а не контекстную рекламу. Так что "накрутить качество сайта" контекстной рекламой не получится. Да и вообще, при чем тут перевод и качество сайта?
Второе. Для исследования взяты низкочастотники по теме "качественный контент". Какие именно? Это коммерческие низкочастотники (ex.: "заказать качественный контент под ключ в Мухосранске") или нет? Потому что по коммерческим низкочастотникам в конкурентных тематиках (ex.: "установка кондиционеров под ключ в Мухосранске") ситуация в выдаче в корне иная.

wmascat
wmascat комментирует...

2Лиля Вежеватова:
1) а я говорю именно о текстовом контексте, а не рекламе. Представь ситуацию, когда для какого-то ключевика, цитаты и т. д. накручивает «траст» в контексте, что оно от профессионала, поисковик начинает воспринимать текст и сам сайт с ключевиком, цитатой и т. д. как профессиональный и подымает его ранжирование. Перевод и поиск — вещи разные, но принцип работы алгоритмов определения контекста те же.

2) я специально не заострял внимание на формате ключевика, тут полный рандом, просто тема одинаковая. В мои планы не входило делать полномасштабное исследование, с учётом моих возможностей это невозможно, да и очень дорого, ведь оценка качественная, а не количесвенная, т. е. проводится человеком, а не алгоритмом.

Skarui
Skarui комментирует...

Важен не только контент в плане текста, но и 100500 других факторов. Я выделяю такие факторы в плане релевантности страницы: тексты должны логически и семантически делиться на заголовки и подзаголовки. Отвечать на запросы пользователей не только полностью, но и давая информацию наперед. Должны содержать также графику и/или медиа для более быстрого и успешного усваивания (лучше посмотреть или послушать чем читать, ведь пользователь в интернете ленив).