пятница, 11 марта 2011 г.

Копипаста


Это исследование посвящено профессиональным СМИ рунета — сайтам, материалы которых написаны на русском языке сотрудниками редакции этих сайтов. Рассматриваются как интернет-версии традиционных СМИ, так и собственно онлайн-СМИ.
Все основные данные получены от службы Яндекс.Новости. Это крупнейший агрегатор новостей в рунете — в январе 2011 года Яндекс.Новости обрабатывали в режиме реального времени сообщения более чем 3500 онлайн-СМИ. Также в отчёте использованы данные открытой системы статистики LiveInternet.ru и компании comScore. Исследование охватывает период с сентября 2010 по январь 2011 года.

1. Новости и их аудитория
1 Под новостями (сообщениями) в этом исследовании понимаются в том числе статьи, интервью - то есть все публикации изданий, которые работают с Яндекс.Новостями.
2 Учтены все сообщения всех онлайн-СМИ, содержащихся в базе Яндекс.Новостей.
По данным Яндекс.Новостей на январь 2011, каждый будний день СМИ публикуют в интернете не менее 50 тысяч новостей1 на русском языке, каждый выходной — не менее 15 тысяч2. Две трети этого потока создают российские издания, 22% — украинские. Ещё примерно 9% сообщений приходят от СМИ из бывших республик СССР, остальные 2–3% — из дальнего зарубежья. 80% новостного потока генерируют всего 20% крупных изданий. Половина всех СМИ пишет не более четырёх сообщений в будний день. С точки зрения количества публикаций самое продуктивное издание — «Комсомольская правда», каждый будний день она выпускает около 900 сообщений.
По данным comScore на декабрь 2010, месячная аудитория русскоязычных СМИ во всём мире превышает 40 миллионов. Около 25 миллионов из них — пользователи из России, около 12 миллионов — из Европы. Тем не менее, по данным счётчика LiveInternet.ru, аудитория большинства онлайн-СМИ сравнительно невелика. Это означает, что читатели новостей в интернете получают информацию преимущественно из узкого круга изданий.



2. Сообщения в зависимости от типа издания

Сообщения в разных типах СМИ выглядят по-разному. Самые длинные материалы появляются на сайтах еженедельных журналов, их средняя длина — 485 слов (это примерно одна страница формата А4). В еженедельных журналах также самая высокая доля интервью — 1% от всех публикаций. Самые короткие публикации появляются на сайтах телеканалов и радиостанций, их средняя длина — 195 слов.
Мультимедийные объекты в сообщениях онлайн-СМИ встречаются довольно редко: изображения — в 39% сообщений, а аудио и видео — всего в 1–2%. Даже в сообщениях на сайтах телеканалов и радиостанций они есть далеко не всегда. А мультимедиа всех трёх типов (и изображения, и аудио, и видео) в заметном количестве встречаются в основном на сайтах телеканалов, например, «Россия» (vesti.ru) и «Дон-ТР» (dontr.ru).
Типы профессиональных СМИ рунета
Онлайн-версии обычных СМИ — газет, журналов, телеканалов и радиостанций.
Собственно сетевые СМИ, не существующие за пределами интернета.
Информационные агентства — компании, которые специализируются на оперативном предоставлении информации.
Тематические сайты, которые ведут новостную колонку по определенной теме.
Сайты государственных организаций, публикующие официальную информацию.


Количество изображений в сообщениях зависит также от региона издания. Например, украинские СМИ публикуют их в 47% новостей, а российские — всего в 36%. Внутри России ситуация тоже неоднородна. Урал по доле сообщений с изображениями обгоняет не только Москву, но даже Украину, а Северный Кавказ отстаёт от Урала почти втрое.

3. Активность русскоязычных онлайн-СМИ3

3 Все показатели активности в этом разделе рассчитаны для будних дней.

3.1. Активность в зависимости от типа издания

Среди всех типов онлайн-СМИ больше всего сообщений выпускают информационные агентства — в среднем 37 в день.Впрочем, крупнейшие из них пишут гораздо больше — по 300–400 сообщений в день. Благодаря своей высокой активности информагентства обеспечивают 22% новостного потока, хотя составляют всего 7% от онлайн-СМИ. Высокая активность информагентств вполне понятна — они специализируются на быстрой поставке информации.
Меньше всего пишут сайты государственных организаций и тематические сайты — по 3–6 сообщений в день. Это тоже закономерно, поскольку они освещают только те события, которые непосредственно касаются их сферы деятельности. Тем не менее, тематические сайты генерируют целых 30% новостного потока — просто потому, что их очень много.

3.2. Активность по странам

По данным на январь 2011, каждый день среднее СМИ из России выпускает 13 сообщений. Украинские СМИ заметно активнее — они пишут в среднем 21 сообщение в день. В обеих странах основной поток новостей создают издания из столиц — киевские СМИ ежедневно выпускают по 34 сообщения, московские — по 17.
В ближнем зарубежье наиболее активны издания из Кавказа и Прибалтики, они выпускают более 30 сообщений в день. В дальнем зарубежье лидируют израильские СМИ (21 сообщение в день). Вообще, русскоязычные онлайн-СМИ за пределами России часто выпускают больше сообщений, чем среднее российское издание. Это связано с тем, что в России есть много мелких изданий и тематических сайтов, которые пишут сравнительно редко.


3.3. Активность по регионам России

Среди российских регионов наиболее активны Дальний Восток и Урал — местные СМИ выпускают в среднем по 14 сообщений в день, уступая только изданиям из столицы. Меньше всего пишут издания из Центра — основной новостной поток в этом регионе создают московские СМИ.


Издания из разных регионов достаточно сильно различаются по тому, сколько внимания они уделяют событиям внутренним (связанным со своим регионом) и внешним (не связанным с ним). Больше всего о внутренних событиях пишут СМИ Южного округа, почти треть их сообщений посвящена своему региону. Меньше всего о своём регионе пишут СМИ Северного Кавказа и Дальнего Востока — только в шестой части сообщений (рис. 6).


4. Новостной поток

В первые час–два после события средняя длина сообщения о нём составляет 150 слов, а спустя десять часов — уже более 200. Доля коротких сообщений (короче 50 слов) за это время падает в два раза, а доля длинных (длиннее 500 слов) — увеличивается в 3–4 раза.
Большинство событий не получают сильного резонанса в СМИ — о половине из них выходит не более трёх–четырёх новостей. События, о которых написано более ста сообщений, составляют всего 1%.
Если про событие заранее известно, когда оно произойдёт, у журналистов есть время подготовиться к нему. Информация о таких событиях — например, о спортивных соревнованиях — появляется в профильных СМИ практически в режиме реального времени.
Чтобы узнать о внезапно произошедших событиях и проверить достоверность информации, требуется время. По данным на осень 2010, сообщения о самых серьёзных происшествиях онлайн-издания публикуют на своих сайтах с задержкой в 20–30 минут. С такой скоростью СМИ реагируют только на особенно значительные события, причём, как правило, произошедшие в Москве. О менее заметных происшествиях или о событиях, случившихся в регионах, обычно сообщают спустя несколько часов.
4 Время события определялось по времени первого сообщения о нём.
О событиях, которые произошли утром или днём4, больше всего пишут в первые несколько часов (рис. 7). К вечеру поток публикаций ослабевает, но на следующий день о событии снова вспоминают — возможно, те издания, которые не успели написать накануне, а возможно, появляется дополнительная информация. Основной поток сообщений о вечерних и ночных событиях появляется только на следующий день — ночью большинство изданий не работает. Правда, вечером и ночью происходит в 2–3 раза меньше событий, чем утром и днём — ночью не работают не только журналисты.


5. Ссылки и перепечатки

По данным на осень 2010, в каждом четвёртом сообщении онлайн-СМИ содержатся ссылки на другие издания(гиперссылки или текстовые упоминания). 10% из них являются перепечатками, то есть практически полностью копируют тексты других сообщений. Кроме того, ещё около 15% всех сообщений — перепечатки без ссылок на источник (рис. 8).


В общей сложности в русскоязычной медиасфере каждый день появляется около 12 тысяч ссылок на другие СМИ. Больше всего ссылаются на крупные СМИ общей тематики. Три самых цитируемых издания — это информационные агентства: РИА Новости, Интерфакс и ИТАР-ТАСС. Среди тематических изданий чаще всего цитируются спортивные — в топ-50 входят «Спорт-Экспресс», «Советский спорт» и Sportbox.ru.
Крупные издания, которые часто служат источниками информации, сами тоже ссылаются на другие СМИ. Например, Newsru.com часто ссылается на Интерфакс, ПРАЙМ-ТАСС — на ИТАР-ТАСС, а Business FM — на РИА Новости. Многие СМИ ссылаются на несколько разных источников.

Перепечатки в онлайн-СМИ

Перепечатки возникают сразу же, как только появляется информация о каком-то событии — часто задержка составляет считанные минуты. Особенно часто копируют материалы о событиях, которые вызвали большой резонанс,— если о событии выходит более 50 сообщений, перепечатками оказывается уже не четверть из них, а треть. Впрочем, перепечатка — не обязательно признак дурного тона. Например, издание может быть подписано на материалы информагентства или иметь договорённость с другим изданием на использование его текстов.
Как и в случае с цитированием, перепечатывают чаще всего сообщения крупных агентств. Например, в октябре 2010 материалы РИА Новости и РБК хотя бы раз скопировали около 800 других изданий. Больше всего дубликатов осенью 2010 было у сообщения РИА Новости о графике предстоящих новогодних каникул — его перепечатали 62 раза. А полнее всего перепечатываются материалы сайтов государственных организаций, что вполне понятно — на них публикуется много официальных документов, тексты которых нужны в неизменном виде.
Издания, которые часто копируют чужие материалы, как правило, берут их из какого-то одного, любимого источника. Сами такие издания редко бывают источниками перепечаток.
Осенью 2010 всего 30% изданий ни разу не перепечатали чужих материалов вчистую. Среди них много специализированных — тех, которые пишут только на одну тему или только об одном регионе. Редко перепечатывают чужие материалы и крупные издания.

6. Трафик

В ноябре 2010 две трети переходов на новостные сайты были обусловлены целенаправленным интересом пользователей — они заходили туда напрямую (набирая адрес в адресной строке или через закладки в браузере), через поисковые системы, новостные агрегаторы и каталоги. За два года доля целенаправленных переходов на новостные сайты заметно выросла — в основном за счёт прямых заходов (38% против 30% два года назад). Видимо, это связано с тем, что люди всё больше привыкают узнавать о новостях в интернете и запоминать любимые сайты.
Поисковики и новостные агрегаторы также вносят значительный вклад в трафик. Если исключить прямые заходы, больше всего переходов на новостные ресурсы происходит с Яндекс.Новостей, поиска Яндекса и поиска Google. В сумме они дают онлайн-изданиям 17% переходов — около 5 миллионов в день.


Заметную роль в привлечении аудитории на сайты могут играть крупные порталы. Обычно они сотрудничают сразу с несколькими изданиями. Например, портал Mail.ru в ноябре 2010 приносил «Экспресс-газете» (eg.ru) 11% переходов, агрегатору трафика «Новотека» (beta.novoteka.ru) — 20%, а сайту бизнес- новостей Russian Business (rb.ru) — целых 50%.
5 Виджет — это блок, который пользователь может установить на главную страницу Яндекса. Собственный виджет может сделать любой сайт, в том числе сайт онлайн-издания. Осенью 2010 на Яндексе были доступны более 800 виджетов в различных онлайн-СМИ.
Дополнительный источник посетителей для многих онлайн-СМИ — виджеты5 на главной странице Яндекса. Они особенно актуальны для региональных изданий — например, сайт радио «Кузбасс FM» в декабре 2010 получал с виджетов на Яндексе более трети своего трафика. Крупным изданиям виджеты приносят больше переходов, но они составляют менее значительную часть от суммарного трафика этих сайтов — от долей до единиц процента.
17% переходов на сайты онлайн-СМИ обусловлены не столько интересом к новостям, сколько броскими «новостными» баннерами, расположенными на страницах агрегаторов трафика, баннерообменных сетей и самих онлайн-СМИ. Вклад агрегаторов трафика и баннерных сетей в трафикогенерацию за два года снизился — их общая доля сейчас составляет 11% против 23% два года назад.
Другая заметная тенденция — приход новостных ресурсов в социальные сети. Почти 90% СМИ получают посетителей из этого источника. Правда, переходов из социальных сетей пока гораздо меньше, чем с других ресурсов — как правило, не более 1% от общего трафика. По данным LiveInternet.ru, почти две трети переходов из социальных сетей обеспечивает ВКонтакте, далее следуют LiveJournal, Facebook, Twitter и LiveInternet.

7. Портрет читателей Яндекс.Новостей

7.1. Размер аудитории

По данным comScore, каждый месяц Яндекс.Новости читают более 12 миллионов человек, из которых более 10 миллионов живут в России. Молодые люди (от 15 до 34 лет) интересуются новостями больше, чем старшее поколение. А мужчины и женщины примерно одинаково — аудитория Яндекс.Новостей на 48% состоит из мужчин и на 52% из женщин.


7.2. Модели поведения

Пользователи с Северного Кавказа и из Дальнего Востока — одни из самых активных читателей новостей. Жители Кавказа чаще других пользователей Яндекса заходят на Яндекс.Новости и ставят на главную страницу новостные виджеты, а жители Дальнего Востока — чаще других переходят с виджетов на сайты СМИ.
В зависимости от того, как люди читают Яндекс.Новости, можно выделить несколько групп пользователей (рис. 13). Две трети людей заходят на сервис, только если их внимание привлекло какое-то событие. В основном они просматривают новостные заголовки на главной странице Яндекса, иногда переходя к подробностям — в общей сложности 1–4 раза в день. Такие пользователи чаще всего читают о происшествиях.
13% пользователей следят за новостями более внимательно. Они заходят на сервис несколько раз в день и каждый раз читают о трёх-четырёх событиях — скорее всего, в перерывах между основной работой. Среди них около 3% выбирают те или иные рубрики, около 2% — читают новости о своём регионе.
12% пользователей читают новости через rss — то есть подписываются на новости определённой тематики. Ещё 4% ищут новости о конкретных людях, событиях и странах в поиске по новостям — возможно, по долгу службы, а возможно, из личного интереса.


Основные цифры и факты

По данным Яндекс.Новостей на январь 2011, каждый будний день СМИ рунета публикуют не менее 50 тысяч новостей, каждый выходной — не менее 15 тысяч. 80% этого потока генерируют всего 20% крупных изданий.
По данным comScore на декабрь 2010, месячная аудитория русскоязычных СМИ во всём мире превышает 40 миллионов. Около 25 миллионов из них — пользователи из России.
Самые длинные материалы появляются на сайтах еженедельных журналов, их средняя длина — 485 слов (это примерно одна страница формата А4). Самые короткие публикации появляются на сайтах телеканалов и радиостанций, их средняя длина — 195 слов.
По данным на январь 2011, каждый будний день среднее СМИ из России выпускает 13 сообщений. Украинские СМИ заметно активнее — они пишут в среднем 21 сообщение в будний день. В обеих странах основной поток новостей создают издания из столиц — киевские СМИ ежедневно выпускают по 34 сообщения, московские — по 17.
Среди российских регионов наиболее активны Дальний Восток и Урал — местные СМИ выпускают в среднем по 14 сообщений в будний день, уступая только изданиям из столицы. Меньше всего пишут издания из Центра — основной новостной поток в этом регионе создают московские СМИ.
О внутренних событиях больше всего пишут СМИ из Южного округа — своему региону они посвящают почти треть сообщений. Меньше всего о своём регионе пишут СМИ Северного Кавказа и Дальнего Востока — только в шестой части сообщений.
События, о которых появляется более ста сообщений, составляют всего 1%.
По данным на осень 2010, сообщения о самых серьёзных происшествиях появляются в онлайн-изданиях с задержкой в 20–30 минут. С такой скоростью СМИ реагируют только на особенно значительные события. О менее заметных происшествиях обычно сообщают спустя несколько часов.
В ноябре 2010 две трети переходов на новостные сайты были обусловлены целенаправленным интересом пользователей. Доля прямых заходов за два года выросла с 30% до 38%, а доля переходов упала с 23% до 11%.
Осенью 2010 в каждом четвёртом сообщении онлайн-СМИ содержались ссылки на другие издания (гиперссылки или текстовые упоминания) — в общей сложности около 12 тысяч ссылок каждый день.
По данным на осень 2010, почти 25% новостного потока составляют перепечатки — сообщения, практически полностью идентичные материалам других СМИ. Среди них 10% — перепечатки со ссылками, а 15% — без ссылок. Особенно часто копируют материалы о событиях, которые вызвали большой резонанс,— если о событии выходит более 50 сообщений, перепечатками оказывается уже не четверть из них, а треть. Осенью 2010 всего 30% изданий ни разу не перепечатали чужих материалов вчистую.
НИХУЯ НЕ ПАСТА, САМ ПЕЧАТАЛ.

3 комментария:

  1. Спасибо за интересную статистику, с удовольствием посмотрел

    ОтветитьУдалить
  2. Восхищен исследованием, содержательно, только вот цель не уловил, видимо из-за отсутствия выводов.

    ОтветитьУдалить
  3. Привет, друг. Помнишь как весело было постить, оставлять комментарии, а в придачу еще и копеечку на пиво за это получать ? Если есть желание возобновить эту деятельность, пиши на brumbar1816@yandex.ru, расскажу детали.

    ОтветитьУдалить