Со словами все очевидно – они предназначены для непонимания. Но нам неизбежно приходится пройти через слова. С интернет-статистикой несколько сложнее: предназначена ли она для понимания? И что можно извлечь из рядов хитов, сессий, загрузок, хостов?
Как у христиан не принято оправдываться в ответ на упреки в греховности, так у представителей интернет-счетчиков не принято оправдываться в ответ на упреки в потере части данных и т.п. Это даже неинтересно обсуждать. У кого-то пропадает 5%, у кого 20% данных. В среднем теряется процентов 10, и это вряд ли можно изменить.
С одной стороны каждый из интернет-счетчиков нацелен на свой целевой сегмент потребителей. С другой стороны сегодняшняя интернет-статистика предоставляет единообразную статистику для всех типов сайтов в Интернете. У этой услуги практически отсутствует нишевое позиционирование.
Понятно, что интернет-статистика нужна двум большим группам потребителей: тем, кого интересует только общая посещаемость, и тем, кому нужна статистика для коммерции. Но вот, работая со второй группой, можно было бы сделать счетчик главным инструментом маркетологов, занимающихся развитием какой-либо большой группы сайтов. Пример — сайты электронной коммерции, где соответствующие сервисы окажут продавцам помощь в привлечении и удержании клиентов. Кроме развития системы статистики в систему оценки эффективности маркетинговых акций для сайтов для интернет-коммерции, можно было бы оказывать дополнительные услуги таким клиентам (вплоть до партнерской программы). Liveinternet планирует сделать специальный отдельный отчет для владельцев интернет-магазинов по статистике заходов в корзину заказов. Сейчас это можно сделать с помощью фильтров в SpyLOG или LiveInternet.
К весне 2006 года для SpyLOG наступило время сбора камней, для Liveinternet — время разбрасывать камни. Остальные счетчики на РИФовскую секцию «Интернет-статистика» вообще не явились. Про HotLog Герман Клименко пошутил, что он, скорее всего, умер. Rambler’s Top 100 и TopMail стали заложниками конфликта РИФа и трех порталов. Зарубежные системы не заинтересовались русской забавой — съездить в марте в «Лесные дали”. Но было ожидаемо, что они могут сказать. Кстати, у Клименко был слайд про то, что их общие особенности, не характерные для российских решений – flash-интерфейс, различные уровни доступа к статистике.
Система Stat24.ru – это платность, зависящая от трафика сайта (ограничивает круг пользователей небольшими коммерческими сайтами). Плюс серьезные ограничения по количеству различаемых страниц. Про Google Analitics уместен более долгий рассказ. На РИФе он не прозвучал. Основные минусы Google Analytics: запаздывание статистики, наличие серверов за рубежом, географические название латиницей, отсутствие наших поисковых систем по умолчанию, отсутствие техподдержки по телефону и отправки отчетов по e-mail. Плюсы Google Analytics: графическая карта, грамотная разбивка отчетов, использование терминологии, ориентированной на интернет-маркетолога, отчеты по рекламным кампаниям, электронной коммерции и эффективности вложенных в рекламу средств. Имеются много раскрывающихся отчетов.
Для справки заметим, что в Liveinternet имеются два «готовых решения» для аудита эффективности сайта и рекламы: отчет «О точке продаж» и отчет «Анализ рекламной компании». В SpyLOG при некоторой квалификации и использовании фильтров можно проделать анализ рекламной кампании, анализ продаж, анализ эффективности оптимизации, провести любую другую сегментацию целевой аудитории.
Своими бизнес-моделями системы интернет-статистики отличаются сильнее, чем газеты. Своими архитектурами – сильнее, чем поисковики. Правда, об этом мало кто задумывается, кроме игроков рынка…
Интересна проблема архитектур счетчиков. Самые молодые счетчики LiveInternet и будущий ашмановский счетчики работают всего на 2-3 компьютерах. К примеру, в LiveInternet используется для сбора статистики один двухпроцессорный компьютер (AMD 244) с 8 Гбайт ОЗУ и 4 SCSI-винчестера на 36 Гбайт — общая стоимость этой системы $3000. Еще один слабенький компьютер используется для отдачи картинки и еще один для аналитики (для экспресс-аудита в терминологии этой системы).
В последние годы происходили быстрый рост производительности процессоров и удешевление оперативной памяти. Вместе с тем производительность работы жестких дисков возрастала слабо. С этим связаны изменения в подходах к построению систем, работающих с высокой нагрузкой. Местом хранения данных становится не жесткий диск, а оперативная память. Например, статистика LiveInternet хранит в оперативке всю информацию за текущий день, а это более 230 млн. страниц. Пример старой архитектуры – TopMail, где в оперативной памяти хранятся только последние просмотры. Архитектура SpyLOG публично никогда не была представлена.
Герман Клименко представил в интервью РИФу, а затем и на самом форуме рекламную модель счетчика, который, оставаясь всегда бесплатным, зарабатывает на рекламных показах перед теми, кто заходит посмотреть отчеты.
Осенью 2005 года и зимой 2006 года, независимо от числа регистраций количество живых счетчиков у TopMail, Rambler’s Top100 и SpyLOG было примерно одинаковым составляло около 150 млн. (сейчас у всех подросло до 160-170 млн.). Про LiveInternet и Hotlog этот параметр был неизвестен, и Клименко оценил его соответственно в 235 млн. и 100 млн. Достоверно оценить количество просмотров отчетов не представляется возможным.
Очевидно, что наилучшее использование профилей интернет-статистики — это создание рекламной сети с поведенческим таргетингом. Хотелось бы думать, что наступает время соединения математических моделей, интернет-статистики (или статистики баннерных сетей) в поведенческий таргетинг, в котором анализ дополнен синтезом. Последнее – крайне важно. До сих пор поведенческим таргетингом называлась фиксация и учет предыдущего поведения пользователя — «с этой книгой покупают также…», этот баннер мы ему уже показывали, и он на него не кликнул… А хорошо бы предсказывать поведение – вычислить профессию человека и показать ему допустим финансовую рекламу на Анекдотах.ру, а не на РБК…
Почему о планах лучше молчать? Потому что заинтересованная аудитория тут же дорисует кучу вариантов развития событий, и большинство этих вариантов будут проблемными. Некоторые задают вопрос «сколько еще будут жить интернет-счетчики?». Предлагается такой ответ: однажды сотням тысячам людей дали игрушку, и ее теперь невозможно забрать, к ней привыкли. Счетчики будут жить очень долго. При желании сайты ставят скрытые счетчики. Очень многие выходят из рейтинга и продолжают пользоваться статистикой. Разве что само слово «счетчик» становится немодным: выражение «система интернет-статистики» вытесняет его также, как словосочетание «поисковый маркетинг» теснит «оптимизацию»…
P.S. Почему-то в отзывах участников РИФ то предстает то гусарской пьянкой, то маршированием под гимн Рунета. На самом деле максимум официоза или максимум пива случаются на форуме крайне редко. Но репортаж с секции «Интернет-статистика» родился в атмосфере из минимумов и максимумов.
Максимум скученности, неформальности и открытости, потому что секция проходила в биллиардной, тогда в этот раз в коридорах, где на прошлых РИФах было не протолкнуться, было просторно.
Минимум журналистов – всего два, и оба пришли не для репортажа. Минимум политеса РИФа, к которому мы только-только успели привыкнуть в предыдущие пару лет. В прошлом году ведущий секции контекстной рекламы Андрей Себрант дал мне сказать две фразы в комментариях с места о выходе нового лог-анализатора SpyLOG. В этот раз Ярослав Огнев, главный редактор иноСМИ.ру, беспрепятственно устроил навязчивый рефрен, прославляя в репликах с места одну из систем.
Мой РИФовский доклад про новые направления интернет-статистики можно посмотреть, имея Real Player. Я рассказываю там, не повторяя словами того, что показываю. Впервые осознанно применяю такой принцип — использование двух потоков информации. Поэтому пока лажаю.
Liveinternet представил на РИФе новый скрипт для оптимизаторов, но ссылку не дал. Ее можно разыскать изнутри интерфейса, вот она: https://search.liveinternet.ru/cgi-bin/se/rate.pl.