Борис Овчинников: «Обонятельные» запросы"
4 августа 2020 года
Борис Овчинников, мнение:
"В продолжение разговора про "обоняние" как ключевое слово, статистика запросов по которому отражает динамику и сравнительную силу эпидемии коронавируса. У каждого города (из тех, в которых уже была заметная вспышка) своя динамика запросов», - пишет аналитик на своей странице в Facebook.
"На приведенном здесь графике для каждого города показаны две характеристики:
1) дата, на которую пришелся пик запросов ("Яндекс" показывает динамику только по месяцам и неделям, но не по дням; однако вероятную дату пика можно оценить примерно через сопоставление показателей рекордной недели с предыдущей и последующей - если например количество запросов на неделе перед рекордной и после рекордной примерно одинаковое, значит максимум скорее всего пришелся на середину рекордной недели; если рекордная неделя лишь чуть выше предыдущей и сильно выше последующей - значит, максимум был ближе к началу рекордной недели);
2) интенсивность пика - определяемую через долю запросов со словом "обоняние" от всех запросов к "Яндексу" из данного города на пиковой неделе (можно ожидать, что интенсивность пика запросов будет коррелировать не с общей силой эпидемии, определяемой через долю переболевших в населении, а именно с интенсивностью эпидемии на пике - с долей одновременно болевших; при равной высоте пика запросов больше переболевших следует ожидать в том городе, где рост и снижение запросов были более пологими, и пик шире). Чтобы не перегружать график еще больше, я показываю только города с интенсивностью пика 0,008% и больше.
Тут уместно несколько слов про качество и надежность данных. Первое: большинство пиков ярко выраженные. Медианная разница между частотой запросов на пиковой неделе и в среднем за 2 недели до и после пика - 1,7 раза. Медианная разница между основным пиком и максимальным значением за периоды, отстающие от основного пика более чем на 2 недели, - 1,5 раза. И это с учетом фонового уровня (несвязанные с эпидемией запросы про обоняние + общая для всей России "медийная" компонента), если его вычесть, то разница между пиком и остальными периодами будет намного более выпуклой.
Второе: помимо силы эпидемии, на соотношение относительного количества запросов про "обоняние" на пиках в разных городах может влиять множество других факторов - частота упоминания (на пике эпидемии) потери обоняния как симптома коронавируса в местных СМИ и неформальных коммуникациях; накопленная к моменту вспышки осведомленность населения о симптомах коронавируса; возрастной состав интернет-аудитории (притом не всей, а той примерно половины, которая пользуется "Яндексом"); различия в преобладающей лексике (количество запросов про потерю запахов или "не чувствую запахи" в %% от количества запросов про обоняние варьируется от 11% в Архангельске до 37% в Махачкале); возможные различия между "популяциями" вируса и, соответственно, частотой появления тех или иных симптомов; возможные различия - обусловленные культурой, средой обитания или климатом - по важности обоняния как органа чувств и т.д. Однако среди этих факторов я не вижу ни одного, который мог бы давать отклонения больше, чем примерно х1,3. Различия между городами по высоте пика намного больше - так что все же я считаю, что сравнение городов по частоте запросов про обоняние на локальных пиках индикативно для сравнения пиковой интенсивности эпидемии в этих городах.
Приведенный график - это такая хронология: где и когда прошел локальный для данного города пик количество запросов про "обоняние". И я предполагаю, что это совпадает или почти совпадает с пространственной хронологией самой эпидемии, с датами прохождения соответствующими городами пиков по количеству новых заболевших.
Если исходить из этой логики, то первыми - в самом конце апреля или самом начале мая - пик прошли Махачкала и Ингушетия (в виду малочисленности населения и поисковых запросов для Ингушетии и Тывы я в порядке исключения учитываю запросы не по отдельным городам, а по региону в целом). При этом в силу повышенного уровня скепсиса и неверия на старте эпидемии скорость распространения и уровень на пике и в Дагестане, и в Ингушетии оказались существенно выше, чем в других регионах.
Вторая "пространственная волна" - это Москва с областью, а также Обнинск (про то, что там в апреле-мае ситуация была существенно хуже, чем в областном центре, в Калуге, было известно и без поисковой статистики) и Тверь (вот Тверь меня удивила - я в это время уже находился на территории Тверской области, так что к местным новостям относился с повышенным вниманием, но вспышки в Твери, в отличие от Конаково и Кимр, не заметил ни по официальной статистике, ни по разговорам в соцсетях и оффлайне). Судя по статистике запросов со словом "обоняние", пик во всех перечисленных местах случился практически одновременно, 5-9 мая, и с одинаковой интенсивностью. При этом если Обнинск и Тверь совпали с Москвой по времени пика, то другие крупные города вокруг столицы не совпали.
Дальше наступила пауза - и до конца мая через пик из всех рассматриваемых мною городов (более 90) прошел еще только Владикавказ. Зато с приходом июня сразу началась третья "пространственная волна": 1-3 июня через пик прошли географически близкие Саранск, Пенза, Липецк, Курск и Брянск (притом это не сплошной ареал - в Тамбове пик был примерно на 10 дней позже, а в Орле и Белгороде всплеска запросов не было до сих пор), а также Тольятти. Выше всего интенсивность запросов на локальном пике из перечисленных городов была в Саранске.
Чуть позже, 5-6 июня, через пик прошли Северодвинск, Черкесск и Санкт-Петербург. Объединяет эти три кейса только время. Северодвинск - первый пример сверхмощной (превосходящей уровень Махачкалы и Ингушетии) локальной вспышки, ограниченной одним городом. Потом будут еще Норильск и Когалым. Черкесск (вспышка в котором судя по поисковой статистике на тот момент была четвертой по силе с момента начала эпидемии после Махачкалы, Ингушетии и Северодвинска) продолжил северокавказскую "традицию", в которой у каждого региона и регионального центра своя динамика и свое время прохождения пика; после Черкесска будет еще Нальчик - с пиком на неделю позже, тогда как Грозный доберется до пика только в июле, и то не факт, что это уже пик. Петербург же почти в точности совпал с Москвой по высоте пика, только на 4 недели позже (и "колокол" запросов в Питере сильнее растянут во времени, чем в Москве).
Более чем в десятке городов пик пришелся на 10-13 июня. Основу этой четвертой "пространственной волны" (в которой при этом только некоторые города связаны между собой тем, что можно назвать логикой движения эпидемии по карте) составляют города вокруг Московской области - Владимир, Рязань, Тула, Калуга, Смоленск (при этом Тверь и Обнинск прошли пик на месяц раньше, в Ярославле, Иваново и Рыбинске в начале июня тоже был подъем - но слабый, с максимумами на 0,006-00075%, а в Костроме, Вологде и Череповце подъема вовсе не было). Чуть раньше и слабее был пик в Нижнем Новгороде. В те же дни через пик прошли Архангельск (через неделю после Северодвинска - и с интенсивностью пика примерно в 5 раз меньше), уже упоминавшийся Нальчик и (с существенно большей интенсивностью) Петропавловск-Камчатский. И в эти же дни были пройдены пики в трех очень мощных всплесках - в Чебоксарах, Набережных Челнах и Воркуте (можно предположить, что интенсивность эпидемии на пике здесь, особенно в двух первых случаях, была обусловлена совпадением во времени нарастания эпидемии и снятия существенной части общероссийских ограничений в начале июня).
После 13 июня наступило новое затишье - и в следующие 3 недели через локальные пики прошли только 7 городов. Это (в хронологическом порядке) Новосибирск (в котором, как и в Нижнем Новгороде, запросы про обоняние росли долго и с небольшой скоростью, а пик был небольшим по высоте), Новый Уренгой (первая по времени вспышка в нефтегазовых округах), Тыва, "сверхмощные" вспышки в Норильске и Когалыме, Якутск и Красноярск.
7-11 июля - это пятая "пространственная волна" пиков с достаточно четкой географической локализацией: Среднее Поволжье и Урал. На эти дни пришлись пики (перечисляю в порядке нарастания интенсивности на пике) в Перми, Йошкар-Оле, Челябинске, Ульяновске, Нижнем Тагиле, Екатеринбурге, Уфе, Казани, а также в Мурманске и Омске. Омск и Казань - на данный момент рекордсмены среди всех городов-"миллионников" по высоте пика: в Омске он составил 0,0193% от всех запросов к "Яндексу", в Казани 0,0166%, далее идут Уфа, Петербург, Москва и Екатеринбург с 0,0138-0,0126%.
В эти же дни или чуть позже свои пики прошли несколько городов в ХМАО - Сургут, Нефтеюганск и Нижневартовск. Во всех трех у пиков большая высота - примерно на уровне Омска или даже чуть выше (но все же ниже Нового Уренгоя и тем более Когалыма).
Неделя 13-19 июля стала рекордной по частоте "обонятельных" запросов для Грозного (у которого очень специфичный график количества запросов, с несколькими "полупиками" начиная еще с апреля, так что уверенности в том, что там пик действительно пройден, нет никакой), Южно-Сахалинска, Самары, Ноябрьска и Березников. Следующая неделя (последняя учтенная на данный момент) - рекордная для Астрахани. На графике для нее условно поставлена дата 26 июля (конец той недели) - но судя по доступным на сейчас неполным данным за следующую неделю, рост в Астрахани продолжается.
По мере появления данных за новые периоды на графике могут появляться новые города - в которых пока не пройден порог в 0,008% от всех запросов к "Яндексу", но может быть пройден в будущем. Наиболее вероятные кандидаты на шестую "пространственную волну" - это юг России от Волгограда до Сочи».
[None читать оригинал]
Источники
правитьЛюбой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.