Словари не успевают за пользователями Фейсбука
13 августа 2014 года
В этой статье упоминается Фонд Викимедиа, какой-либо из его проектов или люди, имеющие к ним отношение. Викиновости — один из проектов Фонда Викимедиа. |
На летней конференции Диалог’2014 учёные сообщили о том, что обнаружили в постах пользователей Фейсбука 168 новых слов, не зафиксированных ещё традиционными словарями, а также поделились своими наблюдениями и гипотезами о современном словообразовании в этой социальной сети.
Российские лингвисты Муравьёв Н. А., Панченко А. И. и Объедков С. А. изучили огромный объём текстов на русском языке, генерируемых пользователями Фейсбука. Было проанализировано более 573 миллионов сообщений почти 3,2 млн пользователей за 2006—2013 годы.
Общая статистика исследованного корпуса выглядит следующим образом:
Параметры | Значение |
---|---|
Количество анонимизированных пользователей | 3 190 813 |
Язык | Русский |
Количество постов | 426 089 762 |
Количество комментариев | 147 140 265 |
Количество текстов (посты и комментарии) | 573 230 027 |
Количество словоформ в постах | 20 775 837 467 |
Количество словоформ в комментариях | 2 759 777 659 |
Количество словоформ (посты и комментарии) | 23 535 615 126 |
Средняя длина поста, словоформ | 49 |
Средняя длина комментария, словоформ | 19 |
Чтобы устранить связанное с машинной обработкой «зашумление», учёные вручную отфильтровали 10 тысяч наиболее частотных слов, в результате чего к рассмотрению не были приняты нерусские и неверно лемматизированные слова, слова с ошибками, имена собственные (географические названия, имена, фамилии, названия организаций), сниженная лексика.
Учёные приводят список «несловарных» слов, оказавшихся среди наиболее частотных в полученном после автоматической обработки словаре и отсеянных на этапе ручной фильтрации: ть, нибыть, гый, санкт, що, ул, пр, нью, грн, ца, рожение, т.д, від, україни, вебинара, дтпа, кя, свый, плэйкастый, сегода, др, бй, квна, т.е, кг, млма, гр, бо, який, ра, ка, т.к, бть, чи, ск, холти.
Таким образом были выявлены и сведены в таблицу 168 популярных неологизмов, которых нет ещё в словарях, однако они уже вовсю употребляются пользователями сети (гиперссылки ведут на статьи в Русском Викисловаре):
Неологизм | Тип заимствования | Тип словообразования | Модель словообразования |
---|---|---|---|
сексодром | Англицизм | ||
айпад, айфон, алерт, байк, бейдж, билдер, блоггинг, брейн, брендинг, вау, виджет, девелопер, демотиватор, дресс, инфо, кавер, караванер, клаб, корпоратив, комент, коммент, коучинг, лайт, лайф, мем, ноут, паблик, перфоманс, плиз, праймериз, принт, продакшн, промо, райдер, ребрендинг, рекрутинг, репост, ретвит, реферал, ритейл, ритейлер, роутер, сиквел, скайп, скрин, сорри, стайл, стор, твитер, твиттер, тизер, трекер, треш, трэш, фейк, форсайт, фреш, фэшн, хайп, холдем, чарт, шутер | Англицизм | Исх 1 корень | |
битрейт, бумбокс, геймплей, дабстеп, дедлайн, инфомаркетинг, клипарт, копирайтинг, никнейм, оффлайн, плагин, плейлист, плэйкаст, подкаст, рингтон, стартапер, топфейс, фейсбук, флешмоб, флэшмоб, фолловер, форекс, фрилансер, фэйсбук, хардкор, ютуб, ютюб | Англицизм | Исх 2 корня | |
декупаж | Галлицизм | ||
жжот, капец, мульт, мда, медвед, пипец, ппц, секстиль | Исконное | ||
госуслуга | Исконное | Композит | ST-ST[1] |
единорос | Исконное | Композит | ST-о-ST |
всечь | Исконное | Префикс | в-ST |
нафиг, нахер, нахрен | Исконное | Префикс | на-ST |
предзаказ | Исконное | Префикс | пред-ST |
заценить | Исконное | Префикс+суффикс | за-ST-и |
офигевать | Исконное | Префикс+суффикс | о-ST-ева |
прокремлёвский | Исконное | Префикс+суффикс | про-ST-ск |
бухарь | Исконное | Суффикс | ST-арь |
улыбизм | Исконное | Суффикс | ST-изм |
приколист | Исконное | Суффикс | ST-ист |
личка, печенька, ржака | Исконное | Суффикс | ST-к |
ржачный, улётный | Исконное | Суффикс | ST-н |
херня | Исконное | Суффикс | ST-нь |
пристройство | Исконное | Суффикс | ST-ств |
ржач | Исконное | Суффикс | ST-ч |
адчайший | Исконное | Суффикс | ST-ч-айш |
днюха | Исконное | Суффикс | ST-юх |
вкусняшка | Исконное | Суффикс | ST-яшк |
евроинтеграция, инфографика, инфопродукт, телепроект, фотопроект, фотостудия, видеорепортаж | Из заимств. корней | Композит | ST-ST |
аудиокнига, вконтакт, мультиварка, нардеп, фотолента, фотоотчёт, фотопамять, фотоподборка, фотоприкол, фотошкола | Смешанное | Композит | ST-ST |
лохотрон, файлообменник | Смешанное | Композит | ST-о-ST |
перепост | Смешанное | Префикс | пере-ST |
предстарт | Смешанное | Префикс | пред-ST |
забанить, запостить | Смешанное | Префикс+суффикс | за-ST-и |
зацикливаться | Смешанное | Префикс+суффикс | за-ST-ива |
перепостить | Смешанное | Префикс+суффикс | пере-ST-и |
лайкать | Смешанное | Суффикс | ST-а |
культурить, постить, твитить | Смешанное | Суффикс | ST-и |
анимировать | Смешанное | Суффикс | ST-ирова |
аватарка, гифка, флешка | Смешанное | Суффикс | ST-к |
реферальный | Смешанное | Суффикс | ST-н |
планшетник, цитатник | Смешанное | Суффикс | ST-ник |
имхонуть, лайкнуть | Смешанное | Суффикс | ST-ну |
брендовый, драйвовый | Смешанное | Суффикс | ST-ов |
форумок | Смешанное | Суффикс | ST-ок |
суперский | Смешанное | Суффикс | ST-ск |
позитивчик | Смешанное | Суффикс | ST-чик |
креативщик | Смешанное | Суффикс | ST-щик |
Исследователи обнаружили, что основной активный поток заимствований идёт из английского языка (англицизмов больше всего). Заимствованные неологизмы по большей части являются существительными. Наиболее энергичное словообразование происходит в таких областях, как торговля и «мультимедиа- и интернет-технологии» (что такое «мультимедиа-технологии» авторы публикации не разъясняют).
Изучение неологизмов и заимствованных слов позволяет понять, каким образом языки воздействуют друг на друга и как происходит проникновение слов одного языка в другой.
См. также: «Селфи», «хэштег» и «краудфандинг» включили в словарь Merriam-Webster |
Примечания
править- ↑ ST (от англ. Word stem) — основа слова.
Источники
править- [[Муравьев Н. А., Панченко А. И., Объедков С. А.]] «Неологизмы в социальной сети Фейсбук // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 4 — 8 июня 2014 г.). Вып. 13 (20). — М.: Изд-во РГГУ, 2014, стр. 440-454.». РГГУ, 6 декабря 2014 года. (Проверено 12 августа 2014) (архив)
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.
- Спасибо за статью! --ssr (обсуждение) 11:29, 14 августа 2014 (UTC)
- Слово «зацикливаться» старое же. Оно есть в словарях 15-летней давности. --2A01:D0:9085:0:7054:11A6:62DD:B29 01:47, 20 января 2017 (UTC)