Большой ЭхоНет. Язык и интернет.

Язык – очень интересный объект для наблюдений. Однако выводы и отчеты лингвистов и филологов зачастую не выходят за пределы их весьма узкого круга, как обычно, весьма далекого от народа. Популяризовать исследования, касающиеся языка не так-то просто. Но при желании, можно.Это доказывает проект www.wordcount.org, который ведет подсчет частоты использования слов в английском языке. Делает он это с помощью Британского Национального корпуса — огромного собрания текстов, отображающих язык во всем многообразии стилей, жанров, территориальных и социальных вариантов, и т.п. Программа анализирует этот массив, выбирает слова, которые встречаются в нем, по меньшей мере, дважды и расставляет их по порядку, в зависимости от того, насколько часто их употребляют. В результате образовалась «очередь» более чем из 86 000 слов.Чем популярнее слово, тем крупнее шрифт используется для его написания и эта визуализация очень наглядна. Однако, если забраться дальше первой двадцатки слов, все они будут одинаковыми по размеру. Вне конкуренции слово «the», да и вообще артикли, предлоги, частицы и союзы прочно обосновались в голове этого списка. Первое существительное, которое здесь встречается – это «time», на 66 месте. Таких открытий любопытный пользователь сделает много, тем более, что возможности для этого есть. Например, можно просто пролистывать весь список вперед по одному слову, и при необходимости возвращаться назад. А можно и посмотреть на какой позиции находится то или иное слово, или наоборот, посмотреть, что за слово стоит под каким-либо номером. Ну а последним в этой «очереди» находится слово «conquistador». Интересно также выявлять последовательности слов (например, одно за другим идут слова «Америка», «гарантировать», «нефть» и «возможность») или насколько близкие друг другу слова (по смыслу или привычные по словосочетаниям) отстоят друг от друга. В будущем авторы проекта планируют переориентировать его с Британского Национального корпуса на работу с любым текстом, сайтом и, в конечном счете, с интернетом в целом.

Специальные слова и выражения существуют в любой сфере. В интернете есть много ресурсов, посвященных жаргону, в их числе Интерактивная энциклопедия современного языка www.jargon.ru, претендующая на всеохватность по этой теме. Пополняется он по популярному ныне принципу «народной энциклопедии», самым ярким воплощением которого является Википедия, речь о ней пойдет совсем скоро. Другими словами, любой, кто хочет написать сюда статью, посвященную какому-либо слову, может это сделать, предварительно зарегистрировавшись. Поле для деятельности тут весьма широкое. Несмотря на то, что слов в базе уже довольно много (более 4000), развернуться есть где, и практически любой человек найдет словарь, который он мог бы расширить. Написанное просматривается модератором и после этого ставится в словарь. Все словари объединены в большие разделы: социальные, профессиональные, научные, национальные и народные. Есть весьма обширные собрания, например, больше четверти всего здешнего «словарного запаса» приходится на тему «Одежда и мода». Скорее всего, кто-то разбирающийся в теме просто не пожалел свободного времени. Можно ходить по разделам, или воспользоваться поиском по слову, простым или расширенным, с фильтрами. Помимо профессиональных терминов и жаргона, есть здесь, например и язык глухих – изображение жестов. Кроме того, здесь есть и разделы, посвященные арго, так что о возможности наткнуться в определенных разделах на ненормативную лексику, я вас предупредил.

Если русскоязычный пользователь испытывает какие-либо затруднения в обасти языка, его обычно отправляют на сайт www.gramota.ru – весьма обширный ресурс, посвященный русскому языку. А вот некоторые затруднения в английском лучше всего разъяснять с помощью сайта www.confusingwords.com . Речь здесь идет о словах, которые путают друг с другом. Здесь приведены более 3000 слов подобного рода. Как правило, это просто похожие друг на друга слова или омонимы, то есть сходно звучащие или даже пишущиеся слова с другим значением. Кроме того, есть слова, которые не очень-то похожи по написанию, но люди их все равно путают. Этот весьма незатейливый сайт Ричард Уондерман сделал для своей супруги, школьной учительницы, которая устала от ошибок своих учеников. На создание ресурса ушло довольно много времени и труда. Сама по себе идея возникла более 15 лет назад, когда Интернета в нынешнем смысле этого понятия, по сути, и не было. До тех пор, пока не удалось реализовать задуманное, жена автора собирала примеры, которые затем превратились в содержание сайта. Если вас смущает, какое именно слово лучше употребить, скажем, «аффект» или «эффект», нужно попытаться поискать его в здешней базе. Вовсе необязательно точно знать, как именно пишется слово, достаточно заменить те буквы, в которых вы не уверены вопросительными знаками. Если поиск дал результаты, то вы попадете на страничку, где искомое слово приведено вместе с теми, с которыми его чаще всего путают. Тут же приведено лексическое значение каждого из них и примеры правильного использования. Это не отсылка к словарям, а разъяснения, которые автор и его супруга не поленились написать собственноручно. На первой странице можно найти шестерку наиболее путающих английских слов, точнее тех, из них, о которых больше всего запрашивают посетители. Кроме того, можно посмотреть слова, заинтересовавшие пользователя, просматривавшего сайт непосредственно перед вами.

Интернет – очень удобная среда для того, чтобы проводить исследования в области языка. Этим пользуется американская компания Global Language Monitor (GLM), которая время от времени на своем сайте www.languagemonitor.com публикует интереснейшие исследования. Разумеется, речь идет в основном об английском языке, но менее примечательными их отчеты не становятся. Так, проанализировав новостные публикации начала апреля, специалисты пришли к выводу, что о Папе Римском сообщалось гораздо больше, чем о недавнем цунами в Южной Азии и событиях 11 сентября 2001 года, не говоря уж переизбрании Джорджа Буша, а также смерти Рональда Рейгана и принцессы Дианы. Новости планетарного масштаба практически всегда оказываются в центре внимания здешних аналитиков: можно проследить, например, какие словосочетания чаще всего употребляются в сообщениях о том или ином событии или персонаже. Впрочем, предметом исследования становятся не только новости. Специалисты GLM пытаются подсчитать количество употребляемых слов в английском языке (на первой странице сайта есть счетчик), хотя и признают, что точно сделать это невозможно. Помимо Интернета исследуется и офлайновая медиасреда: здесь можно найти список самых политкорректных выражений, а также «слова года» на телевидении и в кино. Впрочем, на сайте представлены не только собственные исследования компании, по правде сказать, их здесь не так уже много. Зато по различным темам, связанным с языком собрано довольно много статей из других источников. Здесь, в частности, можно узнать о лучших и худших названиях компаний и марок продукции, смайликах, используемых интернет-пользователями, языке героев книги «Властелин Колец» и о многом другом. Сейчас GLM работает над составлением словаря модных политических выражений последнего времени (типа как у нас «вертикаль власти», «политическая составляющая» или «спор хозяйствующих субъектов») и активно использует интернет. Специалисты не только осуществляют мониторинг новостных и политических сайтов, блогов и форумов, но и просят посетителей присылать новые словечки политического лексикона по электронной почте.
Разговор о взаимоотношениях интернета и языка обязательно продолжим на следующей неделе.

,