Клуб Любителей АудиоКниг · Текстовая версия форума · Правила · Рецензии · Трекер · Файлообмен · Перейти в Наш Каталог | Помощь Поиск |
Здравствуйте Гость ( Вход | Регистрация ) | Выслать повторно письмо для активации |
Блокировка сайта Клуба на территории РФ |
Лучшие книги ушедшего года. Авторские подборки |
|
Отправлено: 17.12.2010 - 19:19:35 (post in topic: 1, link to post #438361)
|
||
живу я здесь... Профиль Группа: Moderators Сообщений: 9046 Поблагодарили: 30433 Ай-яй-юшек: 11 Штраф:(0%) |
Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет New Scientist.
До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google. Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году эта цифра возросла до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов. Кроме того, специалисты изучили, как сказывалась на использовании тех или иных слов цензура. Ученые установили, что после 1989 года словосочетание "площадь Тяньаньмень" практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США. Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, что и специалисты по естественным наукам. Источник Добавлено: Отсебятина: Забавная игрушка: Анализ слова "счастье" -------------------- Если Вы зарегистрированы на нашем форуме, то Вы читали Правила Форума и обязались их исполнять! Если Вы их не исполняете - то не обижайтесь на действия модератора! |
||
Поблагодарили за полезное сообщение: Leser2008, Koss, kremen55, AliBaba, trya, krokik, Lona |
|
Отправлено: 17.12.2010 - 20:58:20 (post in topic: 2, link to post #438414)
|
||
живу я здесь... Профиль Группа: Privileged Сообщений: 5818 Поблагодарили: 10687 Ай-яй-юшек: 83 Штраф:(0%) |
Иногда получаются странные результаты: я попробовал два совершенно нейтральных слова "один" и "два" между 1800 и 2000 годами. С "два" картина нормальная, как использовали, так и используют, а "один" начали широко употреблять только с 1917 года!
|
||
Поблагодарили за полезное сообщение: АлексМ |
|
Отправлено: 17.12.2010 - 21:28:31 (post in topic: 3, link to post #438426)
|
||
Подарочек тот ещё... Профиль Группа: Global moderators Сообщений: 23992 Поблагодарили: 78041 Ай-яй-юшек: 61 |
я ввёл слово "халява" - ну очень показательно
-------------------- ...а в разделе Радио ух ты сколько интересного ещё! |
||
Поблагодарили за полезное сообщение: logvin |
|
Отправлено: 21.12.2010 - 05:56:13 (post in topic: 4, link to post #439385)
|
||
Призрак Профиль Группа: Privileged Сообщений: 2337 Поблагодарили: 12177 Ай-яй-юшек: 10 Штраф:(0%) |
И что там показательного? Слово стало широко употребляться в письменной речи, когда приобрело значение "безвозмездно". До этого областное просторечное название голенища широкого хождения в литературных кругах не имело. Да и в устной речи отсутствовало.
Прямо полагаться на эти графики не стоит вообще, тем более в русскоязычной части - слишком мало материала, особенно старого. В графиках целые десятилетия выпадают. Да словоформы, да варианты, да старая орфография... Как с ней быть, вообще непонятно... У англов хоть все буквы сохранились. -------------------- Москва |
||
|
Отправлено: 21.12.2010 - 06:09:12 (post in topic: 5, link to post #439386)
|
||
Ветреный товарищ Профиль Группа: Moderator assistants Сообщений: 6281 Поблагодарили: 13000 Ай-яй-юшек: 30 Штраф:(0%) |
да... многозначительно со "счастьем" получилось...
но что интересно, "несчастье" со "счастьем" сильно коррелирует -------------------- Сталин – мразь и негодяй. |
||
Поблагодарили за полезное сообщение: Lona |