Ответ в темуСоздание новой темыСоздание опроса

> Google изучил эволюцию языка за двести лет
 logvin Пользователя сейчас нет на форуме
Отправлено: 17.12.2010 - 19:19:35 (post in topic: 1, link to post #438361)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Moderators
Сообщений: 9046
Поблагодарили: 30433
Ай-яй-юшек: 11
Штраф:(0%) -----

Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет New Scientist.

До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google.

Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году эта цифра возросла до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов.

Кроме того, специалисты изучили, как сказывалась на использовании тех или иных слов цензура. Ученые установили, что после 1989 года словосочетание "площадь Тяньаньмень" практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США.

Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, что и специалисты по естественным наукам.

Источник
Добавлено:
Отсебятина:
Забавная игрушка:
Анализ слова "счастье"

user posted image

 


--------------------
Если Вы зарегистрированы на нашем форуме, то Вы читали Правила Форума и обязались их исполнять!

Если Вы их не исполняете - то не обижайтесь на действия модератора!
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Leser2008, Koss, kremen55, AliBaba, trya, krokik, Lona
 AliBaba Пользователя сейчас нет на форуме
Отправлено: 17.12.2010 - 20:58:20 (post in topic: 2, link to post #438414)
Цитировать сообщение Цитировать выделенный текст


живу я здесь...
Group Icon
Профиль
Группа: Privileged
Сообщений: 5818
Поблагодарили: 10687
Ай-яй-юшек: 83
Штраф:(0%) -----

Иногда получаются странные результаты: я попробовал два совершенно нейтральных слова "один" и "два" между 1800 и 2000 годами. С "два" картина нормальная, как использовали, так и используют, а "один" начали широко употреблять только с 1917 года! w00t
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: АлексМ
 Koss Пользователя сейчас нет на форуме
Отправлено: 17.12.2010 - 21:28:31 (post in topic: 3, link to post #438426)
Цитировать сообщение Цитировать выделенный текст


GoldPunch keeperЭфир приносящийМастер художественного слова
Подарочек тот ещё...
Group Icon
Профиль
Группа: Global moderators
Сообщений: 23992
Поблагодарили: 78041
Ай-яй-юшек: 61

я ввёл слово "халява" - ну очень показательно dance3


--------------------
...а в разделе Радио ух ты сколько интересного ещё!
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: logvin
 Voice Пользователя сейчас нет на форуме
Отправлено: 21.12.2010 - 05:56:13 (post in topic: 4, link to post #439385)
Цитировать сообщение Цитировать выделенный текст


Участникам первого открытого конкурса чтецов
Призрак
Group Icon
Профиль
Группа: Privileged
Сообщений: 2337
Поблагодарили: 12177
Ай-яй-юшек: 10
Штраф:(0%) -----

И что там показательного? Слово стало широко употребляться в письменной речи, когда приобрело значение "безвозмездно". До этого областное просторечное название голенища широкого хождения в литературных кругах не имело. Да и в устной речи отсутствовало.

Прямо полагаться на эти графики не стоит вообще, тем более в русскоязычной части - слишком мало материала, особенно старого. В графиках целые десятилетия выпадают. Да словоформы, да варианты, да старая орфография... Как с ней быть, вообще непонятно... У англов хоть все буквы сохранились.


--------------------
user posted image Москва user posted image
PMПисьмо на e-mail пользователю
Bottom Top
 trya Пользователя сейчас нет на форуме
Отправлено: 21.12.2010 - 06:09:12 (post in topic: 5, link to post #439386)
Цитировать сообщение Цитировать выделенный текст


Gold
Ветреный товарищ
Group Icon
Профиль
Группа: Moderator assistants
Сообщений: 6281
Поблагодарили: 13000
Ай-яй-юшек: 30
Штраф:(0%) -----

да... многозначительно со "счастьем" получилось...

но что интересно, "несчастье" со "счастьем" сильно коррелирует )

user posted image


--------------------
Сталин – мразь и негодяй.
PMПисьмо на e-mail пользователю
Bottom Top
 Поблагодарили за полезное сообщение: Lona



0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:

Опции темы Ответ в темуСоздание новой темыСоздание опроса
 
  


Анклавы Клуба в социальных сетях:
Клуб любителей Аудиокниг - Твиттер  Клуб на ФейсБук  Клуб любителей Аудиокниг - наш канал на YouTube  Канал Клуба Любителей Аудиокниг в Телеграм