Меню Рубрики

частотные глаголы русского языка

Частотные глаголы русского языка

Самое длинное слово русского языка — Решение проблемы того, какое слово в русском языке является самым длинным (и даже ответ на вопрос о том, имеет ли вообще эта проблема решение), зависит от нескольких факторов. Содержание 1 Критерии 2 Условия выбора 2.1 Форма слов … Википедия

Национальный корпус русского языка — URL: http://ruscorpora.ru/ Коммерческий: нет Тип сайта: образовательный/научный проект Реги … Википедия

Частотный словарь — (или частотный список) набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов… … Википедия

Русский язык — У этого термина существуют и другие значения, см. Русский язык (значения). Русский язык Произношение: ˈruskʲɪj jɪˈzɨk … Википедия

Частотность — термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчёт осуществляется по формуле: где Freqx частотность слова «x», Qx количество словоупотреблений слова «x», Qall общее количество словоупотреблений. В… … Википедия

НКРЯ — Национальный корпус русского языка общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 в Интернете по адресу http://ruscorpora.ru/. Содержание 1 Составители 2 Состав корпуса … Википедия

словарь лингвистический — Словарь, в котором дается разъяснение значения и употребления слов (в отличие от энциклопедического словаря, сообщающего сведения о соответствующих реалиях предметах, явлениях, событиях). Диалектный (областной) словарь. Словарь, содержащий… … Словарь лингвистических терминов

Медицина — I Медицина Медицина система научных знаний и практической деятельности, целями которой являются укрепление и сохранение здоровья, продление жизни людей, предупреждение и лечение болезней человека. Для выполнения этих задач М. изучает строение и… … Медицинская энциклопедия

Источник статьи: http://dic.academic.ru/dic.nsf/ruwiki/269629

LiveInternetLiveInternet

Ссылки

Цитатник

Изумительное песочное печенье Изумительное песочное печенье Список требуем.

10 фишек Windows 10, о которых вы могли не знать 10 полезных фишек Windows 10, о которых знают.

Вяжем идеальную макушку шапки Хочу поделиться с вами отличным способом того, как связать идеал.

Шпаргалка вязальщицам источн.

Два воздушных узора для летний кофты. Мастер-классы + схемы Огромная благодарность автору: Масте.

Рубрики

  • БЛЮДА ИЗ МЯСА. (32)
  • ФРАЗЫ (9)
  • БЕЗ ВЫПЕЧКИ. (47)
  • ДЕСЕРТЫ. КОНФЕТЫ. (8)
  • ПЕЧЕНЬЕ. (8)
  • ПИРОЖНЫЕ. ТОРТЫ. (29)
  • БЛЮДА В КЛЯРЕ (9)
  • БЛЮДА ДЛЯ МУЛЬТИВАРКИ (7)
  • БЛЮДА ИЗ КРУП (20)
  • МАКАРОНЫ, СПАГЕТТИ, ЛАПША. (17)
  • ПЕРЛОВКА. (1)
  • БЛЮДА ИЗ КУРИЦЫ. (62)
  • БЛЮДА ИЗ МЯСНОГО ФАРША. (19)
  • БЛЮДА ИЗ РЫБЫ (36)
  • БЛЮДА ИЗ ФАРША. (19)
  • КОТЛЕТЫ (5)
  • ВИННЫЙ ПОГРЕБОК. (8)
  • АЛКОГОЛЬНЫЕ НАПИТКИ (1)
  • ВЫПЕЧКА. (523)
  • БАРАНОЧКИ. (1)
  • БЕЗЕ (1)
  • БЛИНЫ, ОЛАДЬИ, БЛИНЧИКИ, БАРАНКИ. (20)
  • БУЛОЧКИ. (26)
  • ВАФЛИ. (4)
  • ВЫПЕЧКА НА КЕФИРЕ (22)
  • ГЛАЗУРИ; КРЕМЫ ДЛЯ ТОРТОВ (2)
  • КЕКСЫ. МАФФИНЫ. КАПКЕЙКИ. (79)
  • КОВРИЖКИ; ПЕЧЕНЬЕ (21)
  • ЛАВАШ; ЛЕПЁШКИ (42)
  • ПЕЧЕНЬЕ. РОГАЛИКИ. (49)
  • ПИРОГИ (107)
  • ПИРОЖКИ. (60)
  • ПИРОЖНЫЕ; ТОРТЫ; РУЛЕТЫ; КРЕМЫ ДЛЯ ТОРТОВ (57)
  • ПИЦЦА (17)
  • ПОНЧИКИ. (9)
  • ПРЯНИКИ. (4)
  • ХВОРОСТ. (6)
  • ЧЕБУРЕКИ; БЕЛЯШИ; ХАЧАПУРИ; ПЕРЕМЯЧИ (30)
  • ВЯЗАНИЕ (276)
  • ВАРЕЖКИ. (14)
  • ВЯЗАНИЕ СПИЦАМИ ДЛЯ ЖЕНЩИНЫ (66)
  • ВЯЗАНИЕ СПИЦАМИ: ДЛЯ МАЛЬЧИКА. (12)
  • ЖАККАРД. (2)
  • НОСКИ. ТАПОЧКИ. (24)
  • РЕГЛАН. (21)
  • УЗОРЫ СПИЦАМИ. (80)
  • ШАПКИ; БЕРЕТЫ; ШАРФЫ, МАНИШКИ (63)
  • ШНУРЫ. (3)
  • ЭНТЕРЛАК (2)
  • ВЯЗАНИЕ КРЮЧКОМ. (8)
  • ГРИБЫ (57)
  • БЛЮДА С ГРИБАМИ И ИЗ ГРИБОВ (22)
  • ГРИБНЫЕ СУПЫ (1)
  • ГРИБЫ (3)
  • ЗАГОТОВКИ ИЗ ГРИБОВ (23)
  • ПИРОГИ С ГРИБАМИ (6)
  • РЕЦЕПТЫ ГРИБНЫХ СОУСОВ (1)
  • САЛАТЫ С ГРИБАМИ (9)
  • ДЕСЕРТЫ. (62)
  • КОНФЕТКИ (19)
  • МОРОЖЕНОЕ (3)
  • ПАСТИЛА (1)
  • СЛАДОСТИ. (26)
  • ШОКОЛАД (7)
  • Для ЖЕНЩИНЫ. (260)
  • ДОМАШНЯЯ КОСМЕТИКА (НАРОДНЫЕ СРЕДСТВА) (21)
  • ЗДОРОВЬЕ. (127)
  • ПСИХОЛОГИЯ (6)
  • СЕКРЕТЫ КРАСОТЫ. (31)
  • СТИЛЬ. (10)
  • УХОД ЗА ВОЛОСАМИ. (34)
  • УХОД ЗА ЛИЦОМ. (54)
  • УХОД ЗА НОГАМИ. (19)
  • УХОД ЗА НОГТЯМИ. (10)
  • УХОД ЗА РУКАМИ. (10)
  • ДОМОВОДСТВО (102)
  • ДЕКОРИРОВАНИЕ. (3)
  • ДЕКУПАЖ. (12)
  • ЦВЕТЫ; РАСТЕНИЯ. (13)
  • ПОДЕЛКИ. (24)
  • ПОЛЕЗНЫЕ СОВЕТЫ. (41)
  • РУКОДЕЛИЕ (16)
  • ИМБИРЬ (5)
  • ИНТЕРЕСНОЕ. (39)
  • ГАДАНИЕ (5)
  • КАЛЕНДАРИ. (1)
  • КОСМОЭНЕРГЕТИКА (2)
  • ТЕЛЕФОННЫЕ СПРАВОЧНИКИ. (2)
  • ИНТЕРНЕТ. ВСЁ ПРО ЛИ.РУ. (23)
  • Windows 10 (2)
  • ЙОГА (6)
  • МУДРЫ (4)
  • КИТАЙ. (107)
  • Гороскопы — астро-нумерология, астрология (3)
  • КИТАЙСКАЯ МЕДИЦИНА. (43)
  • МАГАЗИНЫ КИТАЙСКИХ ТОВАРОВ (2)
  • МУЗЫКА (2)
  • ТАЙЦЗИЦЮАНЬ. ЦИГУН. (12)
  • ТОЧКИ АКУПУНКТУРЫ. СУ ДЖОК. (52)
  • ФЭН-ШУЙ (3)
  • КОНСЕРВИРОВАНИЕ. ЗАГОТОВКИ. (153)
  • АДЖИКА (3)
  • АССОРТИ. (3)
  • БАКЛАЖАНЫ. (19)
  • БОЛГАРСКИЙ ПЕРЕЦ. (16)
  • ГРИБЫ (6)
  • ДЖЕМ, ВАРЕНЬЕ, КОНФИТЮР. МАРМЕЛАД. (7)
  • КАБАЧКИ. (11)
  • КАПУСТА БЕЛОКОЧАННАЯ. (27)
  • КАПУСТА ЦВЕТНАЯ, БРОККОЛИ И ДР. (3)
  • МОРКОВЬ; СВЁКЛА (1)
  • ОГУРЧИКИ. (26)
  • ПОМИДОРЫ. (15)
  • ЧЕСНОК. (5)
  • ЩАВЕЛЬ. (1)
  • КУЛИНАРИЯ (147)
  • ТВОРОГ. БЛЮДА С ТВОРОГОМ. (38)
  • БЛЮДА С КАПУСТОЙ (3)
  • ЗАПЕКАНКИ. (1)
  • КУЛИНАРНЫЕ ВИДЕОРЕЦЕПТЫ (10)
  • ПАШТЕТЫ (21)
  • ПЛОВ. (1)
  • РУЛЕТЫ (2)
  • РУЛЕТЫ. (5)
  • СУБПРОДУКТЫ (13)
  • ПЕЛЬМЕНИ, ВАРЕНИКИ, МАНТЫ. ХИНКАЛИ. (34)
  • КУЛИНАРИЯ. ПОЛЕЗНЫЕ СОВЕТЫ (25)
  • КУХНИ МИРА. (135)
  • АРМЯНСКАЯ КУХНЯ (4)
  • ГРУЗИНСКАЯ КУХНЯ (19)
  • ЕВРЕЙСКАЯ КУХНЯ. (5)
  • ИСПАНСКАЯ КУХНЯ (3)
  • ИТАЛЬЯНСКАЯ КУХНЯ. (5)
  • КИТАЙСКАЯ КУХНЯ. КУХНИ АЗИИ. (43)
  • КОРЕЙСКАЯ КУХНЯ. (15)
  • РУССКАЯ КУХНЯ (11)
  • ТАЙСКАЯ КУХНЯ (5)
  • ТАТАРСКАЯ КУХНЯ (9)
  • ТУРЕЦКАЯ КУХНЯ (2)
  • ФРАНЦУЗСКАЯ КУХНЯ. (2)
  • ШВЕДСКАЯ КУХНЯ. (2)
  • МНОГОЛИКАЯ КОЖА (120)
  • ОБУВЬ. (27)
  • СУМКИ, КОСМЕТИЧКИ, КЛАТЧИ. (47)
  • УКРАШЕНИЯ ИЗ КОЖИ. (25)
  • ШКАТУЛОЧКИ. (5)
  • МОРЕПРОДУКТЫ. МОРСКАЯ КАПУСТА. (25)
  • КАЛЬМАРЫ. (11)
  • КРЕВЕТКИ (5)
  • НАПИТКИ. (25)
  • КВАС. (13)
  • ПОЛЕЗНЫЕ НАПИТКИ (4)
  • ЧАЙНЫЙ ГРИБ. (4)
  • ОВОЩИ (40)
  • БАКЛАЖАНЫ. (8)
  • КАБАЧКИ. (2)
  • КАПУСТА (6)
  • КАПУСТА ЦВЕТНАЯ (2)
  • КАРТОФЕЛЬ (9)
  • МОРКОВЬ (2)
  • ПЕРЕЦ БОЛГАРСКИЙ (3)
  • ПОМИДОРЫ (1)
  • ПОЛЕЗНЫЕ ССЫЛКИ. (8)
  • ПРАВОСЛАВИЕ — КУЛИНАРИЯ (53)
  • КУЛИЧИ (28)
  • ПАСХА. (10)
  • ПОСТНАЯ ВЫПЕЧКА (9)
  • ПОСТНОЕ МЕНЮ. (9)
  • РОССИЯ, МОСКВА — моя Родина! (5)
  • МОСКВА. (1)
  • РЫБА: СОЛЁНАЯ; МАРИНОВАННАЯ. (73)
  • ГОРБУША. (10)
  • КЕТА. (7)
  • ЛОСОСЬ. (10)
  • СЕЛЬДЬ. МОЙВА. (45)
  • СЁМГА. (10)
  • СКУМБРИЯ. (25)
  • ФОРЕЛЬ. (8)
  • САЛАТЫ (100)
  • ЗАКУСКИ. (45)
  • САЛАТЫ (24)
  • САЛАТЫ «ЦЕЗАРЬ» (2)
  • САЛАТЫ ОВОЩНЫЕ. (13)
  • САЛАТЫ С ГРИБАМИ. (11)
  • САЛАТЫ С КУРИЦЕЙ. (12)
  • САЛАТЫ С МОРЕПРОДУКТАМИ. (11)
  • САЛАТЫ С МЯСОМ. (2)
  • САЛАТЫ С РЫБОЙ. (8)
  • САЛАТЫ С СЕЛЬДЬЮ. (9)
  • САЛАТЫ С ФРУКТАМИ. (1)
  • САЛАТЫ СО СВЁКЛОЙ. (2)
  • САЛО. (21)
  • СОУСЫ (52)
  • СОУСЫ (24)
  • ХРЕН; МАЙОНЕЗ; ГОРЧИЦА, АДЖИКА (19)
  • СПЕЦИИ. (3)
  • СУПЫ (5)
  • СЫР (29)
  • ТЕЛЕФОННЫЕ СПРАВОЧНИКИ. (3)
  • ТЕЛЕФОННЫЕ СПРАВОЧНИКИ-ОНЛАЙН. (1)
  • ТЕЛЕФОНЫ ЦАО МОСКВА. (2)
  • ТЕСТО. (188)
  • БЕЗДРОЖЖЕВОЕ ТЕСТО. (9)
  • БИСКВИТ (44)
  • КЛЯР (7)
  • ТЕСТО ДЛЯ КЕКСОВ (8)
  • ТЕСТО ДЛЯ ЛАПШИ (1)
  • ТЕСТО ДРОЖЖЕВОЕ. (32)
  • ТЕСТО ЗАВАРНОЕ. (25)
  • ТЕСТО НА КЕФИРЕ (20)
  • ТЕСТО ПЕСОЧНОЕ. (30)
  • ТЕСТО СЛОЁНОЕ. (23)
  • ТЫКВА (13)
  • ОЛАДЬИ С ТЫКВОЙ (1)
  • ПИРОГИ С ТЫКВОЙ (5)
  • ХЛЕБ. (46)
  • ХОЛОДЦЫ И ЗАЛИВНЫЕ БЛЮДА. (20)
  • ШАШЛЫКИ (10)
  • ШАШЛЫКИ (10)
  • ШИТЬЁ. (146)
  • ВИДЕО — УРОКИ ПО ШИТЬЮ. (40)
  • ВЫКРОЙКИ. (35)
  • ТУНИКИ; САРАФАНЫ; ЛЕТНИЕ ПЛАТЬЯ. (32)
  • ЮБКИ. (19)
  • ЭНЦИКЛОПЕДИИ (2)
  • ЯНДЕКС. (1)

Метки

Музыка

Приложения

  • ОткрыткиПерерожденный каталог открыток на все случаи жизни
  • Редактор фотографийРедактор фотографий и изображений для быстрой обработки и сохранения. Возможности включают в себя: изменения размера, обрезка, наложение некоторых эффектов, улучшение качества изображения.
  • Я — фотографПлагин для публикации фотографий в дневнике пользователя. Минимальные системные требования: Internet Explorer 6, Fire Fox 1.5, Opera 9.5, Safari 3.1.1 со включенным JavaScript. Возможно это будет рабо
  • 5 друзейСписок друзей с описанием. Данное приложение позволяет разместить в Вашем блоге или профиле блок, содержащий записи о 5 Ваших друзьях. Содержание подписи может быть любым — от признания в любви, до
  • Всегда под рукойаналогов нет ^_^ Позволяет вставить в профиль панель с произвольным Html-кодом. Можно разместить там банеры, счетчики и прочее

Поиск по дневнику

Подписка по e-mail

Интересы

Друзья

Постоянные читатели

Сообщества

Статистика

ТОП 200 глаголов. (TOP 200 Verbs)

ТОП 200 глаголов. (TOP 200 Verbs).

become [bɪkˈʌm] становиться

understand [ʌndəstˈænd] понимать

№ Первая форма глагола Перевод на русский язык

1 Agree — [ə’griː] Соглашаться

3 Answer — [‘ɑːn(t)sə] — Отвечать

6 Become — [bɪ’kʌm] — Становиться

8 Believe — [bɪ’liːv] — Верить

9 Borrow — [‘bɔrəu] — Занимать

11 Bring — [brɪŋ] — Приносить

17 Close — [kləuz] — Закрывать

20 Copy — [‘kɔpɪ] — Копировать

22 Decide — [dɪ’saɪd] — Решать

23 Discuss — [dɪ’skʌs] — Обсуждать

26 Explain — [ɪk’spleɪn] — Объяснять

28 Feel — [fiːl] — Чувствовать себя

31 Finish — [‘fɪnɪʃ] — Заканчивать

32 Follow — [‘fɔləu] — Следовать

34 Forget — [fə’get] — Забывать

38 Happen — [‘hæp(ə)n] — Случаться

42 Hold — [həuld] — Держать; Обнимать

46 Leave — [liːv] — Оставлять; Уезжать

48 Listen — [‘lɪs(ə)n] — Слушать

50 Look — [luk] — Смотреть; Следить; Осматривать

52 Make — [meɪk] — Делать; Творить; Создавать

54 Mean [miːn] — Значить; намереваться; Иметь в виду

56 Move — [muːv] — Двигать; Перемещать

57 Must — [mʌst] Должен; ОБЯЗАН!

59 Open — [‘əup(ə)n] — Открывать

62 Promise — [‘prɔmɪs] — Обещать

63 Put — [put] — Класть; Ставить

65 Remember — [rɪ’membə] — Помнить

67 Say — [seɪ] — Сказать; Произносить

70 Send — [send] — Посылать; Отправлять

71 Set — [set] — Ставить; Класть

76 Sleep — [sliːp] — Спать
77 Speak — [spiːk] — Говорить; Изъясняться, выражать свою
мысль

78 Spend — [spend] — Проводить время; Тратить; Расходовать

80 Start — [stænd] — Начинать

81 Stop — [stɔp] — Останавливать

83 Suggest — [sə’ʤest] — Предлагать; Советовать

85 Talk — [tɔːk] — Говорить; Разговаривать; Вести беседу

86 Tell — [tel] — Сказать; Сообщать; Рассказывать

88 Travel — [‘træv(ə)l] — Путешествовать

89 Try — [traɪ] — Пытаться; Стараться

90 Turn — [tɜːn] — Поворачивать

91 Understand — [ˌʌndə’stænd] — Понимать

92 Use — [juːz] — Использовать

94 Wake up — Просыпаться; Проснуться

95 Walk — [wɔːk] — Ходить (пешком)

96 Watch — [wɔʧ] — Смотреть; Наблюдать

99 Worry — [‘wʌrɪ] — Беспокоиться

Наиболее часто употребляемые английские глаголы.
Пояснения:

Как работать с данным списком глаголов?

Хорошо не просто знать перевод глаголов с английского на русский, но также важно уметь переводить слова с русского на английский язык. Есть несколько вариантов работы с данным списком.
Первый вариант — мы учим по порядку глаголы. В один день какое-то число, во второй день — еще столько же. Третий день на закрепление и так далее. Очень важно не просто учить, а оставлять время на повторение. Это не впустую потраченное время. Я в этом много раз сам убеждался. Когда я хотел сэкономить время и не закрепить выученное, то была какая-то каша в голове. Не было все упорядочено по полочкам.

Источник статьи: http://www.liveinternet.ru/users/gall-inna/post234321095/

Как пользоваться новым частотным словарем русской лексики

О словаре

Словарь включает наиболее употребительные слова современного русского языка (2-я половина XX – начало XXI вв.), снабженные информацией о частотности употребления, статистическом распределении по текстам и жанрам, по времени создания текстов. Словарь основан на текстах Национального корпуса русского языка объемом 100 млн. словоупотреблений. Подробнее об истории частотных словарей русского языка и методах создания «Нового частотного словаря русской лексики» словаря можно прочитать во Введении.

Разработка концепции словаря и его подготовка к изданию осуществлена О.Н.Ляшевской и С.А.Шаровым, электронная версия подготовлена А. В. Санниковым. Авторы выражают благодарность В. А. Плунгяну, А. Я. Шайкевичу, Е. А. Гришиной, Б. П. Кобрицову, Е. В. Рахилиной, С. О. Савчук, Д. В. Сичинаве и другим участникам семинара НКРЯ, принимавшим участие в обсуждении принципов создания словаря. Мы благодарим О. Урюпину, Д. и Г. Бронниковых, Б. Кобрицова, а также сотрудников ООО «Яндекс» А. Аброскина, Н. Григорьева, А. Сокирко за помощь на разных этапах сбора и компьютерной обработки материала.

Как найти слово в словаре?

Два основных раздела словаря – список слов, упорядоченный по алфавиту и по общей частоте употребления в корпусе. Все слова приводятся в исходной (начальной) форме: для имен это форма именительного падежа (для имен существительных, как правило, форма единственного числа, для имен прилагательных – полная форма мужского рода), для глаголов – форма инфинитива.

В алфавитном списке приведено 60 тысяч наиболее частотных словоформ. Чтобы найти информацию о нужном слове, перейдите в раздел Алфавитный список лемм, выберите первую букву слова и найдите искомое слово в таблице. Чтобы быстро найти слово, вы можете также воспользоваться окном поиска, например:

Таким способом можно найти информацию не только о каком-то конкретном слове, но и о группе слов, начинающихся или заканчивающихся одинаковым образом. Для этого в окне поиска используйте знак звездочки (*) после набранной последовательности букв («все слова, начинающиеся с…») или до цепочки букв («все слова, оканчивающиеся на…». Например, если вы хотите найти все слова, начинающиеся на пере-, наберите в окне поиска:

Если вы хотите найти все слова, оканчивающиеся на –енько, наберите в окне поиска:

В частотном списке лемм слова упорядочены по общей частоте употребления в корпусе современного русского литературного языка. Частотный список включает 20 000 наиболее употребительных лемм.

Чтобы найти информацию о нужном слове, перейдите в раздел Частотный список лемм и найдите искомое слово в таблице. Для поиска информации об отдельных словах лучше всего воспользоваться окном быстрого поиска слова.

Почему я не могу найти слова в словаре, хотя я могу найти его в корпусе?

Это может объясняться несколькими причинами. Во-первых, слово может иметь низкую частотность (например, всего 3 употребления в корпусе) или употребляться только в текстах, написанных до 1950-го года. Во-вторых, слово может встретиться много раз, но в одном-двух текстах: такие леммы были сознательно исключены из словника словаря. В третьих, мы не можем исключить, что произошла ошибка автоматического определения исходной формы или частеречной характеристики слова, или же слово было ошибочно атрибуировано как имя собственное. На сайте представлена «тестовая» версия частотного словаря, и мы собираемся продолжать работу по уточнению его лексического состава.

Какую информацию об употреблении слова можно получить?

В словаре можно получить следующую информацию об употреблении слова в корпусе:

  • общее количество употреблений леммы (общая частота в единицах ipm), см. разделы Алфавитный список лемм, Частотный список лемм, частотные словари художественной литературы и других функциональных стилей; частотные словари имен существительных, глаголов и других частей речи
  • частотный ранг слова (то есть порядковый номер в общем частотном списке), см. разделы Частотный список лемм, частотные словари имен существительных, глаголов и других частей речи.
  • число текстов, в которых встретилось слово (число документов), см. раздел Алфавитный список лемм;
  • коэффициент вариации D, см. разделы Алфавитный список лемм и частотные словари имен существительных, глаголов и других частей речи
  • распределение употребления слова в текстах, созданных в разные десятилетия (1950-е годы, 1960-е годы и т. д.), см. раздел Частотный список лемм;
  • общая частота употребления отдельных словоформ, см. раздел Алфавитный список словоформ.

    В словарях значимой лексики можно также получить информацию о сравнительной частотности слова в общем корпусе и в подкорпусе текстов определенного функционального стиля (художественная литература, публицистика и т. д.) и показателе правдоподобия LL-score.

    Помимо количественных показателей, при слове указывается часть речи. Это делается для того, чтобы развести слова разных частей речи, которые имеют одинаковую исходную форму (ср. печь – имя существительное и глагол).

    Что такое ipm?

    Общая частота характеризует число употреблений на миллион слов корпуса, или ipm (instances per million words). Это общепринятая в мировой практике единица измерения частотности, которая упрощает сравнение частоты слова в разных частотных словарях и в разных корпусах. Дело в том, что выборки текстов, на которых измеряется частотность, могут довольно сильно отличаться по своим размерам. Например, если слово власть встречается 55 раз в корпусе размером 400 тыс. слов, 364 раза в миллионном корпусе и 40598 раз в 100-миллионном корпусе современного русского языка и 55673 раза в большом 135-миллионном корпусе НКРЯ, то его частота в ipm составит 137.5, 364.0, 405.98 и 412.39, соответственно.

    Частотные словари под ред. Л.Н. Засориной и Л.Леннгрена были построены на выборке размером в один миллион словоупотреблений, соответственно, можно считать, что фигурирующие там абсолютные показатели также приводятся в ipm.

    Что такое коэффициент вариации D?

    Коэффициент D, введенный А. Жуйаном (Juilland et al. 1970), используется во многих частотных словарях (русском словаре Л. Леннгрена, словаре Британского национального корпуса, словаря французской лексики в области бизнеса). Этот коэффициент позволяет увидеть, насколько равномерно распределено слово в разных текстах.

    Значение коэффициента определяется в интервале от 0 до 100. Например, слово и встречается практически во всех текстах корпуса, и значение D у него близко к 100. Слово комиссуротомия встречается в корпусе 5 раз, но только в одном тексте; у него значение D около 0.

    Указание коэффициента D для каждого слова дает возможность оценить, насколько оно специфично для отдельных предметных областей. Например, слова перезрелый и имплант имеют примерно равную частоту (0,56 ipm), но при этом коэффициент D у перезрелый равен 90, а у имплант – 0. Это означает, что первое слово равномерно встречается в текстах разного направления и значимо для большого числа предметных областей, в то время как слово имплант присутствует лишь в нескольких текстах тематики «медицина и здоровье».

    Что можно узнать об истории употребления слова в разные периоды?

    Информацию о распределении частотности слова в разные десятилетия 2-ой половины XX века и в начале XXI века можно получить в Частотном списке лемм. Например, можно видеть, как складывалась судьба слова перестройка:

    Резкий всплеск его употребления в 1980-е годы вполне объясним социально-историческими реалиями того времени; вместе с тем, с лингвистической точки зрения этот факт можно трактовать таким образом: слово перестройка обогатилось новым значением, которое стало доминирующим в последующие годы.

    Почему имена собственные и аббревиатуры выделены в отдельный список?

    Имена собственные отделены от основной части словника, так как образуют значительно менее стабильную в статистическом отношении группу, а их частотность в большой степени зависит от выбора текстов в корпусе и от их темы (в частности, от места и времени описываемых событий). В Леннгрен 1993 высказано мнение, что включение имен собственных в частотный словарь на общих основаниях неизбежно приводит к его преждевременному устареванию.

    В словарь включена ядерная часть этого списка, насчитывающая 3 000 наиболее частотных единиц. Для поиска данных об употреблении имен, отчеств, фамилий, прозвищ, кличек, топонимов, названий организаций и аббревиатур перейдите в раздел Алфавитный список собственных имен и аббревиатур, выберите букву, с которой начинается искомое слово и найдите его в таблице. Можно также воспользоваться окном быстрого поиска слова.

    Как получить информацию об употреблении отдельных форм слова?

    Помимо информации об употреблении леммы (то есть слова во всех формах словоизменения), в словаре можно узнать, как употребляются отдельные словоформы. Перейдите в раздел Алфавитный список словоформ, выберите букву, с которой начинается словоформа и найдите ее в таблице. Можно также воспользоваться окном быстрого поиска, например:

    Чтобы найти все словоформы, начинающиеся (или заканчивающиеся) с определенной последовательности букв, используйте в окне поиска знак звездочки (*). Например, все словоформы, начинающиеся с усыпи-, можно найти, набрав:

    Все словоформы, заканчивающиеся на –иком, можно найти, набрав:

    Алфавитный список словоформ включает все словоформы корпуса с частотой выше 0,1 ipm (всего около 15 тыс.) и содержит информацию об их общей частоте. Омонимичные словоформы помечены в таблице знаком *.

    Как найти информацию о «самых употребительных» словах?

    С помощью нашего словаря можно найти информацию о классах слов, отличающихся общими статистическими характеристиками. Это, в частности:

  • наиболее частотные слова по общей выборке из корпуса; среднечастотные слова по общей выборке и т.д. (см. раздел Частотный список лемм);
  • слова, наиболее часто встречающиеся в подкорпусе художественной литературы (см. раздел Частотный словарь художественной литературы);
  • слова, наиболее часто встречающиеся в подкорпусе публицистики (см. раздел Частотный словарь публицистики);
  • слова, наиболее часто встречающиеся в подкорпусе другой нехудожественной литературы (см. раздел Частотный словарь другой нехудожественной литературы);
  • слова, наиболее характерные для устной речи (см. раздел Частотный словарь живой устной речи).
  • наиболее частотные имена существительные (см. раздел Частотный список имен существительных);
  • наиболее частотные глаголы (см. раздел Частотный список глаголов);

    и прочие частотные списки частеречных классов.

    Кроме предлагаемых классов, вы можете самостоятельно исследовать другие группы слов, воспользовавшись в разделе Алфавитного списка словоформ таблицей «Общий алфавитный список» (например, можно исследовать наиболее частотные глаголы с приставкой пере-, слова, встречающиеся более чем в 200-х текстах и многое другое: принципы группировки классов зависят от ваших задач и от вашей фантазии).

    Как проследить распределение частотности в текстах разных функциональных стилей?

    В частотном словаре Л.Н.Засориной приводятся данные об употреблении слова в четырех типах текстов: (I) газетно-журнальных текстах, (II) драматургии, (III) научных и публицистических текстах, (IV) художественной прозе. В нашем словаре можно получить сходную информацию, воспользовавшись разделом «Распределением лемм по функциональным стилям».

    Частотные словари функциональных стилей составлены на основе подкорпусов художественной литературы, публицистики, другой нехудожественной литературы и живой устной речи. По сравнением со словарем Л. Н. Засориной состав рубрик несколько изменен: вместо драматургии используются записи живой устной речи и расшифровки фонограмм кинофильмов, научная литература выделена в отдельную рубрику, наряду с официально-деловой, церковной и прочей нехудожественной литературой.

    В список включены 5 000 самых частотных лемм этих подкорпусов. Для каждой леммы указана часть речи, частотность в подкорпусе и коэффициент D.

    Что такое словарь значимой лексики (художественной литературы и т. д.)?

    Существуют слова, которые гораздо чаще употребляются в одном из фунциональных стилей, нежели в остальных. Например, для живой устной речи такими словами являются вот, вообще и ладно. Дейсвительно, трудно предположить, что в научно-технической литературе эти слова употребляются также часто, как в бытовом языке.

    Список наиболее типичных лемм для каждого функционального типа текстов был выделен на основе сравнения частоты лемм в данном подкорпусе текстов и в остальном корпусе. Словари значимой лексики включают по 500 лемм.

    Что означают показатели frq1, frq2 и LL-score в словаре значимой лексики?

    Frq1 – это общая частота леммы во всем корпусе (в единицах ipm), frq2 – это частота леммы в данном подкорпусе (подкорпус художественной литературы, публицистики, прочей нехудожественной литературы и живой устной речи, соответственно), LL-score – это коэффициент правдоподобия, вычисляемый на основе frq1 и frq2 по формуле, предложенной П.Рейсоном и А.Гарсайдом (см. об этом подробнее во Введении к словарю). Чем выше показатель LL-score, тем более значимо слово для данного функционального стиля.

    Как получить список 100 самых частотных глаголов?

    В разделе «Общая лексика: части речи» частотный список лемм разбит на семь подсписков: имена существительные, глаголы, имена прилагательные, наречия и предикативы, местоимения, числительные и служебные части речи. Здесь для каждой леммы указана ее общая частота и ранг (порядковый номер) в общем списке. Каждый список содержит по 1 000 наиболее частотных лемм.

    Таким образом, можно получить список 100 самых частотных глаголов, зайдя в подраздел Частотный список глаголов и выбрав первые 100 глаголов в верхней части списка. Точно так же можно узнать, какое прилагательное является наиболее частотным (как указано в разделе Частотный список имен прилагательных, это прилагательное новый) и выяснить много других интересных фактов, касающихся состава частеречных классов.

    Как пользоваться вспомогательными таблицами?

    Вспомогательные таблицы включают, во-первых, в данные о частотности частеречных классов, а также других грамматических категорий. Эти данные получены на основание подкорпуса НКРЯ со снятой (вручную) лексико-грамматической неоднозначностиью (размер более 6 млн. словупотреблений). Поскольку статистические данные касаются крупных классов слов, есть основания полагать, что и во всем корпусе пропорция частей речи и других грамматических категорий будет такой же.

    Во-вторых, в данном разделе приводится информация о покрытии текста лексемами, средней длине слова, словоформы и предложения.

    В-третьих, здесь приводятся частотные списки употреблений букв русского алфавита, знаков препинания, а также двубуквенных и многобуквенных сочетаний.

    Сайт создан при финансовой поддержке Федерального агентства по образованию в рамках Федеральной целевой программы «Русский язык» (Госконтракт П66).

    © Институт им. В. В. Виноградова РАН 2008.
    © Национальный корпус русского языка 2008.

    Источник статьи: http://dict.ruslang.ru/freq_faq.html


  • 0 0 голоса
    Article Rating
    Подписаться
    Уведомить о
    guest

    0 Комментарий
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии