Частотные глаголы русского языка
Самое длинное слово русского языка — Решение проблемы того, какое слово в русском языке является самым длинным (и даже ответ на вопрос о том, имеет ли вообще эта проблема решение), зависит от нескольких факторов. Содержание 1 Критерии 2 Условия выбора 2.1 Форма слов … Википедия
Национальный корпус русского языка — URL: http://ruscorpora.ru/ Коммерческий: нет Тип сайта: образовательный/научный проект Реги … Википедия
Частотный словарь — (или частотный список) набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов… … Википедия
Русский язык — У этого термина существуют и другие значения, см. Русский язык (значения). Русский язык Произношение: ˈruskʲɪj jɪˈzɨk … Википедия
Частотность — термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчёт осуществляется по формуле: где Freqx частотность слова «x», Qx количество словоупотреблений слова «x», Qall общее количество словоупотреблений. В… … Википедия
НКРЯ — Национальный корпус русского языка общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 в Интернете по адресу http://ruscorpora.ru/. Содержание 1 Составители 2 Состав корпуса … Википедия
словарь лингвистический — Словарь, в котором дается разъяснение значения и употребления слов (в отличие от энциклопедического словаря, сообщающего сведения о соответствующих реалиях предметах, явлениях, событиях). Диалектный (областной) словарь. Словарь, содержащий… … Словарь лингвистических терминов
Медицина — I Медицина Медицина система научных знаний и практической деятельности, целями которой являются укрепление и сохранение здоровья, продление жизни людей, предупреждение и лечение болезней человека. Для выполнения этих задач М. изучает строение и… … Медицинская энциклопедия
Источник статьи: http://dic.academic.ru/dic.nsf/ruwiki/269629
LiveInternetLiveInternet
—Ссылки
—Цитатник
Изумительное песочное печенье Изумительное песочное печенье Список требуем.
10 фишек Windows 10, о которых вы могли не знать 10 полезных фишек Windows 10, о которых знают.
Вяжем идеальную макушку шапки Хочу поделиться с вами отличным способом того, как связать идеал.
Шпаргалка вязальщицам источн.
Два воздушных узора для летний кофты. Мастер-классы + схемы Огромная благодарность автору: Масте.
—Рубрики
- БЛЮДА ИЗ МЯСА. (32)
- ФРАЗЫ (9)
- БЕЗ ВЫПЕЧКИ. (47)
- ДЕСЕРТЫ. КОНФЕТЫ. (8)
- ПЕЧЕНЬЕ. (8)
- ПИРОЖНЫЕ. ТОРТЫ. (29)
- БЛЮДА В КЛЯРЕ (9)
- БЛЮДА ДЛЯ МУЛЬТИВАРКИ (7)
- БЛЮДА ИЗ КРУП (20)
- МАКАРОНЫ, СПАГЕТТИ, ЛАПША. (17)
- ПЕРЛОВКА. (1)
- БЛЮДА ИЗ КУРИЦЫ. (62)
- БЛЮДА ИЗ МЯСНОГО ФАРША. (19)
- БЛЮДА ИЗ РЫБЫ (36)
- БЛЮДА ИЗ ФАРША. (19)
- КОТЛЕТЫ (5)
- ВИННЫЙ ПОГРЕБОК. (8)
- АЛКОГОЛЬНЫЕ НАПИТКИ (1)
- ВЫПЕЧКА. (523)
- БАРАНОЧКИ. (1)
- БЕЗЕ (1)
- БЛИНЫ, ОЛАДЬИ, БЛИНЧИКИ, БАРАНКИ. (20)
- БУЛОЧКИ. (26)
- ВАФЛИ. (4)
- ВЫПЕЧКА НА КЕФИРЕ (22)
- ГЛАЗУРИ; КРЕМЫ ДЛЯ ТОРТОВ (2)
- КЕКСЫ. МАФФИНЫ. КАПКЕЙКИ. (79)
- КОВРИЖКИ; ПЕЧЕНЬЕ (21)
- ЛАВАШ; ЛЕПЁШКИ (42)
- ПЕЧЕНЬЕ. РОГАЛИКИ. (49)
- ПИРОГИ (107)
- ПИРОЖКИ. (60)
- ПИРОЖНЫЕ; ТОРТЫ; РУЛЕТЫ; КРЕМЫ ДЛЯ ТОРТОВ (57)
- ПИЦЦА (17)
- ПОНЧИКИ. (9)
- ПРЯНИКИ. (4)
- ХВОРОСТ. (6)
- ЧЕБУРЕКИ; БЕЛЯШИ; ХАЧАПУРИ; ПЕРЕМЯЧИ (30)
- ВЯЗАНИЕ (276)
- ВАРЕЖКИ. (14)
- ВЯЗАНИЕ СПИЦАМИ ДЛЯ ЖЕНЩИНЫ (66)
- ВЯЗАНИЕ СПИЦАМИ: ДЛЯ МАЛЬЧИКА. (12)
- ЖАККАРД. (2)
- НОСКИ. ТАПОЧКИ. (24)
- РЕГЛАН. (21)
- УЗОРЫ СПИЦАМИ. (80)
- ШАПКИ; БЕРЕТЫ; ШАРФЫ, МАНИШКИ (63)
- ШНУРЫ. (3)
- ЭНТЕРЛАК (2)
- ВЯЗАНИЕ КРЮЧКОМ. (8)
- ГРИБЫ (57)
- БЛЮДА С ГРИБАМИ И ИЗ ГРИБОВ (22)
- ГРИБНЫЕ СУПЫ (1)
- ГРИБЫ (3)
- ЗАГОТОВКИ ИЗ ГРИБОВ (23)
- ПИРОГИ С ГРИБАМИ (6)
- РЕЦЕПТЫ ГРИБНЫХ СОУСОВ (1)
- САЛАТЫ С ГРИБАМИ (9)
- ДЕСЕРТЫ. (62)
- КОНФЕТКИ (19)
- МОРОЖЕНОЕ (3)
- ПАСТИЛА (1)
- СЛАДОСТИ. (26)
- ШОКОЛАД (7)
- Для ЖЕНЩИНЫ. (260)
- ДОМАШНЯЯ КОСМЕТИКА (НАРОДНЫЕ СРЕДСТВА) (21)
- ЗДОРОВЬЕ. (127)
- ПСИХОЛОГИЯ (6)
- СЕКРЕТЫ КРАСОТЫ. (31)
- СТИЛЬ. (10)
- УХОД ЗА ВОЛОСАМИ. (34)
- УХОД ЗА ЛИЦОМ. (54)
- УХОД ЗА НОГАМИ. (19)
- УХОД ЗА НОГТЯМИ. (10)
- УХОД ЗА РУКАМИ. (10)
- ДОМОВОДСТВО (102)
- ДЕКОРИРОВАНИЕ. (3)
- ДЕКУПАЖ. (12)
- ЦВЕТЫ; РАСТЕНИЯ. (13)
- ПОДЕЛКИ. (24)
- ПОЛЕЗНЫЕ СОВЕТЫ. (41)
- РУКОДЕЛИЕ (16)
- ИМБИРЬ (5)
- ИНТЕРЕСНОЕ. (39)
- ГАДАНИЕ (5)
- КАЛЕНДАРИ. (1)
- КОСМОЭНЕРГЕТИКА (2)
- ТЕЛЕФОННЫЕ СПРАВОЧНИКИ. (2)
- ИНТЕРНЕТ. ВСЁ ПРО ЛИ.РУ. (23)
- Windows 10 (2)
- ЙОГА (6)
- МУДРЫ (4)
- КИТАЙ. (107)
- Гороскопы — астро-нумерология, астрология (3)
- КИТАЙСКАЯ МЕДИЦИНА. (43)
- МАГАЗИНЫ КИТАЙСКИХ ТОВАРОВ (2)
- МУЗЫКА (2)
- ТАЙЦЗИЦЮАНЬ. ЦИГУН. (12)
- ТОЧКИ АКУПУНКТУРЫ. СУ ДЖОК. (52)
- ФЭН-ШУЙ (3)
- КОНСЕРВИРОВАНИЕ. ЗАГОТОВКИ. (153)
- АДЖИКА (3)
- АССОРТИ. (3)
- БАКЛАЖАНЫ. (19)
- БОЛГАРСКИЙ ПЕРЕЦ. (16)
- ГРИБЫ (6)
- ДЖЕМ, ВАРЕНЬЕ, КОНФИТЮР. МАРМЕЛАД. (7)
- КАБАЧКИ. (11)
- КАПУСТА БЕЛОКОЧАННАЯ. (27)
- КАПУСТА ЦВЕТНАЯ, БРОККОЛИ И ДР. (3)
- МОРКОВЬ; СВЁКЛА (1)
- ОГУРЧИКИ. (26)
- ПОМИДОРЫ. (15)
- ЧЕСНОК. (5)
- ЩАВЕЛЬ. (1)
- КУЛИНАРИЯ (147)
- ТВОРОГ. БЛЮДА С ТВОРОГОМ. (38)
- БЛЮДА С КАПУСТОЙ (3)
- ЗАПЕКАНКИ. (1)
- КУЛИНАРНЫЕ ВИДЕОРЕЦЕПТЫ (10)
- ПАШТЕТЫ (21)
- ПЛОВ. (1)
- РУЛЕТЫ (2)
- РУЛЕТЫ. (5)
- СУБПРОДУКТЫ (13)
- ПЕЛЬМЕНИ, ВАРЕНИКИ, МАНТЫ. ХИНКАЛИ. (34)
- КУЛИНАРИЯ. ПОЛЕЗНЫЕ СОВЕТЫ (25)
- КУХНИ МИРА. (135)
- АРМЯНСКАЯ КУХНЯ (4)
- ГРУЗИНСКАЯ КУХНЯ (19)
- ЕВРЕЙСКАЯ КУХНЯ. (5)
- ИСПАНСКАЯ КУХНЯ (3)
- ИТАЛЬЯНСКАЯ КУХНЯ. (5)
- КИТАЙСКАЯ КУХНЯ. КУХНИ АЗИИ. (43)
- КОРЕЙСКАЯ КУХНЯ. (15)
- РУССКАЯ КУХНЯ (11)
- ТАЙСКАЯ КУХНЯ (5)
- ТАТАРСКАЯ КУХНЯ (9)
- ТУРЕЦКАЯ КУХНЯ (2)
- ФРАНЦУЗСКАЯ КУХНЯ. (2)
- ШВЕДСКАЯ КУХНЯ. (2)
- МНОГОЛИКАЯ КОЖА (120)
- ОБУВЬ. (27)
- СУМКИ, КОСМЕТИЧКИ, КЛАТЧИ. (47)
- УКРАШЕНИЯ ИЗ КОЖИ. (25)
- ШКАТУЛОЧКИ. (5)
- МОРЕПРОДУКТЫ. МОРСКАЯ КАПУСТА. (25)
- КАЛЬМАРЫ. (11)
- КРЕВЕТКИ (5)
- НАПИТКИ. (25)
- КВАС. (13)
- ПОЛЕЗНЫЕ НАПИТКИ (4)
- ЧАЙНЫЙ ГРИБ. (4)
- ОВОЩИ (40)
- БАКЛАЖАНЫ. (8)
- КАБАЧКИ. (2)
- КАПУСТА (6)
- КАПУСТА ЦВЕТНАЯ (2)
- КАРТОФЕЛЬ (9)
- МОРКОВЬ (2)
- ПЕРЕЦ БОЛГАРСКИЙ (3)
- ПОМИДОРЫ (1)
- ПОЛЕЗНЫЕ ССЫЛКИ. (8)
- ПРАВОСЛАВИЕ — КУЛИНАРИЯ (53)
- КУЛИЧИ (28)
- ПАСХА. (10)
- ПОСТНАЯ ВЫПЕЧКА (9)
- ПОСТНОЕ МЕНЮ. (9)
- РОССИЯ, МОСКВА — моя Родина! (5)
- МОСКВА. (1)
- РЫБА: СОЛЁНАЯ; МАРИНОВАННАЯ. (73)
- ГОРБУША. (10)
- КЕТА. (7)
- ЛОСОСЬ. (10)
- СЕЛЬДЬ. МОЙВА. (45)
- СЁМГА. (10)
- СКУМБРИЯ. (25)
- ФОРЕЛЬ. (8)
- САЛАТЫ (100)
- ЗАКУСКИ. (45)
- САЛАТЫ (24)
- САЛАТЫ «ЦЕЗАРЬ» (2)
- САЛАТЫ ОВОЩНЫЕ. (13)
- САЛАТЫ С ГРИБАМИ. (11)
- САЛАТЫ С КУРИЦЕЙ. (12)
- САЛАТЫ С МОРЕПРОДУКТАМИ. (11)
- САЛАТЫ С МЯСОМ. (2)
- САЛАТЫ С РЫБОЙ. (8)
- САЛАТЫ С СЕЛЬДЬЮ. (9)
- САЛАТЫ С ФРУКТАМИ. (1)
- САЛАТЫ СО СВЁКЛОЙ. (2)
- САЛО. (21)
- СОУСЫ (52)
- СОУСЫ (24)
- ХРЕН; МАЙОНЕЗ; ГОРЧИЦА, АДЖИКА (19)
- СПЕЦИИ. (3)
- СУПЫ (5)
- СЫР (29)
- ТЕЛЕФОННЫЕ СПРАВОЧНИКИ. (3)
- ТЕЛЕФОННЫЕ СПРАВОЧНИКИ-ОНЛАЙН. (1)
- ТЕЛЕФОНЫ ЦАО МОСКВА. (2)
- ТЕСТО. (188)
- БЕЗДРОЖЖЕВОЕ ТЕСТО. (9)
- БИСКВИТ (44)
- КЛЯР (7)
- ТЕСТО ДЛЯ КЕКСОВ (8)
- ТЕСТО ДЛЯ ЛАПШИ (1)
- ТЕСТО ДРОЖЖЕВОЕ. (32)
- ТЕСТО ЗАВАРНОЕ. (25)
- ТЕСТО НА КЕФИРЕ (20)
- ТЕСТО ПЕСОЧНОЕ. (30)
- ТЕСТО СЛОЁНОЕ. (23)
- ТЫКВА (13)
- ОЛАДЬИ С ТЫКВОЙ (1)
- ПИРОГИ С ТЫКВОЙ (5)
- ХЛЕБ. (46)
- ХОЛОДЦЫ И ЗАЛИВНЫЕ БЛЮДА. (20)
- ШАШЛЫКИ (10)
- ШАШЛЫКИ (10)
- ШИТЬЁ. (146)
- ВИДЕО — УРОКИ ПО ШИТЬЮ. (40)
- ВЫКРОЙКИ. (35)
- ТУНИКИ; САРАФАНЫ; ЛЕТНИЕ ПЛАТЬЯ. (32)
- ЮБКИ. (19)
- ЭНЦИКЛОПЕДИИ (2)
- ЯНДЕКС. (1)
—Метки
—Музыка
—Приложения
- ОткрыткиПерерожденный каталог открыток на все случаи жизни
- Редактор фотографийРедактор фотографий и изображений для быстрой обработки и сохранения. Возможности включают в себя: изменения размера, обрезка, наложение некоторых эффектов, улучшение качества изображения.
- Я — фотографПлагин для публикации фотографий в дневнике пользователя. Минимальные системные требования: Internet Explorer 6, Fire Fox 1.5, Opera 9.5, Safari 3.1.1 со включенным JavaScript. Возможно это будет рабо
- 5 друзейСписок друзей с описанием. Данное приложение позволяет разместить в Вашем блоге или профиле блок, содержащий записи о 5 Ваших друзьях. Содержание подписи может быть любым — от признания в любви, до
- Всегда под рукойаналогов нет ^_^ Позволяет вставить в профиль панель с произвольным Html-кодом. Можно разместить там банеры, счетчики и прочее
—Поиск по дневнику
—Подписка по e-mail
—Интересы
—Друзья
—Постоянные читатели
—Сообщества
—Статистика
ТОП 200 глаголов. (TOP 200 Verbs)
ТОП 200 глаголов. (TOP 200 Verbs).
become [bɪkˈʌm] становиться
understand [ʌndəstˈænd] понимать
№ Первая форма глагола Перевод на русский язык
1 Agree — [ə’griː] Соглашаться
3 Answer — [‘ɑːn(t)sə] — Отвечать
6 Become — [bɪ’kʌm] — Становиться
8 Believe — [bɪ’liːv] — Верить
9 Borrow — [‘bɔrəu] — Занимать
11 Bring — [brɪŋ] — Приносить
17 Close — [kləuz] — Закрывать
20 Copy — [‘kɔpɪ] — Копировать
22 Decide — [dɪ’saɪd] — Решать
23 Discuss — [dɪ’skʌs] — Обсуждать
26 Explain — [ɪk’spleɪn] — Объяснять
28 Feel — [fiːl] — Чувствовать себя
31 Finish — [‘fɪnɪʃ] — Заканчивать
32 Follow — [‘fɔləu] — Следовать
34 Forget — [fə’get] — Забывать
38 Happen — [‘hæp(ə)n] — Случаться
42 Hold — [həuld] — Держать; Обнимать
46 Leave — [liːv] — Оставлять; Уезжать
48 Listen — [‘lɪs(ə)n] — Слушать
50 Look — [luk] — Смотреть; Следить; Осматривать
52 Make — [meɪk] — Делать; Творить; Создавать
54 Mean [miːn] — Значить; намереваться; Иметь в виду
56 Move — [muːv] — Двигать; Перемещать
57 Must — [mʌst] Должен; ОБЯЗАН!
59 Open — [‘əup(ə)n] — Открывать
62 Promise — [‘prɔmɪs] — Обещать
63 Put — [put] — Класть; Ставить
65 Remember — [rɪ’membə] — Помнить
67 Say — [seɪ] — Сказать; Произносить
70 Send — [send] — Посылать; Отправлять
71 Set — [set] — Ставить; Класть
76 Sleep — [sliːp] — Спать
77 Speak — [spiːk] — Говорить; Изъясняться, выражать свою
мысль
78 Spend — [spend] — Проводить время; Тратить; Расходовать
80 Start — [stænd] — Начинать
81 Stop — [stɔp] — Останавливать
83 Suggest — [sə’ʤest] — Предлагать; Советовать
85 Talk — [tɔːk] — Говорить; Разговаривать; Вести беседу
86 Tell — [tel] — Сказать; Сообщать; Рассказывать
88 Travel — [‘træv(ə)l] — Путешествовать
89 Try — [traɪ] — Пытаться; Стараться
90 Turn — [tɜːn] — Поворачивать
91 Understand — [ˌʌndə’stænd] — Понимать
92 Use — [juːz] — Использовать
94 Wake up — Просыпаться; Проснуться
95 Walk — [wɔːk] — Ходить (пешком)
96 Watch — [wɔʧ] — Смотреть; Наблюдать
99 Worry — [‘wʌrɪ] — Беспокоиться
Наиболее часто употребляемые английские глаголы.
Пояснения:
Как работать с данным списком глаголов?
Хорошо не просто знать перевод глаголов с английского на русский, но также важно уметь переводить слова с русского на английский язык. Есть несколько вариантов работы с данным списком.
Первый вариант — мы учим по порядку глаголы. В один день какое-то число, во второй день — еще столько же. Третий день на закрепление и так далее. Очень важно не просто учить, а оставлять время на повторение. Это не впустую потраченное время. Я в этом много раз сам убеждался. Когда я хотел сэкономить время и не закрепить выученное, то была какая-то каша в голове. Не было все упорядочено по полочкам.
Источник статьи: http://www.liveinternet.ru/users/gall-inna/post234321095/
Как пользоваться новым частотным словарем русской лексики
О словаре
Словарь включает наиболее употребительные слова современного русского языка (2-я половина XX – начало XXI вв.), снабженные информацией о частотности употребления, статистическом распределении по текстам и жанрам, по времени создания текстов. Словарь основан на текстах Национального корпуса русского языка объемом 100 млн. словоупотреблений. Подробнее об истории частотных словарей русского языка и методах создания «Нового частотного словаря русской лексики» словаря можно прочитать во Введении.
Разработка концепции словаря и его подготовка к изданию осуществлена О.Н.Ляшевской и С.А.Шаровым, электронная версия подготовлена А. В. Санниковым. Авторы выражают благодарность В. А. Плунгяну, А. Я. Шайкевичу, Е. А. Гришиной, Б. П. Кобрицову, Е. В. Рахилиной, С. О. Савчук, Д. В. Сичинаве и другим участникам семинара НКРЯ, принимавшим участие в обсуждении принципов создания словаря. Мы благодарим О. Урюпину, Д. и Г. Бронниковых, Б. Кобрицова, а также сотрудников ООО «Яндекс» А. Аброскина, Н. Григорьева, А. Сокирко за помощь на разных этапах сбора и компьютерной обработки материала.
Как найти слово в словаре?
Два основных раздела словаря – список слов, упорядоченный по алфавиту и по общей частоте употребления в корпусе. Все слова приводятся в исходной (начальной) форме: для имен это форма именительного падежа (для имен существительных, как правило, форма единственного числа, для имен прилагательных – полная форма мужского рода), для глаголов – форма инфинитива.
В алфавитном списке приведено 60 тысяч наиболее частотных словоформ. Чтобы найти информацию о нужном слове, перейдите в раздел Алфавитный список лемм, выберите первую букву слова и найдите искомое слово в таблице. Чтобы быстро найти слово, вы можете также воспользоваться окном поиска, например:
Таким способом можно найти информацию не только о каком-то конкретном слове, но и о группе слов, начинающихся или заканчивающихся одинаковым образом. Для этого в окне поиска используйте знак звездочки (*) после набранной последовательности букв («все слова, начинающиеся с…») или до цепочки букв («все слова, оканчивающиеся на…». Например, если вы хотите найти все слова, начинающиеся на пере-, наберите в окне поиска:
Если вы хотите найти все слова, оканчивающиеся на –енько, наберите в окне поиска:
В частотном списке лемм слова упорядочены по общей частоте употребления в корпусе современного русского литературного языка. Частотный список включает 20 000 наиболее употребительных лемм.
Чтобы найти информацию о нужном слове, перейдите в раздел Частотный список лемм и найдите искомое слово в таблице. Для поиска информации об отдельных словах лучше всего воспользоваться окном быстрого поиска слова.
Почему я не могу найти слова в словаре, хотя я могу найти его в корпусе?
Это может объясняться несколькими причинами. Во-первых, слово может иметь низкую частотность (например, всего 3 употребления в корпусе) или употребляться только в текстах, написанных до 1950-го года. Во-вторых, слово может встретиться много раз, но в одном-двух текстах: такие леммы были сознательно исключены из словника словаря. В третьих, мы не можем исключить, что произошла ошибка автоматического определения исходной формы или частеречной характеристики слова, или же слово было ошибочно атрибуировано как имя собственное. На сайте представлена «тестовая» версия частотного словаря, и мы собираемся продолжать работу по уточнению его лексического состава.
Какую информацию об употреблении слова можно получить?
В словаре можно получить следующую информацию об употреблении слова в корпусе:
В словарях значимой лексики можно также получить информацию о сравнительной частотности слова в общем корпусе и в подкорпусе текстов определенного функционального стиля (художественная литература, публицистика и т. д.) и показателе правдоподобия LL-score.
Помимо количественных показателей, при слове указывается часть речи. Это делается для того, чтобы развести слова разных частей речи, которые имеют одинаковую исходную форму (ср. печь – имя существительное и глагол).
Что такое ipm?
Общая частота характеризует число употреблений на миллион слов корпуса, или ipm (instances per million words). Это общепринятая в мировой практике единица измерения частотности, которая упрощает сравнение частоты слова в разных частотных словарях и в разных корпусах. Дело в том, что выборки текстов, на которых измеряется частотность, могут довольно сильно отличаться по своим размерам. Например, если слово власть встречается 55 раз в корпусе размером 400 тыс. слов, 364 раза в миллионном корпусе и 40598 раз в 100-миллионном корпусе современного русского языка и 55673 раза в большом 135-миллионном корпусе НКРЯ, то его частота в ipm составит 137.5, 364.0, 405.98 и 412.39, соответственно.
Частотные словари под ред. Л.Н. Засориной и Л.Леннгрена были построены на выборке размером в один миллион словоупотреблений, соответственно, можно считать, что фигурирующие там абсолютные показатели также приводятся в ipm.
Что такое коэффициент вариации D?
Коэффициент D, введенный А. Жуйаном (Juilland et al. 1970), используется во многих частотных словарях (русском словаре Л. Леннгрена, словаре Британского национального корпуса, словаря французской лексики в области бизнеса). Этот коэффициент позволяет увидеть, насколько равномерно распределено слово в разных текстах.
Значение коэффициента определяется в интервале от 0 до 100. Например, слово и встречается практически во всех текстах корпуса, и значение D у него близко к 100. Слово комиссуротомия встречается в корпусе 5 раз, но только в одном тексте; у него значение D около 0.
Указание коэффициента D для каждого слова дает возможность оценить, насколько оно специфично для отдельных предметных областей. Например, слова перезрелый и имплант имеют примерно равную частоту (0,56 ipm), но при этом коэффициент D у перезрелый равен 90, а у имплант – 0. Это означает, что первое слово равномерно встречается в текстах разного направления и значимо для большого числа предметных областей, в то время как слово имплант присутствует лишь в нескольких текстах тематики «медицина и здоровье».
Что можно узнать об истории употребления слова в разные периоды?
Информацию о распределении частотности слова в разные десятилетия 2-ой половины XX века и в начале XXI века можно получить в Частотном списке лемм. Например, можно видеть, как складывалась судьба слова перестройка:
Резкий всплеск его употребления в 1980-е годы вполне объясним социально-историческими реалиями того времени; вместе с тем, с лингвистической точки зрения этот факт можно трактовать таким образом: слово перестройка обогатилось новым значением, которое стало доминирующим в последующие годы.
Почему имена собственные и аббревиатуры выделены в отдельный список?
Имена собственные отделены от основной части словника, так как образуют значительно менее стабильную в статистическом отношении группу, а их частотность в большой степени зависит от выбора текстов в корпусе и от их темы (в частности, от места и времени описываемых событий). В Леннгрен 1993 высказано мнение, что включение имен собственных в частотный словарь на общих основаниях неизбежно приводит к его преждевременному устареванию.
В словарь включена ядерная часть этого списка, насчитывающая 3 000 наиболее частотных единиц. Для поиска данных об употреблении имен, отчеств, фамилий, прозвищ, кличек, топонимов, названий организаций и аббревиатур перейдите в раздел Алфавитный список собственных имен и аббревиатур, выберите букву, с которой начинается искомое слово и найдите его в таблице. Можно также воспользоваться окном быстрого поиска слова.
Как получить информацию об употреблении отдельных форм слова?
Помимо информации об употреблении леммы (то есть слова во всех формах словоизменения), в словаре можно узнать, как употребляются отдельные словоформы. Перейдите в раздел Алфавитный список словоформ, выберите букву, с которой начинается словоформа и найдите ее в таблице. Можно также воспользоваться окном быстрого поиска, например:
Чтобы найти все словоформы, начинающиеся (или заканчивающиеся) с определенной последовательности букв, используйте в окне поиска знак звездочки (*). Например, все словоформы, начинающиеся с усыпи-, можно найти, набрав:
Все словоформы, заканчивающиеся на –иком, можно найти, набрав:
Алфавитный список словоформ включает все словоформы корпуса с частотой выше 0,1 ipm (всего около 15 тыс.) и содержит информацию об их общей частоте. Омонимичные словоформы помечены в таблице знаком *.
Как найти информацию о «самых употребительных» словах?
С помощью нашего словаря можно найти информацию о классах слов, отличающихся общими статистическими характеристиками. Это, в частности:
и прочие частотные списки частеречных классов.
Кроме предлагаемых классов, вы можете самостоятельно исследовать другие группы слов, воспользовавшись в разделе Алфавитного списка словоформ таблицей «Общий алфавитный список» (например, можно исследовать наиболее частотные глаголы с приставкой пере-, слова, встречающиеся более чем в 200-х текстах и многое другое: принципы группировки классов зависят от ваших задач и от вашей фантазии).
Как проследить распределение частотности в текстах разных функциональных стилей?
В частотном словаре Л.Н.Засориной приводятся данные об употреблении слова в четырех типах текстов: (I) газетно-журнальных текстах, (II) драматургии, (III) научных и публицистических текстах, (IV) художественной прозе. В нашем словаре можно получить сходную информацию, воспользовавшись разделом «Распределением лемм по функциональным стилям».
Частотные словари функциональных стилей составлены на основе подкорпусов художественной литературы, публицистики, другой нехудожественной литературы и живой устной речи. По сравнением со словарем Л. Н. Засориной состав рубрик несколько изменен: вместо драматургии используются записи живой устной речи и расшифровки фонограмм кинофильмов, научная литература выделена в отдельную рубрику, наряду с официально-деловой, церковной и прочей нехудожественной литературой.
В список включены 5 000 самых частотных лемм этих подкорпусов. Для каждой леммы указана часть речи, частотность в подкорпусе и коэффициент D.
Что такое словарь значимой лексики (художественной литературы и т. д.)?
Существуют слова, которые гораздо чаще употребляются в одном из фунциональных стилей, нежели в остальных. Например, для живой устной речи такими словами являются вот, вообще и ладно. Дейсвительно, трудно предположить, что в научно-технической литературе эти слова употребляются также часто, как в бытовом языке.
Список наиболее типичных лемм для каждого функционального типа текстов был выделен на основе сравнения частоты лемм в данном подкорпусе текстов и в остальном корпусе. Словари значимой лексики включают по 500 лемм.
Что означают показатели frq1, frq2 и LL-score в словаре значимой лексики?
Frq1 – это общая частота леммы во всем корпусе (в единицах ipm), frq2 – это частота леммы в данном подкорпусе (подкорпус художественной литературы, публицистики, прочей нехудожественной литературы и живой устной речи, соответственно), LL-score – это коэффициент правдоподобия, вычисляемый на основе frq1 и frq2 по формуле, предложенной П.Рейсоном и А.Гарсайдом (см. об этом подробнее во Введении к словарю). Чем выше показатель LL-score, тем более значимо слово для данного функционального стиля.
Как получить список 100 самых частотных глаголов?
В разделе «Общая лексика: части речи» частотный список лемм разбит на семь подсписков: имена существительные, глаголы, имена прилагательные, наречия и предикативы, местоимения, числительные и служебные части речи. Здесь для каждой леммы указана ее общая частота и ранг (порядковый номер) в общем списке. Каждый список содержит по 1 000 наиболее частотных лемм.
Таким образом, можно получить список 100 самых частотных глаголов, зайдя в подраздел Частотный список глаголов и выбрав первые 100 глаголов в верхней части списка. Точно так же можно узнать, какое прилагательное является наиболее частотным (как указано в разделе Частотный список имен прилагательных, это прилагательное новый) и выяснить много других интересных фактов, касающихся состава частеречных классов.
Как пользоваться вспомогательными таблицами?
Вспомогательные таблицы включают, во-первых, в данные о частотности частеречных классов, а также других грамматических категорий. Эти данные получены на основание подкорпуса НКРЯ со снятой (вручную) лексико-грамматической неоднозначностиью (размер более 6 млн. словупотреблений). Поскольку статистические данные касаются крупных классов слов, есть основания полагать, что и во всем корпусе пропорция частей речи и других грамматических категорий будет такой же.
Во-вторых, в данном разделе приводится информация о покрытии текста лексемами, средней длине слова, словоформы и предложения.
В-третьих, здесь приводятся частотные списки употреблений букв русского алфавита, знаков препинания, а также двубуквенных и многобуквенных сочетаний.
Сайт создан при финансовой поддержке Федерального агентства по образованию в рамках Федеральной целевой программы «Русский язык» (Госконтракт П66).
© Институт им. В. В. Виноградова РАН 2008.
© Национальный корпус русского языка 2008.
Источник статьи: http://dict.ruslang.ru/freq_faq.html