Словарь русских существительных txt
БлогNot. Все существительные русского языка в простом формате
Все существительные русского языка в простом формате
Готового файла в нужном мне простейшем и удобном формате (простой текст, одно слово — одна строка) не нашёл, пришлось сделать самому.
Для начала я взял «все» слова русского языка с указанием части речи, числа, рода и падежа, то есть, морфологический словарь русского языка по Хагену, вот отсюда (hagen-morph.rar). Развёрнутый файл .txt будет более 200 Мб, так что поосторожней с «Блокнотиками», если его скачаете 🙂
Потом я простенько отобрал оттуда существительные по формальному указанию файла словаря, вот код на PHP:
Предполагается, что развёрнутый словарь «лежит» под именем 1.txt в папке скрипта, а вывод писался в файл 2.txt .
Символы конца строк — CR/LF, то есть, в формате для Windows. Скрипт может выполняться до 10 секунд, но из-за нехватки памяти «зависать» не должен, так как не пытается засунуть весь файл в оперативку, а читает его построчно.
«Вытащить» только единственное число существительных пришлось вторым маленьким кодом:
Качество отбора «единственного числа» здесь невысоко, скрипт выполнялся на локальном хосте «Денвер».
Можете исключить из получившегося второго словаря что-то ещё, это легко сделать даже с помощью функций startsWith и endsWith из приведённого кода. Например, вот так можно вывести все слова, заканчивающиеся на «ые»:
В реальности исключать такие слова не стоит, ведь окончание «ие» или «ые» может означать не совсем «множественное число», а что-то вроде «русские как нация«, группа «Младшенькие» или отряд «Куриные».
В файлах, разумеется, нет имён, географических названий и т.п. Буквы «ё» тоже нигде нет, как и в исходном словаре.
Скачать файлы .txt в архиве .zip (перекодированы в кодировку utf-8 Юникода!)
Более 125 тысяч русских существительных в именительном падеже (единственное и множественное число, мужской и женский род) (413 Кб)
Более 67 тысяч русских существительных в именительном падеже (единственное число, мужской и женский род) (260 Кб)
Источник статьи: http://blog.kislenko.net/show.php?id=1678
База данных русских слов — существительные
Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая — только существительные в именительном падеже ед. числа.
Скачать SQL скрипт можно с github. Переходим, жмем download.
words-russian-nouns.sql.gz — база существительных без морфологии, таблица nouns.
words-russian-nouns-morf.sql.gz — база существительных с морфологией, таблица nouns_morf.
Описание таблицы nouns
Содержит 65500 существительных в именительном падеже, ед. числе.
- IID, int — суррогатный ключ
- word, varchar[60] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- gender, enum(‘муж’,’жен’,’ср’,’общ’) — род
- wcase, enum(‘им’) — только именительный падеж или NULL для слов, которые не имеют падежных форм. Последние — это в своём большинстве заимствованные иностранные слова.
- soul, boolean — признак одушевленности.
Описание таблицы nouns_morf
Содержит 767,694 словоформ существительных русского языка, в том числе во множественном числе.
- IID, int — суррогатный ключ
- word, varchar[60] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- plural, boolean — множественное число
- gender, enum(‘муж’,’жен’,’ср’,’общ’) — род
- wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’,’зват’,’парт’,’мест’, ’счет’) — 10 падежей. Кроме шести хорошо известных из школьного курса: именительного, родительного, дательного, винительного, творительного и предложного, есть ещё 4 падежа — звательный, счетный падеж (счетная форма), партитив и местный пажеж — локатив.
- soul, boolean — признак одушевленности.
Данная запись опубликована в 13.03.2017 21:38 и размещена в На первой полосе. Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Частицы в русском языке, скачать как SQL дамп
Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список. SQL скрипт размещен на github. Переходим, ищем words-russian-particles, жмем download. .
Источник статьи: http://shra.ru/2017/03/baza-dannykh-russkikh-slov-sushhestvitelnye/
Словарь русских существительных txt
17077 статей
Windows Help формат, CHM + RARSFX (2 куска по 800 КБ) 1 2 Образец текста
Русско-английский математический словарь
A. J. Lohwater’s Russian–English Dictionary of the Mathematical Sciences
Windows Help формат, CHM + RARSFX (352 КБ) Скачать
Государственные стандарты
Словарь психологических терминов
2500 статей, с иллюстрациями и гиперссылками
Windows Help формат, CHM + RARSFX (8 кусков по 2,73 МБ) 1 2 3 4 5 6 7 8
Образец текста
Словарь педагогических терминов
2344 статей, с иллюстрациями и гиперссылками
Windows Help формат, CHM + RARSFX (5 кусков по 683 кБ) 1 2 3 4 5
Образец текста
Философия
Л.В.Блинников. Великие философы. Словарь-справочник (ок. 150 имен)
Словарь медицинских терминов
ок. 43600 статей, с приложениями
Windows Help формат, CHM + RARSFX (2 файла по 2,73 МБ + 1 файл 1,2 МБ) 1 2 3
Образец текста
Словарь финансовых терминов
2066 статей
Windows Help формат, CHM + RARSFX (600 кб) Скачать
Словарь терминов классической музыки
109 статей
Windows Help формат, CHM + RAR (28 кб) Скачать
Краткий музыкальный словарь
Windows Help формат, CHM + RAR (58 кб) Скачать
О.В.Вишнякова. Словарь паронимов русского языка
Условные обозначения в словаре Фасмера
Сам словарь (с алфавитным индексом) в формате CHM+RAR, 6.0 МБ Скачать Образец
Набор шрифтов для просмотра (Windows) Скачать
Энциклопедия Брокгауза и Ефрона
5450 статей
Windows Help формат, CHM + RARSFX (8 кусков по 2,73 МБ) 1 2 3 4 5 6 7 8
Образец текста
Российские фамилии в алфавитном порядке
7 млн. фамилий
Windows Help формат, CHM + RARSFX (2 мб) Скачать
Образец текста
Словарь иностранных слов
19 тыс. слов, этимология
Windows Help формат, CHM + RARSFX (3,2 мб) Скачать
Образец текста
Словарь церковных терминов
346 терминов
Windows Help формат, CHM + RAR (52 кб) Скачать
Образец текста
Язык русской деревни
24 карты с пояснениями и примерами
Windows Help формат, CHM + RAR (1526 кб) Скачать
Образец текста
Правила русской орфографии и пунктуации 1956 г.
Windows Help формат, CHM + RARSFX (128 кб) Скачать
Образец текста
Культура русской речи
Культура русской речи. Учебник для вузов. Под ред. проф. Л.К.Граудиной и проф. Е.H.Ширяева.
Словарь омонимичных словоформ
Ж.Г.Аношкина. Словарь омонимичных словоформ русского языка. Москва, 2001.
Полная акцентуированная парадигма по А.А.Зализняку
86839 статей, 2645347 форм
TXT + RAR (5961 кб) Скачать
Образец текста
Правила транскрипции иностранных имен
23 языка
Ермолович Д. И.
Имена собственные на стыке языков и культур: Заимствование и передача имен собственных с точки зрения лингвистики и теории перевода. (С приложением правил практической транскрипции имен с 23 иностранных языков, в том числе таблиц слоговых соответствий для китайского и японского языков.) — М.: «Р. Валент», 2001.
- 1. Настоящий сайт носит информационный характер и служит для выбора нужного словаря.
Толковые и орфоргафические словари Даля, Ожегова, Ушакова, Ефремовой, Зализняка и мн. др.
Специально для стихосложения служат обратные словари (рифм), словари синонимов и другие.
Кроме того, словари литературы, иностранных слов, пословиц, фамилий, грамматика и мн. др.
2. Ссылки для скачивания файлов словарей на этом сайте не действуют (заблокированы).
3. Ссылки для просмотра образцов текстов словарей работают и ими можно пользоваться.
4. Для приобретения необходимого словаря пишите (получение в течение суток) iaa@tut.by
5. Сборный пакет 60 материалов для поэта, писателя, литератора — смотрите таблицу внизу.
Объединенный пакет материалов для поэта, писателя, литератора ($80.00) |