Лингвистический анализ: Толковый словарь живого великорусского языка (Владимир Даль)


- Толковый словарь живого великорусского языка (а.с. современное написание слов) 2.5 Мб, 1371с. скачать: (fb2) (исправленную)  читать: (полностью)  - Владимир Иванович Даль

Общая статистика

Длина текста2467647 знаков
Длина диалогов0 знаков
Слов в произведении (СВП)343145 слов
Приблизительно страниц1371 стр.
Средняя длина слова5.66 знаков
Предложений в произведении (ПВП)64614 предл.
Средняя длина предложения (СДП)35.22 знаков
Доля диалогов в тексте0.00 %
Доля авторского текста100 %
СДП диалогов0.00 знаков
СДП авторского текста37.29 знаков

Активный словарный запас

Использовано уникальных слов93116
Активный словарный запас (АСЗ)63299
Активный не словарный запас (АНСЗ)29817
Удельный АСЗ на 3000 слов текста1805.98131865 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста5268.81650 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста36321.0048219 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 129239: Толковый словарь живого великорусского языка (Владимир Даль)
Максимальный УАСЗ-3000 (2007) наблюдается примерно на 64 странице
Минимальный УАСЗ-3000 (1570) наблюдается примерно на 571 странице
Рост АСЗ книги № 129239: Толковый словарь живого великорусского языка (Владимир Даль)

Буквы и знаки препинания

Всего букв1923554 букв
Всего знаков препинания167750 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 81703238.10
. 64451187.82
- 355910.37
? 17004.95
! 4051.18
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 00.00
" 1670.49
() 30208.80
: 20525.98
; 1069331.16
БукваКол-во (шт.)Частота использования (в %)
А1554618.08
Б513992.67
В1083125.63
Г435962.27
Д560812.92
Е-Ё1446947.52
Ж435962.27
З339711.77
И-Й1550158.06
К716873.73
Л814674.24
М489002.54
Н1128405.87
О19427110.10
П483072.51
Р953154.96
С958174.98
Т1174196.10
У505172.63
Ф13100.07
Х170540.89
Ц74330.39
Ч295791.54
Ш155520.81
Щ92700.48
Ь-Ъ529512.75
Ы481982.51
Э14750.08
Ю104710.54
Я442392.30
Диаграма использования букв книги № 129239: Толковый словарь живого великорусского языка (Владимир Даль)

Части речи

Определенных частей речи (ОЧР)335315 слов
Не определенных частей речи (НОЧР)7830 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.14013141.791
Глаг.1047716.855
Мест.-сущ.104773.125
Предл.386809.765
Союз216316
Прилаг.3868011.535
Нареч.117983.518
Местоим-прилаг.70872.114
Частица122073.640
Местоим. нареч.21380.638
Числит.10180.304
Числит-прилаг.5300.158
Междомет.3190.095
Часть комп.
сложн. слова
370.011

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.179.6361.997.9746.8829.1349.2611.797.4719.432.310.980.620.410.06
Глаг.47.0346.687.2222.8815.5610.068.882.964.761.910.300.160.130.01
Мест.-сущ.6.549.391.213.072.572.221.620.723.410.280.110.040.050.01
Предл.67.251.558.060.802.3510.140.595.470.090.020.900.390.020.01
Союз23.2914.052.326.811.907.373.271.792.530.770.250.120.060.01
Прилаг.58.638.351.207.886.5726.962.240.782.160.260.160.110.040.01
Нареч.8.918.620.923.712.493.584.180.651.660.290.110.040.020.00
Местоим-прилаг.9.863.760.641.351.341.830.680.411.070.110.060.020.010.00
Частица12.2912.021.223.571.153.021.260.720.700.290.090.040.030.01
Местоим. нареч.1.161.710.350.431.180.290.490.110.500.120.020.000.010.00
Числит.1.960.200.060.110.110.410.060.040.020.010.040.010.000.00
Числит-прилаг.0.980.110.010.120.060.140.070.010.010.010.020.030.010.00
Междомет.0.320.120.050.050.100.030.040.020.060.000.000.000.160.00
Часть комп.
сложн. слова
0.060.000.000.000.000.030.010.010.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.44.7438.5636.8736.4136.34
Глаг.18.5117.7415.9116.9315.69
Мест.-сущ.2.673.813.763.163.58
Предл.8.1514.2112.6212.4313.24
Союз2.505.908.989.159.15
Прилаг.15.3810.6011.2810.7910.45
Нареч.3.012.973.653.593.73
Местоим-прилаг.1.481.832.182.632.72
Частица2.073.113.103.233.57
Местоим. нареч.0.600.600.900.940.82
Числит.0.560.430.480.470.42
Числит-прилаг.0.110.110.180.150.16
Междомет.0.210.120.080.110.10
Часть комп.
сложн. слова
0.030.000.010.020.01

Номер слова в предложении
678910
Сущ.36.4637.1338.0737.1837.14
Глаг.15.7715.7615.4215.0115.48
Мест.-сущ.3.633.582.983.623.36
Предл.13.1013.0613.5712.8613.39
Союз8.628.398.329.198.86
Прилаг.10.5310.2310.4611.2510.62
Нареч.3.663.663.743.613.76
Местоим-прилаг.2.932.622.642.723.01
Частица3.713.813.363.012.72
Местоим. нареч.0.841.000.700.820.86
Числит.0.480.450.460.420.41
Числит-прилаг.0.190.190.190.200.26
Междомет.0.060.090.070.110.12
Часть комп.
сложн. слова
0.020.040.020.000.00

Номер слова в предложении
1112131415
Сущ.37.1238.6838.2439.4139.28
Глаг.14.8914.7513.8913.0613.69
Мест.-сущ.3.253.242.873.223.05
Предл.13.3112.7313.8414.0613.16
Союз8.749.609.088.389.29
Прилаг.11.4710.9211.9511.5011.43
Нареч.3.853.493.093.383.90
Местоим-прилаг.2.982.403.203.363.18
Частица2.692.522.401.981.57
Местоим. нареч.0.890.860.620.870.60
Числит.0.600.490.510.320.69
Числит-прилаг.0.150.240.260.370.09
Междомет.0.060.070.070.050.00
Часть комп.
сложн. слова
0.000.000.000.030.06