Лингвистический анализ: Собрание юмористических рассказов в одном томе (Антон Чехов)


- Собрание юмористических рассказов в одном томе (и.с. Собрание в одном томе) 3.9 Мб, 1000с. скачать: (fb2) (исправленную)  читать: (полностью)  - Антон Павлович Чехов

Общая статистика

Длина текста1799300 знаков
Длина диалогов794639 знаков
Слов в произведении (СВП)281498 слов
Приблизительно страниц1000 стр.
Средняя длина слова5.01 знаков
Предложений в произведении (ПВП)25731 предл.
Средняя длина предложения (СДП)67.34 знаков
Доля диалогов в тексте44.16 %
Доля авторского текста55.84 %
СДП диалогов115.65 знаков
СДП авторского текста92.47 знаков
Использование диалогов по тексту книги № 337792: Собрание юмористических рассказов в одном томе (Антон Чехов)
Максимальный фрагмент авторского текста - 17253 знаков (в страницах - примерно 10, начинается где-то с 478 страницы)

Активный словарный запас

Использовано уникальных слов46440
Активный словарный запас (АСЗ)43680
Активный не словарный запас (АНСЗ)2760
Удельный АСЗ на 3000 слов текста1513.72438080 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4098.37386870 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста23504.4459613 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 337792: Собрание юмористических рассказов в одном томе (Антон Чехов)
Максимальный УАСЗ-3000 (1781) наблюдается примерно на 792 странице
Минимальный УАСЗ-3000 (1356) наблюдается примерно на 369 странице
Рост АСЗ книги № 337792: Собрание юмористических рассказов в одном томе (Антон Чехов)

Буквы и знаки препинания

Всего букв1405385 букв
Всего знаков препинания70937 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 34663123.14
. 1715260.93
- 382213.58
? 392513.94
! 884531.42
... 00.00
!.. 2770.98
?.. 470.17
!!! 280.10
?! 750.27
" 00.00
() 5882.09
: 12244.35
; 2911.03
БукваКол-во (шт.)Частота использования (в %)
А1183768.42
Б246211.75
В608464.33
Г269571.92
Д441443.14
Е-Ё1211778.62
Ж269571.92
З239411.70
И-Й1123978.00
К508143.62
Л663464.72
М432403.08
Н868816.18
О14790410.52
П403052.87
Р578574.12
С709935.05
Т882986.28
У436563.11
Ф25470.18
Х129130.92
Ц54660.39
Ч237531.69
Ш140761.00
Щ42850.30
Ь-Ъ281252.00
Ы258221.84
Э36470.26
Ю95860.68
Я310952.21
Диаграма использования букв книги № 337792: Собрание юмористических рассказов в одном томе (Антон Чехов)

Части речи

Определенных частей речи (ОЧР)279993 слов
Не определенных частей речи (НОЧР)1505 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.7446626.596
Глаг.2915119.666
Мест.-сущ.2915110.411
Предл.1766210.154
Союз261339
Прилаг.176626.308
Нареч.136044.859
Местоим-прилаг.121644.344
Частица152325.440
Местоим. нареч.44611.593
Числит.20160.720
Числит-прилаг.6740.241
Междомет.9200.329
Часть комп.
сложн. слова
160.006

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.56.8263.7019.9730.0338.9114.6511.1810.8712.044.082.000.541.150.01
Глаг.42.6625.2125.3535.5823.519.5110.608.2810.433.431.140.300.670.01
Мест.-сущ.17.0529.338.5510.267.366.018.253.9610.312.220.450.130.230.00
Предл.54.781.7717.740.881.5810.530.7310.580.250.091.610.960.050.01
Союз15.7023.6314.289.034.355.056.133.458.352.620.410.120.210.01
Прилаг.36.745.812.042.705.086.161.361.141.290.410.150.030.160.01
Нареч.5.6716.153.734.954.852.933.891.263.840.730.360.090.140.00
Местоим-прилаг.21.444.722.981.901.355.001.341.302.350.670.290.080.050.00
Частица6.7821.946.474.293.291.993.351.842.881.180.260.050.100.00
Местоим. нареч.1.773.092.271.262.300.731.380.462.190.370.080.020.030.00
Числит.4.300.680.280.380.200.370.200.060.170.030.440.070.020.00
Числит-прилаг.1.540.220.090.080.140.070.030.050.130.000.010.030.010.00
Междомет.0.670.420.360.190.430.070.160.210.190.110.010.000.480.00
Часть комп.
сложн. слова
0.040.000.000.000.000.010.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.21.3621.7523.6325.7826.05
Глаг.16.2222.2321.8821.6621.50
Мест.-сущ.14.4014.7012.5510.859.89
Предл.10.397.6810.219.759.99
Союз11.345.798.019.0710.00
Прилаг.4.354.995.396.176.12
Нареч.5.775.585.404.564.77
Местоим-прилаг.3.744.904.014.284.46
Частица7.088.726.165.414.68
Местоим. нареч.2.951.811.491.331.45
Числит.0.570.920.760.740.76
Числит-прилаг.0.210.430.280.240.19
Междомет.1.610.470.220.140.13
Часть комп.
сложн. слова
0.000.010.010.020.00

Номер слова в предложении
678910
Сущ.26.2926.2926.9326.4226.96
Глаг.20.3719.8218.9118.4619.15
Мест.-сущ.9.239.399.349.398.96
Предл.10.8211.1611.0811.3111.82
Союз10.4710.1310.8210.679.66
Прилаг.6.346.746.826.896.89
Нареч.4.754.634.264.574.24
Местоим-прилаг.4.274.584.194.614.61
Частица4.744.585.144.945.08
Местоим. нареч.1.521.501.331.431.45
Числит.0.760.720.720.830.81
Числит-прилаг.0.260.280.240.240.20
Междомет.0.190.160.220.220.17
Часть комп.
сложн. слова
0.010.010.010.000.00

Номер слова в предложении
1112131415
Сущ.27.0126.8526.9227.6327.30
Глаг.18.8018.4618.5618.0118.57
Мест.-сущ.9.589.039.168.868.91
Предл.11.4711.2511.6811.1310.58
Союз10.0810.269.6510.2210.38
Прилаг.6.656.817.637.717.24
Нареч.4.254.534.134.284.50
Местоим-прилаг.4.664.904.794.274.74
Частица4.895.274.915.224.88
Местоим. нареч.1.401.301.441.331.73
Числит.0.810.820.680.810.80
Числит-прилаг.0.220.330.200.220.17
Междомет.0.150.160.250.300.17
Часть комп.
сложн. слова
0.020.010.000.010.03