Лингвистический анализ: Google. Прошлое. Настоящее. Будущее (Джанет Лау)


- Google. Прошлое. Настоящее. Будущее 993 Кб, 295с. скачать: (fb2) (исправленную)  читать: (полностью)  - Джанет Лау

Общая статистика

Длина текста530546 знаков
Длина диалогов29239 знаков
Слов в произведении (СВП)72099 слов
Приблизительно страниц295 стр.
Средняя длина слова6.00 знаков
Предложений в произведении (ПВП)4193 предл.
Средняя длина предложения (СДП)123.58 знаков
Доля диалогов в тексте5.51 %
Доля авторского текста94.49 %
СДП диалогов171.00 знаков
СДП авторского текста99.53 знаков
Использование диалогов по тексту книги № 99997: Google. Прошлое. Настоящее. Будущее (Джанет Лау)
Максимальный фрагмент авторского текста - 81144 знаков (в страницах - примерно 45, начинается где-то с 148 страницы)

Активный словарный запас

Использовано уникальных слов18896
Активный словарный запас (АСЗ)16751
Активный не словарный запас (АНСЗ)2145
Удельный АСЗ на 3000 слов текста1632.97418847 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4391.49393267 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 99997: Google. Прошлое. Настоящее. Будущее (Джанет Лау)
Максимальный УАСЗ-3000 (1777) наблюдается примерно на 4 странице
Минимальный УАСЗ-3000 (1025) наблюдается примерно на 274 странице
Рост АСЗ книги № 99997: Google. Прошлое. Настоящее. Будущее (Джанет Лау)

Буквы и знаки препинания

Всего букв394985 букв
Всего знаков препинания14249 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 679594.25
. 510270.76
- 93312.94
? 1271.76
! 1321.83
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 00.00
" 290.40
() 5878.14
: 4185.80
; 1261.75
БукваКол-во (шт.)Частота использования (в %)
А309787.84
Б62201.57
В178544.52
Г63651.61
Д116632.95
Е-Ё337638.55
Ж63651.61
З61731.56
И-Й361279.15
К135743.44
Л161474.09
М133083.37
Н264506.70
О4300410.89
П122993.11
Р198445.02
С213525.41
Т260126.59
У90662.30
Ф13640.35
Х36480.92
Ц19240.49
Ч53381.35
Ш22950.58
Щ15400.39
Ь-Ъ65841.67
Ы74261.88
Э14290.36
Ю27230.69
Я71661.81
Диаграма использования букв книги № 99997: Google. Прошлое. Настоящее. Будущее (Джанет Лау)

Части речи

Определенных частей речи (ОЧР)65268 слов
Не определенных частей речи (НОЧР)6831 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.2246834.424
Глаг.389214.137
Мест.-сущ.38925.963
Предл.680612.272
Союз53488
Прилаг.680610.428
Нареч.30544.679
Местоим-прилаг.33625.151
Частица18552.842
Местоим. нареч.7111.089
Числит.2770.424
Числит-прилаг.2070.317
Междомет.160.025
Часть комп.
сложн. слова
350.054

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.95.6454.7914.6559.7143.8030.3215.5216.167.124.540.920.690.090.28
Глаг.37.3412.6910.0031.3212.6115.816.458.384.261.270.630.520.060.03
Мест.-сущ.12.5015.892.284.436.425.275.272.424.090.740.140.170.020.00
Предл.63.152.9115.341.391.5219.211.1614.690.210.461.321.290.000.06
Союз19.1215.328.218.923.837.038.294.584.521.700.180.180.030.02
Прилаг.79.102.941.044.464.379.651.030.660.510.140.200.030.030.12
Нареч.4.3116.072.795.153.636.163.521.852.510.430.290.050.020.02
Местоим-прилаг.23.406.313.003.291.817.282.161.122.080.690.200.170.000.00
Частица3.2611.671.102.971.721.982.331.271.130.780.140.050.000.02
Местоим. нареч.1.182.281.090.551.990.670.870.211.870.140.020.020.000.00
Числит.2.670.260.050.280.080.430.110.140.060.000.170.020.000.00
Числит-прилаг.1.980.230.050.250.120.380.060.020.030.020.050.000.000.00
Междомет.0.140.000.030.020.030.000.020.000.020.000.000.000.000.00
Часть комп.
сложн. слова
0.440.000.000.000.020.080.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.17.7830.1132.5734.7134.58
Глаг.7.6114.9717.7617.6417.37
Мест.-сущ.8.298.857.376.325.35
Предл.21.9310.5611.0412.0612.13
Союз15.406.156.657.396.41
Прилаг.5.056.388.328.749.97
Нареч.9.706.006.164.234.25
Местоим-прилаг.5.987.394.135.244.93
Частица3.366.694.622.392.71
Местоим. нареч.4.001.590.560.301.13
Числит.0.150.730.290.500.58
Числит-прилаг.0.590.510.390.440.55
Междомет.0.150.030.030.000.00
Часть комп.
сложн. слова
0.000.030.100.030.03

Номер слова в предложении
678910
Сущ.34.6034.9536.3133.4134.76
Глаг.16.8815.0115.0715.5513.99
Мест.-сущ.5.005.155.005.565.28
Предл.11.1112.8512.3112.7112.10
Союз8.097.927.947.608.40
Прилаг.9.5510.9410.2911.2411.14
Нареч.4.384.034.014.354.66
Местоим-прилаг.5.945.264.635.684.66
Частица2.222.272.462.013.16
Местоим. нареч.1.250.901.030.831.00
Числит.0.420.360.400.610.58
Числит-прилаг.0.380.290.440.300.27
Междомет.0.030.000.070.040.00
Часть комп.
сложн. слова
0.140.070.040.110.00

Номер слова в предложении
1112131415
Сущ.34.1533.4233.9734.3134.82
Глаг.13.0315.1215.3913.6214.61
Мест.-сущ.5.275.255.485.396.16
Предл.12.8312.5413.4011.5311.72
Союз8.418.568.058.888.30
Прилаг.10.7811.1410.8411.7612.52
Нареч.4.634.114.424.093.97
Местоим-прилаг.6.115.764.735.723.97
Частица2.822.332.172.742.38
Местоим. нареч.1.011.270.800.930.50
Числит.0.600.420.310.600.50
Числит-прилаг.0.360.080.180.370.45
Междомет.0.000.000.000.000.00
Часть комп.
сложн. слова
0.000.000.270.050.10