Лингвистический анализ: Все лгут. Поисковики, Big Data и Интернет знают о вас всё (Сет Стивенс-Давидовиц)


- Все лгут. Поисковики, Big Data и Интернет знают о вас всё (пер. Л. И. Степанова) (и.с. it бестселлер) 4.5 Мб, 285с. скачать: (fb2) (исправленную)  читать: (полностью)  - Сет Стивенс-Давидовиц

Общая статистика

Длина текста512928 знаков
Длина диалогов0 знаков
Слов в произведении (СВП)71776 слов
Приблизительно страниц285 стр.
Средняя длина слова5.78 знаков
Предложений в произведении (ПВП)5095 предл.
Средняя длина предложения (СДП)97.76 знаков
Доля диалогов в тексте0.00 %
Доля авторского текста100 %
СДП диалогов0.00 знаков
СДП авторского текста105.12 знаков

Активный словарный запас

Использовано уникальных слов16475
Активный словарный запас (АСЗ)14273
Активный не словарный запас (АНСЗ)2202
Удельный АСЗ на 3000 слов текста1495.69426873 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3895.28361500 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 403400: Все лгут. Поисковики, Big Data и Интернет знают о вас всё (Сет Стивенс-Давидовиц)
Максимальный УАСЗ-3000 (1703) наблюдается примерно на 250 странице
Минимальный УАСЗ-3000 (1274) наблюдается примерно на 99 странице
Рост АСЗ книги № 403400: Все лгут. Поисковики, Big Data и Интернет знают о вас всё (Сет Стивенс-Давидовиц)

Буквы и знаки препинания

Всего букв391616 букв
Всего знаков препинания14597 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 7401103.11
. 486767.81
- 84011.70
? 5227.27
! 300.42
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 00.00
" 00.00
() 3595.00
: 5307.38
; 480.67
БукваКол-во (шт.)Частота использования (в %)
А292637.47
Б64291.64
В167474.28
Г59701.52
Д116652.98
Е-Ё335398.56
Ж59701.52
З63891.63
И-Й348448.90
К121933.11
Л165634.23
М133683.41
Н269506.88
О4354011.12
П108972.78
Р174144.45
С211045.39
Т256906.56
У85832.19
Ф12740.33
Х41591.06
Ц16940.43
Ч63921.63
Ш27690.71
Щ15800.40
Ь-Ъ74961.91
Ы89502.29
Э17360.44
Ю32780.84
Я71831.83
Диаграма использования букв книги № 403400: Все лгут. Поисковики, Big Data и Интернет знают о вас всё (Сет Стивенс-Давидовиц)

Части речи

Определенных частей речи (ОЧР)67419 слов
Не определенных частей речи (НОЧР)4357 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.2203532.684
Глаг.467615.374
Мест.-сущ.46766.936
Предл.608811.578
Союз53818
Прилаг.60889.030
Нареч.41146.102
Местоим-прилаг.36655.436
Частица20673.066
Местоим. нареч.6430.954
Числит.3720.552
Числит-прилаг.1440.214
Междомет.510.076
Часть комп.
сложн. слова
120.018

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.88.3355.0717.7757.0237.3623.3920.5314.986.593.711.130.530.330.09
Глаг.35.3818.8511.8129.8413.7814.1911.159.496.231.790.790.360.060.01
Мест.-сущ.10.2524.952.733.987.924.036.852.025.380.790.270.150.040.00
Предл.59.272.4214.211.741.9315.462.0615.540.280.161.790.740.150.03
Союз20.6312.8910.927.803.526.336.655.414.270.890.250.120.100.03
Прилаг.66.274.001.353.995.165.951.420.710.770.280.280.030.070.00
Нареч.6.7217.494.274.735.009.546.902.422.820.700.430.010.000.00
Местоим-прилаг.29.014.432.883.281.817.391.901.411.680.220.250.100.000.00
Частица3.9911.762.342.521.322.542.391.691.170.760.160.010.000.00
Местоим. нареч.1.191.560.960.561.680.560.920.471.380.220.010.010.000.00
Числит.3.780.210.040.180.190.590.150.150.090.000.090.040.000.00
Числит-прилаг.1.290.070.040.120.130.240.100.040.000.010.060.010.000.00
Междомет.0.620.030.030.010.010.010.000.010.000.000.000.000.000.01
Часть комп.
сложн. слова
0.090.000.000.010.000.070.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.16.4027.4629.3930.6331.69
Глаг.7.0719.7620.5219.7118.07
Мест.-сущ.13.9810.017.877.116.13
Предл.15.608.349.2710.9912.03
Союз18.346.256.605.666.92
Прилаг.4.816.077.808.838.77
Нареч.10.157.126.257.086.04
Местоим-прилаг.6.786.625.745.545.90
Частица2.836.034.692.973.09
Местоим. нареч.3.081.150.890.570.76
Числит.0.550.540.710.640.31
Числит-прилаг.0.380.590.200.210.24
Междомет.0.020.070.040.050.05
Часть комп.
сложн. слова
0.000.000.020.020.00

Номер слова в предложении
678910
Сущ.33.0033.8434.2832.0534.82
Глаг.16.8616.6115.4415.9713.79
Мест.-сущ.5.845.415.405.475.61
Предл.11.8912.8412.0013.3212.63
Союз7.236.348.158.008.14
Прилаг.9.449.779.6510.1410.07
Нареч.5.695.825.795.115.19
Местоим-прилаг.5.795.285.295.835.48
Частица2.362.732.493.002.60
Местоим. нареч.0.890.680.610.360.74
Числит.0.770.440.580.450.64
Числит-прилаг.0.170.100.220.150.19
Междомет.0.050.080.030.090.10
Часть комп.
сложн. слова
0.020.050.060.060.00

Номер слова в предложении
1112131415
Сущ.32.6832.6431.6832.9633.72
Глаг.14.1315.3714.9113.7614.14
Мест.-сущ.6.496.096.746.516.60
Предл.12.8012.3213.1013.0111.99
Союз7.508.528.348.527.59
Прилаг.10.469.7810.999.9310.21
Нареч.5.585.555.015.435.55
Местоим-прилаг.5.485.144.845.155.29
Частица3.242.892.613.043.04
Местоим. нареч.0.561.101.050.611.26
Числит.0.700.340.460.560.42
Числит-прилаг.0.310.110.170.370.16
Междомет.0.070.150.080.140.05
Часть комп.
сложн. слова
0.000.000.000.000.00