Лингвистический анализ: BIG DATA. Вся технология в одной книге (Андреас Вайгенд)


- BIG DATA. Вся технология в одной книге (пер. С. М. Богданов) (и.с. top business awards) 4.16 Мб, 404с. скачать: (fb2) (исправленную)  читать: (полностью)  - Андреас Вайгенд

Общая статистика

Длина текста726236 знаков
Длина диалогов0 знаков
Слов в произведении (СВП)96075 слов
Приблизительно страниц404 стр.
Средняя длина слова6.18 знаков
Предложений в произведении (ПВП)5364 предл.
Средняя длина предложения (СДП)132.44 знаков
Доля диалогов в тексте0.00 %
Доля авторского текста100 %
СДП диалогов0.00 знаков
СДП авторского текста119.08 знаков

Активный словарный запас

Использовано уникальных слов22045
Активный словарный запас (АСЗ)17497
Активный не словарный запас (АНСЗ)4548
Удельный АСЗ на 3000 слов текста1596.89126108 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4187.82103483 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 422868: BIG DATA. Вся технология в одной книге (Андреас Вайгенд)
Максимальный УАСЗ-3000 (1726) наблюдается примерно на 59 странице
Минимальный УАСЗ-3000 (1437) наблюдается примерно на 391 странице
Рост АСЗ книги № 422868: BIG DATA. Вся технология в одной книге (Андреас Вайгенд)

Буквы и знаки препинания

Всего букв516864 букв
Всего знаков препинания20161 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 10160105.75
. 617764.29
- 218022.69
? 2963.08
! 230.24
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 00.00
" 00.00
() 3964.12
: 8098.42
; 1201.25
БукваКол-во (шт.)Частота использования (в %)
А388337.51
Б78761.52
В228454.42
Г68441.32
Д148892.88
Е-Ё435178.42
Ж68441.32
З91871.78
И-Й485949.40
К152662.95
Л204623.96
М176753.42
Н361677.00
О5778111.18
П154342.99
Р243104.70
С266515.16
Т345796.69
У111312.15
Ф27030.52
Х56371.09
Ц37670.73
Ч76311.48
Ш27060.52
Щ20920.40
Ь-Ъ96931.88
Ы104602.02
Э17960.35
Ю39590.77
Я99571.93
Диаграма использования букв книги № 422868: BIG DATA. Вся технология в одной книге (Андреас Вайгенд)

Части речи

Определенных частей речи (ОЧР)81872 слов
Не определенных частей речи (НОЧР)14203 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.2955336.097
Глаг.489115.017
Мест.-сущ.48915.974
Предл.751412.596
Союз64208
Прилаг.75149.178
Нареч.38054.647
Местоим-прилаг.40824.986
Частица20022.445
Местоим. нареч.4910.600
Числит.3550.434
Числит-прилаг.1270.155
Междомет.190.023
Часть комп.
сложн. слова
50.006

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.104.3659.4113.9968.0743.5228.6516.4017.095.802.250.880.370.160.01
Глаг.42.1118.869.6530.0212.3613.527.808.985.260.730.600.230.020.01
Мест.-сущ.12.0318.352.723.986.854.135.471.623.900.550.120.010.000.00
Предл.69.743.1515.281.011.3217.701.6413.660.220.131.420.640.040.02
Союз22.4914.609.008.003.117.265.044.373.540.650.260.100.000.00
Прилаг.70.894.210.994.093.955.240.750.660.510.280.180.010.000.01
Нареч.4.3216.072.534.123.906.804.701.112.050.500.290.060.010.00
Местоим-прилаг.27.044.593.143.511.445.841.821.060.980.130.180.120.000.00
Частица3.139.471.482.360.931.712.241.121.210.620.180.010.000.00
Местоим. нареч.0.661.270.770.450.900.270.460.110.950.150.000.000.000.00
Числит.2.980.100.060.230.130.450.150.040.010.000.180.000.000.00
Числит-прилаг.1.030.070.070.110.000.200.000.020.010.000.040.000.000.00
Междомет.0.120.020.060.010.000.000.000.010.000.000.000.000.000.00
Часть комп.
сложн. слова
0.050.000.000.000.000.010.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.23.0033.2034.0534.0136.57
Глаг.7.5218.0421.0720.8318.34
Мест.-сущ.9.089.646.025.125.30
Предл.21.339.6610.7311.8811.74
Союз13.904.445.975.716.11
Прилаг.6.147.277.609.398.85
Нареч.8.385.245.414.564.69
Местоим-прилаг.6.955.824.254.745.11
Частица1.194.763.602.822.46
Местоим. нареч.1.670.900.630.280.26
Числит.0.310.510.440.540.45
Числит-прилаг.0.510.510.230.120.07
Междомет.0.020.020.000.000.05
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.35.2336.5836.3335.4636.16
Глаг.17.1016.2316.2815.2114.32
Мест.-сущ.4.584.454.785.695.84
Предл.12.7812.7311.9312.9412.75
Союз6.787.117.547.648.82
Прилаг.10.139.419.9410.169.64
Нареч.4.754.624.334.304.14
Местоим-прилаг.4.805.165.354.735.02
Частица2.512.352.292.552.10
Местоим. нареч.0.650.560.500.570.58
Числит.0.600.660.520.460.50
Числит-прилаг.0.050.100.120.260.11
Междомет.0.020.020.070.030.00
Часть комп.
сложн. слова
0.020.020.000.000.00

Номер слова в предложении
1112131415
Сущ.36.1134.8633.6434.1235.48
Глаг.14.6415.0715.4614.2314.59
Мест.-сущ.5.836.305.895.996.24
Предл.12.5712.8612.2313.5813.06
Союз8.468.668.488.599.11
Прилаг.10.0310.6110.5810.799.32
Нареч.4.173.605.224.283.81
Местоим-прилаг.4.784.434.794.895.27
Частица2.042.212.622.822.18
Местоим. нареч.0.660.600.430.390.49
Числит.0.410.600.490.230.38
Числит-прилаг.0.190.140.150.030.03
Междомет.0.060.030.030.030.03
Часть комп.
сложн. слова
0.030.030.000.030.00