Исследованы квантитативные характеристики кумулятивного числа графем (Гр, КЧГр) частей и корпуса романа Л.Н. Толстого «Анна Каренина» [1-3] по методике Anthony L. [4] «гомогенности» (на русском языке введем понятие однородности) Гр [5] и последовательности КЧГр в отличие от работы [5], начиная с наибольшей величины [1-2]. Прежде всего, все Гр в романе и его частях были ранжированы, начиная с наибольшей величины, и рассчитаны относительные величины кумулятивной частоты (ОКЧГр). Полученные результаты приведены в табл. 1. Таблица 1. Кумулятивные и относительные кумулятивные числа графем частей и корпуса романа Л.Н. Толстого «Анна Каренина»
Гр КЧГр 1 ОКЧГр А-1 Гр КЧГр 2 ОКЧГр А-2 Гр КЧГр 3 ОКЧГр А-3 Гр КЧГр 4 ОКЧГр А-4 Гр КЧГр 5 ОкКЧГр А-5 А 28443 0,3195 А 30756 0,3194 А 32084 0,3176 А 21514 0,3171 А 29685 0,3175 О 34769 0,3905 О 37649 0,3910 О 39431 0,3903 О 26443 0,3898 О 36570 0,3912 Е 39978 0,4490 Е 43398 0,4507 Е 45529 0,4507 Е 30594 0,4510 Е 42202 0,4514 И 44540 0,5002 И 48261 0,5012 И 50765 0,5025 И 34102 0,5027 И 47146 0,5043 Н 48538 0,5451 Н 52646 0,5468 Н 55345 0,5478 Н 37328 0,5502 Н 51521 0,5511 С 52523 0,5899 С 56899 0,5910 С 59753 0,5915 С 40324 0,5944 С 55582 0,5945 Т 56163 0,6308 Т 60707 0,6305 Т 63861 0,6321 Т 43055 0,6346 Т 59417 0,6355 Л 59560 0,6689 Л 64434 0,6692 Л 67686 0,6700 Л 45670 0,6732 Л 63074 0,6747 Р 62899 0,7064 Р 68041 0,7067 Р 71510 0,7078 Р 48134 0,7095 Р 66581 0,7122 В 66117 0,7426 В 71372 0,7413 В 75076 0,7431 В 50568 0,7454 В 70035 0,7491 У 68245 0,7665 П 73764 0,7661 П 77556 0,7677 У 52215 0,7697 П 72249 0,7728 П 70362 0,7903 У 75976 0,7891 У 79917 0,7911 П 53855 0,7938 У 74377 0,7956 К 72352 0,8126 Д 78142 0,8116 Д 82263 0,8143 Д 55423 0,8169 Д 76413 0,8173 М 74331 0,8348 М 80267 0,8337 М 84548 0,8369 М 56981 0,8399 М 78448 0,8391 Д 76305 0,8570 К 82384 0,8557 К 86743 0,8586 К 58281 0,8591 К 80309 0,8590 Я 77969 0,8757 Я 84236 0,8749 Я 88646 0,8775 Я 59540 0,8776 Я 82034 0,8775 Ь 79426 0,8921 Ь 85811 0,8913 Ь 90275 0,8936 Ь 60636 0,8938 Ь 83543 0,8936 Ы 80692 0,9063 Ы 87236 0,9061 Ы 91781 0,9085 З 61590 0,9078 Ы 84886 0,9080 З 81831 0,9191 З 88488 0,9191 З 93136 0,9219 Ы 62540 0,9218 З 86118 0,9212 Б 82898 0,9311 Б 89637 0,9310 Б 94349 0,9339 Б 63299 0,9330 Б 87217 0,9329 Г 83872 0,9420 Г 90712 0,9422 Г 95417 0,9445 Г 64053 0,9442 Г 88195 0,9434 Ш 84727 0,9516 Ш 91643 0,9518 Ч 96346 0,9537 Ч 64681 0,9534 Ш 89070 0,9527 Ч 85540 0,9607 Й 92479 0,9605 Ш 97260 0,9627 Ж 65291 0,9624 Ж 89907 0,9617 Ж 86302 0,9693 Ч 93306 0,9691 Ж 98107 0,9711 Ш 65892 0,9713 Ч 90741 0,9706 Й 87038 0,9775 Ж 94126 0,9776 Й 98923 0,9792 Й 66438 0,9793 Й 91489 0,9786 Х 87699 0,9850 Х 94857 0,9852 Х 99647 0,9864 Ю 66892 0,9860 Ю 92151 0,9857 Ю 88332 0,9921 Ю 95531 0,9922 Ю 10031 0,9929 Х 67293 0,9919 Х 92805 0,9927 Щ 88590 0,9950 Щ 95848 0,9955 Щ 10062 0,9960 Щ 67501 0,9950 Щ 93081 0,9956 Ц 88832 0,9977 Ц 96096 0,9981 Ц 10083 0,9981 Ц 67695 0,9978 Ц 93313 0,9981 Ф 88962 0,9992 Ф 96203 0,9992 Ф 10093 0,9991 Ф 67781 0,9991 Ф 93415 0,9992 Э 89001 0,9996 Э 96246 0,9996 Ъ 10098 0,9996 Э 67813 0,9996 Э 93455 0,9996 Ъ 89037 1 Ъ 96282 1 Э 10102 1 Ъ 67842 1 Ъ 93489 1
Продолжение табл. 1.
Гр КЧГр 6 ОКЧГр А-6 Гр КЧГр 7 ОКЧГр А-7 Гр КЧГР А-8 ОКЧГр А-8 Гр КЧГр Корпус ОКЧГр Корпус А 29488 0,3190 А 24445 0,3183 А 15733 0,3196 А 117505 0,3227 О 36128 0,3908 О 30030 0,3910 О 19325 0,3926 О 142806 0,3921 Е 41611 0,4502 Е 34663 0,4513 Е 22373 0,4545 Е 164797 0,4525 И 46374 0,5017 И 38587 0,5024 И 24919 0,5062 И 183793 0,5047 Н 50483 0,5461 Н 42037 0,5473 Н 27177 0,5521 Н 200595 0,5508 С 54434 0,5889 С 45396 0,5910 С 29303 0,5952 С 216185 0,5936 Т 58109 0,6286 Т 48536 0,6319 Т 31283 0,6355 Т 230522 0,6330 Л 61681 0,6673 Л 51470 0,6701 Л 33113 0,6726 Р 244339 0,6709 Р 65139 0,7047 Р 54368 0,7079 Р 34913 0,7092 Л 257605 0,7073 В 68435 0,7404 В 57146 0,7440 В 36707 0,7456 В 270840 0,7437 П 70712 0,7650 П 59086 0,7693 У 37833 0,7685 П 279865 0,7685 У 72884 0,7885 У 60868 0,7925 М 38958 0,7914 У 288366 0,7918 Д 74989 0,8113 Д 62615 0,8152 Д 40082 0,8142 М 296454 0,8140 М 77093 0,8340 М 64302 0,8372 П 41179 0,8365 К 304395 0,8358 К 79150 0,8563 К 65856 0,8574 Я 42149 0,8562 Д 311919 0,8565 Я 80889 0,8751 Я 67309 0,8763 К 43073 0,875 Я 318800 0,8754 Ь 82436 0,8918 Ь 68605 0,8932 Ы 43799 0,8897 Ы 324327 0,8905 Ы 83814 0,9067 Ы 69683 0,9072 Ь 44518 0,9043 Ь 329812 0,9056 З 85045 0,9200 З 70760 0,9213 З 45172 0,9176 З 334773 0,9192 Б 86136 0,9318 Б 71623 0,9325 Б 45775 0,9298 Б 339023 0,9309 Г 87122 0,9425 Г 72473 0,9436 Г 46368 0,9419 Г 342853 0,9414 Ш 88052 0,9526 Ш 73192 0,9529 Ш 46840 0,9515 Ш 346600 0,9517 Ч 88895 0,9617 Ч 73889 0,9620 Ч 47282 0,9605 Ч 349794 0,9605 Ж 89698 0,9704 Ж 74584 0,9711 Й 47709 0,9691 Й 352872 0,9689 Й 90486 0,9789 Й 75216 0,9793 Ж 48134 0,9778 Ж 355788 0,9769 Х 91178 0,9864 Х 75734 0,9860 Х 48504 0,9853 Ю 358553 0,9845 Ю 91779 0,9929 Ю 76249 0,9927 Ю 48825 0,9918 Х 361184 0,9918 Щ 92054 0,9959 Щ 76483 0,9958 Щ 48998 0,9953 Щ 362503 0,9954 Ц 92274 0,9982 Ц 76667 0,9982 Ц 49123 0,9978 Ц 363444 0,9980 Ф 92357 0,9991 Ф 76742 0,9991 Ф 49181 0,999 Ф 363915 0,9992 Ъ 92397 0,9996 Э 76780 0,9997 Ъ 49207 0,9996 Э 364056 0,9996 Э 92436 1 Ъ 76807 1 Э 49229 1 Ъ 134 1 Где ОКЧГр – относительное кумулятивное число Гр
Полученные результаты по однородности и последовательности КЧГр в романе Л.Н. Толстого «Анна Каренина» приведены в табл. 2, начиная с наибольшей величины.
Таблица 2. Однородности и последовательности кумулятивного числа графем в романе Л.Н. Толстого «Анна Каренина»
Части романа 1 2 3 4 5 6 7 8 9 10 11 12 АК-1 2 0,3193-0.3903 А,О 1 0,4525 Е 3 0,5000-0,5896 И.Н.С 2 0,6304-0,6686 Т.Л АК-2 2 0,3194-0,3910 А,О 1 0,4488 Е 3 0,5012-0,5910 И.Н.С 2 0,6305-0,6692 Т.Л АК-3 2 0,3176-0,3903 А,О 1 0,4507 Е 3 0,5025-0,5915 И.Н.С 2 0,6321-0,6700 Т.Л АК-4 2 0,3171-0,3898 А,О 1 0,4510 Е 3 0,5027-0,5944 И.Н.С 2 0,6346-0,6732 Т.Л АК-5 2 0,3175-0.3912 А,О 1 0,4514 Е 3 0,5043-0,5945 И.Н.С 2 0,6356-0,6747 Т.Л АК-6 2 0,3187-0,3914 А,О 1 0,4506 Е 3 0,5021-0,5892 И.Н.С 2 0,6289-0,6676 Т.Л АК-7 2 0,3180-0.3910 А,О 1 0,4513 Е 3 0,5024-0,5910 И.Н.С 2 0,6319-0,6701 Т.Л АК-8 2 0,3196-0,3926 А,О 1 0,4545 Е 3 0,5062-0,5952 И.Н.С 2 0,6355-0,6726 Т.Л АК-9 Корпус 2 0,3196-0,3926 А,О 1 0,4525 Е 3 0,5047-0,5936 И.Н.С 2 0,6330-0,6709 Т.Л
Где 1, 4, 7, 10, 13, 16, 19 – N* – число Гр , 2, 5, 8, 11, 14, 17, 20 – Интервал 1, 4, 7, 10, 13, 16, 19 для однородности ОКЧГр; 3, 6, 9, 12. 15, 18, 21 – последовательность КЧГр
Продолжение табл.1.
Части романа 13 14 15 16 17 18 19 20 21 АК-1 4 0,7060 -0,7900 Р,В,У,П 5 0,8121-0,8916 К,М,Д,Я,Ь 15 0,9060 0,9994 Ы,З,Б,Г,Ш,Ч,Ж,Й,Х,Ю,Щ,Ц,Ф,Э,Ъ АК-2 4 0,7070-0,7890 Р,В,П,У 5 0,8116-0,8936 Д,М,К,Я,Ь 13 0,9060-0,9996 Ы,З,Б,Г,Ш,Й,Ч,Ж,Х,Ю,Щ,Ц,Ф АК-3 4 0,7078-0,7911 Р,В,П,У 5 0,8143-0,8912 Д,М,К,Я,Ь 14 0,9085-0,9996 З,Ы,Б,Г,Ч,Ж,Ш,Й,Ю,Х,Щ,Ц,Ф,Э АК-4 4 0,7095-0,7938 Р,В,У,П 5 0,8170-0,8940 Д,М,К,Я,Ь 14 0,9078-0,9996 З,Ы,Б,Г,Ч,Ж,Ш,Й,Ю,Х,Щ,Ц,Ф,Э АК-5 4 0,7120-0,7960 Р,В,П,У 5 0,8173-0,8936 Д,М,К,Я,Ь 14 0,9080-0,9996 Ы,З,Б,Г,Ш,Ж,Ч,Й,Ю,Х,Щ,Ц,Ф,Э АК-6 4 0,7149-0,7887 Р,В,П,У 5 0,8114-0,8919 Д,М,К,Я,Ь 14 0,9068-0,9996 Ы,З,Б,Г,Ш,Ч,Ж,Й,Х,Ю,Щ,Ц,Ф,Ъ АК-7 4 0,7080-0,7920 Р,В,П,У 5 0,8152-0,8932 Д,М,К,Я,Ь 14 0,9072-0,9996 Ы,З,Б,Г,Ш,Ч,Ж,Й,Х,Ю,Щ,Ц,Ф,Э АК-8 4 0,7092-0,7914 Р,В,У,М 5 0,8142-0,8997 Д,П,Я,К,Ы 13 0,9043-0,9996 Ь,З,Б,Г,Ш,Ч,Й,Ж,Х,Ю,Щ,Ц,Ф АК-9 Корпус 4 0,7073-0,7918 Р,В,У,М 5 0,8140-0,8997 Д,П,Я,К,Ы 15 0,9056-0,9996 Ь,З,Б,Г,Ш,Ч,Й,Ж,Х,Ю,Щ,Ц,Ф,Э,Ъ
Затем определены числа Гр в интервалах 0,30–0,39 (первый интервал), 0,44–0,45 (второй интервал), 0,50–0,59 (третий интервал), 0,63–0,67 (четвертый интервал), 0,70–0,79 (пятый интервал), 0,80–0,89 (шестой интервал) и 0,90–0,99 (седьмой интервал). Далее каждому интервалу подобраны соответствующие Гр. Первому интервалу соответствует однородность двух Гр А и О, для второго интервала она отсутствует, для третьего интервала – три Гр И. Н. С, для четвертого интервала – две Гр Т и Л, для пятого интервала – четыре Гр Р, В, У, П с различной последовательностью, для шестого интервала – пять Гр К, М, Д, Я, Ь с различной последовательностью, для седьмого интервала – от 13 до 15 Гр Ы, З, Б, Г, Ш, Й, Ч, Ж, Х, Ю, Щ, Ц, Ф; Ы, З, Б, Г, Ш, Ч, Ж, Й, Х, Ю, Щ, Ц, Ф, Э, Ъ и Ь, З, Б, Г, Ш, Ч, Й, Ж, Х, Ю, Щ, Ц, Ф, Э, Ъ также с различной последовательностью. В этом случае последовательность и однородность Гр в каждом интервале будет неодинакова. Однородность КЧГр наблюдается для первого, третьего и четвертого интервалов (2, 3, 2), а для пятого – седьмого интервалов только для 4, 5, 13, 14 и 15 Гр. Причем последовательность и однородность КЧГр в частях и в корпусе романа будет отличной от распределения Бредфорда по трем зонам (табл. 2). Таблица 2. Распределение частоты кумулятивных графем частей и корпуса романа Л.Н. Толстого «Анна Каренина» по трем неравномерным зонам Бредфорда
Л.Н. Толстой «Анна Каренина» Распределение частоты кумулятивных графем по трем неравномерным зонам Бредфорда Текст I-я зона N* II-я зона N* III-я зона N* Часть 1 А,О,Е,И,Н,С 6 Т,Л,Р,В,У,П,К,М,Д,Я,Ь,Ы,З,Б,Г,Ш,Ч,Ж 18 Й,Х,Ю,Щ,Ц,Ф,Э,Ъ 8 Часть 2 А,О,Е,И,Н,С 6 Т,Л,Р,В,П,У,Д,М,К,Я,Ь,Ы,З,Б,Г,Ш,Й,Ч 18 Ж,Х,Ю,Щ,Ц,Ф,Э,Ъ 8 Часть 3 А,О,Е,И,Н,С 6 Т,Л,Р,В,П,У,Д,М,К,Я,Ь,Ы,З,Б,Г,Ч,Ш,Ж 18 Й,Х,Ю,Щ,Ц,Ф,Ъ,Э 8 Часть 4 А,О,Е,И,Н,С,Т 7 Л,Р,В,У,П,Д,М,К,Я,Ь,З,Ы,Б,Г,Ч,Ж,Ш,Й 18 Ю,Х,Щ,Ц,Ф,Э,Ъ 7 Часть 5 А,О,Е,И,Н,С 6 Т,Л,Р,В,П,У,Д,М,К,Я,Ь,Ы,З,Б,Г,Ш,Ж,Ч 18 Й,Ю,Х,Щ,Ц,Ф,Э,Ъ 8 Часть 6 А,О,Е,И,Н,С 6 Т,Л,Р,В,П,У,Д,М,К,Я,Ь,Ы,З,Б,Г,Ш,Ч,Ж 18 Й,Х,Ю,Щ,Ц,Ф,Ъ,Э 8 Часть 7 А,О,Е,И,Н,С 6 Т,Л,Р,В,П,У,Д,М,К,Я,Ь,Ы,З,Б,Г,Ш,Ч,Ж 18 Й,Х,Ю,Щ,Ц,Ф,Э,Ъ 8 Часть 8 А,О,Е,И,Н,С 6 Т,Л,Р,В,У,М,Д,П,Я,К,Ы,Ь,З,Б,Г,Ш,Ч,Й 18 Ж,Х,Ю,Щ,Ц,Ф,Ъ,Э 8 Корпус А,О,Е,И,Н,С 6 Т,Р,Л,В,П,У,М,К,Д,Я,Ы,Ь,З,Б,Г,Ш,Ч 17 Й,Ж,Ю,Х,Щ,Ц,Ф,Э,Ъ 9 *Где N* – число последовательных кумулятивных Гр
В этом случае наблюдается объединение Гр в более компактные группы по зонам с увеличением КЧГр и изменением их последовательности А, О, Е, И, Н, С (частей 1-3 и 5- корпуса для I-й зоны), с однородностью 6; Т, Л, Р, В, У, П, К, М, Д, Я, Ь, Ы, З, Б, Г, Ш, Ч, Ж; Т, Л, Р, В, П, У, Д, М, К, Я, Ь, Ы, З, Б, Г, Ш, Й, Ч; Л, Р, В, У, П, Д, М, К, Я, Ь, З, Ы, Б, Г, Ч, Ж, Ш, Й; Т, Л, Р, В, П, У, Д, М, К, Я, Ь, Ы, З, Б, Г, Ш, Ж, Ч; Т, Л, Р, В, П, У, Д, М, К, Я, Ь, Ы, З, Б, Г, Ш, Ч, Ж; Т, Л, Р, В, У, М, Д, П, Я, К, Ы, Ь, З, Б, Г, Ш, Ч, Й (частей 1-8 II-й зоны) с однородностью 17-18 и Й, Х, Ю, Щ, Ц, Ф, Э, Ъ; Ж, Х, Ю, Щ, Ц, Ф, Э, Ъ; Й, Х, Ю, Щ, Ц, Ф, Ъ, Э ( частей 1-3 и 5-8 III-й зоны). Моделирование КЧГр частей и корпуса романа по линейному уравнению и полиному третьей степени представлены в табл. 3. Таблица 3. Моделирование КЧГр частей и корпуса романа по линейному уравнению и полиному третьей степени Линейное уравнение y= ax+b Полином третьей степени y= ax3+ ax2+bx+c Части романа aх b R2 aх3 aх2 bx c R2 1 0,0295 0,2061 0,9321 -3·10-6 -0,0008 0,0593 0,0319 0,9996 2 0,0295 0,2063 0,9332 -3·10-6 -0,0008 0,0588 0,0341 0,9997 3 0,0315 0,1866 0,9459 -5·10-6 -0,0008 0,0590 0,0333 0,9992 4 0,0294 0,2109 0,9288 -2·10-6 -0,0009 0,0609 0,0298 0,9997 5 0,0294 0,2127 0,9286 -3·10-7 -0,0010 0,0617 0,0290 0,9996 6 0,0296 0,2059 0,9330 -5·10-6 -0,0007 0,0581 0,0353 0,9997 7 0,0295 0,2085 0,9306 -3·10-6 -0,0008 0,0597 0,0320 0,9997 8 0,0293 0,2109 0,9328 -1·10-6 -0,0009 0,0601 0,0347 0,9998 9 корпус 0,0294 0,2097 0,9326 -2·10-6 -0,0009 0,0597 0,0347 0,9997
Однородности по линейному уравнению y = ax+b для исходного КЧГр (величина ax) и по величине b были получены для 1-2, 4-8 частей и корпуса романа с высоким коэффициентом корреляции R2 от 0,9286 до 0,9459, а по полиному третьей степени – по величине свободного члена с – для частей 1-3, 6-8 и корпуса романа также с высоким коэффициентом корреляции R2 от 0,9992 до 0,9998. Отметим, что неоднородность КЧГр в частях и корпусе романа не очень большая. Таким образом, последовательность и однородность КЧГр в каждом интервале будет неодинакова, однородность числа КЧГр наблюдается для первого, третьего и четвертого интервалов (2, 3, 2), а для пятого – седьмого интервалов только для 4, 5, 13, 14 и 15 КЧГр. Причем, последовательность и однородность КЧГр в частях романа и его корпуса будут отличаться от распределения Бредфорда по трем зонам. Однородности для исходного КЧГр (величина ax) и по величине b по линейному уравнению y = ax+b были выявлены для 1-2, 4-8 частей и корпуса романа с высоким коэффициентом корреляции R2 от 0,9286 до 0,9459, а по полиному третьей степени – по величине свободного члена с – для частей 1-3, 6-8 и корпуса романа также с высоким коэффициентом корреляции R2 от 0,9992 до 0,9998. Применение методик [5] и ОКЧГр, начиная с наибольшей величины, могут дать новые результаты по исследованию свойств Гр.
Литература
1. Климов Ю.Н. КВАНТИТАТИВНЫЕ ХАРАКТЕРИСТИКИ РОМАНА Л.Н. ТОЛСТОГО «АННА КАРЕНИНА». ЧАСТЬ 1.... ВНЕ РАЗДЕЛОВ оригинал: 13-12-2015 12:15 2. Klimov Yu.N. QUANTITATIVE CHARACTERISTICS OF NOVEL L.N. TOLSTOY "ANNA КАRЕNINА". THE PART 1. THE GENERAL QUANTITATIVE CHARACTERISTICS AND THEIR MODELING //www.IntellectualArchive.com.: Dec. 16, 2015, 06:45:01 №1655 3. Толстой Л.Н. Анна Каренина. URL: http://modernlib.ru/books/tolstoy_ lev_nikolaevich/anna_karenina/ 4. Anthony L. AntConc: Design and Development of Freeware Corpus Analysis Toolkit for the Technical Writing Classroom. // IEEE International Professional Conference Proceedings, 2005. Рр .729-737. 5. Kelih E. Zur Homogenität von Graphemhäufigkeiten in Texten: Evidenz aus dem Russischen. // Методи аналiзу тексту: Збiрник науковых праць. - Чернiвцi: ЧНУ. 2009.
ДЕСКРИПТОРЫ: однородность, неоднородность, кумулятивное число графем, относительное кумулятивное число графем, моделирование, линейное уравнение, полином третьей степени, Анна Каренина, Л.Н. Толстой, квантитативная лексикология, части романа, корпус романа, ранжирование графем, относительное кумулятивное число графем.
|