Можно прийти к следующим упрощениям традиционного набора частей речи. Местоимения признаются классом семиотических и семантических вариантов и исключаются из области инвариантов. Они понятным образом делятся на субстантивные и адъективные. Причастия и деепричастия также расформировываются как отдельные классы и распределяются в области предикатов и атрибутов. Занимающие малый объем и обычно не слишком информативные в плане общей грамматической организации текста служебные части речи рассматриваются скопом. Наконец, поскольку просматривается заметная корреляция между употреблением в тексте адъективных и адвербиальных элементов, они зачисляются в один класс.
В результате возникает следующая четырехчленная система.
1. Субстантивы (S), а именно все имена существительные и все субстантивные местоимения.
2. Глаголы (V), а именно все личные формы глагола, инфинитивы, деепричастия и страдательные причастия в предикативной функции, типа повержен.
3. Адъективно-адвербиальные слова (A), а именно все прилагательные, адъективные местоимения, причастия, кроме страдательных в предикативной функции, и наречия.
4. Служебные части речи (X).
В подсчетах, предпринятых в рамках этой работы, частеречная принадлежность всех слов понималась по возможности буквально; все транспозиции, вроде субстантивации прилагательных, констатировались только в надежных случаях; все вторичные сращения, вроде вводных слов, рассматривались аналитически, поэлементно, а элементы, в свою очередь, по их исходной, буквальной частеречной принадлежности. Впрочем, общая доля всех этих спорных случаев не превышала один процент материала, и, будь принято какое-либо альтернативное решение, оно не слишком бы изменило итоговые показатели.
Гораздо более принципиально следующее решение. Для того чтобы, во-первых, но отнюдь не в главных, упростить процедуру подсчета, а во-вторых и в-главных, чтобы подчеркнуть и обнажить принцип игры с нулевой общей суммой, когда увеличение доли одного класса неизбежно сопровождается снижением доли остальных классов, всех или некоторых, был избран метод подсчета не по количеству слов, а по количеству слогов, занимаемых ими. Скажем, в онегинской строфе 118 слогов; если субстантивами занято 48, на долю глаголов, адъективно-адвербиальных и служебных слов остается 70 слогов и т. д.
Представляемые подсчеты основаны на корпусе из ста русских поэтических текстов XVIII–XX веков, шестидесяти двух поэтов от Ломоносова до Бродского[346]; автор исследования стремился составить репрезентативную выборку, на материале в сто текстов представляющую как бы саму русскую лирику в ее средоточии (это, кстати говоря, небезразлично для начального этапа работы: если некоторые закономерности работают на подобной сердцевине поэтической традиции, это уже что-нибудь да значит). В подобранном корпусе должны были бы встречаться тексты большого объема и миниатюры, образцы всех эпох в пределах выбранной и различных жанров, тексты, написанные различными размерами (в итоге 45 ямбических, 21 хореическое, 13 трехсложниками и 21 другими формами стиха). Было установлено только два фильтра: на явные грамматические эксперименты, что оправдано, так как изучается именно усредненная точка отсчета, и на тексты с обилием пространных рефренов, снижающих грамматическую репрезентативность текста – первое не пустило в корпус «Шепот, робкое дыханье…» Фета, которому бы иначе там быть, и все отчетливо авангардные тексты заумного типа.