Но в то же самое время я все больше убеждался, что восприятие речи нельзя рассматривать как такую работу некоего сверхскоростного ухо-мозгового приемника, при которой стремительно анализируется поток фонем, раздельных, как звуки морзянки.
Одно время я стал было приверженцем «волновой» теории речи. Но потом пришел к новой и уже окончательной уверенности, что мы воспринимаем речь как некое переменное единство (переменное и во времени и по относительным значениям разных составляющих его элементов). Это единство охватывает и дискретные единицы — отдельные звуки, и непрерывные, транзиторные, т. е. переходные, процессы, и создаваемые теми и другими целостные «блоки» информации: слова, интонации, фразы.
В конце концов я разработал, частью сопоставляя и компилируя вычитанное и выученное, частью заново обдумывая то, что наблюдал сам, такую систему фонетико-физических представлений, которая, как мне казалось, лучше других могла помочь работе моих товарищей — инженеров и техников. Назвал я эту систему «речевые знаки русского языка».
1) ЧАСТОТНО-ЭНЕРГЕТИЧЕСКИЕ дискретные речевые знаки или фонемы. Их физические выражения — образующие, т. е. форманты.
2) ЧАСТОТНО-ВРЕМЕННЫЕ и АМПЛИТУДНО-ВРЕМЕННЫЕ транзиторные знаки «речевого лада», т. е. ударения, интонации, выразительные колебания громкости или мелодии речи. Их выражения — амплитуды звуковых колебаний, переходы основного тона.
3) ВРЕМЕННЫЕ ЗНАКИ: выразительные паузы, ускорения или замедления.
4) ЗРИМЫЕ речевые знаки: мимика, жесты.
Увлеченно, в иные часы и вовсе забывая обо всем вокруг, я изобретал велосипеды и открывал Америки либо строил собственные фантастические умозрительные схемы.
Звуковиды представляли речь прежде всего в двух измерениях: по времени (горизонтальная ось) и по частоте (вертикальная). Третье измерение энергия (амплитуда) выражалась только в степени потемнения отдельных участков.
Сергей сделал приспособление, позволяющее получать точечные — подобно картинам пуантелистов — спектрограммы, с тем чтобы по числу точек определять количество энергии, т. е. высоту соответствующей амплитуды. Но ему все не удавалось получить достаточно объективные и действительно измеримые показатели. Чем больше энергии, тем больше точек, и они сливались в пятна. Он разработал прибор, анализировавший спектр по частоте и амплитуде. Получались звуковиды мгновенных (не дольше ста миллисекунд) долек отдельных звуков речи. По горизонтали частота, по вертикали амплитуды.
Я стал мечтать о трехмерном изображении речи. И Сергей сделал несколько моделей. Десятка два «профильных» частотно-амплитудных спектрограмм выстраивались в ряд по оси времени и так создавали кусочек причудливого горного ландшафта. Но прочесть «трехмерное» слово оказывалось едва ли не труднее, чем по двухмерному звуковиду, а строить подобные модели было и хлопотно и трудоемко.