СПОСОБ МНОГОСТРУКТУРНЫХ, МНОГОУРОВНЕВЫХ ФОРМАЛИЗАЦИИ И СТРУКТУРИРОВАНИЯ ИНФОРМАЦИИ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО Российский патент 2017 года по МПК G06F17/00 G06F5/00 G10H1/00 

Описание патента на изобретение RU2612603C2

Область техники, к которой относится изобретение

Аспекты настоящего изобретения относятся к обработке информации для обеспечения формализации и структурирования, включая анализ аудиоданных, операции с ними и их представление, а конкретнее - к системам и способам структурного анализа и определения отношения между ценностью информации и качеством информации применительно к созданным с использованием гармоник данным, включая цифровые мультимедийные данные.

Уровень техники

Возможно, отсутствует общепризнанный стандарт, связанный с концепцией унифицированных аудиоданных или другой формализацией цифровых данных, хотя для его реализации могут быть использованы различные технологии. Например, некоторые технологии используют упрощенное аудиопредставление звукового сигнала, что прежде всего включает распознавание речи и синтез речи, а также сжатие цифровых данных, представляющих музыку. В одном из аспектов речевые технологии прогрессировали от представления звуковых сигналов через соответствующую форму волны, хотя такие технологии часто действуют на основе слов или даже целых фраз в речевых данных. Такая основа в виде слов и/или фраз представляет форму информации, более близкую к естественному восприятию человеческим мозгом. Напротив, технологии формализации, реализуемые для представления музыки, обычно используют только физически воспринимаемое представление информации, то есть в форме, близкой к форме физического восприятия звука человеческим ухом.

До сих пор другие попытки, направленные на более абстрактное универсальное представление музыки, остаются во многом безуспешными. Отсутствие успеха может быть связано, например, с тем фактом, что речевая информация включает форму первичного языка и синтаксис его описания, достроенные точной математикой, которая была установлена и прошла тонкую настройку многими поколениями. Напротив, существующие представления музыки, например основанные на нотах или звуковых образцах, являются относительно примитивными по сравнению с анализом речевой информации, и любое такое представление обычно не является повсеместно применимым.

В этом отношении одним из существующих относительно более информативных цифровых представлений звука может быть формат импульсно-кодовой модуляции (формат Pulse Code Modulation, PCM), обычно называемый несжатыми аудиоданными. Однако хотя этот формат может быть относительно более информативным, такая информативность нивелирована относительно большим размером файла данных, что, в свою очередь, может сделать этот формат или это представление неподходящим или непрактичным, например, для быстрой доставки, передачи и/или компактного хранения. Если такие свойства необходимы, использовались или используются более компактные, хотя, вероятно, менее информативные представления, обычно использующие популярные подходы к сокращению данных, например используемые в форматах МР3, OGG, аудиоданные среды Windows (Windows Media Audio, WMA) и других классических психоакустических моделях или представлениях. Однако естественные звуки включают больше избыточной информации, чем такие типичные представления и/или модели аудиосигналов способны эффективно анализировать. Кроме того, восприятие музыки человеком обычно намного сложнее любой существующей психоакустической модели. Соответственно, существует потребность в усовершенствованном подходе к формализации звука, способном представлять звук, аудиоданные, музыку и/или любые другие связанные с гармониками цифровые данные более компактно (то есть с обработкой меньших объемов данных) и более информативно (с точки зрения полноты представления, которая может быть обеспечена).

В попытках удовлетворить этот спрос были разработаны более прогрессивные представления и/или модели, которые используют в настоящее время, например в формате МР3-Pro; в формате высокоэффективной улучшенной аудиокодировки (НЕ ААС, High-Efficiency Advanced Audio Coding); в формате МРЗ PlusV; в формате синусоидальной кодировки стандарта Экспертной группы по движущемуся изображению-4 (Moving Picture Experts Group-4, SinuSoidal Coding, MPEG-4 SSC); в формате структурированных аудиоданных MPEG-4; и в формате цифрового интерфейса музыкальных инструментов (Musical Instrument Digital Interface, MIDI). МР3-Pro и HE ААС по существу используют особенности человеческого восприятия как основу для извлечения структурных элементов аудиосигнала без сохранения конкретной фазы и поиска сходства в сигнале. Низкие частоты накладывают на высокие частоты без сохранения фазы, но поддерживают принцип сходства и общие параметры звука, такие как сохранение энергии и хаотическая природа сигнала. Формат МР3-PlusV извлекает, хранит и вырабатывает гармоники без сохранения фазы и также может быть использован для определения высокочастотной части сигнала. MPEG-4 SSC представляет собой способ представления сигнала как набора организованных объектов, таких как гармоники, всплески и шум. Однако такой способ извлечения этих объектов из сигнала отличается от схемы восприятия, естественно осуществляющейся в человеческом мозге. Следовательно, воспроизведение сигнала из этих представления и/или модели может включать нежелательные артефакты. Формат структурированных аудиоданных MPEG-4 предпринимает попытку представить звук с помощью унифицированного алгоритма, способного вырабатывать различные звуковые структуры. Хотя этот подход может иметь некоторый потенциал, создание такого алгоритма может быть затруднительным из-за требуемых вычислительных ресурсов. Формат MIDI обычно требует относительно меньшего размера файла данных, однако, аналогично формату структурированных аудиоданных MPEG-4, является представлением и/или моделью, обычно подходящими для написания музыки вручную, а не для представления естественных звуков и/или уже созданных аудиокомпозиций.

Таким образом, существующие структурированные и объектно-ориентированные звуковые представления и/или модели, хотя и улучшаясь благодаря попыткам уменьшить или исключить имманентную избыточность восприятия аудиосигнала по сравнению с классическими психоакустическими способами или моделями, могут иметь тенденцию к потери объема информативности исходного сигнала при низкой скорости передачи (то есть при большом количестве информации), а следовательно, быть неспособными сохранять качество исходного аудиосигнала с приемлемым уровнем погрешности при создании звуковым представлением и/или моделью файла данных с меньшим размером. Соответственно, имеется потребность в схеме формализации и размещении цифровых мультимедийных данных, например аудиоданных, способных уменьшить количество информации или скорость передачи файла с цифровой информацией посредством подходящего структурирования, при этом удерживая ценность информации в пределах, заданных пороговым значением, или даже выше, чем в исходном файле с цифровой информацией.

Раскрытие изобретения

Вышеупомянутые и другие потребности удовлетворены аспектами настоящего изобретения, один из которых относится к использованию высокоорганизованных структур и параметров, например только показателей аудиосигнала. Еще один аспект включает способ последовательного роста различных звуковых структур из информационных примотронов или других элементов данных для создания сложных, но более компактных с точки зрения размера файла данных высокоинформативных структур.

Структуры уровней высокого порядка состоят из звуковых информационных примотронов, которые могут быть локализованы во времени, по частоте или иметь смешанную, то есть частотно-временную, локализацию. При этом такие информационные примотроны могут обеспечивать развитие или создание звука высокого порядка или других мультимедийных структур, включая фонемы для речевых сигналов. Локализованные во времени примотроны могут вырабатывать атаки и всплески и ритм высокого уровня по отношению к аудиоданным, а локализованные по частоте примотроны являются источником гармоник, модели обертонов высокого уровня и повторяющихся мелодий высокого уровня. Еще один аспект включает организацию сигнальных примотронов с образованием частотно-временных кластеров для дальнейших классификации и анализа. Еще один аспект настоящего изобретения направлен на повторяющееся использование некоторого количества саморегулирующихся способов анализа формализации аудиоданных для выработки конструктивного домена звуковой структуры для каждого частотно-временного кластера на каждом уровне иерархии информации и с необходимым уровнем погрешности исходного файла с цифровой информацией. Дальнейшие аспекты настоящего изобретения направлены на использование такой технологии формализации звука и/или аудиоданных, реализуемой благодаря обеспечению относительно высокого уровня информативности в сочетании с относительно низким размером файла данных, позволяемых аспектами раскрытой технологии.

Используемый здесь термин «примотрон» может быть определен как первичные представительные элементы данных или структуры данных, включающие многоструктурные многоуровневые объекты (объекты MSML) для цифровой формализации мультимедийных данных, таких как звук или аудиоданные, которые могут быть использованы для создания сложных, еще более компактных (с точки зрения размера файла данных) высокоинформативных структур. Структуры уровней высокого порядка звуковых информационных примотронов могут быть локализованы во времени, по частоте или иметь смешанную, то есть частотно-временную, локализацию. Локализованные во времени примотроны могут вырабатывать атаки и всплески и ритм высокого уровня по отношению к аудиоданным, а локализованные по частоте примотроны являются источником гармоник, модели обертонов высокого уровня и повторяющихся мелодий высокого уровня. В целом примотрон, определенный аспектами раскрытого здесь способа формализации, представляет конфигурацию или комбинацию по меньшей мере одного бита или элемента данных на различных уровнях и/или в различных измерениях матрицы битов файла с цифровыми аудиоданными, следовательно, этот файл может быть впоследствии представлен в виде комбинации таких примотронов, идентифицированных и/или иным образом определенных как подлежащие включению в нее. Развитие или «история жизни» этих конфигураций могут быть далее охарактеризованы с помощью принципов развития информации в динамической хаотической системе, определенной конечным числом структур, а именно примотронов, каждый из которых имеет свое «время жизни», которое может варьироваться от долей секунды до нескольких минут в пределах временной или частотно-временной длительности файла с цифровыми аудиоданными. Так как файл с цифровыми аудиоданными теперь представлен такой комбинацией или живой системой примотронов, каждый из которых представляет поднабор битов матрицы битов для другой структуры или объекта, связанных с этим файлом с цифровыми аудиоданными, файл с аудиоданными MSML, включающий идентифицированную комбинацию примотронов, может, например, иметь уменьшенный размер файла данных (количество информации) по сравнению с исходным файлом с оцифрованными аудиоданными с сохранением при этом качества информации файла с цифровыми аудиоданными в пределах, заданных пороговым значением восприятия исходного файла с цифровыми аудиоданными. Такие примотроны могут обеспечивать уменьшение количества информации или скорости передачи конкретного файла с цифровыми аудиоданными с сохранением при этом информативности этого файла в пределах, заданных пороговым значением восприятия исходного файла с цифровыми аудиоданными. Соответственно, такой формат высокоструктурированных, многофункциональных цифровых данных может быть приспособлен для очень компактного и эффективного хранения и воспроизведения любого материала, представленного в виде основанного на гармониках или созданного с использованием гармоник аудиосигнала с высокой верностью воспроизведения (включая музыку, голос и другие основанные на звуке мультимедийные данные высокого качества) в пределах, заданных пороговым значением исходного сигнала с цифровыми данными.

С другой стороны, аспекты настоящего изобретения предлагают системы и способы представления звуковой композиции в виде многоструктурной многоуровневой (Multi-Structural, Multi-Level, MSML) формализации, причем относительно высокий структурный уровень звуковой композиции может быть сконфигурирован как объединение элементов относительно низкого уровня звуковой композиции с использованием, например, критериев воспринимаемой информации (Perceptive Information Criteria, PIC). Критерии воспринимаемой информации считаются выполненными, например, если воспринимаемая информация некоторого уровня меньше, чем сумма ценностей информации независимых составляющих элементов этого уровня. Нулевой уровень определен как уровень, количество информации на котором эквивалентно «воспринимаемой энтропии». Уровни высокого порядка содержат звуковые информационные примотроны, или первичные звуковые структуры, которые могут быть локализованы во времени, локализованы по частоте и/или иметь смешанную локализацию. Информационные примотроны могут порождать звуковые структуры высокого порядка, которые могут включать фонемы для речевых сигналов. Локализованные во времени примотроны могут вырабатывать атаки и всплески и ритм высокого уровня. Локализованные по частоте примотроны могут быть связаны с источником гармоник, далее с моделями обертонов высокого уровня и далее с повторяющимися мелодиями высокого уровня. Будучи созданной, формализация MSML каждой звуковой композиции или сигнала может содержать формализацию MSML другой звуковой композиции или сигнала, трансформироваться в нее или с ней или быть по-другому объединенной с ней, создавая таким образом более сложные семантические структуры MSML высокого уровня.

В частности, аспекты настоящего изобретения предлагают способы и системы для структурирования информации. Эти способы и системы в целом включают анализ исходного файла с цифровой информацией для определения исходного количества информации и связанной с ним исходной ценности информации. Далее, применительно к исходному файлу с цифровой информацией используют исходный процесс манипуляции для создания первого результирующего файла с цифровой информацией. Затем применительно к первому результирующему файлу с цифровой информацией может быть использован последующий процесс манипуляции для создания второго результирующего файла с цифровой информацией. Каждый процесс манипуляции реализуют с обеспечением удаления по меньшей мере одного элемента обрабатываемого файла с цифровой информацией и/или представления комбинации множества элементов обрабатываемого файла с цифровой информацией посредством представительного элемента и первого индикатора, связанного с соотношением между представительным элементом и по меньшей мере одним из указанного множества элементов в комбинации, так что обеспечено уменьшение количества информации обрабатываемого файла с цифровой информацией и структурирование этого файла. Удаленный элемент и/или представительный элемент определяют с обеспечением уменьшения ценности информации обрабатываемого файла с цифровой информацией не ниже выбранного порогового значения относительно исходного файла с цифровой информацией. Эти процессы манипуляции последовательно используют применительно к предыдущему результирующему файлу с цифровой информацией до тех пор, пока последовательное использование процессов манипуляции не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией по сравнению с предыдущим результирующим файлом с цифровой информацией. Последний результирующий файл с цифровой информацией, таким образом, имеет первичную структуру с уменьшенным количеством информации относительно исходного количества информации и результирующую ценность информации в пределах, заданных выбранным пороговым значением исходной ценности информации.

В соответствии еще с одним аспектом, могут быть предложены системы и способы уменьшения полосы пропускания и скорости передачи аудиоданных с использованием интерфейса бесфазного кодирования (процесс манипуляции) для формализации MSML звуковой композиции, причем интерфейс выполнен с возможностью учета иерархии ценности воспринимаемой информации. Способ уменьшение полосы пропускания и скорости передачи использует этот интерфейс для выполнения заданий, имеющих целью уменьшение выбранных данных, при этом сохраняя информативность или ценность информации всех звуковых структур, связанных со звуковой композицией, например посредством сравнения с известными звуковыми показателями. Этот способ выполняет сравнение звуковых объектов различного уровня в пространстве, сосредотачиваясь на определении целостности структур и степени их повреждения в пределах уменьшенного количественного представления сигнала после фильтрации или использования процесса манипуляции, что обеспечивает выбор подходящего параметра для каждого звукового элемента. Интерфейс бесфазного кодирования соответственно выполнен таким образом, что зависимость сигнала от времени не сохраняется, и сохраняются звуковые структуры, а не форма волны сигнала, что приводит к существенному уменьшению полосы пропускания и скорости передачи. Для достижения большей скорости уменьшения полосы пропускания и скорости передачи аудиоданных структуры более информативного уровня формализации MSML звуковой композиции поддерживают постоянные параметры. Параметры структур относительно менее информативного уровня сохраняют с меньшей точностью или обобщают при декодировании с использованием случайных значений.

В соответствии еще с одним аспектом, могут быть предложены системы и способы структурного анализа аудиоданных с использованием интерфейса структурного анализа для формализации MSML звуковой композиции, для извлечения нечетких повторяющихся элементов из таких музыкальных композиций. Этот интерфейс структурного анализа выполнен с возможностью обработки аудиоданных, получаемых от формализации MSML исходного сигнала, и с возможностью идентификации нечетких повторяющихся циклических элементов на относительно низком уровне формализации MSML для использовании при последующем уменьшении данных без уменьшения общей информативности сигнала. Такой интерфейс содержит три модуля. Первый модуль обеспечивает поиск, размещение и разметку длины всех нечетких повторяющихся элементов на всем исходном уровне формализации MSML. Второй модуль извлекает общие звуковые составляющие для любого набора нечетких повторяющихся элементов и определяет уровень связности данных путем выработки соответствующего остаточного сигнала. Третий модуль выполняет прогнозное создание результирующего аудиофрагмента путем объединения извлеченных повторяющихся элементов, соответствующих данных разметки и остаточной информации. Для минимизации требуемой исходной информации о фазе во время процесса создания звука используют способ фильтрации для моделирования фазы. Этот интерфейс выполнен с возможностью его использования в качестве элемента в различных областях, включая поисковые машины для поиска музыки, визуализацию музыки, технологии глубокого сжатия аудиоданных и пр.

Еще один аспект направлен на системы и способы сжатия аудиоданных с использованием иерархических повторяющихся структур формализации MSML звуковой композиции. Интерфейс улучшенного повторяющегося бесфазного кодирования использует структуры, созданные посредством макроповторяющихся звуковых примотронов высокого уровня в смысловой иерархии звука формализации MSML. В процессе декодирования используют два типа данных: крупномасштабные данные, определяющие общую структуру формализации MSML, и данные, содержащие фрагменты исходного сигнала, описанные моделью относительно низкого уровня. Для сжатия фрагментов сигнала может быть использован обычный психоакустический кодировщик с возможным использованием в некоторых примерах внешнего маскирования сигнала. Уменьшение скорости передачи происходит благодаря исключению повторяющихся фрагментов, созданных на высоком уровне формализации MSML с сохранением мест этих фрагментов. Воспринимаемая эквивалентность повторяющихся фрагментов обеспечивает уменьшение количества ссылочных образцов.

Еще один аспект направлен на системы и способы уменьшения полосы пропускания и скорости передачи с использованием интерфейса сжатия без потерь для формализации MSML звуковой композиции путем уменьшения количества массивов целочисленных значений, связанных с нею, путем использования улучшенного кодировщика энтропии, выполняющего только целочисленные операции без деления и оценок вторичных вероятностей. Так как кодировщик диапазона интерфейса и контекстная модель не используют математическую операцию деления, этот интерфейс можно использовать для его выполнения недорогим микрокомпьютером, не имеющим операции деления. Для повышения надежности контекстной модели интерфейса используют оценку вторичной вероятности. Оценка вторичной вероятности является сложной контекстной моделью, использующей прогнозную вероятность в качестве контекста для другой модели. Оценка 2-мерной вторичной вероятности также может быть использована для объединения двух различных моделей. Оценка 2-мерной вторичной вероятности является модификацией оценки вторичной вероятности, которая имеет две входные вероятности и использует их в качестве контекста. Также может быть использован дополнительный целочисленный контекст.

Еще один аспект направлен на системы и способы улучшения сжатия аудиосигнала. Также предложены системы и способы для улучшения арифметического кодирования и контекстного моделирования для увеличения коэффициентов сжатия и скоростей обработки, благодаря чему обеспечено сжатие спектральных данных с высокой эффективностью и с более высокой скоростью. Способ сжатия может быть полностью автоматизированным и не требует предварительной инициализации различных типов аудиоданных. Он достаточно гибок с точки зрения подстройки к различным размерам спектральных аудиоданных, что позволяет использовать его с различными спектральными преобразованиями. Вместо стандартного арифметического кодировщика используют более эффективный кодировщик диапазона. Применительно к потоку данных используют контекстное моделирование, созданные алгоритмические модели и алгоритмическую оптимизацию функции кодировщика и/или декодера. Этот аспект также по меньшей мере частично основан на использовании технологий адаптивного кодировщика диапазона, включающих увеличение вероятности закодированного значения. Для повышения надежности контекстной модели может быть использована оценка вторичной вероятности.

Другие аспекты включают системы и способы эффективной потоковой передачи аудиоданных с использованием интерфейса улучшенного ускорителя аудиоданных для формализации MSML звуковой композиции, а также использование процесса с нулевой потерей качества (Null Quality Loss (NQL) для уменьшения количества квантованных частотно-временных спектральных коэффициентов для обеспечения более быстрой доставки исходных аудиоданных без существенной потери качества в результирующем звуке. Процесс NQL выполняет классификацию звуковых структур в формализации MSML в зависимости от их важности на основе ограничений человеческого восприятия. Интерфейс улучшенного ускорителя воссоздает квантованные частотно-временные спектральные коэффициенты исходного формата без деквантования или обратного транскодирования через формат РСМ. Интерфейс улучшенного ускорителя делит первоначально закодированный файл частотно-временных спектральных коэффициентов на три группы, причем коэффициенты низкочастотной спектральной группы остаются неизменными, некоторые коэффициенты промежуточной частотной группы обнуляют с использованием процесса NQL, коэффициенты из третьей группы (самые высокие частоты) исключают путем их замены наиболее сходными подгруппами коэффициентов, а также интегральными коэффициентами без влияния на структурные звуковые элементы (то есть гармоники и всплески).

В соответствии еще с одним аспектом также предложены системы и способы уменьшения размера аудиоданных с использованием интерфейса кодирования с использованием аффинных преобразований для формализации MSML звуковой композиции с сохранением полной целостности исходного воспроизведения звука в виде аффинного преобразования неизменных звуковых примотронов, что ведет к уменьшению энтропии сигнала (то есть большему структурированию). Аффинный интерфейс, связанный с формализацией MSML, используют в дополнение к любой процедуре кодирования аудиоданных для увеличения коэффициента сжатия, а также к процессу основного сжатия для класса сигналов, в которых частотно-временные аффинно-неизменные микрофрагменты несут существенную часть звуковой информации. Этот интерфейс кодирования с использованием аффинных преобразований выполнен с возможностью использования неизменных спектральных микрофрагментов цифрового аудиосигнала для увеличения коэффициента сжатия сигнала при использовании этого интерфейса совместно с формализацией MSML. Во время обработки полный спектральный диапазон делят на два поддиапазона, в каждом из которых независимо и с использованием разного шага проводят поиск неизменных спектральных фрагментов в предыдущей части звукового сигнала. Во время поиска неизменных фрагментов используют аффинное амплитудное, временное преобразование и аффинное преобразование, связанное со спектральным смещением. Каждый найденный фрагмент вычитают из исходного спектрального фрагмента, а остаток затем обрабатывают как разность спектральных компонентов, таким образом устраняя существенную избыточность спектральных данных.

В целом аспекты настоящего изобретения предлагают системы и способы, направленные на многоструктурную, многоуровневую формализацию звука или другой цифровой мультимедийной композиции, а также различные системы и способы определения конфигурации и/или комбинации первичных объектов формализации для уменьшения размера файла данных по сравнению с исходным файлом с оцифрованными аудиоданными (то есть уменьшения количества информации или скорости передачи) с сохранением максимальной информативности (то есть качества информации) определенных элементов. Также предложены системы и способы для восстановления или декодирования конфигурации и/или комбинации первичных объектов (элементов) для синтеза исходного звука или другой цифровой мультимедийной композиции. Аспекты настоящего изобретения, таким образом, удовлетворяют указанные потребности и обеспечивают другие преимущества, как подробно здесь описано.

Краткое описание чертежей

После описания изобретения в общих терминах далее сделана отсылка к сопроводительным чертежам, которые необязательно выполнены в масштабе и среди которых

фиг. 1 схематически иллюстрирует многоструктурную многоуровневую формализацию цифровых аудиоданных как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 2А-2С схематически иллюстрируют визуализацию информативных примотронов звуковой информации, соответствующую формализации MSML файла с цифровыми аудиоданными как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 3А схематически иллюстрирует процесс манипуляции для бесфазного кодирования цифровых аудиоданных как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 3В схематически иллюстрирует процесс манипуляции для бесфазного декодирования цифровых аудиоданных как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 4А схематически иллюстрирует процесс манипуляции для разложения музыкальной композиции на остаточную часть и повторяющуюся часть (то есть извлечение нечетких повторяющихся элементов) на основе 3 равных «базовых» сигналов как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 4В схематически иллюстрирует процесс манипуляции для разложения музыкальной композиции с извлечением нечетких повторяющихся элементов как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 5 схематически иллюстрирует процесс манипуляции для сжатия аудиоданных с использованием иерархически повторяющихся структур как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 6А схематически иллюстрирует процесс манипуляции для сжатия без потерь с использованием контекстной модели, включающей вероятностный способ смешивания как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 6В схематически иллюстрирует процесс манипуляции для сжатия без потерь с использованием способа оценки вторичной вероятности как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 7А схематически иллюстрирует процесс манипуляции для эффективной потоковой передачи аудиоданных с использованием схемы сжатия с потерями, включающей ускоритель аудиоданных и процесс с нулевой потерей качества, для уменьшения количества квантованных частотно-временных спектральных коэффициентов как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 7В схематически иллюстрирует фрагменты с квантованными частотно-временными спектральными коэффициентами, полученные посредством процесса манипуляции, включающего схему сжатия с потерями, как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 8А схематически иллюстрирует схему кодирования процесса манипуляции, связанного с кодированием с использованием аффинных преобразований, как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 8В схематически иллюстрирует схему декодирования процесса манипуляции, связанного с кодированием с использованием аффинных преобразований, как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 8С схематически иллюстрирует схему быстрого декодирования процесса манипуляции, связанного с кодированием с использованием аффинных преобразований, как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 9 схематически иллюстрирует изменения данных между уровнями формализации MSML файла с цифровой информацией и конкретные процессы кодирования и декодирования, связанные с ними, как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения;

фиг. 10 схематически иллюстрирует изменения данных между уровнями формализации MSML файла с цифровыми аудиоданными и конкретные процессы кодирования и декодирования, связанные с ними, как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения; и

фиг. 11 схематически иллюстрирует процессы, используемые применительно к данным между уровнями формализации MSML файла с цифровой информацией как один из примеров структурирования информации в соответствии с различными аспектами настоящего изобретения.

Подробное описание изобретения

Далее настоящее изобретение описано более полно со ссылками на сопроводительные чертежи, на которых представлены некоторые, но не все аспекты изобретения. Действительно, изобретение может быть реализовано в различных формах, и его не следует расценивать как ограниченное приведенными здесь аспектами. Скорее, эти аспекты представлены для того, чтобы изобретение удовлетворяло соответствующим требованиям законодательства. В заявке одинаковые номера относятся к одинаковым элементам.

Несколько главных современных теорий, относящихся к конкретным феноменам, основаны на относительно простых принципах, оптимально сформулированных в одной фразе. Однако, чтобы прийти к таким простым формулировкам, обычно требуется значительная и продолжительная эволюция лежащей в основе теории. Например, геометрическая оптика основана на принципе минимума движения вдоль светового луча, механика использует принцип минимума действия, термодинамика основана на принципе максимума энтропии, эволюционная теория основана на принципе выживания наиболее приспособленных видов, а биология реализует принцип минимума энергии. Раскрытые аспекты настоящего изобретения, а именно аспекты, направленные на теорию формализации звука, основанную на расположении MSML, в целом основаны на принципе максимизации информативности относительно размера файла данных и направлены на этот принцип, причем в конкретных аспектах этот принцип расширен до максимизации ценности информации элементов данных в сочетании с минимизацией размера файла данных.

Исходным посылом может быть условие, что количество информации, имеющейся в звуковых волнах, доставляемых к человеческим ушам, значительно превосходит количество информации, получаемой или иначе воспринимаемой человеческим мозгом. Поэтому оперативное определение и количественная оценка части информации, которая получена и может быть воспринята человеческим мозгом, могут помочь в обеспечении схемы формализации звука, в большей степени соответствующей механизму восприятия человеком звука и/или аудиоданных, который может быть одним из самых эффективных в живой системе. Соответственно, аспекты схемы формализации MSML, представленные здесь, могут учитывать вышеперечисленные проблемы и могут служить для создания основы универсальной формализации для представления звука в отношении как речи, так и музыки (то есть аудиоданных).

По меньшей мере часть аудиоинформации, представленной с аудиособытием полного спектра, может быть отвергнута на физиологическом уровне структуры человеческого уха. Иными словами, физиология человеческого уха может иметь ограничения, которые не позволяют принимать всю аудиоинформацию (частотные ограничения). Однако что касается той части аудиоинформации, которую получает физиология человеческого уха, далее нейронная сеть человека, связанная с человеческим ухом, ответственна за извлечение и естественный выбор наиболее значительных звуковых объектов из оставшейся аудиоинформации. В этих примерах извлеченные и выбранные звуковые объекты могут характеризоваться специфичными данными, локальными по отношению к аудиособытию, а также и, возможно, даже прежде всего, более глобальными и обобщенными звуковыми структурами.

В этом отношении аспекты настоящего изобретения направлены на такие глобальные и/или обобщенные звуковые структуры, которые обычно могут быть связаны с восприятием человеком звука и/или аудиоданных. В некоторых примерах такие звуковые структуры могут быть также основаны, например, на трех уровнях нулевой потери качества или иным образом связаны с ними, причем эти уровни могут зависеть, например, от времени неразличимости при восприятии получаемой информации. Более конкретно, три уровня нулевой потери качества могут характеризоваться следующим:

1. Неразличимые при восприятии звуковые события - если одно звуковое событие, например, отделено от другого звукового события временем около 20 мсек.

Для таких звуковых событий нулевая потеря качества может быть достигнута, только если они имеют эквивалентные формы волны. Модели представления звука, удовлетворяющие этому критерию, обычно используют в стандартных или традиционных аудиокодеках. Однако формализация MSML, основанная на этих временном масштабе и/или длительности, может включать значительное количество или долю низкоинформативных структур MSML или элементов MSML. При этом кодеки, связанные с формализацией MSML, основанной только на этом критерии, могут быть неспособны максимизировать или хотя бы сохранять необходимую информативность или качество структур MSML или элементов MSML, в частности, например, при низких скоростях передачи или низком качестве информации.

2. Неразличимые при восприятии звуковые события - если одно звуковое событие, например, отделено от другого звукового события временем около 1 мин.

При этих временном масштабе и/или длительности требование математической эквивалентности, например эквивалентности формы волны, не является необходимым, а характеристики восприятия звукового события определяются сравнительно намного менее существенными структурами MSML или элементами MSML, так как в мозге остается или с мозгом связано относительно меньшее количество информации о ранее услышанном и/или испытанном исходном звуковом событии. Однако может быть выполнен более сложный анализ звука для определения того, могут ли структуры или элементы, связанные со вторым уровнем или более высокими уровнями формализации MSML, иметь достаточное качество, хотя для достижения эквивалентности восприятия точное соответствие может не требоваться.

3. Эквивалентные при восприятии звуковые события - если одно звуковое событие отделено от другого звукового события временем около одного дня или более.

При таких временном интервале и/или длительности человеческий мозг обычно сохраняет только высококонцентрированные звуковые информационные структуры, которые обычно представляют высокие уровни схемы формализации MSML или соответствуют им. Такие структуры играют значительную роль в представленных здесь аспектах анализа звука и важны для эквивалентности восприятия, хотя количество информации и/или информативность этих структур и/или элементов относительно меньше, чем при предыдущих временном интервале и/или длительности. Обычно квалифицированный профессионал в области аудиоданных может быть способен различать звуковые структуры более низкого уровня (то есть связанные с предыдущими меньшими временными интервалами и/или длительностями), даже если между звуковыми событиями прошло много времени, хотя переход и/или продвижение от звуковых структур более низкого уровня к звуковым структурам более высокого уровня (то есть от меньших временных интервалов и/или длительностей к большим) обычно является обычным процессом для большинства людей, испытывающих звуковые события.

В соответствии с физической теорией, в системе, имеющей некоторое количество разрешенных состояний при конкретных условиях, чем более упорядочена система, тем меньше энтропия. Кроме того, в соответствии со вторым началом термодинамики, энтропия обычно растет в замкнутой системе. Однако, согласно Шредингеру, человек всегда стремится уменьшить энтропию в жизни, чтобы поддержать внутреннюю организацию или, иными словами, сохранить структурированную информацию. Концепция энтропии иногда также может быть отождествлена с количеством информации, а также с самой информацией, по меньшей мере частично в силу отсутствия научного определения информации и многочисленных дефиниций информации. Согласно Шеннону, количество информации обратно пропорционально энтропии. Иными словами, чем менее вероятно событие (больше энтропия), тем меньше информации включено в данные об этом событии. По-другому количество информации может быть представлено как количественное изменение неопределенности в результате взаимодействия. Однако количество информации является только одним из атрибутов информации, которая может иметь много других атрибутов, и ценность информации может быть наиболее важным из этих других атрибутов. В любом случае при наличии множества дефиниций информации аспекты настоящего изобретения могут быть основаны на данной Кастелером: «Информация - это запомненный выбор из некоторого количества возможных выборов».

Согласно Чернавскому, макроинформация - это запомненный выбор, то есть время существования знания больше, чем время использования данной информации, связанной с этим знанием. Микроинформация - это незапомненный выбор одного аспекта из некоторого количества возможных аспектов. Область физической энтропии (или больцмановской энтропии) ограничена эргодическими системами, которые быстро забывают свое предыдущее состояние (так, в газе это время составляет примерно 10-13 сек. при температуре ~ 300К). При этом количество макроинформации пропорционально логарифму количества устойчивых состояний, а количество микроинформации пропорционально логарифму количества всех состояний, необязательно устойчивых. Например, количество микроинформации в сосуде, заполненным газом, составляет

Imicro=log2 (количество всех состояний)=log2(exp(S/k)), где S - энтропия, равная 3/2kN (то есть информация составляет 2,16*N, что по порядку величины 1023 сравнимо с числом Авогадро);

Imacro=log2 (количество устойчивых состояний)=log2(1)=0 (так как имеется только одно устойчивое состояние, то есть термодинамическое равновесие).

Таким образом, понятие информационного содержания зависит от того, может эта информация быть использована или нет. В частности, белый шум в звуке можно рассматривать как эквивалент термодинамического равновесия, так как оба состояния соответствуют максимуму энтропии соответствующей системы. Следствием может быть сосуд, наполненный газом, а именно такой, в котором макроинформация минимальна и равна нулю, а микроинформация максимальна.

В соответствии с одним из аспектов, ценность информации может быть определена как разность между энтропией системы, на которую воздействует получаемая информация, и энтропией системы, на которую не оказывается такое воздействие. Математически эта ценность информации может быть определена как: V=log2(P1/P0), где Р0 - вероятность достижения цели без получения информации, a P1 - вероятность достижения цели при условии получения информации, причем понятие цели может быть различным для каждой системы. При этом целью каждого элемента является хранить (сохранять) информацию, связанную с ним. Как только цель задана или определена иным образом, развитие ценности полученной информации, связанной с этой целью, может быть отслежено и проанализировано. Соответственно, аспекты настоящего изобретения включают цель в виде анализа и извлечения примотронов из оцифрованных аудиоданных как основу схемы синтеза звука. Однако для специалиста очевидно, что отсылка к звуку или аудиоданным является лишь иллюстративным примером использования и возможностей раскрытых здесь систем и способов, которые в более общем случае могут быть использованы применительно к любой информацией, которая может быть проанализирована в цифровой форме, например с цифровыми мультимедийными данными, включая аудиоданные, видеоданные и пр.

Аспекты изобретения могут, таким образом, предоставлять системы и способы для анализа, идентификации и структурирования примотронов (то есть первичных представительных элементов или структур данных), размещенных по различным уровням иерархии MSML и связанных с цифровыми аудиоданными или другим цифровым мультимедийным файлом, преобразуемым в формат MSML. Далее, такие системы и способы анализа, идентификации и структурирования могут отличаться от синтеза или воссоздания аудиоданных или других цифровых медиаданных из таких примотронов в пределах, заданных пороговым значением исходных цифровых мультимедийных данных. Иными словами, кодирование исходного цифрового мультимедийного файла может быть процессом, отличным от процесса декодирования кодированного файла для синтеза или воссоздания исходного цифрового мультимедийного файла. В любом случае общий подход, используемый в конкретных аспектах настоящего изобретения и направленный на основанное на примотронах описание или представление звука или других мультимедийных данных, может обеспечить представление (то есть определение комбинаций элементов данных, образующих примотроны) и синтез (воссоздание) примотронов с созданием звукового или другого мультимедийного файла и может быть основан на взаимодействиях интерфейсов (также называемых процессами манипуляции) с формализацией MSML, причем эти процессы манипуляции могут быть независимо функциональны или согласованы в отношении конкретной функции или в конкретных примерах. Поскольку природа звука, особенно музыки и речи, но также и в случае других мультимедийных данных, например видеоданных, может быть основана на конкретной повторяемости базовых звуков или других базовых элементов, то есть отдельных букв, написания слов, музыкальных символов, гармоник, постольку конкретные примотроны или их комбинации могут быть использованы как компактное представление файлов, подвергнутых обработке MSML, через размещение этих идентифицированных базовых или первичных элементов высокоструктурированным образом (причем структурированные данные могут быть связаны с конкретными хаотическими параметрами, которые могут способствовать интерпретации данных, а также их структуры), что уменьшает количество информации, например посредством уменьшения или минимизации избыточности этих элементов. При этом обеспечивают удержание этих структурированных базовых элементов в пределах, заданных воспринимаемым пороговым значением, равным ценности информации исходного файла или превышающего ее. Более того, таким образом различные уровни примотронов или элементов данных в иерархии MSML могут служить источником (источниками), из которого может быть синтезирован или иным образом восстановлен общий сигнал (то есть исходный файл оцифрованных аудиоданных), если для такого синтеза определены соответствующие инструкции или правила, например посредством хаотических параметров или другим подходящим способом, то есть включающим статистическую оценку вероятностей воссоздания.

Таким образом, рассматриваемые аспекты настоящего изобретения предлагают способы обработки аудиоданных и других цифровых мультимедийных данных, направленные на создание компактной многоструктурной многоуровневой (Multi-Structural, Multi-Level, MSML) цифровой формализации звука или других мультимедийных данных (см. например фиг. 1, 9, 10 и 11). Эти способы основаны на конкретных определениях информационных примотронов, критериях воспринимаемой информации (Perceptive Information Criteria (PIC), связанных с существованием таких промотронов, то есть с ограничениями человеческого восприятия, и с определением комбинаций или наборов элементов данных, образующих такие примотроны. Такая формализация MSML также может включать способы извлечения примотронов из цифровых аудиоданных или других цифровых мультимедийных файлов и классификации этих примотронов как во временном, так и в частотно-временном пространстве. С процедурами формализации MSML, раскрытыми здесь, может быть связано определение вторичного уровня или набора звуковых структур MSML и связанных с ними PIC, что также может включать анализ по меньшей мере некоторых примотронов для создания таких вторичных структур MSML. Процедуры формализации MSML также могут быть связаны с определением высокого уровня или набора звуковых структур MSML и связанных с ними в иерархии PIC, что также может включать анализ структур MSML низкого уровня для выбора или определения иным образом структур MSML высокого уровня. Эти принципы и способы совместно обеспечивают создание параметрической структурной модели звука или других мультимедийных данных для целей формализации, а именно раскрытой здесь формализации MSML, которая может обеспечивать организацию данных в конкретные структуры и наборы структур. С формализацией MSML также могут быть связаны способы и устройства для создания библиотеки примотронов в частотно-временном пространстве, которая может быть использована для синтеза или воссоздания звука. При этом размещение или размещения конкретных примотронов в библиотеке могут быть определены структурами высоких уровней формализации MSML.

Аспекты настоящего изобретения также предлагают способы определения критериев воспринимаемой информации для определения вероятностей существования примотронов путем сравнения двух значений энергии, одно из которых может быть определено для структуры, образующей примотрон или связанной с ним иным образом, а другое может быть вычислено для части цифрового сигнала, содержащей указанный примотрон, в частотно-временном пространстве. Если отношение первого значения энергии ко второму значению энергии больше заданного порогового значения, критерии воспринимаемой информации для указанного примотрона, подтверждающие его существование, выполнены.

Еще один аспект настоящего изобретения направлен на способ определения порогового значения энергии как приемлемой вероятности события, где случайные хаотические флуктуации можно считать ценными звуковыми структурами. Такая вероятность может быть определена путем выполнения вычислительного эксперимента или путем прямого использования теоретически выведенной формулы для определения функции распределения вероятности с использованием случайного шума как входного сигнала.

Еще один аспект настоящего изобретения направлен на теоретическое определение порогового значения энергии примотрона с помощью процесса, включающего вычисление площади поверхности n-мерной сферы (Sn) единичного радиуса в частотно-временном пространстве с использованием следующей неявной функции:

где K - искомое пороговое значение энергии первых Μ компонентов N-мерного вектора, деленное на общую энергию вектора. Индексы слагаемых включают такие значения, что 21+2q-N+2=0 и

так что:

Sn определяется как:

Еще один аспект настоящего изобретения направлен на способ определения критерия нулевой потери качества (Null Quality Loss (NQL) путем сравнительного анализа исходного сигнала и синтезированного или иным образом восстановленного сигнала в соответствии с раскрытыми здесь процедурами формализации MSML.

Еще один аспект настоящего изобретения направлен на способ определения PIC как вероятностного коэффициента для создания новой структуры высокого уровня в иерархии формализации MSML, только если создание или возникновение этой высокоуровневой структуры уменьшает общую энтропию структур низкого уровня формализации MSML, которые совместно образуют эту структуру высокого уровня.

Еще один аспект настоящего изобретения направлен на способ определения или назначения примотронной структуры как некоторого количества соответствующих примотронов или других элементов данных первого уровня в иерархии MSML в соответствии с временными координатами, связанными с ними во временном пространстве. Далее, этот аспект может также включать определение всплеска как локализованных во времени примотронов второго уровня, примотронных структур или других элементов данных, имеющих такие же координаты времени начала, а уменьшение энтропии структур высокого уровня (то есть более лаконичное определение) обеспечено путем устранения избыточности значений временного компонента примотрона, очевидной в структуре низкого уровня. Этот аспект также может включать определение гармоник как локализованных по частоте структур MSML второго уровня, причем начало последующего примотрона или его обнаружение совпадает с координатой окончания предыдущего примотрона. В этих примерах уменьшение энтропии структуры высокого уровня также обеспечено путем устранения избыточности значений временных компонентов примотрона. Этот аспект также может включать определение набора обертонов как локализованных по частоте структур MSML второго уровня, включающих одну базовую частоту от структур MSML первого уровня и некоторое количество ее копий, смещенных на постоянное значение частоты от базовой частоты и друг от друга. Общая энтропия таких структур может иметь тенденцию к уменьшению в результате компактного описания набора структур первого уровня одним параметром, связанным со смещением частоты.

Более конкретно, если исходный файл с цифровой информацией является файлом с цифровыми аудиоданными, этот аспект настоящего изобретения включает связывание количества информации файла с цифровыми аудиоданными со скоростью передачи пропорционально размеру и длительности этого файла и связывание ценности информации файла с цифровыми аудиоданными с качеством этого файла, которое определяют на основе по меньшей мере одного элемента группы, включающей: пороговое значение энергии примотрона, критерии воспринимаемой информации, звуковая структура, идентифицированная из события случайной хаотической флуктуации, определенного в соответствии с функцией распределения вероятности с использованием случайного шума как входного сигнала, критерии нулевой потери качества и площадь поверхности n-мерной сферы единичного радиуса в частотно-временном пространстве, определенная из неявной функции.

В конкретных аспектах, например в случае файла с цифровыми аудиоданными, представленного, например, на фиг. 2А-2С, структурирование интерфейсов или процессы манипуляции могут быть последовательно использованы применительно к предыдущему результирующему файлу с цифровыми аудиоданными для создания последнего результирующего файла со структурированными цифровыми аудиоданными, сконфигурированного в соответствии с иерархией информации, имеющей множество уровней информации, причем низкий уровень информации в иерархии содержит представление аудиоданных в виде файлов с цифровой информацией высокого разрешения, а высокий уровень информации в иерархии содержит, например, табличное представление, содержащее письменную партитуру с соответствующим текстом. При таком структурировании высокий уровень информации может иметь меньшее количество информации, чем низкий уровень информации в иерархии, причем низкий уровень информации может быть создан, синтезирован или восстановлен на основе высокого уровня информации и хаотических параметров, связанных с характеристиками и оцифровкой аудиоданных, в соответствии с табличным представлением.

На фиг. 2А-2С показаны различные визуализации информационных примотронов звуковой информации, где нечерные области представляют собой примотроны, которые отвечают критериям воспринимаемой информации (PIC) или требуют более подробного анализа другим образом для определения соотношения примотронов, в то время как черные области не принадлежат конкретному примотрону или набору примотронов.

Еще один аспект настоящего изобретения учитывает, что последовательное использование процессов манипуляции применительно к предыдущему результирующему файлу с цифровыми аудиоданными создает последний результирующий файл со структурированными цифровыми аудиоданными, который содержит по меньшей мере один примотрон, определенный во временном пространстве или в частотно-временном пространстве и таким образом представляет компактную цифровую формализацию гармонического сигнала. При этом количество информации, связанной со скоростью передачи аудиоданных, уменьшено по сравнению с файлом с цифровыми аудиоданными, соответствующим исходному файлу с цифровой информацией, а ценность информации, связанная с качеством аудиоданных, поддерживают в пределах, заданных пороговым значением файла с цифровыми аудиоданными, соответствующего исходному файлу с цифровой информацией.

Еще один аспект настоящего изобретения учитывает, что каждый файл с цифровыми аудиоданными представляет связанные с гармониками данные, а их анализ включает определение всплесков как иерархических структур высокого уровня во временном пространстве; определение гармоник как иерархических структур высокого уровня в частотном пространстве, имеющих ориентацию последующего гармонического примотрона, совпадающую с окончанием предыдущего гармонического примотрона; устранение избыточности в иерархических структурах низкого уровня во временном пространстве с обеспечением уменьшения энтропии в иерархических структурах высокого уровня; и определение обертонов как иерархических структур высокого уровня в частотном пространстве, имеющих одну базовую частоту, соответствующую иерархическим структурам низкого уровня, и множество копий иерархических структур высокого уровня, смещенных на постоянную частоту от указанной одной базовой частоты и друг от друга.

В более общем случае формализация MSML может относиться к способу структурирования информации, которая может включать, например цифровую информацию, такую как аудиоданные, как указано выше и в других частях настоящего документа. При этом исходный файл с цифровой информацией сначала анализируют для определения количества исходной информации и ценности исходной информации, связанной с ним. Иными словами, сначала определяют, сколько элементов данных включено в файл с цифровой информацией и соответствующий уровень информативности, связанный с каждым элементом данных. При структурировании информации исходный процесс манипуляции может быть использован применительно к исходному файлу с цифровой информацией для создания первого результирующего файла с цифровой информацией, а последующий процесс манипуляции используют применительно к первому результирующему файлу с цифровой информацией для создания второго результирующего файла с цифровой информацией. В этих примерах каждый процесс манипуляции может быть реализован с обеспечением удаления из обрабатываемого файла с цифровой информацией по меньшей мере одного элемента, который может быть, например, идентифицирован как избыточный, как шум или как не являющийся необходимым по другой причине. В других примерах каждый процесс манипуляции может быть реализован с обеспечением представления комбинации множества элементов обрабатываемого файла с цифровой информацией посредством представительного элемента и первого индикатора, связанного с соотношением между представительным элементом и по меньшей мере одним из указанного множества элементов в комбинации, чтобы уменьшить количество информации обрабатываемого файла с цифровой информацией и структурировать этот файл. Иными словами, элементы можно объединять и представлять одним представительным элементом, который может быть связан с первым индикатором, указывающим, например, причину, результат анализа или предоставляющий любой другой подходящий указатель того, почему конкретные элементы были объединены, и природы отношения между конкретной комбинацией элементов и назначенным представительным элементом (то есть представительный элемент представляет то, что объединенные элементы образуют повторяющийся рисунок или мелодию, определяют гармонику, связаны с текстом и т.п.). При удалении одного элемента или более и/или комбинации элементов каждый процесс манипуляции может быть реализован таким образом, что определяют указанный по меньшей мере один из удаленных элементов и/или представительный элемент для уменьшения ценности информации обрабатываемого файла с цифровой информацией не ниже выбранного порогового значения. Иными словами, хотя предыдущее количество информации может быть уменьшено, каждый процесс манипуляции предпочтительно реализован таким образом, что ценность информации результирующего файла с цифровой информацией находится в пределах, заданных конкретным количеством или другой подходящей мерой исходного или предыдущего файла с цифровой информацией (то есть в пределах, заданных пороговым значением). Таким образом, процессы манипуляции могут быть последовательно использованы применительно к предыдущему результирующему файлу с цифровой информацией (то есть применительно к каждому результирующему файлу с цифровой информацией может быть использован еще один процесс манипуляции), пока последовательное использование процессов манипуляции не обеспечит уменьшение количества информации в последующем результирующем файле с цифровой информацией по сравнению с предыдущем результирующим файлом с цифровой информацией до порогового значения. Иными словами, процесс использования процесса манипуляции применительно к каждому результирующему файлу с цифровой информацией можно продолжать до тех пор, пока не будет дальнейшего существенного (то есть в пределах, заданных пороговым значением) уменьшения количества информации в последующем результирующем файле с цифровой информацией по сравнению с предыдущим результирующим файлом с цифровой информацией. Иными словами, использование последнего процесса манипуляции не приводит к существенному удалению элемента или элементов и/или существенной комбинации элементов, представленных представительным элементом. При этом последний результирующий файл с цифровой информацией может, таким образом, иметь первичную структуру с уменьшенным количеством информации относительно исходного количества информации и результирующую ценность информации в пределах, заданных выбранным пороговым значением исходной ценности информации. Иными словами, количество информации, включенное в последний результирующий файл с цифровой информацией, меньше, чем количество информации в исходном файле с цифровой информацией, однако ценность информации или информативность данных в последнем результирующем файле с цифровой информацией находится в пределах конкретной приемлемой меры (то есть в пределах, заданных пороговым значением) исходного файла с цифровой информацией (см. например фиг. 9-11).

Посредством процесса последовательного использования различных процессов манипуляции применительно к каждому результирующему файлу с цифровой информацией по меньшей мере последний результирующий файл со структурированной цифровой информацией может быть сконфигурирован в соответствии с иерархией информации, имеющей множество уровней информации. Иными словами, последний результирующий файл с цифровой информацией включает относительно высокоструктурированную информацию по сравнению, например, с исходным файлом с цифровой информацией, причем количество данных или информации в файле меньше, чем в исходном файле с цифровой информацией, но ценность этих данных или информации находится в пределах, заданных конкретным количеством или пороговым значением исходного файла с цифровой информацией (то есть меньший файл с точки зрения количества данных, но при этом файл обладает примерно такой же или, возможно, большей ценностью информации). Более того, будучи структурированным таким образом, последний результирующий файл с цифровой информацией может иметь иерархическую конфигурацию, причем данные на высоких уровнях информации в иерархии могут соотноситься с данными на низких уровнях информации в иерархии посредством различных хаотических параметров. Иными словами, высокий уровень информации в иерархии информации может содержать меньшее количество информации, чем низкий уровень информации, при этом высокий уровень информации создан из структуры (то есть комбинаций данных или комбинаций конкретных элементов) низкого уровня информации и хаотических параметров (то есть причин или других параметров, ведущих к конкретной комбинации), связанных с ними. В некоторых примерах высокий уровень информации может быть создан таким образом, что он содержит большую ценность информации, чем исходная ценность информации, например благодаря информации, связанной с хаотическими параметрами. В некоторых примерах при необходимости множество низких уровней информации может быть создано из структуры высокого уровня информации и по меньшей мере один из множества низких уровней информации может быть выбран для связывания с этим высоким уровнем информации. В этих примерах отношение между ними может быть определено конкретными хаотическими параметрами.

В некоторых аспектах множество процессов манипуляции может быть одновременно использовано применительно к предыдущему файлу с цифровой информацией для создания вторичного файла со структурированной цифровой информацией в дополнение к первичному файлу со структурированной цифровой информацией. В этих аспектах первичный и вторичный файлы со структурированной цифровой информацией могут быть проанализированы для определения соотношения между уровнями информации первичного или вторичного файла со структурированной цифровой информацией и/или соотношения между первичным и вторичным файлами со структурированной цифровой информацией. Такие соотношения в некоторых примерах могут включать раскрытые выше хаотические параметры или быть связаны с ними иным образом.

В некоторых аспектах может быть использован по меньшей мере один из множества процессов манипуляции применительно к предыдущему файлу с цифровой информацией, причем процессы манипуляции могут быть выбраны из группы, содержащей, например, процесс манипуляции, связанный с бесфазным кодированием, процесс манипуляции, связанный со структурным анализом, для повторяющихся структур, процесс манипуляции, связанный с бесфазным повторяющимся кодированием, способ манипуляции, связанный с сжатием энтропии без потерь, процесс манипуляции, связанный с ускорителем без потерь, для создания дополнительного сжатого слоя для ранее уменьшенного файла с аудиоданными, процесс манипуляции, связанный с ускорителем, для обеспечения эффективной потоковой передачи аудиоданных и процесс манипуляции, связанный с кодированием с использованием аффинных преобразований.

Более конкретно, в одном из аспектов процесса манипуляции может быть реализовано уменьшение полосы пропускания и скорости передачи аудиоданных с использованием интерфейса бесфазного кодирования для формализации MSML звуковой композиции, причем интерфейс выполнен с возможностью учета иерархии ценности воспринимаемой информации (см. например фиг. 3А). Уменьшение полосы пропускания и скорости передачи может быть обеспечено путем использования такого интерфейса для выполнения заданий, имеющих целью уменьшение выбранных данных с сохранением информативности всех звуковых структур, связанных со звуковой композицией, например посредством использования звуковых показателей. При этом выполняют сравнение в пространстве звуковых объектов различных уровней, сосредотачиваясь на определении целостности структур и степени их повреждения в пределах уменьшенного представления сигнала после фильтрации, что обеспечивает выбор подходящего параметра для каждого звукового элемента. Интерфейс бесфазного кодирования соответственно выполнен таким образом, что зависимость сигнала от времени не сохраняется, и сохраняются звуковые структуры, а не форма волны сигнала, что приводит к существенному уменьшению полосы пропускания и скорости передачи. Для достижения большей скорости уменьшения полосы пропускания и скорости передачи аудиоданных структуры более информативного уровня формализации MSML звуковой композиции сконфигурированы таким образом, чтобы поддерживать постоянные параметры. Параметры структур относительно менее информативного уровня в иерархии могут быть сохранены с меньшей точностью или созданы при декодировании с использованием случайных значений. Пример процесса декодирования, связанного с таким интерфейсом бесфазного кодирования, представлен, например, на фиг. 3В.

В соответствии еще с одним аспектом процесса манипуляции может быть выполнен структурный анализ аудиоданных с использованием интерфейса структурного анализа для формализации MSML звуковых композиций для извлечения нечетких повторяющихся элементов из таких музыкальных композиций, как представлено, например, на фиг. 4А и 4В. Этот интерфейс структурного анализа может быть выполнен с возможностью обработки аудиоданных, получаемых от формализации MSML исходного сигнала, и с возможностью идентификации нечетких повторяющихся циклических элементов на относительно низком уровне формализации MSML для использования при последующем уменьшении данных без уменьшения общей информативности сигнала. Такой интерфейс может содержать три модуля. Первый модуль может обеспечивать поиск, размещение и разметку длины всех нечетких повторяющихся элементов на всем исходном уровне формализации MSML. Второй модуль может быть выполнен с возможностью извлечения общих звуковых составляющих для любого набора нечетких повторяющихся фрагментов и с возможностью определения уровня связности данных путем выработки соответствующего остаточного сигнала. Третий модуль может быть выполнен с возможностью прогнозного создания результирующего аудиофрагмента путем объединения извлеченных повторяющихся элементов, соответствующих данных разметки и остаточной информации. Для минимизации требуемой исходной информации о фазе во время процесса создания звука может быть использован способ фильтрации для моделирования фазы. Этот интерфейс может быть выполнен с возможностью его использования в качестве элемента в различных областях, включая, например, поисковые машины для поиска музыки, визуализацию музыки, технологии глубокого сжатия аудиоданных и пр.

Еще один аспект процесса манипуляции включает сжатие аудиоданных с использованием иерархических повторяющихся структур формализации MSML звуковой композиции, как показано, например, на фиг. 5. Такой интерфейс улучшенного повторяющегося бесфазного кодирования использует структуры, созданные посредством макроповторяющихся звуковых примотронов высокого уровня в смысловой иерархии звука формализации MSML. В процессе декодирования могут быть использованы два типа данных: крупномасштабные данные, определяющие общую структуру формализации MSML, и данные, содержащие фрагменты исходного сигнала, описанные моделью относительно низкого уровня иерархии. Для сжатия фрагментов сигнала может быть использован обычный психоакустический кодировщик с возможным использованием в некоторых примерах внешнего маскирования сигнала. Уменьшение скорости передачи происходит благодаря исключению повторяющихся фрагментов, созданных на высоком уровне формализации MSML с сохранением мест этих фрагментов. Воспринимаемая эквивалентность повторяющихся фрагментов обеспечивает уменьшение количества ссылочных образцов.

Еще один аспект процесса манипуляции включает уменьшение полосы пропускания и скорости передачи с использованием интерфейса сжатия без потерь для формализации MSML звуковой композиции (см., например, фиг. 6А), что в некоторых примерах уменьшает количество массивов целочисленных значений, связанных с этой формализацией, путем использования улучшенного кодировщика энтропии, выполняющего только целочисленные операции без деления и оценок вторичных вероятностей. Так как кодировщик диапазона интерфейса и контекстная модель не используют математическую операцию деления, этот интерфейс можно использовать для его выполнения большинством недорогих микрокомпьютеров, не имеющим операции деления. Для повышения надежности контекстной модели интерфейса может быть использована оценка вторичной вероятности (см., например, фиг. 6В). Оценка вторичной вероятности является сложной контекстной моделью, использующей прогнозную вероятность в качестве контекста для другой модели. Оценка 2-мерной вторичной вероятности также может быть использована для объединения двух различных моделей. Оценка 2-мерной вторичной вероятности является модификацией оценки вторичной вероятности, которая имеет две входные вероятности и использует их в качестве контекста. Также может быть использован дополнительный целочисленный контекст. Этот аспект процесса манипуляции также может включать улучшение сжатия аудиосигнала и/или улучшение арифметического кодирования и контекстного моделирования для увеличения коэффициентов сжатия и скоростей обработки, благодаря чему обеспечено сжатие спектральных данных с высокой эффективностью и с более высокой скоростью. Процедура сжатия может быть полностью автоматизированной и необязательно требует предварительной инициализации различных типов аудиоданных или других цифровых данных. Она может быть достаточно гибка с точки зрения подстройки к различным размерам или количествам спектральных аудиоданных, что позволяет использовать ее с различными спектральными преобразованиями. Вместо стандартного арифметического кодировщика может быть использован более эффективный кодировщик диапазона. Применительно к потоку данных используют контекстное моделирование, созданные алгоритмические модели и алгоритмическую оптимизацию функции декодера. Этот аспект также по меньшей мере частично может быть основан на использовании технологий адаптивного кодировщика диапазона, включающих увеличение вероятности закодированного значения. Для повышения надежности контекстной модели может быть использована оценка вторичной вероятности.

Другие аспекты процессов манипуляции включают эффективную потоковую передачу аудиоданных с использованием интерфейса улучшенного ускорителя аудиоданных для формализации MSML звуковой композиции, а также использование процесса с нулевой потерей качества (Null Quality Loss (NQL) для уменьшения количества квантованных частотно-временных спектральных коэффициентов для обеспечения более быстрой доставки исходных аудиоданных или другой цифровой информации без существенной потери качества в результирующем звуке или в результирующих данных (см., например, фиг. 7А и 7В). Процесс NQL выполняет классификацию звуковых структур в формализации MSML в зависимости от их важности на основе человеческого восприятия. Интерфейс улучшенного ускорителя воссоздает квантованные частотно-временные спектральные коэффициенты исходного формата без деквантования данных или обратного транскодирования через формат РСМ. Интерфейс улучшенного ускорителя делит первоначально закодированный файл частотно-временных спектральных коэффициентов на три группы, причем коэффициенты низкочастотной спектральной группы остаются неизменными, некоторые коэффициенты промежуточной частотной группы обнуляют с использованием процесса NQL, коэффициенты из третьей группы (самые высокие частоты) исключают путем их замены наиболее сходными подгруппами коэффициентов, при этом включая их в низкочастотную и промежуточную группы и сохраняя ссылку на эту сходную подгруппу, а также, например, интегральным коэффициентом, связанным с ними, без влияния на структурные звуковые элементы или элементы, связанные с другими цифровыми данными (то есть гармоники и всплески).

Еще один аспект процесса манипуляции включает уменьшение размера файла с аудиоданными или с другими цифровыми данными или количества этих данных с использованием интерфейса кодирования с использованием аффинных преобразований для формализации MSML звуковой композиции (см., например, фиг. 8А) с сохранением в случае аудиоданных полной целостности исходного воспроизведения звука в виде аффинного преобразования неизменных звуковых примотронов, что ведет к уменьшению энтропии сигнала. Аффинный интерфейс, связанный с формализацией MSML, может быть использован в дополнение к любой процедуре кодирования аудиоданных или других цифровых данных для увеличения коэффициента сжатия, а также к процессу основного сжатия для класса сигналов, в которых частотно-временные аффинно-неизменные микрофрагменты несут существенную часть звуковой информации или информации, связанной с другими цифровыми данными. Этот интерфейс кодирования с использованием аффинных преобразований выполнен с возможностью использования неизменных спектральных микрофрагментов цифрового сигнала (аудиосигнала или другого сигнала) для увеличения коэффициента сжатия сигнала при использовании этого интерфейса совместно с формализацией MSML. Во время обработки полный спектральный диапазон делят на два поддиапазона, в каждом из которых независимо и с использованием разного шага проводят поиск неизменных спектральных фрагментов в предыдущей части звукового сигнала или сигнала, связанного с другими цифровыми данными. Во время поиска неизменных фрагментов используют аффинное амплитудное, временное преобразование и аффинное преобразование, связанное со спектральным смещением. Каждый найденный фрагмент вычитают из исходного спектрального фрагмента, а остаток затем обрабатывают как разность спектральных компонентов, таким образом устраняя существенную избыточность спектральных данных. Соответствующая схема декодирования для такого интерфейса кодировки с использованием аффинных преобразований представлена, например, на фиг. 8В, а используемая при необходимости схема быстрого декодирования для такого интерфейса кодировки с использованием аффинных преобразований представлена, например, на фиг. 8С.

Специалисту понятно, что раскрытые здесь различные аспекты процессов манипуляции приведены исключительно как примеры, и их не следует никоим образом рассматривать как ограничительные в отношении различных процессов манипуляции, которые могут быть использованы как в настоящем, так и в будущем применительно к структурированию данных, связанных с цифровой информацией, для уменьшения размера файла с цифровыми данными, то есть уменьшения реального количества информации или данных, содержащего этот файл с цифровыми данными, с удержанием ценности информации файла со структурированными цифровыми данными в пределах, заданных пороговым значением ценности информации исходного файла с цифровыми данными. Специалисту также понятно, что ценность информации файла со структурированными цифровыми данными в некоторых примерах может иметь намного меньшее количество данных или информации по сравнению с исходным файлом с цифровой информацией, но может также иметь информативность (то есть ценность информации) в пределах, заданных пороговым значением исходного файла с цифровой информацией, и в некоторых примерах может даже иметь большую информативность, чем исходный файл с цифровыми данными. Такое структурирование данных в соответствии с изложенными здесь принципами и в соответствии с различными аспектами настоящего изобретения проиллюстрированы и представлены подробнее, например, на фиг. 9-11.

В конкретных аспектах последовательное использование процессов манипуляции с получением результирующей ценности информации в пределах, заданных выбранным пороговым значением исходной ценности информации, может дополнительно включать последовательное использование процессов манипуляции для сохранения верности воспроизведения первичного файла со структурированной цифровой информацией относительно исходного файла с цифровой информацией, причем выбранное пороговое значение является, например, ограничением человеческого восприятия, то есть, как обсуждалось выше в отношении критериев воспринимаемой информации или в случае аудиоданных, например, спектральными ограничениями человеческого слуха.

В процессе последовательного использования процессов манипуляции для создания результирующих файлов с цифровой информацией, эти файлы создают таким образом, что каждый результирующий файл с цифровой информацией содержит набор объектов и кластеров объектов, причем каждый объект и кластер объектов имеет соответствующее определение. В частности, по меньшей мере один процесс манипуляции может быть использован применительно к удалению по меньшей мере одного элемента обрабатываемого файла с цифровой информацией и/или к представлению комбинации множества элементов обрабатываемого файла с цифровой информацией посредством представительного элемента, первого индикатора, связанного с соотношением между представительным элементом и по меньшей мере одним из указанного множества элементов в комбинации, и второго индикатора, связанного с соотношением по меньшей мере между двумя из указанного множества элементов в комбинации. Результирующие файлы с цифровой информацией создают таким образом, что объекты и кластеры объектов в них содержат по меньшей мере один из указанных представительных элементов, а определение, связанное с каждым объектом и кластером объектов, содержит указанный первый индикатор соотношения, а при необходимости содержит указанный второй индикатор соотношения, связанный с указанным по меньшей мере одним из представительных элементов. В некоторых примерах указанные определения могут быть включены с соответствующим набором объектов и кластеров объектов в каждый результирующий файл с цифровой информацией (то есть совместно сохранены в этом файле). В других примерах, однако, указанные определения, связанные с набором объектов и кластеров объектов, можно удерживать (то есть хранить) отдельно от каждого соответствующего результирующего файла с цифровой информацией. Каждый результирующий файл с цифровой информацией может быть создан таким образом, что каждый последующий результирующий файл с цифровой информацией содержит любые распознанные конфигурации объектов и кластеров объектов предыдущего результирующего файла с цифровой информацией.

Еще в одном аспекте процессы манипуляции могут быть последовательно использованы до тех пор, пока последовательное использование процессов манипуляции не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией. В этих примерах последний результирующий файл с цифровой информацией может иметь информационную примотронную структуру, содержащую набор первичных объектов, кластеров первичных объектов и любые связанные соотношения между ними. По использовании или после использования процессов манипуляции каждый последовательный результирующий файл с цифровой информацией и последний результирующий файл с цифровой информацией могут быть проанализированы для определения статистических корреляций между последующими объектами в последующем файле с цифровой информацией и предыдущими комбинациями объектов в предыдущем файле с цифровой информацией. Кроме того, для любой статистической корреляции, по меньшей мере удовлетворяющей соответствующему пороговому значению, индикатор корреляции соответствующего последующего объекта и предыдущей комбинации объектов сохраняют для анализа последующего исходного файла с цифровой информацией.

В некоторых примерах каждый последовательный результирующий файл с цифровой информацией может быть проанализирован для определения по меньшей мере одной объективной корреляции между комбинацией предыдущих объектов и по меньшей мере одного межъобъектного отношения между предыдущими объектами в комбинации в предыдущем файле с цифровой информацией. Указанную по меньшей мере одну объективную корреляцию и указанное по меньшей мере одно межъобъектное отношение затем связывают с соответствующим последующим объектом в последующем файле с цифровой информацией. Указанная по меньшей мере одна объективная корреляция и указанное по меньшей мере одно межъобъектное отношение, связанные с соответствующим последующим объектом, по множеству последующих объектов могут, таким образом, совместно образовывать набор объективных корреляций, представляющих соотношения, связанные с набором первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

В других примерах каждый последовательный результирующий файл с цифровой информацией может быть проанализирован для определения по меньшей мере одной объективной корреляции между комбинацией предыдущих объектов в предыдущем файле с цифровой информацией, и по меньшей мере одно межъобъектное отношение между предыдущими объектами в комбинации может быть присвоено или назначено иным образом. Указанная по меньшей мере одна объективная корреляция и указанное по меньшей мере одно межъобъектное отношение затем могут быть связаны с соответствующим последующим объектов в последующем файле с цифровой информацией. Указанная по меньшей мере одна объективная корреляция и указанное по меньшей мере одно межъобъектное отношение, связанные с соответствующим последующим объектом, по множеству последующих объектов могут, таким образом, совместно образовывать набор объективных корреляций, представляющих соотношения, связанные с набором первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

В каждом из примеров набор первичных объектов и кластеров первичных объектов в информационной примотронной структуре может быть затем интерпретирован путем статистической оценки различных комбинаций объективных корреляций в наборе объективных корреляций и, для любой комбинации объективных корреляций, по меньшей мере удовлетворяющей статистическому пороговому значению, эти комбинации связывают с первичными объектами и с кластерами первичных объектов как контекстную интерпретацию набора первичных объектов и кластеров первичных объектов в информационной примотронной структуре. Затем может быть синтезирован представительный файл с цифровой информацией, связанный с исходным файлом с цифровой информацией, например путем использования контекстной интерпретации применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

Далее на основе анализа каждого последовательного результирующего файла с цифровой информацией, по меньшей мере один объект, выбранный из предыдущих объектов, последующих объектов и первичных объектов и кластеров первичных объектов, может быть связан с одной из множества характеристик исходного файла с цифровой информацией. При этом может быть определено размещение множества характеристик по отношению к длительности исходного файла с цифровой информацией, а с ним может быть обеспечена корреляция распределения указанного по меньшей мере одного объекта. В этих примерах может быть создан файл со сводными данными, содержащий обобщенное представление распределения указанного по меньшей мере одного объекта, связанного с каждой из указанного множества характеристик, по длительности исходного файла с цифровой информацией.

В примерах, в которых последовательное использование процессов манипуляции до тех пор, пока оно не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией, количество и порядок процессов манипуляции, последовательно используемых применительно к последующим результирующим файлам с цифровой информацией с получением последнего результирующего файла с цифровой информацией, имеющего информационную примотронную структуру, может быть зарегистрировано, причем количество процессов манипуляции связано с соответствующими уровнями иерархии информации.

При этом, в соответствии с некоторыми аспектами, представительный файл с цифровой информацией, связанный с исходным файлом с цифровой информацией, может быть синтезирован, например, в соответствии с условным процессом, включающим следующие этапы:

1. использование любого применимого индикатора корреляции применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними;

2. если ни один применимый индикатор корреляции не определен на этапе 1, использование контекстной интерпретации применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними; и

3. если использование контекстной интерпретации на этапе 2 ниже пороговой ценности информации, связанной с исходной ценностью информации, использование исходного обратного процесса манипуляции применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними, причем исходный обратный процесс манипуляции является первой манипуляцией при обратном порядке процессов манипуляции.

В некоторых примерах применительно к предыдущей комбинации объектов, определенной на основе набора первичных объектов и кластеров первичных объектов в информационной примотронной структуре, может быть использован условный процесс, включающий любой применимый индикатор корреляции, соответствующую контекстную интерпретацию или следующий обратный процесс манипуляции при обратном порядке процессов манипуляции, соответствующий предыдущей комбинации объектов, для определения следующей предыдущей комбинации объектов, ей соответствующей. Таким образом, далее этот условный процесс может быть последовательно использован применительно к следующей предыдущей комбинации объектов до тех пор, пока результирующая предыдущая комбинация объектов не будет связана с исходным уровнем иерархии информации, причем результирующий предыдущий файл с цифровой информацией, таким образом, соответствует синтезированному представительному файлу с цифровой информацией.

Как указано выше, формализация MSML может относиться к способу структурирования информации, которая может содержать, например, цифровую информацию, например аудиоданные. Соответственно, еще один аспект настоящего изобретения может включать способ развития примотронов на различных уровнях формализации MSML (то есть иерархическая структура) для анализа звука и аудиоданных, причем развитие этих примотронов может быть осуществлено путем использования применительно к общей формализации MSML независимых интерфейсов.

Эти интерфейсы могут включать, например, процессы манипуляции для анализа и модификации структур данных формализации MSML для обеспечения этого развития примотронов. Этот аспект также может включать способ синтеза звука, использующий набор или комбинацию примотронов, определенные совместно с формализацией MSML, и конкретные инструкции и правила, определяющие сложный сигнал, обеспечиваемый формализацией MSML, путем последовательного и/или одновременного использования применительно к ним указанных интерфейсов, а также любое развитие этих примотронов, связанное с ними, для синтеза или воссоздания звукового или аудиосигнала или файла, по существу соответствующего исходному файлу с оцифрованными аудиоданными.

В одном из примеров этих интерфейсов (представляющем процесс манипуляции, который может быть использован применительно к цифровому аудиофайлу или другому информационному файлу), используемых применительно к общей формализации MSML, уменьшение полосы пропускания и скорости передачи аудиоданных может быть реализовано с использованием интерфейса бесфазного кодирования для формализации MSML звуковой композиции (см., например, фиг. 3А). Этот интерфейс бесфазного кодирования может быть, например, выполнен с возможностью учета иерархии ценности воспринимаемой информации для определения, какие данные в файле могут быть сохранены, преобразованы или исключены. В частности, после того, как сигнал с цифровыми аудиоданными был проанализирован и была определена соответствующая формализация MSML, кодировщиком диапазона, например, может быть использовано сжатие без потерь для обработки 1) гармонических структур в виде 2-мерного растра; 2) огибающей полной энергии с высоким временным разрешением для нескольких диапазонов частот; и 3) отношения энергии шума к полной энергии. Способ бесфазного кодирования может быть использован применительно к формализации MSML, например, для выполнения заданий, имеющих целью выбранное уменьшение данных в формализации MSML с сохранением при этом звуковых структур с высокой информативностью (то есть с высокой ценностью информации), связанных со звуковой композицией, например посредством сравнения с известными звуковыми показателями. В целом этот способ выполняет сравнение звуковых объектов различного уровня в пространстве для определения целостности структур и степени их повреждения, которое может иметься в пределах уменьшенного (то есть с меньшим количеством информации или с меньшей скоростью передачи) представления аудиосигнала после фильтрации и/или обработки, что обеспечивает выбор подходящего параметра для каждого звукового элемента для уменьшения количества информации и/или скорости передачи с сохранением информативности. В некоторых примерах интерфейс бесфазного кодирования соответственно выполнен таким образом, что зависимость сигнала от времени необязательно сохраняется, и сохраняются звуковые структуры, а не форма волны сигнала, что приводит к существенному уменьшению полосы пропускания и скорости передачи. Для достижения большей скорости уменьшения полосы пропускания и скорости передачи аудиоданных структуры более информативного уровня формализации MSML звуковой композиции могут быть такими, что они поддерживают постоянные параметры. Параметры структур относительно менее информативного уровня, таким образом, могут быть сохранены с меньшей точностью или могут быть созданы при декодировании, например с использованием случайных значений или соответствующих параметров.

Еще в одном примере таких интерфейсов и/или процессов манипуляции, которые могут быть использованы применительно к общей формализации MSML, интерфейс структурного анализа аудиоданных для формализации MSML звуковой композиции может быть выполнен с возможностью извлечения нечетких повторяющихся элементов из таких музыкальных композиций (см. например фиг. 4А и 4В). Этот интерфейс структурного анализа может быть выполнен с возможностью обработки аудиоданных, связанных с файлом с аудиоданными, связанным с формализацией MSML, для идентификации нечетких повторяющихся циклических элементов на относительно низком уровне иерархии формализации MSML. В этих примерах идентифицированные как похожие нечеткие повторяющиеся циклические элементы могут быть заменены представительным элементом и соответствующими хаотическими параметрами для обеспечения таким образом уменьшения количества данных и/или информации или скорости передачи без существенного уменьшения общей ценности информации или информативности. Такой интерфейс может содержать, например, три модуля. Первый модуль может быть выполнен с возможностью обеспечения поиска, размещения и разметки длины всех нечетких повторяющихся элементов на всем исходном уровне формализации MSML. Второй модуль может быть выполнен с возможностью извлечения общих звуковых составляющих для любого набора нечетких повторяющихся фрагментов и с возможностью определения уровня связности данных путем выработки соответствующего остаточного сигнала. Третий модуль может быть выполнен с возможностью прогнозного создания результирующего аудиофрагмента путем объединения извлеченных повторяющихся элементов, соответствующих данных разметки и остаточной информации. Для минимизации требуемой исходной информации о фазе во время процесса создания звука для остаточного аудиофрагмента используют способ фильтрации для моделирования фазы. Этот интерфейс также может быть выполнен с возможностью его использования в различных областях, включая поисковые машины для поиска музыки, визуализацию музыки, технологии глубокого сжатия аудиоданных и пр.

Еще один пример интерфейса и/или процесса манипуляции, который может быть использован применительно к общей формализации MSML, включает сжатие аудиоданных с использованием иерархических повторяющихся структур формализации MSML звуковой композиции (см. например фиг. 5). Этот интерфейс улучшенного повторяющегося бесфазного кодирования идентифицирует структуры, созданные посредством макроповторяющихся звуковых или аудиопримотронов высокого уровня в иерархии звука формализации MSML с обеспечением таким образом дальнейшего уменьшения количества информации и/или данных или скорости передачи без существенного уменьшения общей ценности информации или информативности. В процессе кодирования используют два типа данных: крупномасштабные данные, определяющие общую структуру формализации MSML, и данные, содержащие фрагменты исходного сигнала, описанные относительно низким уровнем иерархии. Для сжатия фрагментов сигнала может быть использован обычный психоакустический кодировщик с возможным использованием в некоторых примерах внешнего маскирования сигнала. Уменьшение скорости передачи происходит благодаря исключению повторяющихся фрагментов, определенных на высоком уровне иерархии формализации MSML с сохранением или поддержанием иным образом мест этих фрагментов. Воспринимаемая эквивалентность повторяющихся фрагментов может обеспечивать уменьшение количества ссылочных образцов, необходимых для сравнений.

Еще один пример интерфейса и/или процесса манипуляции, который может быть использован применительно к общей формализации MSML, включает уменьшение полосы пропускания и скорости передачи с использованием интерфейса сжатия без потерь для формализации MSML звуковой композиции (см., например, фиг. 6А), который может быть выполнен с возможностью уменьшения количества массивов целочисленных значений, связанных с формализацией MSML, путем использования улучшенного кодировщика энтропии, выполняющего только целочисленные операции без деления и оценок вторичных вероятностей. Так как кодировщик диапазона интерфейса и контекстная модель не используют математическую операцию деления, этот интерфейс можно использовать со многими недорогими компьютерами, не имеющими операции деления, и/или этот интерфейс могут исполнять такие микрокомпьютеры. Для повышения надежности контекстной модели интерфейса можно использовать оценку вторичной вероятности (см., например, фиг. 6В). Оценка вторичной вероятности является сложной контекстной моделью, использующей прогнозную вероятность в качестве контекста для другой модели. То есть, например, оценка 2-мерной вторичной вероятности также может быть использована для объединения двух различных моделей. Оценка 2-мерной вторичной вероятности является модификацией оценки вторичной вероятности, которая использует две входные вероятности для определения контекста. В некоторых примерах также может быть использован дополнительный целочисленный контекст.

Еще один пример интерфейса и/или процесса манипуляции, который может быть использован применительно к общей формализации MSML, включает сжатие аудиосигналов для улучшения арифметического кодирования и контекстного моделирования для увеличения таким образом коэффициентов сжатия и скоростей обработки и обеспечения сжатия спектральных данных с высокой эффективностью и с более высокой скоростью. Такой способ сжатия может быть полностью автоматизированным и не требует предварительной инициализации различных типов аудиоданных. Он достаточно гибок для подстройки к различным размерам спектральных аудиоданных, что позволяет использовать его с различными спектральными преобразованиями. Вместо стандартного арифметического кодировщика используют более эффективный кодировщик диапазона. Применительно к потоку данных используют контекстное моделирование, созданные алгоритмические модели и алгоритмическую оптимизацию функции декодера. Этот аспект также по меньшей мере частично основан на использовании технологий адаптивного кодировщика диапазона, включающих увеличение вероятности закодированного значения. Для повышения надежности контекстной модели может быть использована оценка вторичной вероятности.

Еще один пример интерфейса и/или процесса манипуляции, который может быть использован применительно к общей формализации MSML, включает эффективную потоковую передачу аудиоданных с использованием интерфейса улучшенного ускорителя аудиоданных для формализации MSML звуковой композиции, а также использование процесса с нулевой потерей качества (Null Quality Loss (NQL) для уменьшения количества квантованных частотно-временных спектральных коэффициентов для обеспечения таким образом более быстрой доставки аудиоданных без существенной потери качества в результирующем звуке (см., например, фиг. 7А и 7В). Процесс NQL выполняет классификацию звуковых структур в формализации MSML в зависимости от их важности на основе сравнения, основанного, например, на ограничении или пороговом значении человеческого восприятия. То есть, например, потеря качества информации является минимальной, если вообще происходит, если количество информации уменьшено до данных, которые примерно соответствуют ограничению или пороговому значению человеческого восприятия или превышают его. Интерфейс улучшенного ускорителя может быть выполнен с возможностью воссоздания квантованных частотно-временных спектральных коэффициентов исходного формата без деквантования данных или обратного транскодирования через формат РСМ. Интерфейс улучшенного ускорителя может, например, делить первоначально закодированный файл частотно-временных спектральных коэффициентов на три группы, причем коэффициенты низкочастотной спектральной группы остаются неизменными, некоторые коэффициенты промежуточной частотной спектральной группы могут быть обнулены с использованием процесса NQL, коэффициенты из третьей группы (самые высокие частоты) могут быть исключены путем их замены наиболее сходными подгруппами коэффициентов с включением их при этом в низкочастотную и промежуточную группы и с сохранением ссылки на эту искомую подгруппу, а также интегральным коэффициентом без влияния на структурные звуковые элементы (гармоники и всплески).

Еще один пример интерфейса и/или процесса манипуляции, который может быть использован применительно к общей формализации MSML, включает уменьшение размера файла с аудиоданными (количества информации или скорости передачи) с использованием интерфейса кодирования с использованием аффинных преобразований для формализации MSML звуковой композиции (см., например, фиг. 8А) с сохранением целостности (ценности информации) исходного файла с аудиоданными. Такой интерфейс может реализовывать аффинное преобразование неизменных звуковых примотронов, что ведет к уменьшению энтропии сигнала (то есть большее структурирование обеспечивает меньшую энтропию и, возможно, уменьшение количества информации или скорости передачи). Интерфейс с использованием аффинного преобразования, связанный с формализацией MSML, может быть использован в дополнение к любой процедуре кодирования аудиоданных, например описанных здесь, для увеличения коэффициента их сжатия, а также для обеспечения процесса основного сжатия для звуковых и/или аудиосигналов, в которых частотно-временные аффинно-неизменные микрофрагменты являются существенными по отношению к ценности звуковой информации. Этот интерфейс кодирования с использованием аффинных преобразований, который может быть использован совместно с формализацией MSML, выполнен с возможностью использования неизменных спектральных микрофрагментов цифрового аудиосигнала для увеличения коэффициента сжатия этого сигнала. Во время обработки полный спектральный диапазон делят на два поддиапазона, в каждом из которых независимо и с использованием разного шага проводят поиск неизменных спектральных фрагментов в предыдущей части звукового сигнала. Во время поиска неизменных фрагментов используют аффинное амплитудное, временное преобразование и аффинное преобразование, связанное со спектральным смещением. Каждый найденный фрагмент вычитают из исходного спектрального фрагмента, а остаток затем обрабатывают как разность спектральных компонентов, таким образом устраняя существенную избыточность спектральных данных и уменьшая благодаря этому количество информации или скорость передачи в процессе.

На практике, как показано, например, на фиг. 9-11, файл с цифровыми аудиоданными представлен матрицей битов, которая затем может быть соответствующим образом проанализирована на предмет конфигураций битов, представляющих различные уровни информативности. Такие базовые конфигурации битов могут быть названы «примотронами» в соответствии с различными аспектами настоящего изобретения, здесь описанными. Так как матрица битов может иметь множество измерений и так как конфигурации битов могут иметь различные структуры и/или комбинации, распространяющиеся более чем на одно измерение матрицы битов (то есть обеспечивающие различные уровни информативности), примотроны могут быть охарактеризованы как многоструктурные, многоуровневые объекты, обеспечивающие новую парадигму цифровой формализации мультимедийных данных, таких как звук или аудиоданные. Такая процедура формализации и файл с формализованными цифровыми аудиоданными, созданный с ее помощью, раскрыты в настоящей заявке, также как различные способы, которыми примотроны могут быть идентифицированы или иным образом определены, и различные способы, которыми примотроны могут быть (повторно) объединены или иным образом проанализированы для синтеза представления исходного файла с цифровыми аудиоданными в пределах, заданных его пороговым значением. Так как один из аспектов настоящего изобретения включает уменьшение количества информации или скорости передачи исходного файла с цифровыми мультимедийными данными с сохранением при этом количества информации в пределах, заданных его пороговым значением, специалисту понятно, что могут быть реализованы и другие выгоды и преимущества, относящиеся, например, к передаче данных, хранению данных, защите данных и пр., как описано ниже.

Так как примотрон, определенный аспектами раскрытого здесь способа формализации, представляет конфигурацию или комбинацию по меньшей мере одного бита или элемента данных на различных уровнях и/или в различных измерениях матрицы битов файла с цифровыми аудиоданными, следовательно, этот файл может быть впоследствии представлен в виде комбинации таких примотронов, идентифицированных и/или иным образом определенных как подлежащие включению в нее. Иными словами, файл с цифровыми аудиоданными может быть подвергнут формализации MSML, а затем формализация MSML может быть проанализирована для определения комбинации таких примотронов или элементов данных, имеющихся в ней. Этот анализ может быть, например, охарактеризован как «живая система» взаимодействия звуковых конфигураций в конкретных условиях в пределах ограниченного количества информации. Развитие или «история жизни» этих конфигураций могут быть далее охарактеризованы с помощью принципов развития информации в динамической хаотической системе, определенной конечным числом структур, а именно примотронов, каждый из которых имеет свое «время жизни», которое может варьироваться от долей секунды до нескольких минут в пределах временной или частотно-временной длительности файла с цифровыми аудиоданными. Так как файл с цифровыми аудиоданными теперь представлен такой комбинацией или живой системой примотронов, каждый из которых представляет поднабор битов матрицы битов для другой структуры или объекта, связанных с этим файлом с цифровыми аудиоданными, файл с аудиоданными MSML, включающий идентифицированную комбинацию примотронов, может, например, иметь уменьшенный размер файла данных (количество информации) по сравнению с исходным файлом с оцифрованными аудиоданными с сохранением при этом качества информации файла с цифровыми аудиоданными в пределах, заданных пороговым значением восприятия исходного файла с цифровыми аудиоданными. В некоторых примерах такое уменьшение может быть, например, от примерно 20 раз до примерно 60 раз меньше, чем размер исходного файла данных, хотя может быть достигнуто уменьшение и более чем в 60 раз, например, когда далее примотроны и связанные способы идентифицированы или иным образом определены и уточнены, причем эти примотроны могут обеспечивать уменьшение количества информации или скорости передачи конкретного файла с цифровыми аудиоданными с сохранением при этом информативности этого файла в пределах, заданных пороговым значением восприятия исходного файла с цифровыми аудиоданными. В других примерах может быть возможно представление поднабора комбинации примотронов или других элементов данных в файле данных еще более общим объектом с дальнейшим уменьшением таким образом размера файла данных по сравнению с исходным файлом с цифровыми аудиоданными (и/или его формализация MSML). Соответственно, такая парадигма создает основу в виде формата высокоструктурированных, многофункциональных цифровых данных, приспособленного для очень компактного и эффективного хранения и воспроизведения любого материала, представленного в виде основанного на гармониках или созданного с использованием гармоник аудиосигнала с высокой верностью воспроизведения (включая музыку, голос и другие основанные на звуке мультимедийные данные высокого качества) в пределах, заданных пороговым значением исходного сигнала с цифровыми данными.

При идентификации различных комбинаций элементов, образующих различные примотроны или другие элементы данных результирующий представительный элемент также может быть связан с конкретными параметрами (называемыми здесь хаотическими параметрами или, по-другому, файлом данных, связанным с конкретными характеристиками представительного элемента), представляющими, например, контекст или другие характеристики представительного элемента и/или элементов данных или примотронов, на основе которых был определен представительный элемент. Эти параметры, например, могут включать отношения между элементами данных одного уровня иерархии, отношения между элементами данных разных уровней иерархии, отношения между элементами данных низкого уровня иерархии и их отношение с элементом данных высокого уровня иерархии. Кроме того, так как эти примотроны определены в пределах конечного ограниченного количества информации, идентифицированные конфигурации, связанные с этими примотронами, могут быть связаны с различными соответствующими аспектами файла с цифровыми аудиоданными. Например, некоторые примотроны могут представлять гармоники, а другие примотроны могут представлять вокальные произведения, конкретные инструменты, специфичные частоты или частотные диапазоны, акустические характеристики концертной площадки или любые другие идентифицируемые аспекты файла с цифровыми аудиоданными, связанные с музыкальным или другим основанным на гармониках концерте.

Отсюда, таким образом, следует, что одним из аспектов формализации MSML файла с цифровыми аудиоданными (то есть представления файла с оцифрованными аудиоданными посредством комбинации примотронов) является то, что биты матрицы битов, которые необязательно идентифицированы и/или определены как компоненты примотрона из комбинации примотронов, могут быть названы шумом, то есть белым шумом или другим периферийным шумом, который необязательно существенен для природы файла с цифровыми аудиоданными, преобразуемого в формализацию MSML, то есть имеет ограниченное негативное влияние на качество информации файла с цифровыми аудиоданными. В этих примерах шум может не быть включен в представление MSML или может быть по-другому исключен из него. Однако могут быть и такие примеры, в которых может быть необходимо оставить часть «шума» или весь «шум» в представлении MSML. Например, в примерах, в которых файл с цифровыми аудиоданными представляет живой музыкальный концерт, часть шума может относиться к акустическим характеристикам концертной площадки или к реакции аудитории на концерт. Таким образом, в некоторых примерах может быть необходимо включить такой шум в представление MSML файла с цифровыми аудиоданными для обеспечения в контенте аудиофайла живого звука, окружающей обстановки или другого контекста. При этом «необходимый шум» может быть разделен на шумовые элементы, каждый из которых представлен соответствующим периферийным примотроном. Таким образом, по меньшей мере один примотрон или их различные комбинации могут быть выборочно включены в представление MSML. То есть эти периферийные примотроны могут быть включены в представление MSML при необходимости, а в другом случае могут быть удалены из него.

Еще один аспект, связанный с вышесказанным, состоит в том, что представление MSML исходного файла данных имеет вид комбинации примотронов или других элементов данных, и так как периферийные примотроны могут быть идентифицированы и/или определены и выборочно включены в представление MSML или исключены из него, может быть возможно идентифицировать и/или определить и выборочно включить в представление MSML или исключить из него по меньшей мере одну подкомбинацию комбинации примотронов. Например, что касается вышеописанного живого музыкального концерта, комбинация примотронов, включенных в представление MSML, может включать только музыку от инструментов, на которых играют. В этих примерах может быть возможно, например, идентифицировать музыку от отдельных инструментов, так что концерт может быть разделен на «дорожки», каждая из которых связана с соответствующим инструментом. Соответственно, одновременная и синхронизированная во времени эффективная агрегированная обработка информации в отношении аудиосигнала и связанной с ним и ее отслеживаемая сетевая доставка могут быть динамически оптимизированы в мобильной и наземной инфраструктуре интернет-протокола, причем такие представленные с использованием MSML аудиофайлы могут быть способны одновременно нести и динамически извлекать как плоское, так и объемное представления сигнала с высокой четкостью (включая, например стерео 2.0 и звук вокруг 5.1) в одном файле данных с низкой скоростью передачи и могут быть также способны извлекать в режиме реального времени поющий голос с качеством звука, обеспечивающим полную прозрачность по отношению к исходному источнику звука и его воспроизводимость. Так как одной из характеристик, присущих представлению MSML файлов с цифровыми аудиоданными, является существенно меньшие количество информации или скорость передачи, при ценности информации в пределах, заданных пороговым значением качества информации исходного файла с цифровыми аудиоданными, или даже выше, эти примеры возможностей, раскрытые здесь, могут существенно снижать затраты на хранение, передачу, вещание цифровых данных и полосу пропускания, связанные с ориентированными на мультимедийные данные системы и сети, создавая новые доходы и увеличивая монетизацию контента.

Например, еще один аспект, связанный с возможностью разложения исходного файла с аудиоданными или другого его разделения в соответствии с конкретными характеристиками в отношении представления MSML, состоит в том, что в некоторых примерах может быть возможно создавать или переносить конкретные вторичные примотроны для их выборочного включения в представление MSML. Например, в случае вышеупомянутого живого музыкального концерта, могут быть сняты цифровым образом или воссозданы и затем преобразованы в представление MSML в виде по меньшей мере одного примотрона акустические характеристики другой концертной площадки. В этих примерах может быть возможно удалить компонент, связанный с концертной площадкой, из представления MSML файла с цифровыми аудиоданными, а затем заменить его на примотрон или примотроны, связанные с другой концертной площадкой. Для специалиста очевидно, что примотроны могут быть размещены в различных комбинациях для обеспечения необходимого представления MSML независимо от того, происходят или нет примотроны из исходного файла с цифровыми аудиоданными.

При осуществлении концепции размещения примотронов во многих различных комбинациях для обеспечения необходимого представления MSML для специалиста очевидно, что примотроны или другие элементы данных могут быть созданы с обеспечением представления других объектов в представлении MSML файла с цифровыми аудиоданными. Например, один такой примотрон или другой элемент данных может быть связан с уникальными знаками, представляющими, например, владельца представления MSML файла с цифровыми аудиоданными. Конкретнее, после преобразования файла с цифровыми аудиоданными в формат MSML, может быть создана уникальная комбинация примотронов или других элементов данных для идентификации конкретного пользователя, имеющего право на представление MSML файла с цифровыми аудиоданными, является ли этот пользователь, например, владельцем контента, лицензиатом контента, приобретателем контента или другим лицом, приобретшим право доступа к контенту. В некоторых случаях уникальные знаки могут быть выполнены с возможностью сохранения части представления MSML (то есть «нестираемыми» или неудаляемыми другим образом) независимо от манипуляций с файлом с представлением MSML, выполняемых пользователем или последующим владельцем (владельцами). Соответственно, как очевидно для специалиста, уникальные знаки могут в некоторых примерах обеспечивать конкретное представление MSML исходного файла с цифровыми аудиоданными «водяными знаками» или другим защитным признаком. Такие уникальные знаки в некоторых примерах независимо от того, выполнены ли они с возможностью сохранения части представления MSML или нет, также могут быть выполнены или размещены с возможностью представления других аспектов файла с представлением MSML, причем такие уникальные знаки могут содержать, например, метаданные (ключевое слово, ссылку, классификацию, защитные данные и пр.), как очевидно для специалиста.

В некоторых примерах уникальные знаки, включенные в представление MSML файла с цифровыми мультимедийными данными, могут быть выполнены видными или по-другому отслеживаемыми через специальный канал данных, сконфигурированный с возможностью функционирования совместно с закодированным гармоническим сигналом для динамического отражения и отображения межструктурной информации во временном пространстве с обеспечением воспроизведения аудиоданных, синхронизированных с внешними или внутренними событиями. Например, после определения примотронной структуры конкретного файла с цифровыми мультимедийными данными, примотроны, содержащие файл, включающий уникальные знаки, могут быть размещены во временном пространстве. Зная структуру или конкретные характеристики конкретных примотронов и их место во временном пространстве совместно с длительностью файла с цифровыми мультимедийными данными, можно приводить в действие конкретные события или обеспечивать конкретные появления информации, связанной с ними. Такие внешние события могут включать, например, видеоданные или программирующую последовательность в игре или фильме, текст песни, обложку, информацию об исполнителе и композиторе или ноты, различные визуальные и пиротехнические спецэффекты, включая внутреннюю и наружную подсветку или визуальную аудиокнигу, целевую рекламу или любую другую информацию, связанную с воспроизводимыми звуковыми мультимедийными данными. То есть, например, в специальном канале данных примотрон или комбинация примотронов могут быть назначены как приводящие в действие конкретное внешнее событие или эффект. Если со специальным каналом данных объединен формализованный с использованием MSML аудиофайл или этот аудиофайл включен в этот канал иным образом, появления конкретных примотронов или их комбинаций в течение длительности формализованного с использованием MSML аудиофайла служит для приведения в действие соответствующего внешнего события или эффекта в конкретное время при воспроизведении формализованного с использованием MSML аудиофайла, что увеличивает информативность и индивидуальность получаемых мультимедийных данных и существенно увеличивает их развлекательную ценность и монетизацию.

В частности, в случае аспекта, связанного со специальным каналом данных, в процессе кодирования и преобразования исходных аудиоданных (форматы PCM, wav, aiff) и файлов в форматах МР3, ААС, OGG, WMA с высокой скоростью передачи (то есть около 192 кбит/сек. или выше) в формализацию MSML идентифицируют и извлекают набор структур, имеющих уникальные свойства и характеристики, представляющие аудиоданные (то есть примотроны и многоуровневые описания, их использующие). Представление аудиоданных таким образом обеспечивает интеллектуальный полностью интегрированный интерактивный канал данных совместно с формализацией MSML. Например, канал данных может быть выполнен с возможностью включения в него различной информации о формализации MSML аудиоданных и других мультимедийных данных и связанной с этой формализацией. В частности, канал данных может быть сконфигурирован с возможностью получения данных, указывающих по меньшей мере на одно событие, связанное с конкретным примотроном и/или многоуровневым описательным элементом формализации MSML. В других примерах данные могут быть связаны в целом со всей музыкальной композицией. Например, такое событие может включать аудиоатрибут и/или звуковой атрибут, связанный с нотой; по меньшей мере с одним текстом с конкретными временной привязкой и длительностью, связанными со словом; с нотами, связанными с музыкальной композицией; с идентификацией лицензии; с информацией об авторском праве и юридической информацией; а также с различными вспомогательными данными, такими как ссылки на другие аудиоданные, варианты выбора изображения и видеоданных, сопутствующие текстовые материалы, включая новости, события и пр.

В одном из примеров звуковая композиция может быть переработана в соответствующую формализацию MSML, включая вышеупомянутые примотроны и многоуровневые описания. При подготовке формализации MSML соответствующий файл данных может содержать в себе данные, способные взаимодействовать с внешними данными (то есть файл данных может быть выполнен с возможностью взаимодействия с каналом данных). Эти внешние данные могут быть сконфигурированы с возможностью соотнесения конкретного примотрона, конкретного многоуровневого описания или их комбинации с конкретным действием, событием, эффектом и пр. Например, внешние данные могут быть выполнены с возможностью выполнения операции, относящейся к декоративным водным фонтанам. Соответственно, может быть обеспечена корреляция различных характеристик звуковой композиции с различными рабочими характеристиками водных фонтанов. В конкретных аспектах, например, может быть обеспечена корреляция громкости на протяжении звуковой композиции с громкостью или давлением воды, направляемой по меньшей мере из одного фонтана; может быть обеспечена корреляция различных инструментов с различными подгруппами фонтанов; может быть обеспечена корреляция текста с подсветкой и его привязка по времени к этой подсветке, подсвечивающей различные фонтаны. Соответственно, различные примотроны и многоуровневые описания, определенные на основе формализации MSML в отношении конкретной звуковой композиции, могут быть автоматически выполнены с возможностью приведения в действие конкретного приложения или с возможностью другого воздействия на него. Таким образом, конкретное приложение может быть легко изменено путем простого связывания формализации MSML другой звуковой композиции с конкретным приложением через специальный канал данных. Аналогичный пример может быть приведен в отношении пиротехники, например при демонстрации фейерверков. При этом, будучи выполненной таким образом, звуковая композиция используется для приведения в действие конкретного приложения в силу самой природы формализации MSML этой звуковой композиции. То есть конкретная конфигурация канала данных может оставаться той же самой (то есть конкретные примотроны или их комбинации приводят в действие конкретные соответствующие внешние события), но изменение звуковой композиции приводит к другой формализации MSML, связанной с этой конкретной звуковой композицией, и, так как примотронные события появляются в различные моменты в течение длительности по сравнению с другой звуковой композицией, внешние события, связанные с каналом данных, будут приводиться в действие в другой последовательности, чем в случае другой звуковой композиции. Соответственно формализация MSML одной звуковой композиции может быть просто заменена на формализацию MSML другой звуковой композиции, чтобы повлиять на изменение конкретного приложения, например видеоигры, основанной на характеристиках музыкальной композиции (видеоигры, основанной на караоке). Такая схема существенно отличается от известной, согласно которой должна быть проанализирована каждая звуковая композиция и должна быть обеспечена корреляция отдельных событий, связанных с конкретным приложением, с конкретными аспектами этой звуковой композиции, что является очень длительным процессом. В таких примерах, чтобы изменить звуковую композицию, снова должен быть повторен трудоемкий процесс ручной корреляции.

Для специалиста также очевидно, что концепция канала данных может иметь также другие возможности по отношению к взаимодействию с формализацией MSML. Например, с конкретной звуковой композицией в некоторых примерах могут быть связаны соответствующий текст и/или видеоданные. Как описано, звуковая композиция может быть представлена формализацией MSML в соответствии с различными аспектами настоящего изобретения, подробно здесь изложенными. В некоторых примерах может быть обеспечена корреляция текста и/или видеоданных с примотронным профилем звуковой композиции во временном или частотно-временном пространстве. То есть конкретные появления в тексте и/или в видеоданных могут быть связаны с примотронным профилем звуковой композиции во временном пространстве. Таким образом, взаимодействие между формализацией MSML звуковой композиции и каналом данных, с которым связаны текст и/или видеоданные, может приводить к ситуации, когда может быть обеспечена корреляция профилей между ними (в соответствии с появлением конкретных примотронов или их комбинаций во временном пространстве). При этой корреляции формализация MSML звуковой композиции становится по существу синхронизирована с текстом и/или видеоданными, связанными с каналом данных, благодаря соответствию примотронных профилей временного пространства. Соответственно, в некоторых примерах может быть достигнута или реализована динамическая синхронизация, так как корреляция между каналом данных и формализацией MSML звуковой композиции имеет место по существу в режиме реального времени. Практическим смыслом этого является, например, то, что формализация MSML звуковой композиции может быть в процессе выполнения и может быть приведена во взаимодействие с каналом данных в любое время своей длительности, причем после этого взаимодействия видеоданные и/или текст, связанные с каналом данных, могут стать динамически синхронизированными со звуковой композицией по существу в режиме реального времени. Это может, например, обеспечить по усмотрению соединение или рассоединение канала данных и формализации MSML звуковой композиции без необходимости обращения к началу отсчета времени (то есть t=0) для обеспечения корреляции.

В некоторых аспектах внешние данные, связанные с каналом данных, могут быть направлены в специальное хранилище или место в файле данных формализации MSML звуковой композиции. Таким образом, внешние данные могут быть реализованы перед синтезом и воспроизведением звука на основе формализации MSML звуковой композиции и соразмерно с ними. Соответственно, подходящий аспект воспроизведения может быть таким, чтобы обеспечивать доступ к хранилищу собранной звуковой информации (внешним данным), и таким, чтобы принимать необходимый контент (то есть различные звуковые и/или видеокомпозиции) через специальный канал данных с обеспечением полной синхронизации между ними и с одновременным декодированием звуковых данных для обеспечения восприятия пользователем расширенного интерактивного контента. Эти аспекты обеспечивают создание многомерной интеллектуальной музыки и соответствующих приложений, включая помимо прочего различные услуги, связанные с интерактивной музыкой, и видеоуслуги и игры, в которых пользователь и среда взаимодействуют с носителем и друг с другом (то есть новый способ восприятия музыки путем предоставления пользователю первоклассного интерактивного контента для индивидуализации восприятия воспроизведения, например, когда музыка приводит в действие или по-иному управляет восприятием).

Канал данных может состоять из данных, собранных во время формализации MSML и процесса синтеза той же звуковой композиции и/или цифровых аудиоданных, и любой внешней информации, связанной со звуковой композицией, и может быть сконфигурирован с возможностью включения необходимой информации в формализацию MSML во время соответствующего процесса кодирования или в виде добавления после процесса в уже закодированную формализацию MSML в соответствии помимо прочего со следующей структурой.

Иными словами, в некоторых аспектах указанный канал данных может включать информационные данные нескольких типов, связанные с внешними событиями и/или соответствующие формализации MSML звуковой композиции, сконфигурированной с возможностью взаимодействия с ними, причем одним из примеров может быть следующий:

- Общие:

- базовые данные, закодированные как в заголовке файла, так и в каждом блоке (обычно с интервалом 10 сек.), идентифицирующие проигрываемый контент, кто закодировал и декодировал исходный файл и всю соответствующую расширенную информацию:

- Идентификатор песни - уникальный идентификатор песни или аудиокомпозиции, с помощью которого может быть получена любая дополнительная информация о песне из облачного компьютерного хранилища

- ввод локальных данных

- идентификатор кодировщика

- идентификатор декодера

- период действия лицензии

- название песни

- название альбома

- имя исполнителя (имена исполнителей)

- общее количество рисунков

- общее количество повторений

- расширенные

- внутренние

- блок

- группа данных

- внешние

- первичные

- вторичные

- общие данные, представляющие следующую информацию:

- расширенные (данные, закодированные в заголовке файла)

- данные, идентифицирующие песню:

- номер дорожки в альбоме, номер диска (для многодисковой коллекции), альбом с паузами или без них

- музыкальный жанр, музыкальный под жанр, стиль

- исходная композиция или ремикс

- исходный язык (исходные языки) исполнения

- авторское право:

- имя владельца авторского права

- дата выпуска

- тип лицензии

- период действия лицензии (дата начала и окончания)

- территория действия лицензии

- название звукозаписывающей студии

- Информация о:

авторе музыки (композиторе (композиторах музыки)

- авторе текста песни

- списке и общем количестве различных инструментов, использовавшихся для создания песни, и их соответствующих идентификаторах на дорожке

- исполнителе на каждом инструменте (то есть имена всех исполнителей, игравших на инструментах, упомянутых в общей информации)

- звукоинженере (звукоинженерах)

- художнике-иллюстраторе

- технические характеристики:

- формат песни (моно, стерео, многоканальный звук 5.1 и т.п.)

- характеристики выходного файла: дискретизация (44,1/48/96/192кГц), битовое разрешение (16/24/32)

- отклонение уровня громкости звука от среднего (то есть насколько должен быть подстроен уровень громкости песни, чтобы обеспечить согласованный уровень в течение песни и/или непрерывное воспроизведение с одинаковым уровнем различных песен)

- внутренние:

- на блок:

- базовые данные

- ритм

- темп

- определения стереосигналов

- частотно-временная маска и другая информация, по которой пользователь может отфильтровать инструмент(ы) от смешенного звука

- определения мелодий:

- тип звукоряда

- ссылка (ссылки) к удаленной информации (аудио-, видеоданные, текст) с временными метками и ее соответствующая длительность

- звуковые характеристики с временными метками и их соответствующая длительность:

- всплески с соответствующей яркостью

- гармоничность:

- идентификация инструмента и определения соответствующего объемного пространства

- доля каждого инструмента в смешанном звуке и конкретном канале, включая время задержки и т.п.

- общее количество инструментов в блоке

- определение голоса и/или инструмента

- гласный

- согласный

- диссонирующие гармонии

- высотные классы

- музыкальные события:

- средний уровень громкости

- увеличение уровня громкости

- уменьшение уровня громкости

- восходящий звукоряд

- нисходящий звукоряд

- атака звука

- затухание звука

- длительность звука

- высота звука

- интенсивность звука (громкость)

- качество звука

- апериодические аспекты:

- переходный процесс атаки

- вибрато

- модуляция огибающей

- рисунки и повторения

- количество рисунков в блоке

- идентификация рисунка

- количество повторений в блоке

- идентификация повторения

- текст на исходном языке

- на группу данных:

- характеристики композиции:

- текст песни:

- место во времени и длительность каждого слова текста по группе данных

- место всплесков

- характеристики всплесков:

- яркость

- длительность

- ступени звукоряда

- место звуковых сцен, высокоструктурированных с точки зрения гармоник

- уровень гармоничности

- уровень частоты сигнала

- место повторений гармоник

- место каждого конкретного рисунка

- внешние:

- первичные (информация сохранена, например, в облачном компьютерном музыкальном хранилище)

- общая информация

- соответствующие иллюстрации

- дополнительные слайды

- звуковая метка контента

- ноты песни

- вторичные (информация сохранена, например, внешне по отношению к облачному компьютерному музыкальному хранилищу)

- любой текст с его временной синхронизацией и длительностью его видимости в течение песни (франмента)

- любая ссылка с ее временной синхронизацией и длительностью ее видимости в течение песни (франмента)

На практике специальный канал данных может помочь повысить универсальность формализации MSML файла с цифровыми аудиоданными. В частности, в рамках схемы формализации MSML характеристика аудиоданных (или видеоданных в некоторых аспектах) обеспечивает то, что объективное представление этих данных выступает как их замена при формализации MSML. Более конкретно, относительно ограниченное количество объективных представлений, а также конкретных определений этих представлений обеспечивает такое размещение различных комбинаций этих представлений, которое отражает конфигурацию исходных аудиоданных, то есть аудиоданные представлены различными комбинациями известного набора объективных представлений, который обеспечивает определенную совокупность для характеристики любой звуковой композиции. Таким образом, процедура и структура формализации MSML минимизирует или иным образом исключает субъективные или нестандартные критерии, встречающиеся при традиционном анализе звука с волновой точки зрения.

Определенная совокупность объективных представлений, кроме того, обеспечивает разложение звуковых композиций на отдельные элементы (то есть инструменты, текст и пр.), которые могут быть включены, удалены, заменены или подвергнуты другим необходимым манипуляциям. В некоторых аспектах звуковая композиция может быть сформирована с использованием полученных путем формализации MSML объективных представлений в качестве «строительных блоков» или базиса композиции. Кроме того, внешние данные, такие как метаданные, защитная информация, материал, связанный с авторским правом и пр., могут быть добавлены к формализации MSML, причем такие внешние данные, будучи в цифровой форме, могут быть предоставлены с объективными представлениями, которые могут отличаться от объективных представлений звуковой композиции. Таким образом, внешние данные могут быть синхронизированы, реализованы, проанализированы или подвергнуты другим манипуляциям без разрушения или иного влияния на характеристики самой звуковой композиции (то есть внешние данные могут быть сконфигурированы таким образом, чтобы объективно отличаться от данных, представляющих подвергнутую формализации MSML звуковую композицию).

В конкретных аспектах объективные представления, реализованные с использованием формализации MSML, могут быть применимы, например, при объективном анализе различных звуковых композиций (как инструмент «криминалистики авторского права») или как средства приведения в действие или другой соответствующий компонент «приводимой в действие» системы (показ пиротехники, динамический фонтан, видеоигра и пр.). Иными словами, объективные представления могут быть связаны с соответствующими функциями или иным образом сконфигурированы для приведения в действие этих функций, которые могут быть определены через связь с внешними данными. Вышеупомянутый специальный канал данных может быть использован для введения звуковой композиции в определенные функции (в формате формализации MSML) или, наоборот, в гармоническую структуру полученного путем формализации MSML представления звуковой композиции.

В других аспектах формализация MSML звуковой композиции, обеспечивая получение объективных представлений звуковой композиции, может обеспечивать основанную на элементах событийную схему, которая необязательно может быть основана на аспекте временной зависимости, но может включать его. Так как эта схема приводится в действие элементом и/или событием, различные аудиохарактеристики (темп, акценты, такты, синхронность в режиме реального времени, звуковые события, эмоциональные события и пр.) могут быть представлены более объективным образом и, таким образом, подвергаться манипуляции аналогично базовым компонентам звуковой композиции.

В некоторых аспектах вышеупомянутый уникальный знак, который может быть включен во внешние данные как их часть, может предотвращать манипуляцию представлением MSML кем-либо иным отличным от пользователя. В других аспектах уникальный знак может служить для идентификации пользователя (конкретного пользователя, имеющего право на конкретное представление MSML) в примерах, в которых пользователь копирует, передает или иным образом распространяет такой файл. Этот признак в некоторых примерах ограничивает или исключает копирование, совместный доступ к файлу или иное несанкционированное использование конкретного представления MSML исходного файла с цифровыми аудиоданными. В других примерах этот признак может служить механизмом «отслеживания» пользователя, включая, например, привычки и тенденции при покупке, демографические характеристики или использование данных (и тенденции использования), или механизмом направления счетов пользователю за покупку, санкционированное использование представления MSML или разрешенный доступ к нему. Соответственно, уникальный знак в некоторых примерах может функционировать в пространстве формата MSML для обеспечения файлов с отслеживаемыми данными, которые могут быть привязаны к конкретному пользователю, имеющему в нем конкретные права. Эта функция может повышать эффективность и защищать доход владельца контента путем ограничения несанкционированного повторного распространения файла данных как в формате MSML, так и нет, или сдерживания такого повторного распространения иным образом. Соответственно, представление MSML может быть сконфигурировано с возможностью извлечения уникальной звуковой метки из аналогового аудиосигнала, что совместно с дополнением в виде незвуковых данных может обеспечивать высокоэффективный и обладающим высоким уровнем защиты способ идентификации и отслеживания цифровых мультимедийных данных безотносительно преобразований формата и способов доставки.

Для специалиста очевидны различные модификации и другие аспекты описанных здесь изобретений, обладающие преимуществами описанного в предшествующем описании и сопроводительных чертежах. Например, описанные здесь аспекты в некоторых примерах могут относиться к индикатору формата многофункциональных цифровых данных, обеспечивающего очень компактное и эффективное хранение и воспроизведение любого материала, представленного в виде основанного на гармониках или созданного с использованием гармоник сигнала с высокой верностью воспроизведения (включая музыку, голос и другие основанные на звуке мультимедийные данные высокого качества), с одновременной синхронизированной во времени эффективной агрегированной обработкой информации в отношении сигнала и связанной с ним и его отслеживаемой сетевой доставкой, динамически оптимизируемой в мобильной и наземной инфраструктуре интернет-протокола. Такие мультимедийные файлы могут быть способны одновременно нести и динамически извлекать как плоское, так и объемное представления сигнала с высокой четкостью (включая, например стерео 2.0 и звук вокруг 5.1) в одном файле данных с низкой скоростью передачи (то есть в одном файле данных с уменьшенным количеством информации) и могут быть также способны извлекать в режиме реального времени поющий голос с качеством звука, обеспечивающим полную прозрачность по отношению к исходному источнику звука и его воспроизводимость (то есть с высоким качеством информации). Эти возможности могут существенно снижать затраты на хранение, передачу, вещание цифровых данных и полосу пропускания, связанные с ориентированными на мультимедийные данные системы и сети, создавая новые доходы и увеличивая монетизацию контента. Таким образом, эти мультимедийные данные могут быть сконфигурированы с возможностью извлечения уникальной звуковой метки из аналогового сигнала, что совместно с дополнением в виде незвуковых данных может обеспечивать высокоэффективный и обладающим высоким уровнем защиты способ идентификации и отслеживания цифровых мультимедийных данных безотносительно преобразований формата и способов доставки. Эти мультимедийные данные также могут включать специальный канал данных, объединенный и смешанный с гармоническим сигналом для динамического отражения и отображения межструктурной информации сигнала во временном пространстве или в частотно-временном пространстве, обеспечивая, таким образом, воспроизведение аудиоданных, синхронизированных с любыми внешними или внутренними событиями, путем двунаправленного взаимодействия данных. Такие события могут включать, например, видеоданные или программирующую последовательность в игре или фильме, текст песни, обложку, информацию об исполнителе и композиторе или ноты, различные визуальные и пиротехнические спецэффекты, включая внутреннюю и наружную подсветку или визуальную аудиокнигу, целевую рекламу или любую другую информацию, связанную с воспроизводимыми звуковыми мультимедийными данными. Канал данных по существу увеличивает информативность (то есть ценность информации) и индивидуализацию получаемых мультимедийных данных, таким образом существенно увеличивая их развлекательную ценность и монетизацию.

Для специалиста очевидно, что кроме раскрытых здесь способов, эти способы могут быть реализованы и выполнены соответствующими устройствами и системами, например различными устройствами, выполненными с возможностью взаимодействия посредством соответствующих процессоров, или другими вычислительными устройствами и устройствами связи, причем такие устройства могут быть связаны с конкретными средствами памяти или хранения, где необходимо, требуется или является подходящим. Для специалиста также очевидно, что раскрытые способы могут быть реализованы по меньшей мере на одном машиночитаемом запоминающем носителе, в котором сохранены части машиночитаемого программного кода, которые при их выполнении процессором обеспечивают по меньшей мере осуществление устройством раскрытых способов. Следовательно, следует понимать, что изобретения не ограничены конкретными описанными аспектами и что модификации и другие аспекты рассматриваются как включенные в объем приложенной формулы. Хотя здесь использованы конкретные термины, они использованы в обобщающем и описательном смысле, а не для целей ограничения.

Похожие патенты RU2612603C2

название год авторы номер документа
ОБРАБОТКА ПРОСТРАНСТВЕННО ДИФФУЗНЫХ ИЛИ БОЛЬШИХ ЗВУКОВЫХ ОБЪЕКТОВ 2020
  • Бребарт, Дирк Ерун
  • Лу, Ле
  • Цингос, Николас Р.
  • Матеос Соле, Антонио
RU2803638C2
ОБРАБОТКА ПРОСТРАНСТВЕННО ДИФФУЗНЫХ ИЛИ БОЛЬШИХ ЗВУКОВЫХ ОБЪЕКТОВ 2014
  • Бребарт Дирк Ерун
  • Лу Ле
  • Цингос Николас Р.
  • Матеос Соле Антонио
RU2646344C2
ОБРАБОТКА ПРОСТРАНСТВЕННО-ДИФФУЗНЫХ ИЛИ БОЛЬШИХ ЗВУКОВЫХ ОБЪЕКТОВ 2014
  • Бребарт, Дирк Ерун
  • Лу, Ле
  • Цингос, Николас Р.
  • Матеос Соле, Антонио
RU2716037C2
УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ КОДИРОВАНИЯ, ДЕКОДИРОВАНИЯ, ОБРАБОТКИ СЦЕНЫ И ДРУГИХ ПРОЦЕДУР, ОТНОСЯЩИХСЯ К ОСНОВАННОМУ НА DirAC ПРОСТРАНСТВЕННОМУ АУДИОКОДИРОВАНИЮ 2018
  • Фукс, Гийом
  • Херре, Юрген
  • Кюх, Фабиан
  • Дёла, Штефан
  • Мультрус, Маркус
  • Тиргарт, Оливер
  • Вюббольт, Оливер
  • Гидо, Флорин
  • Байер, Штефан
  • Егерс, Вольфганг
RU2759160C2
СИСТЕМА УПРАВЛЕНИЯ ФАЙЛАМИ, ИСПОЛЬЗУЮЩАЯ ОСНОВАННОЕ НА ВРЕМЕННОЙ ШКАЛЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ 2005
  • Уильямс Шон Ф.
  • Болл Стивен Дж.
RU2406132C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ВОСПРОИЗВЕДЕНИЯ АУДИО- И ВИДЕОДАННЫХ 2004
  • Ким Ду-Ил
  • Ким Йоунг-Йоон
  • Портных Владимир
RU2331936C2
СИСТЕМА, СПОСОБ И ПОСТОЯННЫЙ МАШИНОЧИТАЕМЫЙ НОСИТЕЛЬ ДАННЫХ ДЛЯ ГЕНЕРИРОВАНИЯ, КОДИРОВАНИЯ И ПРЕДСТАВЛЕНИЯ ДАННЫХ АДАПТИВНОГО ЗВУКОВОГО СИГНАЛА 2020
  • Робинсон, Чарльз К.
  • Тсингос, Николас Р.
  • Шабанне, Кристоф
RU2820838C2
НОСИТЕЛЬ ЗАПИСИ, УСТРОЙСТВО ВОСПРОИЗВЕДЕНИЯ И СПОСОБЫ ЗАПИСИ И ВОСПРОИЗВЕДЕНИЯ 2006
  • Яхата Хироси
  • Окада Томоюки
RU2393556C2
СИСТЕМА И СПОСОБ ДЛЯ ГЕНЕРИРОВАНИЯ, КОДИРОВАНИЯ И ПРЕДСТАВЛЕНИЯ ДАННЫХ АДАПТИВНОГО ЗВУКОВОГО СИГНАЛА 2012
  • Робинсон Чарльз К.
  • Тсингос Николас Р.
  • Шабанне Кристоф
RU2731025C2
СИСТЕМА, СПОСОБ И ПОСТОЯННЫЙ МАШИНОЧИТАЕМЫЙ НОСИТЕЛЬ ДАННЫХ ДЛЯ ГЕНЕРИРОВАНИЯ, КОДИРОВАНИЯ И ПРЕДСТАВЛЕНИЯ ДАННЫХ АДАПТИВНОГО ЗВУКОВОГО СИГНАЛА 2020
  • Робинсон, Чарльз К.
  • Тсингос, Николас Р.
  • Шабанне, Кристоф
RU2741738C1

Иллюстрации к изобретению RU 2 612 603 C2

Реферат патента 2017 года СПОСОБ МНОГОСТРУКТУРНЫХ, МНОГОУРОВНЕВЫХ ФОРМАЛИЗАЦИИ И СТРУКТУРИРОВАНИЯ ИНФОРМАЦИИ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО

Изобретение относится к способу, машиночитаемому запоминающему носителю и системе структурирования информации. Технический результат заключается в уменьшении количества информации файла при сохранении ценности информации в пределах порогового значения. Способ включает анализ исходного файла для определения исходного количества и ценности информации, создание посредством процесса манипуляции первого результирующего файла из исходного файла и второго результирующего файла из первого результирующего файла, при этом обеспечивают удаление элемента обрабатываемого файла и/или замену комбинации множества элементов обрабатываемого файла представительным элементом и первым индикатором, последовательное использование процессов манипуляции применительно к предыдущему результирующему файлу до тех пор, пока оно не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле по сравнению с предыдущим результирующим файлом, причем последний результирующий файл имеет первичную структуру с уменьшенным количеством информации относительно исходного количества информации и результирующую ценность информации в пределах, заданных выбранным пороговым значением исходной ценности информации. 3 н. и 60 з.п. ф-лы, 19 ил.

Формула изобретения RU 2 612 603 C2

1. Способ структурирования информации, включающий

анализ исходного файла с цифровой информацией для определения исходного количества информации и связанной с ним исходной ценности информации;

использование исходного процесса манипуляции применительно к исходному файлу с цифровой информацией для создания первого результирующего файла с цифровой информацией и использование последующего процесса манипуляции применительно к первому результирующему файлу с цифровой информацией для создания второго результирующего файла с цифровой информацией, причем каждый процесс манипуляции реализуют с обеспечением удаления по меньшей мере одного элемента обрабатываемого файла с цифровой информацией и/или замены комбинации множества элементов обрабатываемого файла с цифровой информацией представительным элементом и первым индикатором, связанным с соотношением между представительным элементом и по меньшей мере одним из указанного множества элементов в комбинации, так что обеспечено уменьшение количества информации обрабатываемого файла с цифровой информацией и структурирование этого файла, а указанный по меньшей мере один удаленный элемент и/или представительный элемент определяют с обеспечением уменьшения ценности информации обрабатываемого файла с цифровой информацией не ниже выбранного порогового значения; а способ дополнительно включает

последовательное использование процессов манипуляции применительно к предыдущему результирующему файлу с цифровой информацией до тех пор, пока оно не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией по сравнению с предыдущим результирующим файлом с цифровой информацией, причем последний результирующий файл с цифровой информацией, таким образом, имеет первичную структуру с уменьшенным количеством информации относительно исходного количества информации и результирующую ценность информации в пределах, заданных выбранным пороговым значением исходной ценности информации.

2. Способ по п. 1, в котором последовательное использование процессов манипуляции дополнительно включает последовательное использование процессов манипуляции применительно к предыдущему результирующему файлу с цифровой информацией для создания последнего результирующего файла со структурированной цифровой информацией, сконфигурированного в соответствии с иерархией информации, имеющей множество уровней информации.

3. Способ по п. 2, в котором высокий уровень информации в иерархии информации содержит меньшее количество информации, чем низкий уровень информации, причем способ дополнительно включает создание высокого уровня информации из структуры низкого уровня информации и связанных с ней хаотических параметров.

4. Способ по п. 2, в котором высокий уровень информации в иерархии информации содержит меньшее количество информации, чем низкий уровень информации, причем способ дополнительно включает создание высокого уровня информации таким образом, что он содержит ценность информации большую, чем исходная ценность информации.

5. Способ по п. 2, в котором высокий уровень информации в иерархии информации содержит меньшее количество информации, чем низкий уровень информации, причем способ дополнительно включает создание множества низких уровней информации из структуры высокого уровня информации и выбор одного из указанного множества низких уровней информации для связывания с высоким уровнем информации.

6. Способ по п. 1, дополнительно включающий одновременное использование множества процессов манипуляции применительно к предыдущему файлу с цифровой информацией с созданием вторичного файла со структурированной цифровой информацией.

7. Способ по п. 6, дополнительно включающий анализ первичного и вторичного файлов со структурированной цифровой информацией с определением соотношения между уровнями информации первичного или вторичного файла со структурированной цифровой информацией и/или соотношения между первичным и вторичным файлами со структурированной цифровой информацией.

8. Способ по п. 1, дополнительно включающий использование по меньшей мере одного из множества процессов манипуляции применительно к предыдущему файлу с цифровой информацией, причем процессы манипуляции выбирают из группы, содержащей процесс манипуляции, связанный с бесфазным кодированием, процесс манипуляции, связанный со структурным анализом, для повторяющихся структур, процесс манипуляции, связанный с бесфазным повторяющимся кодированием, способ манипуляции, связанный с сжатием энтропии без потерь, процесс манипуляции, связанный с ускорителем без потерь, для создания дополнительного сжатого слоя для ранее уменьшенного файла с аудиоданными, процесс манипуляции, связанный с ускорителем, для обеспечения эффективной потоковой передачи аудиоданных и процесс манипуляции, связанный с кодированием с использованием аффинных преобразований.

9. Способ по п. 1, в котором последовательное использование процессов манипуляции с получением результирующей ценности информации в пределах, заданных выбранным пороговым значением исходной ценности информации, дополнительно включает последовательное использование процессов манипуляции с получением результирующей ценности информации в пределах, заданных выбранным пороговым значением исходной ценности информации, содержащим ограничение человеческого восприятия, для сохранения верности воспроизведения первичного файла со структурированной цифровой информацией.

10. Способ по п. 1, в котором создание результирующих файлов с цифровой информацией дополнительно включает создание результирующих файлов с цифровой информацией таким образом, что каждый результирующий файл с цифровой информацией содержит набор объектов и кластеров объектов, причем каждый объект и кластер объектов имеет соответствующее определение.

11. Способ по п. 1, в котором использование процесса манипуляции применительно к удалению по меньшей мере одного элемента обрабатываемого файла с цифровой информацией и/или к замене комбинации множества элементов обрабатываемого файла с цифровой информацией представительным элементом дополнительно включает использование процесса манипуляции применительно к удалению по меньшей мере одного элемента обрабатываемого файла с цифровой информацией и/или к замене комбинации множества элементов обрабатываемого файла с цифровой информацией представительным элементом, первым индикатором, связанным с соотношением между представительным элементом и по меньшей мере одним из указанного множества элементов в комбинации, и вторым индикатором, связанным с соотношением по меньшей мере между двумя из указанного множества элементов в комбинации.

12. Способ по п. 10 или 11, в котором создание результирующих файлов с цифровой информацией дополнительно включает создание результирующих файлов с цифровой информацией таким образом, что объекты и кластеры объектов в них содержат по меньшей мере один из указанных представительных элементов, а определение, связанное с каждым объектом и кластером объектов, содержит указанный первый индикатор соотношения, а при необходимости содержит указанный второй индикатор соотношения, связанный с указанным по меньшей мере одним из представительных элементов.

13. Способ по п. 12, дополнительно включающий включение указанных определений с соответствующим набором объектов и кластеров объектов в каждый результирующий файл с цифровой информацией.

14. Способ по п. 12, дополнительно включающий удержание указанных определений, связанных с набором объектов и кластеров объектов, отдельно от каждого соответствующего результирующего файла с цифровой информацией.

15. Способ по п. 1, в котором создание результирующих файлов с цифровой информацией дополнительно включает создание результирующих файлов с цифровой информацией таким образом, что каждый последующий результирующий файл с цифровой информацией содержит любые распознанные конфигурации объектов и кластеров объектов предыдущего результирующего файла с цифровой информацией.

16. Способ по п. 1, в котором последовательное использование процессов манипуляции до тех пор, пока оно не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией дополнительно включает последовательное использование процессов манипуляции до тех пор, пока оно не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией, таким образом, что последний результирующий файл с цифровой информацией имеет информационную примотронную структуру, содержащую набор первичных объектов, кластеров первичных объектов и любые связанные соотношения между ними.

17. Способ по п. 16, дополнительно включающий анализ каждого последовательного результирующего файла с цифровой информацией и последнего результирующего файла с цифровой информацией для определения статистических корреляций между последующими объектами в последующем файле с цифровой информацией и предыдущими комбинациями объектов в предыдущем файле с цифровой информацией и сохранение для любой статистической корреляции, по меньшей мере удовлетворяющей соответствующему пороговому значению, индикатора корреляции соответствующего последующего объекта и предыдущей комбинации объектов для анализа последующего исходного файла с цифровой информацией.

18. Способ по п. 16, дополнительно включающий анализ каждого последовательного результирующего файла с цифровой информацией для определения по меньшей мере одной объективной корреляции между комбинацией предыдущих объектов и по меньшей мере одного межъобъектного отношения между предыдущими объектами в комбинации в предыдущем файле с цифровой информацией и связывание указанной по меньшей мере одной объективной корреляции и указанного по меньшей мере одного межъобъектного отношения с соответствующим последующим объектом в последующем файле с цифровой информацией, причем указанная по меньшей мере одна объективная корреляция и указанное по меньшей мере одно межъобъектное отношение, связанные с соответствующим последующим объектом, по множеству последующих объектов совместно образуют набор объективных корреляций, представляющих соотношения, связанные с набором первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

19. Способ по п. 16, дополнительно включающий анализ каждого последовательного результирующего файла с цифровой информацией для определения по меньшей мере одной объективной корреляции между комбинацией предыдущих объектов в предыдущем файле с цифровой информацией, присвоение по меньшей мере одного межъобъектного отношения между предыдущими объектами в комбинации и связывание указанной по меньшей мере одной объективной корреляции и указанного по меньшей мере одного межъобъектного отношения с соответствующим последующим объектом в последующем файле с цифровой информацией, причем указанная по меньшей мере одна объективная корреляция и указанное по меньшей мере одно межъобъектное отношение, связанные с соответствующим последующим объектом, по множеству последующих объектов совместно образуют набор объективных корреляций, представляющих соотношения, связанные с набором первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

20. Способ по п. 18 или 19, дополнительно включающий интерпретацию набора первичных объектов и кластеров первичных объектов в информационной примотронной структуре путем статистической оценки различных комбинаций объективных корреляций в наборе объективных корреляций и, для любой комбинации объективных корреляций, по меньшей мере удовлетворяющей статистическому пороговому значению, связывание этих комбинаций с первичными объектами и с кластерами первичных объектов как контекстной интерпретации набора первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

21. Способ по п. 20, дополнительно включающий синтез представительного файла с цифровой информацией, связанного с исходным файлом с цифровой информацией, путем использования контекстной интерпретации применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

22. Способ по п. 18 или 19, дополнительно включающий

связывание по меньшей мере одного объекта, выбранного из предыдущих объектов, последующих объектов и первичных объектов и кластеров первичных объектов, с одной из множества характеристик исходного файла с цифровой информацией; и

определение размещения множества характеристик по отношению к длительности исходного файла с цифровой информацией и обеспечение корреляции распределения указанного по меньшей мере одного объекта по отношению к нему.

23. Способ по п. 22, дополнительно включающий создание файла со сводными данными, содержащего обобщенное представление распределения указанного по меньшей мере одного объекта, связанного с каждой из указанного множества характеристик, по длительности исходного файла с цифровой информацией.

24. Способ по п. 16, в котором последовательное использование процессов манипуляции до тех пор, пока оно не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией, дополнительно включает регистрацию количества и порядка процессов манипуляции, последовательно используемых применительно к последующим результирующим файлам с цифровой информацией с получением последнего результирующего файла с цифровой информацией, имеющего информационную примотронную структуру, причем количество процессов манипуляции связано с соответствующими уровнями иерархии информации.

25. Способ по п. 17 или 24, дополнительно включающий синтез представительного файла с цифровой информацией, связанного с исходным файлом с цифровой информацией, в соответствии с условным процессом, включающим:

использование любого применимого индикатора корреляции применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними;

если ни один применимый индикатор корреляции не определен, использование контекстной интерпретации применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними; и

если использование контекстной интерпретации ниже пороговой ценности информации, связанной с исходной ценностью информации, использование исходного обратного процесса манипуляции применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними, причем исходный обратный процесс манипуляции является первой манипуляцией при обратном порядке процессов манипуляции.

26. Способ по п. 25, дополнительно включающий использование применительно к предыдущей комбинации объектов, определенной на основе набора первичных объектов и кластеров первичных объектов в информационной примотронной структуре, условного процесса, включающего любой применимый индикатор корреляции, соответствующую контекстную интерпретацию или следующий обратный процесс манипуляции при обратном порядке процессов манипуляции, соответствующий предыдущей комбинации объектов, для определения следующей предыдущей комбинации объектов, ей соответствующей.

27. Способ по п. 26, дополнительно включающий последовательное использование условного процесса применительно к следующей предыдущей комбинации объектов до тех пор, пока результирующая предыдущая комбинация объектов не будет связана с исходным уровнем иерархии информации, причем результирующий предыдущий файл с цифровой информацией, таким образом, соответствует синтезированному представительному файлу с цифровой информацией.

28. Способ по любому из пп. 1-11, 13-17, в котором исходный файл с цифровой информацией является файлом с цифровыми аудиоданными, а способ дополнительно включает связывание количества информации файла с цифровыми аудиоданными со скоростью передачи пропорционально его размеру и длительности и связывание ценности информации файла с цифровыми аудиоданными с его качеством, причем качество определяют на основе по меньшей мере одного элемента группы, включающей: пороговое значение энергии примотрона, критерии воспринимаемой информации, звуковую структуру, идентифицированную из события случайной хаотической флуктуации, определенного в соответствии с функцией распределения вероятности с использованием случайного шума как входного сигнала, критерии нулевой потери качества и площадь поверхности n-мерной сферы единичного радиуса в частотно-временном пространстве, определенную из неявной функции.

29. Способ по п. 28, в котором последовательное использование процессов манипуляции применительно к предыдущему результирующему файлу с цифровыми аудиоданными для создания последнего результирующего файла со структурированными цифровыми музыкальными данными дополнительно включает последовательное использование процессов манипуляции применительно к предыдущему результирующему файлу с цифровыми аудиоданными для создания последнего результирующего файла со структурированными цифровыми аудиоданными, сконфигурированного в соответствии с иерархией информации, включающей множество уровней информации, причем низкий уровень информации содержит представление аудиоданных в виде файла с цифровой информацией высокого разрешения, а высокий уровень информации содержит табличное представление, содержащее письменную партитуру с соответствующими словами, при этом высокий уровень информации, таким образом, имеет меньшее количество информации, чем низкий уровень информации, и, таким образом, обеспечена возможность создания низкого уровня информации на основе высокого уровня информации и хаотических параметров, связанных с характеристиками и оцифровкой аудиоданных, в соответствии с табличным представлением.

30. Способ по п. 29, в котором последовательное использование процессов манипуляции применительно к предыдущему результирующему файлу с цифровыми аудиоданными для создания последнего результирующего файла со структурированными цифровыми музыкальными данными дополнительно включает последовательное использование процессов манипуляции применительно к предыдущему результирующему файлу с цифровыми аудиоданными для создания последнего результирующего файла со структурированными цифровыми аудиоданными, содержащего по меньшей мере один примотрон, определенный во временном пространстве или в частотно-временном пространстве, причем последний результирующий файл со структурированными цифровыми аудиоданными, таким образом, представляет компактную цифровую формализацию гармонического сигнала, количество информации, связанное со скоростью передачи аудиоданных, уменьшено по сравнению с файлом с цифровыми аудиоданными, соответствующим исходному файлу с цифровой информацией, а ценность информации, связанную с качеством аудиоданных, поддерживают в пределах, заданных пороговым значением файла с цифровыми аудиоданными, соответствующего исходному файлу с цифровой информацией.

31. Способ по п. 28, в котором каждый файл с цифровыми аудиоданными представляет связанные с гармониками данные, а способ дополнительно включает определение всплесков как иерархических структур высокого уровня во временном пространстве; определение гармоник как иерархических структур высокого уровня в частотном пространстве, имеющих ориентацию последующего гармонического примотрона, совпадающую с окончанием предыдущего гармонического примотрона; устранение избыточности в иерархических структурах низкого уровня во временном пространстве с обеспечением уменьшения энтропии в иерархических структурах высокого уровня; и определение обертонов как иерархических структур высокого уровня в частотном пространстве, имеющих одну базовую частоту, соответствующую иерархическим структурам низкого уровня, и множество копий иерархических структур высокого уровня, смещенных на постоянную частоту от указанной одной базовой частоты и друг от друга.

32. Система для структурирования информации, содержащая:

первое аналитическое устройство, содержащее процессор, выполненный с возможностью анализа исходного файла с цифровой информацией для определения исходного количества информации и связанной с ним исходной ценности информации; и

устройство для уменьшения цифрового файла, функционально связанное с первым аналитическим устройством и содержащее процессор, выполненный с возможностью:

использования исходного процесса манипуляции применительно к исходному файлу с цифровой информацией для создания первого результирующего файла с цифровой информацией и использования последующего процесса манипуляции применительно к первому результирующему файлу с цифровой информацией для создания второго результирующего файла с цифровой информацией, причем обеспечена возможность реализации каждого процесса манипуляции с обеспечением удаления по меньшей мере одного элемента обрабатываемого файла с цифровой информацией и/или замены комбинации множества элементов обрабатываемого файла с цифровой информацией представительным элементом и первым индикатором, связанным с соотношением между представительным элементом и по меньшей мере одним из указанного множества элементов в комбинации, так что обеспечено уменьшение количества информации обрабатываемого файла с цифровой информацией и структурирование этого файла, а также определение указанного по меньшей мере одного удаленного элемента и/или представительного элемента с обеспечением уменьшения ценности информации обрабатываемого файла с цифровой информацией не ниже выбранного порогового значения, а процессор устройства для уменьшения цифрового файла дополнительно выполнен с возможностью

последовательного использования процессов манипуляции применительно к предыдущему результирующему файлу с цифровой информацией до тех пор, пока оно не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией по сравнению с предыдущим результирующим файлом с цифровой информацией, причем последний результирующий файл с цифровой информацией, таким образом, имеет первичную структуру с уменьшенным количеством информации относительно исходного количества информации и результирующую ценность информации в пределах, заданных выбранным пороговым значением исходной ценности информации.

33. Система по п. 32, в которой процессор устройства для уменьшения цифрового файла дополнительно выполнен с возможностью последовательного использования процессов манипуляции применительно к предыдущему результирующему файлу с цифровой информацией для создания последнего результирующего файла со структурированной цифровой информацией, сконфигурированного в соответствии с иерархией информации, имеющей множество уровней информации.

34. Система по п. 33, в которой высокий уровень информации в иерархии информации содержит меньшее количество информации, чем низкий уровень информации, причем процессор устройства для уменьшения цифрового файла дополнительно выполнен с возможностью создания высокого уровня информации из структуры низкого уровня информации и связанных с ней хаотических параметров.

35. Система по п. 33, в которой высокий уровень информации в иерархии информации содержит меньшее количество информации, чем низкий уровень информации, причем процессор устройства для уменьшения цифрового файла дополнительно выполнен с возможностью создания высокого уровня информации таким образом, что он содержит ценность информации большую, чем исходная ценность информации.

36. Система по п. 33, в которой высокий уровень информации в иерархии информации содержит меньшее количество информации, чем низкий уровень информации, причем процессор устройства для уменьшения цифрового файла дополнительно выполнен с возможностью создания множества низких уровней информации из структуры высокого уровня информации и с возможностью выбора одного из указанного множества низких уровней информации для связывания с высоким уровнем информации.

37. Система по п. 32, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью одновременного использования множества процессов манипуляции применительно к предыдущему файлу с цифровой информацией с созданием вторичного файла со структурированной цифровой информацией.

38. Система по п. 37, дополнительно содержащая второе аналитическое устройство, содержащее процессор, выполненный с возможностью анализа первичного и вторичного файлов со структурированной цифровой информацией с определением соотношения между уровнями информации первичного или вторичного файла со структурированной цифровой информацией и/или соотношения между первичным и вторичным файлами со структурированной цифровой информацией.

39. Система по п. 32, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью использования по меньшей мере одного из множества процессов манипуляции применительно к предыдущему файлу с цифровой информацией, причем процессы манипуляции выбраны из группы, содержащей процесс манипуляции, связанный с бесфазным кодированием, процесс манипуляции, связанный со структурным анализом, для повторяющихся структур, процесс манипуляции, связанный с бесфазным повторяющимся кодированием, способ манипуляции, связанный с сжатием энтропии без потерь, процесс манипуляции, связанный с ускорителем без потерь, для создания дополнительного сжатого слоя для ранее уменьшенного файла с аудиоданными, процесс манипуляции, связанный с ускорителем, для обеспечения эффективной потоковой передачи аудиоданных и процесс манипуляции, связанный с кодированием с использованием аффинных преобразований.

40. Система по п. 32, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью последовательного использования процессов манипуляции с получением результирующей ценности информации в пределах, заданных выбранным пороговым значением исходной ценности информации, содержащим ограничение человеческого восприятия, для сохранения верности воспроизведения первичного файла со структурированной цифровой информацией.

41. Система по п. 32, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью создания результирующих файлов с цифровой информацией таким образом, что каждый результирующий файл с цифровой информацией содержит набор объектов и кластеров объектов, причем каждый объект и кластер объектов имеет соответствующее определение.

42. Система по п. 32, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью использования процесса манипуляции применительно к удалению по меньшей мере одного элемента обрабатываемого файла с цифровой информацией и/или к замене комбинации множества элементов обрабатываемого файла с цифровой информацией представительным элементом, первым индикатором, связанным с соотношением между представительным элементом и по меньшей мере одним из указанного множества элементов в комбинации, и вторым индикатором, связанным с соотношением по меньшей мере между двумя из указанного множества элементов в комбинации.

43. Система по п. 41 или 42, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью создания результирующих файлов с цифровой информацией таким образом, что объекты и кластеры объектов в них содержат по меньшей мере один из указанных представительных элементов, а определение, связанное с каждым объектом и кластером объектов, содержит указанный первый индикатор соотношения, а при необходимости содержит указанный второй индикатор, связанный с указанным по меньшей мере одним из представительных элементов.

44. Система по п. 43, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью включения указанных определений с соответствующим набором объектов и кластеров объектов в каждый результирующий файл с цифровой информацией.

45. Система по п. 43, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью удержания указанных определений, связанных с набором объектов и кластеров объектов, отдельно от каждого соответствующего результирующего файла с цифровой информацией.

46. Система по п. 32, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью создания результирующих файлов с цифровой информацией таким образом, что каждый последующий результирующий файл с цифровой информацией содержит любые распознанные конфигурации объектов и кластеров объектов предыдущего результирующего файла с цифровой информацией.

47. Система по п. 32, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью последовательного использования процессов манипуляции до тех пор, пока оно не обеспечит уменьшение до порогового значения количества информации в последующем результирующем файле с цифровой информацией, таким образом, что последний результирующий файл с цифровой информацией имеет информационную примотронную структуру, содержащую набор первичных объектов, кластеров первичных объектов и любые связанные соотношения между ними.

48. Система по п. 47, дополнительно содержащая второе аналитическое устройство, содержащее процессор, выполненный с возможностью анализа каждого последовательного результирующего файла с цифровой информацией и последнего результирующего файла с цифровой информацией для определения статистических корреляций между последующими объектами в последующем файле с цифровой информацией и предыдущими комбинациями объектов в предыдущем файле с цифровой информацией и с возможностью сохранения для любой статистической корреляции, по меньшей мере удовлетворяющей соответствующему пороговому значению, индикатора корреляции соответствующего последующего объекта и предыдущей комбинации объектов для анализа последующего исходного файла с цифровой информацией.

49. Система по п. 47, дополнительно содержащая второе аналитическое устройство, содержащее процессор, выполненный с возможностью анализа каждого последовательного результирующего файла с цифровой информацией для определения по меньшей мере одной объективной корреляции между комбинацией предыдущих объектов и по меньшей мере одного межъобъектного отношения между предыдущими объектами в комбинации в предыдущем файле с цифровой информацией и с возможностью связывания указанной по меньшей мере одной объективной корреляции и указанного по меньшей мере одного межъобъектного отношения с соответствующим последующим объектом в последующем файле с цифровой информацией, причем указанная по меньшей мере одна объективная корреляция и указанное по меньшей мере одно межъобъектное отношение, связанные с соответствующим последующим объектом, по множеству последующих объектов совместно образуют набор объективных корреляций, представляющих соотношения, связанные с набором первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

50. Система по п. 47, дополнительно содержащая второе аналитическое устройство, содержащее процессор, выполненный с возможностью анализа каждого последовательного результирующего файла с цифровой информацией для определения по меньшей мере одной объективной корреляции между комбинацией предыдущих объектов в предыдущем файле с цифровой информацией, с возможностью присвоения по меньшей мере одного межъобъектного отношения между предыдущими объектами в комбинации и с возможностью связывания указанной по меньшей мере одной объективной корреляции и указанного по меньшей мере одного межъобъектного отношения с соответствующим последующим объектом в последующем файле с цифровой информацией, причем указанная по меньшей мере одна объективная корреляция и указанное по меньшей мере одно межъобъектное отношение, связанные с соответствующим последующим объектом, по множеству последующих объектов совместно образуют набор объективных корреляций, представляющих соотношения, связанные с набором первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

51. Система по п. 49 или 50, дополнительно содержащая третье аналитическое устройство, содержащее процессор, выполненный с возможностью интерпретации набора первичных объектов и кластеров первичных объектов в информационной примотронной структуре путем статистической оценки различных комбинаций объективных корреляций в наборе объективных корреляций и, для любой комбинации объективных корреляций, по меньшей мере удовлетворяющей статистическому пороговому значению, с возможностью связывания этих комбинаций с первичными объектами и с кластерами первичных объектов как контекстной интерпретации набора первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

52. Система по п. 51, дополнительно содержащая синтезирующее устройство, содержащее процессор, выполненный с возможностью синтеза представительного файла с цифровой информацией, связанного с исходным файлом с цифровой информацией, путем использования контекстной интерпретации применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре.

53. Система по п. 49 или 50, дополнительно содержащая третье аналитическое устройство, содержащее процессор, выполненный с возможностью

связывания по меньшей мере одного объекта, выбранного из предыдущих объектов, последующих объектов и первичных объектов и кластеров первичных объектов, с одной из множества характеристик исходного файла с цифровой информацией; с возможностью

определения размещения множества характеристик по отношению к длительности исходного файла с цифровой информацией и с возможностью обеспечения корреляции распределения указанного по меньшей мере одного объекта по отношению к нему.

54. Система по п. 53, в которой процессор третьего аналитического устройства выполнен с возможностью создания файла со сводными данными, содержащего обобщенное представление распределения указанного по меньшей мере одного объекта, связанного с каждой из указанного множества характеристик, по длительности исходного файла с цифровой информацией.

55. Система по п. 47, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью регистрации количества и порядка процессов манипуляции, последовательно используемых применительно к последующим результирующим файлам с цифровой информацией с получением последнего результирующего файла с цифровой информацией, имеющего информационную примотронную структуру, причем количество процессов манипуляции связано с соответствующими уровнями иерархии информации.

56. Система по п. 48 или 55, дополнительно содержащая синтезирующее устройство, содержащее процессор, выполненный с возможностью синтеза представительного файла с цифровой информацией, связанного с исходным файлом с цифровой информацией, в соответствии с условным процессом, включающим:

использование любого применимого индикатора корреляции применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними;

если ни один применимый индикатор корреляции не определен, использование контекстной интерпретации применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними; и

если использование контекстной интерпретации ниже пороговой ценности информации, связанной с исходной ценностью информации, использование исходного обратного процесса манипуляции применительно к набору первичных объектов и кластеров первичных объектов в информационной примотронной структуре для определения соответствующей предыдущей комбинации объектов, связанных с ними, причем исходный обратный процесс манипуляции является первой манипуляцией при обратном порядке процессов манипуляции.

57. Система по п. 56, в которой процессор синтезирующего устройства выполнен с возможностью использования применительно к предыдущей комбинации объектов, определенной на основе набора первичных объектов и кластеров первичных объектов в информационной примотронной структуре, условного процесса, включающего любой применимый индикатор корреляции, соответствующую контекстную интерпретацию или следующий обратный процесс манипуляции при обратном порядке процессов манипуляции, соответствующий предыдущей комбинации объектов, для определения следующей предыдущей комбинации объектов, ей соответствующей.

58. Система по п. 57, в которой процессор синтезирующего устройства выполнен с возможностью последовательного использования условного процесса применительно к следующей предыдущей комбинации объектов до тех пор, пока результирующая предыдущая комбинация объектов не будет связана с исходным уровнем иерархии информации, причем результирующий предыдущий файл с цифровой информацией, таким образом, соответствует синтезированному представительному файлу с цифровой информацией.

59. Система по любому из пп. 32-42, 44-48, в которой исходный файл с цифровой информацией является файлом с цифровыми аудиоданными, а процессор устройства для уменьшения цифрового файла выполнен с возможностью связывания количества информации файла с цифровыми аудиоданными со скоростью передачи пропорционально его размеру и длительности и с возможностью связывания ценности информации файла с цифровыми аудиоданными с его качеством, причем обеспечено определение качества на основе по меньшей мере одного элемента группы, включающей: пороговое значение энергии примотрона, критерии воспринимаемой информации, звуковую структуру, идентифицированную из события случайной хаотической флуктуации, определенного в соответствии с функцией распределения вероятности с использованием случайного шума как входного сигнала, критерии нулевой потери качества и площадь поверхности n-мерной сферы единичного радиуса в частотно-временном пространстве, определенную из неявной функции.

60. Система по п. 59, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью последовательного использования процессов манипуляции применительно к предыдущему результирующему файлу с цифровыми аудиоданными для создания последнего результирующего файла со структурированными цифровыми аудиоданными, сконфигурированного в соответствии с иерархией информации, включающей множество уровней информации, причем низкий уровень информации содержит представление аудиоданных в виде файла с цифровой информацией высокого разрешения, а высокий уровень информации содержит табличное представление, содержащее письменную партитуру с соответствующими словами, при этом высокий уровень информации, таким образом, имеет меньшее количество информации, чем низкий уровень информации, и, таким образом, обеспечена возможность создания низкого уровня информации на основе высокого уровня информации и хаотических параметров, связанных с характеристиками и оцифровкой аудиоданных, в соответствии с табличным представлением.

61. Система по п. 60, в которой процессор устройства для уменьшения цифрового файла выполнен с возможностью последовательного использования процессов манипуляции применительно к предыдущему результирующему файлу с цифровыми аудиоданными для создания последнего результирующего файла со структурированными цифровыми аудиоданными, содержащего по меньшей мере один примотрон, определенный во временном пространстве или в частотно-временном пространстве, причем последний результирующий файл со структурированными цифровыми аудиоданными, таким образом, представляет компактную цифровую формализацию гармонического сигнала, количество информации, связанное со скоростью передачи аудиоданных, уменьшено по сравнению с файлом с цифровыми аудиоданными, соответствующим исходному файлу с цифровой информацией, и обеспечено поддержание ценности информации, связанной с качеством аудиоданных, в пределах, заданных пороговым значением файла с цифровыми аудиоданными, соответствующего исходному файлу с цифровой информацией.

62. Система по п. 59, в которой каждый файл с цифровыми аудиоданными представляет связанные с гармониками данные, а процессор устройства для уменьшения цифрового файла выполнен с возможностью определения всплесков как иерархических структур высокого уровня во временном пространстве; с возможностью определения гармоник как иерархических структур высокого уровня в частотном пространстве, имеющих ориентацию последующего гармонического примотрона, совпадающую с окончанием предыдущего гармонического примотрона; с возможностью устранения избыточности в иерархических структурах низкого уровня во временном пространстве с обеспечением уменьшения энтропии в иерархических структурах высокого уровня; и с возможностью определения обертонов как иерархических структур высокого уровня в частотном пространстве, имеющих одну базовую частоту, соответствующую иерархическим структурам низкого уровня, и множество копий иерархических структур высокого уровня, смещенных на постоянную частоту от указанной одной базовой частоты и друг от друга.

63. Машиночитаемый запоминающий носитель, содержащий части машиночитаемого программного кода, которые сохранены на нем и которые при их выполнении процессором обеспечивают, по меньшей мере, выполнение устройством способа по любому из пп. 1-31.

Документы, цитированные в отчете о поиске Патент 2017 года RU2612603C2

US 5742930 A1, 21.04.1998
US 6404898 B1, 11.06.2002
Способ и аппарат для получения гидразобензола или его гомологов 1922
  • В. Малер
SU1998A1
СПОСОБ И УСТРОЙСТВО СЖАТИЯ ВИДЕОИНФОРМАЦИИ 1997
  • Дюссе Жан-Кристоф
  • Гиллотель Филипп
RU2209527C2

RU 2 612 603 C2

Авторы

Жирков Александр

Ораевский Алексей

Гришин Андрей

Блондхейм Джордж

Вандингер Макс

Аттвуд Вэйд

Даты

2017-03-09Публикация

2012-08-16Подача