Вернуться к оглавлению книги 4.
Свертка информации.
Однажды, года три тому назад, я, будучи на курсах в Санкт-Петербургском университете им. Бонч-Бруевича, совершенно случайно в одной из лабораторий, на стеллаже обнаружил брошюрку местного издания, в которой были кратко описаны тематики научных работ проводимых в его стенах. Ради праздного интереса выпросил ее. И оказалось не зря!
Дело в том, что в брошюре был материал с названием «Новый способ архивации данных».
А это очень интересная для меня тема, поскольку я много лет пытался отыскать алгоритм, т.н. «свертки информации». Т.е. способа сжатия первоначального объема цифровой информации с равновероятностным распределением «нулей» и «единиц» многопроходным методом с простым универсальным алгоритмом, до исчезающе малого объема. Все мои попытки оказались тщетными.
Но, к выводу о том, что с помощью обычного представления цифровой информации, добиться ожидаемых результатов невозможно, я все же пришел.
Стал пробовать применять «Вращающиеся матрицы», «Триплетные алгоритмы», «Пространственные матрицы» и многое другое.
Но все безрезультатно.
Сейчас я понял, что эту задачу решить одному, с карандашом и бумагой в руках, вряд ли возможно. Здесь нужно участие высококлассного программиста, как минимум. Что бы он мог все возникающие нюансы быстро переводить в алгоритм и тут же перепроверять его работоспособность на ПК.
Большинство людей вряд ли понимают грандиозность задачи по отысканию способов «Свертки информации».
А ведь ее решение позволит революционизировать все, что связано с обработкой информации и управлением объектами.
Причем революционизировать так, что живая природа со своими биологическими нейросетями, мозгами и прочим, останется далеко позади.
Станет возможным записывать на носитель информации объемом, к примеру 1,0 Гб, все книги когда-либо изданные на планете Земля.
И как сейчас начало вырисовываться, кое-где, кто-то, уже начал подбираться к периферии неизведанной области с названием «Свертка информации».
Вспомните:
Ну и наконец, предлагаемая ниже статья (фрагмент из брошюры).
НОВЫЙ СПОСОБ АРХИВАЦИИ ДАННЫХ
Разработан принципиально новый метод представления данных, позволяющий произвести более краткую запись представленного сообщения, то есть осуществить сжатие без потерь. Алгоритм и математическое обоснование предлагаемой теории кодирования основаны на теории больших чисел и обеспечивают на существующей материальной базе практически неограниченную степень архивации.
В настоящее время на мировом рынке имеются программы архивации данных, позволяющие сжимать исходное сообщение до некоторого предела, характеризуемого как бинарной структурой файла, так и особенностями алгоритмов архивации. При этом общей чертой, объединяющей существующие методы архивации, является ориентировка на изначальную избыточность файлов по первой производной, то есть наличие априорной вероятности появления символов. Причем степень сжатия современных архиваторов без потери данных, ориентированных на исходные предпосылки, не превышает для текстовых данных 4-х кратного, а для двоичного (исполняемые модули, данные) 2-3-х кратного сжатия.
Предложенный метод является многопроходным и позволяет получить за один проход коэффициент сжатия порядка 1,02 - 1,028, что соответствует выигрышу от 2% до 2,8%. Минимальный объем сжимаемого файла на сегодняшний день составляет порядка 1 мегабайта. Любой больший файл, используя разработанный метод, возможно сжать до этого размера за некоторое время, зависящее от мощности вычислительных средств. К примеру, архив arj размером 16 Мб. с почти равновероятным распределением символов и не сжимаемый далее никаким из существующих архиваторов, сжимается новым методом до 1,3 Мб на персональном компьютере Pentium-600/128 за 16 часов.
Столь разительные результаты были получены путем перехода от стандартного арифметического кодирования к новым созданным способам оптимальной записи битовых потоков с равновероятным распределением, то есть белого шума, который невозможно сжать без потерь существующими методами.
Разработанный метод основан на разделении исходной информации на "динамическую" и "статическую" составляющие по некоторым "признакам", причем статическая часть является неотделимой частью кода. В результате многолетних исследований выявлено, что статическая часть является меньшей по объему (по результатам исследований), а динамическая часть (большая составляющая), теоретически может быть сжата не только до некоторого объема по первой производной, используемой современными архиваторами, но и до стремящегося при больших числах к минимуму значения.
Данная разработка может быть использована в системах обработки и хранения данных больших объемов, в системах цифровой связи, работающих в режиме ограничения объема передаваемой информации и т. д. Она реализована в виде программного продукта в составе пакета прикладных программ обработки и анализа исходных сообщений, выполнена под операционную систему Windows 95 на языке С++.
Кафедра автоматизации предприятий связи (АПС)
А.П. Луценко Тел.: (812) 589 8390, 589 8274. E-mail: aps@scientist.com.
Вернуться к оглавлению книги 4.