Способ записи информации на оптические диски однократной записи, организованные в гибридные структуры Российский патент 2025 года по МПК G11B7/04 G06F11/07 

Описание патента на изобретение RU2839304C1

Область техники, к которой относится изобретение

Изобретение относится к способам записи информации на оптические диски однократной записи типа CD-R, DVD-R, BD-R, организованные в гибридные структуры, для создания долговременных архивов электронной информации.

Уровень техники

При создании долговременных архивов электронной информации одной из главных проблем является деградация с течением времени носителей информации (любого типа), что может привести к потере хранящейся информации. Проблему решают созданием нескольких копий сохраняемой в архиве информации на разных экземплярах носителей и ежегодным контролем состояния носителей с записью с заменой деградировавших на новые. Для восстановления деградировавших экземпляров носителей используют экземпляры носителей с копиями информации. В частности, при создании долговременного архива электронной информации на базе оптических дисков однократной записи обычно используется один из способов:

1) записывают одну и ту же информацию на несколько оптических дисков, используя обычный компьютер с одним приводом оптических дисков; способ общеизвестен (обозначим этот способ как R1);

2) используют роботизированную библиотеку оптических дисков (типа Panasonic LB-DH8), которая позволяет группировать оптические диски в массивы типа RAID5, RAID6, повышающие надежность хранения информации (Data Archiver LB-DH8 series. [Электронный ресурс]. URL: https://docs.connect.panasonic.com/archiver/lb-dh8/index.html (дата обращения 2024-07-18)).

В первом случае обеспечивается минимизация стоимости аппаратуры, необходимой для обеспечения работы долговременного архива (один компьютер с одним приводом оптических дисков), а также минимальное время для доступа к записанной на дисках информации, включая возможность прямого контроля целостности записанной информации, например, по контрольным суммам файлов. Но для обеспечения минимизации вероятности потери информации из-за деградации оптических дисков при хранении требуется большое количество дисков с копиями информации {Чернышев А. В. Расчет параметров долговременного электронного архива на оптических дисках для небольшой организации на примере архива для Музея истории детского движения. // Новые информационные технологии и системы (НИТиС-2023): Сборник научных статей по материалам XX Международной научно-технической конференции (г. Пенза, 16-17 ноября 2023 г.). Пенза: Изд-во ПГУ, 2023. С. 222-225.) и, как следствие, значительное количество новых дисков, необходимых ежегодно для замены деградировавших.

Во втором случае стоимость аппаратуры, необходимой для обеспечения работы долговременного архива, включая и затраты на эксплуатацию этой аппаратуры, оказывается очень большой (например, для роботизированной библиотеки Panasonic LB-DH8 базовая комплектация составляла порядка 6 млн. руб., плюс ежегодно 1/10 этой суммы на эксплуатацию библиотеки {Российские организации начинают строить электронные архивы на оптических дисках. [Электронный ресурс]. URL: https://www.itweek.ru/infrastructure/article/detail.php?ID=179684&ysclid=lyrona684t644374563 (дата обращения 2024-07-18)). Однако необходимая минимизация вероятности потери информации в процессе хранения (при объединении оптических дисков в массивы RAID6) может быть достигнута при создании копий информации всего на 3 массивах RAID.

Имеется возможность записывать информацию на массивы оптических дисков, организованных в структуры RAID, не используя дорогостоящие роботизированные библиотеки оптических дисков. Для этого можно использовать обычный компьютер с одним приводом оптических дисков и жестким диском достаточной емкости для подготовки файлов-образов оптических дисков, образующих RAID. Например, для записи массива RAID6 минимального объема (4 диска) на оптические диски типа BD-R (емкость одного диска 25 гигабайт) на жестком диске потребуется всего 100 гигабайт свободного пространства. При этом «сырая» емкость массива RAID6 будет составлять 50 гигабайт, а после создания на нем файловой системы доступная для записи файлов емкость массива RAID6 станет меньше на несколько мегабайт. На жестком диске создаются 4 файла дисковых образа по 25 гигабайт, которые объединяются в программный массив RAID6, на который после создания файловой системы выполняется запись информации. Далее RAID программно разбирается и каждый получившийся файл-образ записывается последовательно на 3 оптических диска типа BD-R. Интересным следствием этого способа является возможность «обмена» оптическими дисками с одинаковыми номерами между получившимися массивами RAID6, что фактически дает структуру RAID 16, существенно снижающую вероятность потери информации при хранении по сравнению с RAID6 (обозначим ее как R16).

Очевидной проблемой способа является невозможность прямого (быстрого) доступа к записанной информации - необходимо предварительное считывание на жесткий диск хотя бы двух оптических дисков из массива RAID6 (требуемое время около 30 минут), из которых на компьютере может быть программно собран «деградировавший» массив RAID6, дающий доступ к записанной информации.

Проблема прямого доступа к записанной на оптические диски информации решается путем организации оптических дисков в гибридные структуры, базирующиеся на массивах RAID. Например, гибридная структура, базирующаяся на массиве RAID6 минимального объема (4 диска), включает в себя одну копию информации, записанную на 2 одиночных оптических диска (как в способе R1) и 2 (или более) копии этой же информации, записанные на оптические диски, объединенные в массивы RAID6 (как для R16). (Чернышев А.В. Применение гибридных структур массивов оптических дисков для создания архивов электронной информации длительного хранения. // Сборник трудов X Международной научной конференции «ИТ-Стандарт 2020». М.: Изд-во «Проспект», 2020. С. 468-474) (Обозначим получившуюся гибридную структуру как G16).

Для структуры G16 обеспечивается быстрый доступ к записанной информации (за счет наличия одиночных дисков) и достаточно низкая вероятность потери информации в процессе хранения (за счет использования структур R16 с копиями) уже при 3 копиях информации. Расчеты показывают, что количество оптических дисков, необходимое для записи 3 копий информации на структуру G16, совпадает с количеством оптических дисков при записи 5 копий информации по способу R1, но вероятность потери информации при хранении на структуре G16 оказывается примерно на два порядка меньше, чем при способе R1 {Чернышев А.В. Расчет параметров долговременного электронного архива на оптических дисках для небольшой организации на примере архива для Музея истории детского движения. // Новые информационные технологии и системы (НИТиС-2023): Сборник научных статей по материалам XX Международной научно-технической конференции (г. Пенза, 16-17 ноября 2023 г.). Пенза: Изд-во ЛГУ, 2023. С. 222-225). То есть, такая структура, не требуя дорогостоящей аппаратуры для создания и эксплуатации долговременного архива, одновременно обеспечивает и возможность быстрого доступа к хранимой информации, и минимизацию количества записываемых архивных оптических дисков. Как следствие, минимизируется и количество оптических дисков, требуемых ежегодно для замены деградировавших архивных дисков.

Однако из-за двух способов записи информации (одиночные диски и диски в составе RAID) возникает две проблемы:

1) при деградации одиночного диска нет простого способа получить его файл-образ для записи нового диска на замену, так как копии информации хранятся на дисках, не являющихся одиночными;

2) нет простого и быстрого способа проверить целостность информации на дисках, образующих массивы RAID, - требуется длительная процедура сборки программного массива RAID из копий оптических дисков на жестком диске компьютера.

Предлагаемый способ записи информации на оптические диски однократной записи, объединенные в гибридные структуры, позволяет обойти названные проблемы. Раскрытие сущности изобретения.

Сущность изобретения заключается в том, что на массиве RAID6 гибридной структуры записываются файлы-образы файловых систем одиночных оптических дисков гибридной структуры, сжатые программой архивации (например, gzip). (Из-за необходимости создания на массиве RAID6 хотя бы минимальной файловой системы, которая сама занимает некоторое место, оставшегося свободного места для размещения файлов-образов файловых систем одиночных оптических дисков без сжатия на массиве RAID6 недостаточно.) При этом внутри файловых систем файлов-образов одиночных оптических дисков предусмотрены файлы контрольных сумм (например, MD5), позволяющие непосредственно проверить целостность файлов, записанных на эти файловые системы (и, соответственно, на одиночные оптические диски). Каждый получившийся файл-образ диска, входящий в массив RAID6, снабжается внешним файлом с его контрольной суммой и записывается на оптические диски в необходимом количестве копий (не менее 2). Это возможно, так как реальная емкость однократно записываемого оптического диска немного больше его официально заявленной емкости.

Достигаемый технический результат состоит в простоте контроля целостности информации на всех оптических дисках гибридной структуры, а также в возможности получения достоверных файлов-образов оптических дисков обоих типов, необходимых для записи новых оптических дисков на замену деградировавшим.

В результате все оптические диски, входящие в гибридную структуру, могут быть проверены на целостность записанной на них информации по присутствующим на них же файлам контрольных сумм поочередно в единственном приводе оптических дисков компьютера без необходимости длительной сборки массива RAID.

Восстановить деградировавший диск из массива RAID можно, сняв копию с другого (исправного) диска RAID с аналогичным номером, входящего в гибридную структуру.

Восстановить деградировавший одиночный диск можно, собрав на жестком диске компьютера программный RAID из файлов-образов массива RAID6, записанных на соответствующих оптических дисках, и скопировав из него необходимый файл-образ деградировавшего одиночного диска с одновременным разжатием.

Осуществление изобретения

Пусть долговременный архив создается на оптических дисках однократной записи типа BD-R емкостью 25 гигабайт (25000000000 байт), объединяемых в гибридные структуры на базе массивов RAID6 с минимальным количеством дисков (4 диска на массив). В этом случае в каждой гибридной структуре будет присутствовать 2 одиночных оптических диска.

Принятая конфигурация обеспечивает минимальную вероятность потери информации в процессе хранения из-за деградации дисков. При увеличении количества дисков в массиве RAID6 будет возрастать вероятность потери информации на нем из-за возможной одновременной деградации нескольких дисков массива.

Пусть, для определенности, принято решение о достаточности 3 копий информации (одна копия на одиночных дисках и 2 копии на массивах RAID6). Если необходимо большее количество копий информации, то все дополнительные копии должны создаваться на массивах RAID6.

Пусть принято решение об использовании контрольных сумм MD5 для проверки целостности хранимых в архиве файлов.

Пусть для записи архивных оптических дисков и последующей работы с ними используется один компьютер с одним оптическим приводом и жестким диском емкостью 300 гигабайт.

Для определенности дальнейшее описание приводится для операционной системы Linux (тип дистрибутива роли не играет).

Подготовительные операции

1. На жестком диске необходимо создать подкаталоги D1, D2, D3, D4, D5, D6, R6:

mkdir D1

mkdir D2

mkdir D3

mkdir D4

mkdir D5

mkdir D6

mkdir R6

Подкаталоги D1 и D2 будут использоваться для первоначальной записи информации, размещаемой на одиночных оптических дисках гибридной структуры. Подкаталоги D3-D6 будут использоваться для размещения в них файлов-образов массива RAID6. Подкаталог R6 будет использоваться для монтирования в него файловой системы программного массива RAID6.

2. Создать в каждом из подкаталогов D3-D6 файл-образ массива RAID6 размером строго 25 гигабайт.Например, для подкаталога D3:

Команда losetup обеспечивает возможность работы с файлом file.img как с блочным устройством. В результате выполнения вышеуказанных действий для всех подкаталогов D3-D6 в системе появятся блочные устройства /dev/loop0, /dev/loop1, /dev/loop2, /dev/loop3.

3. Собрать программный массив RAID6:

4. Создать на массиве RAID6 минимальную файловую систему типа ext2:

5. Разобрать программный массив RAID6:

На этом подготовительные операции закончены.

Процесс записи

1. Собрать программный массив RAID6 и смонтировать его файловую систему в подкаталог R6:

2. Заполнить подкаталоги D1 и D2 записываемыми файлами обычным способом, контролируя объем файлов в каждом подкаталоге, например, с помощью команды du или любым другим способом.

3. В корне каждого подкаталога D1 и D2 разместить файл контрольных сумм. Например, для подкаталога D1:

4. Убедиться любым способом, что суммарный объем файлов, включая файл MD5, в каждом подкаталоге D1 и D2 не превышает 25000000000 байт.

5. Получить файл-образ файловой системы для записи первого одиночного оптического диска:

В результате выполнения команды будет сгенерирован файл-образ dl.iso.

6. Записать полученный файл-образ на первый одиночный оптический диск:

7. Записать файл-образ dl.iso на массив RAID6 со сжатием:

8. Удалить файл dl.iso:

9. Получить файл-образ файловой системы для записи второго одиночного оптического диска:

В результате выполнения команды будет сгенерирован файл-образ d2.iso.

10. Записать полученный файл-образ на второй одиночный оптический диск:

11. Записать файл-образ d2.iso на массив RAID6 со сжатием:

12. Удалить файл d2.iso:

13. Разобрать массив RAID6:

14. Для каждого подкаталога D3-D6 свернуть файл контрольной суммы. Например, для подкаталога D3:

15. Для каждого подкаталога D3-D6 дважды выполнить запись на оптический диск (или в другом необходимом количестве копий). Например, для подкаталога D3:

(сменить оптический диск в приводе на новый)

После выполнения пункта 15 для каждого подкаталога D3-D6 запись гибридной структуры на оптические диски закончена.

Процесс контроля целостности информации на оптических дисках

Независимо от типа оптического диска в гибридной структуре контроль целостности информации выполняется следующей последовательностью команд:

1. Смонтировать оптический диск (предположим, что монтирование выполняется в подкаталог /mnt):

2. Выполнить проверку контрольных сумм:

3. Извлечь оптический диск из привода:

Процесс восстановления деградировавшего оптического диска из массива RAID6

1. Получить на жестком диске компьютера файл-образ файловой системы исправного оптического диска массива RAID6 с тем же номером из другой копии массива RAID6:

2. Выполнить запись полученного файла-образа на новый оптический диск:

Процесс восстановления деградировавшего одиночного оптического диска

Предположим, что необходимо восстановить первый одиночный диск (файл-образ dl.iso).

1. Получить на жестком диске компьютера файлы-образы файловой системы двух оптических дисков массива RAID6 (с любыми номерами). Например, оптических дисков, запись которых была выполнена из подкаталогов D3 и D4:

2. Превратить файлы-образы в блочные устройства:

Предположим, что в результате этих команд в системе появились блочные устройства /dev/loop4 и /dev/loop5 (конкретные номера блочных устройств будут назначены автоматически).

3. Собрать «деградировавший» программный массив RAID6 и смонтировать его файловую систему:

4. Извлечь из смонтированной файловой системы массива RAID6 необходимый файл-образ диска с одновременным разжатием:

5. Выполнить запись полученного файла-образа на новый оптический диск:

6. Вернуть систему в первоначальное состояние:

Похожие патенты RU2839304C1

название год авторы номер документа
Накопитель магнитный с разделёнными областями 2020
  • Носков Александр Георгиевич
RU2757659C1
ОТСЛЕЖИВАНИЕ "ГРЯЗНЫХ" ОБЛАСТЕЙ ЭНЕРГОНЕЗАВИСИМЫХ НОСИТЕЛЕЙ 2011
  • Палеологу Эмануэль
  • Мехра Каран
  • Мосс Даррен
RU2728816C2
СПОСОБ ЗАЩИТЫ ДОСТУПНОСТИ И КОНФИДЕНЦИАЛЬНОСТИ ХРАНИМЫХ ДАННЫХ И СИСТЕМА НАСТРАИВАЕМОЙ ЗАЩИТЫ ХРАНИМЫХ ДАННЫХ 2014
  • Косолапов Юрий Владимирович
RU2584755C2
Способ хранения данных в избыточном массиве независимых дисков с повышенной отказоустойчивостью 2020
  • Дремлюга Антон Анатольевич
  • Фромм Антон Константинович
  • Шетохин Дмитрий Николаевич
  • Пинчук Артур Игоревич
RU2750645C1
СПОСОБ И УСТРОЙСТВО ДЛЯ СОХРАНЕНИЯ АУДИОИНФОРМАЦИИ С ПОМОЩЬЮ МЕХАНИЗМА ТАБЛИЦЫ СОДЕРЖАНИЯ (TOC), А ТАКЖЕ С ПОМОЩЬЮ ОСНОВАННОГО НА ФАЙЛАХ МЕХАНИЗМА ЧЕРЕЗ КОРНЕВОЙ КАТАЛОГ, КОТОРЫЙ СОДЕРЖИТ КАТАЛОГ ВЫСШЕГО УРОВНЯ ТАБЛИЦЫ СОДЕРЖАНИЯ, И УНИТАРНЫЙ НОСИТЕЛЬ, СОДЕРЖАЩИЙ ТАКУЮ ИНФОРМАЦИЮ 1998
  • Монс Йоханнес Ян
RU2271580C2
НОСИТЕЛЬ ЗАПИСИ СО СТРУКТУРОЙ ДАННЫХ ДЛЯ УПРАВЛЕНИЯ ВОСПРОИЗВЕДЕНИЕМ ЗАПИСАННЫХ НА НЕМ СТАТИЧЕСКИХ ИЗОБРАЖЕНИЙ И СПОСОБЫ И УСТРОЙСТВА ЗАПИСИ И ВОСПРОИЗВЕДЕНИЯ 2003
  • Ким Бён Джин
  • Пак Сын Ван
  • Со Ган Су
  • Ым Сон Хён
RU2360302C2
НОСИТЕЛЬ ЗАПИСИ И СПОСОБ ЗАПИСИ НА НОСИТЕЛЬ ЗАПИСИ 2003
  • Охби Сейдзи
  • Каваками Такаси
  • Кии Манабу
  • Хаттори Масато
RU2305330C2
СПОСОБ СОЗДАНИЯ ВИТРИНЫ ДАННЫХ 2024
  • Семенов Александр Владимирович
  • Мулло Дмитрий Александрович
RU2840319C1
КОНТРОЛЬНЫЕ ТОЧКИ ДЛЯ ФАЙЛОВОЙ СИСТЕМЫ 2011
  • Карджилл Джонатан М.
  • Миллер Томас Дж.
  • Типтон Вилльям Р.
RU2554847C2
СПОСОБ ВНЕСЕНИЯ ИЗМЕНЕНИЙ В ДИСТРИБУТИВ БЕЗ ПОВТОРНОГО ВЫЧИСЛЕНИЯ ПОДПИСЕЙ ДЛЯ ФАЙЛОВ ВНУТРИ ДИСТРИБУТИВА 2013
  • Филатов Константин Михайлович
  • Яблоков Виктор Владимирович
RU2571722C2

Реферат патента 2025 года Способ записи информации на оптические диски однократной записи, организованные в гибридные структуры

Изобретение относится к способам записи информации на оптические диски однократной записи типа CD-R, DVD-R, BD-R, организованные в гибридные структуры. Способ состоит в том, что на массиве RAID гибридной структуры записываются файлы-образы файловых систем одиночных оптических дисков гибридной структуры, сжатые программой архивации. Внутри файловых систем файлов-образов одиночных оптических дисков предусмотрены файлы контрольных сумм. Каждый получившийся файл-образ диска, входящий в массив RAID, снабжается внешним файлом с его контрольной суммой и записывается на оптические диски в необходимом количестве копий. Изобретение позволяет выполнять контроль целостности записанной информации непосредственно на каждом оптическом диске гибридной структуры с применением всего одного привода оптических дисков компьютера.

Формула изобретения RU 2 839 304 C1

Способ записи информации на оптические диски однократной записи, организованные в гибридные структуры, предусматривающий для каждой гибридной структуры запись одной копии информации на одиночные оптические диски и несколько копий информации на оптические диски, образующие массивы RAID, отличающийся тем, что на массив RAID записывают файлы-образы файловых систем одиночных оптических дисков гибридной структуры, сжатые программой сжатия файлов, а непосредственно на каждый оптический диск, входящий в массив RAID гибридной структуры, записывают файл-образ соответствующего диска массива RAID вместе с файлом его контрольной суммы.

Документы, цитированные в отчете о поиске Патент 2025 года RU2839304C1

WO 2005104670 A2, 29.23.3005
CN 110727541 A, 24.01.2020
CN 107870731 B, 27.07.2021.

RU 2 839 304 C1

Авторы

Чернышов Александр Викторович

Даты

2025-04-29Публикация

2024-07-22Подача