МНОГОПРОТОКОЛЬНОЕ УСТРОЙСТВО ХРАНЕНИЯ ДАННЫХ, РЕАЛИЗУЮЩЕЕ ИНТЕГРИРОВАННУЮ ПОДДЕРЖКУ ФАЙЛОВЫХ И БЛОЧНЫХ ПРОТОКОЛОВ ДОСТУПА Российский патент 2007 года по МПК G06F12/08 

Описание патента на изобретение RU2302034C9

Область техники

Настоящее изобретение относится к области систем хранения данных и, в частности, к области многопротокольных устройств хранения данных, поддерживающих файловые и блочные протоколы доступа.

Уровень техники

Система хранения данных представляет собой компьютер с функционирующей на нем службой хранения информации, в основе которой лежит организация информации на перезаписываемых постоянных запоминающих устройствах, например блоках памяти, лентах или дисках. Система хранения данных, как правило, устанавливается в среде сети хранения данных (storage area network, SAN) или среде накопителя, подключенного к сети (network attached storage, NAS). Система хранения данных, используемая в среде NAS, может быть реализована в виде файлового сервера, имеющего операционную систему, которая, в свою очередь, поддерживает файловую систему, посредством которой осуществляется логическая организация информации в виде иерархической структуры каталогов и файлов (например, на дисках). Каждый "дисковый" файл может представлять собой набор структур данных, например блоков на диске, сконфигурированных для целей хранения информации, например собственно данных файла. В свою очередь, каталог может представлять собой файл специального формата, в котором хранится информация о других файлах и каталогах.

Далее, файловый сервер (filer) может быть сконфигурирован для работы по модели предоставления информации "клиент-сервер", что позволяет многим клиентским системам (клиентам) получать доступ к совместно используемым ресурсам, например файлам, хранящимся в файловой системе. Совместное использование файлов - характерная черта системы NAS, поскольку эта возможность обуславливается семантическим уровнем доступа к файлам и файловым системам, присущим таким системам. Средства хранения информации в системе NAS, как правило, устанавливаются в компьютерной сети, включающей в себя множество территориально распределенных взаимосвязанных каналов связи, таких как Ethernet, которые позволяют удаленным клиентам обращаться к информации (файлам) на файловом сервере. Как правило, клиенты взаимодействуют с файловой системой путем обмена дискретными кадрами или пакетами данных по предварительно определенным протоколам, например TCP/IP (Transmission Control Protocol/Internet Protocol, протокол управления передачей/протокол Интернета).

В клиент-серверной модели клиент может включать в себя приложение, функционирующее на компьютере и "соединяющееся" с файловым сервером по компьютерной сети, например по каналу связи типа "точка-точка", совместно используемой локальной сети, глобальной сети или виртуальной частной сети, развернутой на основе сети общего пользования, например Интернета. В системах NAS, как правило, используются файловые протоколы доступа; это означает, что каждый клиент может запросить услуги файлового сервера путем посылки по сети сообщений для файлового сервера с использованием протокола файловой системы (в форме пакетов), при этом сообщения идентифицируют один или более файлов, к которым запрашивается доступ, без учета конкретного их местоположения, например блоков, в которых данные хранятся на диске. Поддержка множества протоколов файловых систем, таких как протоколы CIFS (Common Internet File System, общий протокол доступа к Интернет-файлам), NFS (Network File System, сетевая файловая система) и DAFS (Direct Access File System, файловая система с прямым доступом), позволяет расширить функции файлового сервера для работы с сетевыми клиентами.

SAN представляет собой высокоскоростную сеть, поддерживающую установление прямых соединений между системой хранения информации и ее накопителями. SAN, таким образом, может рассматриваться как расширение шины системы памяти, и, по сути, операционная система устройства хранения данных реализует доступ к хранящейся информации с использованием блочных протоколов доступа по "расширенной шине". В этом случае расширенная шина, как правило, реализуется на основе среды передачи Fibre Channel (FC) или Ethernet, адаптированных для работы с блочными протоколами доступа; пример такой адаптации - инкапсуляция протокола SCSI (Small Computer System Interface, интерфейс малых компьютерных систем) для передачи по FC или TCP/IP/Ethernet.

Схема развертывания (топология) SAN позволяет устранить жесткую связь пространства хранения данных и системы хранения, например сервера приложений, и реализовать определенный уровень совместного использования пространства хранения данных на уровне сервера приложений. Существуют, однако, среды, в которых SAN функционирует на базе выделенного для нее сервера. В некоторых вариантах топологии SAN информация организуется в форме баз данных, в то время как в других вариантах применяется организация на основе файлов. Если информация организуется на основе файлов, то в этом случае клиент, запрашивающий информацию, обрабатывает отображения файлов и задает семантику файлов, в то время как его запросы (и ответы сервера) обращаются к информации в соответствии с принципами адресации блоков на диске с использованием, например, номеров логических устройств (logical unit number, lun).

В известных подходах адресация в средах SAN и NAS осуществляется с использованием двух отдельных решений. В подходах, предоставляющих общее решение для обеих этих сред, функции NAS обычно представляют собой "надстройку" над платформой системы хранения данных SAN, реализуемую, например, путем применения дополнительного устройства (иногда называемого "мотоциклетной коляской"), подключаемого к платформе SAN. Однако даже в этих системах предыдущего уровня техники существует деление хранения на различные области хранения - области SAN и NAS. Таким образом, пространства хранения данных для областей SAN и NAS не сосуществуют, а, напротив, физически разделяются в процессе конфигурирования, который выполняется, например, пользователем (системным администратором).

Пример такой системы предыдущего уровня техники - платформа системы Symmetrix®, поставляемая ЕМС® Corporation. Распределенные отдельные диски системы хранения SAN (система Symmetrix) ассоциированы с дополнительным устройством NAS (например, устройством Celerra), которое, в свою очередь, предоставляет доступ к этим дискам для клиентов NAS по определенным протоколам, например протоколам NFS и CIFS. Системный администратор определяет количество дисков и местоположение "секций" (экстентов) этих дисков, которые объединяются и образуют "определяемые пользователем тома", а также способ использования этих томов. Термин "том", традиционно используемый в среде SAN, означает объект, в котором хранится информация и который создается путем определения физических дисков и экстентов в пределах этих дисков посредством операций, объединяющих эти экстенты/диски в определяемый пользователем объект хранения - том. Следует отметить, что диски SAN и диски NAS, содержащие пользовательские тома, в пределах системной платформы являются физически отдельными.

Как правило, системный администратор реализует свои решения через сложный пользовательский интерфейс, ориентированный на тех пользователей, которые хорошо осведомлены об основных физических характеристиках системы. Таким образом, пользовательский интерфейс предназначается, прежде всего, для работы и управления структурами физических дисков, с которыми системный администратор должен производить определенные операции с целью представления платформы SAN для клиента. Например, пользовательский интерфейс может предложить администратору определить физические диски наряду с размерами экстентов для этих дисков, необходимых для создания пользовательского тома. Кроме того, интерфейс запрашивает у администратора физическое расположение этих экстентов и дисков, а также способ их "склеивания" (организации) и представления (экспорта) для клиента SAN в виде пользовательского тома, соответствующего диску или lun. После того как физические диски и их экстенты для создания тома будут выбраны, этот том будет находиться только на этих дисках и в этих экстентах. Системный администратор должен также определить способ обеспечения надежности, например уровень защиты RAID (Redundant Array of Independent (Inexpensive) Disks, избыточный массив независимых (или недорогих) дисков) и/или "зеркальное копирование", для этого созданного тома. В этом случае группы RAID являются следующим по высоте уровнем по отношению к указанным выбранным дискам/экстентам.

Резюме: подход, применяемый в системах предыдущего уровня техники, предъявляет следующее требование: при создании пользовательского тома, представляемого для клиента SAN в виде одного lun, системный администратор должен явно и тщательно сконфигурировать физическое размещение дисков и их организацию. Все операции администрирования, связанные с этим подходом предыдущего уровня техники, основываются на работе непосредственно с физическими дисками. Если системному администратору требуется увеличить размер пользовательского тома, производится добавление дисков и повторное выполнение вычислений для RAID с целью добавления избыточной информации, связанной с теми данными, которые хранятся на дисках, составляющих том. Очевидно, что этот подход является сложным и дорогостоящим. Настоящее изобретение направлено на реализацию простого и эффективного интегрированного решения для сред хранения SAN и NAS.

Раскрытие изобретения

Задачей настоящего изобретения является создание многопротокольного устройства хранения данных, поддерживающего файловые и блочные протоколы доступа и реализующего на их основе доступ к информации, хранящейся на накопителях, общим для систем с топологией накопителя, подключенного к сети (network attached storage, NAS), и систем с топологией сети хранения данных (storage area network, SAN) способом. Операционная система устройства хранения данных поддерживает файловую систему, которая взаимодействует с современными модулями виртуализации и реализует систему виртуализации, которая, в свою очередь, "виртуализирует" пространство хранения данных, предоставляемое устройствами. Следует отметить, что файловая система поддерживает возможности управления томами, что обеспечивает возможность их использования для целей блочного доступа к информации, хранящейся на устройствах. Система виртуализации позволяет логически организовать данные в файловой системе в такие объекты хранения, как именованные файлы, каталоги и виртуальные диски (vdisk), что позволяет реализовать интегрированный подход к хранению, общий для NAS и SAN, путем обеспечения файлового доступа к файлам и каталогам и одновременно блочного доступа к виртуальным дискам.

В варианте осуществления изобретения модули виртуализации представляют собой, например, сочетание модуля виртуальных дисков и целевого модуля с интерфейсом SCSI. Модуль виртуального диска реализует тракт передачи данных из целевого модуля SCSI с блочным доступом в блоки, обслуживаемые файловой системой. Кроме того, модуль виртуальных дисков взаимодействует с файловой системой, посредством чего реализуется доступ по административным интерфейсам, например удобному пользовательскому интерфейсу (user interface, UI), в ответ на команды, посылаемые системным администратором в многопротокольное устройство хранения данных. Далее, модуль виртуального диска осуществляет управление системами с топологией SAN, для чего он, помимо прочего, поддерживает полный набор команд управления виртуальными дисками, посылаемых системным администратором через UI. Эти команды управления виртуальными дисками преобразуются в низкоуровневые операции файловой системы, которые взаимодействуют с файловой системой и целевым модулем SCSI, посредством чего реализуются виртуальные диски.

Целевой модуль SCSI, в свою очередь, инициирует эмуляцию диска или устройства с логическим номером (lun) путем выполнения процедуры отображения, которая преобразует основанное на логических блоках обращение к lun, указанным в запросах доступа, в обращение к виртуальным дискам, основанное на виртуальных блоках; эта же процедура преобразует виртуальные диски в логические номера для ответов на запросы. Таким образом, целевой модуль SCSI реализует уровень трансляции системы виртуализации между пространством блоков (lun) SAN и пространством файловой системы, в котором номера логических устройств (lun) представляются как виртуальные диски. Многопротокольное устройство хранения данных использует "надстройку" виртуализации SAN над файловой системой (что в корне отличается от подходов, используемых в системах предыдущего уровня техники) и таким образом реализует самостоятельную единую платформу хранения, в общем случае поддерживающую все протоколы доступа к хранимой информации.

Одно из преимуществ интегрированного многопротокольного устройства хранения данных состоит в том, что это устройство обеспечивает управление доступом и при соответствующем обеспечении - совместное использование файлов и виртуальных дисков для всех протоколов при сохранении целостности данных. Далее, многопротокольное устройство хранения данных предоставляет возможности встроенной/интегрированной виртуализации, которые устраняют необходимость участия пользователя в распределении ресурсов хранения при создании объектов хранения NAS и SAN. Эти возможности включают в себя виртуальное пространство хранения данных, которое поддерживает совместное существование объектов SAN и NAS по отношению к управлению общим пространством хранения данных со стороны файловой системы. Кроме того, многопротокольное устройство хранения данных обеспечивает одновременную поддержку протоколов блочного доступа к одному и тому же виртуальному диску, а также гетерогенную среду SAN с поддержкой кластеризации.

Перечень фигур чертежей

Вышеописанные и другие свойства и достоинства настоящего изобретения станут ясны из нижеследующего описания, содержащего ссылки на прилагаемые чертежи, которые иллюстрируют вариант осуществления изобретения, не вносящий каких-либо ограничений, причем одинаковые позиции на чертежах указывают на идентичные или функционально подобные элементы.

На чертежах:

на фиг.1 представлена структурная схема многопротокольного устройства хранения данных, сконфигурированного для работы в средах сети хранения данных (SAN) и накопителя, подключенного к сети (NAS) в соответствии с настоящим изобретением;

на фиг.2 представлена структурная схема операционной системы многопротокольного устройства хранения данных, которая может быть преимущественно использована при осуществлении настоящего изобретения;

на фиг.3 представлена структурная схема системы виртуализации, которая реализуется на основе файловой системы, взаимодействующей с модулями виртуализации в соответствии с настоящим изобретением; и

на фиг.4 изображена блок-схема, иллюстрирующая последовательность шагов, которые выполняются при обращении к информации, хранящейся в многопротокольном устройстве хранения данных, по сети SAN.

Осуществление изобретения

Настоящее изобретение направлено на создание многопротокольного устройства хранения данных, которое поддерживает доступ к информации, хранящейся на накопителях, интегрированным способом, общим для файловых и блочных протоколов доступа. В этом контексте интегрированное многопротокольное устройство представляет собой компьютер, имеющий такие свойства, как простота управления службой хранения информации и легкость конфигурирования устройства хранения данных, в том числе многократно используемого пространства хранения данных, для пользователей (системных администраторов) и клиентов систем с топологией накопителя, подключенного к сети (network attached storage, NAS) и систем с топологией сети хранения данных (storage area network, SAN). Устройство хранения данных может предоставлять услуги NAS посредством файловой системы, одновременно реализуя услуги SAN с помощью средств виртуализации, в том числе эмуляции номеров логических устройств (lun).

На фиг.1 изображена структурная схема многопротокольного устройства 100 хранения данных, сконфигурированного для реализации службы хранения данных, в основе которой лежит организация информации, хранящейся на накопителях, например, дисках 130. Вариант реализации многопротокольного устройства 100 хранения данных представляет собой систему хранения информации, которая включает в себя процессор 122, память 124, множество сетевых адаптеров 125 и 126 и адаптер 128 накопителей; все эти компоненты связаны системной шиной 123.

Многопротокольное устройство 100 хранения данных также включает в себя операционную систему 200 устройства хранения данных, которая реализует систему виртуализации (и, в частности, файловую систему), осуществляющую логическую организацию информации в виде иерархической структуры таких объектов хранения, как именованные каталоги, файлы и виртуальные диски (vdisk), расположенных на дисках 130.

В то время как для клиентов сетевой среды на основе NAS используется файловое представление, для клиентов сетевой среды на основе SAN используется представление пространства хранения данных на основе блоков или дисков. Для этого многопротокольное устройство 100 хранения данных представляет (экспортирует) диски для клиентов SAN посредством создания логических номеров устройств (lun) или объектов виртуальных дисков (vdisk). Объект vdisk (в дальнейшем "vdisk") представляет собой файл специального типа, который создается системой виртуализации и преобразуется в эмулируемый диск, в виде которого он представляется клиентам SAN. Далее многопротокольное устройство 100 хранения данных предоставляет доступ к этим эмулируемым дискам для клиентов SAN посредством управляемого экспорта, который описан далее в настоящем документе.

В варианте осуществления изобретения память 124 включает в себя ячейки памяти, адресуемые процессором и адаптерами и предназначенные для хранения программного кода и структур данных в соответствии с настоящим изобретением. Процессор и адаптеры могут, в свою очередь, включать в себя элементарные процессоры и/или логические схемы, сконфигурированные для выполнения программного кода и управления структурами данных. Операционная система 200 устройства хранения данных, компоненты которой, как правило, резидентно располагаются в памяти и выполняются элементарными процессорами, функционально организует многопротокольное устройство 100 хранения данных и при этом, помимо прочего, инициирует операции с пространством хранения данных для поддержки службы хранения, реализуемой устройством. Специалисту в данной области техники ясно, что для хранения и выполнения программного кода, имеющего отношение к описываемой системе и способу в соответствии с настоящим изобретением, могут использоваться и другие средства обработки и хранения, в том числе различные носители информации, которые могут читаться компьютером.

Сетевой адаптер 125 соединяет многопротокольное устройство хранения данных с множеством клиентов (160а, b) по каналам связи типа "точка-точка", глобальным сетям, виртуальным частным сетям, развернутым на основе сети общего пользования (Интернета) или совместно используемой локальной сети, в дальнейшем используемой в качестве примера и называемой сетью 165 Ethernet. Поэтому сетевой адаптер 125 может включать в себя сетевую интерфейсную плату (network interface card, NIC), содержащую все механические, электрические и сигнальные схемы, необходимые для соединения устройства с сетевым коммутатором, например обычным коммутатором 170 Ethernet. В этой сетевой среде на основе NAS клиенты конфигурируются для обращения к информации, хранящейся в многопротокольном устройстве 100 хранения данных, как к файлам. Клиенты 160 взаимодействуют с многопротокольным устройством 100 хранения данных по сети 165 путем обмена дискретными фреймами или пакетами данных по предварительно определенным протоколам, например TCP/IP.

Клиенты 160 могут быть универсальными компьютерами, сконфигурированными для выполнения приложений, на основе разнообразных операционных систем, в том числе операционных систем UNIX® и Microsoft® Windows При запросе информации (в форме файлов и каталогов) по сети на основе NAS системы клиентов, как правило, используют протоколы доступа на основе файлов. Поэтому каждый клиент 160 может запрашивать услуги многопротокольного устройства 100 хранения данных путем посылки устройству сообщений по файловому протоколу доступа (в форме пакетов) по сети 165. Например, клиент 160а, использующий операционную систему Windows, может связаться с многопротокольным устройством 100 хранения данных с применением протокола CIFS по TCP/IP. С другой стороны, клиент 160b, использующий операционную систему UNIX, может связаться с многопротокольным устройством 100 хранения данных с применением как протокола NFS по TCP/IP, так и протокола DAFS по каналу передачи виртуального интерфейса (virtual interface, VI) в соответствии с протоколом передачи удаленного DMA (Remote DMA, RDMA) по TCP/IP. Специалисту в данной области техники ясно, что к многопротокольному устройству хранения данных могут подключаться и другие клиенты, использующие другие типы операционных систем, посредством других файловых протоколов доступа.

"Целевой" адаптер 126 сети хранения данных также соединяет многопротокольное устройство 100 хранения данных с клиентами 160, которые могут быть далее сконфигурированы для обращения к хранящейся информации, как к блокам или дискам. Для этой сетевой среды SAN устройство хранения в данном варианте осуществления соединяется с сетью 185 Fibre Channel (FC). FC - это сетевой стандарт, описывающий набор протоколов и сред, который наиболее часто используется в средах SAN. Целевой сетевой адаптер 126 может включать в себя шинный хост-адаптер FC (host bus adapter HBA), имеющий все механические, электрические и сигнальные схемы, необходимые для соединения многопротокольного устройства 100 хранения данных с сетевым коммутатором, например обычным коммутатором 180 FC. В дополнение к поддержке доступа FC, FC HBA может разгрузить операции по поддержке волоконно-оптической сети для устройства хранения данных.

Для доступа к информации (в форме блоков, дисков или виртуальных дисков) по сети SAN клиенты 160, как правило, используют блочные протоколы доступа, например протокол SCSI. SCSI представляет собой интерфейс ввода-вывода (I/O), предназначенный для подключения периферии и имеющий стандартный, не зависящий от устройств протокол, который позволяет подключать к многопротокольному устройству 100 хранения данных различные периферийные устройства, такие как диски 130. В терминологии SCSI клиенты 160, функционирующие в среде SAN, являются инициаторами, т.е. они инициируют запросы и команды для обращения к данным. Следовательно, многопротокольное устройство хранения данных представляет собой целевое устройство, сконфигурированное для ответа на запросы, поступающие от инициаторов, в соответствии с протоколом запросов/ответов. Инициаторы и целевые устройства, являющиеся оконечными точками, имеют определенные адреса, которые в соответствии с протоколом FC включают в себя глобальные имена (worldwide name, WWN). WWN - это уникальный идентификатор, например имя узла или имя порта, представляющее собой 8-байтовое число.

Многопротокольное устройство 100 хранения данных поддерживает различные протоколы, основанные на SCSI и используемые в среде SAN, в том числе SCSI с инкапсуляцией в TCP (iSCSI) и SCSI с инкапсуляцией в FC (FCP). Инициаторы (далее клиенты 160) могут таким образом запрашивать услуги у целевого устройства (далее многопротокольное устройство 100 хранения данных) путем посылки сообщений iSCSI и FCP по сети (165, 185) для получения доступа к информации, хранящейся на дисках. Специалистам в данной области техники ясно, что клиенты могут также запрашивать услуги многопротокольного устройства 100 хранения данных с применением других протоколов блочного доступа. Поддержка многопротокольным устройством 100 хранения данных множества протоколов блочного доступа обеспечивает единое и связное решение для доступа к виртуальным дискам/lun в гетерогенной среде SAN.

Адаптер 128 накопителей взаимодействует с операционной системой 200 устройства хранения данных, функционирующей на многопротокольном устройстве 100 хранения данных, и обеспечивает доступ к информации, запрашиваемой клиентами. Информация может храниться на дисках 130 или других аналогичных носителях, способных хранить информацию. Адаптер накопителей содержит схему интерфейса ввода-вывода, которая соединяется с дисками через инфраструктуру взаимного соединения для ввода-вывода, такую как обычная топология высокоэффективных каналов последовательной передачи FC. Адаптер накопителей извлекает данные, затем они, при необходимости, обрабатываются процессором 122 (или самим адаптером 128), после чего эти данные посылаются по системной шине 123 в сетевые адаптеры (125, 126), где они распределяются по пакетам или сообщениям и передаются клиентам.

Хранение информации в многопротокольном устройстве 100 хранения данных предпочтительно реализуется в форме одного или более томов памяти (например, тома 1-2 150), которые представляют собой кластер физических дисков 130 внешней памяти, определяющий общую логическую структуру дискового пространства. Диски в пределах одного тома, как правило, организуются в одну или более групп RAID. Использование RAID повышает надежность/целостность хранения данных путем записи "дорожек" данных с "чередованием" на определенное количество физических дисков в группе RAID и соответствующего сохранения избыточной информации о чередовании данных. Избыточность информации позволяет восстанавливать потерянные данные в случае отказа накопителя. Специалисту в данной области техники ясно, что в соответствии с настоящим изобретением могут применяться и другие технологии избыточности, например "зеркальное копирование".

Более конкретно, каждый том 150 создается на основе массива физических дисков 130, которые организованы в группы 140, 142, и 144 RAID. Физические диски каждой группы RAID включают в себя диски, сконфигурированные для хранения чередуемых данных (D), и диски, сконфигурированные для хранения данных четности (Р) для этих данных, в соответствии с вариантом конфигурации RAID уровня 4. Следует отметить, что приводимые в настоящем документе принципы допускают также применение конфигураций с RAID другого уровня (например, RAID 5). В варианте осуществления может использоваться, по меньшей мере, один диск четности и один диск собственно данных. С другой стороны, типичный вариант осуществления может содержать три диска данных и один диск четности в одной группе RAID и, по меньшей мере, одну группу RAID в одном томе.

Для облегчения доступа к дискам 130 операционная система 200 устройства хранения данных поддерживает файловую систему с произвольной записью, построенную на основе системы виртуализации, которая "виртуализирует" пространство хранения данных, образуемое дисками 130. Посредством этой файловой системы информация логически организуется в иерархическую структуру объектов, более конкретно - именованных каталогов и файлов (далее "каталоги" и "файлы") на дисках. Каждый "дисковый" файл может представлять собой набор блоков на диске, сконфигурированный для хранения информации, например данных, а каталог может представлять собой файл специального формата, в котором хранятся имена других файлов и каталогов и ссылки на них. Система виртуализации позволяет осуществить на основе файловой системы дальнейшую логическую организацию информации в иерархическую структуру именованных виртуальных дисков, располагающихся на физических дисках, реализуя таким образом, обеспечивает интегрированный подход к хранению, общий для NAS и SAN; при этом обеспечивается файловый доступ (NAS) к именованным файлам и каталогам и, одновременно, блочный доступ (SAN) к виртуальным дискам в пределах одной платформы хранения данных с файловым доступом. Файловая система упрощает управление базовыми физическими накопителями в системах с топологией SAN.

Как указано выше, виртуальный диск представляет собой специальный тип файла в томе, который представляет собой обычный файл с добавлением определенных средств управления экспортом и ограничений на операции с ним, посредством которых обеспечивается эмуляция диска. В отличие от файла, который может быть создан клиентом с помощью, например, протокола NFS или CIFS, виртуальный диск в многопротокольном устройстве хранения данных создается с помощью, например, пользовательского интерфейса (UI) в форме файла (объекта) специального типа. В примере виртуальный диск представляет собой многокомпонентный объект, включающий в себя специальный файловый объект inode, который содержит данные и, по меньшей мере, один связанный с ним потоковый объект inode, который содержит атрибуты данных, в том числе данные защиты. Специальный файловый объект inode служит главным контейнером для хранения данных, таких как данные прикладных программ, соответствующих эмулируемому диску. В потоковом объекте inode хранятся атрибуты, посредством которых номера lun и данные экспорта сохраняются, например, при операциях перезагрузки; кроме того, эти атрибуты позволяют управлять виртуальным диском как отдельным дисковым объектом, с точки зрения клиентов SAN. Вариант виртуального диска и связанных с ним объектов inode, который может быть с преимуществом использован при осуществлении настоящего изобретения, описан в американской заявке №112056-0069 "Storage Virtualization by Layering Vdisks on a File System" (Виртуализация хранения данных путем создания "надстройки" виртуальных дисков над файловой системой), причем указанная заявка тем самым включается в настоящий документ в качестве ссылки, как если бы она была полностью сформулирована непосредственно в настоящем документе.

В варианте осуществления предпочтительно используется операционная система хранения NetApp® ONTAP, поставляемая компанией Network Appliance, Inc, Саннивейл, Калифорния, которая поддерживает файловую систему WAFL (Write Anywhere File Layout, метод расположения файлов с произвольной записью). С другой стороны, очевидно, что можно использовать любую соответствующую операционную систему хранения, в том числе операционную систему с непосредственной записью файлов, при условии ее усовершенствования для использования в соответствии с описываемыми принципами по изобретению. По существу, используемый термин "WAFL" следует понимать в широком смысле как относящийся к любой операционной системе устройства хранения данных, адаптируемой к принципам настоящего изобретения каким-либо другим способом.

В настоящем документе термин "операционная система устройства хранения данных" в общем случае относится к компьютерному исполнимому коду, который функционирует на компьютере, управляющем доступом к данным, и способному, в случае многопротокольного устройства хранения данных, реализовывать семантику доступа к данным; примером такого кода является операционная система устройства хранения данных ONTAP, которая реализована в виде микроядра. Операционная система устройства хранения данных может также представлять собой прикладную программу, работающую в универсальной операционной системе, такой как UNIX® или Windows NT®, или универсальную операционную систему с конфигурируемыми функциональными возможностями, которые конфигурируются для поддержки приложений хранения, как описано в настоящем документе.

Кроме того, специалисту в данной области техники ясно, что описываемые система и способ в соответствии с настоящим изобретением могут применяться к любому типу специального (например, устройства, специально предназначенного для службы хранения) или универсального компьютера, в том числе автономного компьютера или его компонента, реализованного в форме системы хранения данных или включающего ее в себя. Далее, принципы настоящего изобретения могут быть адаптированы для применения в системах хранения данных на базе различных архитектур, в том числе в среде с накопителем, подключенным к сети, в сети хранения данных и в массиве дисков, непосредственно подключенном к клиенту или главному компьютеру, без какого-либо ограничения ими. Термин "система хранения данных" следует, таким образом, понимать в широком смысле как включающий в себя указанные схемы в дополнение к любым подсистемам, сконфигурированным для выполнения функции хранения информации и связанным с другим оборудованием или системами.

На фиг.2 приведена структурная схема операционной системы 200 устройства хранения данных, которая может быть преимущественно использована при осуществлении настоящего изобретения. Операционная система 200 устройства хранения данных состоит из ряда программных уровней, организованных таким образом, что они формируют интегрированный стек сетевых протоколов или, более широко, многопротокольный механизм, который обеспечивает пути данных для доступа клиентов к информации, хранящейся в многопротокольном устройстве хранения данных, посредством файловых и блочных протоколов доступа. Стек протоколов включает в себя уровень 210 доступа к среде для сетевых драйверов (например, драйверов Gigabit Ethernet), который связывается с протоколами сетевого уровня, например уровня 212 IP и поддерживаемыми ими механизмами передачи, уровнем 214 TCP и уровнем 216 протокола UDP (User Datagram Protocol, протокол пользовательских датаграмм). Уровень протокола файловой системы обеспечивает доступ к файлу по множеству протоколов и с этой целью включает в себя поддержку протокола 218 DAFS, протокола 220 NFS, протокола 222 CIFS и протокола 224 HTTP (hypertext transfer protocol, протокол передачи гипертекста). Уровень 226 VI реализует архитектуру VI для реализации возможностей передачи с прямым доступом (direct access transport, DAT), например RDMA, что необходимо в соответствии с протоколом 218 DAFS.

Уровень 228 драйвера iSCSI обеспечивает доступ по блочному протоколу на базе уровней протоколов сетей TCP/IP, в то время как уровень 230 драйвера FC взаимодействует с FC HBA 126 и выполняет прием и передачу запросов и ответов блочного доступа, принимаемых интегрированным устройством хранения данных и поступающих от него. Драйверы FC и iSCSI обеспечивают специфичное для FC и iSCSI управление доступом к lun (или виртуальным дискам) и таким образом управляют экспортом виртуальных дисков для iSCSI или FCP либо одновременно для iSCSI и FCP при обращении к одному и тому же виртуальному диску в многопротокольном устройстве хранения данных. Кроме того, операционная система устройства хранения данных включает в себя уровень 240 дисковой памяти, который реализует протокол дисковой памяти, такой как протокол RAID, и уровень 250 драйвера дисков, который реализует протокол доступа к дискам, такой как протокол SCSI.

Соединение программных дисковых уровней с уровнями интегрированного стека сетевых протоколов составляет согласно настоящему изобретению систему 300 виртуализации. На фиг.3 приведена структурная схема системы 300 виртуализации, которая реализуется на основе сочетания файловой системы 320 и модулей виртуализации, в данном примере представляющие собой модуль 330 виртуальных дисков и целевой модуль 310 SCSI. Следует отметить, что модуль 330 виртуальных дисков, файловая система 320 и целевой модуль 310 SCSI могут быть реализованы программно, аппаратно, во встроенном программном обеспечении или комбинацией этих способов. Модуль 330 виртуальных дисков является "надстройкой" над файловой системой 320 (и взаимодействует с ней) и обеспечивает тракт передачи данных от блочного целевого модуля SCSI в блоки, управляемые файловой системой. Модуль виртуальных дисков также предоставляет доступ через административные интерфейсы, например удобный пользовательский интерфейс (UI), в ответ на команды, посылаемые системным администратором в многопротокольное устройство 100 хранения данных. По существу, модуль 330 виртуальных дисков управляет системами с топологией SAN, для чего он, помимо прочего, поддерживает полный набор команд управления виртуальными дисками (или lun), посылаемых системным администратором через UI. Эти команды управления виртуальными дисками преобразуются в элементарные ("низкоуровневые") операции файловой системы, которые взаимодействуют с файловой системой 320 и целевым модулем 310 SCSI, посредством чего реализуются виртуальные диски.

Целевой модуль 310 SCSI, в свою очередь, инициирует эмуляцию диска или lun путем выполнения процедуры отображения, которая преобразует обращение на основе логических блоков к логическим устройствам, указанным в запросах доступа, в обращение к файлам специального типа vdisk на основе виртуальных блоков и преобразование vdisk в lun для ответов на запросы. В данном примере целевой модуль SCSI располагается между драйверами FC и iSCSI (228 и 230) и файловой системой 320 и реализует уровень трансляции системы виртуализации между пространством блоков (lun) среды SAN и пространством файловой системы, в котором lun представляются как виртуальные диски. Многопротокольное устройство 100 хранения данных использует "надстройку" виртуализации SAN над файловой системой 230 (что в корне отличается от подходов, используемых в системах предыдущего уровня техники) и таким образом реализует самостоятельную единую платформу хранения, в общем случае поддерживающую все протоколы доступа к хранимой информации.

В соответствии с изобретением файловая система обеспечивает возможности ее использования посредством файлового доступа к информации, хранящейся на накопителях, например дисках. Кроме того, файловая система поддерживает возможности управления томами при использовании блочного доступа к хранящейся информации. Таким образом, в дополнение к обеспечению семантики файловой системы (такой, как подразделение хранимых данных на отдельные объекты и именование этих объектов хранения) файловая система 320 реализует функции, обычно связанные с менеджером томов. Как описано в настоящем документе, эти функции включают в себя (i) агрегирование дисков, (ii) агрегирование полосы пропускания для дисков и (iii) обеспечение надежности, например зеркальное копирование и/или контроль четности (RAID), и таким образом представляют один или более объектов хранения, "надстроенных" над файловой системой. Особенностью многопротокольного устройства хранения данных является простота использования в сочетании с описанными возможностями управления томами, особенно в случае использования в системах с топологией SAN.

В данном примере файловая система 320 представляет собой файловую систему WAFL, имеющую блочное представление формата хранения данных на диске с использованием блоков размером, например, 4 килобайта (Кб) и использованием объектов inode для описания файлов. В файловой системе WAFL используются файлы с метаданными, описывающими структуру файловой системы; эти файлы метаданных включают в себя, помимо прочего, файлы объектов inode. Для поиска объектов inode на диске используется дескриптор файла, т.е. идентификатор, который содержит номер объекта inode. Описание структуры файловой системы, включая файл объекта inode, приводится в Американском патенте №5819292 "Method for Maintaining Consistent States of a File System and for creating User-accessible Read-Only Copies of a File system" ("Способ поддержания непротиворечивых состояний файловой системы и создания доступных пользователю копий файловой системы, предназначенных только для чтения"), принадлежащем Дэвиду Хитзу и др., опубликованном 6 октября 1998 года, причем указанный патент, тем самым, включается в настоящий документ в качестве ссылки, как если бы он был полностью сформулирован непосредственно в настоящем документе.

Вообще говоря, все объекты inode файловой системы организуются в файл объектов inode. Блок информации о файловой системе (file system, FS) определяет размещение информации в файловой системе и включает в себя объект inode того файла, который содержит все остальные объекты inode файловой системы. Каждый том имеет собственный блок информации об FS, который предпочтительно сохраняется в постоянном местоположении в пределах, например, группы RAID файловой системы. Объект inode корневого блока информации об FS может содержать ссылку (указывать) непосредственно на блоки файла объекта inode или указывать на косвенные блоки файла объекта inode, которые, в свою очередь, указывают на непосредственные блоки файла объекта inode. Внутри каждого непосредственного блока файла объекта inode содержатся объекты inode, каждый из которых может ссылаться на косвенные блоки, которые, в свою очередь, указывают на блоки данных файла или виртуального диска.

Согласно характерной особенности изобретения файловая система осуществляет операции доступа к виртуальным дискам 322, а также к файлам 324 и каталогам (dir 326), которые существуют совместно по отношению к управлению общим пространством объектов хранения данных, например томов 150 и/или объектов 328 qtree. Объект 328 qtree - это специальный каталог, который имеет свойства логического подтома в пределах пространства имен физического тома. Каждый объект хранения в файловой системе (файл, каталог или виртуальный диск) в данном примере связан с одним объектом qtree и, таким образом, квоты, параметры защиты и другие параметры могут назначаться для объектов qtree. Виртуальные диски и файлы/каталоги могут быть "надстроены" над объектами 328 qtree, которые, в свою очередь, являются "надстройками" над томами 150 в соответствии с представлением уровня 320 "виртуализации" файловой системы.

Следует отметить, что объекты хранения vdisk в файловой системе 320 ассоциируются с системами многопротокольного устройства хранения данных, имеющих топологию SAN, а такие объекты хранения, как файлы и каталоги, ассоциируются с системами многопротокольного устройства хранения данных, имеющими топологию NAS. В общем случае доступ к файлам и каталогам по протоколам блочного доступа FC или SCSI невозможен; с другой стороны, файл может быть преобразован в объект vdisk, после чего становится возможным доступ к нему как по протоколу SAN, так и по протоколу NAS. В протоколах SAN (FC и SCSI) объекты vdisk доступны как логические устройства, а в протоколах NAS (NFS и CIFS) - как файлы.

Согласно другой особенности изобретения система 300 виртуализации создает виртуальное пространство хранения данных, которое позволяет объектам SAN и объектам NAS совместно сосуществовать по отношению к управлению общим пространством памяти со стороны файловой системы 320. Для этого система 300 виртуализации использует характерные особенности файловой системы, в том числе свойственную ей способность объединять диски и представлять их в виде единой области (пула) хранения. Например, система 300 виртуализации расширяет возможности управления томами, имеющиеся у файловой системы 320, а именно организует набор дисков 130 в один или более томов 150, образующих пул общего пространства хранения данных. После этого пул общего пространства хранения данных открывается для доступа из систем с топологией SAN и NAS посредством создания виртуальных дисков 322 и файлов 324 соответственно. В дополнение к совместному использованию одного общего пространства хранения данных виртуальные диски и файлы совместно используют один пул доступного пространства хранении данных для расширения при масштабировании систем с топологией SAN и/или NAS. В отличие от систем предыдущего уровня техники в общем пространстве хранения данных многопротокольного устройства хранения данных не существует какого-либо физического разделения дисков.

Многопротокольное устройство хранения данных существенно упрощает управление общим пространством хранения данных, поскольку оно позволяет пользователю управлять объектами хранения как NAS, так и SAN при использовании единого пула ресурсов хранения данных. В частности, управление свободным пространством блоков производится из глобального свободного пула на уровне малых блоков как для систем с топологией SAN, так и для систем с топологией NAS. Если бы управление этими объектами хранения выполнялось дискретно, то пользователю приходилось бы иметь в постоянной готовности определенное количество "запасных" дисков для каждого типа объекта для гарантии оперативной реакции на какое-либо изменение, например смену целей бизнеса. Накладные расходы на такой "дискретный" подход оказываются значительно выше, чем в том случае, если управление этими объектами можно выполнять из единого пула ресурсов с единственной группой запасных дисков, предназначенных для расширения в ситуациях, когда этого требует бизнес. Те блоки, которые освобождаются при отдельных операциях с виртуальными дисками, немедленно становятся доступными для использования объектами NAS (и наоборот). При этом детали структуры управления являются прозрачными для администратора. В этом состоит преимущество интегрированного многопротокольного устройства хранения данных по показателю "общей стоимости владения".

Далее, система 300 виртуализации обеспечивает гарантии надежности объектов хранения SAN и NAS, совместно существующих в глобальном пространстве хранения данных многопротокольного устройства 100 хранения данных. В частности, гарантии надежности в случае отказа дисков обеспечиваются такими методиками, как применение RAID или зеркального копирования, которые базируются на файловой системе 320 многопротокольного устройства 100 хранения данных и встроены в нее изначально в отличие от обычных систем SAN, где они реализуются на уровне физических блоков. Это упрощает администрирование и позволяет администратору реализовывать глобальные решения относительно базового избыточного физического носителя, которые применяются к виртуальным дискам и объектам NAS в файловой системе единым образом.

Как указано выше, файловая система 320 организует информацию в такие объекты, как файлы, каталоги и виртуальные диски в пределах томов 150 дисков 130. Основой каждого тома 150 является набор групп 140-144 RAID, которые обеспечивают защиту и надежность от отказов одного или нескольких дисков в пределах тома. Защита информации, обслуживаемой многопротокольным устройством хранения данных, реализуется в данном примере в соответствии с конфигурацией RAID 4. Этот уровень защиты может быть расширен, например к нему может быть добавлено синхронное зеркальное копирование на платформе устройства. Виртуальный диск 322, созданный на основе тома, имеющего защиту на базе RAID уровня 4, "наследует" эту дополнительную защиту на базе синхронного зеркального копирования, если том 150 определен как находящийся под этой защитой. В этом случае защита с синхронным зеркальным копированием является функцией не виртуального диска, а функцией основного тома и средств гарантии надежности файловой системы 320. Эта особенность "наследования" многопротокольного устройства хранения данных упрощает управление виртуальными дисками, поскольку системному администратору не приходится иметь дело с проблемами надежности.

Кроме того, система 300 виртуализации агрегирует пропускную способность дисков 130 и при этом пользователю не требуется знание физической структуры этих дисков. Файловая система 320 сконфигурирована для записи (сохранения) данных на дисках в виде длинных непрерывных дорожек на этих дисках в соответствии с операциями ввода-вывода (I/O) при сохранении, которые объединяют пропускную способность всех дисков тома для сохраняемых данных. Когда информация сохраняется или считывается с виртуальных дисков, операции ввода-вывода не направляются на диски, определяемые пользователем. Напротив, эти операции прозрачны для пользователя, так как файловая система распределяет эти данные с "чередованием" по всем дискам тома надежным способом в соответствии с политикой размещения с произвольной записью. В результате виртуализации блочной памяти пропускная способность при выполнении операций ввода-вывода с виртуальными дисками может возрастать вплоть до максимальной пропускной способности базовых физических дисков файловой системы независимо от размера виртуального диска (в отличие от обычных физических реализаций lun в обычных продуктах с блочным доступом).

Наконец, система виртуализации повышает эффективность политик файловой системы по размещению, управлению и размещению блоков для обеспечения корректного функционирования виртуальных дисков в многопротокольном устройстве хранения данных. Политики размещения блоков виртуальных дисков являются функцией базовой файловой системы виртуализации и, следовательно, отсутствует какое-либо жесткое физическое соответствие блоков файловой системы и адресов логических блоков SCSI, которое могло бы повлиять на модификацию. Если требуется модификация функционирования схемы доступа к данным, виртуальные диски могут быть прозрачно реорганизованы в соответствии с этой модификацией.

С точки зрения систем с топологиями SAN и NAS, политики распределения блоков не зависят от физических свойств дисков (например, конфигураций, объемов, цилиндров и размера секторов). Файловая система 320 обеспечивает управление файлами 324 и каталогами 326 на основе файлов и в соответствии с изобретением виртуальными дисками 322 в томах 150. При добавлении диска в массив, подключенный к многопротокольному устройству хранения, этот диск внедряется в имеющийся том и увеличивает общий объем тома, после чего это пространство может использоваться для любых целей, например увеличения количества виртуальных дисков или же файлов.

Управление интегрированным многопротокольным устройством 100 хранения данных упрощается путем применения UI 350 и набора команд управления виртуальными дисками, доступных системному администратору. В данном примере UI 350 включает в себя как интерфейс 352 командной строки (command line interface, CLI), так и графический пользовательский интерфейс 354 (graphical user interface, GUI), используемые для выполнения команд набора управления виртуальными дисками, которые позволяют, помимо прочего, создавать виртуальные диски, увеличивать и уменьшать их размеры и/или удалять их. Пространство хранения данных, освободившееся после удаления виртуального диска, может быть повторно использовано, например, для записи файла NAS в соответствии с функцией виртуального пространства хранения данных многопротокольного устройства 100 хранения данных. Виртуальный диск может быть увеличен ("расширен") или уменьшен ("сжат") по желанию пользователя при сохранении как блочного доступа, так и многопротокольного доступа NAS к собственно данным, которые хранятся на нем.

UI 350 упрощает управление многопротокольным устройством хранения данных SAN/NAS, поскольку он, например, устраняет необходимость в явном конфигурировании и указании дисков, используемых при создании виртуального диска, системным администратором. Например, в данном случае для создания виртуального диска системный администратор должен просто подать команду создания виртуального диска ("lun create") посредством, например, интерфейса 352 командной строки или графического пользовательского интерфейса 354. Команда vdisk определяет создание виртуального диска (lun) наряду с желаемым размером виртуального диска и дескриптором пути (именем пути) к этому виртуальному диску. После этого файловая система 320 совместно с модулем 330 виртуальных дисков "виртуализирует" пространство хранения данных, предоставляемое основными дисками, и создает виртуальный диск в соответствии с командой создания. Более конкретно, модуль 330 виртуальных дисков обрабатывает команду vdisk для "вызова" элементарных ("низкоуровневых") операций в файловой системе 320, которая осуществляет высокоуровневые операции с виртуальными дисками (или lun). Например, команда "lun create" транслируется в набор элементарных операций файловой системы, которые выполняют создание виртуального диска с соответствующими характеристиками и размером, расположенного в соответствующем месте. Эти элементарные операции файловой системы включают в себя операции создания файлового объекта inode (create_file), создания потокового объекта inode (create_stream) и сохранения информации в потоковом объекте inode (stream_write).

Результатом выполнения команды "lun create" является создание виртуального диска 322 указанного размера, для которого активируется защита RAID без необходимости явной активизации этой защиты. Сохранение информации на дисках многопротокольного устройства 100 хранения данных производится без использования определенного типа; на дисках сохраняются только "простые" биты. Файловая система организует эти биты в виртуальные диски и группы RAID по всем дискам в пределах тома. Таким образом, нет необходимости явно конфигурировать создаваемый виртуальный диск 322, поскольку система 300 виртуализации создает виртуальный диск способом, прозрачным для пользователя. Созданный виртуальный диск наследует высокоэффективные характеристики, такие как надежность и пропускная способность хранения, присущие базовому тому, созданному файловой системой.

Интерфейс 352 командной строки и/или графический пользовательский интерфейс 354 также взаимодействует с модулем 330 виртуальных дисков, посредством чего выполняется ввод атрибутов и постоянных привязок карты lun, которые определяют соответствие созданных виртуальных дисков и их номеров. Затем эти привязки карты lun используются для представления виртуальных дисков для клиентов в виде определенных идентификаторов SCSI (ID). В частности, созданный виртуальный диск может представляться с применением технологии отображения lun для предоставления клиенту SAN возможности "просмотра" диска, т.е. доступа к нему. Виртуальные диски (или lun) в среде SAN в общем случае требуют строгого контроля доступа; совместное использование логических устройств lun в среде SAN, как правило, имеет место только в определенных условиях, таких как кластеризованные файловые системы, кластеризованные операционные системы и конфигурации с множеством трактов. Системный администратор многопротокольного устройства хранения данных определяет то, какие виртуальные диски (или lun) могут экспортироваться клиенту SAN. После того как виртуальный диск будет представлен как lun, клиент получает возможность обращаться к виртуальному диску по сети SAN с использованием протокола блочного доступа, например FCP или iSCSI.

Клиенты SAN, как правило, идентифицируют диски и обращаются к ним по логическим номерам (lun). С другой стороны, "легкость управления", присущая многопротокольному устройству 100 хранения данных, состоит в том, что системные администраторы могут управлять виртуальными дисками и их адресацией по логическим именам. Для этого модуль 330 виртуальных дисков в многопротокольном устройстве 100 хранения данных выполняет сопоставление логических имен виртуальным дискам. Например, при создании виртуального диска системный администратор задает "правильный размер" виртуального диска и присваивает ему имя, которое в общем случае соответствует его назначению (например, /vol/vol0/database - для хранения базы данных). Интерфейс администрирования обеспечивает управление lun/виртуальными дисками (а также файлами), представляемыми для клиентов из устройства хранения на основе имен, и обеспечивает таким образом унифицированную и единую схему именования для хранения на основе блоков (а также на основе файлов).

Многопротокольное устройство 100 хранения данных управляет представлением виртуальных дисков как логических имен с использованием групп инициаторов (igroups). igroup - это логический именованный объект, который назначается одному или более адресам, связанным с одним или более инициаторами (в зависимости от того, сконфигурирована ли кластеризованная среда). Команда "igroup create" фактически "привязывает" (ассоциирует) эти адреса, которые могут включать в себя адреса WWN или идентификаторы iSCSI, к логическому имени или igroup. Затем выполняется команда "lun map", которая экспортирует один или более виртуальных дисков в igroup, т.е. делает виртуальный диск (диски) "видимым(и)" для igroup. В этом смысле команда "lun create" эквивалентна экспорту NFS или предоставлению совместного доступа CIFS. Таким образом, адреса WWN или идентификаторы iSCSI идентифицируют клиентов, которые получают возможность доступа к виртуальным дискам, определенным командой lun map. После этого логическое имя используется во всех операциях, являющихся внутренними для операционной системы хранения. Это представление логического именования распространяется на весь набор команд работы с виртуальными дисками, включая любое взаимодействие между пользователем и многопротокольным устройством хранения данных. В частности, соглашение об именах igroup используется для всех последующих операций экспорта и построения списков lun, экспортируемых для различных клиентов SAN.

На фиг.4 приведена блок-схема, иллюстрирующая последовательность шагов операции обращения к информации, хранящейся в многопротокольном устройстве хранения данных, по сети SAN. В данном случае клиент работает с многопротокольным устройством 100 хранения данных с использованием блочного протокола доступа по сети, к которой подключено устройство. Для клиента 160а, использующего операционную систему Windows, в данном примере применяется протокол блочного доступа FCP в сети 185. С другой стороны, для клиента 160b, использующего операционную систему UNIX, в данном примере применяется протокол блочного доступа iSCSI в сети 165. Последовательность начинается с шага 400, далее идет шаг 402, на котором клиент генерирует запрос обращения к информации, находящейся в многопротокольном устройстве 100 хранения данных, после чего на шаге 404 запрос посылается по сети (185, 165) как обычный запрос блочного доступа FCP или iSCSI.

На шаге 406 запрос принимается сетевым адаптером (126, 125) многопротокольного устройства 100 хранения данных, где он обрабатывается интегрированным стеком сетевых протоколов и на шаге 408 передается в систему 300 виртуализации. Более конкретно, если запрос является запросом FCP, он обрабатывается драйвером 230 FC как, например, запрос обращения к данным (т.е. запрос чтения-записи) блоком 4 Кб. Если запрос является запросом по протоколу iSCSI, он принимается на уровне доступа к среде передачи (Intel Gigabit Ethernet) и передается в систему виртуализации через уровни сетевых протоколов TCP/IP.

В качестве адресатов в операциях подачи команд и управления (в том числе адресации информации), связанных с протоколом SCSI, как правило, выступают диски или lun; в то же время файловая система 320 не распознает номера lun. Поэтому целевой модуль 310 SCSI системы виртуализации инициирует эмуляцию lun для ответа на команды SCSI, содержащиеся в запросе (шаг 410). Для этого целевой модуль SCSI имеет ряд прикладных программных интерфейсов 360 (application programming interfaces, API), которые основаны на протоколе SCSI и таким образом реализуют интерфейс, совместимый как с драйверами iSCSI, так и с драйверами FCP (228 и 230). Кроме того, целевой модуль 310 SCSI выполняет процедуру отображения и преобразования, которая, по существу, транслирует номера lun в виртуальные диски. На шаге 412 целевой модуль 310 SCSI преобразует информацию адресации запроса, например данные маршрутизации FC, в информацию, соответствующую внутренней структуре файловой системы.

Файловая система 320 в данном примере представляет собой систему на основе сообщений; в данном случае целевой модуль 310 SCSI помещает запрос SCSI в сообщение, представляющее операцию, направленную файловой системе. Сообщение, сгенерированное целевым модулем SCSI, может, например, содержать тип операции (например, чтение, запись) наряду с именем пути (например, дескриптором пути) и именем файла (например, именем специального файла) объекта vdisk, представленного в файловой системе. Целевой модуль 310 SCSI передает сообщение на уровень файловой системы 320 в виде, например, вызова 365 функции и операция выполняется на этом уровне.

В ответ на получение сообщения файловая система 320 преобразует имя пути в информацию структуры inode для получения дескриптора файла, соответствующего виртуальному диску 322. Имея дескриптор файла, операционная система 200 устройства хранения данных может преобразовать этот дескриптор в дисковый блок и таким образом извлечь блок (inode) с диска. Вообще говоря, дескриптор файла - это внутреннее представление структуры данных, т.е. представление структуры данных inode, используемое в пределах файловой системы. Дескриптор файла, как правило, состоит из множества компонентов, включая идентификатор файла (номер inode), идентификатор "снимка", идентификатор поколения и флаг. Файловая система использует дескриптор файла для извлечения специального файла объекта inode и, по меньшей мере, одного соответствующего потокового объекта inode, содержащих виртуальный диск, в пределах структуры файловой системы, расположенной на дисках 130.

На шаге 414 файловая система генерирует операции загрузки (считывания) требуемых данных с диска 130, если они не находятся "в ядре", т.е. в памяти 124. Если информация отсутствует в памяти, файловая система 320 производит поиск по индексу в файле inode по номеру inode для обращения к соответствующей записи и извлечения номера блока логического тома (volume block number, VBN). Затем файловая система передает логический VBN на уровень 240 дисковой памяти (RAID), где этот логический номер преобразуется в номер дискового блока, который посылается соответствующему драйверу (например, SCSI) уровня 250 драйвера дисков. Драйвер дисков обращается к дисковому блоку с требуемым номером на диске 130 и загружает требуемый блок/блоки данных в память 124. На шаге 416 затребованные данные обрабатываются системой 300 виртуализации. К примеру, данные могут быть обработаны в соответствии с операцией чтения или записи, относящейся к виртуальному диску, или в соответствии с командой запроса для виртуального диска.

Целевой модуль 310 SCSI системы 300 виртуализации эмулирует поддержку обычного протокола SCSI путем предоставления значимой информации "моделирования" о требуемом виртуальном диске. Эти данные вычисляются целевым модулем SCSI или же постоянно хранятся, например, в потоке признаков inode виртуального диска. На шаге 418 целевой модуль 310 SCSI загружает требуемую информацию в блочной форме (после преобразования из файловой информации, предоставленной файловой системой 320) в сообщение блочного доступа протокола (SCSI). Например, целевой модуль 310 SCSI может загрузить информацию, такую как размер виртуального диска, в сообщение протокола SCSI в ответ на запрос команды запроса SCSI. По завершении обработки запроса многопротокольное устройство хранения данных (и операционная система устройства хранения данных) возвращает ответ (например, в виде "полного" ответного сообщения SCSI) клиенту по сети (шаг 420). На шаге 422 последовательность заканчивается.

Следует отметить, что вышеописанный программный "путь" через уровни операционной системы хранения, необходимый для обращения к области хранения данных по запросу клиента, полученному многопротокольным устройством хранения данных, может также быть реализован аппаратно. Поэтому в дополнительном варианте осуществления изобретения путь данных запроса доступа к хранению через уровни операционной системы (включая систему 300 виртуализации) может быть построен в форме логической схемы, реализованной на основе программируемой вентильной матрицы (field progerammable gate array, FPGA) или специализированной интегральной схемы (application specific integrated circuit, ASIC). Этот вариант аппаратной реализации позволяет увеличить эффективность службы хранения данных, реализуемой многопротокольным устройством 100 хранения данных, при ответе на запрос файлового или блочного доступа, посылаемый клиентом 160. Кроме того, в другом дополнительном варианте осуществления изобретения элементарные процессоры сети и адаптеров 125-128 могут быть сконфигурированы для освобождения процессора 122 от некоторых или всех операций обработки пакетов и доступа к области хранения данных соответственно и таким образом могут увеличить эффективность службы хранения данных, реализуемой многопротокольным устройством 100 хранения данных. Следует особо отметить, что описываемые здесь различные процессы, архитектуры и процедуры могут быть реализованы в аппаратных средствах, встроенном программном обеспечении или обычном программном обеспечении.

Одно из преимуществ интегрированного многопротокольного устройства хранения данных состоит в том, что оно обеспечивает управление доступом и при соответствующем обеспечении - совместное использование файлов и виртуальных дисков для всех протоколов при сохранении целостности данных. Далее, устройство хранения предоставляет возможности встроенной/интегрированной виртуализации, которые устраняют потребность в участии пользователя в распределении ресурсов хранения при создании объектов хранения NAS и SAN. Эти возможности включают в себя виртуальное пространство хранения данных, которое позволяет объектам SAN и объектам NAS совместно существовать по отношению к управлению глобальным пространством хранения данных в пределах устройства. Кроме того, интегрированное устройство хранения данных обеспечивает одновременную поддержку протоколов блочного доступа к одному и тому же виртуальному диску, а также гетерогенную среду SAN с поддержкой кластеризации. В результате многопротокольное устройство хранения реализует самостоятельную единую платформу хранения, в общем случае поддерживающую все протоколы доступа к хранимой информации.

Вышеприведенное описание относилось к конкретным вариантам осуществления настоящего изобретения. В то же время, очевидно, что к описанным вариантам осуществления могут быть применены другие вариации и модификации, предполагающие достижение некоторых или всех их преимуществ. Например, явно предполагается, что принципы настоящего изобретения могут быть реализованы программным способом, включая читаемые компьютером носители информации, содержащие исполняемые компьютером программные инструкции, аппаратным способом во встроенном программном обеспечении или комбинацией этих способов. Поэтому указанное описание следует рассматривать лишь в качестве примера, не вносящего каких-либо ограничений в область изобретения. Таким образом, цель прилагаемой формулы изобретения состоит в охвате всех подобных вариаций и модификаций в соответствии с истинными принципами и областью изобретения.

Похожие патенты RU2302034C9

название год авторы номер документа
ТЕХНОЛОГИЧЕСКИЕ ПРИЕМЫ ВЫГРУЗКИ ОБЪЕКТА НАЗНАЧЕНИЯ ВИРТУАЛЬНОГО ХРАНИЛИЩА 2010
  • Ошинс Джейкоб
  • Грин Дастин Л.
RU2562436C2
Интегрированный программно-аппаратный комплекс 2016
  • Игнатьев Александр Валерьевич
  • Сунгуров Андрей Борисович
RU2646312C1
ВИРТУАЛЬНАЯ СЕТЕВАЯ СИСТЕМА ХРАНЕНИЯ ИНФОРМАЦИИ, СЕТЕВОЕ ЗАПОМИНАЮЩЕЕ УСТРОЙСТВО И ВИРТУАЛЬНЫЙ СПОСОБ 2006
  • Ни Сяокэ
RU2427891C2
СИСТЕМА И СПОСОБ ВЗАИМОДЕЙСТВИЯ ПОЛЬЗОВАТЕЛЕЙ С ОБЛАЧНЫМИ ОБЪЕКТНЫМИ ХРАНИЛИЩАМИ ДАННЫХ 2015
  • Мазур Эмиль Маркович
  • Анисимов Денис Борисович
RU2656836C2
Метод построения высокопроизводительных отказоустойчивых систем хранения данных на основе распределенных файловых систем и технологии NVMe over Fabrics 2018
  • Дружинин Егор Александрович
  • Катенев Антон Владимирович
  • Лавренко Павел Александрович
  • Пономарев Константин Алексеевич
  • Московский Александр Александрович
RU2716040C2
СПОСОБ И СИСТЕМА ХРАНЕНИЯ ДАННЫХ 2017
  • Обидин Станислав Михайлович
RU2656739C1
АППАРАТНО-ВЫЧИСЛИТЕЛЬНЫЙ КОМПЛЕКС С ПОВЫШЕННЫМИ НАДЕЖНОСТЬЮ И БЕЗОПАСНОСТЬЮ В СРЕДЕ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ 2013
  • Гаврилов Дмитрий Александрович
  • Щелкунов Николай Николаевич
RU2557476C2
СПОСОБ РАСШИРЕНИЯ, ОСНОВАННЫЙ НА СЕРВЕРЕ АРХИТЕКТУРЫ ДЕСКТОПНОЙ ВИРТУАЛЬНОЙ МАШИНЫ НА КЛИЕНТСКИЕ МАШИНЫ, И МАШИНОЧИТАЕМАЯ СРЕДА 2009
  • Хэлперин Ярон
  • Чэмчэм Джад
  • Лерой Кристиан М.
  • Чеонг Джералд И. Л.
  • Экклестон Мэтью
  • Фенг Джи
RU2432605C1
УНИФИЦИРОВАННОЕ ПРЕДОСТАВЛЕНИЕ ФИЗИЧЕСКИХ И ВИРТУАЛЬНЫХ ОБРАЗОВ 2008
  • Фрис Роберт М.
  • Шефер Стюарт
RU2462749C2
СПОСОБ И СИСТЕМА РАСПРЕДЕЛЕННОГО ХРАНЕНИЯ ВОССТАНАВЛИВАЕМЫХ ДАННЫХ С ОБЕСПЕЧЕНИЕМ ЦЕЛОСТНОСТИ И КОНФИДЕНЦИАЛЬНОСТИ ИНФОРМАЦИИ 2021
  • Чайковский Сергей Станиславович
RU2777270C1

Иллюстрации к изобретению RU 2 302 034 C9

Реферат патента 2007 года МНОГОПРОТОКОЛЬНОЕ УСТРОЙСТВО ХРАНЕНИЯ ДАННЫХ, РЕАЛИЗУЮЩЕЕ ИНТЕГРИРОВАННУЮ ПОДДЕРЖКУ ФАЙЛОВЫХ И БЛОЧНЫХ ПРОТОКОЛОВ ДОСТУПА

Изобретение относится к области систем хранения данных, в частности к области многопротокольных устройств хранения данных. Многопротокольное устройство хранения данных, обеспечивающее доступ к информации, хранящейся на накопителях, по файловым и блочным протоколам доступа для систем с топологией накопителя, подключенного к сети (NAS), и систем с топологией сети хранения данных (SAN) содержит операционную систему устройств хранения данных, поддерживающую файловую систему, которая взаимодействует с модулями виртуализации, посредством чего виртуализируется пространство хранения данных, предоставляемое накопителями, причем пространство хранения данных предназначено для хранения информации способом, общим для запросов по файловым и блочным протоколам доступа. Файловая система осуществляет управления томами и их использование для блочного доступа к информации, хранящейся в устройствах. Система виртуализации позволяет логически организовать информацию в файловой системе в виде таких объектов хранения, как именованные файлы, каталоги и виртуальные диски, что позволяет реализовать интегрированный подход к хранению, общий для NAS и SAN, путем обеспечения файлового доступа к файлам и каталогам и одновременно блочного доступа к виртуальным дискам. 4 н. и 21 з.п. ф-лы, 4 ил.

Формула изобретения RU 2 302 034 C9

1. Многопротокольное устройство хранения данных, обеспечивающее доступ к информации, хранящейся на накопителях, по файловым и блочным протоколам доступа для систем с топологией накопителя, подключенного к сети (NAS), и систем с топологией сети хранения данных (SAN), включающее в себя следующий компонент: операционная система устройства хранения данных, поддерживающая файловую систему, которая взаимодействует с модулями виртуализации, посредством чего виртуализируется пространство хранения данных, предоставляемое накопителями, причем пространство хранения данных предназначено для хранения информации способом, общим для запросов по файловым и блочным протоколам доступа.2. Многопротокольное устройство хранения данных по п.1, отличающееся тем, что файловая система логически организует информацию в файлы, каталоги и виртуальные диски и таким образом обеспечивает интегрированный подход к хранению, общий для NAS и SAN, путем обеспечения файлового доступа к файлам и каталогам и, одновременно, блочного доступа к виртуальным дискам.3. Многопротокольное устройство хранения данных по п.1, отличающееся тем, что модули виртуализации включают в себя модуль виртуальных дисков и целевой модуль SCSI.4. Многопротокольное устройство хранения данных по п.3, отличающееся тем, что модуль виртуальных дисков реализуется в виде дополнения к файловой системе, причем указанный модуль предоставляет доступ посредством административных интерфейсов в ответ на команды, посылаемые системным администратором в многопротокольное устройство хранения данных.5. Многопротокольное устройство хранения данных по п.4, отличающееся тем, что административные интерфейсы включают в себя пользовательский интерфейс.6. Многопротокольное устройство хранения данных по п.5, отличающееся тем, что модуль виртуальных дисков обслуживает системы с топологией SAN посредством выполнения набора команд работы с виртуальными дисками, посылаемых через пользовательский интерфейс.7. Многопротокольное устройство хранения данных по п.6, отличающееся тем, что команды работы с виртуальными дисками преобразуются в элементарные операции файловой системы, которые взаимодействуют с файловой системой и целевым модулем SCSI, посредством чего реализуются виртуальные диски.8. Многопротокольное устройство хранения данных по п.7, отличающееся тем, что целевой модуль SCSI инициирует эмуляцию диска или устройства с логическим номером путем выполнения процедуры отображения, осуществляющей преобразование логического номера устройства в виртуальный диск.9. Многопротокольное устройство хранения данных по п.8, отличающееся тем, что целевой модуль SCSI реализует уровень трансляции между пространством блоков SAN и пространством файловой системы.10. Многопротокольное устройство хранения данных по п.1, отличающееся тем, что виртуальное пространство хранения данных поддерживает совместное существование объектов хранения SAN и NAS по отношению к управлению общим пространством хранения данных со стороны файловой системы.11. Многопротокольное устройство хранения данных по п.10, отличающееся тем, что файловая система взаимодействует с модулями виртуализации, посредством чего реализуется система виртуализации, которая обеспечивает гарантии надежности объектов хранения SAN и NAS, совместно существующих в виртуальном пространстве хранения данных.12. Многопротокольное устройство хранения данных по п.1, отличающееся тем, что файловая система обеспечивает возможности управления томами, причем эти возможности используются для предоставления блочного доступа к информации, хранящейся на накопителях.13. Многопротокольное устройство хранения данных по п.12, отличающееся тем, что накопители представляют собой диски.14. Многопротокольное устройство хранения данных по п.1, отличающееся тем, что файловая система поддерживает семантику файловой системы, например, именование объектов хранения, и функции, относящиеся к менеджеру томов.15. Многопротокольное устройство хранения данных по п.14, отличающееся тем, что функции, относящиеся к менеджеру томов, включают в себя, по меньшей мере, одну из следующих функций: агрегация накопителей; агрегация пропускной способности накопителей; средства гарантии надежности, например, зеркальное копирование или использование избыточного массива независимых дисков (RAID).16. Операционная система многопротокольного устройства хранения данных, сконфигурированная для реализации службы хранения, осуществляющей организацию информации, хранящейся на накопителях, подключенных к многопротокольному устройству хранения данных посредством адаптера накопителей, причем указанная операционная система хранения данных включает в себя следующие компоненты: интегрированный стек сетевых протоколов, реализующий тракты передачи данных для поддержки доступа клиентов к информации, хранящейся в многопротокольном устройстве хранения данных, с использованием блочных и файловых протоколов доступа; файловая система, взаимодействующая с модулями виртуализации, посредством чего осуществляется виртуализация пространства хранения данных, предоставляемого накопителями.17. Операционная система хранения данных по п.16, отличающаяся тем, что файловая система логически организует информацию в файлы, каталоги и виртуальные диски, посредством чего реализуется интегрированный подход к хранению для систем с топологией накопителя, подключенного к сети (NAS), и систем с топологией сети хранения данных (SAN) с использованием файловых и блочных протоколов доступа.18. Операционная система хранения данных по п.17, отличающаяся тем, что блочные протоколы доступа включают в себя протоколы на основе SCSI, такие, как инкапсуляция SCSI в протокол TCP (iSCSI) и инкапсуляция SCSI в протокол Fibre Channel.19. Операционная система хранения данных по п.18, отличающаяся тем, что интегрированный стек сетевых протоколов включает в себя следующие компоненты: уровни сетевых протоколов; уровень протокола файловой системы, взаимодействующий с уровнями сетевых протоколов и обеспечивающий доступ к файлам и каталогам, организованным файловой системой, по файловому протоколу доступа; драйвер iSCSI, представляющий собой дополнение к уровням сетевых протоколов и обеспечивающий доступ к виртуальным дискам, организованным файловой системой, по блочному протоколу доступа.20. Операционная система хранения данных по п.19, отличающаяся тем, что интегрированный стек сетевых протоколов дополнительно включает в себя виртуальный интерфейсный уровень, который реализует возможности прямой транспортировки для файлового протокола доступа на уровне протокола файловой системы.21. Операционная система хранения данных по п.20, отличающаяся тем, что интегрированный стек сетевых протоколов дополнительно включает в себя драйвер Fibre Channel, используемый для приема и посылки запросов блочного доступа к виртуальным дискам, организованным файловой системой.22. Операционная система хранения данных по п.21, отличающаяся тем, что драйверы Fibre Channel и iSCSI обеспечивают управление доступом к виртуальным дискам, специфичное для Fibre Channel и iSCSI, а также управление представлением виртуальных дисков для iSCSI и протокола Fibre Channel при обращении к виртуальным дискам, расположенным в многопротокольном устройстве хранения данных.23. Способ обеспечения доступа к информации, хранящейся на накопителях, по файловым и блочным протоколам доступа для систем с топологий накопителя, подключенного к сети (NAS), и систем с топологией сети хранения данных (SAN), включающий в себя следующие шаги: предоставляют единое пространство хранения данных для размещения хранимой информации; осуществляют предоставление услуг NAS с использованием сетевого адаптера, соединяющего многопротокольное устройство хранения данных с первой сетью, и возможностей файловой системы, позволяющих многопротокольному устройству хранения данных отвечать на файловые запросы, посылаемые клиентом NAS, для обращения к хранящейся информации как к файлам; осуществляют предоставление услуг SAN с использованием целевого сетевого адаптера, соединяющего многопротокольное устройство хранения данных со второй сетью, и возможностей управления томами, позволяющих многопротокольному устройству хранения данных отвечать на блочные запросы, посылаемые клиентом SAN, для обращения к хранящейся информации как к виртуальным дискам.24. Способ по п.23, отличающийся тем, что дополнительно включает в себя следующие шаги: обеспечивают управления файлами и виртуальными дисками, расположенными в многопротокольном устройстве хранения данных, на основе имен, посредством чего реализуется единая схема именования для блочного и файлового хранения данных; реализуют иерархическую структуру именованных файлов и виртуальных дисков, расположенных на накопителях.25. Способ обеспечения доступа к объектам хранения, расположенным на накопителях многопротокольного устройства хранения данных, по файловым и блочным протоколам, для систем с топологией накопителя, подключенного к сети (NAS), и систем с топологией сети хранения данных (SAN), отличающийся тем, что включает в себя следующие шаги: осуществляют организацию накопителей в один или более томов, образующих общее пространство хранения данных; предоставляют возможность совместного существования объектов хранения SAN и NAS в общем пространстве хранения данных; осуществляют прием файловых и блочных запросов на доступ к объектам хранения SAN и NAS в механизме многопротокольного устройства хранения данных; отвечают на файловые и блочные запросы путем извлечения объектов хранения SAN и NAS и их предоставления в ответ на запрос.

Документы, цитированные в отчете о поиске Патент 2007 года RU2302034C9

СИСТЕМА И СПОСОБ ЭФФЕКТИВНОГО ИСПОЛЬЗОВАНИЯ КЭШ-ПАМЯТИ В РАСПРЕДЕЛЕННОЙ ФАЙЛОВОЙ СИСТЕМЕ 1994
  • Кэнтрелл Томас Джордж
  • Джаджи Себнем
  • Шахин Амаль Ахмед
  • Уорд Ричард Байрон
RU2170454C2
US 6185655 А, 06.02.2006
СПОСОБ ЗАЩИТЫ КОРПОРАТИВНОЙ ВИРТУАЛЬНОЙ ЧАСТНОЙ КОМПЬЮТЕРНОЙ СЕТИ ОТ НЕСАНКЦИОНИРОВАННОГО ОБМЕНА ИНФОРМАЦИЕЙ С ПУБЛИЧНОЙ ТРАНСПОРТНОЙ СЕТЬЮ И СИСТЕМА ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2001
  • Орлов В.Н.
  • Крайнов Е.В.
  • Трещенков А.Н.
RU2182355C1
RU 21074400 C1, 20.03.1998.

RU 2 302 034 C9

Авторы

Павловски Брайан

Сринивасан Мохан

Ли Герман

Раджан Вийяйян

Питтман Йозеф С.

Даты

2007-06-27Публикация

2003-07-28Подача