Изобретение относится к области вычислительной техники и может быть испольэовано при построении высоконадежных цифровых систем, работающих в необслуживаемом режиме.
Известно устройство для управлени переключением резерва самовосстанавлвающегося при ошибках функционирования (отказах и сбоях) цифрового вычиЛительного устройства (СЦВУ), в соетав которого входят узлы контроля, . регистр конфигураций резерва, выходы которого соединены с входами управления конфигураций резерва блоков СЦВУ, узел управления и таймер. Устройство обеспечивает автоматическое обнаружение ошибок функционирования, замещение отказавших блоков резервными и перезапуск программы работы устройства с ближайщей контрольной точки . 1 .
Недостатком этого устройства является низкая эффективность средств автоматического восстановления работоспособности после ошибки.
Наиболее близким к данному является устройство для управления переключением резерва СЦВУ, содержащее таймер, регистр конфигураций-резерва, входы которого соединены с выходами узлов контроля, а выходы - с входами управления конфигурацией резерва блоков СЦВУ, причем информационные входы регистра конфигураций и таймера соединены с магистралью СЦВУ, а выход переполнения - с входом прерьгония СЦВУ С21.
К недостаткам известного устройства относятся жесткая реализация всех фаз восстановления работоспособности включая стандартную реакцию устройства на. ошибки функционирования. Это затрудняет использование устройства в различных системах, так как в них оказьгеается необходимым формирование различных реакций на ошибки различного типа: возврат к ближайщей контрольной точке программы или переход к очередной точке, повторный счет по измененным алгоритмам, тестирование блоков, перезагрузка ЗУ, переход на аварийную программу, полный перезапуск программы и т.д. Для обнаружения ошибок типа зависания или зацикливания в устройстве исполь зуется таймер, осуществляющий временной контроль. Однако влияние ошибок указанного типа, вызванных отказами
аппарат5фы, не обнаруживаемыми средствами контроля, или неверной идентификацией отказавшего блока в устройстве, не может быть устранено, что снижает надежность СЦВУ в целом.
Цель изобретения - расширение области применения устройства.
Поставленная цель достигается тем что в устройство для управления переключением резервных блоков, содержащее К-разрядный счетчик таймера, регистр конфигураций резерва, управляющие выходы которого соединены с управляющими выходами устройства, магистральные выходы - с магистральными выходами устройства и входами дешифратора, а соответствующие входы модификации состояния - с контрольными входами устройства, введены п -разрядный регистр признаков ошибок, элемент И и П -входовой элемент ИЛИ, первьй вход которого соединен с входом первого разряда регистра признаков ошибок и выходом элемента И, второй вход - с выходом перепонения счетчика таймера, с входом второго разряда регистра признаков ошибок и входом одновременной модификации состояния регистра конфигураций резерва, а выход - с установочным выходом устройства, первый выход дешифратора подключен к входу сброса регистра признаков ошибок, магистральные выходы которого подключены к магистральньм выходам устройства, а входы с третьего по п -и разрядовк контрольным входам устройствам и одновременным входам И -входового элемента ИЛИ, второй вход дешифратора соединен с входом сброса счетчика таймера, выход г,-го разряда которого (.) соединен с первым входом элемента И, второй вход которого соединен с обменным входом устройства.
На чертеже представлена структурная схема СЦВУ. I
Схема СЦВУ включает предложенное устройство для управления переключения резервных блоков (УУПРБ), цифровые вычислительные блоки 1, блоки ЗУ 2 блоки связи 3 и блок управления переключением резерва 4, подключенный к магистрали МЦВУ. В состав УУПРБ входят регистр конфигураций резерва 5, N -разрядный регистр 6 признаков ошибок, дешифратор 7, К-разрядны счетчик таймера (таймер) 8, двухвходовой элемент И 9, N -входовой эле3мент 10 ШШ. Магистральные выходы блоков 1-3, регистров 5,6, а также входы блоков 1-3 и вход дешифратора 7 соединены двунаправленной магис тралью М. Выходы контроля q, е , Р , блоков 1-3 соединены с третьим N м входами регистра 6, а также соответствующими входами модификации состоя ния регистра 5, выходные шины а,Ь , С, ... которого соединены с одноименными входами управления конфигурацией резерва блоков 1-3 Первый вход элемента 10 соединен с входом первого разряда регистра 6 и выходом элемента 9, первьй вход которого сое динен с выходом i -го разряда счетчика таймера, а второй - с выходом К режима обмена СЦВУ. Второй вход элемента 10 ШШ соединен с выходом переполнения таймера К, с входом втрро го разряда регистра 5 конфигураций резерва, а выход t элемента 10 ИЛИ соединен с входами установки блоков 1-3. Выходы дешифратора 7 соединены с входом обнуления регистра 6 и входом обнуления таймера. Устройство для управления переклю 1чением резервных блоков в составе 1СЦВУ работает следующим образом. f При включении СЦВУ регистры 5,6, таймер 8 обнуляются, причем нулевой код в регистре 5 обеспечивает уста-новку исходных конфигураций резерва блоков 1-3 (на шинах а, Ь , , ... нулевые воды). Число резервных комплектов этих блоков определяется требованиями к надежности и может быть различным. Правильность функционирования после запуска программы СЦВУ оперативно контролируется аппаратными средствами контроля блоков 1-3 с использованием любых известных методов (сравнение, контроль по модулю, с применением кодов Хэмминга и т.д.). При обнаружении отказа в каком-либо блоке, последний формирует сигнал ошибки на своем выходе контроля (cf, 9 , или f ), который, поступая на вход регистра 5, модифицирует его состояние и тем самым состояние шин управления конфигурацией резерваа, 6 или с. в зависимости от номера отказавшего блока, чем обеспечивается переключение (реконфигурация) резерва этого блока. Однрвремен-55 но в разряде регистра 6, связанном с выходом контроля отказавшего блока, устанавливается код 1 фиксирующий 23 ошибку, соответствующую данному блоку. Сигнал ошибки поступает также на вход элемента ИЛИ 10, на выходе 2. которого формируется сигнал, поступающий на входы установки блоков 1-3 и переводящий их в фиксированное состояние блокировки обмена, реакции на прерывание, записи в ЗУ, а также инициирующий в блоках 1 режим выполнения программы анализа ошибок. При выполнении программы анализа ошибок блок 1 считывает содержимое регистра 6, каждый разряд которого фиксирует ошибку определенного типа, программа производит их анализ, по результатам которого вырабатыв.ает ту или иную реакцию на ошибку в зависимости от ее типа и конкретного применения СЦВУ. Возможные реакции на ошибки указаны. Непосредственно после анализа 1 егистра 6 блок 1 при выполнении программы анализа ошибок через магистраль М осуществляет запись управляющего кода О в дешифратор 7, в результате чего вьфабатывается сигнал обнуления регистра 6 на первом выходе дешифратора, тем самым подготавливая УУПРВ к приему вновь возникающих ошибок. Контроль работы СЦВУ по времени осуществляется счетчиком таймера, на счетный вход которого (на чертеже условно не показан) непрерывно поступает последовательность импульсов. Обнуление таймера происходит в моменты времени, определяемые программой | при подаче кода 1 из блока t через магистраль М на вход дешифратора 7, в рез.ультате чего вырабатьтается сигнал на втором выходе дешифратора,связан1 ом с входом обнуления таймера. При нарушении временных соотношений выполнения программы обнуление таймера не происходит и на его выходе переполнения формируется сигнал, поступающий на вход второго разряда регистра 6 (запись признака ошибки по времени) и на вход одновременной модификации регистра 5, что вызывает одновременное изменение состояния иа всех шинах Л, Ь, с. ... (т.е. переключение резерва во всех блоках СЦВУ). Сигнал переполнения таймера поступает также на второй вход элемента 10, появляется на его выходе € и на входах установки блоков СЦВУ, переводя его в режим выполнения программы анализа ошибок, выполняющей одну из указанных задач или их совокупность (в зависимости от конкретного применения СЦВУ). Следует отметить, что программа анализа ошибок является самозащищенной, так как при появлении ошибок в ходе вьшолнения этой программы устройство УПРБ с помощью описанного механизма обеспечивает перевод СЦВУ на ее начало и выполнение этой программы в очередной установшейся конфигурации резерва блоков СЦВУ. Измнение конфигурации резерва блоков (реконфигурация) происходит ко кольцу, причем в сл5гчае переполнения таймера осуществляется переклю чение резерва всех блоков в отличие от случая обнаружения ошибки только в одном (нескольких) блоках, вызьшаю щего переключение резерва только в одном (нескольких) блоках соответственно. Причинами ошибки по времени (отсутствия программного обнуления таймера) при выполнении СЦВУ целевых программ являются ошибки блоков, не обнаруженные их средствами аппаратного контроля. Например, необнаружен ная ошибка при считывании команды из ЗУ в цифровой вычислительный блок мо еЯст вызвать его останов, установку запрещающей маски по всем входам запросов на прерывание, перевод СЦВУ в режим ожидания обмена или иное некорректное действие, вызывающее зависание СЦВУ или его зацикливание на некотором участке программы К таким же последствиям может привес ти необнаруженная ошибка в любом блоке СЦВУ. Использование реконфигурации резерва всех блоков при перепо нении таймера и переход на программу анализа ошибок уже в новой конфигу-. рации резерва блоков приводит к конечном итоге к нормальному выходу в работоспособное состояние СЦВУ. , - . Предложенное техническое решение позволяет также повысить эффективность самовосстановления по отношени к неверно идентифицируемым системой контроля отказам.Так, при необнаруживаемом отказе цифрового вычислительного блока последний загружает неверные слова в блоки ЗУ, эта ошибка обнаруживается при счить1вании из ЗУ и относится к ЗУ. В этом случае производится реконфигурация резерва работоспособного ЗУ вместо фактически необходимого переключения резерва цифрового вычислительного блока 1. Нормальное функционирование всего СЦВУ восстанавливается лишь благодаря одновременной реконфигурации резерва всех блоков (в том числе блока 1) по переполнению таймера, вьгоодящей устройство из зацикленного состояния . Предложенный механизм контроля по времени обмена СЦВУ с абонентами введен с целью сокращения потерь времени при ошибках обмена типа останова СЦВУ при стартстопном обмене и отсутствии сигнала пуска от абонента или при обмене словом с ожиданием запроса на прерьгоание от абонента и его отсутствии. Контрольный интервал времени, через который вырабатывается сигнал с i-го разряда таймера, незначительно (на 15-20%) превышает длительность операции обмена. Непосредственно перед началом операции обмена таймер обнуляется описанным вьщ1е образом, а на время выполнения обмена на выходе h блока 3 устанавливается уровень 1. При наличии ошибок, вызывающих превьш1ение отведенного на обмен времени, формируется сигнал с i -го разряда таймера, проходящий через элементы 9 и 10, инициирующий перевод СЦВУ на программу анализа ошибок и фиксирующий признак временной ошибки обмена в первом разряде регистра 6. Выделение этой ошибки в отдельный ип позволяет программе анализа ошибок просто продолжить текущую программу как прерванную ошибкой абонента (но не СЦВУ) либо выработать иную реакцию в зависимости от применения СЦВУ. Таким образом аппаратурные средства использзтатся для правильного выполнения программы анализа ошибок, которой предоставляется возможность производить различные действия по восстановлению работоспособности в зависимости от типа ошибки, момента ее появления и конкретного применения СЦВУ. Это обеспечивает гибкость и эффективность системы восстановления и высокую надежность работы СЦВУ. Для оценки технической эффективности предложенного решения проведен анализ реальной схемы СЦВУ с УУПРБ. оторый показдл, что из общего числа (8%) не обнаруживаемых аппаратным
71108623 . 8
контролем отказов около половины ох-казов на 3-5%, что для случая резерватыяяются одновременной конфигураци-вирования блокоЬ замещением с кратей резерва по таймеру. Это позволяетностью 4-6 обеспечивает снижение
.повысить вероятность обнаружения от-отказности в 1,2-1,5 раза.
название | год | авторы | номер документа |
---|---|---|---|
Резервированное устройство | 1983 |
|
SU1121676A1 |
Устройство для управления реконфигурацией резервированного вычислительного комплекса | 1983 |
|
SU1149449A1 |
Система для программного управления резервированными объектами и их диагностирования | 1989 |
|
SU1741295A1 |
ОТКАЗОУСТОЙЧИВАЯ ВЫЧИСЛИТЕЛЬНАЯ СИСТЕМА С АППАРАТНО-ПРОГРАММНОЙ РЕАЛИЗАЦИЕЙ ФУНКЦИЙ ОТКАЗОУСТОЙЧИВОСТИ И ДИНАМИЧЕСКОЙ РЕКОНФИГУРАЦИИ | 2010 |
|
RU2455681C1 |
УСТРОЙСТВО ДЛЯ ОТСЧЕТА ВРЕМЕНИ | 1990 |
|
RU2024920C1 |
ЗАПОМИНАЮЩЕЕ УСТРОЙСТВО С ДИНАМИЧЕСКИМ РЕЗЕРВИРОВАНИЕМ | 1990 |
|
RU2028677C1 |
Устройство для контроля цифровой вычислительной системы | 1987 |
|
SU1529242A1 |
Мажоритарно-резервированный интерфейс памяти | 1990 |
|
SU1751766A1 |
Многоканальное запоминающее устройство | 1990 |
|
SU1805497A1 |
Резервированная вычислительная система | 1989 |
|
SU1798946A1 |
УСТРОЙСТВО ДЛЯ УПРАВЛЕНИЯ .ПЕРЕКЛЮЧЕНИЕМ РЕЗЕРВНЫХ БЛОКОВ, содержащее К-разрядный счетчик таймера, регистр конфигураций резерва, управляющие выходы которого соединены с управляющими выходами устройства, магистральные выходы - с магистральными выходами устройства и входами дешифратора, а соответствующие входы модификации состояния - с кон рольными входами устройства, отли чающееся тем, что, с целью расширения области применения устрой ства, в него введены п -разрядньйрегистр признаков ошибок, элемент И и п-входовой элемент ИЛИ, первый вход которого соединен с входом первого разряда регистра признаков ошибок и выходом элемента И, второй вход - с выходом переполнения счетчика таймера, с входом второго разряда регистра признаков ошибок и входом одновременной модификации состояния регистра конфигураций резерва, а выход - с установочным выходом устройства, перйый выход дешифратора подключен к входу сброса регистра признаков ошибок, магистральные выходы которого подключены к магистральным выходом устройства, а входы с третьего по П-и разрядов - к контрольным входам устройства и одноименным входам п -входового элемента ИЛИ, второй вход дешифратора соединен с входом сброса счетчика таймера, выход t-ro разряда которого ( ) соединен с первым входом элемента И, второй вход которого соединен с обменным входом устройства.
Печь для непрерывного получения сернистого натрия | 1921 |
|
SU1A1 |
Цифровая вычислительная машина STAR со средствами самоЛроверк и самовосстановления | |||
Экспресс-инфо мация, серия ВТ, 1972, № 16, с, 4,5 2 | |||
Организация машины SERF | |||
Экспресс-информация, серия ВТ-, 1973, № 22f с | |||
Прибор для нагревания перетягиваемых бандажей подвижного состава | 1917 |
|
SU15A1 |
Авторы
Даты
1984-08-15—Публикация
1981-11-02—Подача