Показать метаданные Скрыть метаданные

(19)

(11)

2 666 285

(13)

(51)

МПК

G06F7/483(2006-01-01)

G06F7/487(2006-01-01)

(21) (22)

Заявка

2017135775, 2017-10-06

(24)

Дата начала отсчета патента

2017-10-06

(22)

дата подачи заявки

2017-10-06

(45)

опубликовано

2018-09-06

(72)

авторы

Князьков Владимир СергеевичКоржавина Анастасия Сергеевна

(73)

патентообладатели

Федеральное Государственное Бюджетное Образовательное Учреждение Высшего Образования Государственный Университет"

(56)

Документы, цитированные в отчете о поиске

US 5144574 A, 01.09.1992US 4366549 A, 28.12.1982.

Способ организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах Российский патент 2018 года по МПК G06F7/483 G06F7/487

Описание патента на изобретение RU2666285C1

Изобретение относится к вычислительной технике и предназначено для выполнения операции умножения чисел, представленных в модулярно-логарифмическом формате с плавающей точкой на гибридных многоядерных процессорах.

Известен способ организации выполнения операции умножения двух чисел в модулярно-позиционном формате представления с плавающей точкой на универсальных многоядерных процессорах (A.C. RU №2509345, БИ №7, 10.03.2014), в котором операция умножения t-разрядных позиционных мантисс сомножителей заменяется n параллельно выполняемыми операциями умножения q-разрядных знакопозиций чисел в системе счисления в остаточных классах. Недостаток данного способа состоит в том, что не определено, каким образом выявляются ситуации переполнения диапазона представления модулярных мантисс при выполнении операции умножения и выполняется процедура масштабирования мантисс, таким образом, способ (A.C. RU №2509345, БИ №7, 10.03.2014) может быть использован для выполнения операции умножения не для всех операндов из заявленного диапазона представления.

Наиболее близким к заявленному способу является способ организации выполнения операции умножения двух чисел в модулярно-позиционном формате (Исупов К.С., Мальцев А.Н. Способ представления чисел с плавающей точкой большой разрядности, ориентированный на параллельную обработку //Вычислительные методы и программирование: новые вычислительные технологии. 2014. Т. 15, №4. С. 631-643), в котором масштабирование мантиссы осуществляется методом, использующим таблицы поправочных коэффициентов с применением интервально-позиционных характеристик. Недостаток данного способа состоит в том, что необходимо хранить таблицы поправочных коэффициентов большого размера, а также использовать вычислительные устройства с плавающей точкой для вычисления интервальной позиционной характеристики.

Техническим результатом применения способа организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах является оптимизация выполнения операции умножения в раз, где q - разрядность знакопозиций чисел в системе счисления в остаточных классах, за счет использования только целочисленных операций при умножении, проверке выхода за границы диапазона, масштабировании модулярных мантисс степенью двойки, при этом не требуется использования операций с плавающей точкой и подстановочных таблиц. Минимальное время выполнения операции умножения предложенным способом равно минимальному времени выполнения операции умножения способом (A.C. RU №2509345, БИ №7, 10.03.2014), при этом способ может быть применен для умножения любых операндов из заявленного диапазона представления, в чем заключается универсальность предлагаемого способа.

Описание способа организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах: реализация способа осуществляется посредством подачи набора электрических, нейронных либо других сигналов на устройства управления каждого вычислительного ядра многоядерного гибридного процессора, которые, в соответствии с данными сигналами, формируют управляющие команды для операционных устройств соответствующих вычислительных ядер.

В позиционных двоичных форматах с плавающей точкой стандарта IEEE-754 любое вещественное число представляется трехэлементным набором:

где М - рациональная мантисса, е - порядок числа, e_min=2-2^ν-1 и e_m_a_x=2^ν-1-1, S-знак числа.

Величина чисел, записанных в таком формате, выражается формулой -1^S⋅М⋅2^е. Машинными представлениями чисел вида (1) являются (ν+t+1)-разрядные двоичные векторы (Sr_ν-1…r₂r₁d_t…d₂d₁), где разряды с d₁ по d_t отводятся под представление рациональных двоичных мантисс М=d_td_t-1…d₂d₁, разряды с r₁ по r_ν отводятся под представление целочисленных двоичных порядков е, записанных в форме с избытком Е=r_νr_ν-1…r₂r₁=е+e_m_a_x, разряд S выражает знак числа.

Определим целочисленную мантиссу М'=d_td_t-1…d₂d₁ как t-разрядное неотрицательное целое двоичное число, такое, что М=М'⋅2^1-t. Определим перемещенный порядок λ как целое двоичное число со знаком, такое, что λ=е-t+1, где е - ν-разрядный порядок числа, представленного в двоичном формате (1).

Зададим n целочисленных положительных q-разрядных оснований системы остаточных классов p₁,р₂, …, p_n, таких, что ∀i₁, i₂∈{1, 2, …, n), i₁≠i₂: , q≤k, где - наибольший общий делитель для и , k - размер разрядной сетки процессора.

Целочисленную мантиссу М'=d_td_t-1…d₂d₁ преобразуем в систему остаточных классов с заданными основаниями р₁, p₂, …, p_n, получая тем самым модулярную мантиссу :

где m_i∈[0, р_i-1], i=1, 2, …, n - q-разрядные цифры (модулярные разряды) модулярной мантиссы , q - разрядность оснований p₁, p₂, …, p_n, - операция получения остатка от деления М' на i-ое основание p_i.

Определим ранг модулярной мантиссы как значение R, такое, что выполняется условие:

где - мультипликативная инверсия Р_i по модулю рi∈[1, n], n - количество модулей.

R∈[0,n-1] и вычисляется по формуле:

где - наибольшее целое, не превышающее

При условии, что 2^q-1<p_i<2^q, где q - разрядность оснований р₁, р₂, …, р_n, величина может быть вычислена по формуле , где w_i - s-разрядные весовые коэффициенты. Тогда величина ранга может быть вычислена по формуле:

Определим верхнюю и нижнюю границы величины ранга модулярного числа как

, ,

где , , при условии, что 2^q-1<р_i<2^q, - наибольшее целое, не превышающее , s - разрядность коэффициентов w_i.

Согласно теоретико-числовой теореме Эйлера мультипликативную инверсию , соответствующую сравнению , можно вычислить следующим образом

где ϕ(p_i) - функция Эйлера, равная количеству целых чисел в диапазоне [1, р_i], взаимно простых с р_i.

Пример. Вычислим значения мультипликативных инверсий P_i по модулям р_i для системы с основаниями: р₁=11, р₂=13, р₃=15:

; ϕ(11)=10; ;

; ϕ(13)=12; ;

; ϕ(15)=12;

Определим логарифмическую характеристику числа как значение двоичного логарифма от этого числа. Тогда логарифмическая характеристика модуля числа, представленного в формате [М, е, S], вычисляется следующим образом:

log₂(М'⋅2^1-t⋅2^е)=log₂(М')+е-t+1=log₂(М')+λ.

Определим интервальную логарифмическую характеристику мантиссы числа как целочисленный интервал [L_min, L_m_а_х], нижняя и верхняя границы L_min, L_m_а_х которого представлены r-разрядными двоичными числами без знака и вычисляются следующим образом:

L_min=[log₂(М')⋅2^r-h-1],

L_m_а_х=L_min+1

где , - наибольшее целое, не превышающее , [log₂(М')⋅2^r-h-1] - наибольшее целое, не превышающее log₂(М')⋅2^r-h-1.

Диапазон представления нижней и верхней границ L_min, L_m_а_х интервальной логарифмической характеристики:

; ,

где - значение нижней границы интервальной логарифмической характеристики диапазона представления модулярных мантисс , - наибольшее целое, не превышающее .

Таким образом, число с плавающей точкой вида (1) можно преобразовать к следующему модулярно-логарифмическому формату:

где 〈m₁, m₂, …, m_n〉 - набор знакопозиций (модулярных разрядов) модулярной мантиссы , λ- позиционный перемещенный порядок, представляющий собой целое двоичное число со знаком, L_min, L_m_a_x - границы интервальной логарифмической характеристики мантиссы числа, представляющие собой целые двоичные числа без знака, σ - знак числа, причем если σ=-1, то число отрицательное, σ=1 - положительное, σ=0 - машинный ноль.

Диапазон допустимых значений модулярных мантисс в системе остаточных классов с основаниями p₁, p₂, … , р_n определяется интервалом ; таким образом, t-разрядная позиционная мантисса М=d_td_t-1…d₂d₁ может быть представлена в системе остаточных классов набором из n взаимно независимых q-разрядных знакопозиций 〈m₁, m₂, …, m_n〉, причем q≈t/n (при условии, что все основания р₁, p₂, …, p_n q-разрядные).

Примеры преобразования позиционных чисел с плавающей точкой в модулярно-логарифмический формат: пусть числа представлены в 10-разрядном двоичном формате вида (1), в котором под смещенный порядок Е, отводится четыре бита (максимальный порядок е_m_a_x=2^4-1-1=7, соответственно е=Е-7), под дробную часть мантиссы - пять бит (т.е. t=6, причем целая часть d₆ рациональной мантиссы М в явном виде не записана) и под знак числа - один бит.Пусть для представления модулярных мантисс в модулярно-логарифмическом формате [〈m₁, m₂, …, m_n〉, λ, L_min, L_m_a_x, σ] используется три основания: р₁=11, р₂=13, р₃=15. Диапазон представления чисел Р=11⋅13⋅15=2145. Разрядность оснований q=4, разрядность интервальной логарифмической характеристики r=5.

Пример 1: необходимо перевести число X=3.3125₁₀=[1.65625, 1, 0]=-1⁰⋅1.65625⋅2¹, представленное в двоичном формате [М, е, S], в модулярно-логарифмический формат [〈m₁, m₂, …, m_n〉, L_min, L_m_a_x, λ, σ].

С учетом принятых характеристик двоичного формата [М, е, S], число X будет записано в памяти ЭВМ в виде двоичного вектора 〈0100010101〉. Для его преобразования в модулярно-логарифмический формат (2) необходимо выполнить следующие действия:

1. Выделить составные части числа X: знак числа S=0, дробная часть рациональной мантиссы d₅…d₂d₁=10101₂, смещенный (избыточный) порядок Е=1000₂=8.

2. Восстановить целую часть d₆ мантиссы М=d₆d₅…d₂d₁:d₆=1, т.к. Е>0, следовательно, М=1.10101₂.

3. Определить порядок е: е=Е-е_m_a_x=8-7=1, т.к. Е>0.

4. Определить знак σ, перемещенный позиционный порядок λ и целочисленную мантиссу М': σ=1, λ=е-t+1=1-6+1=-4, М'=d₆d₅…d₂d₁=110101₂=53.

5. Найти модулярную мантиссу : .

6. Вычислить интервально-логарифмическую характеристику мантиссы L_min, L_mах: L_min=[log₂(53)⋅2^5-3-1]=11, L_m_a_x=11+1=12.

В результате получается число X, представленное в модулярно-логарифмическом формате с плавающей точкой: X=[〈9, 1, 8〉, 11, 12, -4, 1].

Пример 2: необходимо перевести число X=0.02783203125₁₀=[1.78125, -5, 1]=-1¹⋅1.78125⋅2^-5 из двоичного формата [М, е, S] в модулярно-логарифмический формат [〈m₁, m₂, …, m_n〉, L_min, L_m_a_x, λ, σ].

С учетом принятых характеристик двоичного формата [М, е, S], число X будет записано в памяти ЭВМ в виде двоичного вектора 〈1000111001〉. Для его преобразования в модулярно-логарифмический формат (2) необходимо выполнить следующие действия:

1. Выделить составные части числа X: знак числа S=1, дробная часть d₅…d₂d₁=11000₂, смещенный порядок Е=0001₂=1.

2. Восстановить целую часть d₆ мантиссы М=d₆d₅…d₂d₁:d₆=1, т.к. Е>0, следовательно, М=1.11001₂.

3. Определить порядок е. е=е_min=1-7=-6, т.к. Е=0.

4. Определить знак σ, перемещенный порядок λ и целочисленную мантиссу М': σ=-1, λ=e-t+l=-6-6+1=-11, М'=d₆d₅…d₂d₁=111001₂=57.

5. Найти модулярную мантиссу :

6. Вычислить интервально-логарифмическую характеристику мантиссы L_min, L_m_a_x: L_min=log₂(57)⋅2^5-3-1]=11, L_m_a_x=11+1=12.

В результате получается число X, представленное в модулярно-логарифмическом формате с плавающей точкой: X=[〈2, 5, 12〉, 11, 12, -11, -1].

Алгоритм 1. Вычисление ранга числа, представленного в модулярно-логарифмическом формате.

Пусть - число, представленное в модулярно-логарифмическом формате с плавающей точкой, где - модулярная мантисса числа А. Для того чтобы найти ранг R модулярной мантиссы , необходимо:

1. Вычислить значение минимальной величины ранга R_min модулярной мантиссы : , где , , мультипликативная инверсия Р_i по модулю р_i, , - наибольшее целое, не превышающее , - наибольшее целое, не превышающее , s - разрядность , при условии, что 2^q-1<рi<2^q, s>1+log₂n.

2. Вычислить значение максимальной величины ранга R_m_a_x модулярной мантиссы : где , - мультипликативная инверсия Р_i по модулю р_i, , - наибольшее целое, не превышающее , - наибольшее целое, не превышающее , s - разрядность , при условии, что 2^q-1<рi<2^q, s>1+log₂n.

3. Если R_min=R_m_a_x, то R=R_min, иначе выполнить сравнение: если , то есть значение мантиссы меньше половины максимально возможного значения, то R=R_m_a_x, если , то есть значение мантиссы больше или равно половине максимально возможного значения, то R=R_min, где L_Р/2=L_Р-2^r-h-1, , , r - разрядность интервальной логарифмической характеристики числа .

Пример: необходимо вычислить ранги чисел A=53 и B=57. Используется три основания: р₁=11, р₂=13, р₃=15. Р=р₁⋅р₂⋅р₃=2145 - произведение оснований (верхний предел допустимого диапазона представления модулярных мантисс). , , , , , . Разрядность оснований q=4. Разрядность коэффициентов w_i:s=5.

Значения верхних и нижних границ , коэффициентов для значений модулей р₁=11, р₂=13, р₃=15 равны соответственно , , , , , .

Значения мультипликативных инверсий для модулей р₁=11, р₂=13, р₃=15 равны соответственно , , .

Вычислим значение ранга первого числа.

1. Вычислим значение минимальной величины ранга R_min модулярной мантиссы:

2. Вычислим значение максимальной величины ранга R_m_a_x модулярной мантиссы:

3. Так как R_min=R_m_a_x, то R^A=R_min=1. Вычислим значение ранга второго числа.

Вычислим значение ранга второго числа.

1. Вычислим значение минимальной величины ранга R_min модулярной мантиссы:

2. Вычислим значение максимальной величины ранга R_m_a_x модулярной мантиссы:

3. Так как R_min=R_m_a_x, то R^B=R_min=1.

Алгоритм 2. Деление модулярной мантиссы числа, представленного в модулярно-логарифмическом формате, на число 2^x (масштабирование степенью двойки).

Пусть - число, представленное в модулярно-логарифмическом формате с плавающей точкой, где - модулярная мантисса числа А. Для того чтобы найти результат деления модулярного числа на позиционное число 2^x, необходимо:

1. Вычислить α. Если x>q-1, то вычислить значение , где - наименьшее целое, не превышающее , α=|х|_q-1; если x≤q-1, то α=х.

2. Вычислить значение ранга R для модулярного числа в соответствии с алгоритмом 1.

3. Вычислить остаток от деления модулярного числа на р_n+1=2^q-1:

где , , - мультипликативная инверсия Р_i по модулю р_i.

Если 0<α<q-1, то , если α=0, то уменьшить j на 1.

4. Вычислить значение , для чего вычесть из каждого значения знакопозиций модулярного числа значение остатка от деления на 2^α

5. Вычислить значение , для чего умножить каждое значение знакопозиций модулярного числа на мультипликативные инверсии 2^α по соответствующим модулям.

где - мультипликативная инверсия числа 2^α по модулю р_i - результат сравнения .

6. Если , то прибавить к величину .

7. Шаги 2-6 выполнить j раз для α=q-1.

Пример. Необходимо разделить числа А=53 и В=57 на число 2¹. Используется три основания: р₁=11, р₂=13, р₃=15. Р=р₁⋅р₂⋅р₃=2145 - произведение оснований (верхний предел допустимого диапазона представления модулярных мантисс), , . Разрядность оснований q=4.

Значения мультипликативных инверсий для модулей р₁=11, р₂=13, р₃=15 равны соответственно , , .

Значения мультипликативных инверсий по модулям р₁=11, р₂=13, р₃=15 и для значений α=1, 2, 3 равны соответственно ; ; ; ; ; ; ; .

Значения остатков от деления и на 2^α для значений модулей р₁=11, р₂=13, р₃=15 и для значений α=1, 2, 3 равны соответственно

; ; ;

Вычисляем значение .

1. α=x=1, так как x=1<q=4-1.

2. Вычисляем ранг числа A=53 соответствии с алгоритмом 1. R^A=1.

3. Вычисляем остаток от деления модулярного числа на 2^4-1=8:

Вычисляем остаток от деления модулярного числа на р₄=2¹ .

4. Вычитаем из модулярного числа модулярное значение остатка от деления на 2 :

5. Умножаем на мультипликативные инверсии двойки по соответствующим модулям:

6. Прибавляем квеличину 1=(1, 1, 1), так как :

Вычисляем значение

1. α=х=1, так как х=1<q=4-1.

2. Вычисляем ранг числа В=57 соответствии с алгоритмом 1. R^B=1.

3. Вычисляем остаток от деления модулярного числа на 2^4-1=8:

Вычисляем остаток от деления модулярного числа на р₄=2¹

4. Вычитаем из модулярного числа модулярное значение остатка от деления на 2 :

5. Умножаем на мультипликативные инверсии двойки по соответствующим модулям:

6. Прибавляем к величину 1=(1, 1, 1), так как :

Алгоритм 3. Выполнение операции умножения с плавающей точкой в модулярно-логарифмическом формате. Для того чтобы найти произведение чисел и , представленных в модулярно-логарифмическом формате с плавающей точкой, необходимо:

1. Проверить результат на равенство 0. Если σ^С=σ^А⋅σ^В=0, что означает равенство нулю одного из операндов или обоих операндов сразу, то

Если оба операнда ненулевые, то перейти к следующему шагу.

2. Присвоить знак произведению σ^С=σ^А⋅σ^В. Определить верхнюю и нижнюю границы интервальной логарифмической характеристики результата , . Определить порядок результата λ^С=λ^А+λ^В.

3. Проверить выход результата за границы диапазона представления чисел. Если , то

. Если ,то. Если и , то перейти к следующему шагу.

4. Проверить выход мантиссы результата за границы диапазона представления модулярных мантисс и выполнить умножение модулярных мантисс.

4.1. Если , то выполнить коррекцию операндов следующим образом:

4.1.1. Вычислить значения поправочных коэффициентов L₁ и L₂: , , где - наибольшее целое, не превышающее , - наибольшее целое, не превышающее

Если |L₁|≤|L₂| и L₂≥0, то z_А=L₁, z_В=0.

Если |L₁|≤|L₂| и L₂<0, то z_А=0, z_В=L₁.

Если |L₁|>|L₂|и |L₁+L₂|₂=1, то , .

Если |L₁|>|L₂|и |L₁+L₂|₂=0, то., .

4.1.2. Вычислить значения скорректированных мантисс и операндов и скорректировать значение верхней и нижней границы интервальной логарифмической характеристики результата.

Если и I, то , .

Если и , то , , если , то .

Если и, то, , если , то .

Если и , то , если , то .

Если и , то , , если , то , иначе .

Если и , то , , если то если , то .

Если и , то , , если , то , если , то .

Если и , то , , если , то , иначе .

4.1.3. Скорректировать значение порядка результата λ^C=λ^C+L₁.

4.1.4. Скорректировать значение верхней и нижней границы интервальной логарифмической характеристики результата если , то , иначе ;

4.2. Выполнить умножение модулярных мантисс путем нахождения значений , где - наибольшее целое, не превышающее

4.3. Если и , то выполнить коррекцию результата следующим образом.

4.3.1. Вычислить значение поправочного коэффициента .

4.3.2. Вычислить значение скорректированной мантиссы результата: .

4.3.3. Вычислить значение порядка результата λ^C=λ^C-z_C.

4.3.4. Выполнить коррекцию значений верхней и нижней границы интервальной логарифмической характеристики результата , .

4.4. Если и , то выполнить коррекцию результата следующим образом:

4.4.1. Вычислить значение поправочного коэффициента .

4.4.2. Вычислить значение скорректированной мантиссы результата и скорректировать значение верхней и нижней границы интервальной логарифмической характеристики результата.

Если , то.

Если , то , если , то .

Если то если , то .

4.4.3. Вычислить значение порядка результата λ^С=λ^С+z_С.

4.4.4. Выполнить коррекцию значений верхней и нижней границы интервальной логарифмической характеристики результата ; .

В результате выполнения данных операций получается произведение чисел и , представленное в модулярно-логарифмическом формате с плавающей точкой.

Пусть - числа, представленные в модулярно-логарифмическом формате с плавающей точкой, где и - модулярные мантиссы чисел А и В соответственно. Тогда способ умножения С=А⋅В чисел А и В, представленных в модулярно-логарифмическом формате с плавающей точкой (2), на гибридном многоядерном процессоре, содержащем n q-разрядных модулярных вычислительных ядер, одно k-разрядное и два r-разрядных универсальных целочисленных ядра, два специализированных s-разрядных векторных ядра, одно специализированное q-разрядное векторное ядро, одно специализированное управляющее ядро, определяется следующим образом.

1. Множитель и множимое , представленные в модулярно-логарифмическом формате с плавающей точкой, загружают в гибридный многоядерный процессор, содержащий n q-разрядных модулярных вычислительных ядер, одно k-разрядное и два r-разрядных универсальных целочисленных ядра, два специализированных s-разрядных векторных ядра, одно специализированное q-разрядное векторное ядро, одно специализированное управляющее ядро, следующим образом:

- в первое модулярное ядро гибридного многоядерного процессора загружают разрядные двоичные представления первых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р₁ и значение мультипликативной инверсии Р₁ по модулю р₁ ;

- параллельно с этим во второе модулярное ядро гибридного многоядерного процессора загружают q-разрядные двоичные представления вторых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р₂ и значение мультипликативной инверсии Р₂ по модулю р₂ ;

- и т.д.;

- параллельно с этим в n-ое модулярное ядро гибридного многоядерного процессора загружают q-разрядные двоичные представления n-ых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р_n и значение мультипликативной инверсии Р_n по модулю р_n ;

- параллельно с этим в первое универсальное вычислительное ядро загружают k-разрядные двоичные порядки λ^А и λ^В, а также знаки σ^А и σ^В чисел А и В соответственно;

- параллельно с этим во второе универсальное вычислительное ядро загружают r-разрядные значения нижних границ интервальных логарифмических характеристик и чисел А и В соответственно;

- параллельно с этим в третье универсальное вычислительное ядро загружают r-разрядные значения верхних границ интервальных логарифмических характеристик и чисел А я В соответственно, а также r-разрядное значение нижней границы интервальной логарифмической характеристики диапазона представления модулярных мантисс L_р;

- параллельно с этим в первое векторное вычислительное ядро загружают вектор s-разрядных констант коэффициентов ;

- параллельно с этим во второе векторное вычислительное ядро загружают вектор s-разрядных констант коэффициентов ;

- параллельно с этим в третье векторное вычислительное ядро загружают вектор разрядных констант остатков от деления ;

- параллельно с этим в управляющее ядро загружают k-разрядные двоичные порядки λ^А и λ^В, r-разрядные значения нижних границ интервальных логарифмических характеристик и и r-разрядные значения верхних границ интервальных логарифмических характеристик и чисел А и В соответственно, а также r-разрядное значение нижней границы интервальной логарифмической характеристики диапазона представления модулярных мантисс L_р.

2. После того, как множитель и множимое представленные в модулярно-логарифмическом формате с плавающей точкой, загружены в гибридный процессор, содержащий n q-разрядных модулярных вычислительных ядер, одно k-разрядное и два r-разрядных универсальных целочисленных ядра, два специализированных s-разрядных векторных ядра, одно специализированное q-разрядное векторное ядро, одно специализированное управляющее ядро, операция их умножения выполняется следующим образом:

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно, путем нахождения значения , где - наибольшее целое, не превышающее ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

-параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р_n q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим в первом универсальном вычислительном ядре процессора выполняется сложение λ^C=λ^А+λ^В двоичных порядков λ^А и λ^В, а также умножение σ^С=σ^А⋅σ^В знаков σ^А и σ^В чисел А и В соответственно;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется сложение двоичных значений нижних границ интервальных логарифмических характеристик и чисел А и В соответственно;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется сложение двоичных значений верхних границ интервальных логарифмических характеристик и чисел А и В соответственно;

- параллельно с этим в управляющем ядре вычисляются следующие значения поправочных коэффициентов: , , , , , z_А=L₁+1, z_В=0, если |L₁|≤|L₂| и L₂≥0, z_А=0, z_В=L₁+1, если |L₁|≤|L₂| и L₂<0, , , если |L₁|>|L₂| и |L₁+L₂|₂=1, , , если |L₁|>|L₂| и |L₁+L₂|₂=0.

3. После того, как получено промежуточное значение произведения чисел и , выполняется коррекция результата следующим образом:

3.1. Если знак промежуточного результатапроизведения чисел А и Вне равен 0, и порядок промежуточного результата произведения чисел А и В принадлежит интервалу [2-2^k-1; 2^k-1-2], и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы, то есть , , , то коррекции результата не требуется.

3.2. Если знак промежуточного результата произведения чисел А и В равен 0, то есть, то:

- в первом универсальном вычислительном ядре процессора выполняется обнуление двоичного порядка промежуточного результата произведения чисел А и В;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется обнуление двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется обнуление двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В.

3.3. Если знак промежуточного результата произведения чисел А и В не равен 0 и значение , то есть модуль промежуточного результата произведения чисел А и В выходит за границы минимально возможного представления, то:

- в первом универсальном вычислительном ядре процессора выполняется обнуление двоичного порядка и знака промежуточного результата произведения чисел А и В;

- параллельно с этим в первом модулярном вычислительном ядре процессора выполняется обнуление значения первой знакопозиций промежуточного результата произведения чисел А и В;

-параллельно с этим во втором модулярном вычислительном ядре процессора выполняется обнуление значения второй знакопозиций промежуточного результата произведения чисел А и В;

- и т.д.

- параллельно с этим в n-ом модулярном вычислительном ядре процессора выполняется обнуление значения n-ой знакопозиций промежуточного результата произведения чисел А и В.

3.4. Если знак промежуточного результата произведения чисел А и В не равен 0 и значение , то есть модуль промежуточного результата произведения чисел А и В выходит за границы максимального возможного представления, то:

- в первом универсальном вычислительном ядре процессора выполняется присвоение двоичному порядку промежуточного результата произведения числе А и В;

- параллельно с этим в первом модулярном вычислительном ядре процессора выполняется обнуление значения первой знакопозиции промежуточного результата произведения чисел А и В;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется обнуление значения второй знакопозиции промежуточного результата произведения чисел А и В;

- и т.д.

- параллеьно с этим в n-ом модулярном вычислительном ядре процессора выполняется обнуление значения n-ой знакопозиции промежуточного результта произведения чисел А и В.

3.5. Знак промежутоного результата произведения чисел А и В не равен 0, и порядок промежуточного результата умножения чисел А и В принадлежит интервалу , где - наибольшее целое, не превышающее , и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы , то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значения поправочных коэффициентов: , , где - наибольшее целое, не превышающее , после чего:

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы ) промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения , полученного сдвигом числа 1 на двоичных разрядов влево, путем нахождения значения , где - наибольшее целое, не превышающее ; затем, если , то раз выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения 2^q-1, полученного сдвигом числа 1 на (q-1) двоичных разрядов влево, путем нахождения значения , где - наибольшее целое, не превышающее ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора

выполняется операция целочисленного умножения по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₂; затем, если , то раз выполняется операция целочисленного умножения по модулю р₂;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р_n; затем, если , то раз выполняется операция целочисленного умножения по модулю р_n;

- параллельно с этим в первом универсальном вычислительном ядре процессора выполняется коррекция двоичного порядка промежуточного результата произведения чисел А и В;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекциядвоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В.

3.6. Если знакпромежуточного результатапроизведения чисел А и В не равен 0, и порядок промежуточного результата произведения чисел А и В принадлежит интервалу , где - наибольшее целое, не превышающее , и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы , то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значение поправочного коэффициента , после чего:

3.6.1. Выполняется загрузка мультипликативных инверсий и 2^q-1:

- в первое модулярное ядро загружают ^-разрядные двоичные значенияи , мультипликативных инверсий и 2^q-1 по модулю р₁;

- параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю р₂;

- и т.д.;

- параллельно с этим в n-ое модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2_q-1 по модулю р_n;

- параллельно с этим в управляющем ядре вычисляется количество итераций j: j=0, если , , если , где - наибольшее целое, не превышающее .

3.6.2. Если , то действия 3.6.3-3.6.7 выполняются один раз для , затем если количество итераций j≥1, то действия 3.6.3-3.6.7 выполняются j раз для α=q-1.

3.6.3. Вычисляются значения элементов вектора :

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результатапроизведения чисел А и В и значения мультипликативной инверсии Р₁ по модулю р₁ , путем нахождения значения где - наибольшее целое, не превышающее ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии Р₂ по модулю р₂ ;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция целочисленного умноженияпо модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии Р_n по модулю р_n .

3.6.4. После того, как получены значения элементов вектора , данный вектор загружается в векторные ядра следующим образом:

- в первое векторное вычислительное ядро загружают вектор q-разрядных элементов , q≤s;

- параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов , q≤s;

- параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов;

3.6.5. После того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и частичного остатка от деления на 2^q-1 модулярной мантиссы промежуточного результата произведения чисел А я В:

-в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и , вычисляют значение , где - наибольшее целое, не превышающее значение передается в управляющее ядро;

- параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и вычисляют значение , где - наибольшее целое, не превышающее , значение передается в управляющее ядро;

- параллельно с этим в третьем векторном вычислительном ядре вычисляют скалярное произведение векторов и , значение передается в управляющее ядро.

3.6.6. После того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга , если или , R=R_max, если , и значение остатка от деления модулярной мантиссы промежуточного результата произведения чисел А и В .

3.6.7. После того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы промежуточного результатапроизведения чисел А и В на число 2α:

- в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: если , то , если, то; после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результатапроизведения чисел А и В и значения мультипликативной инверсии 2_α по модулю р₁ путем нахождения значения , где - наибольшее целое, не превышающее ; после чего если выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В следующим образом: если , то если , то; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результатапроизведения чисел А и В и значения , после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2α по модулю р₂ ; после чего если выполняется операция сложения по модулю р₂;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения ; после чего выполняется операция умножения по модулю р_n q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2^α по модулю р_n ; после чего если выполняется операция сложения по модулю р_1n;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция если , иначе двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция , если иначе двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

3.7. Если знак промежуточного результата произведения чисел А и В не равен 0, и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В больше или равно значению нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы , то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значение поправочных коэффициентов z_А, z_В, после чего:

3.7.1. Выполняется загрузка мультипликативных инверсий , и 2^q-1:

- в первое модулярное ядро загружают q-разрядные двоичные значения , и мультипликативных инверсий , и 2^q-1 по модулю р₁;

- параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные значения , и мультипликативных инверсий , и 2^q-1 по модулю р₂;

- и т.д.;

- параллельно с этим в и-ое модулярное ядро загружают q-разрядные двоичные значения,имультипликативных инверсий , и 2^q-1 по модулю р_n;

- параллельно с этим в управляющем ядре вычисляется количество итераций j_А=0, если z_А<q-1, , если z_А>q-1 и j_В=0, если z_В<q-1, , если z_В>q-1.

3.7.2. Если |Z_A|_q-1>0, то действия 3.7.3-3.7.7 выполняются один раз для затем если количество итераций j_А≥1, то действия 3.7.3-3.7.7 выполняются j_А раз для α=q-1.

3.7.3. Вычисляются значения элементов вектора :

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения мультипликативной инверсии Р₁ по модулю р₁ , путем нахождения значения , где - наибольшее целое, не превышающее; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы и значения мультипликативной инверсии Р₂ по модулю р₂ ;

- и т.д.

3.7.4. После того, как получены значения элементов вектора , данный вектор загружается в векторные ядра следующим образом:

- в первое векторное вычислительное ядро загружают вектор q-разрядных элементов , q≤s;

- параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов , q≤s;

- параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов .

3.7.5. После того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и частичного остатка от деления на 2^q-1 модулярной мантиссы числа А следующим образом:

- в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и , вычисляют значение , где - наибольшее целое, на превышающее , значение передается в управляющее ядро;

- параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и , вычисляют значение , где - наибольшее целое, не превышающее, значение передается в управляющее ядро;

3.7.6. После того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга , если или, R=R_m_а_х, если и значение остатка от деления модулярной мантиссы числа А на 2^α: .

3.7.7. После того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы числа А на число 2^α:

- в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения следующим образом: если , то , если, то ; после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения мультипликативной инверсии 2^α по модулю р₁ путем нахождения значения , где - наибольшее целое, не превышающее ; после чего если выполняется операция сложенияпо модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А следующим образом: если , то если , то ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения , после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2_α по модулю р₂ ; после чего если выполняется операция сложения по модулю р₂;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения ; после чего выполняется операция умножения по модулю р_n q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2^α по модулю р_n ; после чего если выполняется операция сложения по модулю р_n;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция , если , иначе двоичного значения нижней границы интервальной логарифмической характеристикипромежуточного результатапроизведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция , если , иначе двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

3.7.8. Если |z_B|_q-1>0, то действия 3.7.9-3.7.13 выполняются один раз для α=|z_B|_q-1; затем если количество итераций j_В≥1, то действия 3.7.9-3.7.13 выполняются затем j_В раз для α=q-1.

3.7.9. Вычисляются значения элементов вектора :

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения мультипликативной инверсии Р₁ по модулю р₁ , путем нахождения значения , где - наибольшее целое, не превышающее ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы и значения мультипликативной инверсии Р₂ по модулю р₂ ;

- и т.д.

3.7.10. После того, как получены значения элементов вектора , данный вектор загружается в векторные ядра следующим образом:

- в первое векторное вычислительное ядро загружают вектор q-разрядных элементов ;

- параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов ;

- параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов

3.7.11. После того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и остатка от деления на 2^q-1 следующим образом:

- в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

- параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и , значение передается в управляющее ядро;

- параллельно с этим в третьем векторном вычислительном ядре вычисляют скалярное произведение векторов и , значение передается в управляющее ядро;

3.7.12. После того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга , если или , , если и значение остатка от деления модулярной мантиссы числа В на 2^α: .

3.7.13. После того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы числа В на число 2^α:

- в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения следующим образом: если , то , если , то , после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения мультипликативной инверсии 2^α по модулю р₁ путем нахождения значения , где - наибольшее целое, не превышающее; после чего если , выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В следующим образом: если, то, если то ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения , после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозицийи значения мультипликативной инверсии 2^α по модулю p₂ ; после чего, если, выполняется операция сложения по модулю р₂;

- и т.д.

-параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения ; после чего выполняется операция умножения по модулю р_n q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2^α по модулю р_n после чего, если выполняется операция сложения по модулю р_n;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция , если , иначе двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция , если, иначе двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

3.7.14. После того, как выполнена коррекция мантисс и чисел А и В соответственно, выполняется их умножение следующим образом:

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умноженияпо модулю р₂ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- и т.д.

Для выполнения операции сложения двух целых q-разрядных двоичных чисел требуется устройство, состоящее из q элементарных двоичных устройств, для выполнения операции умножения двух целых q-разрядных двоичных чисел требуется устройство, состоящее из q×q элементарных двоичных устройств, для выполнения операции модулярного умножения двух целых q-разрядных двоичных чисел требуется устройство, состоящее из 2×q×q элементарных двоичных устройств, для хранения одного бита информации требуется устройство, состоящее из одного элементарного двоичного устройства, для сложения двух q-разрядных двоичных чисел в формате с плавающей точкой с направленным округлением требуется устройство, состоящее из 2×q элементарных двоичных устройств. Для выполнения операции умножения способом (A.C. RU №2509345, БИ №7, 10.03.2014) требуется устройство, состоящее из (2×k×k×n+k) элементарных двоичных устройств, где k - разрядность одного ядра универсального многоядерного процессора, n - количество модулей. Для выполнения операции умножения способом (К.С. Исупов, А.Н. Мальцев. «Способ представления чисел с плавающей точкой большой разрядности, ориентированный на параллельную обработку», Вычислительные методы и программирование, 15:4 (2014), с. 631-643.), требуется устройство, состоящее из (2^β-l)×n×q+2×q×q×n+k+2×2×γ, где β - шаг масштабирования, n - количество моделей, q - разрядность модулей, k - разрядность порядка, γ - разрядность интервальной позиционной характеристики). Для выполнения операции умножения предложенным способом, требуется устройство, состоящее из 2×q×q×n+k+2×r+2×(n×s×s+(n-1)×(s+log₂n))+(n×q×q+(n-1)×q), где n - количество моделей, q - разрядность модулей, k -разрядность порядка, r - разрядность интервальной логарифмической характеристики, s -разрядность весовых коэффициентов. При условии, что k=r=s=q, β=q-1, γ=2⋅q, для выполнения операции умножения способом (A.C. RU №2509345, БИ №7, 10.03.2014) требуется устройство, состоящее из (q⋅(2⋅n⋅q+1)) элементарных двоичных устройств, для выполнения операции умножения способом (К.С. Исупов, А.Н. Мальцев. «Способ представления чисел с плавающей точкой большой разрядности, ориентированный на параллельную обработку», Вычислительные методы и программирование, 15:4 (2014), с. 631-643.), требуется устройство, состоящее из (q⋅((2^q-1-1)⋅n+2⋅q+9)), для выполнения операции умножения предложенным способом, требуется устройство, состоящее из (5⋅n⋅q²+3⋅n⋅q+(n-1)⋅log₂n).

Предложенный способ полностью описывает процедуру умножения двух чисел в модулярном формате с плавающей точкой, включая контроль переполнения, потери порядка, масштабирования, при этом требует для своего выполнения устройство всего в раза сложнее, чем требуется для выполнения способа (A.C. RU №2509345, БИ №7, 10.03.2014) и в раз проще, чем требуется для способа (Исупов К.С., Мальцев А.Н. Способ представления чисел с плавающей точкой большой разрядности, ориентированный на параллельную обработку // Вычислительные методы и программирование: новые вычислительные технологии. 2014. Т. 15, №4. С. 631-643).

Реферат патента 2018 года Способ организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах

Изобретение относится к вычислительной технике и предназначено для выполнения операции умножения двух чисел в модулярно-логарифмическом формате с плавающей точкой. Техническим результатом является упрощение выполнения операции умножения. Способ осуществляется на гибридных многоядерных процессорах и содержит процедуру умножения двух чисел в модулярном формате с плавающей точкой, включая контроль переполнения, потери порядка, масштабирования.

Формула изобретения RU 2 666 285 C1

Способ организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах, заключающийся в том, что:

в гибридном многоядерном вычислителе, содержащем n q-разрядных модулярных вычислительных ядер, одно k-разрядное и два r-разрядных универсальных целочисленных ядра, два специализированных s-разрядных векторных ядра, одно специализированное q-разрядное векторное ядро и одно специализированное управляющее ядро, выполняется система из операций, в состав которой входят операции арифметического умножения и арифметического сложения над числами, представленными в позиционных целочисленных форматах данных, операции скалярного произведения векторов n чисел, представленными в позиционных целочисленных форматах данных, операции передачи управления и информации между ядрами;

при организации выполнения операций умножения каждое число, множитель и множимое, представляется в модулярно-логарифмическом формате с плавающей точкой в виде (2+k+2⋅r+q⋅n) -элементного вектора, где:

первые два разряда слева σ являются старшими разрядами в формате числа и отводятся под значение знака числа, причем если σ=+1, то число считается положительным, если σ=-1, то число считается отрицательным, если σ=0, то число равно 0;

следующие за первыми двумя разрядами σ числа k разрядов отводятся под хранение порядка числа, представляющего собой целое двоичное число λ со знаком s_λ, изменяющееся для конечных чисел с плавающей точкой в диапазоне λ_min≤λ≤λ_mах и получаемое в результате преобразования числа из позиционного формата с плавающей точкой посредством вычисления выражения λ=е-t+1, где е определяет величину числа в двоичном позиционном формате с плавающей точкой в выражении -1^S⋅М⋅2^епри 0≤М≤2, являющейся рациональной t-разрядной мантиссой числа в двоичном позиционном формате с плавающей точкой, λ_min=2-2^k-1, λ_max=2^k-1-2, при s_λ=0, порядок λ считается положительным, а при s_λ=1 порядок λ считается отрицательным;

следующие за (k+2) разрядами 2⋅r разрядов отводятся под хранение интервальной логарифмической характеристики числа, представляющей собой пару целых двоичных чисел L_min, L_max без знака, изменяющихся в диапазоне 0≤L_min≤L_P, 0≤L_max≤L_P и получаемых в результате преобразования числа из позиционного формата с плавающей точкой -1^S⋅М⋅2^е посредством вычисления выражений L_min= L_max=L_min+1, где М' - целое неотрицательное двоичное число, определяемое выражением М'=М⋅2^t-1, М - рациональная t-разрядная мантисса числа в двоичном позиционном формате с плавающей точкой, - наибольшее целое, не превышающее log₂(M')⋅2^r-h-1, - наибольшее целое, не превышающее , - наибольшее целое, не превышающее

следующие за (2⋅r+k+2) разрядами q⋅n разрядов отводятся для представления мантиссы числав модулярно-логарифмическом формате, причем данная мантисса представляется в системе остаточных классов с n основаниями P₁, P₂, …, Р_n, n - количество знакопозиций мантиссы, q - разрядность каждой знакопозиции; причем каждая i-ая знакопозиция, где 1≤i≤n, представляется целым неотрицательным числом m_i в двоичной позиционной системе счисления; значение m_i каждой i-ой знакопозиции определяется по выражению m_i= , где М' - целое неотрицательное двоичное число, определяемое выражением М'=М⋅2^t-1, М - рациональная t-разрядная мантисса числа в двоичном позиционном формате с плавающей точкой, - операция получения остатка от деления М' на i-ое основание р_i;

диапазон изменения модулярной мантиссы в позиционной системе счисления определяется интервалом

значения порядка λ, мантиссы и верхней и нижней границ интервальной логарифмической характеристики L_min, L_max положительных конечных чисел при σ=+1 в модулярно-логарифмическом формате [〈m₁, m₂, …, m_n〉, L_min, L_max, λ, σ] находятся соответственно в следующих диапазонах: 2-2^k-1≤λ≤2^k-1-2, 0≤L_min≤L_P, 0≤L_max≤Lp,

значения порядка λ, мантиссы и интервальной логарифмической характеристики L_min, L_max отрицательных конечных чисел при σ=-1 в модулярно-логарифмическом формате находятся соответственно в следующих диапазонах: 2-2^k-1≤λ≤2^k-1-2, 0≤L_min≤L_P, 0≤L_max≤L_P;

значение машинного нуля представляется в модулярно логарифмическом формате следующим образом: σ=0, λ=0, L_min=0, L_max=0;

значение положительной бесконечности представляется в модулярно-логарифмическом формате следующим образом: σ=+1, λ=λ_mах+1=2^k-1-1, L_min=0, L_max=0;

значение отрицательной бесконечности представляется в модулярно-логарифмическом формате следующим образом: σ=-1, λ=λ_mаx+1=2^k-1-1, L_min=0, L_max=0;

для положительных нечисловых величин (NaN) в модулярно-логарифмическом формате при σ=+1 значение позиционного порядка λ определяется выражением λ=λ_mах+1=2^k-1-1, значение мантиссынаходится в диапазоне 〈1₁, 1₂, …, 1_n〉≤≤〈р₁-1), (р₂-1), …, (р₂-1)〉, значение верхней и нижней границ интервальной логарифмической характеристики L_min, L_max находятся в диапазонах 0≤L_min≤L_P, 0≤L_max≤L_P,

для отрицательных нечисловых величин (NaN) в модулярно-логарифмическом формате при σ=-1 значение позиционного порядка λ определяется выражением λ=λ_mах+1=2^k-1-1, значение мантиссынаходится в диапазоне 〈1₁, 1₂,…, 1_n〉≤≤ 〈р₁-1), (р₂-1), ..., (р₂-1)〉, значение верхней и нижней границ интервальной логарифмической характеристики L_min, L_max находятся в диапазонах 0≤L_min≤L_P, 0≤L_max≤L_P;

по сигналу процессора множитель и множимое представленные в модулярно-логарифмическом формате с плавающей точкой, загружают в гибридный многоядерный процессор следующим образом:

в первое модулярное ядро гибридного многоядерного процессора загружают q-разрядные двоичные представления первых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р₁ и значение мультипликативной инверсии Р₁ по модулю

параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные представления вторых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р₂ и значение мультипликативной инверсии Р₂ по модулю

параллельно с этим в третье ÷ n-ое модулярные ядра загружают q-разрядные двоичные представления третьих ÷ n-ых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основания системы остаточных классов р₃÷р_n и значения мультипликативных инверсий Р₃÷Р_n по модулям р₃÷р_n

параллельно с этим в первое универсальное вычислительное ядро загружают k-разрядные двоичные порядки λ^А и λ^B, а также знаки σ^А и σ^B чисел А и В соответственно;

параллельно с этим во второе универсальное вычислительное ядро загружают r-разрядные значения нижних границ интервальных логарифмических характеристик и чисел А и В соответственно;

параллельно с этим в третье универсальное вычислительное ядро загружают r-разрядные значения верхних границ интервальных логарифмических характеристик и чисел А и В соответственно, а также r-разрядное значение нижней границы интервальной логарифмической характеристики диапазона представления модулярных мантисс L_P;

параллельно с этим в первое векторное вычислительное ядро загружают вектор s-разрядных коэффициентов

параллельно с этим во второе векторное вычислительное ядро загружают вектор s-разрядных коэффициентов

параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных остатков от деления

после того, как множитель и множимое загружены в гибридный многоядерный процессор, операция их умножения выполняется следующим образом:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно, путем нахождения значения - наибольшее целое, не превышающее

все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₃÷ р_n q-разрядных двоичных представлений знакопозиций модулярных мантисс и чисел А и В соответственно;

параллельно с этим в первом универсальном вычислительном ядре процессора выполняется сложение λ^C=λ^A+λ^B двоичных порядков λ^А и λ^B, а также умножение σ^C=σ^А⋅σ^B знаков σ^А и σ^B чисел А и В соответственно;

параллельно с этим во втором универсальном вычислительном ядре процессора выполняется сложение двоичных значений нижних границ интервальных логарифмических характеристик чисел А и В соответственно;

параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется сложение двоичных значений верхних границ интервальных логарифмических характеристик чисел А и В соответственно;

параллельно с этим в управляющем ядре вычисляются следующие значения поправочных коэффициентов: если если и L₂<0,z_B= если и если и

после того, как получено промежуточное значение произведения чисел и выполняется коррекция результата следующим образом:

в случае если знак промежуточного результата произведения чисел А и В не равен 0, и порядок промежуточного результата произведения чисел А и В принадлежит интервалу [2-2^k-1; 2^k-1-2], и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы, то есть

то коррекции результата не требуется;

в случае если знак промежуточного результата произведения чисел А и В равен 0, то есть то:

в первом универсальном вычислительном ядре процессора выполняется обнуление двоичного порядка промежуточного результата произведения чисел А и В;

параллельно с этим во втором универсальном вычислительном ядре процессора выполняется обнуление двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется обнуление двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

в случае если знак промежуточного результата произведения чисел А и В не равен 0 и значение то есть модуль промежуточного результата произведения чисел А и В выходит за границы минимально возможного представления, то:

в первом универсальном вычислительном ядре процессора выполняется обнуление двоичного порядка и знака промежуточного результата произведения чисел А и В;

параллельно с этим в первом модулярном вычислительном ядре процессора выполняется обнуление значения первой знакопозиции промежуточного результата произведения чисел А и В;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется обнуление значения второй знакопозиции промежуточного результата произведения чисел А и В;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется обнуление значения третьей ÷ n-ой знакопозиции промежуточного результата произведения чисел А и В;

в случае если знак промежуточного результата С произведения чисел А и В не равен 0 и значение то есть модуль промежуточного результата произведения чисел А и В выходит за границы максимально возможного представления, то:

в первом универсальном вычислительном ядре процессора выполняется присвоение двоичному порядку промежуточного результата произведения чисел А и В;

в случае если знак промежуточного результата произведения чисел А и В не равен 0, и порядок промежуточного результата произведения чисел А и В принадлежит интервалу и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значения поправочных коэффициентов после чего:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₁ знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения полученного сдвигом числа 1 на двоичных разрядов влево, путем нахождения значения где - наибольшее целое, не превышающее затем, если j_C>0, то j_C раз выполняется операция целочисленного умножения по модулю р₁ знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения 2^q-1, полученного сдвигом числа 1 на (q-1) двоичных разрядов влево, путем нахождения значения где - наибольшее целое, не превышающее все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₂; затем, если j_C>0, то j_C раз выполняется операция целочисленного умножения по модулю р₂;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₃÷р_n; затем, если j_C>0, то j_C раз выполняется операция целочисленного умножения по модулю р₃÷р_n;

параллельно с этим в первом универсальном вычислительном ядре процессора выполняется коррекция двоичного порядка промежуточного результата произведения чисел А и В;

параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

в случае если знак промежуточного результата произведения чисел А и В не равен 0, и порядок промежуточного результата С произведения чисел А и В принадлежит интервалу и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значение поправочного коэффициента после чего:

в первое модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий по модулю р₁;

параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю р₂;

параллельно с этим в третье ÷ n-ое модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю p₃÷р_n;

параллельно с этим в управляющем ядре вычисляется количество итераций j=0, если если

в случае если выполняется один цикл деления на 2^α, где затем, если количество итераций j≥1, выполняется j циклов деления на 2^α, где α=q-1;

цикл деления на 2^α состоит в следующем:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии P₁ по модулю путем нахождения значения где - наибольшее целое, не превышающее все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии Р₂ по модулю

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р_n _{q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии Р_n по модулю}

после того, как получены значения элементов вектора данный вектор загружается в векторные ядра следующим образом:

в первое векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов

после того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и частичного остатка от деления на 2^q-1модулярной мантиссы промежуточного результата произведения чисел А и В:

- в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и вычисляют значение где - наибольшее целое, не превышающее значение передается в управляющее ядро;

- параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и вычисляют значение где - наибольшее целое, не превышающее значение передается в управляющее ядро;

- параллельно с этим в третьем векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

после того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга если или R=R_max, если и значение остатка от деления модулярной мантиссы промежуточного результата произведения чисел

после того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы промежуточного результата произведения чисел А и В на число 2^α:

в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: если то если то после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии 2^α по модулю путем нахождения значения

- наибольшее целое, не превышающее после чего, если , выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В следующим образом: если , если то все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₂;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р_1n q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения после чего выполняется операция умножения по модулю р_n q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р_n;

параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция если иначе двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция если иначе двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В; цикл деления на 2^α заканчивается;

если знак промежуточного результата произведения чисел А и В не равен 0 и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В больше или равно значению нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значение поправочных коэффициентов z_A, z_B, после чего:

в первое модулярное ядро загружают q-разрядные двоичные значения мультипликативных инверсий по модулю р₁;

параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю р_2;

параллельно с этим в третье ÷ n-ое модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю р₃÷р_n;

параллельно с этим в управляющем ядре вычисляется количество итераций j_A=0, если z_A≤q-1, если z_A>q-1 и j_B=0, если z_B≤q-1, если z_B>q-1.

в случае если выполняется один цикл деления на 2^α, где затем, если количество итераций j_A≥1, выполняется j_A циклов деленияна 2^α, где α=q-1;

цикл деления на 2^α состоит в следующем:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значения мультипликативной инверсии Р₁ по модулю р₁ , путем нахождения значения где - наибольшее целое, не превышающее все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂q- разрядного двоичного представления знакопозиции модулярной мантиссы и значения мультипликативной инверсии Р₂ по модулю

в первое векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов

после того, как элементы вектора загружены в векторные ядра производится вычисление ранга и частичного остатка от деления на 2^q-1модулярной мантиссы числа А следующим образом:

- в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и вычисляют значение где - наибольшее целое, на превышающее значение передается в управляющее ядро;

после того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга , если или если и значение остатка от деления модулярной мантиссы числа А

после того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы числа А на число 2^α:

в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значения следующим образом: если то если то после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значения мультипликативной инверсии 2^α по

модулю P₁ путем нахождения значения - где - наибольшее целое, не превышающее после чего, если , выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А следующим образом: если то , если то все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значения после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₂;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значенияпосле чего выполняется операция умножения по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₃÷р_n;

цикл деления завершается;

в случае если выполняется один цикл деления на 2^α, где α= затем если количество итераций j_B≥1, выполняется j_B циклов деления на 2^α, где α=q-1;

цикл деления на 2^α состоит в следующем:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа В и значения мультипликативной инверсии Р₁ по модулю р₁ путем нахождения значения - наибольшее целое, не превышающее все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂q-разрядного двоичного представления знакопозиции модулярной мантиссы и значения мультипликативной инверсии Р₂ по модулю

в первое векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов

после того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и остатка от деления на 2^q-1 следующим образом:

в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

параллельно с этим в третьем векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

после того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга R^B=R^B_min, если если и значение остатка от деления модулярной мантиссы числа В

после того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы числа В на число 2^α:

в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы, числа В и значения следующим образом: если то если то после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа В и значения мультипликативной инверсии 2^α по модулю p₁ путем нахождения значения - где - наибольшее целое, не превышающее после чего, если , выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа В следующим образом: если то , если то все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа В и значения после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₂;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции модулярной мантиссычисла В и значения после чего выполняется операция умножения по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₃÷р_n;

цикл деления на 2^α завершается;

после того, как выполнена коррекция мантисс и чисел А и В соответственно, выполняется их умножение следующим образом:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядных двоичных представлений знакопозиций модулярных мантисс и чисел А и В соответственно, путем нахождения значения где - наибольшее целое, не превышающее

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядных двоичных представлений знакопозиций модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₃÷р_n q-разрядных двоичных представлений знакопозиций модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

в результате выполнения данных операций получается произведение чисел и представленное в модулярно-логарифмическом формате с плавающей точкой.

Документы, цитированные в отчете о поиске Патент 2018 года RU2666285C1

СПОСОБ ОРГАНИЗАЦИИ ВЫПОЛНЕНИЯ ОПЕРАЦИИ УМНОЖЕНИЯ ДВУХ ЧИСЕЛ В МОДУЛЯРНО-ПОЗИЦИОННОМ ФОРМАТЕ ПРЕДСТАВЛЕНИЯ С ПЛАВАЮЩЕЙ ТОЧКОЙ НА УНИВЕРСАЛЬНЫХ МНОГОЯДЕРНЫХ ПРОЦЕССОРАХ	2012	Князьков Владимир Сергеевич Исупов Константин Сергеевич	RU2509345C1
СПОСОБ, УСТРОЙСТВО И КОМАНДА ДЛЯ ВЫПОЛНЕНИЯ ЗНАКОВОЙ ОПЕРАЦИИ УМНОЖЕНИЯ	2003	Мейси Вилльям В. Мл. Нгуйен Хьюи В.	RU2275677C2
Способ приготовления мыла	1923	Петров Г.С. Таланцев З.М.	SU2004A1
US 5144574 A, 01.09.1992
US 4366549 A, 28.12.1982.

RU 2 666 285 C1

Авторы

Князьков Владимир Сергеевич

Коржавина Анастасия Сергеевна

Даты

2018-09-06—Публикация

2017-10-06—Подача

название	год	авторы	номер документа
Способ организации выполнения операции умножения двух чисел в модулярно-индексном формате представления с плавающей точкой на универсальных многоядерных процессорах	2017	Князьков Владимир Сергеевич Коржавина Анастасия Сергеевна	RU2652460C1
СПОСОБ ОРГАНИЗАЦИИ ВЫПОЛНЕНИЯ ОПЕРАЦИИ УМНОЖЕНИЯ ДВУХ ЧИСЕЛ В МОДУЛЯРНО-ПОЗИЦИОННОМ ФОРМАТЕ ПРЕДСТАВЛЕНИЯ С ПЛАВАЮЩЕЙ ТОЧКОЙ НА УНИВЕРСАЛЬНЫХ МНОГОЯДЕРНЫХ ПРОЦЕССОРАХ	2012	Князьков Владимир Сергеевич Исупов Константин Сергеевич	RU2509345C1
Устройство для сравнения чисел в системе остаточных классов	2018	Коржавина Анастасия Сергеевна	RU2698413C1
УСТРОЙСТВО ДЛЯ СРАВНЕНИЯ ЧИСЕЛ В СИСТЕМЕ ОСТАТОЧНЫХ КЛАССОВ НА ОСНОВЕ ИНТЕРВАЛЬНО-ПОЗИЦИОННЫХ ХАРАКТЕРИСТИК	2014	Князьков Владимир Сергеевич Исупов Константин Сергеевич	RU2557444C1
УСТРОЙСТВО ДЛЯ ОПРЕДЕЛЕНИЯ ЗНАКОВ ЧИСЕЛ В СИСТЕМЕ ОСТАТОЧНЫХ КЛАССОВ	2014	Князьков Владимир Сергеевич Исупов Константин Сергеевич	RU2557446C1
Устройство вычисления модулярного произведения Монтгомери	2017	Червяков Николай Иванович Коляда Андрей Алексеевич Кучуков Виктор Андреевич Бабенко Михаил Григорьевич	RU2652450C1
НЕЙРОННАЯ СЕТЬ ДЛЯ ДЕЛЕНИЯ ЧИСЕЛ, ПРЕДСТАВЛЕННЫХ В СИСТЕМЕ ОСТАТОЧНЫХ КЛАССОВ	2005	Червяков Николай Иванович Лавриненко Ирина Николаевна Кондрашов Александр Владимирович Гуйда Михаил Владимирович Щегольков Алексей Викторович	RU2305312C2
НЕЙРОННАЯ СЕТЬ ДЛЯ ВЫЧИСЛЕНИЯ ПОЗИЦИОННЫХ ХАРАКТЕРИСТИК НЕПОЗИЦИОННОГО КОДА	2003	Червяков Н.И. Малофей А.О. Рыбальченко М.С. Щелкунова Ю.О.	RU2257615C2
Арифметическое устройство в модулярной системе счисления	1987	Коляда Андрей Алексеевич Селянинов Михаил Юрьевич Чернявский Александр Федорович	SU1432517A1
Устройство для умножения чисел в модулярной системе счисления	1986	Амербаев Вильжан Мавлютинович Коляда Андрей Алексеевич Селянинов Михаил Юрьевич Чернявский Александр Федорович	SU1368878A1

Описание патента на изобретение RU2666285C1

Похожие патенты RU2666285C1

Формула изобретения RU 2 666 285 C1

Документы, цитированные в отчете о поиске Патент 2018 года RU2666285C1

RU 2 666 285 C1