Изобретение относится к вычислительной технике и предназначено для построения быстродействующих параллельно-конвейерных умножителей, обрабатывающих массивы положительных чисел с плавающей запятой в системе остаточных классов (СОК).
Операция умножения производится параллельно по нескольким основаниям pi, их количество n определяется диапазоном P представления чисел: Р=p1*p2*…*pn. Представление числа в СОК обеспечивается наименьшими неотрицательными остатками Ai по системе взаимно простых оснований pi (i∈[1,n]).
Числа в системе остаточных классов представляют собой позиционный порядок и мантиссу, состоящую из набора остатков по основаниям pi.
Известен итерационный способ умножения целых чисел с плавающей запятой, который применим к числам, представленным как в позиционной системе счисления, так и в системе остаточных классов. В этом способе умножение сводится к последовательности сложений с накоплением, которые выполняются последовательно. При сдвигах множителя освободившиеся разряды заполняются нулями. Если первый бит m-разрядного множителя равен единице, то первое слагаемое является множимым, иначе первое слагаемое равно нулю. Если второй бит множителя равен единице, то второе слагаемое является множимым, сдвинутым на один разряд влево, иначе второе слагаемое равно нулю. К сумме первого и второго слагаемого прибавляется множимое, сдвинутое на два разряда влево, если второй бит множителя равен единице, иначе прибавляется нуль. Затем к полученной сумме прибавляется множимое, сдвинутое на три разряда влево, если третий бит множителя равен единице, иначе прибавляется нуль. И так далее до k-ого разряда множителя, к накопленной сумме прибавляется множимое, сдвинутое на k разрядов влево, если k-ый бит множителя равен единице, иначе прибавляется нуль. И так далее до m-ого разряда множителя, к накопленной сумме прибавляется множимое, сдвинутое на n разрядов влево, если m-ый бит множителя равен единице, иначе прибавляется нуль. В итоге накопленная сумма является искомым произведением сомножителей. Недостаток состоит, в том что, во-первых, при итерационном способе умножения чисел выполняется m-1 операций суммирования, а с учетом последовательного способа переносов в старшие разряды - количество тактов суммирования равно (m-1)*2*m. Во-вторых, процесс формирования суммы является последовательным процессом.
Техническим результатом от использования способа организации умножения чисел с плавающей запятой, представленных в системе остаточных классов, является повышение скорости вычисления за счет замены серии из m-1 арифметических операций сложения 2*(m-1) параллельно исполняемыми операциями подсчета количества единичных бит в разрядных срезах, формируемых из разрядов множимого. Данная операция выполняется параллельно для всех остатков по основаниям системы остаточных классов, формирующих сомножители. На основании анализа и модификации полученных значений сумм количества единиц во всех разрядных срезах выполняется формирование значения двоичного числа, являющегося значением искомого произведения. В результате количество тактов, необходимых для формирования значения суммы массива целых двоичных чисел - произведения, будет равно (log2m)*2*m тактов. Таким образом, предлагаемый способ обеспечивает выполнение операции формирования произведения быстрее известного итерационного способа в ((m-1)*2*m)/((log2m)*2*m)=(m-1)/log2m раз, например, при m=64 вычисления будут выполняться в 8 раз быстрее.
Описание работы устройства: каждый i-ый двоичный позиционный остаток по основанию pi можно представить в виде последовательности бит Ai(am, am-1, …, a2, a1), где m - разрядность остатка, i∈[1,n].
Происходит параллельная запись остатка по основанию p1 множимого в ячейки матрицы на элементах памяти, размерность матрицы составляет (2*m-1) столбцов и m строк, где m - разрядность первого основания системы остаточных классов. В ячейки с 1 по m первой строки матрицы записывается m-разрядный остаток по основанию pi множимого в том случае, когда первый разряд множителя равен единице, иначе записываются нули.
В ячейки с 2 по m+1 второй строки матрицы записывается m-разрядный остаток по основанию pi множимого в том случае, когда второй разряд множителя равен единице, иначе записываются нули.
И так далее, в ячейки с k по (m+k-1) k-ой строки матрицы записывается m-разрядный остаток по основанию p1 множимого в том случае, когда k-ый разряд множителя равен единице, иначе записываются нули.
И так далее, в ячейки с m по (2*m-1) второй строки матрицы записывается поразрядный остаток по основанию p1 множимого в том случае, когда m-ый разряд множителя равен единице, иначе записываются нули.
Во все остальные ячейки матрицы записываются нули, в общем виде размещение множимого в ячейках матрицы на элементах памяти выглядит следующим образом:
Затем производится параллельный подсчет количества единиц в 2*m-1 двоичных векторах, являющихся столбцами приведенной выше матрицы. В результате формируется 2*m-1 двоичных чисел bi - значений количества единиц в соответствующих m-разрядных векторах, где i∈[1,2*m-1].
В результате параллельного подсчета количества единиц в (2*m-1) столбцах матрицы формируется (2*m-1) двоичных чисел - значений количества единиц в соответствующих m-разрядных столбцах матрицы, причем, первое двоичное число b1 - значение количества единиц в первом m-разрядном столбце матрицы, второе двоичное число b2 - значение количества единиц во втором m-разрядном столбце матрицы, k-ое двоичное число bk - значение количества единиц в k-ом m-разрядном столбце матрицы, …, m-ое двоичное число b2*m-1 - значение количества единиц в (2*m-1)-ом m-разрядном столбце матрицы.
Младший разряд числа b1 является первым разрядом s1 произведения m-разрядных остатков по основанию p1 исходных чисел;
затем выполняется сдвиг двоичного числа b1 на один разряд вправо, после чего полученный результат суммируется с числом b2, где младший разряд полученной суммы
затем выполняется сдвиг двоичного числа
И так далее вычисления продолжаются аналогичным образом до вычисления суммы
Затем выполняется сдвиг двоичного числа
И так далее вычисления продолжаются аналогичным образом до вычисления суммы
Выполняется сдвиг двоичного числа
В итоге будет сформировано произведение m-разрядных остатков по основанию p1 исходных чисел - число s1, s2, …, sk, …, s2*m.
Одновременно с вычислением произведения m-разрядных остатков исходных чисел по основанию p1 аналогичным образом вычисляются произведения m-разрядных остатков исходных чисел по основаниям p2, p3, …, pk, …, pn.
Одновременно с вычислением произведения m-разрядных остатков суммируются порядки сомножимых, полученная сумма является порядком искомого произведения.
Пример: необходимо умножить два бинарных трехбитных (m=3) операнда: множимое a1=111, множитель a2=101 по основанию p=10001. Запишем их в виде матрицы размерностью m=3 строк и 2*m-1=5 столбцов, в ячейки с 1 по m=3 первой строки записывается множимое, так как первый бит множимого равен единице. В ячейки с 2 по m+1=4 второй строки записываются нули, так как второй бит множимого равен нулю. В ячейки с 3 по 2*m-1=5 третьей строки записывается множимое, так как третий бит множителя равен единице. Во все остальные ячейки матрицы записываются нули:
Затем параллельно подсчитывается число единиц в столбцах матрицы: b1=001, b2=001, b3=010, b4=001, b5=001. Так как младший бит b1 равен единице, то бит результата s1=1.
Число b1 сдвигается на один разряд вправо и результат сдвига
Число
Число
Число
Число
Если принять за время сложения пары m-разрядных остатков m тактов работы устройства, то время вычисления произведения в устройстве на базе описанного способа равно р*2*m тактов, где p=log2m, в то время как время умножения итерационным способом равно 2*(m-1)*m тактов. Таким образом, быстродействие устройства на базе описанного способа в (m-1)/log2m раз выше по сравнению с быстродействием устройства на базе известного итерационного способа умножения.
Примером построения устройства на базе способа организации умножения чисел с плавающей запятой, представленных в системе остаточных классов, может служить ее программирование на программируемых логических интегральных схемах (ПЛИС).
На фиг.1 представлен вариант структурной схемы устройства, реализующего операцию вычисления произведения остатков по основанию в общем виде, где 1 - счетчик единичный бит в двоичных векторах, 2 - р-разрядный двухплечевой сумматор, где p=log2n, 3 - сдвиговый р-разрядный регистр, a1-an - m-разрядные информационные входы схемы, s1-sm - одноразрядные информационные выходы схемы, b1-bm - р-разрядные выходы счетчиков 1,
На фиг.2 представлен вариант структурной схемы матрицы на элементах памяти для трехбитного остатка (m=3), где 1 - логический элемент И, 2 - информационный триггер с одним входом данных, одним входом синхронизации и одним выходом данных, 3 - информационный вход триггера, 4 - вход синхронизации триггера, 5 - информационный выход триггера, x1-х3 - входы схемы, на которые подается остаток множимого по трехбитному основанию, y1-y3 - входы схемы, на которые подается остаток множителя по трехбитному основанию, ai,j - выходы матрицы на элементах памяти.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ ОРГАНИЗАЦИИ УМНОЖЕНИЯ ЧИСЕЛ С ПЛАВАЮЩЕЙ ЗАПЯТОЙ, ПРЕДСТАВЛЕННЫХ В СИСТЕМЕ ОСТАТОЧНЫХ КЛАССОВ | 2012 |
|
RU2485574C1 |
СПОСОБ ДЕЛЕНИЯ ЦЕЛЫХ ДВОИЧНЫХ ЧИСЕЛ БЕЗ ОСТАТКА НАЧИНАЯ С МЛАДШИХ РАЗРЯДОВ | 2012 |
|
RU2498393C1 |
СПОСОБ ОРГАНИЗАЦИИ ВЫПОЛНЕНИЯ ОПЕРАЦИИ УМНОЖЕНИЯ ДВУХ ЧИСЕЛ В МОДУЛЯРНО-ПОЗИЦИОННОМ ФОРМАТЕ ПРЕДСТАВЛЕНИЯ С ПЛАВАЮЩЕЙ ТОЧКОЙ НА УНИВЕРСАЛЬНЫХ МНОГОЯДЕРНЫХ ПРОЦЕССОРАХ | 2012 |
|
RU2509345C1 |
Способ организации выполнения операции умножения двух чисел в модулярно-индексном формате представления с плавающей точкой на универсальных многоядерных процессорах | 2017 |
|
RU2652460C1 |
Матричное устройство для умножения чисел (его варианты) | 1983 |
|
SU1160398A1 |
СПОСОБ ОРГАНИЗАЦИИ ВЫЧИСЛЕНИЙ СУММЫ N M-РАЗРЯДНЫХ ЧИСЕЛ | 2011 |
|
RU2491612C1 |
Матричное устройство для умножения чисел по модулю 2 @ -1 | 1985 |
|
SU1254471A1 |
Устройство для умножения чисел с плавающей запятой | 1985 |
|
SU1280624A1 |
Матричное вычислительное устройство | 1988 |
|
SU1541599A1 |
Матричное устройство для умножения двоичных и десятичных чисел | 1983 |
|
SU1200282A1 |
Изобретение относится к вычислительной технике и предназначено для построения быстродействующих параллельно-конвейерных умножителей. Техническим результатом является повышение скорости вычисления. Способ содержит этапы: осуществляют параллельную запись остатка по основанию p1 множимого в элементы памяти, параллельно выполняют подсчет количества единиц bi в каждом столбце i-ой матрицы, сдвигают двоичное число b1 на один разряд вправо, суммируют с числом b2, полученную сумму
Способ организации умножения двоичных чисел с плавающей запятой, представленных в системе остаточных классов по основаниям p1, p2, …, pk, …, pn, заключающийся в том, что в умножающем устройстве:
происходит параллельная запись остатка по основанию p1 множимого в ячейки матрицы на элементах памяти, размерность матрицы составляет (2·m-1) столбцов и m строк, где m - разрядность первого основания системы остаточных классов, причем
в ячейки с 1 по m первой строки матрицы записывается m-разрядный остаток по основанию p1 множимого в том случае, когда первый разряд множителя равен единице, иначе записываются нули,
в ячейки с 2 по m+1 второй строки матрицы записывается m-разрядный остаток по основанию p1 множимого в том случае, когда второй разряд множителя равен единице, иначе записываются нули, …,
в ячейки с k по (m+k-1) k-й строки матрицы записывается m-разрядный остаток по основанию p1 множимого в том случае, когда k-й разряд множителя равен единице, иначе записываются нули, …,
в ячейки с m по (2·m-1) m-й строки матрицы записывается m-разрядный остаток по основанию p1 множимого в том случае, когда n-й разряд множителя равен единице, иначе записываются нули,
во все остальные ячейки матрицы записываются нули,
затем параллельно выполняется подсчет количества единиц в первом столбце матрицы, втором столбце матрицы, …, k-м столбце матрицы, …, (2·m-1)-м столбце матрицы; в результате параллельного подсчета количества единиц в (2·m-1) столбцах матрицы формируется (2·m-1) двоичных чисел - значений количества единиц в соответствующих m-разрядных столбцах матрицы, причем первое двоичное число b1 - значение количества единиц в первом m-разрядном столбце матрицы, второе двоичное число b2 - значение количества единиц во втором m-разрядном столбце матрицы, …, k-е двоичное число bk - значение количества единиц в k-м m-разрядном столбце матрицы, …, m-е двоичное число b2·m-1 - значение количества единиц в (2·m-1)-м m-разрядном столбце матрицы;
младший разряд числа b
1
является первым разрядом s
1
произведения m-разрядных остатков по основанию p
1
исходных чисел;
затем выполняется сдвиг двоичного числа b
1
на один разряд вправо, после чего полученный результат суммируется с числом b2, где младший разряд полученной суммы
затем выполняется сдвиг двоичного числа
и так далее вычисления продолжаются аналогичным образом до вычисления суммы
затем выполняется сдвиг двоичного числа
и так далее вычисления продолжаются аналогичным образом до вычисления суммы
затем выполняется сдвиг двоичного числа
в итоге будет сформировано произведение m-разрядных остатков по основанию
p1 исходных чисел - число s1, s2, …, sk, …, S2·m;
в том случае, если s больше p
1
, производится коррекция полученного произведения s, для невыхода за пределы основания, путем последовательного вычитания из s основания p
1
до тех пор, пока s не станет меньше p
1
, иначе коррекция не производится,
одновременно с вычислением и коррекцией произведения m-разрядных остатков исходных чисел по основанию p
1
аналогичным образом вычисляются и корректируются произведения m-разрядных остатков исходных чисел по основаниям p2, p3, …, pk, …, pn;
одновременно с вычислением произведения m-разрядных остатков суммируются порядки сомножимых, полученная сумма является порядком искомого произведения.
УСТРОЙСТВО ДЛЯ УМНОЖЕНИЯ S-ИЧНЫХ ЦИФР В ПОЗИЦИОННО-ОСТАТОЧНОЙ СИСТЕМЕ СЧИСЛЕНИЯ | 1991 |
|
RU2006919C1 |
УСТРОЙСТВО ДЛЯ УМНОЖЕНИЯ ЧИСЕЛ ПО ПРОИЗВОЛЬНОМУ МОДУЛЮ | 2006 |
|
RU2316042C1 |
Устройство для умножения чисел с плавающей запятой | 1985 |
|
SU1280624A1 |
US 2011231465 А1, 22.09.2011 | |||
US 2006184600 А1, 17.08.2006 | |||
Машина для разделения сыпучих материалов и размещения их в приемники | 0 |
|
SU82A1 |
Авторы
Даты
2013-11-27—Публикация
2012-07-27—Подача