Цитата:
А почему 2 АЛУ?
Это я пример со своего компьютера списал. Сколько есть столько и написал.
Цитата:
Т.е получается 48 а на тесте 15.5? Значит не очнь хор. тест.
48 это идеальный случай много не учтено. Так как неизвестно точно сколько тактов занимает инструкции умножения и сложения для того xenon я не нашел. Обычно для идеального случая берут 1. Хотя может оказаться что 2.
А возможно это просто штраф за чтение из памяти.
Так как в компьютерной технике производительность растет не ленельно, а экспоненциально то разница в 3 раза не такая внушительная.
GTX280 теор 936 GFLOPS реально 250 GFLOPS
1296 МГц*240 процессоров*3 арифметические операции за такт(MADD+MUL)=933,12.
То что тут называется процессорами на самом деле ALU. Шедерных блоков если не ошибаюсь 48 и каждый состоит из 5 АЛУ. Каждое 5 алу специализированное.
Но на практике в большинстве случаев не реально задействовать две инструкции. Так что берем только
MADD это умножение со сложением
1296 МГц*240 процессоров*2=622,08
Цитата:
А производительность алгоритма я правильно подсчитал?
Правильно.
Флопсы они еще те попугаи.