Параллельное VS последовательное вычисление

12K

24 октября 2007 года

37 / / 31.03.2006

Предлагаю такую тему. Необходимо опытным путем выяснить границу, после которой параллельное вычисление окажется эффективнее последовательного (она скорее всего должна быть, так как в случае простых задач расходы на создание потоков не окупаются).
Собсно такую задачку мне и задал препод...

В качестве задания предложено использовать перемножение матрицы A (размера MxN) на вектор B (M). На выходе получится матрица C (размер N), где C(i)=A(i,1)*B(i)+...+A(i,n)*B(i). Кстати N возьмем 10.

Мое видение работы программы такое: в главном цикле последовательно, затем параллельно обрабатываются задания. Задания (матрицы A и B) хранятся в бинарных файлах, откуда перед обработкой считываются в дин. массивы. Задания по сложности варьируются от 100х10 до 5000100х10 с шагом 500000 - итого 10 штук.
Но файл 5000100х10 весит около 210 Метров, корректно ли его считывать в оперативную память (ее 256 Мб)?

Так вот, с последовательным все понятно, суть параллельного - создать 10 потоков, каждый из них посчитает i-й элемент C.
Самое главное, что нужно измерить время, само собой не в секундах :), а учитывая "сложность" задачи - даже не в миллисекундах. Я решил измерять в процессорных тактах (через функцию RDTSC).

Сразу вопрос: если выполнять RDTSC на разных машинах (по производительности), то результаты будут сильно отличаться друг от друга, если да то насколько эффективен такой метод подсчета времени выполнения вычисления?

Ниже приведен кусок моего кода, посвященный параллельной обработке. Есть ли какие замечания к подобной реализации? Обратите внимание на начальный и конечный временные штампы. Как их следует расставить, чтобы условия эксперимента были "максимально чистыми"?. На сколько я понял, полное время подсчета одного задания 10 тредами рассчитывается исходя из конечного штампа последнего (штампы снимаются для каждого и сохраняются в MemoryStream).

Свернуть исходник

Код:

...

{ TDynThread - наследуем от TThread }

constructor TDynThread.Create(Num:byte);

begin

  FNum:=Num;  {Номер нити}

  Inherited Create(false);

  Priority:=tpHighest;

end;

procedure TDynThread.Execute;

var

  j:LongWord;

begin

  for j:=0 to D-1 do

    c[FNum]:=c[FNum]+Arr.a[j,FNum]*Arr.b[j];

end;

procedure TDynThread.DoTerminate;

begin

  CounterGuard.Acquire; {вход в критическую секцию}

  TimeEnd:=DM.RDTSC; {!!Конечный штамп!!}

  MemoryStream.Write(TimeEnd,SizeOf(Comp)); {сохраняем}

  dec(ActiveThreads); {-1 тред}

  if ActiveThreads=0 then

    Finished.SetEvent; {если закончен последний то сигналим главному процессу}

  CounterGuard.Release; {выход из критической секции}

end;

...

procedure TForm1.ExecParallel;

  {Выполнить параллельно}

var

  i:byte;

begin

  if ActiveThreads>0 then

    raise Exception.Create('...');

  for i:=1 to 10 do

    C:=0; {обнуляем C}

  MemoryStream.Clear; {чистим MemoryStream}

  ActiveThreads:=10;

  Finished.ResetEvent;

  TimeBeg:=DM.RDTSC; {!!Начальный штамп!!}

  for i:=1 to 10 do

    TDynThread.Create(i); {Создаем 10 тредов}

  if Finished.WaitFor(20000) <> wrSignaled then {Ждем завешения всех 10}

    raise Exception.Create('...');

end;

...

Подписаться на вопросНеобходима регистрация

Ваш аккаунт

Последние темы форума

Почтовая рассылка

Параллельное VS последовательное вычисление

23 ответа