Toplu işlem - Collective operation

Toplu işlemler sıklıkla kullanılan etkileşim kalıpları için yapı taşlarıdır SPMD algoritmalar paralel programlama bağlam. Dolayısıyla bu işlemlerin verimli bir şekilde gerçekleştirilmesine ilgi vardır.

Toplu işlemlerin gerçekleştirilmesi, Mesaj Geçiş Arayüzü[1] (MPI).

Tanımlar

Tüm asimptotik çalışma zamanı işlevlerinde, gecikmeyi gösteririz , kelime başına iletişim maliyeti , işlem birimlerinin sayısı ve düğüm başına giriş boyutu . Birden fazla düğümde ilk mesajlarımızın olduğu durumlarda, tüm yerel mesajların aynı boyutta olduğunu varsayıyoruz. Kullandığımız bireysel işleme birimlerine hitap etmek için .

Eşit bir dağılıma sahip değilsek, yani düğüm boyutunda bir mesajı var , ayarlayarak çalışma zamanı için bir üst sınır elde ederiz .

Bir dağıtılmış bellek modeli varsayılmaktadır. Kavramlar için benzer paylaşılan hafıza modeli. Ancak, paylaşılan bellek sistemleri, yayın gibi bazı işlemler için donanım desteği sağlayabilir (§ Yayın yapmak ) örneğin, uygun eşzamanlı okumaya izin veren.[2] Böylece yeni algoritmik olasılıklar kullanılabilir hale gelebilir.

Yayın yapmak [3]

Solda dikey olarak hizalanmış üç kare ve sağda dikey olarak hizalanmış üç kare vardır. Noktalı bir çizgi sol üst ve sağ yüksek kareyi birleştirir. İki düz çizgi sol yüksek kare ile orta ve düşük sağ kare arasında bağlantı kurar. A harfi sol yüksek kareye ve tüm sağdaki karelere yazılır.
Üç düğümde gerçekleştirilen Yayın işleminin bilgi akışı.

Yayın modeli, verileri bir işlem biriminden tüm işleme birimlerine dağıtmak için kullanılır ve bu genellikle SPMD girdi veya global değerleri dağıtmak için paralel programlar. Yayın, azaltma modelinin ters bir versiyonu olarak yorumlanabilir (§ Azaltın ). Başlangıçta sadece kök ile mesajı depolar . Yayın sırasında kalan işleme birimlerine gönderilir, böylece sonunda tüm işleme birimlerinde mevcuttur.

Sıralı bir döngü aracılığıyla bir uygulama yinelemeler bir darboğaz haline gelir, böl ve yönet yaklaşımları yaygındır. Bir olasılık, bir iki terimli ağaç yapısının kullanılmasıdır. ikinin gücü olmalı. İşlem birimi göndermekten sorumlu olduğunda işlem birimlerine , gönderir işlem birimine ve işleme birimlerinin sorumluluğunu devreder kendi sorumluluğu kesilirken ona .

Binom ağaçlarının uzun mesajlarla ilgili bir sorunu var . Alıcı birimi mesajı yalnızca tüm mesajı aldıktan sonra diğer birimlere yayabilir. Bu arada iletişim ağı kullanılmamaktadır. Bu nedenle ardışık düzen ikili ağaçlar nerede kullanılır bir diziye bölünür boyut paketleri . Paketler daha sonra birbiri ardına yayınlanır, böylece veri iletişim ağında hızlı bir şekilde dağıtılır.

Dengeli olarak ardışık düzenlenmiş yayın ikili ağaç mümkündür .


Azalt [4]

Solda dikey olarak hizalanmış üç kare ve sağda dikey olarak hizalanmış üç kare vardır. İki sütun arasına içinde f harfi olan bir daire yerleştirilir. Üç düz çizgi, daireyi soldaki üç kareye bağlar. Düz bir çizgi, çemberi ve sağ üst kareyi birleştirir. Yukarıdan aşağıya doğru sol karelere a, b ve c harfleri yazılır. Alfa harfi sağ üst kareye yazılır.
Üç düğümde gerçekleştirilen Azaltma işleminin bilgi akışı. f birleştirici operatördür ve α indirgemenin sonucudur.

Azaltma modeli, farklı işleme birimlerinden veri veya kısmi sonuçlar toplamak ve bunları seçilen bir operatör tarafından global bir sonuçta birleştirmek için kullanılır. İndirgeme, yayının ters bir versiyonu olarak görülebilir (§ Yayın yapmak ). Verilen işlem birimleri, mesaj işlem biriminde başlangıçta. Herşey tarafından toplanır ve sonuç sonunda şurada saklanır: . İndirgeme operatörü en azından çağrışımlı olmalıdır. Bazı algoritmalar, nötr öğeli bir değişmeli operatör gerektirir. Operatörler beğenir , , yaygındır.

Azaltma ters yayın olarak yorumlanabildiğinden, eşit uygulama hususları geçerlidir (§ Yayın yapmak ). Ardışık düzen için ikili ağaçlar mesaj bileşen bazlı indirgeme için daha küçük bir nesnenin vektörü olarak gösterilebilir olmalıdır.

Dengeli bir şekilde boru hatlı azaltma ikili ağaç mümkündür .

Tümü Azalt [5]

Solda dikey olarak hizalanmış üç kare ve sağda dikey olarak hizalanmış üç kare vardır. İki sütun arasına içinde f harfi olan bir daire yerleştirilir. Üç düz çizgi, daireyi soldaki üç kareye bağlar. Düz bir çizgi, çemberi ve sağ üst kareyi birleştirir. Yukarıdan aşağıya doğru sol karelere a, b ve c harfleri yazılır. Alfa harfi sağ üst kareye yazılır.
Üç düğümde gerçekleştirilen All-Reduce işleminin bilgi akışı. f birleştirici operatördür ve α indirgemenin sonucudur.

Bir küçültme işleminin sonucu ise, tümü azaltma modeli kullanılır (§ Azaltın ) tüm işleme birimlerine dağıtılmalıdır. Verilen işlem birimleri, mesaj işlem biriminde başlangıçta. Herşey bir operatör tarafından toplanır ve sonuç sonunda hepsinde saklanır . Azaltma işlemine analog, operatör en azından çağrışımlı olmalıdır.

Tüm azaltma, sonraki bir yayınla yapılan bir azaltma işlemi olarak yorumlanabilir (§ Yayın yapmak ). Uzun mesajlar için karşılık gelen bir uygulama uygundur, oysa kısa mesajlar için gecikme, bir hiperküp (Hypercube (iletişim modeli) § All-Gather / All-Reduce ) topoloji, eğer ikinin gücüdür.

Tüm azaltma mümkündür azaltma ve yayınlama mümkün olduğu için Dengeli boru hattı ile ikili ağaçlar.

Önek-Toplam / Tarama [6]

Solda dikey olarak hizalanmış üç kare ve sağda dikey olarak hizalanmış üç dikdörtgen vardır. İçinde kelime taraması olan bir daire iki sütun arasına yerleştirilir. Üç düz çizgi, daireyi soldaki üç kareye bağlar. Üç düz çizgi, daireyi sağdaki üç kareye bağlar. Yukarıdan aşağıya doğru sol karelere a, b ve c harfleri yazılır. Sağ yüksek karede a harfi yazılır. Sağ ortadaki karede a artı b terimi yazılır. Sağ alttaki karede a artı b artı c terimi yazılır.
Üç düğümde gerçekleştirilen Önek-Toplam / Tarama işleminin bilgi akışı. + Operatörü herhangi bir ilişkilendirici operatör olabilir.

Önek toplamı veya tarama işlemi, farklı işleme birimlerinden veri veya kısmi sonuçlar toplamak ve bu işleme birimlerinde depolanan bir operatör tarafından ara sonuçları hesaplamak için kullanılır. İndirgeme işleminin bir genellemesi olarak görülebilir (§ Azaltın ). Verilen işlem birimleri, mesaj işlem biriminde . Operatör en azından ilişkilendirilebilir olmalıdır, oysa bazı algoritmalar aynı zamanda bir değişmeli operatör ve bir nötr öğe gerektirir. Ortak operatörler , ve . Sonunda işleme birimi önek toplamını depolar . Sözde münhasır önek toplamı durumunda, işlem birimi önek toplamını depolar . Bazı algoritmalar, önek toplamlarına ek olarak her işlem biriminde genel toplamı depolamayı gerektirir.

Kısa mesajlar için bu, bir hiperküp topolojisi ile sağlanabilir, eğer ikinin gücüdür. Uzun mesajlar için hiperküp (Hypercube (iletişim modeli) § Önek toplamı, Önek toplamı § Dağıtılmış bellek: Hypercube algoritması ) topoloji uygun değildir, çünkü tüm işleme birimleri her adımda aktiftir ve bu nedenle boru hatları kullanılamaz. Bir ikili ağaç topoloji keyfi için daha uygundur ve uzun mesajlar (Önek toplamı § Büyük Mesaj Boyutları: Ardışık Düzenlenmiş İkili Ağaç ).

Bir ikili ağaçta önek toplamı, yukarı ve aşağı doğru bir aşamayla uygulanabilir. Yukarı doğru faz indirgeme yapılırken, aşağı doğru faz ise yayına benzer, burada önek toplamları sol ve sağ çocuklara farklı veriler gönderilerek hesaplanır. Bu yaklaşımla boru hattı oluşturma mümkündür, çünkü işlemler azaltmaya eşittir (§ Azaltın ) ve yayın (§ Yayın yapmak ).

İkili ağaçta ardışık düzenlenmiş önek toplamı, .

Bariyer [7]

Kolektif bir işlem olarak engel, bir kavramın genellemesidir. bariyer, dağıtılmış hesaplamada kullanılabilir. Bir işlem birimi engel çağırdığında, diğer tüm işlem birimleri de engel çağırana kadar bekler. Engel, bu nedenle dağıtılmış hesaplamada küresel senkronizasyonu sağlamak için kullanılır.

Bariyeri uygulamanın bir yolu, tümü azalt§ Tümünü Azalt ) boş / sahte bir işlenen ile. All-fall'nin çalışma zamanının . Sahte işlenen kullanmak boyutu küçültür sabit bir faktöre ve bir çalışma süresine yol açar .

Topla [8]

Solda dikey olarak hizalanmış üç kare ve sağda dikey olarak hizalanmış üç dikdörtgen vardır. Noktalı bir çizgi, sol yüksek kareyi sağ yüksek dikdörtgene bağlar. İki düz çizgi, orta ve düşük sol kareleri sağ yüksek dikdörtgene bağlar. Yukarıdan aşağıya doğru sol karelere a, b ve c harfleri yazılır. A, b ve c harfleri sağ üstteki dikdörtgene arka arkaya yazılır.
Üç düğümde gerçekleştirilen Toplama işleminin bilgi akışı.

Toplama iletişim modeli, tüm işleme birimlerinden gelen verileri tek bir işlem biriminde depolamak için kullanılır. Verilen işlem birimleri, mesaj işlem biriminde . Sabit bir işlem birimi için mesajı saklamak istiyoruz açık . Toplama, bir azaltma işlemi olarak düşünülebilir (§ Azaltın ) bitiştirme operatörünü kullanan. Bu, birleştirme işleminin ilişkisel olması nedeniyle çalışır. Aynı binom ağaç azaltma algoritmasını kullanarak bir çalışma zamanı elde ederiz. . Asimptotik çalışma zamanının, indirgeme işleminin asimptotik çalışma zamanına benzer olduğunu görüyoruz. , ancak terime bir p faktörü eklenmesiyle . Bu ek faktör, mesajlar birleştirildikçe her adımda artan mesaj boyutundan kaynaklanmaktadır. Aşağıdaki gibi operatörler için mesaj boyutunun sabit olduğu durumu azaltmak için bunu karşılaştırın .

All-Topla [8]

Solda dikey olarak hizalanmış üç kare ve sağda dikey olarak hizalanmış üç dikdörtgen vardır. Üç noktalı çizgi sol yüksek kareyi yüksek sağ dikdörtgene, orta sol kareyi orta sağ dikdörtgene ve sol alt kareyi sağ alçak dikdörtgenle birleştirir. İki düz çizgi, orta ve düşük sol kareleri sağ yüksek dikdörtgene bağlar. İki düz çizgi, sol üst ve alt kareleri orta sağ dikdörtgene bağlar. İki düz çizgi, sol üst ve orta kareleri sağ alt dikdörtgene bağlar. Yukarıdan aşağıya doğru sol karelere a, b ve c harfleri yazılır. A, b ve c harfleri, arka arkaya tüm dikdörtgenlerde yazılmıştır.
Üç düğümde gerçekleştirilen All-Gather işleminin bilgi akışı.

Hepsi bir arada iletişim modeli, tüm işleme birimlerinden veri toplamak ve toplanan verileri tüm işleme birimlerinde depolamak için kullanılır. Verilen işleme birimleri , İleti başlangıçta depolandı mesajı saklamak istiyoruz her birinde .

Çeşitli şekillerde düşünülebilir. Birincisi, tamamen azaltma işlemidir (§ Tümünü Azalt ) işleç olarak bitiştirme ile, aynı şekilde toplama azaltma ile temsil edilebilir. İkincisi, bir toplama operasyonu ve ardından yeni boyuttaki mesajın yayınlanmasıdır. . Bununla hepsinin bir araya geldiğini görüyoruz mümkün.

Dağılım [9]

Solda dikey olarak hizalanmış üç dikdörtgen ve sağda dikey olarak hizalanmış üç kare vardır. Noktalı bir çizgi, sol yüksek dikdörtgeni yüksek sağ kare ile birleştirir. İki düz çizgi sol yüksek dikdörtgeni orta ve düşük sağ karelere bağlar. Sol üstteki dikdörtgende c, b ve a harfleri arka arkaya yazılır. A, b ve c harfleri yukarıdan aşağıya doğru sağdaki karelere yazılır.
Üç düğümde gerçekleştirilen Scatter işleminin bilgi akışı.

Dağılım iletişim modeli, verileri bir işlem biriminden tüm işlem birimlerine dağıtmak için kullanılır. Tüm işlem birimlerine aynı mesajı göndermemesi açısından yayından farklıdır. Bunun yerine, mesajı böler ve her işlem birimine bir bölümünü iletir.

Verilen işleme birimleri sabit bir işlem birimi mesajı tutan . Mesajı taşımak istiyoruz üstüne . Toplama ile aynı uygulama endişeleri (§ Toplayın ) uygulamak. Bu, optimum çalışma süresine yol açar .

Hepsi bir arada [10]

Hepsi bir arada, en genel iletişim modelidir. İçin , İleti başlangıçta düğümde depolanan mesajdır ve düğüme teslim edilmesi gerekiyor . Operatör kullanmayan tüm iletişim ilkellerini herkese açık olarak ifade edebiliriz. Örneğin, mesaj yayını düğümden ayarlanarak taklit edilir için ve ayar boş .

Tamamen bağlı bir ağımız olduğunu varsayarsak, herkes için mümkün olan en iyi çalışma zamanı . Bu, aracılığıyla elde edilir doğrudan mesaj alışverişi. İçin iletişim turunda 2'nin gücü , düğüm düğüm ile mesaj alışverişi yapar .

Mesaj boyutu küçükse ve iletişimde gecikme hâkimse, mesajları zamanında dağıtmak için bir hiper küp algoritması kullanılabilir. .

Solda dikey olarak hizalanmış üç dikdörtgen ve sağda dikey olarak hizalanmış üç dikdörtgen vardır. Dikdörtgenler geniş olarak üç kat daha yüksektir. A1, a2 ve a3 terimleri sol yüksek dikdörtgende birbirinin altına yazılmıştır. B1, b2 ve b3 terimleri sol ortadaki dikdörtgende üst üste yazılmıştır. C1, c2 ve c3 terimleri sol alttaki dikdörtgende birbirinin altına yazılmıştır. A1, b1 ve c1 terimleri sağ üst dikdörtgende birbirinin altına yazılmıştır. A2, b2 ve c2 terimleri sağ ortadaki dikdörtgende üst üste yazılmıştır. A3, b3 ve c3 terimleri sağ alttaki dikdörtgende birbirinin altına yazılmıştır. Noktalı bir çizgi sol yüksek dikdörtgenden a1'i ve sağ yüksek dikdörtgenden a1'i birbirine bağlar. Noktalı bir çizgi, orta sol dikdörtgenden b2'yi ve orta sağ dikdörtgenden b2'yi birbirine bağlar. Noktalı bir çizgi sol alt dikdörtgenden c3'ü ve sağ alt dikdörtgenden c3'ü birbirine bağlar. Düz çizgiler, sol ve sağ dikdörtgenler arasında karşılık gelen diğer terimleri birleştirir.
Üç düğümde gerçekleştirilen Hepsi Bir Arada işleminin bilgi akışı. Harfler düğümleri belirtir ve sayılar bilgi öğelerini belirtir.

Çalışma Zamanına Genel Bakış [11]

Bu tablo, özgürce ağ topolojisine sahip olduğumuzu varsayarak, en iyi bilinen asimptotik çalışma zamanlarına genel bir bakış sunar.

Optimum çalışma süresi için istediğimiz örnek topolojiler şunlardır: ikili ağaç iki terimli ağaç hiperküp.

Pratikte, mevcut fiziksel topolojilere uyum sağlamalıyız, örn. yusufçuk, şişman ağaç, ızgara ağı (diğer topolojilere de başvurur).

Altında daha fazla bilgi Ağ topolojisi.

Her işlem için en uygun algoritma giriş boyutlarına bağlı olabilir . Örneğin, kısa mesajlar için yayın en iyi iki terimli ağaç kullanılarak gerçekleştirilirken, uzun mesajlar için dengeli bir ikili ağaç üzerinde ardışık düzenlenmiş bir iletişim en uygunudur.

Tabloda belirtilen karmaşıklıklar gecikmeye bağlıdır ve kelime başına iletişim maliyeti işleme birimlerinin sayısına ek olarak ve düğüm başına giriş mesajı boyutu . # gönderen ve # alıcı sütunlar, sırasıyla işlemde yer alan gönderenlerin ve alıcıların sayısını temsil eder. # mesaj sütun giriş mesajlarının sayısını listeler ve Hesaplamalar? sütunu, mesajlar üzerinde herhangi bir hesaplama yapılıp yapılmadığını veya mesajların işlenmeden teslim edilip edilmediğini gösterir. Karmaşıklık serbest topoloji seçimi altında optimal bir uygulamanın asimptotik çalışma zamanı karmaşıklığını verir.

İsim# gönderen# alıcı# mesajHesaplamalar?Karmaşıklık
Yayın yapmakHayır
AzaltEvet
Tüm azaltEvet
Önek toplamıEvet
BariyerHayır
ToplaHayır
All-ToplaHayır
DağılımHayır
Hepsi Bir AradaHayır veya

Notlar

  1. ^ Intercommunicator Toplu İşlemleri. Mesaj Geçiş Arayüzü (MPI) standardı, bölüm 7.3.1. Matematik ve Bilgisayar Bilimleri Bölümü, Argonne Ulusal Laboratuvarı.
  2. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 395
  3. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 396-401
  4. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 402-403
  5. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 403-404
  6. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 404-406
  7. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 408
  8. ^ a b Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 412-413
  9. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 413
  10. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 413-418
  11. ^ Sanders, Mehlhorn, Dietzfelbinger, Dementiev 2019, s. 394

Referanslar

Sanders, Peter; Mehlhorn, Kurt; Dietzfelbinger, Martin; Dementiev, Roman (2019). Sıralı ve Paralel Algoritmalar ve Veri Yapıları - Temel Araç Kutusu. Springer Nature Switzerland AG. ISBN  978-3-030-25208-3.