Sloučit třídění

Sloučit animaci řazení

Objevitel nebo vynálezce	John von Neumann
Datum objevu	1945
Související problémy	Třídění podle srovnání ( en ) , stabilní třídicí algoritmus ( en )
Datové struktury	Algoritmus sloučení tabulky ( v )
Na začátku	Timsort

Časová složitost

Nejhorší případ	$O (n \ log n)$
Průměrný	$O (n \ log n)$
Nejlepší případ	$O (n \ log n)$

Složitost prostoru

Nejhorší případ	$My)$
Nejlepší případ	$O (1)$

V počítačové vědě je sloučení třídění nebo dichotomické třídění stabilním srovnávacím algoritmem třídění . Jeho časová složitost pro vstup velikosti n je řádově n log n , což je asymptoticky optimální. Toto třídění je založeno na algoritmické technice rozděl a panuj . Hlavní operací algoritmu je slučování , které spočívá ve spojení dvou seřazených seznamů do jednoho. Účinnost algoritmu vychází ze skutečnosti, že lze v lineárním čase sloučit dva seřazené seznamy.

Sloučené třídění je přirozeně popsáno na seznamech a na takových strukturách je nejjednodušší i nejrychlejší. Funguje to však také na polích . Jednodušší verze sloučeného řazení na tabulkách má efektivitu srovnatelnou s rychlým tříděním , ale nefunguje na místě : je zapotřebí další dočasná oblast dat, která má stejnou velikost jako položka (složitější verze mohou být provádí se na místě, ale jsou pomalejší). Na seznamech je jeho složitost optimální, lze jej implementovat velmi jednoduše a nevyžaduje kopii v dočasné paměti.

Intuice

Ze dvou seřazených seznamů lze snadno sestavit seřazený seznam obsahující prvky vyplývající z těchto dvou seznamů (jejich * fúze *). Princip tohoto algoritmu sloučení je založen na tomto pozorování: nejmenší prvek seznamu, který má být sestaven, je buď nejmenší prvek prvního seznamu, nebo nejmenší prvek druhého seznamu. Můžeme tedy vytvořit prvek seznamu po prvku odstraněním někdy prvního prvku prvního seznamu, někdy prvního prvku druhého seznamu (ve skutečnosti menšího ze dvou za předpokladu, že žádný ze dvou seznamů není prázdný., jinak je reakce okamžitá).

Tento proces se nazývá fúze a je jádrem třídicího algoritmu vyvinutého níže.

Algoritmus

Algoritmus je přirozeně popsán rekurzivně.

Pokud má pole pouze jednu položku, je již tříděno.
Jinak rozdělte tabulku na dvě zhruba stejné části.
Rekurzivně seřaďte dvě části pomocí algoritmu sloučení.
Sloučte dvě seřazená pole do jednoho seřazeného pole.

V pseudokódu:

entrée : un tableau T sortie : une permutation triée de T fonction triFusion(T[1, …, n]) si n ≤ 1 renvoyer T sinon renvoyer fusion(triFusion(T[1, …, n/2]), triFusion(T[n/2 + 1, …, n])) entrée : deux tableaux triés A et B sortie : un tableau trié qui contient exactement les éléments des tableaux A et B fonction fusion(A[1, …, a], B[1, …, b]) si A est le tableau vide renvoyer B si B est le tableau vide renvoyer A si A[1] ≤ B[1] renvoyer A[1] ⊕ fusion(A[2, …, a], B) sinon renvoyer B[1] ⊕ fusion(A, B[2, …, b])

Algoritmus končí, protože velikost pole, které má být tříděno, se v průběhu volání striktně snižuje. Sloučení A a B je tam, kde a je velikost A a b je velikost B. Sloučený druh pole T je kde n je velikost pole T. Symbol ⊕ zde označuje zřetězení obrazů. ${\ displaystyle O (a + b)}$ $O (n \ log n)$

Provádění na seznamech

Následující algoritmus je podrobný, takže je možné jej přeložit do jakéhokoli imperativního jazyka . Seznam k seřazení má velikost n . Pro stručnost a efektivitu algoritmu se předpokládá, že seznam, který má být seřazen, obsahuje alespoň 2 prvky a že:

buď je jednoduše zřetězený, ne kruhový a předchází mu kořenový odkaz p (mimo seznam, ale ukazuje na jeho první prvek);
buď je jednoduše připoutaný a kruhový;
nebo je dvojnásobně připoutaný a kruhový.

Ve všech případech je seznam seřazen po předání odkazu p jako parametru, tj. Následný odkaz p bude nejmenší v seznamu. Trochu méně stručné popisy, ale osvobozené od těchto strukturálních omezení, existují.

fonction trier(p, n) Q := n/2 (division entière) P := n-Q si P >= 2 q := trier(p, P) si Q >= 2 trier(q, Q) sinon q := p.suivant fin q := fusionner(p, P, q, Q) renvoyer q fin fonction fusionner(p, P, q, Q) pour i allant de 0 à taille(p)-1 faire si valeur(p.suivant) > valeur(q.suivant) déplacer le maillon q.suivant après le maillon p si Q = 1 quitter la boucle Q := Q-1 sinon si P = 1 tant que Q >= 1 q := q.suivant Q := Q-1 fin quitter la boucle fin P := P-1 fin p := p.suivant fin renvoyer q fin

Posun následujícího odkazu q. Po odkazu p vyžaduje dočasný ukazatel t . Pokud je seznam jednoduše zřetězený, pohyb se provádí touto výměnou odkazů:

t := q.suivant q.suivant := t.suivant t.suivant := p.suivant p.suivant := t

Pokud je seznam dvojnásobně zřetězený a kruhový, pohyb se provádí touto výměnou odkazů:

t := q.suivant q.suivant := t.suivant q.suivant.précédent := q t.précédent := p t.suivant := p.suivant p.suivant.précédent := t p.suivant := t

Takto popsaný algoritmus lze velmi snadno hybridizovat s jinými druhy. To se provádí přidáním podmínky na první řádek funkce řazení ( p , n ). Na malých dílčích seznamech má za úkol nahradit všechny operace, které následují, určitou kvadratickou složitostí, ale v praxi rychlejší. V následujícím lze potom podmínky P> = 2 a Q> = 2 odstranit.

Implementace na stolech

S tabulkami to můžeme třídit na místě nebo ne. Schematicky pak existují tři možnosti správy paměti:

Ošetření provádíme na místě. Začneme tříděním dvojic nebo trojic prvků na místě a potom sloučíme sousední seznamy dohromady na místě. Postup sloučení se pak použije na dílčí pole obsahující dva seznamy jeden za druhým. Chcete-li sloučit na místě, jednoduchá implementace posunutí prvního seznamu při vkládání jednoho nebo více prvků druhého je pomalá (podobně jako řazení typu vložení ). Existují i jiné rychlejší algoritmy, ale jsou komplikované a často nejsou stabilní (nedodržují předchozí pořadí). Podívejte se na externí odkaz níže.
Ošetření provádíme v polovině na místě. Začneme tříděním dvojic nebo trojic prvků na místě a poté sloučíme. Během sloučení vytvoříme kopii prvního seznamu v dočasné paměti (můžeme vytvořit kopii dvou seznamů, ale není to nutné). Už tedy nemusíme přesouvat data, jednoduše zkopírujeme prvek z prvního seznamu (z dočasné paměti) nebo z druhého seznamu (který je udržován na místě). Toto řešení je rychlejší (rychlejší než hromadné řazení, ale pomalejší než rychlé řazení ).
K řazení používáme dočasnou zónu stejné velikosti jako pole. Poté můžeme sloučit jednu z tabulek do druhé. Třídění jednoho prvku pak znamená jeho kopírování z jedné tabulky do druhé, třídění dvou prvků znamená jejich kopírování příčně nebo ne atd. Tentokrát během slučování, když kopírujeme první prvek prvního seznamu nebo druhého, nepotřebujeme přesouvat data ani kopírovat první seznam. Toto řešení má složitost srovnatelnou s rychlým tříděním , aniž by mělo nevýhodu kvadratického nejhoršího případu. Toto sloučení vytvoří více kopií než rychlé řazení, ale provede méně srovnání.

Vlastnosti

Počet požadovaných srovnání je řádově . $n \ log n$
Požadované místo v paměti je v O (n), pokud neotočíte prvky.

Možné optimalizace

Pokud jde o využití paměti:
- Použitou paměť lze omezit na n / 2 prvků zkopírováním pouze prvního ze dvou seznamů, které mají být sloučeny, do dočasné paměti;
- Použitou paměť můžete omezit na O (1) nekopírováním prvků. Můžete je sloučit otočením prvků, které jdou od středu prvního seznamu do středu druhého.
Pokud jde o rychlost provádění:
- Rychlost kopírování z jednoho pole do druhého můžete dosáhnout při použití dočasného pole pouze velikosti n / 2. Nechť A je první a B druhá polovina pole k řazení a C dočasné pole velikosti n / 2. Třídíme kopírováním prvků mezi A a C, poté mezi A a B. Nakonec sloučíme seznamy získané v B a C do celého pole AB.

Příklad

Sloučit provoz

Sloučit [1; 2; 5] a [3; 4]: první prvek sloučeného seznamu bude prvním prvkem jednoho ze dvou vstupních seznamů (buď 1 nebo 3), protože jde o seřazené seznamy.

Srovnání 1 a 3: 1 je menší
- [2; 5] - [3; 4] → [1]
Srovnání 2 a 3: 2 je menší
- [5] - [3; 4] → [1; 2]
Porovnání 5 a 3 → 3 je menší
- [5] - [4] → [1; 2; 3]
Srovnání 5 a 4: 4 je menší
- [5] → [1; 2; 3; 4]
Výsledek fúze:
- [1; 2; 3; 4; 5]

Třídění, kompletní postup

Pojďme si projít následující volání tri_fusion([6, 1, 2, 5, 4, 7, 3]) :

tri_fusion([6, 1, 2, 5, 4, 7, 3]) [6, 1, 2, 5] [4, 7, 3] tri_fusion([6, 1, 2, 5]) [6, 1] [2, 5] tri_fusion([6, 1]) [6] [1] tri_fusion([6]) --> [6] tri_fusion([1]) --> [1] '''fusion''' de [6] et [1] : [1, 6] --> [1, 6] tri_fusion([2, 5]) [2] [5] tri_fusion([2]) --> [2] tri_fusion([5]) --> [5] '''fusion''' de [2] et [5] : [2, 5] --> [2, 5] '''fusion''' de [1, 6] et [2, 5] : [1, 2, 5, 6] --> [1, 2, 5, 6] tri_fusion([4, 7, 3]) [4] [7, 3] tri_fusion([4]) --> [4] tri_fusion([7, 3]) [7] [3] tri_fusion([7]) --> [7] tri_fusion([3]) --> [3] '''fusion''' de [7] et [3] : [3, 7] --> [3, 7] '''fusion''' de [4] et [3, 7] : [3, 4, 7] --> [3, 4, 7] '''fusion''' de [1, 2, 5, 6] et [3, 4, 7] : [1, 2, 3, 4, 5, 6, 7] --> [1, 2, 3, 4, 5, 6, 7]

Všimněte si, že funkce sloučení je vždy volána na seřazených seznamech.

Podívejte se také

externí odkazy

(en) Java používá pro své tris sbírky objektů variantu fúze třídění
(en) Sloučit řazení na místě : článek o sloučení řazení na místě, ale není stabilní v (soubor formátu PostScript) $O (n \ log n)$
(en) Sloučit třídění na místě: chytrý algoritmus v Javě pro slučování třídění na místě a stabilní pomocí rotace prvků
(en) Dynamické znázornění sloučení

Reference

Steven Skiena, The Algorithm Design Manual , Springer Science + Business Media ,2008, 730 s. ( ISBN 978-1-84800-069-8 ) , str. 122