روش مرتبسازی درجی (Insertion Sort) یکی از روشهای مقدماتی مرتبسازی مبتنی بر مقایسه عناصر است که در مقایسه با روشهای دیگر بیشتر مورد توجه قرار دارد.
قفسه کتابی را در نظر بگیرید که قصد دارید کتابها را بر اساس عنوان و به ترتیب حروف الفبا مرتب کنید. از یک سمت قفسه شروع به مرتب کردن میکنید. ابتدا کتاب دوم را با کتاب اول مقایسه کرده و در صورت لزوم جابجا میکنید. سپس کتاب سوم را از محل خود برداشته، و در مقایسه با دو کتاب قبلی در محل مناسب قرار میدهید. به همین ترتیب کتابهای بعدی را نیز نسبت به کتابهای مرتبشده قبلی در محل مناسب درج میکنید، تا به آخر قفسه برسید.
عملکرد این الگوریتم به گونهای است که در پایان هر مرحله قسمتی از دادهها به صورت کامل مرتب هستند. در مرحله بعدی نیز دادهای از میان دادههای غیرمرتب به این قسمت مرتب وارد شده و در محل مناسب درج میشود. اگر بخواهیم با روش مرتبسازی درجی لیست اعداد زیر را به صورت صعودی (کوچک به بزرگ) مرتب کنیم، در پایان هر مرحله ترتیب عناصر به صورت زیر خواهد بود:
کد:
1) 1 5 2 7 3 6
2) 1 2 5 7 3 6
3) 1 2 5 7 3 6
4) 1 2 3 5 7 6
5) 1 2 3 5 6 7
پیادهسازی مرتبسازی درجی
الگوریتم مرتبسازی درجی به زبان برنامهنویسی ++C برای مرتب کردن عناصر آرایهای از اعداد صحیح به صورت زیر پیادهسازی میشود:
کد:
void insertion_sort( int arr[ ], int n )
{
int i, j, t;
for( i = 1 ; i < n ; i++ )
{
t = arr[ i ];
for( j = i ; j > 0 ; j-- )
{
if( t >= arr[ j - 1 ] )
{
break;
}
arr[ j ] = arr[ j - 1 ];
}
arr[ j ] = t;
}
}
حلقه بیرونی مراحل مختلف مرتبسازی را پیادهسازی کرده، و حلقه درونی در هر مرحله محل مناسب عنصر جدید را مییابد. در انتها نیز این عنصر در محل صحیح خود درج میشود. برای درک بهتر، مراحل عمل این الگوریتم به ازای لیست مثال فوق مجددا بررسی میشود:
در مرحله اول i = 1 و t = 1 است:
کد:
j = 1: 5 5 2 7 3 6
: 1 5 2 7 3 6
در مرحله دوم i = 2 و t = 2 است:
کد:
j = 2: 1 5 5 7 3 6
j = 1: 1 5 5 7 3 6
: 1 2 5 7 3 6
در مرحله سوم i=3 و t = 7 است:
کد:
j = 3: 1 2 5 7 3 6
: 1 2 5 7 3 6
در مرحله چهارم i = 4 و t = 3 است:
کد:
j = 4: 1 2 5 7 7 6
j = 3: 1 2 5 5 7 6
j = 2: 1 2 5 5 7 6
: 1 2 3 5 7 6
و در مرحله پنجم i = 5 و t = 6 است:
کد:
j = 5: 1 2 3 5 7 7
j = 4: 1 2 3 5 7 7
: 1 2 3 5 6 7
در پایان لیست مرتب شده است.
پیچیدگی زمانی مرتبسازی درجی
بدترین حالت این الگوریتم زمانی اتفاق میافتد که لیست به صورت معکوس مرتب باشد. در این حالت حلقه داخلی در مرحله اول یک بار، در مرحله دوم دو بار، در مرحله سوم سه بار، و در حالت کلی در مرحله iام (i < n) به تعداد i بار تکرار میشود. پس اگر ( T( n تعداد مقایسههای حلقه داخلی به ازای n عنصر را نشان دهد، میتوان نوشت:
کد:
T( n ) = 1 + 2 + 3 + ... + (n - 1) = n ( n - 1 ) / 2 ≈ n2 / 2
که از مرتبه اجرای ( Θ( n2 است.
بهترین حالت الگوریتم زمانی است است که لیست از پیش مرتبشده باشد. در این حالت هر حلقه درونی با یکبار مقایسه خاتمه پیدا میکند. در نتیجه تعداد کل مقایسهها از مرتبه ( Θ( n خواهد بود.
حالت متوسط برای شرایطی که عناصر به صورت تصادفی پخش شده باشند محاسبه میشود. در این حالت در هر تکرار حلقه بیرونی، حلقه داخلی برای یافتن محل مناسب درج عنصر جدید به طور میانگین نصف لیست مرتبشده را پیمایش میکند. در نتیجه حدود n2 / 4 مقایسه صورت خواهد گرفت (چرا؟). این تعداد اگرچه از مرتبه اجرایی ( Θ( n2 است، اما در مقایسه با بدترین حالت (تقریبا n2 / 2 مقایسه) عملکرد بهتری را نشان میدهد.
ویژگیهای مرتبسازی درجی
1- پیچیدگی زمانی الگوریتم مرتبسازی درجی در بدترین حالت و حالت متوسط ( Θ( n2، و در بهترین حالت ( Θ( n است.
2- یکی از ویژگیهای مهم مرتبسازی درجی این است که در حالت متوسط برای درج عنصر جدید در لیست مرتبشده نیاز به مقایسه عنصر با تمامی عناصر ندارد. به همین دلیل کارآیی آن در مقایسه با بدترین حالت بهتر است. از سوی دیگر، این روش برای مرتب کردن عناصر به جای عمل جابجایی - که نیاز به سه عمل اصلی مقداردهی دارد - از کپی کردن استفاده میکند. در این روش ابتدا مقدار عنصر جدید در یک متغیر کمکی (در قطعه کد فوق متغیر t) ذخیره شده و جابجا کردن عناصر بزرگتر به انتهای لیست با یک عمل اصلی انجام میگیرد. در انتها نیز مقدار عنصر جدید در محل مناسب درج میشود. در چنین حالتی تعداد اعمال اصلی انچام شده کمتر از تعداد اعمال مورد نیاز در عمل جابجایی است. به همین دلیل این روش به روشهای مقدماتی دیگر (مانند روش مرتبسازی حبابی و انتخابی) ارجحیت داشته و در مراحل نهایی مرتبسازیهای پیشرفته (مانند روش مرتبسازی سریع) از این روش به عنوان روش مرتبسازی جایگزین استفاده میشود. اگر تعداد عناصر لیست کمتر از بیست عنصر باشد، این روش در مقایسه بار روشهای متداول مرتبسازی سریعتر عمل میکند.
3- حافظه مصرفی مرتبسازی درجی از مرتبه ( Θ( 1 بوده و مستقل از اندازه لیست است. چنین الگوریتمی را مرتبسازی درجا گویند.
4- در صورتی که مرتبسازی درجی به صورت قطعهکد فوق پیادهسازی شود، یک مرتبسازی پایدار خواهد بود. یعنی ترتیب عناصر با مقادیر یکسان در حین مرتبسازی تغییر نمیکند. اما اگر به جای شرط [ t >= arr[ j - 1 از شرط [ t > arr[ j - 1 استفاده شود، الگوریتم ناپایدار خواهد شد.