4876

Быстрая сортировка и способы ее реализации в программировании

Лекция

Информатика, кибернетика и программирование

Быстрая сортировка. Быстрая сортировка (quicksort) является одним из наиболее эффективных алгоритмов сортировки. В основе его лежит идея декомпозиции, т.е. поэтапного сведения исходной задачи к набору аналогичных, но более простых, вплоть до т...

Русский

2012-11-28

72.5 KB

17 чел.

Быстрая сортировка.

Быстрая сортировка (quick sort) является одним из наиболее эффективных алгоритмов сортировки. В основе его лежит идея декомпозиции, т.е. поэтапного сведения исходной задачи к набору аналогичных, но более простых, вплоть до тривиальных, а затем объединения результатов. Подход можно описать в виде трех этапов:

 Разделение. Массив A[p,r] разбивается на два подмассива A[p,q] и A[q+1,r] (возможно, пустые) так, чтобы все элементы первого были меньше элементов второго. С этой целью в исходном массиве выбирается «опорный» элемент M, определяющий границу разбиения: все элементы со значениями меньшими M, перемещаются в первый подмассив, а элементы со значениями большими либо равными M, размещаются во втором.

 Решение подзадач. К каждому из двух полученных массивов рекурсивно применяется та же самая процедура. Поскольку все значения элементов первого массива меньше значений во втором массиве, исходный массив будет отсортирован правильно. В процессе последовательного разделения задача постепенно сведется к сортировке подмассивов, содержащих не более двух элементов, которая решается тривиально.

 Объединение результатов. В данном алгоритме подзадачи (т.е сортировка подмассивов) решаются «на месте», поэтому никаких специальных действий для объединения результатов не потребуется.

Существенным вопросом в этом алгоритме является выбор опорного элемента M. Нетрудно видеть, что наиболее эффективной стратегией был бы выбор медианного элемента массива, что обеспечивало бы разделение массива на две примерно равные части. Однако, определение медианного элемента повлекло бы дополнительные вычислительные затраты, поэтому чаще всего в качестве опорного выбирают элемент, расположенный посередине массива.

Рис. 1. Процедура разделения.

void quickSort( double * A, int first, int last )

{

   int i = first, j = last;

 // Выбираем "опорный" элемент

 double med = A[ (first + last) / 2 ];

 

 // Разбиваем массив на 2 части относительно

 // "опорного" элемента

do 

{

       while ( A[i] < med )

  i++;

       while ( A[j] > med )

  j--;

 

       if ( i <= j )

  {

           double tmp = A[i];

    A[i] = A[j];

  A[j] = tmp;

   

  i++;

           j--;

       }

   }

   while ( i <= j );

 

 // Рекурсивно применяем ту жу процедуру к

 // обеим частям массива

   if ( i < last )

       quickSort( A, i, last );

   if ( first < j )

       quickSort( A, first, j );

}

Несмотря на все положительные качества быстрой сортировки, базовый вариант алгоритма обладает недостатком: сортировка становится крайне неэффективной на некоторых часто встречающихся на практике типах входных данных. Например, если она применяется для сортировки уже отсортированной последовательности из N элементов, то все операции разделения вырождаются, и алгоритм рекурсивно вызовет сам себя N раз, перемещая за каждый вызов всего лишь один элемент. В этом, худшем, случае нетрудно оценить требуемое количество операций сравнения: N + (N-1) + …+ 2 + 1 = (N+1)N/2, что приводит к асимптотической оценке количества сравнений в худшем случае в O(N2).

В наиболее благоприятном случае, на каждой стадии разбиения последовательность делится на равные части. Это приводит к тому, что количество операций сравнения удовлетворяет рекуррентному соотношению:

CN = 2CN/2 + N.

Можно доказать, что решением этого соотношения будет CNN logN. Асимптотическая оценка среднего случая приводит к аналогичной величине.

Большая глубина рекурсивных вызовов может быть серьезной проблемой при использовании быстрой сортировки для очень длинных последовательностей. При использовании базового варианта алгоритма, даже короткие участки последовательности будут сортироваться по тому же принципу, при этом, количество вызовов алгоритма для коротких блоков на самых «глубоких» уровнях рекурсии будет очень велико. Сократить расходы на рекурсивный вызов алгоритма для коротких блоков можно простым способом – ввести ограничение на минимальный размер блока, для которого вместо алгоритма быстрой сортировки будет вызван другой, нерекурсивный, метод сортировки, например, сортировка вставками. Определение фактического значения этого порогового значения можно путем анализа скорости работы алгоритма на ожидаемых на практике последовательностях.

Ещё одно из возможных усовершенствований алгоритма быстрой сортировки заключается в использовании такого опорного элемента, который с большой вероятностью приводил к разделению последовательности на примерно равные части. Наиболее безопасный выбор, минимизирующий вероятность возникновения наихудшего случая, обеспечивается использованием в качестве разделяющего случайного элемента массива. Такой метод представляет собой пример вероятностного алгоритма, когда используется случайный характер величин для достижения высокой эффективности с большой вероятностью, независимо от степени упорядоченности входных данных.

Другой часто используемый способ нахождения подходящего разделяющего элемента заключается в том, что производится выборка трёх элементов из последовательности, а затем в качестве разделяющего используется медиана из этих трех элементов. Такой выбор основывается на том, что в среднем, медиана из трех элементов даст грубую оценку медианы всей последовательности.

Ещё один особый случай, в котором быстрая сортировка неэффективна – последовательность, содержащая большое количество (в предельном случае – все) дублирующихся элементов. В таком случае в качестве усовершенствования можно предложить разбивать последовательность не на две, а на три части: первая – для элементов меньших опорного, вторая – для элементов, равных ему, третья – для элементов, больших опорного. Однако, выполнение такого разделения реализуется гораздо сложнее.

Быстрая сортировка нашла широкое применение в связи с тем, что она эффективно работает в большинстве случаев. Другие методы работают лучше только в некоторых особых ситуациях, время от времени встречающихся на практике.


2

0

1

5

9

8

6

12

2

7

3

4

2

4

1

5

9

8

6

12

2

7

3

10

2

4

1

5

3

8

6

12

2

7

9

10

2

4

1

5

3

7

6

12

2

8

9

10

2

4

1

5

3

7

6

2

12

8

9

10


 

А также другие работы, которые могут Вас заинтересовать

46474. НАЗНАЧЕНИЕ ТЕХНОЛИГИЧЕОНИХ БАЗ 16.74 KB
  От правильности решения вопроса о технологических базах в значительной степени зависят: фактическая точность выполнения линейных размеров заданных конструктором; правильность взаимного расположения обрабатываемых поверхностей; точность обработки которую должен выдержать рабочий при выполнении запроектированной технологической операции; степень сложности и конструкция необходимых приспособлений режущих и мерительных инструментов; общая производительность обработки заготовок. При автоматизации производства развитии гидрокопировальных...
46475. Культура России XIX века 16.75 KB
  Русская культура первой половины XIX в. Начало XIX века время культурного и духовного подъёма России. В первой половине XIX века в России было образовано семь университетов.
46476. Объектное обобщение 16.81 KB
  Организация объектного обобщения: clss С1 { int x y z; public: void D1 { . clss Shpe { public: virtul void In = 0; ввод данных virtul void Out = 0; вывод данных virtul double re = 0; площадь }; Наследование механизм объектноориентированного программирования позволяющий описать новый класс на основе уже существующего родительского при этом свойства и функциональность родительского класса заимствуются новым классом. Наследование: Cинтаксис в языке C Наследование: Синтаксис в языке C clss { clss {...
46477. Рак легкого. Формы периферического рака легкого. Дифференциальная диагностика с доброкачественными заболеваниями легких. Методы хирургического лечени 16.82 KB
  Распространение повсеместно. Вызывается заболевание эхинококкус гранулезус. Окончательный хозяин –собака, волк. Промежуточный –копытные. Содержимое кисты жид-ть, сколексы и дочерние пузыри. Оболочки: герминативная (зародышевая), кутикулярная (хитиновая), фиброзная капсула
46478. Становление новой российской государственности (1993-1999 гг.) 16.87 KB
  После распада СССР началась ликвидация прежних структур власти и управления. Отсутствие четкого разграничения полномочий между ними вызывало острое противостояние двух ветвей государственной власти законодательной и исполнительной. под давлением законодательной власти ушло в отставку правительство Е. Противостояние ветвей власти усилилось осенью 1993 г.
46479. Психология человека при ЧС и профилактические меры 16.93 KB
  Реакция людей попавших в зону ЧС может быть как индивидуальной так и коллективной. Индивидуальные реакции людей при этом возможны положительного или отрицательного вида. Отрицательные реакции у людей проявляются в виде тревоги беспокойства неуверенности в себе обострения чувства самосохранения страха острой борьбы мотивов долга и личной безопасности растерянности непонимания происходящего деавтоматизации навыков допущения ошибок в работе недостаточной мобилизованности утраты самоконтроля панических действий острых психозов и...
46480. Понятие социализации в психоанализе и в теории Ж. Пиаже 17.07 KB
  Она рассматривает детское развитие как процесс постепенной социализации ребенка подчиняющийся закону перехода от принципа удовольствия к принципу реальности. Фрейду усиливается влияние на ребенка внешнего мира З. Фрейд защита от элементов детской жизни таких как жадность корысть ревность пожелание смерти которые толкают ребенка в направлении десоциализации. Продвижение ребенка от принципа удовольствия к принципу реальности наступает когда различные функции Я достигают определенной ступени развития.
46481. Государственный заказ 17.1 KB
  Субъекты системы госзакупок: госзаказчики формирующие и размещающие госзаказ на поставку продукции заключающие контракты и получающие продукцию непосредственные потребители товаров работ и услуг поставщики продукции участвующие в процедурах размещения гозакупок заключающие контракты на поставку продукции и поставляющие ее координатор уполномоченный орган исполнительной власти осуществляющий планирование координацию контроль и методическое руководство процессом формирования и размещения госзаказа специализированные...
46482. Несостоятельность (банкротство) предприятий. Основные понятия 17.1 KB
  К внешним факторам относят: Экономические уровень доходов и накопления населения покупательская способность; платежеспособность экономических партнеров кредитная и налоговая политика государства; изменение рыночных ориентаций потребителя конъюнктуры внутреннего и мирового рынков государственное регулирование уровень развития науки и техники инфляция; Социальные – изменение политической обстановки внутри страны и за рубежом; международная конкуренция уровень культуры предпринимателей и потребителей их продукции организация досуга...