#
 #  Modifications from vanilla NetBSD source:
 #    Add do ... while() macro fix
-#    Remove __inline, _DIAGASSERTs, __P
-#    Remove ill-considered "swap_cnt" switch to insertion sort,
-#    in favor of a simple check for presorted input.
-#     Instead of sorting arbitrary objects, we're always sorting SortTuples
-#     Add CHECK_FOR_INTERRUPTS()
+#    Remove __inline, _DIAGASSERTs, __P
+#    Remove ill-considered "swap_cnt" switch to insertion sort,
+#    in favor of a simple check for presorted input.
+#    Take care to recurse on the smaller partition, to bound stack usage.
+#
+#     Instead of sorting arbitrary objects, we're always sorting SortTuples.
+#     Add CHECK_FOR_INTERRUPTS().
 #
 # CAUTION: if you change this file, see also qsort.c and qsort_arg.c
 #
 $EXTRAPARAMS = ', ssup';
 $CMPPARAMS   = ', ssup';
 print <<'EOM';
+
 #define cmp_ssup(a, b, ssup) \
    ApplySortComparator((a)->datum1, (a)->isnull1, \
                        (b)->datum1, (b)->isnull1, ssup)
+
 EOM
 emit_qsort_implementation();
 
 {
    print <<'EOM';
 /*
- * autogenerated by src/backend/utils/sort/gen_qsort_tuple.pl, do not edit
+ * autogenerated by src/backend/utils/sort/gen_qsort_tuple.pl, do not edit!
+ *
  * This file is included by tuplesort.c, rather than compiled separately.
  */
 
  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
- * ARE DISCLAIMED. IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
+ * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
  * Qsort routine based on J. L. Bentley and M. D. McIlroy,
  * "Engineering a sort function",
  * Software--Practice and Experience 23 (1993) 1249-1265.
+ *
  * We have modified their original by adding a check for already-sorted input,
  * which seems to be a win per discussions on pgsql-hackers around 2006-03-21.
+ *
+ * Also, we recurse on the smaller partition and iterate on the larger one,
+ * which ensures we cannot recurse more than log(N) levels (since the
+ * partition recursed to is surely no more than half of the input).  Bentley
+ * and McIlroy explicitly rejected doing this on the grounds that it's "not
+ * worth the effort", but we have seen crashes in the field due to stack
+ * overrun, so that judgment seems wrong.
  */
 
 static void
        *(b) = t;                       \
    } while (0);
 
-#define vecswap(a, b, n) if ((n) > 0) swapfunc((a), (b), (size_t)(n))
+#define vecswap(a, b, n) if ((n) > 0) swapfunc(a, b, n)
+
 EOM
 }
 
               *pl,
               *pm,
               *pn;
-   int         d,
-               r,
+   size_t      d1,
+               d2;
+   int         r,
                presorted;
 
 loop:
        pn = a + (n - 1);
        if (n > 40)
        {
-           d = (n / 8);
+           size_t      d = (n / 8);
+
            pl = med3_$SUFFIX(pl, pl + d, pl + 2 * d$EXTRAPARAMS);
            pm = med3_$SUFFIX(pm - d, pm, pm + d$EXTRAPARAMS);
            pn = med3_$SUFFIX(pn - 2 * d, pn - d, pn$EXTRAPARAMS);
    {
        while (pb <= pc && (r = cmp_$SUFFIX(pb, a$CMPPARAMS)) <= 0)
        {
-           CHECK_FOR_INTERRUPTS();
            if (r == 0)
            {
                swap(pa, pb);
                pa++;
            }
            pb++;
+           CHECK_FOR_INTERRUPTS();
        }
        while (pb <= pc && (r = cmp_$SUFFIX(pc, a$CMPPARAMS)) >= 0)
        {
-           CHECK_FOR_INTERRUPTS();
            if (r == 0)
            {
                swap(pc, pd);
                pd--;
            }
            pc--;
+           CHECK_FOR_INTERRUPTS();
        }
        if (pb > pc)
            break;
        pc--;
    }
    pn = a + n;
-   r = Min(pa - a, pb - pa);
-   vecswap(a, pb - r, r);
-   r = Min(pd - pc, pn - pd - 1);
-   vecswap(pb, pn - r, r);
-   if ((r = pb - pa) > 1)
-       qsort_$SUFFIX(a, r$EXTRAPARAMS);
-   if ((r = pd - pc) > 1)
+   d1 = Min(pa - a, pb - pa);
+   vecswap(a, pb - d1, d1);
+   d1 = Min(pd - pc, pn - pd - 1);
+   vecswap(pb, pn - d1, d1);
+   d1 = pb - pa;
+   d2 = pd - pc;
+   if (d1 <= d2)
    {
-       /* Iterate rather than recurse to save stack space */
-       a = pn - r;
-       n = r;
-       goto loop;
+       /* Recurse on left partition, then iterate on right partition */
+       if (d1 > 1)
+           qsort_$SUFFIX(a, d1$EXTRAPARAMS);
+       if (d2 > 1)
+       {
+           /* Iterate rather than recurse to save stack space */
+           /* qsort_$SUFFIX(pn - d2, d2$EXTRAPARAMS); */
+           a = pn - d2;
+           n = d2;
+           goto loop;
+       }
+   }
+   else
+   {
+       /* Recurse on right partition, then iterate on left partition */
+       if (d2 > 1)
+           qsort_$SUFFIX(pn - d2, d2$EXTRAPARAMS);
+       if (d1 > 1)
+       {
+           /* Iterate rather than recurse to save stack space */
+           /* qsort_$SUFFIX(a, d1$EXTRAPARAMS); */
+           n = d1;
+           goto loop;
+       }
    }
-/*     qsort_$SUFFIX(pn - r, r$EXTRAPARAMS);*/
 }
-
 EOM
 }
 
  *   Remove __inline, _DIAGASSERTs, __P
  *   Remove ill-considered "swap_cnt" switch to insertion sort,
  *   in favor of a simple check for presorted input.
+ *   Take care to recurse on the smaller partition, to bound stack usage.
  *
  * CAUTION: if you change this file, see also qsort_arg.c, gen_qsort_tuple.pl
  *
  * Qsort routine based on J. L. Bentley and M. D. McIlroy,
  * "Engineering a sort function",
  * Software--Practice and Experience 23 (1993) 1249-1265.
+ *
  * We have modified their original by adding a check for already-sorted input,
  * which seems to be a win per discussions on pgsql-hackers around 2006-03-21.
+ *
+ * Also, we recurse on the smaller partition and iterate on the larger one,
+ * which ensures we cannot recurse more than log(N) levels (since the
+ * partition recursed to is surely no more than half of the input).  Bentley
+ * and McIlroy explicitly rejected doing this on the grounds that it's "not
+ * worth the effort", but we have seen crashes in the field due to stack
+ * overrun, so that judgment seems wrong.
  */
+
 #define swapcode(TYPE, parmi, parmj, n) \
 do {       \
    size_t i = (n) / sizeof (TYPE);         \
    } else                          \
        swapfunc(a, b, es, swaptype)
 
-#define vecswap(a, b, n) if ((n) > 0) swapfunc((a), (b), (size_t)(n), swaptype)
+#define vecswap(a, b, n) if ((n) > 0) swapfunc(a, b, n, swaptype)
 
 static char *
 med3(char *a, char *b, char *c, int (*cmp) (const void *, const void *))
               *pl,
               *pm,
               *pn;
-   int         d,
-               r,
+   size_t      d1,
+               d2;
+   int         r,
                swaptype,
                presorted;
 
        pn = (char *) a + (n - 1) * es;
        if (n > 40)
        {
-           d = (n / 8) * es;
+           size_t      d = (n / 8) * es;
+
            pl = med3(pl, pl + d, pl + 2 * d, cmp);
            pm = med3(pm - d, pm, pm + d, cmp);
            pn = med3(pn - 2 * d, pn - d, pn, cmp);
        pc -= es;
    }
    pn = (char *) a + n * es;
-   r = Min(pa - (char *) a, pb - pa);
-   vecswap(a, pb - r, r);
-   r = Min(pd - pc, pn - pd - es);
-   vecswap(pb, pn - r, r);
-   if ((r = pb - pa) > es)
-       qsort(a, r / es, es, cmp);
-   if ((r = pd - pc) > es)
+   d1 = Min(pa - (char *) a, pb - pa);
+   vecswap(a, pb - d1, d1);
+   d1 = Min(pd - pc, pn - pd - es);
+   vecswap(pb, pn - d1, d1);
+   d1 = pb - pa;
+   d2 = pd - pc;
+   if (d1 <= d2)
    {
-       /* Iterate rather than recurse to save stack space */
-       a = pn - r;
-       n = r / es;
-       goto loop;
+       /* Recurse on left partition, then iterate on right partition */
+       if (d1 > es)
+           pg_qsort(a, d1 / es, es, cmp);
+       if (d2 > es)
+       {
+           /* Iterate rather than recurse to save stack space */
+           /* pg_qsort(pn - d2, d2 / es, es, cmp); */
+           a = pn - d2;
+           n = d2 / es;
+           goto loop;
+       }
+   }
+   else
+   {
+       /* Recurse on right partition, then iterate on left partition */
+       if (d2 > es)
+           pg_qsort(pn - d2, d2 / es, es, cmp);
+       if (d1 > es)
+       {
+           /* Iterate rather than recurse to save stack space */
+           /* pg_qsort(a, d1 / es, es, cmp); */
+           n = d1 / es;
+           goto loop;
+       }
    }
-/*     qsort(pn - r, r / es, es, cmp);*/
 }
 
 /*
- * qsort wrapper for strcmp.
+ * qsort comparator wrapper for strcmp.
  */
 int
 pg_qsort_strcmp(const void *a, const void *b)
 {
-   return strcmp(*(char *const *) a, *(char *const *) b);
+   return strcmp(*(const char *const *) a, *(const char *const *) b);
 }
 
  *   Remove __inline, _DIAGASSERTs, __P
  *   Remove ill-considered "swap_cnt" switch to insertion sort,
  *   in favor of a simple check for presorted input.
+ *   Take care to recurse on the smaller partition, to bound stack usage.
  *
  * CAUTION: if you change this file, see also qsort.c, gen_qsort_tuple.pl
  *
  * Qsort routine based on J. L. Bentley and M. D. McIlroy,
  * "Engineering a sort function",
  * Software--Practice and Experience 23 (1993) 1249-1265.
+ *
  * We have modified their original by adding a check for already-sorted input,
  * which seems to be a win per discussions on pgsql-hackers around 2006-03-21.
+ *
+ * Also, we recurse on the smaller partition and iterate on the larger one,
+ * which ensures we cannot recurse more than log(N) levels (since the
+ * partition recursed to is surely no more than half of the input).  Bentley
+ * and McIlroy explicitly rejected doing this on the grounds that it's "not
+ * worth the effort", but we have seen crashes in the field due to stack
+ * overrun, so that judgment seems wrong.
  */
+
 #define swapcode(TYPE, parmi, parmj, n) \
 do {       \
    size_t i = (n) / sizeof (TYPE);         \
    } else                          \
        swapfunc(a, b, es, swaptype)
 
-#define vecswap(a, b, n) if ((n) > 0) swapfunc((a), (b), (size_t)(n), swaptype)
+#define vecswap(a, b, n) if ((n) > 0) swapfunc(a, b, n, swaptype)
 
 static char *
 med3(char *a, char *b, char *c, qsort_arg_comparator cmp, void *arg)
               *pl,
               *pm,
               *pn;
-   int         d,
-               r,
+   size_t      d1,
+               d2;
+   int         r,
                swaptype,
                presorted;
 
        pn = (char *) a + (n - 1) * es;
        if (n > 40)
        {
-           d = (n / 8) * es;
+           size_t      d = (n / 8) * es;
+
            pl = med3(pl, pl + d, pl + 2 * d, cmp, arg);
            pm = med3(pm - d, pm, pm + d, cmp, arg);
            pn = med3(pn - 2 * d, pn - d, pn, cmp, arg);
        pc -= es;
    }
    pn = (char *) a + n * es;
-   r = Min(pa - (char *) a, pb - pa);
-   vecswap(a, pb - r, r);
-   r = Min(pd - pc, pn - pd - es);
-   vecswap(pb, pn - r, r);
-   if ((r = pb - pa) > es)
-       qsort_arg(a, r / es, es, cmp, arg);
-   if ((r = pd - pc) > es)
+   d1 = Min(pa - (char *) a, pb - pa);
+   vecswap(a, pb - d1, d1);
+   d1 = Min(pd - pc, pn - pd - es);
+   vecswap(pb, pn - d1, d1);
+   d1 = pb - pa;
+   d2 = pd - pc;
+   if (d1 <= d2)
    {
-       /* Iterate rather than recurse to save stack space */
-       a = pn - r;
-       n = r / es;
-       goto loop;
+       /* Recurse on left partition, then iterate on right partition */
+       if (d1 > es)
+           qsort_arg(a, d1 / es, es, cmp, arg);
+       if (d2 > es)
+       {
+           /* Iterate rather than recurse to save stack space */
+           /* qsort_arg(pn - d2, d2 / es, es, cmp, arg); */
+           a = pn - d2;
+           n = d2 / es;
+           goto loop;
+       }
+   }
+   else
+   {
+       /* Recurse on right partition, then iterate on left partition */
+       if (d2 > es)
+           qsort_arg(pn - d2, d2 / es, es, cmp, arg);
+       if (d1 > es)
+       {
+           /* Iterate rather than recurse to save stack space */
+           /* qsort_arg(a, d1 / es, es, cmp, arg); */
+           n = d1 / es;
+           goto loop;
+       }
    }
-/*     qsort_arg(pn - r, r / es, es, cmp, arg);*/
 }