Repair bug in regexp split performance improvements.
authorAndrew Gierth <rhodiumtoad@postgresql.org>
Wed, 12 Sep 2018 18:31:06 +0000 (19:31 +0100)
committerAndrew Gierth <rhodiumtoad@postgresql.org>
Wed, 12 Sep 2018 18:49:59 +0000 (19:49 +0100)
commitdea7fc60a0512b37730fb2d69ae85074ec106cfa
tree866e6eaaae89fb4a6bb949b139a68dbdb129db6b
parent520711d6e23e313bb2b3de39667a6596953ceed0
Repair bug in regexp split performance improvements.

Commit c8ea87e4b introduced a temporary conversion buffer for
substrings extracted during regexp splits. Unfortunately the code that
sized it was failing to ignore the effects of ignored degenerate
regexp matches, so for regexp_split_* calls it could under-size the
buffer in such cases.

Fix, and add some regression test cases (though those will only catch
the bug if run in a multibyte encoding).

Backpatch to 9.3 as the faulty code was.

Thanks to the PostGIS project, Regina Obe and Paul Ramsey for the
report (via IRC) and assistance in analysis. Patch by me.
src/backend/utils/adt/regexp.c
src/test/regress/expected/strings.out
src/test/regress/sql/strings.sql