Optimize vector8_has_le() on AArch64.
authorNathan Bossart <nathan@postgresql.org>
Fri, 3 Oct 2025 19:02:47 +0000 (14:02 -0500)
committerNathan Bossart <nathan@postgresql.org>
Fri, 3 Oct 2025 19:02:47 +0000 (14:02 -0500)
commitf8f4afe751fc75e1d3093fa634934018f440c29c
treef3d706f466366e567d5bb448392b763fefa8aee3
parent74b41f5a77b8586356d02227c92e7e47380ac228
Optimize vector8_has_le() on AArch64.

Presently, the SIMD implementation of this function uses unsigned
saturating subtraction to find bytes less than or equal to the
given value, which is a workaround for the lack of unsigned
comparison instructions on some architectures.  However, Neon
offers vminvq_u8(), which returns the minimum (unsigned) value in
the vector.  This commit adds a Neon-specific implementation that
uses vminvq_u8() to optimize vector8_has_le() on AArch64.

In passing, adjust the SSE2 implementation to use vector8_min() and
vector8_eq() to find values less than or equal to the given value.
This was the only use of vector8_ssub(), so it has been removed.

Reviewed-by: John Naylor <johncnaylorls@gmail.com>
Discussion: https://postgr.es/m/aNHDNDSHleq0ogC_%40nathan
src/include/port/simd.h