// Copyright 2025 Google LLC // SPDX-License-Identifier: Apache-2.0 // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. #include #include #undef HWY_TARGET_INCLUDE #define HWY_TARGET_INCLUDE "tests/neg_test.cc" #include "hwy/foreach_target.h" // IWYU pragma: keep #include "hwy/highway.h" #include "hwy/nanobenchmark.h" #include "hwy/tests/test_util-inl.h" HWY_BEFORE_NAMESPACE(); namespace hwy { namespace HWY_NAMESPACE { namespace { struct TestAbs { template HWY_NOINLINE void operator()(T /*unused*/, D d) { const Vec v0 = Zero(d); const Vec vp1 = Set(d, static_cast(1)); const Vec vn1 = Set(d, static_cast(-1)); const Vec vpm = Set(d, LimitsMax()); const Vec vnm = Set(d, LimitsMin()); HWY_ASSERT_VEC_EQ(d, v0, Abs(v0)); HWY_ASSERT_VEC_EQ(d, vp1, Abs(vp1)); HWY_ASSERT_VEC_EQ(d, vp1, Abs(vn1)); HWY_ASSERT_VEC_EQ(d, vpm, Abs(vpm)); HWY_ASSERT_VEC_EQ(d, vnm, Abs(vnm)); } }; struct TestFloatAbs { template HWY_NOINLINE void operator()(T /*unused*/, D d) { const Vec v0 = Zero(d); const Vec vp1 = Set(d, ConvertScalarTo(1)); const Vec vn1 = Set(d, ConvertScalarTo(-1)); const Vec vp2 = Set(d, ConvertScalarTo(0.01)); const Vec vn2 = Set(d, ConvertScalarTo(-0.01)); HWY_ASSERT_VEC_EQ(d, v0, Abs(v0)); HWY_ASSERT_VEC_EQ(d, vp1, Abs(vp1)); HWY_ASSERT_VEC_EQ(d, vp1, Abs(vn1)); HWY_ASSERT_VEC_EQ(d, vp2, Abs(vp2)); HWY_ASSERT_VEC_EQ(d, vp2, Abs(vn2)); } }; struct TestMaskedAbs { template HWY_NOINLINE void operator()(T /*unused*/, D d) { const MFromD zero_mask = MaskFalse(d); const MFromD first_five = FirstN(d, 5); const Vec v0 = Zero(d); const Vec vp1 = Set(d, ConvertScalarTo(hwy::Unpredictable1())); const Vec vn1 = Neg(vp1); const Vec vp2 = Set(d, ConvertScalarTo(0.01)); const Vec vn2 = Set(d, ConvertScalarTo(-0.01)); // Test that mask is applied correctly for MaskedAbsOr const Vec v1_exp = IfThenElse(first_five, vp1, vn1); const Vec v2_exp = IfThenElse(first_five, vp2, vn2); HWY_ASSERT_VEC_EQ(d, v1_exp, MaskedAbsOr(vn1, first_five, vn1)); HWY_ASSERT_VEC_EQ(d, v2_exp, MaskedAbsOr(vn2, first_five, vn2)); // Test that zero mask will return all zeroes for MaskedAbs HWY_ASSERT_VEC_EQ(d, v0, MaskedAbs(zero_mask, vn1)); // Test that zero is returned in cases m==0 for MaskedAbs const Vec v1_exp_z = IfThenElseZero(first_five, vp1); const Vec v2_exp_z = IfThenElseZero(first_five, vp2); HWY_ASSERT_VEC_EQ(d, v1_exp_z, MaskedAbs(first_five, vn1)); HWY_ASSERT_VEC_EQ(d, v2_exp_z, MaskedAbs(first_five, vn2)); } }; HWY_NOINLINE void TestAllAbs() { ForSignedTypes(ForPartialVectors()); ForFloatTypes(ForPartialVectors()); ForSignedTypes(ForPartialVectors()); } struct TestIntegerNeg { template HWY_NOINLINE void operator()(T /*unused*/, D d) { const RebindToUnsigned du; using TU = TFromD; const Vec v0 = Zero(d); const Vec v1 = BitCast(d, Set(du, TU{1})); const Vec vp = BitCast(d, Set(du, TU{3})); const Vec vn = Add(Not(vp), v1); // 2's complement HWY_ASSERT_VEC_EQ(d, v0, Neg(v0)); HWY_ASSERT_VEC_EQ(d, vp, Neg(vn)); HWY_ASSERT_VEC_EQ(d, vn, Neg(vp)); } }; struct TestFloatNeg { // Must be inlined on aarch64 for bf16, else clang crashes. template HWY_INLINE void operator()(T /*unused*/, D d) { const RebindToUnsigned du; using TU = TFromD; // 1.25 in binary16. const Vec vp = BitCast(d, Set(du, static_cast(Unpredictable1() * 0x3D00))); // Flip sign bit in MSB const Vec vn = BitCast(d, Xor(BitCast(du, vp), SignBit(du))); // Do not check negative zero - we do not yet have proper bfloat16_t Eq(). HWY_ASSERT_VEC_EQ(du, BitCast(du, vp), BitCast(du, Neg(vn))); HWY_ASSERT_VEC_EQ(du, BitCast(du, vn), BitCast(du, Neg(vp))); } }; struct TestNegOverflow { template HWY_NOINLINE void operator()(T /*unused*/, D d) { const auto vn = Set(d, LimitsMin()); const auto vp = Set(d, LimitsMax()); HWY_ASSERT_VEC_EQ(d, Neg(vn), Neg(vn)); HWY_ASSERT_VEC_EQ(d, Neg(vp), Neg(vp)); } }; HWY_NOINLINE void TestAllNeg() { ForFloatTypes(ForPartialVectors()); // Always supported, even if !HWY_HAVE_FLOAT16. ForPartialVectors()(float16_t()); ForSignedTypes(ForPartialVectors()); ForSignedTypes(ForPartialVectors()); } struct TestIntegerAbsDiff { template static inline T ScalarAbsDiff(T a, T b) { using TW = MakeSigned>; const TW diff = static_cast(static_cast(a) - static_cast(b)); return static_cast((diff >= 0) ? diff : -diff); } template static inline T ScalarAbsDiff(T a, T b) { if (a >= b) { return static_cast(static_cast(a) - static_cast(b)); } else { return static_cast(static_cast(b) - static_cast(a)); } } template HWY_NOINLINE void operator()(T /*unused*/, D d) { const size_t N = Lanes(d); auto in_lanes_a = AllocateAligned(N); auto in_lanes_b = AllocateAligned(N); auto out_lanes = AllocateAligned(N); HWY_ASSERT(in_lanes_a && in_lanes_b && out_lanes); constexpr size_t shift_amt_mask = sizeof(T) * 8 - 1; for (size_t i = 0; i < N; ++i) { // Need to mask out shift_amt as i can be greater than or equal to // the number of bits in T if T is int8_t, uint8_t, int16_t, or uint16_t. const auto shift_amt = i & shift_amt_mask; in_lanes_a[i] = static_cast((static_cast(i) ^ 1u) << shift_amt); in_lanes_b[i] = static_cast(static_cast(i) << shift_amt); out_lanes[i] = ScalarAbsDiff(in_lanes_a[i], in_lanes_b[i]); } const auto a = Load(d, in_lanes_a.get()); const auto b = Load(d, in_lanes_b.get()); const auto expected = Load(d, out_lanes.get()); HWY_ASSERT_VEC_EQ(d, expected, AbsDiff(a, b)); HWY_ASSERT_VEC_EQ(d, expected, AbsDiff(b, a)); } }; HWY_NOINLINE void TestAllIntegerAbsDiff() { ForPartialVectors()(int8_t()); ForPartialVectors()(uint8_t()); ForPartialVectors()(int16_t()); ForPartialVectors()(uint16_t()); ForPartialVectors()(int32_t()); ForPartialVectors()(uint32_t()); #if HWY_HAVE_INTEGER64 ForPartialVectors()(int64_t()); ForPartialVectors()(uint64_t()); #endif } } // namespace // NOLINTNEXTLINE(google-readability-namespace-comments) } // namespace HWY_NAMESPACE } // namespace hwy HWY_AFTER_NAMESPACE(); #if HWY_ONCE namespace hwy { namespace { HWY_BEFORE_TEST(HwyNegTest); HWY_EXPORT_AND_TEST_P(HwyNegTest, TestAllAbs); HWY_EXPORT_AND_TEST_P(HwyNegTest, TestAllNeg); HWY_EXPORT_AND_TEST_P(HwyNegTest, TestAllIntegerAbsDiff); HWY_AFTER_TEST(); } // namespace } // namespace hwy HWY_TEST_MAIN(); #endif // HWY_ONCE