Adopt @tex3d's feedback in intrinsic lowering.

llvm-beanz · llvm-beanz · commit 635ff2a9cac9 · 2025-04-08T17:54:55.000-05:00
This also results in correctly disabling scalarization for a number of
intrinsics too.
../tools/clang/test/CodeGenDXIL/hlsl/types/longvec-scalarized-intrinsics
.hlsl
../tools/clang/test/CodeGenDXIL/hlsl/types/longvec-trivial-scalarized-in
trinsics.hlsl
diff --git a/lib/HLSL/HLOperationLower.cpp b/lib/HLSL/HLOperationLower.cpp
@@ -484,16 +484,17 @@ Value *TrivialDxilVectorOperation(Function *Func, OP::OpCode Opcode,
 // Generates a DXIL operation with the overloaded type based on `Ty` and return
 // type `RetTy`. When Ty is a vector, it will either generate per-element calls
 // for each vector element and reconstruct the vector type from those results or
-// operate on and return native vectors depending on vector size and the value
-// of `SupportsVectors`, which is deteremined by version and opcode support.
+// operate on and return native vectors depending on vector size and the
+// legality of the vector overload.
 Value *TrivialDxilOperation(OP::OpCode opcode, ArrayRef<Value *> refArgs,
                             Type *Ty, Type *RetTy, OP *hlslOP,
-                            IRBuilder<> &Builder,
-                            bool SupportsVectors = false) {
+                            IRBuilder<> &Builder) {
 
   // If supported and the overload type is a vector with more than 1 element,
   // create a native vector operation.
-  if (SupportsVectors && Ty->isVectorTy() && Ty->getVectorNumElements() > 1) {
+  if (Ty->isVectorTy() && Ty->getVectorNumElements() > 1 &&
+      hlslOP->GetModule()->GetHLModule().GetShaderModel()->IsSM69Plus() &&
+      OP::IsOverloadLegal(opcode, Ty)) {
     Function *dxilFunc = hlslOP->GetOpFunc(opcode, Ty);
     return TrivialDxilVectorOperation(dxilFunc, opcode, refArgs, Ty, hlslOP,
                                       Builder);
@@ -540,40 +541,34 @@ Value *TrivialUnaryOperationRet(CallInst *CI, IntrinsicOp IOP,
 }
 
 Value *TrivialDxilUnaryOperation(OP::OpCode OpCode, Value *Src, hlsl::OP *Op,
-                                 IRBuilder<> &Builder,
-                                 bool SupportsVectors = false) {
+                                 IRBuilder<> &Builder) {
   Type *Ty = Src->getType();
 
   Constant *OpArg = Op->GetU32Const((unsigned)OpCode);
   Value *Args[] = {OpArg, Src};
 
-  return TrivialDxilOperation(OpCode, Args, Ty, Ty, Op, Builder,
-                              SupportsVectors);
+  return TrivialDxilOperation(OpCode, Args, Ty, Ty, Op, Builder);
 }
 
 Value *TrivialDxilBinaryOperation(OP::OpCode opcode, Value *src0, Value *src1,
-                                  hlsl::OP *hlslOP, IRBuilder<> &Builder,
-                                  bool SupportsVectors = false) {
+                                  hlsl::OP *hlslOP, IRBuilder<> &Builder) {
   Type *Ty = src0->getType();
 
   Constant *opArg = hlslOP->GetU32Const((unsigned)opcode);
   Value *args[] = {opArg, src0, src1};
 
-  return TrivialDxilOperation(opcode, args, Ty, Ty, hlslOP, Builder,
-                              SupportsVectors);
+  return TrivialDxilOperation(opcode, args, Ty, Ty, hlslOP, Builder);
 }
 
 Value *TrivialDxilTrinaryOperation(OP::OpCode opcode, Value *src0, Value *src1,
                                    Value *src2, hlsl::OP *hlslOP,
-                                   IRBuilder<> &Builder,
-                                   bool SupportsVectors = false) {
+                                   IRBuilder<> &Builder) {
   Type *Ty = src0->getType();
 
   Constant *opArg = hlslOP->GetU32Const((unsigned)opcode);
   Value *args[] = {opArg, src0, src1, src2};
 
-  return TrivialDxilOperation(opcode, args, Ty, Ty, hlslOP, Builder,
-                              SupportsVectors);
+  return TrivialDxilOperation(opcode, args, Ty, Ty, hlslOP, Builder);
 }
 
 // Translate call that trivially converts to a dxil unary operation by passing
@@ -587,8 +582,7 @@ Value *TrivialUnaryOperation(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
   IRBuilder<> Builder(CI);
   hlsl::OP *hlslOP = &helper.hlslOP;
 
-  return TrivialDxilUnaryOperation(opcode, src0, hlslOP, Builder,
-                                   helper.M.GetShaderModel()->IsSM69Plus());
+  return TrivialDxilUnaryOperation(opcode, src0, hlslOP, Builder);
 }
 
 // Translate call that trivially converts to a dxil binary operation by passing
@@ -603,8 +597,7 @@ Value *TrivialBinaryOperation(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
   Value *src1 = CI->getArgOperand(HLOperandIndex::kBinaryOpSrc1Idx);
   IRBuilder<> Builder(CI);
 
-  return TrivialDxilBinaryOperation(opcode, src0, src1, hlslOP, Builder,
-                                    helper.M.GetShaderModel()->IsSM69Plus());
+  return TrivialDxilBinaryOperation(opcode, src0, src1, hlslOP, Builder);
 }
 
 // Translate call that trivially converts to a dxil trinary (aka tertiary)
@@ -621,8 +614,7 @@ Value *TrivialTrinaryOperation(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
   Value *src2 = CI->getArgOperand(HLOperandIndex::kTrinaryOpSrc2Idx);
   IRBuilder<> Builder(CI);
 
-  return TrivialDxilTrinaryOperation(opcode, src0, src1, src2, hlslOP, Builder,
-                                     helper.M.GetShaderModel()->IsSM69Plus());
+  return TrivialDxilTrinaryOperation(opcode, src0, src1, src2, hlslOP, Builder);
 }
 
 Value *TrivialIsSpecialFloat(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
@@ -1969,11 +1961,9 @@ Value *TranslateClamp(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
 
   IRBuilder<> Builder(CI);
   // min(max(x, minVal), maxVal).
-  bool SupportsVectors = helper.M.GetShaderModel()->IsSM69Plus();
   Value *maxXMinVal = TrivialDxilBinaryOperation(maxOp, x, minVal, hlslOP,
-                                                 Builder, SupportsVectors);
-  return TrivialDxilBinaryOperation(minOp, maxXMinVal, maxVal, hlslOP, Builder,
-                                    SupportsVectors);
+                                                 Builder);
+  return TrivialDxilBinaryOperation(minOp, maxXMinVal, maxVal, hlslOP, Builder);
 }
 
 Value *TranslateClip(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
@@ -2287,8 +2277,7 @@ Value *TranslateExp(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
   }
   val = Builder.CreateFMul(log2eConst, val);
 
-  return TrivialDxilUnaryOperation(OP::OpCode::Exp, val, hlslOP, Builder,
-                                   helper.M.GetShaderModel()->IsSM69Plus());
+  return TrivialDxilUnaryOperation(OP::OpCode::Exp, val, hlslOP, Builder);
 }
 
 Value *TranslateLog(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
@@ -2305,8 +2294,7 @@ Value *TranslateLog(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
   }
 
   Value *log =
-      TrivialDxilUnaryOperation(OP::OpCode::Log, val, hlslOP, Builder,
-                                helper.M.GetShaderModel()->IsSM69Plus());
+      TrivialDxilUnaryOperation(OP::OpCode::Log, val, hlslOP, Builder);
 
   return Builder.CreateFMul(ln2Const, log);
 }
@@ -2325,8 +2313,7 @@ Value *TranslateLog10(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
         ConstantVector::getSplat(Ty->getVectorNumElements(), log2_10Const);
   }
   Value *log =
-      TrivialDxilUnaryOperation(OP::OpCode::Log, val, hlslOP, Builder,
-                                helper.M.GetShaderModel()->IsSM69Plus());
+      TrivialDxilUnaryOperation(OP::OpCode::Log, val, hlslOP, Builder);
 
   return Builder.CreateFMul(log2_10Const, log);
 }
@@ -2690,8 +2677,7 @@ Value *TranslateSmoothStep(CallInst *CI, IntrinsicOp IOP, OP::OpCode opcode,
   Value *satVal = Builder.CreateFDiv(xSubMin, maxSubMin);
 
   Value *s =
-      TrivialDxilUnaryOperation(DXIL::OpCode::Saturate, satVal, hlslOP, Builder,
-                                helper.M.GetShaderModel()->IsSM69Plus());
+      TrivialDxilUnaryOperation(DXIL::OpCode::Saturate, satVal, hlslOP, Builder);
   // return s * s *(3-2*s).
   Constant *c2 = ConstantFP::get(CI->getType(), 2);
   Constant *c3 = ConstantFP::get(CI->getType(), 3);
diff --git a/tools/clang/test/CodeGenDXIL/hlsl/types/longvec-scalarized-intrinsics.hlsl b/tools/clang/test/CodeGenDXIL/hlsl/types/longvec-scalarized-intrinsics.hlsl
@@ -1,147 +1,115 @@
-// RUN: %dxc -T ps_6_9 %s | FileCheck %s
+// RUN: %dxc -T lib_6_9 %s | FileCheck %s
 
 // Long vector tests for vec ops that scalarize to something more complex
 //  than a simple repetition of the same dx.op calls.
 
-StructuredBuffer< vector<float, 8> > buf;
-ByteAddressBuffer rbuf;
-
-float4 main(uint i : SV_PrimitiveID, bool b : B) : SV_Target {
-  vector<float, 8> vec1 = rbuf.Load< vector<float, 8> >(i++*32);
-  vector<float, 8> vec2 = rbuf.Load< vector<float, 8> >(i++*32);
-  vector<float, 8> vec3 = rbuf.Load< vector<float, 8> >(i++*32);
-
-  // CHECK: fdiv fast <8 x float>
-  // CHECK: call float @dx.op.unary.f32(i32 17, float %{{.*}}) ; Atan(value)
-  // CHECK: call float @dx.op.unary.f32(i32 17, float %{{.*}}) ; Atan(value)
-  // CHECK: call float @dx.op.unary.f32(i32 17, float %{{.*}}) ; Atan(value)
-  // CHECK: call float @dx.op.unary.f32(i32 17, float %{{.*}}) ; Atan(value)
-  // CHECK: call float @dx.op.unary.f32(i32 17, float %{{.*}}) ; Atan(value)
-  // CHECK: call float @dx.op.unary.f32(i32 17, float %{{.*}}) ; Atan(value)
-  // CHECK: call float @dx.op.unary.f32(i32 17, float %{{.*}}) ; Atan(value)
-  // CHECK: call float @dx.op.unary.f32(i32 17, float %{{.*}}) ; Atan(value)
-  // CHECK: fadd fast <8 x float> %{{.*}}, <float 0x
-  // CHECK: fadd fast <8 x float> %{{.*}}, <float 0x
-  // CHECK: fcmp fast olt <8 x float>
-  // CHECK: fcmp fast oeq <8 x float>
-  // CHECK: fcmp fast oge <8 x float>
-  // CHECK: fcmp fast olt <8 x float>
-  // CHECK: and <8 x i1>
-  // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float>
-  // CHECK: and <8 x i1>
-  // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float>
-  // CHECK: and <8 x i1>
-  // CHECK: select <8 x i1> %{{.*}}, <8 x float> <float 0x
-  // CHECK: and <8 x i1>
-  // CHECK: select <8 x i1> %{{.*}}, <8 x float> <float 0x
+// CHECK-LABEL: test_atan2
+// CHECK: fdiv fast <8 x float>
+// CHECK: call <8 x float> @dx.op.unary.v8f32(i32 17, <8 x float> %{{.*}}) ; Atan(value)
+// CHECK: fadd fast <8 x float> %{{.*}}, <float 0x
+// CHECK: fadd fast <8 x float> %{{.*}}, <float 0x
+// CHECK: fcmp fast olt <8 x float>
+// CHECK: fcmp fast oeq <8 x float>
+// CHECK: fcmp fast oge <8 x float>
+// CHECK: fcmp fast olt <8 x float>
+// CHECK: and <8 x i1>
+// CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float>
+// CHECK: and <8 x i1>
+// CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float>
+// CHECK: and <8 x i1>
+// CHECK: select <8 x i1> %{{.*}}, <8 x float> <float 0x
+// CHECK: and <8 x i1>
+// CHECK: select <8 x i1> %{{.*}}, <8 x float> <float 0x
+export void test_atan2(inout vector<float, 8> vec1, vector<float, 8> vec2) {
   vec1 = atan2(vec1, vec2);
+}
 
+// CHECK-LABEL: test_fmod
+// CHECK: fdiv fast <8 x float>
+// CHECK: fsub fast <8 x float> <float
+// CHECK: fcmp fast oge <8 x float>
+// CHECK: call <8 x float> @dx.op.unary.v8f32(i32 6, <8 x float> %{{.*}}) ; FAbs(value)
+// CHECK: call <8 x float> @dx.op.unary.v8f32(i32 22, <8 x float> %{{.*}}) ; Frc(value)
 
-  // CHECK: fdiv fast <8 x float>
-  // CHECK: fsub fast <8 x float> <float
-  // CHECK: fcmp fast oge <8 x float>
-  // CHECK: call float @dx.op.unary.f32(i32 6, float %{{.*}}) ; FAbs(value)
-  // CHECK: call float @dx.op.unary.f32(i32 6, float %{{.*}}) ; FAbs(value)
-  // CHECK: call float @dx.op.unary.f32(i32 6, float %{{.*}}) ; FAbs(value)
-  // CHECK: call float @dx.op.unary.f32(i32 6, float %{{.*}}) ; FAbs(value)
-  // CHECK: call float @dx.op.unary.f32(i32 6, float %{{.*}}) ; FAbs(value)
-  // CHECK: call float @dx.op.unary.f32(i32 6, float %{{.*}}) ; FAbs(value)
-  // CHECK: call float @dx.op.unary.f32(i32 6, float %{{.*}}) ; FAbs(value)
-  // CHECK: call float @dx.op.unary.f32(i32 6, float %{{.*}}) ; FAbs(value)
-
-  // CHECK: call float @dx.op.unary.f32(i32 22, float %{{.*}}) ; Frc(value)
-  // CHECK: call float @dx.op.unary.f32(i32 22, float %{{.*}}) ; Frc(value)
-  // CHECK: call float @dx.op.unary.f32(i32 22, float %{{.*}}) ; Frc(value)
-  // CHECK: call float @dx.op.unary.f32(i32 22, float %{{.*}}) ; Frc(value)
-  // CHECK: call float @dx.op.unary.f32(i32 22, float %{{.*}}) ; Frc(value)
-  // CHECK: call float @dx.op.unary.f32(i32 22, float %{{.*}}) ; Frc(value)
-  // CHECK: call float @dx.op.unary.f32(i32 22, float %{{.*}}) ; Frc(value)
-  // CHECK: call float @dx.op.unary.f32(i32 22, float %{{.*}}) ; Frc(value)
-
-  // CHECK: fsub fast <8 x float> <float
-  // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float>
-  // CHECK: fmul fast <8 x float>
+// CHECK: fsub fast <8 x float> <float
+// CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float>
+// CHECK: fmul fast <8 x float>
+export void test_fmod(inout vector<float, 8> vec1, vector<float, 8> vec2) {
   vec1 = fmod(vec1, vec2);
+}
+
+// CHECK-LABEL: test_ldexp
+// CHECK: call <8 x float> @dx.op.unary.v8f32(i32 21, <8 x float> %{{.*}}) ; Exp(value)
+// CHECK: fmul fast <8 x float>
 
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: fmul fast <8 x float>
+export void test_ldexp(inout vector<float, 8> vec1, vector<float, 8> vec2) {
   vec1 = ldexp(vec1, vec2);
+}
+
 
-  // CHECK: call float @dx.op.unary.f32(i32 23, float %{{.*}}) ; Log(value)
-  // CHECK: call float @dx.op.unary.f32(i32 23, float %{{.*}}) ; Log(value)
-  // CHECK: call float @dx.op.unary.f32(i32 23, float %{{.*}}) ; Log(value)
-  // CHECK: call float @dx.op.unary.f32(i32 23, float %{{.*}}) ; Log(value)
-  // CHECK: call float @dx.op.unary.f32(i32 23, float %{{.*}}) ; Log(value)
-  // CHECK: call float @dx.op.unary.f32(i32 23, float %{{.*}}) ; Log(value)
-  // CHECK: call float @dx.op.unary.f32(i32 23, float %{{.*}}) ; Log(value)
-  // CHECK: call float @dx.op.unary.f32(i32 23, float %{{.*}}) ; Log(value)
-  // CHECK: fmul fast <8 x float>
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
-  // CHECK: call float @dx.op.unary.f32(i32 21, float %{{.*}}) ; Exp(value)
+// CHECK-LABEL: test_pow
+// CHECK: call <8 x float> @dx.op.unary.v8f32(i32 23, <8 x float> %{{.*}}) ; Log(value)
+// CHECK: fmul fast <8 x float>
+// CHECK: call <8 x float> @dx.op.unary.v8f32(i32 21, <8 x float> %{{.*}}) ; Exp(value)
+export void test_pow(inout vector<float, 8> vec1, vector<float, 8> vec2) {
   vec1 = pow(vec1, vec2);
+}
 
-  // CHECK: call float @dx.op.unary.f32(i32 29, float %{{.*}}) ; Round_z(value)
-  // CHECK: call float @dx.op.unary.f32(i32 29, float %{{.*}}) ; Round_z(value)
-  // CHECK: call float @dx.op.unary.f32(i32 29, float %{{.*}}) ; Round_z(value)
-  // CHECK: call float @dx.op.unary.f32(i32 29, float %{{.*}}) ; Round_z(value)
-  // CHECK: call float @dx.op.unary.f32(i32 29, float %{{.*}}) ; Round_z(value)
-  // CHECK: call float @dx.op.unary.f32(i32 29, float %{{.*}}) ; Round_z(value)
-  // CHECK: call float @dx.op.unary.f32(i32 29, float %{{.*}}) ; Round_z(value)
-  // CHECK: call float @dx.op.unary.f32(i32 29, float %{{.*}}) ; Round_z(value)
-  // CHECK: fsub fast <8 x float>
+// CHECK-LABEL: test_modf
+// CHECK: call <8 x float>  @dx.op.unary.v8f32(i32 29, <8 x float>  %{{.*}}) ; Round_z(value)
+// CHECK: fsub fast <8 x float>
+export void test_modf(inout vector<float, 8> vec1, vector<float, 8> vec2) {
   vec1 = modf(vec1, vec2);
+}
 
-  // CHECK: [[el:%.*]] = extractelement <8 x float>
-  // CHECK: [[mul:%.*]] = fmul fast float [[el]]
-  // CHECK: [[ping:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[mul]]) ; FMad(a,b,c)
-  // CHECK: [[pong:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[ping]]) ; FMad(a,b,c)
-  // CHECK: [[ping:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[pong]]) ; FMad(a,b,c)
-  // CHECK: [[pong:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[ping]]) ; FMad(a,b,c)
-  // CHECK: [[ping:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[pong]]) ; FMad(a,b,c)
-  // CHECK: [[pong:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[ping]]) ; FMad(a,b,c)
-  // CHECK: [[ping:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[pong]]) ; FMad(a,b,c)
+// CHECK-LABEL: test_dot
+// CHECK: [[el:%.*]] = extractelement <8 x float>
+// CHECK: [[mul:%.*]] = fmul fast float [[el]]
+// CHECK: [[ping:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[mul]]) ; FMad(a,b,c)
+// CHECK: [[pong:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[ping]]) ; FMad(a,b,c)
+// CHECK: [[ping:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[pong]]) ; FMad(a,b,c)
+// CHECK: [[pong:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[ping]]) ; FMad(a,b,c)
+// CHECK: [[ping:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[pong]]) ; FMad(a,b,c)
+// CHECK: [[pong:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[ping]]) ; FMad(a,b,c)
+// CHECK: [[ping:%.*]] = call float @dx.op.tertiary.f32(i32 46, float %{{.*}}, float %{{.*}}, float [[pong]]) ; FMad(a,b,c)
+export void test_dot(inout vector<float, 8> vec1, vector<float, 8> vec2) {
   vec1 = dot(vec1, vec2);
+}
 
-  vector<bool, 8> bvec = b;
-  // CHECK: or i1
-  // CHECK: or i1
-  // CHECK: or i1
-  // CHECK: or i1
-  // CHECK: or i1
-  // CHECK: or i1
-  // CHECK: or i1
+// CHECK-LABEL: test_any
+// CHECK: or i1
+// CHECK: or i1
+// CHECK: or i1
+// CHECK: or i1
+// CHECK: or i1
+// CHECK: or i1
+// CHECK: or i1
+export void test_any(vector<float, 8> vec1, inout vector<bool, 8> bvec) {
   bvec &= any(vec1);
+}
 
-  // CHECK: and i1
-  // CHECK: and i1
-  // CHECK: and i1
-  // CHECK: and i1
-  // CHECK: and i1
-  // CHECK: and i1
-  // CHECK: and i1
-  bvec &= all(vec2);
+// CHECK-LABEL: test_all
+// CHECK: and i1
+// CHECK: and i1
+// CHECK: and i1
+// CHECK: and i1
+// CHECK: and i1
+// CHECK: and i1
+// CHECK: and i1
+export void test_all(vector<float, 8> vec1, inout vector<bool, 8> bvec) {
+  bvec &= all(vec1);
+}
 
-  // call {{.*}} @dx.op.wave
-  // call {{.*}} @dx.op.wave
-  // call {{.*}} @dx.op.wave
-  // call {{.*}} @dx.op.wave
-  // call {{.*}} @dx.op.wave
-  // call {{.*}} @dx.op.wave
-  // call {{.*}} @dx.op.wave
-  // call {{.*}} @dx.op.wave
-  // call {{.*}} @dx.op.wave
+// CHECK-LABEL: test_WaveMatch
+// call {{.*}} @dx.op.wave
+// call {{.*}} @dx.op.wave
+// call {{.*}} @dx.op.wave
+// call {{.*}} @dx.op.wave
+// call {{.*}} @dx.op.wave
+// call {{.*}} @dx.op.wave
+// call {{.*}} @dx.op.wave
+// call {{.*}} @dx.op.wave
+// call {{.*}} @dx.op.wave
+export uint4 test_WaveMatch(vector<bool, 8> bvec) {
   return WaveMatch(bvec);
 }
diff --git a/tools/clang/test/CodeGenDXIL/hlsl/types/longvec-trivial-scalarized-intrinsics.hlsl b/tools/clang/test/CodeGenDXIL/hlsl/types/longvec-trivial-scalarized-intrinsics.hlsl