microsoft
diff --git a/‎projects/dxilconv/lib/DxbcConverter/DxbcConverter.cpp‎
Lines changed: 3 additions & 3 deletions b/‎projects/dxilconv/lib/DxbcConverter/DxbcConverter.cpp‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎projects/dxilconv/test/dxbc2dxil/icb1.ref‎
Lines changed: 94 additions & 117 deletions b/‎projects/dxilconv/test/dxbc2dxil/icb1.ref‎
Lines changed: 94 additions & 117 deletions
diff --git a/‎projects/dxilconv/test/dxbc2dxil/icb2.dxbc‎
-708 Bytes b/‎projects/dxilconv/test/dxbc2dxil/icb2.dxbc‎
-708 Bytes
diff --git a/‎projects/dxilconv/test/dxbc2dxil/icb2.hlsl‎
Lines changed: 0 additions & 16 deletions b/‎projects/dxilconv/test/dxbc2dxil/icb2.hlsl‎
Lines changed: 0 additions & 16 deletions
diff --git a/‎projects/dxilconv/test/dxbc2dxil/icb2.ref‎
Lines changed: 0 additions & 66 deletions b/‎projects/dxilconv/test/dxbc2dxil/icb2.ref‎
Lines changed: 0 additions & 66 deletions
@@ -2127,9 +2127,9 @@ void DxbcConverter::ConvertInstructions(D3D10ShaderBinary::CShaderCodeParser &Pa
         unsigned Size = Inst.m_CustomData.DataSizeInBytes >> 2;
         DXASSERT_DXBC(m_pIcbGV == nullptr && Inst.m_CustomData.DataSizeInBytes == Size*4);
 
-        llvm::Constant *pIcbData = ConstantDataArray::get(m_Ctx, ArrayRef<uint32_t>((uint32_t*)Inst.m_CustomData.pData, Size));
+        llvm::Constant *pIcbData = ConstantDataArray::get(m_Ctx, ArrayRef<float>((float*)Inst.m_CustomData.pData, Size));
         m_pIcbGV = new GlobalVariable(*m_pModule, pIcbData->getType(), true, GlobalValue::InternalLinkage,
-                                      pIcbData, "dx.icb", nullptr,
+                                      pIcbData, "dx.icb", nullptr, 
                                       GlobalVariable::NotThreadLocal, DXIL::kImmediateCBufferAddrSpace);
       }
       break;
@@ -6074,7 +6074,7 @@ void DxbcConverter::LoadOperand(OperandValue &SrcVal,
         Value *pPtr = m_pBuilder->CreateGEP(m_pIcbGV, pGEPIndices);
         LoadInst *pLoad = m_pBuilder->CreateLoad(pPtr);
         pLoad->setAlignment(kRegCompAlignment);
-        Value *pValue = CastDxbcValue(pLoad, CompType::getU32(), ValueType);
+        Value *pValue = CastDxbcValue(pLoad, CompType::getF32(), ValueType);
         pValue = ApplyOperandModifiers(pValue, O);
 
         OVH.SetValue(pValue);
 
@@ -1,5 +1,5 @@
 
-@dx.icb = internal addrspace(5) constant [16 x i32] [i32 1065353216, i32 0, i32 0, i32 0, i32 0, i32 1065353216, i32 0, i32 0, i32 0, i32 0, i32 1065353216, i32 0, i32 0, i32 0, i32 0, i32 1065353216]
+@dx.icb = internal addrspace(5) constant [16 x float] [float 1.000000e+00, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00, float 1.000000e+00, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00, float 1.000000e+00, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00, float 1.000000e+00]
 
 define void @main() {
 entry:
@@ -11,122 +11,102 @@ entry:
   %5 = call float @dx.op.loadInput.f32(i32 4, i32 0, i32 0, i8 3, i32 undef)
   %6 = mul i32 %1, 4
   %7 = add i32 %6, 0
-  %8 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %7
-  %9 = load i32, i32 addrspace(5)* %8, align 4
-  %10 = call float @dx.op.bitcastI32toF32(i32 126, i32 %9)
-  %11 = mul i32 %1, 4
-  %12 = add i32 %11, 1
-  %13 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %12
-  %14 = load i32, i32 addrspace(5)* %13, align 4
-  %15 = call float @dx.op.bitcastI32toF32(i32 126, i32 %14)
-  %16 = mul i32 %1, 4
-  %17 = add i32 %16, 2
-  %18 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %17
-  %19 = load i32, i32 addrspace(5)* %18, align 4
-  %20 = call float @dx.op.bitcastI32toF32(i32 126, i32 %19)
-  %21 = mul i32 %1, 4
-  %22 = add i32 %21, 3
-  %23 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %22
-  %24 = load i32, i32 addrspace(5)* %23, align 4
-  %25 = call float @dx.op.bitcastI32toF32(i32 126, i32 %24)
-  %26 = call float @dx.op.dot4.f32(i32 56, float %2, float %3, float %4, float %5, float %10, float %15, float %20, float %25)
-  %27 = call float @dx.op.loadInput.f32(i32 4, i32 1, i32 0, i8 0, i32 undef)
-  %28 = call float @dx.op.loadInput.f32(i32 4, i32 1, i32 0, i8 1, i32 undef)
-  %29 = call float @dx.op.loadInput.f32(i32 4, i32 1, i32 0, i8 2, i32 undef)
-  %30 = call float @dx.op.loadInput.f32(i32 4, i32 1, i32 0, i8 3, i32 undef)
+  %8 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %7
+  %9 = load float, float addrspace(5)* %8, align 4
+  %10 = mul i32 %1, 4
+  %11 = add i32 %10, 1
+  %12 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %11
+  %13 = load float, float addrspace(5)* %12, align 4
+  %14 = mul i32 %1, 4
+  %15 = add i32 %14, 2
+  %16 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %15
+  %17 = load float, float addrspace(5)* %16, align 4
+  %18 = mul i32 %1, 4
+  %19 = add i32 %18, 3
+  %20 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %19
+  %21 = load float, float addrspace(5)* %20, align 4
+  %22 = call float @dx.op.dot4.f32(i32 56, float %2, float %3, float %4, float %5, float %9, float %13, float %17, float %21)
+  %23 = call float @dx.op.loadInput.f32(i32 4, i32 1, i32 0, i8 0, i32 undef)
+  %24 = call float @dx.op.loadInput.f32(i32 4, i32 1, i32 0, i8 1, i32 undef)
+  %25 = call float @dx.op.loadInput.f32(i32 4, i32 1, i32 0, i8 2, i32 undef)
+  %26 = call float @dx.op.loadInput.f32(i32 4, i32 1, i32 0, i8 3, i32 undef)
+  %27 = mul i32 %1, 4
+  %28 = add i32 %27, 0
+  %29 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %28
+  %30 = load float, float addrspace(5)* %29, align 4
   %31 = mul i32 %1, 4
-  %32 = add i32 %31, 0
-  %33 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %32
-  %34 = load i32, i32 addrspace(5)* %33, align 4
-  %35 = call float @dx.op.bitcastI32toF32(i32 126, i32 %34)
-  %36 = mul i32 %1, 4
-  %37 = add i32 %36, 1
-  %38 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %37
-  %39 = load i32, i32 addrspace(5)* %38, align 4
-  %40 = call float @dx.op.bitcastI32toF32(i32 126, i32 %39)
-  %41 = mul i32 %1, 4
-  %42 = add i32 %41, 2
-  %43 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %42
-  %44 = load i32, i32 addrspace(5)* %43, align 4
-  %45 = call float @dx.op.bitcastI32toF32(i32 126, i32 %44)
-  %46 = mul i32 %1, 4
-  %47 = add i32 %46, 3
-  %48 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %47
-  %49 = load i32, i32 addrspace(5)* %48, align 4
-  %50 = call float @dx.op.bitcastI32toF32(i32 126, i32 %49)
-  %51 = call float @dx.op.dot4.f32(i32 56, float %27, float %28, float %29, float %30, float %35, float %40, float %45, float %50)
-  %52 = call float @dx.op.loadInput.f32(i32 4, i32 2, i32 0, i8 0, i32 undef)
-  %53 = call float @dx.op.loadInput.f32(i32 4, i32 2, i32 0, i8 1, i32 undef)
-  %54 = call float @dx.op.loadInput.f32(i32 4, i32 2, i32 0, i8 2, i32 undef)
-  %55 = call float @dx.op.loadInput.f32(i32 4, i32 2, i32 0, i8 3, i32 undef)
+  %32 = add i32 %31, 1
+  %33 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %32
+  %34 = load float, float addrspace(5)* %33, align 4
+  %35 = mul i32 %1, 4
+  %36 = add i32 %35, 2
+  %37 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %36
+  %38 = load float, float addrspace(5)* %37, align 4
+  %39 = mul i32 %1, 4
+  %40 = add i32 %39, 3
+  %41 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %40
+  %42 = load float, float addrspace(5)* %41, align 4
+  %43 = call float @dx.op.dot4.f32(i32 56, float %23, float %24, float %25, float %26, float %30, float %34, float %38, float %42)
+  %44 = call float @dx.op.loadInput.f32(i32 4, i32 2, i32 0, i8 0, i32 undef)
+  %45 = call float @dx.op.loadInput.f32(i32 4, i32 2, i32 0, i8 1, i32 undef)
+  %46 = call float @dx.op.loadInput.f32(i32 4, i32 2, i32 0, i8 2, i32 undef)
+  %47 = call float @dx.op.loadInput.f32(i32 4, i32 2, i32 0, i8 3, i32 undef)
+  %48 = mul i32 %1, 4
+  %49 = add i32 %48, 0
+  %50 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %49
+  %51 = load float, float addrspace(5)* %50, align 4
+  %52 = mul i32 %1, 4
+  %53 = add i32 %52, 1
+  %54 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %53
+  %55 = load float, float addrspace(5)* %54, align 4
   %56 = mul i32 %1, 4
-  %57 = add i32 %56, 0
-  %58 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %57
-  %59 = load i32, i32 addrspace(5)* %58, align 4
-  %60 = call float @dx.op.bitcastI32toF32(i32 126, i32 %59)
-  %61 = mul i32 %1, 4
-  %62 = add i32 %61, 1
-  %63 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %62
-  %64 = load i32, i32 addrspace(5)* %63, align 4
-  %65 = call float @dx.op.bitcastI32toF32(i32 126, i32 %64)
-  %66 = mul i32 %1, 4
-  %67 = add i32 %66, 2
-  %68 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %67
-  %69 = load i32, i32 addrspace(5)* %68, align 4
-  %70 = call float @dx.op.bitcastI32toF32(i32 126, i32 %69)
-  %71 = mul i32 %1, 4
-  %72 = add i32 %71, 3
-  %73 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %72
-  %74 = load i32, i32 addrspace(5)* %73, align 4
-  %75 = call float @dx.op.bitcastI32toF32(i32 126, i32 %74)
-  %76 = call float @dx.op.dot4.f32(i32 56, float %52, float %53, float %54, float %55, float %60, float %65, float %70, float %75)
-  %77 = call float @dx.op.loadInput.f32(i32 4, i32 3, i32 0, i8 0, i32 undef)
-  %78 = call float @dx.op.loadInput.f32(i32 4, i32 3, i32 0, i8 1, i32 undef)
-  %79 = call float @dx.op.loadInput.f32(i32 4, i32 3, i32 0, i8 2, i32 undef)
-  %80 = call float @dx.op.loadInput.f32(i32 4, i32 3, i32 0, i8 3, i32 undef)
+  %57 = add i32 %56, 2
+  %58 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %57
+  %59 = load float, float addrspace(5)* %58, align 4
+  %60 = mul i32 %1, 4
+  %61 = add i32 %60, 3
+  %62 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %61
+  %63 = load float, float addrspace(5)* %62, align 4
+  %64 = call float @dx.op.dot4.f32(i32 56, float %44, float %45, float %46, float %47, float %51, float %55, float %59, float %63)
+  %65 = call float @dx.op.loadInput.f32(i32 4, i32 3, i32 0, i8 0, i32 undef)
+  %66 = call float @dx.op.loadInput.f32(i32 4, i32 3, i32 0, i8 1, i32 undef)
+  %67 = call float @dx.op.loadInput.f32(i32 4, i32 3, i32 0, i8 2, i32 undef)
+  %68 = call float @dx.op.loadInput.f32(i32 4, i32 3, i32 0, i8 3, i32 undef)
+  %69 = mul i32 %1, 4
+  %70 = add i32 %69, 0
+  %71 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %70
+  %72 = load float, float addrspace(5)* %71, align 4
+  %73 = mul i32 %1, 4
+  %74 = add i32 %73, 1
+  %75 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %74
+  %76 = load float, float addrspace(5)* %75, align 4
+  %77 = mul i32 %1, 4
+  %78 = add i32 %77, 2
+  %79 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %78
+  %80 = load float, float addrspace(5)* %79, align 4
   %81 = mul i32 %1, 4
-  %82 = add i32 %81, 0
-  %83 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %82
-  %84 = load i32, i32 addrspace(5)* %83, align 4
-  %85 = call float @dx.op.bitcastI32toF32(i32 126, i32 %84)
-  %86 = mul i32 %1, 4
-  %87 = add i32 %86, 1
-  %88 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %87
-  %89 = load i32, i32 addrspace(5)* %88, align 4
-  %90 = call float @dx.op.bitcastI32toF32(i32 126, i32 %89)
-  %91 = mul i32 %1, 4
-  %92 = add i32 %91, 2
-  %93 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %92
-  %94 = load i32, i32 addrspace(5)* %93, align 4
-  %95 = call float @dx.op.bitcastI32toF32(i32 126, i32 %94)
-  %96 = mul i32 %1, 4
-  %97 = add i32 %96, 3
-  %98 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %97
-  %99 = load i32, i32 addrspace(5)* %98, align 4
-  %100 = call float @dx.op.bitcastI32toF32(i32 126, i32 %99)
-  %101 = call float @dx.op.dot4.f32(i32 56, float %77, float %78, float %79, float %80, float %85, float %90, float %95, float %100)
-  %102 = mul i32 %0, 4
-  %103 = add i32 %102, 0
-  %104 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %103
-  %105 = load i32, i32 addrspace(5)* %104, align 4
-  %106 = call float @dx.op.bitcastI32toF32(i32 126, i32 %105)
-  %107 = mul i32 %0, 4
-  %108 = add i32 %107, 1
-  %109 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %108
-  %110 = load i32, i32 addrspace(5)* %109, align 4
-  %111 = call float @dx.op.bitcastI32toF32(i32 126, i32 %110)
-  %112 = mul i32 %0, 4
-  %113 = add i32 %112, 2
-  %114 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %113
-  %115 = load i32, i32 addrspace(5)* %114, align 4
-  %116 = call float @dx.op.bitcastI32toF32(i32 126, i32 %115)
-  %117 = mul i32 %0, 4
-  %118 = add i32 %117, 3
-  %119 = getelementptr [16 x i32], [16 x i32] addrspace(5)* @dx.icb, i32 0, i32 %118
-  %120 = load i32, i32 addrspace(5)* %119, align 4
-  %121 = call float @dx.op.bitcastI32toF32(i32 126, i32 %120)
-  %122 = call float @dx.op.dot4.f32(i32 56, float %26, float %51, float %76, float %101, float %106, float %111, float %116, float %121)
-  call void @dx.op.storeOutput.f32(i32 5, i32 0, i32 0, i8 0, float %122)
+  %82 = add i32 %81, 3
+  %83 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %82
+  %84 = load float, float addrspace(5)* %83, align 4
+  %85 = call float @dx.op.dot4.f32(i32 56, float %65, float %66, float %67, float %68, float %72, float %76, float %80, float %84)
+  %86 = mul i32 %0, 4
+  %87 = add i32 %86, 0
+  %88 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %87
+  %89 = load float, float addrspace(5)* %88, align 4
+  %90 = mul i32 %0, 4
+  %91 = add i32 %90, 1
+  %92 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %91
+  %93 = load float, float addrspace(5)* %92, align 4
+  %94 = mul i32 %0, 4
+  %95 = add i32 %94, 2
+  %96 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %95
+  %97 = load float, float addrspace(5)* %96, align 4
+  %98 = mul i32 %0, 4
+  %99 = add i32 %98, 3
+  %100 = getelementptr [16 x float], [16 x float] addrspace(5)* @dx.icb, i32 0, i32 %99
+  %101 = load float, float addrspace(5)* %100, align 4
+  %102 = call float @dx.op.dot4.f32(i32 56, float %22, float %43, float %64, float %85, float %89, float %93, float %97, float %101)
+  call void @dx.op.storeOutput.f32(i32 5, i32 0, i32 0, i8 0, float %102)
   ret void
 }
 
@@ -145,9 +125,6 @@ declare float @dx.op.loadInput.f32(i32, i32, i32, i8, i32) #0
 ; Function Attrs: nounwind readonly
 declare i32 @dx.op.tempRegLoad.i32(i32, i32) #2
 
-; Function Attrs: nounwind readnone
-declare float @dx.op.bitcastI32toF32(i32, i32) #0
-
 ; Function Attrs: nounwind
 declare void @dx.op.tempRegStore.f32(i32, i32, float) #1