dotnet · echesakov · Jan 28, 2021 · Jan 22, 2021 · Jan 22, 2021 · Jan 22, 2021
diff --git a/src/coreclr/jit/hwintrinsic.cpp b/src/coreclr/jit/hwintrinsic.cpp
@@ -1062,6 +1062,18 @@ GenTree* Compiler::impHWIntrinsic(NamedIntrinsic        intrinsic,
                         retNode->AsHWIntrinsic()->SetAuxiliaryType(getBaseTypeOfSIMDType(sigReader.op2ClsHnd));
                         break;
 
+                    case NI_ArmBase_Arm64_MultiplyHigh:
+                        if (sig->retType == CORINFO_TYPE_ULONG)
+                        {
+                            retNode->AsHWIntrinsic()->gtSIMDBaseType = TYP_ULONG;
+                        }
+                        else
+                        {
+                            assert(sig->retType == CORINFO_TYPE_LONG);
+                            retNode->AsHWIntrinsic()->gtSIMDBaseType = TYP_LONG;
+                        }
+                        break;
+
                     default:
                         break;
                 }

diff --git a/src/coreclr/jit/hwintrinsiclistarm64.h b/src/coreclr/jit/hwintrinsiclistarm64.h
@@ -530,6 +530,7 @@ HARDWARE_INTRINSIC(ArmBase,       ReverseElementBits,
 //  Base 64-bit only Intrinsics
 HARDWARE_INTRINSIC(ArmBase_Arm64, LeadingSignCount,                                                  0,      1,     {INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_cls,            INS_invalid,        INS_cls,            INS_invalid,        INS_invalid,        INS_invalid},     HW_Category_Scalar,                HW_Flag_BaseTypeFromFirstArg|HW_Flag_NoFloatingPointUsed)
 HARDWARE_INTRINSIC(ArmBase_Arm64, LeadingZeroCount,                                                  0,      1,     {INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_clz,            INS_clz,            INS_invalid,        INS_invalid},     HW_Category_Scalar,                HW_Flag_BaseTypeFromFirstArg|HW_Flag_NoFloatingPointUsed)
+HARDWARE_INTRINSIC(ArmBase_Arm64, MultiplyHigh,                                                      0,      2,     {INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_smulh,          INS_umulh,          INS_invalid,        INS_invalid},     HW_Category_Scalar,                HW_Flag_NoFloatingPointUsed)
 HARDWARE_INTRINSIC(ArmBase_Arm64, ReverseElementBits,                                                0,      1,     {INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_invalid,        INS_rbit,           INS_rbit,           INS_invalid,        INS_invalid},     HW_Category_Scalar,                HW_Flag_NoFloatingPointUsed)
 
 // ***************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************

diff --git a/src/libraries/System.Private.CoreLib/src/System/Math.cs b/src/libraries/System.Private.CoreLib/src/System/Math.cs
@@ -151,6 +151,11 @@ public static unsafe ulong BigMul(ulong a, ulong b, out ulong low)
                 low = tmp;
                 return high;
             }
+            else if (ArmBase.Arm64.IsSupported)
 EMIT_NEW_ICONST (cfg, ins, supported ? 1 : 0); 
 <ExcludeList Include = "$(XunitTestBinBase)/JIT/HardwareIntrinsics/Arm/ArmBase.Arm64/ArmBase.Arm64_ro/**"> 
 EMIT_NEW_ICONST (cfg, ins, supported ? 1 : 0); 
 <ExcludeList Include = "$(XunitTestBinBase)/JIT/HardwareIntrinsics/Arm/ArmBase.Arm64/ArmBase.Arm64_ro/**"> 
+            {
+                low = a * b;
+                return ArmBase.Arm64.MultiplyHigh(a, b);
+            }
 
             return SoftwareFallback(a, b, out low);
 
@@ -185,6 +190,12 @@ static ulong SoftwareFallback(ulong a, ulong b, out ulong low)
         /// <returns>The high 64-bit of the product of the specied numbers.</returns>
         public static long BigMul(long a, long b, out long low)
         {
+            if (ArmBase.Arm64.IsSupported)
+            {
+                low = a * b;
+                return ArmBase.Arm64.MultiplyHigh(a, b);
+            }
+
             ulong high = BigMul((ulong)a, (ulong)b, out ulong ulow);
             low = (long)ulow;
             return (long)high - ((a >> 63) & b) - ((b >> 63) & a);

diff --git a/.../System.Private.CoreLib/src/System/Runtime/Intrinsics/Arm/ArmBase.PlatformNotSupported.cs b/.../System.Private.CoreLib/src/System/Runtime/Intrinsics/Arm/ArmBase.PlatformNotSupported.cs
@@ -47,6 +47,16 @@ internal Arm64() { }
             /// </summary>
             public static int LeadingZeroCount(ulong value) { throw new PlatformNotSupportedException(); }
 
+            /// <summary>
+            ///   A64: SMULH Xd, Xn, Xm
+            /// </summary>
+            public static long MultiplyHigh(long left, long right) { throw new PlatformNotSupportedException(); }
+
+            /// <summary>
+            ///   A64: UMULH Xd, Xn, Xm
+            /// </summary>
+            public static ulong MultiplyHigh(ulong left, ulong right) { throw new PlatformNotSupportedException(); }
+
             /// <summary>
             ///   A64: RBIT Xd, Xn
             /// </summary>

diff --git a/src/libraries/System.Private.CoreLib/src/System/Runtime/Intrinsics/Arm/ArmBase.cs b/src/libraries/System.Private.CoreLib/src/System/Runtime/Intrinsics/Arm/ArmBase.cs
@@ -43,6 +43,16 @@ internal Arm64() { }
             /// </summary>
             public static int LeadingZeroCount(ulong value) => LeadingZeroCount(value);
 
+            /// <summary>
+            ///   A64: SMULH Xd, Xn, Xm
+            /// </summary>
+            public static long MultiplyHigh(long left, long right) => MultiplyHigh(left, right);
+
+            /// <summary>
+            ///   A64: UMULH Xd, Xn, Xm
+            /// </summary>
+            public static ulong MultiplyHigh(ulong left, ulong right) => MultiplyHigh(left, right);
+
             /// <summary>
             ///   A64: RBIT Xd, Xn
             /// </summary>

diff --git a/src/libraries/System.Runtime.Intrinsics/ref/System.Runtime.Intrinsics.cs b/src/libraries/System.Runtime.Intrinsics/ref/System.Runtime.Intrinsics.cs
@@ -2563,6 +2563,8 @@ internal Arm64() { }
             public static int LeadingSignCount(long value) { throw null; }
             public static int LeadingZeroCount(long value) { throw null; }
             public static int LeadingZeroCount(ulong value) { throw null; }
+            public static long MultiplyHigh(long left, long right) { throw null; }
+            public static ulong MultiplyHigh(ulong left, ulong right) { throw null; }
             public static long ReverseElementBits(long value) { throw null; }
             public static ulong ReverseElementBits(ulong value) { throw null; }
         }

diff --git a/src/mono/mono/mini/mini-llvm.c b/src/mono/mono/mini/mini-llvm.c
@@ -9086,6 +9086,22 @@ process_bb (EmitContext *ctx, MonoBasicBlock *bb)
 			values [ins->dreg] = LLVMBuildCall (builder, get_intrins (ctx, ins->opcode == OP_LSCNT32 ? INTRINS_CTLZ_I32 : INTRINS_CTLZ_I64), args, 2, "");
 			break;
 		}
+		case OP_ARM64_SMULH:
+		case OP_ARM64_UMULH: {
+			LLVMValueRef op1, op2;
+			if (ins->opcode == OP_ARM64_SMULH) {
+				op1 = LLVMBuildSExt (builder, lhs, LLVMInt128Type (), "");
+				op2 = LLVMBuildSExt (builder, rhs, LLVMInt128Type (), "");
+			} else {
+				op1 = LLVMBuildZExt (builder, lhs, LLVMInt128Type (), "");
+				op2 = LLVMBuildZExt (builder, rhs, LLVMInt128Type (), "");
+			}
+			LLVMValueRef mul = LLVMBuildMul (builder, op1, op2, "");
+			LLVMValueRef hi64 = LLVMBuildLShr (builder, mul,
+				LLVMConstInt (LLVMInt128Type (), 64, FALSE), "");
+			values [ins->dreg] = LLVMBuildTrunc (builder, hi64, LLVMInt64Type (), "");
+			break;
+		}
 #endif
 
 		case OP_DUMMY_USE:

diff --git a/src/mono/mono/mini/mini-ops.h b/src/mono/mono/mini/mini-ops.h
@@ -1578,4 +1578,6 @@ MINI_OP(OP_POPCNT64, "popcnt64", LREG, LREG, NONE)
 #ifdef TARGET_ARM64
 MINI_OP(OP_LSCNT32, "lscnt32", IREG, IREG, NONE)
 MINI_OP(OP_LSCNT64, "lscnt64", LREG, LREG, NONE)
+MINI_OP(OP_ARM64_SMULH, "arm64_smulh", LREG, LREG, LREG)
+MINI_OP(OP_ARM64_UMULH, "arm64_umulh", LREG, LREG, LREG)
 #endif // TARGET_ARM64
diff --git a/src/mono/mono/mini/simd-intrinsics-netcore.c b/src/mono/mono/mini/simd-intrinsics-netcore.c
@@ -807,6 +807,7 @@ emit_invalid_operation (MonoCompile *cfg, const char* message)
 static SimdIntrinsic armbase_methods [] = {
 	{SN_LeadingSignCount},
 	{SN_LeadingZeroCount},
+	{SN_MultiplyHigh},
 	{SN_ReverseElementBits},
 	{SN_get_IsSupported}
 };
@@ -847,6 +848,9 @@ emit_arm64_intrinsics (MonoCompile *cfg, MonoMethod *cmethod, MonoMethodSignatur
 			return emit_simd_ins_for_sig (cfg, klass, arg0_i32 ? OP_LZCNT32 : OP_LZCNT64, 0, arg0_type, fsig, args);
 		case SN_LeadingSignCount:
 			return emit_simd_ins_for_sig (cfg, klass, arg0_i32 ? OP_LSCNT32 : OP_LSCNT64, 0, arg0_type, fsig, args);
+		case SN_MultiplyHigh:
+			return emit_simd_ins_for_sig (cfg, klass,
+				(arg0_type == MONO_TYPE_I8 ? OP_ARM64_SMULH : OP_ARM64_UMULH), 0, arg0_type, fsig, args);
 		case SN_ReverseElementBits:
 			return emit_simd_ins_for_sig (cfg, klass,
 				(is_64bit ? OP_XOP_I8_I8 : OP_XOP_I4_I4),

diff --git a/src/tests/JIT/HardwareIntrinsics/Arm/ArmBase.Arm64/ArmBase.Arm64_r.csproj b/src/tests/JIT/HardwareIntrinsics/Arm/ArmBase.Arm64/ArmBase.Arm64_r.csproj
@@ -12,6 +12,8 @@
     <Compile Include="LeadingSignCount.Int64.cs" />
     <Compile Include="LeadingZeroCount.Int64.cs" />
     <Compile Include="LeadingZeroCount.UInt64.cs" />
+    <Compile Include="MultiplyHigh.Int64.cs" />
+    <Compile Include="MultiplyHigh.UInt64.cs" />
     <Compile Include="ReverseElementBits.Int64.cs" />
     <Compile Include="ReverseElementBits.UInt64.cs" />
     <Compile Include="Program.ArmBase.Arm64.cs" />

diff --git a/src/tests/JIT/HardwareIntrinsics/Arm/ArmBase.Arm64/ArmBase.Arm64_ro.csproj b/src/tests/JIT/HardwareIntrinsics/Arm/ArmBase.Arm64/ArmBase.Arm64_ro.csproj
@@ -12,6 +12,8 @@
     <Compile Include="LeadingSignCount.Int64.cs" />
     <Compile Include="LeadingZeroCount.Int64.cs" />
     <Compile Include="LeadingZeroCount.UInt64.cs" />
+    <Compile Include="MultiplyHigh.Int64.cs" />
+    <Compile Include="MultiplyHigh.UInt64.cs" />
     <Compile Include="ReverseElementBits.Int64.cs" />
     <Compile Include="ReverseElementBits.UInt64.cs" />
     <Compile Include="Program.ArmBase.Arm64.cs" />