[Perf] Linux/arm64: 39 Improvements on 7/10/2024 6:51:07 AM #38492

performanceautofiler · 2024-07-18T08:16:05Z

Run Information

Name	Value
Architecture	arm64
OS	ubuntu 22.04
Queue	AmpereUbuntu
Baseline	0bfb733c6419e78e55286e0d01c5994a337c486a
Compare	029007daba42d17965555f63a3f5d138cf76ecb9
Diff	Diff
Configs	CompilationMode:tiered, RunKind:micro

Improvements in System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>

Benchmark	Baseline	Test	Test/Base	Test Quality	Edge Detector
MaxMagnitude_Vector - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	194.18 ns	137.22 ns	0.71	0.02	False
MaxMagnitude_Scalar - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	3.20 μs	2.88 μs	0.90	0.00	True
MaxMagnitude_Vector - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	3.48 μs	2.94 μs	0.85	0.01	True
Max_Vector - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	81.00 ns	45.22 ns	0.56	0.05	False
Max_Scalar - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	73.15 ns	38.45 ns	0.53	0.01	False
MaxMagnitude_Scalar - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	178.07 ns	130.68 ns	0.73	0.02	False

Test Report

Repro

General Docs link: https://github.com/dotnet/performance/blob/main/docs/benchmarking-workflow-dotnet-runtime.md

git clone https://github.com/dotnet/performance.git
python3 .\performance\scripts\benchmarks_ci.py -f net8.0 --filter 'System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives&lt;Double&gt;*'

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.MaxMagnitude_Vector(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.MaxMagnitude_Scalar(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.MaxMagnitude_Vector(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.Max_Vector(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.Max_Scalar(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.MaxMagnitude_Scalar(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

Docs

Profiling workflow for dotnet/runtime repository
Benchmarking workflow for dotnet/runtime repository

Run Information

Name	Value
Architecture	arm64
OS	ubuntu 22.04
Queue	AmpereUbuntu
Baseline	0bfb733c6419e78e55286e0d01c5994a337c486a
Compare	029007daba42d17965555f63a3f5d138cf76ecb9
Diff	Diff
Configs	CompilationMode:tiered, RunKind:micro

Improvements in System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>

Benchmark	Baseline	Test	Test/Base	Test Quality	Edge Detector
MaxMagnitude_Vector - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	122.54 ns	84.26 ns	0.69	0.01	False
Max - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	22.98 ns	21.42 ns	0.93	0.09	False
MaxMagnitude_Scalar - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	112.58 ns	73.14 ns	0.65	0.02	False
MaxMagnitude_Scalar - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	1.60 μs	1.49 μs	0.93	0.00	False

Test Report

Repro

General Docs link: https://github.com/dotnet/performance/blob/main/docs/benchmarking-workflow-dotnet-runtime.md

git clone https://github.com/dotnet/performance.git
python3 .\performance\scripts\benchmarks_ci.py -f net8.0 --filter 'System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives&lt;Int32&gt;*'

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>.MaxMagnitude_Vector(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>.Max(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>.MaxMagnitude_Scalar(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>.MaxMagnitude_Scalar(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

Docs

Profiling workflow for dotnet/runtime repository
Benchmarking workflow for dotnet/runtime repository

Run Information

Name	Value
Architecture	arm64
OS	ubuntu 22.04
Queue	AmpereUbuntu
Baseline	0bfb733c6419e78e55286e0d01c5994a337c486a
Compare	029007daba42d17965555f63a3f5d138cf76ecb9
Diff	Diff
Configs	CompilationMode:tiered, RunKind:micro

Improvements in System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>

Benchmark	Baseline	Test	Test/Base	Test Quality	Edge Detector
Log - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	7.68 μs	5.90 μs	0.77	0.01	False
Truncate - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	67.40 ns	30.61 ns	0.45	0.03	True
Exp - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	8.62 μs	7.12 μs	0.83	0.01	True
Sinh - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	11.79 μs	10.17 μs	0.86	0.00	True
Exp - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	380.14 ns	313.77 ns	0.83	0.00	True
Log - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	332.51 ns	257.49 ns	0.77	0.01	False
Round - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	69.48 ns	31.87 ns	0.46	0.00	True
Truncate - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	1.44 μs	555.34 ns	0.38	0.06	True
Sigmoid - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	9.47 μs	7.96 μs	0.84	0.00	True
Round - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	1.44 μs	555.32 ns	0.39	0.00	True
Sinh - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	519.47 ns	450.51 ns	0.87	0.00	True
Sigmoid - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	405.58 ns	341.93 ns	0.84	0.00	True

Test Report

Repro

General Docs link: https://github.com/dotnet/performance/blob/main/docs/benchmarking-workflow-dotnet-runtime.md

git clone https://github.com/dotnet/performance.git
python3 .\performance\scripts\benchmarks_ci.py -f net8.0 --filter 'System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives&lt;Single&gt;*'

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Log(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Truncate(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Exp(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Sinh(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Exp(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Log(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Round(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Truncate(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Sigmoid(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Round(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Sinh(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Sigmoid(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

Docs

Profiling workflow for dotnet/runtime repository
Benchmarking workflow for dotnet/runtime repository

Run Information

Name	Value
Architecture	arm64
OS	ubuntu 22.04
Queue	AmpereUbuntu
Baseline	0bfb733c6419e78e55286e0d01c5994a337c486a
Compare	029007daba42d17965555f63a3f5d138cf76ecb9
Diff	Diff
Configs	CompilationMode:tiered, RunKind:micro

Improvements in System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>

Benchmark	Baseline	Test	Test/Base	Test Quality	Edge Detector
Log - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	21.53 μs	15.22 μs	0.71	0.01	True
Sinh - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	22.16 μs	17.62 μs	0.80	0.00	True
Sigmoid - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	799.38 ns	611.52 ns	0.76	0.00	True
Round - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	294.55 ns	40.89 ns	0.14	0.01	False
Sigmoid - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	18.56 μs	14.08 μs	0.76	0.00	True
Log - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	908.11 ns	645.69 ns	0.71	0.01	True
Sinh - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	912.05 ns	720.52 ns	0.79	0.00	True
Exp - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	16.92 μs	12.22 μs	0.72	0.00	True
Round - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	7.07 μs	660.73 ns	0.09	0.01	False
Exp - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	716.07 ns	520.62 ns	0.73	0.00	True

Test Report

Repro

General Docs link: https://github.com/dotnet/performance/blob/main/docs/benchmarking-workflow-dotnet-runtime.md

git clone https://github.com/dotnet/performance.git
python3 .\performance\scripts\benchmarks_ci.py -f net8.0 --filter 'System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives&lt;Double&gt;*'

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Log(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Sinh(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Sigmoid(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Round(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Sigmoid(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Log(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Sinh(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Exp(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Round(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Double>.Exp(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

Docs

Profiling workflow for dotnet/runtime repository
Benchmarking workflow for dotnet/runtime repository

performanceautofiler · 2024-07-18T08:16:07Z

Run Information

Name	Value
Architecture	arm64
OS	ubuntu 22.04
Queue	AmpereUbuntu
Baseline	0bfb733c6419e78e55286e0d01c5994a337c486a
Compare	029007daba42d17965555f63a3f5d138cf76ecb9
Diff	Diff
Configs	CompilationMode:tiered, RunKind:micro

Improvements in System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Single>

Benchmark	Baseline	Test	Test/Base	Test Quality	Edge Detector
Max_Vector - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	65.16 ns	30.41 ns	0.47	0.13	False
MaxMagnitude_Scalar - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	111.03 ns	73.43 ns	0.66	0.02	False
MaxMagnitude_Vector - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	1.82 μs	1.51 μs	0.83	0.01	False
Max_Scalar - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	59.57 ns	27.03 ns	0.45	0.06	False
MaxMagnitude_Vector - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	120.25 ns	76.38 ns	0.64	0.01	False
MaxMagnitude_Scalar - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	1.62 μs	1.45 μs	0.89	0.00	False

Test Report

Repro

General Docs link: https://github.com/dotnet/performance/blob/main/docs/benchmarking-workflow-dotnet-runtime.md

git clone https://github.com/dotnet/performance.git
python3 .\performance\scripts\benchmarks_ci.py -f net8.0 --filter 'System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives&lt;Single&gt;*'

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Single>.Max_Vector(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Single>.MaxMagnitude_Scalar(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Single>.MaxMagnitude_Vector(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Single>.Max_Scalar(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Single>.MaxMagnitude_Vector(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Single>.MaxMagnitude_Scalar(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

Docs

Profiling workflow for dotnet/runtime repository
Benchmarking workflow for dotnet/runtime repository

Run Information

Name	Value
Architecture	arm64
OS	ubuntu 22.04
Queue	AmpereUbuntu
Baseline	0bfb733c6419e78e55286e0d01c5994a337c486a
Compare	029007daba42d17965555f63a3f5d138cf76ecb9
Diff	Diff
Configs	CompilationMode:tiered, RunKind:micro

Improvements in System.Collections.ContainsKeyFalse<Int32, Int32>

Benchmark	Baseline	Test	Test/Base	Test Quality	Edge Detector	Baseline IR	Compare IR	IR Ratio
Dictionary - Duration of single invocation 📝 - Benchmark Source ADX - Test Multi Config Graph	4.90 μs	4.11 μs	0.84	0.10	False

Test Report

Repro

General Docs link: https://github.com/dotnet/performance/blob/main/docs/benchmarking-workflow-dotnet-runtime.md

git clone https://github.com/dotnet/performance.git
python3 .\performance\scripts\benchmarks_ci.py -f net8.0 --filter 'System.Collections.ContainsKeyFalse&lt;Int32, Int32&gt;*'

System.Collections.ContainsKeyFalse<Int32, Int32>.Dictionary(Size: 512)

ETL Files

Histogram

JIT Disasms

Docs

Profiling workflow for dotnet/runtime repository
Benchmarking workflow for dotnet/runtime repository

LoopedBard3 · 2024-07-18T16:45:29Z

Improvements likely caused by: dotnet/runtime#103837

performanceautofiler bot added ampere arch-arm64 branch-refs/heads/main kind-micro os-linux perf-improvement runtime-coreclr untriaged labels Jul 18, 2024

performanceautofiler bot mentioned this issue Jul 18, 2024

[SENTINEL] Autofile run complete at 7/18/2024 8:16:20 AM. 15 issues filed. #38499

Closed

LoopedBard3 closed this as completed Jul 18, 2024

LoopedBard3 removed the untriaged label Jul 18, 2024

[Perf] Linux/arm64: 39 Improvements on 7/10/2024 6:51:07 AM #38492

[Perf] Linux/arm64: 39 Improvements on 7/10/2024 6:51:07 AM #38492

Comments

performanceautofiler bot commented Jul 18, 2024

Run Information

Improvements in System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>

Repro

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.MaxMagnitude_Vector(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.MaxMagnitude_Scalar(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.MaxMagnitude_Vector(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.Max_Vector(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.Max_Scalar(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Double>.MaxMagnitude_Scalar(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

Docs

Run Information

Improvements in System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>

Repro

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>.MaxMagnitude_Vector(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>.Max(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>.MaxMagnitude_Scalar(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_NumberTensorPrimitives<Int32>.MaxMagnitude_Scalar(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

Docs

Run Information

Improvements in System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>

Repro

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Log(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Truncate(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Exp(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Sinh(BufferLength: 3079)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Exp(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Log(BufferLength: 128)

ETL Files

Histogram

JIT Disasms

System.Numerics.Tensors.Tests.Perf_FloatingPointTensorPrimitives<Single>.Round(BufferLength: 128)