AMDGPU: Use generated tests in reg-coalescer-sched-crash.ll test #131259

arsenm · 2025-03-14T02:59:11Z

This wasn't checking anything. Also remove undef uses.

arsenm · 2025-03-14T02:59:29Z

This stack of pull requests is managed by Graphite. Learn more about stacking.

llvmbot · 2025-03-14T03:00:56Z

@llvm/pr-subscribers-llvm-globalisel

Author: Matt Arsenault (arsenm)

Changes

This wasn't checking anything. Also remove undef uses.

Full diff: https://github.com/llvm/llvm-project/pull/131259.diff

1 Files Affected:

(modified) llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll (+64-4)

diff --git a/llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll b/llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll
index 51072c36dadd2..a3b3831f5b954 100644
--- a/llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll
+++ b/llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll
@@ -1,5 +1,6 @@
-; RUN: llc -mtriple=amdgcn -verify-machineinstrs -o /dev/null < %s
-; RUN: llc -mtriple=amdgcn -mcpu=tonga -mattr=-flat-for-global -verify-machineinstrs -o /dev/null < %s
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
+; RUN: llc -mtriple=amdgcn -mcpu=tahiti < %s | FileCheck -check-prefix=GFX6 %s
+; RUN: llc -mtriple=amdgcn -mcpu=tonga < %s | FileCheck -check-prefix=GFX8 %s
 
 ; The register coalescer introduces a verifier error which later
 ; results in a crash during scheduling.
@@ -7,13 +8,72 @@
 declare i32 @llvm.amdgcn.workitem.id.x() #0
 
 define amdgpu_kernel void @reg_coalescer_breaks_dead(ptr addrspace(1) nocapture readonly %arg, i32 %arg1, i32 %arg2, i32 %arg3, i1 %c0) #1 {
+; GFX6-LABEL: reg_coalescer_breaks_dead:
+; GFX6:       ; %bb.0: ; %bb
+; GFX6-NEXT:    v_mov_b32_e32 v1, 0
+; GFX6-NEXT:    v_cmp_eq_u32_e32 vcc, 0, v0
+; GFX6-NEXT:    v_mov_b32_e32 v2, 0
+; GFX6-NEXT:    s_and_saveexec_b64 s[0:1], vcc
+; GFX6-NEXT:    s_cbranch_execz .LBB0_2
+; GFX6-NEXT:  ; %bb.1: ; %bb3
+; GFX6-NEXT:    s_load_dword s2, s[4:5], 0xb
+; GFX6-NEXT:    s_load_dwordx2 s[6:7], s[4:5], 0x9
+; GFX6-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX6-NEXT:    s_ashr_i32 s3, s2, 31
+; GFX6-NEXT:    s_lshl_b64 s[2:3], s[2:3], 3
+; GFX6-NEXT:    s_add_u32 s2, s6, s2
+; GFX6-NEXT:    s_addc_u32 s3, s7, s3
+; GFX6-NEXT:    s_load_dwordx2 s[2:3], s[2:3], 0x0
+; GFX6-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX6-NEXT:    v_mov_b32_e32 v1, s2
+; GFX6-NEXT:    v_mov_b32_e32 v2, s3
+; GFX6-NEXT:  .LBB0_2: ; %bb4
+; GFX6-NEXT:    s_or_b64 exec, exec, s[0:1]
+; GFX6-NEXT:    s_load_dword s0, s[4:5], 0xe
+; GFX6-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX6-NEXT:    s_bitcmp0_b32 s0, 0
+; GFX6-NEXT:    s_cbranch_scc1 .LBB0_4
+; GFX6-NEXT:  ; %bb.3: ; %bb15
+; GFX6-NEXT:    s_mov_b32 m0, -1
+; GFX6-NEXT:    ds_write_b64 v0, v[1:2]
+; GFX6-NEXT:  .LBB0_4: ; %bb16
+;
+; GFX8-LABEL: reg_coalescer_breaks_dead:
+; GFX8:       ; %bb.0: ; %bb
+; GFX8-NEXT:    v_mov_b32_e32 v1, 0
+; GFX8-NEXT:    v_cmp_eq_u32_e32 vcc, 0, v0
+; GFX8-NEXT:    v_mov_b32_e32 v2, 0
+; GFX8-NEXT:    s_and_saveexec_b64 s[0:1], vcc
+; GFX8-NEXT:    s_cbranch_execz .LBB0_2
+; GFX8-NEXT:  ; %bb.1: ; %bb3
+; GFX8-NEXT:    s_load_dword s2, s[4:5], 0x2c
+; GFX8-NEXT:    s_load_dwordx2 s[6:7], s[4:5], 0x24
+; GFX8-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX8-NEXT:    s_ashr_i32 s3, s2, 31
+; GFX8-NEXT:    s_lshl_b64 s[2:3], s[2:3], 3
+; GFX8-NEXT:    s_add_u32 s2, s6, s2
+; GFX8-NEXT:    s_addc_u32 s3, s7, s3
+; GFX8-NEXT:    s_load_dwordx2 s[2:3], s[2:3], 0x0
+; GFX8-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX8-NEXT:    v_mov_b32_e32 v1, s2
+; GFX8-NEXT:    v_mov_b32_e32 v2, s3
+; GFX8-NEXT:  .LBB0_2: ; %bb4
+; GFX8-NEXT:    s_or_b64 exec, exec, s[0:1]
+; GFX8-NEXT:    s_load_dword s0, s[4:5], 0x38
+; GFX8-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX8-NEXT:    s_bitcmp0_b32 s0, 0
+; GFX8-NEXT:    s_cbranch_scc1 .LBB0_4
+; GFX8-NEXT:  ; %bb.3: ; %bb15
+; GFX8-NEXT:    s_mov_b32 m0, -1
+; GFX8-NEXT:    ds_write_b64 v0, v[1:2]
+; GFX8-NEXT:  .LBB0_4: ; %bb16
 bb:
   %id.x = call i32 @llvm.amdgcn.workitem.id.x()
   %cmp0 = icmp eq i32 %id.x, 0
   br i1 %cmp0, label %bb3, label %bb4
 
 bb3:                                              ; preds = %bb
-  %tmp = ashr exact i32 undef, 8
+  %tmp = ashr exact i32 poison, 8
   br label %bb6
 
 bb4:                                              ; preds = %bb6, %bb
@@ -28,7 +88,7 @@ bb6:                                              ; preds = %bb6, %bb3
   %tmp11 = getelementptr inbounds <2 x i32>, ptr addrspace(1) %arg, i64 %tmp10
   %tmp12 = load <2 x i32>, ptr addrspace(1) %tmp11, align 8
   %tmp13 = add <2 x i32> %tmp12, %tmp7
-  %tmp14 = icmp slt i32 undef, %arg2
+  %tmp14 = icmp slt i32 poison, %arg2
   br i1 %tmp14, label %bb6, label %bb4
 
 bb15:                                             ; preds = %bb4

llvmbot · 2025-03-14T03:00:56Z

@llvm/pr-subscribers-backend-amdgpu

Author: Matt Arsenault (arsenm)

Changes

This wasn't checking anything. Also remove undef uses.

Full diff: https://github.com/llvm/llvm-project/pull/131259.diff

1 Files Affected:

(modified) llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll (+64-4)

diff --git a/llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll b/llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll
index 51072c36dadd2..a3b3831f5b954 100644
--- a/llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll
+++ b/llvm/test/CodeGen/AMDGPU/reg-coalescer-sched-crash.ll
@@ -1,5 +1,6 @@
-; RUN: llc -mtriple=amdgcn -verify-machineinstrs -o /dev/null < %s
-; RUN: llc -mtriple=amdgcn -mcpu=tonga -mattr=-flat-for-global -verify-machineinstrs -o /dev/null < %s
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
+; RUN: llc -mtriple=amdgcn -mcpu=tahiti < %s | FileCheck -check-prefix=GFX6 %s
+; RUN: llc -mtriple=amdgcn -mcpu=tonga < %s | FileCheck -check-prefix=GFX8 %s
 
 ; The register coalescer introduces a verifier error which later
 ; results in a crash during scheduling.
@@ -7,13 +8,72 @@
 declare i32 @llvm.amdgcn.workitem.id.x() #0
 
 define amdgpu_kernel void @reg_coalescer_breaks_dead(ptr addrspace(1) nocapture readonly %arg, i32 %arg1, i32 %arg2, i32 %arg3, i1 %c0) #1 {
+; GFX6-LABEL: reg_coalescer_breaks_dead:
+; GFX6:       ; %bb.0: ; %bb
+; GFX6-NEXT:    v_mov_b32_e32 v1, 0
+; GFX6-NEXT:    v_cmp_eq_u32_e32 vcc, 0, v0
+; GFX6-NEXT:    v_mov_b32_e32 v2, 0
+; GFX6-NEXT:    s_and_saveexec_b64 s[0:1], vcc
+; GFX6-NEXT:    s_cbranch_execz .LBB0_2
+; GFX6-NEXT:  ; %bb.1: ; %bb3
+; GFX6-NEXT:    s_load_dword s2, s[4:5], 0xb
+; GFX6-NEXT:    s_load_dwordx2 s[6:7], s[4:5], 0x9
+; GFX6-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX6-NEXT:    s_ashr_i32 s3, s2, 31
+; GFX6-NEXT:    s_lshl_b64 s[2:3], s[2:3], 3
+; GFX6-NEXT:    s_add_u32 s2, s6, s2
+; GFX6-NEXT:    s_addc_u32 s3, s7, s3
+; GFX6-NEXT:    s_load_dwordx2 s[2:3], s[2:3], 0x0
+; GFX6-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX6-NEXT:    v_mov_b32_e32 v1, s2
+; GFX6-NEXT:    v_mov_b32_e32 v2, s3
+; GFX6-NEXT:  .LBB0_2: ; %bb4
+; GFX6-NEXT:    s_or_b64 exec, exec, s[0:1]
+; GFX6-NEXT:    s_load_dword s0, s[4:5], 0xe
+; GFX6-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX6-NEXT:    s_bitcmp0_b32 s0, 0
+; GFX6-NEXT:    s_cbranch_scc1 .LBB0_4
+; GFX6-NEXT:  ; %bb.3: ; %bb15
+; GFX6-NEXT:    s_mov_b32 m0, -1
+; GFX6-NEXT:    ds_write_b64 v0, v[1:2]
+; GFX6-NEXT:  .LBB0_4: ; %bb16
+;
+; GFX8-LABEL: reg_coalescer_breaks_dead:
+; GFX8:       ; %bb.0: ; %bb
+; GFX8-NEXT:    v_mov_b32_e32 v1, 0
+; GFX8-NEXT:    v_cmp_eq_u32_e32 vcc, 0, v0
+; GFX8-NEXT:    v_mov_b32_e32 v2, 0
+; GFX8-NEXT:    s_and_saveexec_b64 s[0:1], vcc
+; GFX8-NEXT:    s_cbranch_execz .LBB0_2
+; GFX8-NEXT:  ; %bb.1: ; %bb3
+; GFX8-NEXT:    s_load_dword s2, s[4:5], 0x2c
+; GFX8-NEXT:    s_load_dwordx2 s[6:7], s[4:5], 0x24
+; GFX8-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX8-NEXT:    s_ashr_i32 s3, s2, 31
+; GFX8-NEXT:    s_lshl_b64 s[2:3], s[2:3], 3
+; GFX8-NEXT:    s_add_u32 s2, s6, s2
+; GFX8-NEXT:    s_addc_u32 s3, s7, s3
+; GFX8-NEXT:    s_load_dwordx2 s[2:3], s[2:3], 0x0
+; GFX8-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX8-NEXT:    v_mov_b32_e32 v1, s2
+; GFX8-NEXT:    v_mov_b32_e32 v2, s3
+; GFX8-NEXT:  .LBB0_2: ; %bb4
+; GFX8-NEXT:    s_or_b64 exec, exec, s[0:1]
+; GFX8-NEXT:    s_load_dword s0, s[4:5], 0x38
+; GFX8-NEXT:    s_waitcnt lgkmcnt(0)
+; GFX8-NEXT:    s_bitcmp0_b32 s0, 0
+; GFX8-NEXT:    s_cbranch_scc1 .LBB0_4
+; GFX8-NEXT:  ; %bb.3: ; %bb15
+; GFX8-NEXT:    s_mov_b32 m0, -1
+; GFX8-NEXT:    ds_write_b64 v0, v[1:2]
+; GFX8-NEXT:  .LBB0_4: ; %bb16
 bb:
   %id.x = call i32 @llvm.amdgcn.workitem.id.x()
   %cmp0 = icmp eq i32 %id.x, 0
   br i1 %cmp0, label %bb3, label %bb4
 
 bb3:                                              ; preds = %bb
-  %tmp = ashr exact i32 undef, 8
+  %tmp = ashr exact i32 poison, 8
   br label %bb6
 
 bb4:                                              ; preds = %bb6, %bb
@@ -28,7 +88,7 @@ bb6:                                              ; preds = %bb6, %bb3
   %tmp11 = getelementptr inbounds <2 x i32>, ptr addrspace(1) %arg, i64 %tmp10
   %tmp12 = load <2 x i32>, ptr addrspace(1) %tmp11, align 8
   %tmp13 = add <2 x i32> %tmp12, %tmp7
-  %tmp14 = icmp slt i32 undef, %arg2
+  %tmp14 = icmp slt i32 poison, %arg2
   br i1 %tmp14, label %bb6, label %bb4
 
 bb15:                                             ; preds = %bb4

arsenm · 2025-03-14T08:57:15Z

Merge activity

Mar 14, 4:57 AM EDT: A user started a stack merge that includes this pull request via Graphite.
Mar 14, 5:02 AM EDT: Graphite rebased this pull request as part of a merge.
Mar 14, 5:04 AM EDT: A user merged this pull request with Graphite.

This wasn't checking anything. Also remove undef uses.

…m#131259) This wasn't checking anything. Also remove undef uses.

arsenm mentioned this pull request Mar 14, 2025

AMDGPU: Add generated checks to compile only test #131258

Merged

arsenm added backend:AMDGPU llvm:globalisel labels Mar 14, 2025 — with Graphite App

arsenm requested review from jayfoad, Pierre-vh, pravinjagtap and shiltian March 14, 2025 03:00

arsenm marked this pull request as ready for review March 14, 2025 03:00

shiltian approved these changes Mar 14, 2025

View reviewed changes

arsenm force-pushed the users/arsenm/amdgpu/generate-checks-in-test-swdev282079 branch from 054d0f3 to 810371b Compare March 14, 2025 04:47

arsenm force-pushed the users/arsenm/amdgpu/use-generated-checks-reg-coalescer-sched-crash branch from ab94652 to 494add8 Compare March 14, 2025 04:47

This was referenced Mar 14, 2025

AMDGPU: Use generated checks in unchecked test #131275

Merged

AMDGPU: Use generated checks in coalescer_distribute.ll #131276

Merged

AMDGPU: Migrate some tests away from undef #131277

Merged

arsenm force-pushed the users/arsenm/amdgpu/generate-checks-in-test-swdev282079 branch from 810371b to d527e6f Compare March 14, 2025 07:56

arsenm force-pushed the users/arsenm/amdgpu/use-generated-checks-reg-coalescer-sched-crash branch from 494add8 to 1907a9f Compare March 14, 2025 07:56

arsenm force-pushed the users/arsenm/amdgpu/generate-checks-in-test-swdev282079 branch from d527e6f to 69dfaeb Compare March 14, 2025 08:58

Base automatically changed from users/arsenm/amdgpu/generate-checks-in-test-swdev282079 to main March 14, 2025 09:01

AMDGPU: Use generated tests in reg-coalescer-sched-crash.ll test

71c8ed8

This wasn't checking anything. Also remove undef uses.

arsenm force-pushed the users/arsenm/amdgpu/use-generated-checks-reg-coalescer-sched-crash branch from 1907a9f to 71c8ed8 Compare March 14, 2025 09:02

arsenm merged commit 7bae613 into main Mar 14, 2025
6 of 10 checks passed

arsenm deleted the users/arsenm/amdgpu/use-generated-checks-reg-coalescer-sched-crash branch March 14, 2025 09:04

frederik-h pushed a commit to frederik-h/llvm-project that referenced this pull request Mar 18, 2025

AMDGPU: Use generated tests in reg-coalescer-sched-crash.ll test (llv…

fd8559f

…m#131259) This wasn't checking anything. Also remove undef uses.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

AMDGPU: Use generated tests in reg-coalescer-sched-crash.ll test #131259

AMDGPU: Use generated tests in reg-coalescer-sched-crash.ll test #131259

Uh oh!

arsenm commented Mar 14, 2025

Uh oh!

arsenm commented Mar 14, 2025 •

edited

Loading

Uh oh!

llvmbot commented Mar 14, 2025

Uh oh!

llvmbot commented Mar 14, 2025

Uh oh!

arsenm commented Mar 14, 2025 •

edited

Loading

Uh oh!

Uh oh!

Uh oh!

AMDGPU: Use generated tests in reg-coalescer-sched-crash.ll test #131259

AMDGPU: Use generated tests in reg-coalescer-sched-crash.ll test #131259

Uh oh!

Conversation

arsenm commented Mar 14, 2025

Uh oh!

arsenm commented Mar 14, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

llvmbot commented Mar 14, 2025

Uh oh!

llvmbot commented Mar 14, 2025

Uh oh!

arsenm commented Mar 14, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Merge activity

Uh oh!

Uh oh!

Uh oh!

arsenm commented Mar 14, 2025 •

edited

Loading

arsenm commented Mar 14, 2025 •

edited

Loading