1
1
// RUN: llvm - mc - triple=amdgcn - m cpu =gfx1010 - mattr= + wavefrontsize32 ,+ wavefrontsize64 - show - encoding %s | FileCheck -- check - prefix=GFX10 %s
2
2
3
3
v_cmp_ge_i32_e32 s0 , v0
4
- // GFX10: v_cmp_ge_i32_e32 vcc , s0 , v0 ; encoding: [0x00,0x00,0x0c,0x7d]
4
+ // GFX10: v_cmp_ge_i32_e32 vcc_lo , s0 , v0 ; encoding: [0x00,0x00,0x0c,0x7d]
5
5
6
6
v_cmp_ge_i32_e32 vcc_lo , s0 , v1
7
- // GFX10: v_cmp_ge_i32_e32 vcc , s0 , v1 ; encoding: [0x00,0x02,0x0c,0x7d]
7
+ // GFX10: v_cmp_ge_i32_e32 vcc_lo , s0 , v1 ; encoding: [0x00,0x02,0x0c,0x7d]
8
8
9
9
v_cmp_ge_i32_e32 vcc , s0 , v2
10
- // GFX10: v_cmp_ge_i32_e32 vcc , s0 , v2 ; encoding: [0x00,0x04,0x0c,0x7d]
10
+ // GFX10: v_cmp_ge_i32_e32 vcc_lo , s0 , v2 ; encoding: [0x00,0x04,0x0c,0x7d]
11
11
12
12
v_cmp_le_f16_sdwa s0 , v3 , v4 src0_sel:WORD_1 src1_sel:DWORD
13
13
// GFX10: v_cmp_le_f16_sdwa s0 , v3 , v4 src0_sel:WORD_1 src1_sel:DWORD ; encoding: [0xf9,0x08,0x96,0x7d,0x03,0x80,0x05,0x06]
@@ -16,10 +16,10 @@ v_cmp_le_f16_sdwa s[0:1], v3, v4 src0_sel:WORD_1 src1_sel:DWORD
16
16
// GFX10: v_cmp_le_f16_sdwa s [ 0 : 1 ], v3 , v4 src0_sel:WORD_1 src1_sel:DWORD ; encoding: [0xf9,0x08,0x96,0x7d,0x03,0x80,0x05,0x06]
17
17
18
18
v_cmp_class_f32_e32 vcc_lo , s0 , v0
19
- // GFX10: v_cmp_class_f32_e32 vcc , s0 , v0 ; encoding: [0x00,0x00,0x10,0x7d]
19
+ // GFX10: v_cmp_class_f32_e32 vcc_lo , s0 , v0 ; encoding: [0x00,0x00,0x10,0x7d]
20
20
21
21
v_cmp_class_f32_e32 vcc , s0 , v0
22
- // GFX10: v_cmp_class_f32_e32 vcc , s0 , v0 ; encoding: [0x00,0x00,0x10,0x7d]
22
+ // GFX10: v_cmp_class_f32_e32 vcc_lo , s0 , v0 ; encoding: [0x00,0x00,0x10,0x7d]
23
23
24
24
v_cmp_class_f16_sdwa vcc_lo , v1 , v2 src0_sel:DWORD src1_sel:DWORD
25
25
// GFX10: v_cmp_class_f16_sdwa vcc_lo , v1 , v2 src0_sel:DWORD src1_sel:DWORD ; encoding: [0xf9,0x04,0x1e,0x7d,0x01,0x00,0x06,0x06]
@@ -34,40 +34,40 @@ v_cmp_class_f16_sdwa s[0:1], v1, v2 src0_sel:DWORD src1_sel:DWORD
34
34
// GFX10: v_cmp_class_f16_sdwa s [ 0 : 1 ], v1 , v2 src0_sel:DWORD src1_sel:DWORD ; encoding: [0xf9,0x04,0x1e,0x7d,0x01,0x80,0x06,0x06]
35
35
36
36
v_cndmask_b32_e32 v1 , v2 , v3 ,
37
- // GFX10: v_cndmask_b32_e32 v1 , v2 , v3 , vcc ; encoding: [0x02,0x07,0x02,0x02]
37
+ // GFX10: v_cndmask_b32_e32 v1 , v2 , v3 , vcc_lo ; encoding: [0x02,0x07,0x02,0x02]
38
38
39
39
v_cndmask_b32_e32 v1 , v2 , v3 , vcc_lo
40
- // GFX10: v_cndmask_b32_e32 v1 , v2 , v3 , vcc ; encoding: [0x02,0x07,0x02,0x02]
40
+ // GFX10: v_cndmask_b32_e32 v1 , v2 , v3 , vcc_lo ; encoding: [0x02,0x07,0x02,0x02]
41
41
42
42
v_cndmask_b32_e32 v1 , v2 , v3 , vcc
43
- // GFX10: v_cndmask_b32_e32 v1 , v2 , v3 , vcc ; encoding: [0x02,0x07,0x02,0x02]
43
+ // GFX10: v_cndmask_b32_e32 v1 , v2 , v3 , vcc_lo ; encoding: [0x02,0x07,0x02,0x02]
44
44
45
45
v_add_co_ci_u32_e32 v3 , vcc_lo , v3 , v4 , vcc_lo
46
- // GFX10: v_add_co_ci_u32_e32 v3 , vcc , v3 , v4 , vcc ; encoding: [0x03,0x09,0x06,0x50]
46
+ // GFX10: v_add_co_ci_u32_e32 v3 , vcc_lo , v3 , v4 , vcc_lo ; encoding: [0x03,0x09,0x06,0x50]
47
47
48
48
v_add_co_ci_u32_e32 v3 , vcc , v3 , v4 , vcc
49
- // GFX10: v_add_co_ci_u32_e32 v3 , vcc , v3 , v4 , vcc ; encoding: [0x03,0x09,0x06,0x50]
49
+ // GFX10: v_add_co_ci_u32_e32 v3 , vcc_lo , v3 , v4 , vcc_lo ; encoding: [0x03,0x09,0x06,0x50]
50
50
51
51
v_add_co_ci_u32_e32 v3 , v3 , v4
52
- // GFX10: v_add_co_ci_u32_e32 v3 , vcc , v3 , v4 , vcc ; encoding: [0x03,0x09,0x06,0x50]
52
+ // GFX10: v_add_co_ci_u32_e32 v3 , vcc_lo , v3 , v4 , vcc_lo ; encoding: [0x03,0x09,0x06,0x50]
53
53
54
54
v_sub_co_ci_u32_e32 v3 , vcc_lo , v3 , v4 , vcc_lo
55
- // GFX10: v_sub_co_ci_u32_e32 v3 , vcc , v3 , v4 , vcc ; encoding: [0x03,0x09,0x06,0x52]
55
+ // GFX10: v_sub_co_ci_u32_e32 v3 , vcc_lo , v3 , v4 , vcc_lo ; encoding: [0x03,0x09,0x06,0x52]
56
56
57
57
v_sub_co_ci_u32_e32 v3 , vcc , v3 , v4 , vcc
58
- // GFX10: v_sub_co_ci_u32_e32 v3 , vcc , v3 , v4 , vcc ; encoding: [0x03,0x09,0x06,0x52]
58
+ // GFX10: v_sub_co_ci_u32_e32 v3 , vcc_lo , v3 , v4 , vcc_lo ; encoding: [0x03,0x09,0x06,0x52]
59
59
60
60
v_sub_co_ci_u32_e32 v3 , v3 , v4
61
- // GFX10: v_sub_co_ci_u32_e32 v3 , vcc , v3 , v4 , vcc ; encoding: [0x03,0x09,0x06,0x52]
61
+ // GFX10: v_sub_co_ci_u32_e32 v3 , vcc_lo , v3 , v4 , vcc_lo ; encoding: [0x03,0x09,0x06,0x52]
62
62
63
63
v_subrev_co_ci_u32_e32 v1 , vcc_lo , 0 , v1 , vcc_lo
64
- // GFX10: v_subrev_co_ci_u32_e32 v1 , vcc , 0 , v1 , vcc ; encoding: [0x80,0x02,0x02,0x54]
64
+ // GFX10: v_subrev_co_ci_u32_e32 v1 , vcc_lo , 0 , v1 , vcc_lo ; encoding: [0x80,0x02,0x02,0x54]
65
65
66
66
v_subrev_co_ci_u32_e32 v1 , vcc , 0 , v1 , vcc
67
- // GFX10: v_subrev_co_ci_u32_e32 v1 , vcc , 0 , v1 , vcc ; encoding: [0x80,0x02,0x02,0x54]
67
+ // GFX10: v_subrev_co_ci_u32_e32 v1 , vcc_lo , 0 , v1 , vcc_lo ; encoding: [0x80,0x02,0x02,0x54]
68
68
69
69
v_subrev_co_ci_u32_e32 v1 , 0 , v1
70
- // GFX10: v_subrev_co_ci_u32_e32 v1 , vcc , 0 , v1 , vcc ; encoding: [0x80,0x02,0x02,0x54]
70
+ // GFX10: v_subrev_co_ci_u32_e32 v1 , vcc_lo , 0 , v1 , vcc_lo ; encoding: [0x80,0x02,0x02,0x54]
71
71
72
72
v_add_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
73
73
// GFX10: v_add_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x50,0x01,0x06,0x00,0x06]
@@ -76,7 +76,7 @@ v_add_co_ci_u32_sdwa v1, vcc, v1, v4, vcc dst_sel:DWORD dst_unused:UNUSED_PAD sr
76
76
// GFX10: v_add_co_ci_u32_sdwa v1 , vcc , v1 , v4 , vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x50,0x01,0x06,0x00,0x06]
77
77
78
78
v_add_co_ci_u32_sdwa v1 , v1 , v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
79
- // GFX10: v_add_co_ci_u32_sdwa v1 , vcc , v1 , v4 , vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x50,0x01,0x06,0x00,0x06]
79
+ // GFX10: v_add_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x50,0x01,0x06,0x00,0x06]
80
80
81
81
v_sub_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
82
82
// GFX10: v_sub_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x52,0x01,0x06,0x00,0x06]
@@ -85,7 +85,7 @@ v_sub_co_ci_u32_sdwa v1, vcc, v1, v4, vcc dst_sel:DWORD dst_unused:UNUSED_PAD sr
85
85
// GFX10: v_sub_co_ci_u32_sdwa v1 , vcc , v1 , v4 , vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x52,0x01,0x06,0x00,0x06]
86
86
87
87
v_sub_co_ci_u32_sdwa v1 , v1 , v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
88
- // GFX10: v_sub_co_ci_u32_sdwa v1 , vcc , v1 , v4 , vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x52,0x01,0x06,0x00,0x06]
88
+ // GFX10: v_sub_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x52,0x01,0x06,0x00,0x06]
89
89
90
90
v_subrev_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
91
91
// GFX10: v_subrev_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x54,0x01,0x06,0x00,0x06]
@@ -94,10 +94,10 @@ v_subrev_co_ci_u32_sdwa v1, vcc, v1, v4, vcc dst_sel:DWORD dst_unused:UNUSED_PAD
94
94
// GFX10: v_subrev_co_ci_u32_sdwa v1 , vcc , v1 , v4 , vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x54,0x01,0x06,0x00,0x06]
95
95
96
96
v_subrev_co_ci_u32_sdwa v1 , v1 , v4 dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
97
- // GFX10: v_subrev_co_ci_u32_sdwa v1 , vcc , v1 , v4 , vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x54,0x01,0x06,0x00,0x06]
97
+ // GFX10: v_subrev_co_ci_u32_sdwa v1 , vcc_lo , v1 , v4 , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x54,0x01,0x06,0x00,0x06]
98
98
99
99
v_add_co_ci_u32 v1 , sext(v1) , sext(v4) dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
100
- // GFX10: v_add_co_ci_u32_sdwa v1 , vcc , sext(v1) , sext(v4) , vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x50,0x01,0x06,0x08,0x0e]
100
+ // GFX10: v_add_co_ci_u32_sdwa v1 , vcc_lo , sext(v1) , sext(v4) , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x50,0x01,0x06,0x08,0x0e]
101
101
102
102
v_add_co_ci_u32_sdwa v1 , vcc_lo , sext(v1) , sext(v4) , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD
103
103
// GFX10: v_add_co_ci_u32_sdwa v1 , vcc_lo , sext(v1) , sext(v4) , vcc_lo dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x50,0x01,0x06,0x08,0x0e]
@@ -106,7 +106,7 @@ v_add_co_ci_u32_sdwa v1, vcc, sext(v1), sext(v4), vcc dst_sel:DWORD dst_unused:U
106
106
// GFX10: v_add_co_ci_u32_sdwa v1 , vcc , sext(v1) , sext(v4) , vcc dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:BYTE_0 src1_sel:DWORD ; encoding: [0xf9,0x08,0x02,0x50,0x01,0x06,0x08,0x0e]
107
107
108
108
v_add_co_ci_u32_dpp v5 , v1 , v2 quad_perm: [ 0 , 1 , 2 , 3 ] row_mask: 0x0 bank_mask: 0x0
109
- // GFX10: v_add_co_ci_u32_dpp v5 , vcc , v1 , v2 , vcc quad_perm: [ 0 , 1 , 2 , 3 ] row_mask: 0x0 bank_mask: 0x0 ; encoding: [0xfa,0x04,0x0a,0x50,0x01,0xe4,0x00,0x00]
109
+ // GFX10: v_add_co_ci_u32_dpp v5 , vcc_lo , v1 , v2 , vcc_lo quad_perm: [ 0 , 1 , 2 , 3 ] row_mask: 0x0 bank_mask: 0x0 ; encoding: [0xfa,0x04,0x0a,0x50,0x01,0xe4,0x00,0x00]
110
110
111
111
v_add_co_ci_u32_dpp v5 , vcc_lo , v1 , v2 , vcc_lo quad_perm: [ 0 , 1 , 2 , 3 ] row_mask: 0x0 bank_mask: 0x0
112
112
// GFX10: v_add_co_ci_u32_dpp v5 , vcc_lo , v1 , v2 , vcc_lo quad_perm: [ 0 , 1 , 2 , 3 ] row_mask: 0x0 bank_mask: 0x0 ; encoding: [0xfa,0x04,0x0a,0x50,0x01,0xe4,0x00,0x00]
@@ -189,8 +189,8 @@ v_subrev_co_ci_u32_e64 v4, s[0:1], v1, v5, s[2:3]
189
189
v_add_co_ci_u32_e64 v4 , vcc_lo , v1 , v5 , s2
190
190
// GFX10: v_add_co_ci_u32_e64 v4 , vcc_lo , v1 , v5 , s2 ; encoding: [0x04,0x6a,0x28,0xd5,0x01,0x0b,0x0a,0x00]
191
191
192
- v_add_co_ci_u32_e64 v4 , vcc , v1 , v5 , s [ 2 : 3 ]
193
- // GFX10: v_add_co_ci_u32_e64 v4 , vcc , v1 , v5 , s [ 2 : 3 ] ; encoding: [0x04,0x6a,0x28,0xd5,0x01,0x0b,0x0a,0x00]
192
+ v_add_co_ci_u32_e64 v4 , vcc_lo , v1 , v5 , s [ 2 : 3 ]
193
+ // GFX10: v_add_co_ci_u32_e64 v4 , vcc_lo , v1 , v5 , s [ 2 : 3 ] ; encoding: [0x04,0x6a,0x28,0xd5,0x01,0x0b,0x0a,0x00]
194
194
195
195
v_add_co_ci_u32_e64 v4 , s0 , v1 , v5 , vcc_lo
196
196
// GFX10: v_add_co_ci_u32_e64 v4 , s0 , v1 , v5 , vcc_lo ; encoding: [0x04,0x00,0x28,0xd5,0x01,0x0b,0xaa,0x01]
0 commit comments