tjulitianyi
/
CycleGAN_MindSpore

 
			
							//
// Generated by NVIDIA NVVM Compiler
//
// Compiler Build ID: CL-26907403
// Cuda compilation tools, release 10.1, V10.1.243
// Based on LLVM 3.4svn
//

.version 6.4
.target sm_60
.address_size 64

	// .globl	Fused_Mul_Maximum_fusion_15921793407927341931_kernel0

.visible .entry Fused_Mul_Maximum_fusion_15921793407927341931_kernel0(
	.param .u64 Fused_Mul_Maximum_fusion_15921793407927341931_kernel0_param_0,
	.param .u64 Fused_Mul_Maximum_fusion_15921793407927341931_kernel0_param_1
)
{
	.reg .f32 	%f<17>;
	.reg .b32 	%r<6>;
	.reg .b64 	%rd<8>;


	ld.param.u64 	%rd1, [Fused_Mul_Maximum_fusion_15921793407927341931_kernel0_param_0];
	ld.param.u64 	%rd2, [Fused_Mul_Maximum_fusion_15921793407927341931_kernel0_param_1];
	cvta.to.global.u64 	%rd3, %rd1;
	mov.u32 	%r1, %ctaid.x;
	shl.b32 	%r2, %r1, 12;
	mov.u32 	%r3, %tid.x;
	shl.b32 	%r4, %r3, 2;
	add.s32 	%r5, %r4, %r2;
	mul.wide.s32 	%rd4, %r5, 4;
	add.s64 	%rd5, %rd3, %rd4;
	ld.global.nc.v4.f32 	{%f1, %f2, %f3, %f4}, [%rd5];
	mul.f32 	%f9, %f1, 0f3E4CCCCD;
	mul.f32 	%f10, %f2, 0f3E4CCCCD;
	mul.f32 	%f11, %f3, 0f3E4CCCCD;
	mul.f32 	%f12, %f4, 0f3E4CCCCD;
	cvta.to.global.u64 	%rd6, %rd2;
	add.s64 	%rd7, %rd6, %rd4;
	max.f32 	%f13, %f12, %f4;
	max.f32 	%f14, %f11, %f3;
	max.f32 	%f15, %f10, %f2;
	max.f32 	%f16, %f9, %f1;
	st.global.v4.f32 	[%rd7], {%f16, %f15, %f14, %f13};
	ret;
}