mplayer.hg: postproc/yuv2rgb_template.c comparison

comparison postproc/yuv2rgb_template.c @ 13720:821f464b4d90

adapting existing mmx/mmx2/sse/3dnow optimizations so they work on x86_64

author	aurel
date	Thu, 21 Oct 2004 11:55:20 +0000
parents	bc5b87370cd1
children

comparison

equal deleted inserted replaced

-:43ecd6a73ec0
+:821f464b4d90
 for (y= 0; y<srcSliceH; y++ ) {
 	uint8_t *_image = dst[0] + (y+srcSliceY)*dstStride[0];
 	uint8_t *_py = src[0] + y*srcStride[0];
 	uint8_t *_pu = src[1] + (y>>1)*srcStride[1];
 	uint8_t *_pv = src[2] + (y>>1)*srcStride[2];
-	int index= -h_size/2;
+	long index= -h_size/2;
 	b5Dither= dither8[y&1];
 	g6Dither= dither4[y&1];
 	g5Dither= dither8[y&1];
 	r5Dither= dither8[(y+1)&1];
 		     "por %%mm7, %%mm5;" /* r7r6r5r4 r3g7g6g5 g4g3g2b7 b6b5b4b3 */
 		     "movd 4 (%3, %0), %%mm1;" /* Load 4 Cr 00 00 00 00 v3 v2 v1 v0 */
 		     MOVNTQ " %%mm5, 8 (%1);" /* store pixel 4-7 */
-		     "addl $16, %1			\n\t"
+		     "add $16, %1			\n\t"
-		     "addl $4, %0			\n\t"
+		     "add $4, %0			\n\t"
 		     " js 1b				\n\t"
 		     : "+r" (index), "+r" (_image)
 		     : "r" (_pu - index), "r" (_pv - index), "r"(&c->redDither), "r" (_py - 2*index)
 		     );
 for (y= 0; y<srcSliceH; y++ ) {
 	uint8_t *_image = dst[0] + (y+srcSliceY)*dstStride[0];
 	uint8_t *_py = src[0] + y*srcStride[0];
 	uint8_t *_pu = src[1] + (y>>1)*srcStride[1];
 	uint8_t *_pv = src[2] + (y>>1)*srcStride[2];
-	int index= -h_size/2;
+	long index= -h_size/2;
 	b5Dither= dither8[y&1];
 	g6Dither= dither4[y&1];
 	g5Dither= dither8[y&1];
 	r5Dither= dither8[(y+1)&1];
 		     "por %%mm7, %%mm5;" /* 0_r7r6r5 r4r3g7g6 g5g4g3b7 b6b5b4b3 */
 		     "movd 4 (%3, %0), %%mm1;" /* Load 4 Cr 00 00 00 00 v3 v2 v1 v0 */
 		     MOVNTQ " %%mm5, 8 (%1);" /* store pixel 4-7 */
-		     "addl $16, %1			\n\t"
+		     "add $16, %1			\n\t"
-		     "addl $4, %0			\n\t"
+		     "add $4, %0			\n\t"
 		     " js 1b				\n\t"
 		     : "+r" (index), "+r" (_image)
 		     : "r" (_pu - index), "r" (_pv - index), "r"(&c->redDither), "r" (_py - 2*index)
 		     );
 }
 for (y= 0; y<srcSliceH; y++ ) {
 	uint8_t *_image = dst[0] + (y+srcSliceY)*dstStride[0];
 	uint8_t *_py = src[0] + y*srcStride[0];
 	uint8_t *_pu = src[1] + (y>>1)*srcStride[1];
 	uint8_t *_pv = src[2] + (y>>1)*srcStride[2];
-	int index= -h_size/2;
+	long index= -h_size/2;
 	    /* this mmx assembly code deals with SINGLE scan line at a time, it convert 8
 	       pixels in each iteration */
 	    __asm__ __volatile__ (
 	/* load data for start of next scan line */
 			"movd 4 (%3, %0), %%mm1;" /* Load 4 Cr 00 00 00 00 v3 v2 v1 v0 */
 			"pxor %%mm4, %%mm4		\n\t"
 #endif
-		     "addl $24, %1			\n\t"
+		     "add $24, %1			\n\t"
-		     "addl $4, %0			\n\t"
+		     "add $4, %0			\n\t"
 		     " js 1b				\n\t"
 		     : "+r" (index), "+r" (_image)
 		     : "r" (_pu - index), "r" (_pv - index), "r"(&c->redDither), "r" (_py - 2*index)
 		     );
 for (y= 0; y<srcSliceH; y++ ) {
 	uint8_t *_image = dst[0] + (y+srcSliceY)*dstStride[0];
 	uint8_t *_py = src[0] + y*srcStride[0];
 	uint8_t *_pu = src[1] + (y>>1)*srcStride[1];
 	uint8_t *_pv = src[2] + (y>>1)*srcStride[2];
-	int index= -h_size/2;
+	long index= -h_size/2;
 	    /* this mmx assembly code deals with SINGLE scan line at a time, it convert 8
 	       pixels in each iteration */
 	    __asm__ __volatile__ (
 	/* load data for start of next scan line */
 		     "movd 4 (%3, %0), %%mm1;" /* Load 4 Cr 00 00 00 00 v3 v2 v1 v0 */
 		     "pxor %%mm4, %%mm4;" /* zero mm4 */
 		     "movq 8 (%5, %0, 2), %%mm6;" /* Load 8 Y Y7 Y6 Y5 Y4 Y3 Y2 Y1 Y0 */
-		     "addl $32, %1			\n\t"
+		     "add $32, %1			\n\t"
-		     "addl $4, %0			\n\t"
+		     "add $4, %0			\n\t"
 		     " js 1b				\n\t"
 		     : "+r" (index), "+r" (_image)
 		     : "r" (_pu - index), "r" (_pv - index), "r"(&c->redDither), "r" (_py - 2*index)
 		     );

Mercurial > mplayer.hg

comparison postproc/yuv2rgb_template.c @ 13720:821f464b4d90