mplayer.hg: liba52/resample

comparison liba52/resample_mmx.c @ 3626:e22ff7ebdc05

runtime cpu detection for the resample stuff

author	michael
date	Wed, 19 Dec 2001 20:20:06 +0000
parents	79759c05911e
children	b11b15df02ed

comparison

equal deleted inserted replaced

-:84ff13d4540c
+:e22ff7ebdc05
 	(but thats just test.c so that needs to be testd in reallity)
 	and it would mean (C / MMX2 / MMX / 3DNOW) versions
 */
 #include <inttypes.h>
+#include <stdio.h>
 #include "a52.h"
 #include "../config.h"
+#include "../cpudetect.h"
-#ifdef HAVE_MMX
+int (* a52_resample) (float * _f, int16_t * s16)=NULL;
+#ifdef ARCH_X86
 static uint64_t __attribute__((aligned(8))) magicF2W= 0x43c0000043c00000LL;
 static uint64_t __attribute__((aligned(8))) wm1010= 0xFFFF0000FFFF0000LL;
 static uint64_t __attribute__((aligned(8))) wm0101= 0x0000FFFF0000FFFFLL;
 static uint64_t __attribute__((aligned(8))) wm1100= 0xFFFFFFFF00000000LL;
 #endif
 }
 static int chans=2;
 static int flags=0;
-void a52_resample_init(int _flags,int _chans){
+int a52_resample_C(float * _f, int16_t * s16)
-chans=_chans;
-flags=_flags;
-}
-int a52_resample(float * _f, int16_t * s16)
 {
 int i;
 int32_t * f = (int32_t *) _f;
 switch (flags) {
 case A52_MONO:
-#ifdef HAVE_MMX
+	for (i = 0; i < 256; i++) {
+	    s16[5*i] = s16[5*i+1] = s16[5*i+2] = s16[5*i+3] = 0;
+	    s16[5*i+4] = convert (f[i]);
+	}
+	break;
+case A52_CHANNEL:
+case A52_STEREO:
+case A52_DOLBY:
+	for (i = 0; i < 256; i++) {
+	    s16[2*i] = convert (f[i]);
+	    s16[2*i+1] = convert (f[i+256]);
+	}
+	break;
+case A52_3F:
+	for (i = 0; i < 256; i++) {
+	    s16[5*i] = convert (f[i]);
+	    s16[5*i+1] = convert (f[i+512]);
+	    s16[5*i+2] = s16[5*i+3] = 0;
+	    s16[5*i+4] = convert (f[i+256]);
+	}
+	break;
+case A52_2F2R:
+	for (i = 0; i < 256; i++) {
+	    s16[4*i] = convert (f[i]);
+	    s16[4*i+1] = convert (f[i+256]);
+	    s16[4*i+2] = convert (f[i+512]);
+	    s16[4*i+3] = convert (f[i+768]);
+	}
+	break;
+case A52_3F2R:
+	for (i = 0; i < 256; i++) {
+	    s16[5*i] = convert (f[i]);
+	    s16[5*i+1] = convert (f[i+512]);
+	    s16[5*i+2] = convert (f[i+768]);
+	    s16[5*i+3] = convert (f[i+1024]);
+	    s16[5*i+4] = convert (f[i+256]);
+	}
+	break;
+case A52_MONO | A52_LFE:
+	for (i = 0; i < 256; i++) {
+	    s16[6*i] = s16[6*i+1] = s16[6*i+2] = s16[6*i+3] = 0;
+	    s16[6*i+4] = convert (f[i+256]);
+	    s16[6*i+5] = convert (f[i]);
+	}
+	break;
+case A52_CHANNEL | A52_LFE:
+case A52_STEREO | A52_LFE:
+case A52_DOLBY | A52_LFE:
+	for (i = 0; i < 256; i++) {
+	    s16[6*i] = convert (f[i+256]);
+	    s16[6*i+1] = convert (f[i+512]);
+	    s16[6*i+2] = s16[6*i+3] = s16[6*i+4] = 0;
+	    s16[6*i+5] = convert (f[i]);
+	}
+	break;
+case A52_3F | A52_LFE:
+	for (i = 0; i < 256; i++) {
+	    s16[6*i] = convert (f[i+256]);
+	    s16[6*i+1] = convert (f[i+768]);
+	    s16[6*i+2] = s16[6*i+3] = 0;
+	    s16[6*i+4] = convert (f[i+512]);
+	    s16[6*i+5] = convert (f[i]);
+	}
+	break;
+case A52_2F2R | A52_LFE:
+	for (i = 0; i < 256; i++) {
+	    s16[6*i] = convert (f[i+256]);
+	    s16[6*i+1] = convert (f[i+512]);
+	    s16[6*i+2] = convert (f[i+768]);
+	    s16[6*i+3] = convert (f[i+1024]);
+	    s16[6*i+4] = 0;
+	    s16[6*i+5] = convert (f[i]);
+	}
+	break;
+case A52_3F2R | A52_LFE:
+	for (i = 0; i < 256; i++) {
+	    s16[6*i] = convert (f[i+256]);
+	    s16[6*i+1] = convert (f[i+768]);
+	    s16[6*i+2] = convert (f[i+1024]);
+	    s16[6*i+3] = convert (f[i+1280]);
+	    s16[6*i+4] = convert (f[i+512]);
+	    s16[6*i+5] = convert (f[i]);
+	}
+	break;
+}
+return chans*256;
+}
+#ifdef ARCH_X86
+int a52_resample_MMX(float * _f, int16_t * s16)
+{
+int i;
+int32_t * f = (int32_t *) _f;
+switch (flags) {
+case A52_MONO:
 	asm volatile(
 		"movl $-512, %%esi		\n\t"
 		"movq magicF2W, %%mm7		\n\t"
 		"movq wm1100, %%mm3		\n\t"
 		"movq wm0101, %%mm4		\n\t"
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+1280), "r" (f+256)
 		:"%esi", "%edi", "memory"
 	);
-#else
-	for (i = 0; i < 256; i++) {
-	    s16[5*i] = s16[5*i+1] = s16[5*i+2] = s16[5*i+3] = 0;
-	    s16[5*i+4] = convert (f[i]);
-	}
-#endif
 	break;
 case A52_CHANNEL:
 case A52_STEREO:
 case A52_DOLBY:
 /* benchmark scores are 0.3% better with SSE but we would need to set bias=0 and premultiply it
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+512), "r" (f+256)
 		:"%esi", "memory"
 	);*/
-#ifdef HAVE_MMX
 	asm volatile(
 		"movl $-1024, %%esi		\n\t"
 		"movq magicF2W, %%mm7		\n\t"
 		"1:				\n\t"
 		"movq (%1, %%esi), %%mm0	\n\t"
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+512), "r" (f+256)
 		:"%esi", "memory"
 	);
-#else
+	break;
-	for (i = 0; i < 256; i++) {
+case A52_3F: //FIXME Optimize
-	    s16[2*i] = convert (f[i]);
-	    s16[2*i+1] = convert (f[i+256]);
-	}
-#endif
-	break;
-case A52_3F:
 	for (i = 0; i < 256; i++) {
 	    s16[5*i] = convert (f[i]);
 	    s16[5*i+1] = convert (f[i+512]);
 	    s16[5*i+2] = s16[5*i+3] = 0;
 	    s16[5*i+4] = convert (f[i+256]);
 	}
 	break;
 case A52_2F2R:
-#ifdef HAVE_MMX
 	asm volatile(
 		"movl $-1024, %%esi		\n\t"
 		"movq magicF2W, %%mm7		\n\t"
 		"1:				\n\t"
 		"movq (%1, %%esi), %%mm0	\n\t"
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+1024), "r" (f+256)
 		:"%esi", "memory"
 	);
-#else
+	break;
-	for (i = 0; i < 256; i++) {
+case A52_3F2R: //FIXME optimitze
-	    s16[4*i] = convert (f[i]);
-	    s16[4*i+1] = convert (f[i+256]);
-	    s16[4*i+2] = convert (f[i+512]);
-	    s16[4*i+3] = convert (f[i+768]);
-	}
-#endif
-	break;
-case A52_3F2R:
 	for (i = 0; i < 256; i++) {
 	    s16[5*i] = convert (f[i]);
 	    s16[5*i+1] = convert (f[i+512]);
 	    s16[5*i+2] = convert (f[i+768]);
 	    s16[5*i+3] = convert (f[i+1024]);
 	    s16[5*i+4] = convert (f[i+256]);
 	}
 	break;
 case A52_MONO | A52_LFE:
-#ifdef HAVE_MMX
 	asm volatile(
 		"movl $-1024, %%esi		\n\t"
 		"movq magicF2W, %%mm7		\n\t"
 		"pxor %%mm6, %%mm6		\n\t"
 		"1:				\n\t"
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+1536), "r" (f+256)
 		:"%esi", "%edi", "memory"
 	);
-#else
-	for (i = 0; i < 256; i++) {
-	    s16[6*i] = s16[6*i+1] = s16[6*i+2] = s16[6*i+3] = 0;
-	    s16[6*i+4] = convert (f[i+256]);
-	    s16[6*i+5] = convert (f[i]);
-	}
-#endif
 	break;
 case A52_CHANNEL | A52_LFE:
 case A52_STEREO | A52_LFE:
 case A52_DOLBY | A52_LFE:
-#ifdef HAVE_MMX
 	asm volatile(
 		"movl $-1024, %%esi		\n\t"
 		"movq magicF2W, %%mm7		\n\t"
 		"pxor %%mm6, %%mm6		\n\t"
 		"1:				\n\t"
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+1536), "r" (f+256)
 		:"%esi", "%edi", "memory"
 	);
-#else
-	for (i = 0; i < 256; i++) {
-	    s16[6*i] = convert (f[i+256]);
-	    s16[6*i+1] = convert (f[i+512]);
-	    s16[6*i+2] = s16[6*i+3] = s16[6*i+4] = 0;
-	    s16[6*i+5] = convert (f[i]);
-	}
-#endif
 	break;
 case A52_3F | A52_LFE:
-#ifdef HAVE_MMX
 	asm volatile(
 		"movl $-1024, %%esi		\n\t"
 		"movq magicF2W, %%mm7		\n\t"
 		"pxor %%mm6, %%mm6		\n\t"
 		"1:				\n\t"
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+1536), "r" (f+256)
 		:"%esi", "%edi", "memory"
 	);
-#else
-	for (i = 0; i < 256; i++) {
-	    s16[6*i] = convert (f[i+256]);
-	    s16[6*i+1] = convert (f[i+768]);
-	    s16[6*i+2] = s16[6*i+3] = 0;
-	    s16[6*i+4] = convert (f[i+512]);
-	    s16[6*i+5] = convert (f[i]);
-	}
-#endif
 	break;
 case A52_2F2R | A52_LFE:
-#ifdef HAVE_MMX
 	asm volatile(
 		"movl $-1024, %%esi		\n\t"
 		"movq magicF2W, %%mm7		\n\t"
 //		"pxor %%mm6, %%mm6		\n\t"
 		"1:				\n\t"
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+1536), "r" (f+256)
 		:"%esi", "%edi", "memory"
 	);
-#else
-	for (i = 0; i < 256; i++) {
-	    s16[6*i] = convert (f[i+256]);
-	    s16[6*i+1] = convert (f[i+512]);
-	    s16[6*i+2] = convert (f[i+768]);
-	    s16[6*i+3] = convert (f[i+1024]);
-	    s16[6*i+4] = 0;
-	    s16[6*i+5] = convert (f[i]);
-	}
-#endif
 	break;
 case A52_3F2R | A52_LFE:
-#ifdef HAVE_MMX
 	asm volatile(
 		"movl $-1024, %%esi		\n\t"
 		"movq magicF2W, %%mm7		\n\t"
 //		"pxor %%mm6, %%mm6		\n\t"
 		"1:				\n\t"
 		" jnz 1b			\n\t"
 		"emms				\n\t"
 		:: "r" (s16+1536), "r" (f+256)
 		:"%esi", "%edi", "memory"
 	);
-#else
-	for (i = 0; i < 256; i++) {
-	    s16[6*i] = convert (f[i+256]);
-	    s16[6*i+1] = convert (f[i+768]);
-	    s16[6*i+2] = convert (f[i+1024]);
-	    s16[6*i+3] = convert (f[i+1280]);
-	    s16[6*i+4] = convert (f[i+512]);
-	    s16[6*i+5] = convert (f[i]);
-	}
-#endif
 	break;
 }
 return chans*256;
 }
+#endif //arch_x86
+void a52_resample_init(int _flags,int _chans){
+chans=_chans;
+flags=_flags;
+if(a52_resample==NULL) // only once please ;)
+{
+	    if(gCpuCaps.hasMMX) fprintf(stderr, "Using MMX optimized resampler\n");
+	    else		fprintf(stderr, "No accelerated resampler found\n");
+}
+#ifdef ARCH_X86
+if(gCpuCaps.hasMMX) a52_resample= a52_resample_MMX;
+#else
+if(0);
+#endif
+else		a52_resample= a52_resample_C;
+}

Mercurial > mplayer.hg

comparison liba52/resample_mmx.c @ 3626:e22ff7ebdc05