mplayer.hg: postproc/rgb2rgb.c annotate

annotate postproc/rgb2rgb.c @ 2511:6db23dd30242

mmx, mmx2, 3dnow optimized 24to32

author	nick
date	Sun, 28 Oct 2001 12:02:16 +0000
parents	42e1ae2c8f5f
children	8899131fae4d

rev	line source
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	1 #include <inttypes.h>
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	2 #include "../config.h"
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	3 #include "rgb2rgb.h"
2506 501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	4 #include "mmx.h"
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	5
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	6 #ifdef HAVE_3DNOW
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	7 #define PREFETCH "prefetch"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	8 #define PREFETCHW "prefetchw"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	9 #elif HAVE_MMX2
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	10 #define PREFETCH "prefetchnta"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	11 #define PREFETCHW "prefetcht0"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	12 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	13
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	14 #ifdef HAVE_3DNOW
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	15 #define EMMS "femms"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	16 #else
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	17 #define EMMS "emms"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	18 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	19
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	20 #ifdef HAVE_MMX2
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	21 #define MOVNTQ "movntq"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	22 #else
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	23 #define MOVNTQ "movq"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	24 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	25
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	26 void rgb24to32(uint8_t src,uint8_t dst,uint32_t src_size)
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	27 {
2508 94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	28 uint8_t *dest = dst;
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	29 uint8_t *s = src;
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	30 uint8_t *end;
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	31 #ifdef HAVE_MMX
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	32 const uint64_t mask32 = 0x00FFFFFF00FFFFFFULL;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	33 uint8_t *mm_end;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	34 #endif
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	35 end = s + src_size;
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	36 #ifdef HAVE_MMX
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	37 #ifdef PREFETCH
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	38 __asm __volatile(
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	39 PREFETCH" %0\n\t"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	40 PREFETCH" 64%0\n\t"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	41 PREFETCHW" %1\n\t"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	42 PREFETCHW" 64%1\n\t"::"m"(s),"m"(dest):"memory");
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	43 #endif
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	44 mm_end = (uint8_t)((((unsigned long)end)/16)16);
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	45 __asm __volatile("movq %0, %%mm7"::"m"(mask32):"memory");
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	46 while(s < mm_end)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	47 {
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	48 #ifdef PREFETCH
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	49 __asm __volatile(
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	50 PREFETCH" 128%0\n\t"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	51 PREFETCHW" 128%1"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	52 ::"m"(s),"m"(dest):"memory");
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	53 #endif
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	54 __asm __volatile(
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	55 "movd %1, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	56 "movd 3%1, %%mm1\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	57 "movd 6%1, %%mm2\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	58 "movd 9%1, %%mm3\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	59 "punpckldq %%mm1, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	60 "punpckldq %%mm3, %%mm2\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	61 "pand %%mm7, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	62 "pand %%mm7, %%mm2\n\t"
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	63 MOVNTQ" %%mm0, %0\n\t"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	64 MOVNTQ" %%mm2, 8%0"
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	65 :"=m"(*dest)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	66 :"m"(*s)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	67 :"memory");
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	68 dest += 16;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	69 s += 12;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	70 }
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	71 __asm __volatile(EMMS:::"memory");
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	72 #endif
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	73 while(s < end)
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	74 {
2508 94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	75 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	76 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	77 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	78 *dest++ = 0;
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	79 }
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	80 }
2505 2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	81
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	82 /* TODO: MMX optimization */
2505 2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	83 void rgb32to24(uint8_t src,uint8_t dst,uint32_t src_size)
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	84 {
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	85 uint8_t *dest = dst;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	86 uint8_t *s = src;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	87 uint8_t *end;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	88 end = s + src_size;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	89 while(s < end)
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	90 {
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	91 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	92 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	93 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	94 s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	95 }
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	96 }
2506 501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	97
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	98 /* Original by Strepto/Astral
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	99 ported to gcc & bugfixed : A'rpi */
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	100 void rgb15to16(uint8_t src,uint8_t dst,uint32_t src_size)
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	101 {
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	102 #ifdef HAVE_MMX
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	103 static uint64_t mask_b = 0x001F001F001F001FLL; // 00000000 00011111 xxB
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	104 static uint64_t mask_rg = 0x7FE07FE07FE07FE0LL; // 01111111 11100000 RGx
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	105 register char* s=src+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	106 register char* d=dst+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	107 register int offs=-src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	108 movq_m2r (mask_b, mm4);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	109 movq_m2r (mask_rg, mm5);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	110 while(offs<0){
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	111 movq_m2r (*(s+offs), mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	112 movq_r2r (mm0, mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	113
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	114 movq_m2r (*(s+8+offs), mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	115 movq_r2r (mm2, mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	116
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	117 pand_r2r (mm4, mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	118 pand_r2r (mm5, mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	119
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	120 psllq_i2r(1,mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	121 pand_r2r (mm4, mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	122
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	123 pand_r2r (mm5, mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	124 por_r2r (mm1, mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	125
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	126 psllq_i2r(1,mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	127 movq_r2m (mm0,*(d+offs));
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	128
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	129 por_r2r (mm3,mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	130 movq_r2m (mm2,*(d+8+offs));
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	131
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	132 offs+=16;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	133 }
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	134 emms();
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	135 #else
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	136 uint16_t s1=( uint16_t )src;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	137 uint16_t d1=( uint16_t )dst;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	138 uint16_t e=((uint8_t )s1)+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	139 while( s1<e ){
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	140 register int x=*( s1++ );
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	141 /* rrrrrggggggbbbbb
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	142 0rrrrrgggggbbbbb
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	143 0111 1111 1110 0000=0x7FE0
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	144 00000000000001 1111=0x001F */
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	145 *( d1++ )=( x&0x001F )\|( ( x&0x7FE0 )<<1 );
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	146 }
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	147 #endif
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	148 }

Mercurial > mplayer.hg

annotate postproc/rgb2rgb.c @ 2511:6db23dd30242