mplayer.hg: postproc/rgb2rgb.c annotate

annotate postproc/rgb2rgb.c @ 2513:d3c6b9ae24b1

sfence

author	nick
date	Sun, 28 Oct 2001 13:59:57 +0000
parents	8899131fae4d
children	5e55450d48fa

rev	line source
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	1 #include <inttypes.h>
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	2 #include "../config.h"
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	3 #include "rgb2rgb.h"
2506 501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	4 #include "mmx.h"
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	5
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	6 #ifdef HAVE_3DNOW
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	7 #define PREFETCH "prefetch"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	8 #define PREFETCHW "prefetchw"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	9 #elif HAVE_MMX2
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	10 #define PREFETCH "prefetchnta"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	11 #define PREFETCHW "prefetcht0"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	12 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	13
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	14 #ifdef HAVE_3DNOW
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	15 #define EMMS "femms"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	16 #else
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	17 #define EMMS "emms"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	18 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	19
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	20 #ifdef HAVE_MMX2
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	21 #define MOVNTQ "movntq"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	22 #else
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	23 #define MOVNTQ "movq"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	24 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	25
2513 d3c6b9ae24b1 sfence nick parents: 2512 diff changeset	26 #ifdef HAVE_MMX2
d3c6b9ae24b1 sfence nick parents: 2512 diff changeset	27 #define SFENCE "sfence"
d3c6b9ae24b1 sfence nick parents: 2512 diff changeset	28 #endif
d3c6b9ae24b1 sfence nick parents: 2512 diff changeset	29
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	30 void rgb24to32(uint8_t src,uint8_t dst,uint32_t src_size)
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	31 {
2508 94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	32 uint8_t *dest = dst;
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	33 uint8_t *s = src;
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	34 uint8_t *end;
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	35 #ifdef HAVE_MMX
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	36 const uint64_t mask32 = 0x00FFFFFF00FFFFFFULL;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	37 uint8_t *mm_end;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	38 #endif
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	39 end = s + src_size;
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	40 #ifdef HAVE_MMX
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	41 #ifdef PREFETCH
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	42 __asm __volatile(
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	43 PREFETCH" %0\n\t"
2512 8899131fae4d More accurate prefetching nick parents: 2511 diff changeset	44 ::"m"(*s):"memory");
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	45 #endif
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	46 mm_end = (uint8_t)((((unsigned long)end)/16)16);
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	47 __asm __volatile("movq %0, %%mm7"::"m"(mask32):"memory");
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	48 while(s < mm_end)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	49 {
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	50 #ifdef PREFETCH
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	51 __asm __volatile(
2512 8899131fae4d More accurate prefetching nick parents: 2511 diff changeset	52 PREFETCH" 32%0\n\t"
8899131fae4d More accurate prefetching nick parents: 2511 diff changeset	53 ::"m"(*s):"memory");
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	54 #endif
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	55 __asm __volatile(
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	56 "movd %1, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	57 "movd 3%1, %%mm1\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	58 "movd 6%1, %%mm2\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	59 "movd 9%1, %%mm3\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	60 "punpckldq %%mm1, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	61 "punpckldq %%mm3, %%mm2\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	62 "pand %%mm7, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	63 "pand %%mm7, %%mm2\n\t"
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	64 MOVNTQ" %%mm0, %0\n\t"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	65 MOVNTQ" %%mm2, 8%0"
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	66 :"=m"(*dest)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	67 :"m"(*s)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	68 :"memory");
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	69 dest += 16;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	70 s += 12;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	71 }
2513 d3c6b9ae24b1 sfence nick parents: 2512 diff changeset	72 #ifdef SFENCE
d3c6b9ae24b1 sfence nick parents: 2512 diff changeset	73 __asm __volatile(SFENCE:::"memory");
d3c6b9ae24b1 sfence nick parents: 2512 diff changeset	74 #endif
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	75 __asm __volatile(EMMS:::"memory");
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	76 #endif
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	77 while(s < end)
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	78 {
2508 94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	79 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	80 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	81 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	82 *dest++ = 0;
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	83 }
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	84 }
2505 2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	85
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	86 /* TODO: MMX optimization */
2505 2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	87 void rgb32to24(uint8_t src,uint8_t dst,uint32_t src_size)
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	88 {
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	89 uint8_t *dest = dst;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	90 uint8_t *s = src;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	91 uint8_t *end;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	92 end = s + src_size;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	93 while(s < end)
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	94 {
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	95 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	96 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	97 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	98 s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	99 }
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	100 }
2506 501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	101
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	102 /* Original by Strepto/Astral
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	103 ported to gcc & bugfixed : A'rpi */
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	104 void rgb15to16(uint8_t src,uint8_t dst,uint32_t src_size)
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	105 {
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	106 #ifdef HAVE_MMX
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	107 static uint64_t mask_b = 0x001F001F001F001FLL; // 00000000 00011111 xxB
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	108 static uint64_t mask_rg = 0x7FE07FE07FE07FE0LL; // 01111111 11100000 RGx
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	109 register char* s=src+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	110 register char* d=dst+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	111 register int offs=-src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	112 movq_m2r (mask_b, mm4);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	113 movq_m2r (mask_rg, mm5);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	114 while(offs<0){
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	115 movq_m2r (*(s+offs), mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	116 movq_r2r (mm0, mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	117
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	118 movq_m2r (*(s+8+offs), mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	119 movq_r2r (mm2, mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	120
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	121 pand_r2r (mm4, mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	122 pand_r2r (mm5, mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	123
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	124 psllq_i2r(1,mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	125 pand_r2r (mm4, mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	126
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	127 pand_r2r (mm5, mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	128 por_r2r (mm1, mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	129
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	130 psllq_i2r(1,mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	131 movq_r2m (mm0,*(d+offs));
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	132
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	133 por_r2r (mm3,mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	134 movq_r2m (mm2,*(d+8+offs));
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	135
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	136 offs+=16;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	137 }
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	138 emms();
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	139 #else
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	140 uint16_t s1=( uint16_t )src;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	141 uint16_t d1=( uint16_t )dst;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	142 uint16_t e=((uint8_t )s1)+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	143 while( s1<e ){
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	144 register int x=*( s1++ );
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	145 /* rrrrrggggggbbbbb
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	146 0rrrrrgggggbbbbb
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	147 0111 1111 1110 0000=0x7FE0
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	148 00000000000001 1111=0x001F */
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	149 *( d1++ )=( x&0x001F )\|( ( x&0x7FE0 )<<1 );
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	150 }
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	151 #endif
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	152 }

Mercurial > mplayer.hg

annotate postproc/rgb2rgb.c @ 2513:d3c6b9ae24b1