mplayer.hg: postproc/rgb2rgb_template.c annotate

annotate postproc/rgb2rgb_template.c @ 2512:8899131fae4d

More accurate prefetching

author	nick
date	Sun, 28 Oct 2001 13:06:49 +0000
parents	6db23dd30242
children	d3c6b9ae24b1

rev	line source
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	1 #include <inttypes.h>
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	2 #include "../config.h"
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	3 #include "rgb2rgb.h"
2506 501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	4 #include "mmx.h"
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	5
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	6 #ifdef HAVE_3DNOW
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	7 #define PREFETCH "prefetch"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	8 #define PREFETCHW "prefetchw"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	9 #elif HAVE_MMX2
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	10 #define PREFETCH "prefetchnta"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	11 #define PREFETCHW "prefetcht0"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	12 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	13
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	14 #ifdef HAVE_3DNOW
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	15 #define EMMS "femms"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	16 #else
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	17 #define EMMS "emms"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	18 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	19
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	20 #ifdef HAVE_MMX2
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	21 #define MOVNTQ "movntq"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	22 #else
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	23 #define MOVNTQ "movq"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	24 #endif
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	25
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	26 void rgb24to32(uint8_t src,uint8_t dst,uint32_t src_size)
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	27 {
2508 94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	28 uint8_t *dest = dst;
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	29 uint8_t *s = src;
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	30 uint8_t *end;
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	31 #ifdef HAVE_MMX
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	32 const uint64_t mask32 = 0x00FFFFFF00FFFFFFULL;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	33 uint8_t *mm_end;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	34 #endif
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	35 end = s + src_size;
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	36 #ifdef HAVE_MMX
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	37 #ifdef PREFETCH
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	38 __asm __volatile(
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	39 PREFETCH" %0\n\t"
2512 8899131fae4d More accurate prefetching nick parents: 2511 diff changeset	40 ::"m"(*s):"memory");
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	41 #endif
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	42 mm_end = (uint8_t)((((unsigned long)end)/16)16);
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	43 __asm __volatile("movq %0, %%mm7"::"m"(mask32):"memory");
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	44 while(s < mm_end)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	45 {
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	46 #ifdef PREFETCH
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	47 __asm __volatile(
2512 8899131fae4d More accurate prefetching nick parents: 2511 diff changeset	48 PREFETCH" 32%0\n\t"
8899131fae4d More accurate prefetching nick parents: 2511 diff changeset	49 ::"m"(*s):"memory");
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	50 #endif
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	51 __asm __volatile(
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	52 "movd %1, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	53 "movd 3%1, %%mm1\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	54 "movd 6%1, %%mm2\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	55 "movd 9%1, %%mm3\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	56 "punpckldq %%mm1, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	57 "punpckldq %%mm3, %%mm2\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	58 "pand %%mm7, %%mm0\n\t"
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	59 "pand %%mm7, %%mm2\n\t"
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	60 MOVNTQ" %%mm0, %0\n\t"
6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	61 MOVNTQ" %%mm2, 8%0"
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	62 :"=m"(*dest)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	63 :"m"(*s)
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	64 :"memory");
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	65 dest += 16;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	66 s += 12;
42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	67 }
2511 6db23dd30242 mmx, mmx2, 3dnow optimized 24to32 nick parents: 2510 diff changeset	68 __asm __volatile(EMMS:::"memory");
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	69 #endif
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	70 while(s < end)
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	71 {
2508 94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	72 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	73 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	74 dest++ = s++;
94f9825a3736 Prev ver could work only on x86 nick parents: 2506 diff changeset	75 *dest++ = 0;
2504 13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	76 }
13e1c5ab417a vo_vesa: rgb2rgb support nick parents: diff changeset	77 }
2505 2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	78
2510 42e1ae2c8f5f mmx optimized 24to32 nick parents: 2508 diff changeset	79 /* TODO: MMX optimization */
2505 2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	80 void rgb32to24(uint8_t src,uint8_t dst,uint32_t src_size)
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	81 {
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	82 uint8_t *dest = dst;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	83 uint8_t *s = src;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	84 uint8_t *end;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	85 end = s + src_size;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	86 while(s < end)
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	87 {
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	88 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	89 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	90 dest++ = s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	91 s++;
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	92 }
2aaa11d22f91 vo_vesa: more rgb2rgb support nick parents: 2504 diff changeset	93 }
2506 501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	94
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	95 /* Original by Strepto/Astral
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	96 ported to gcc & bugfixed : A'rpi */
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	97 void rgb15to16(uint8_t src,uint8_t dst,uint32_t src_size)
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	98 {
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	99 #ifdef HAVE_MMX
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	100 static uint64_t mask_b = 0x001F001F001F001FLL; // 00000000 00011111 xxB
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	101 static uint64_t mask_rg = 0x7FE07FE07FE07FE0LL; // 01111111 11100000 RGx
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	102 register char* s=src+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	103 register char* d=dst+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	104 register int offs=-src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	105 movq_m2r (mask_b, mm4);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	106 movq_m2r (mask_rg, mm5);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	107 while(offs<0){
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	108 movq_m2r (*(s+offs), mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	109 movq_r2r (mm0, mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	110
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	111 movq_m2r (*(s+8+offs), mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	112 movq_r2r (mm2, mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	113
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	114 pand_r2r (mm4, mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	115 pand_r2r (mm5, mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	116
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	117 psllq_i2r(1,mm1);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	118 pand_r2r (mm4, mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	119
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	120 pand_r2r (mm5, mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	121 por_r2r (mm1, mm0);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	122
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	123 psllq_i2r(1,mm3);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	124 movq_r2m (mm0,*(d+offs));
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	125
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	126 por_r2r (mm3,mm2);
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	127 movq_r2m (mm2,*(d+8+offs));
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	128
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	129 offs+=16;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	130 }
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	131 emms();
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	132 #else
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	133 uint16_t s1=( uint16_t )src;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	134 uint16_t d1=( uint16_t )dst;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	135 uint16_t e=((uint8_t )s1)+src_size;
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	136 while( s1<e ){
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	137 register int x=*( s1++ );
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	138 /* rrrrrggggggbbbbb
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	139 0rrrrrgggggbbbbb
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	140 0111 1111 1110 0000=0x7FE0
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	141 00000000000001 1111=0x001F */
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	142 *( d1++ )=( x&0x001F )\|( ( x&0x7FE0 )<<1 );
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	143 }
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	144 #endif
501752469c39 vo_vesa: more rgb2rgb support nick parents: 2505 diff changeset	145 }

Mercurial > mplayer.hg

annotate postproc/rgb2rgb_template.c @ 2512:8899131fae4d