libavcodec.hg: dsputil.h annotate

annotate dsputil.h @ 386:f49629bab18d libavcodec

hopefully faster mmx2&3dnow MC

author	michaelni
date	Fri, 17 May 2002 01:04:14 +0000
parents	9c6f056f0e41
children	2c3e25f4c496

rev	line source
0 986e461dc072 Initial revision glantau parents: diff changeset	1 #ifndef DSPUTIL_H
986e461dc072 Initial revision glantau parents: diff changeset	2 #define DSPUTIL_H
986e461dc072 Initial revision glantau parents: diff changeset	3
986e461dc072 Initial revision glantau parents: diff changeset	4 #include "common.h"
252 ddb1a0e94cf4 - Added PSNR feature to libavcodec and ffmpeg. By now just Y PSNR until I'm pulento parents: 214 diff changeset	5 #include "avcodec.h"
0 986e461dc072 Initial revision glantau parents: diff changeset	6
255 db20b987c32d divx5-gmc support michaelni parents: 252 diff changeset	7 //#define DEBUG
0 986e461dc072 Initial revision glantau parents: diff changeset	8 /* dct code */
986e461dc072 Initial revision glantau parents: diff changeset	9 typedef short DCTELEM;
986e461dc072 Initial revision glantau parents: diff changeset	10
986e461dc072 Initial revision glantau parents: diff changeset	11 void jpeg_fdct_ifast (DCTELEM *data);
986e461dc072 Initial revision glantau parents: diff changeset	12
986e461dc072 Initial revision glantau parents: diff changeset	13 void j_rev_dct (DCTELEM *data);
986e461dc072 Initial revision glantau parents: diff changeset	14
986e461dc072 Initial revision glantau parents: diff changeset	15 void fdct_mmx(DCTELEM *block);
986e461dc072 Initial revision glantau parents: diff changeset	16
986e461dc072 Initial revision glantau parents: diff changeset	17 void (av_fdct)(DCTELEM block);
986e461dc072 Initial revision glantau parents: diff changeset	18
34 2733a4c1c693 added block permutation functions glantau parents: 19 diff changeset	19 /* encoding scans */
2733a4c1c693 added block permutation functions glantau parents: 19 diff changeset	20 extern UINT8 ff_alternate_horizontal_scan[64];
2733a4c1c693 added block permutation functions glantau parents: 19 diff changeset	21 extern UINT8 ff_alternate_vertical_scan[64];
2733a4c1c693 added block permutation functions glantau parents: 19 diff changeset	22 extern UINT8 zigzag_direct[64];
2733a4c1c693 added block permutation functions glantau parents: 19 diff changeset	23
190 9e0e56869d05 fix for non-mmx runtimedetect encoding bugs - patch by Michael Niedermayer <michaelni@gmx.at> uid46427 parents: 174 diff changeset	24 /* permutation table */
9e0e56869d05 fix for non-mmx runtimedetect encoding bugs - patch by Michael Niedermayer <michaelni@gmx.at> uid46427 parents: 174 diff changeset	25 extern UINT8 permutation[64];
9e0e56869d05 fix for non-mmx runtimedetect encoding bugs - patch by Michael Niedermayer <michaelni@gmx.at> uid46427 parents: 174 diff changeset	26
0 986e461dc072 Initial revision glantau parents: diff changeset	27 /* pixel operations */
986e461dc072 Initial revision glantau parents: diff changeset	28 #define MAX_NEG_CROP 384
986e461dc072 Initial revision glantau parents: diff changeset	29
986e461dc072 Initial revision glantau parents: diff changeset	30 /* temporary */
986e461dc072 Initial revision glantau parents: diff changeset	31 extern UINT32 squareTbl[512];
50 4ea4c10d03d8 export for imgconvert usage glantau parents: 34 diff changeset	32 extern UINT8 cropTbl[256 + 2 * MAX_NEG_CROP];
0 986e461dc072 Initial revision glantau parents: diff changeset	33
986e461dc072 Initial revision glantau parents: diff changeset	34 void dsputil_init(void);
986e461dc072 Initial revision glantau parents: diff changeset	35
986e461dc072 Initial revision glantau parents: diff changeset	36 /* pixel ops : interface with DCT */
986e461dc072 Initial revision glantau parents: diff changeset	37
19 82d4c9be9873 MMX/MMXEXT iDCT support, using external functions currently defined in libmpeg2 arpi_esp parents: 6 diff changeset	38 extern void (ff_idct)(DCTELEM block);
0 986e461dc072 Initial revision glantau parents: diff changeset	39 extern void (get_pixels)(DCTELEM block, const UINT8 *pixels, int line_size);
324 9c6f056f0e41 fixed mpeg4 time stuff on encoding michaelni parents: 296 diff changeset	40 extern void (diff_pixels)(DCTELEM block, const UINT8 s1, const UINT8 s2, int stride);
0 986e461dc072 Initial revision glantau parents: diff changeset	41 extern void (put_pixels_clamped)(const DCTELEM block, UINT8 *pixels, int line_size);
986e461dc072 Initial revision glantau parents: diff changeset	42 extern void (add_pixels_clamped)(const DCTELEM block, UINT8 *pixels, int line_size);
255 db20b987c32d divx5-gmc support michaelni parents: 252 diff changeset	43 extern void (gmc1)(UINT8 dst, UINT8 *src, int srcStride, int h, int x16, int y16, int rounder);
296 c1a8a1b4a24b sizeof(s->block) isnt 6462 anymore bugfix michaelni parents: 294 diff changeset	44 extern void (clear_blocks)(DCTELEM blocks);
255 db20b987c32d divx5-gmc support michaelni parents: 252 diff changeset	45
0 986e461dc072 Initial revision glantau parents: diff changeset	46
986e461dc072 Initial revision glantau parents: diff changeset	47 void get_pixels_c(DCTELEM block, const UINT8 pixels, int line_size);
324 9c6f056f0e41 fixed mpeg4 time stuff on encoding michaelni parents: 296 diff changeset	48 void diff_pixels_c(DCTELEM block, const UINT8 s1, const UINT8 *s2, int stride);
0 986e461dc072 Initial revision glantau parents: diff changeset	49 void put_pixels_clamped_c(const DCTELEM block, UINT8 pixels, int line_size);
986e461dc072 Initial revision glantau parents: diff changeset	50 void add_pixels_clamped_c(const DCTELEM block, UINT8 pixels, int line_size);
296 c1a8a1b4a24b sizeof(s->block) isnt 6462 anymore bugfix michaelni parents: 294 diff changeset	51 void clear_blocks_c(DCTELEM *blocks);
0 986e461dc072 Initial revision glantau parents: diff changeset	52
986e461dc072 Initial revision glantau parents: diff changeset	53 /* add and put pixel (decoding) */
986e461dc072 Initial revision glantau parents: diff changeset	54 typedef void (op_pixels_func)(UINT8 block, const UINT8 *pixels, int line_size, int h);
255 db20b987c32d divx5-gmc support michaelni parents: 252 diff changeset	55 typedef void (qpel_mc_func)(UINT8 dst, UINT8 *src, int dstStride, int srcStride, int mx, int my);
0 986e461dc072 Initial revision glantau parents: diff changeset	56
986e461dc072 Initial revision glantau parents: diff changeset	57 extern op_pixels_func put_pixels_tab[4];
986e461dc072 Initial revision glantau parents: diff changeset	58 extern op_pixels_func avg_pixels_tab[4];
986e461dc072 Initial revision glantau parents: diff changeset	59 extern op_pixels_func put_no_rnd_pixels_tab[4];
986e461dc072 Initial revision glantau parents: diff changeset	60 extern op_pixels_func avg_no_rnd_pixels_tab[4];
255 db20b987c32d divx5-gmc support michaelni parents: 252 diff changeset	61 extern qpel_mc_func qpel_mc_rnd_tab[16];
db20b987c32d divx5-gmc support michaelni parents: 252 diff changeset	62 extern qpel_mc_func qpel_mc_no_rnd_tab[16];
db20b987c32d divx5-gmc support michaelni parents: 252 diff changeset	63
0 986e461dc072 Initial revision glantau parents: diff changeset	64
986e461dc072 Initial revision glantau parents: diff changeset	65 /* sub pixel (encoding) */
986e461dc072 Initial revision glantau parents: diff changeset	66 extern void (sub_pixels_tab[4])(DCTELEM block, const UINT8 *pixels, int line_size, int h);
986e461dc072 Initial revision glantau parents: diff changeset	67
986e461dc072 Initial revision glantau parents: diff changeset	68 #define sub_pixels_2(block, pixels, line_size, dxy) \
986e461dc072 Initial revision glantau parents: diff changeset	69 sub_pixels_tab[dxy](block, pixels, line_size, 8)
986e461dc072 Initial revision glantau parents: diff changeset	70
986e461dc072 Initial revision glantau parents: diff changeset	71 /* motion estimation */
986e461dc072 Initial revision glantau parents: diff changeset	72
294 944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	73 typedef int (op_pixels_abs_func)(UINT8 blk1, UINT8 *blk2, int line_size);
0 986e461dc072 Initial revision glantau parents: diff changeset	74
986e461dc072 Initial revision glantau parents: diff changeset	75 extern op_pixels_abs_func pix_abs16x16;
986e461dc072 Initial revision glantau parents: diff changeset	76 extern op_pixels_abs_func pix_abs16x16_x2;
986e461dc072 Initial revision glantau parents: diff changeset	77 extern op_pixels_abs_func pix_abs16x16_y2;
986e461dc072 Initial revision glantau parents: diff changeset	78 extern op_pixels_abs_func pix_abs16x16_xy2;
294 944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	79 extern op_pixels_abs_func pix_abs8x8;
944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	80 extern op_pixels_abs_func pix_abs8x8_x2;
944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	81 extern op_pixels_abs_func pix_abs8x8_y2;
944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	82 extern op_pixels_abs_func pix_abs8x8_xy2;
0 986e461dc072 Initial revision glantau parents: diff changeset	83
294 944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	84 int pix_abs16x16_c(UINT8 blk1, UINT8 blk2, int lx);
944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	85 int pix_abs16x16_x2_c(UINT8 blk1, UINT8 blk2, int lx);
944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	86 int pix_abs16x16_y2_c(UINT8 blk1, UINT8 blk2, int lx);
944632089814 4MV motion estimation (not finished yet) michaelni parents: 255 diff changeset	87 int pix_abs16x16_xy2_c(UINT8 blk1, UINT8 blk2, int lx);
0 986e461dc072 Initial revision glantau parents: diff changeset	88
174 ac5075a55488 new IDCT code by Michael Niedermayer (michaelni@gmx.at) - #define SIMPLE_IDCT to enable arpi_esp parents: 88 diff changeset	89 static inline int block_permute_op(int j)
ac5075a55488 new IDCT code by Michael Niedermayer (michaelni@gmx.at) - #define SIMPLE_IDCT to enable arpi_esp parents: 88 diff changeset	90 {
190 9e0e56869d05 fix for non-mmx runtimedetect encoding bugs - patch by Michael Niedermayer <michaelni@gmx.at> uid46427 parents: 174 diff changeset	91 return permutation[j];
174 ac5075a55488 new IDCT code by Michael Niedermayer (michaelni@gmx.at) - #define SIMPLE_IDCT to enable arpi_esp parents: 88 diff changeset	92 }
34 2733a4c1c693 added block permutation functions glantau parents: 19 diff changeset	93
2733a4c1c693 added block permutation functions glantau parents: 19 diff changeset	94 void block_permute(INT16 *block);
2733a4c1c693 added block permutation functions glantau parents: 19 diff changeset	95
62 4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	96 #if defined(HAVE_MMX)
0 986e461dc072 Initial revision glantau parents: diff changeset	97
986e461dc072 Initial revision glantau parents: diff changeset	98 #define MM_MMX 0x0001 /* standard MMX */
986e461dc072 Initial revision glantau parents: diff changeset	99 #define MM_3DNOW 0x0004 /* AMD 3DNOW */
986e461dc072 Initial revision glantau parents: diff changeset	100 #define MM_MMXEXT 0x0002 /* SSE integer functions or AMD MMX ext */
986e461dc072 Initial revision glantau parents: diff changeset	101 #define MM_SSE 0x0008 /* SSE functions */
986e461dc072 Initial revision glantau parents: diff changeset	102 #define MM_SSE2 0x0010 /* PIV SSE2 functions */
986e461dc072 Initial revision glantau parents: diff changeset	103
986e461dc072 Initial revision glantau parents: diff changeset	104 extern int mm_flags;
986e461dc072 Initial revision glantau parents: diff changeset	105
986e461dc072 Initial revision glantau parents: diff changeset	106 int mm_support(void);
986e461dc072 Initial revision glantau parents: diff changeset	107
986e461dc072 Initial revision glantau parents: diff changeset	108 static inline void emms(void)
986e461dc072 Initial revision glantau parents: diff changeset	109 {
6 ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	110 __asm __volatile ("emms;":::"memory");
ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	111 }
ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	112
ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	113 #define emms_c() \
ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	114 {\
ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	115 if (mm_flags & MM_MMX)\
ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	116 emms();\
0 986e461dc072 Initial revision glantau parents: diff changeset	117 }
986e461dc072 Initial revision glantau parents: diff changeset	118
986e461dc072 Initial revision glantau parents: diff changeset	119 #define __align8 __attribute__ ((aligned (8)))
986e461dc072 Initial revision glantau parents: diff changeset	120
986e461dc072 Initial revision glantau parents: diff changeset	121 void dsputil_init_mmx(void);
986e461dc072 Initial revision glantau parents: diff changeset	122
62 4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	123 #elif defined(ARCH_ARMV4L)
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	124
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	125 #define emms_c()
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	126
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	127 /* This is to use 4 bytes read to the IDCT pointers for some 'zero'
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	128 line ptimizations */
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	129 #define __align8 __attribute__ ((aligned (4)))
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	130
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	131 void dsputil_init_armv4l(void);
4bfc845cdfea arm optimizations glantau parents: 50 diff changeset	132
88 06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	133 #elif defined(HAVE_MLIB)
06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	134
06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	135 #define emms_c()
06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	136
06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	137 /* SPARC/VIS IDCT needs 8-byte aligned DCT blocks */
06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	138 #define __align8 __attribute__ ((aligned (8)))
06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	139
06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	140 void dsputil_init_mlib(void);
06f63b58d2a8 mlib merge glantau parents: 62 diff changeset	141
214 73df666cacc7 Alpha optimizations by Falk Hueffner <falk.hueffner@student.uni-tuebingen.de> nickols_k parents: 190 diff changeset	142 #elif defined(ARCH_ALPHA)
73df666cacc7 Alpha optimizations by Falk Hueffner <falk.hueffner@student.uni-tuebingen.de> nickols_k parents: 190 diff changeset	143
73df666cacc7 Alpha optimizations by Falk Hueffner <falk.hueffner@student.uni-tuebingen.de> nickols_k parents: 190 diff changeset	144 #define emms_c()
73df666cacc7 Alpha optimizations by Falk Hueffner <falk.hueffner@student.uni-tuebingen.de> nickols_k parents: 190 diff changeset	145 #define __align8 __attribute__ ((aligned (8)))
73df666cacc7 Alpha optimizations by Falk Hueffner <falk.hueffner@student.uni-tuebingen.de> nickols_k parents: 190 diff changeset	146
73df666cacc7 Alpha optimizations by Falk Hueffner <falk.hueffner@student.uni-tuebingen.de> nickols_k parents: 190 diff changeset	147 void dsputil_init_alpha(void);
73df666cacc7 Alpha optimizations by Falk Hueffner <falk.hueffner@student.uni-tuebingen.de> nickols_k parents: 190 diff changeset	148
0 986e461dc072 Initial revision glantau parents: diff changeset	149 #else
986e461dc072 Initial revision glantau parents: diff changeset	150
6 ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	151 #define emms_c()
ec4642daa6fe added emms_c() macro which should can used in c code in both mmx/non mmx cases glantau parents: 2 diff changeset	152
0 986e461dc072 Initial revision glantau parents: diff changeset	153 #define __align8
986e461dc072 Initial revision glantau parents: diff changeset	154
986e461dc072 Initial revision glantau parents: diff changeset	155 #endif
986e461dc072 Initial revision glantau parents: diff changeset	156
252 ddb1a0e94cf4 - Added PSNR feature to libavcodec and ffmpeg. By now just Y PSNR until I'm pulento parents: 214 diff changeset	157 /* PSNR */
ddb1a0e94cf4 - Added PSNR feature to libavcodec and ffmpeg. By now just Y PSNR until I'm pulento parents: 214 diff changeset	158 void get_psnr(UINT8 orig_image[3], UINT8 coded_image[3],
ddb1a0e94cf4 - Added PSNR feature to libavcodec and ffmpeg. By now just Y PSNR until I'm pulento parents: 214 diff changeset	159 int orig_linesize[3], int coded_linesize,
ddb1a0e94cf4 - Added PSNR feature to libavcodec and ffmpeg. By now just Y PSNR until I'm pulento parents: 214 diff changeset	160 AVCodecContext *avctx);
ddb1a0e94cf4 - Added PSNR feature to libavcodec and ffmpeg. By now just Y PSNR until I'm pulento parents: 214 diff changeset	161
0 986e461dc072 Initial revision glantau parents: diff changeset	162 #endif

Mercurial > libavcodec.hg

annotate dsputil.h @ 386:f49629bab18d libavcodec