libavcodec.hg: i386/mmx.h annotate

annotate i386/mmx.h @ 0:986e461dc072 libavcodec

Initial revision

author	glantau
date	Sun, 22 Jul 2001 14:18:56 +0000
parents
children	e4b7c3e5e527

rev	line source
0 986e461dc072 Initial revision glantau parents: diff changeset	1 /* mmx.h
986e461dc072 Initial revision glantau parents: diff changeset	2
986e461dc072 Initial revision glantau parents: diff changeset	3 MultiMedia eXtensions GCC interface library for IA32.
986e461dc072 Initial revision glantau parents: diff changeset	4
986e461dc072 Initial revision glantau parents: diff changeset	5 To use this library, simply include this header file
986e461dc072 Initial revision glantau parents: diff changeset	6 and compile with GCC. You MUST have inlining enabled
986e461dc072 Initial revision glantau parents: diff changeset	7 in order for mmx_ok() to work; this can be done by
986e461dc072 Initial revision glantau parents: diff changeset	8 simply using -O on the GCC command line.
986e461dc072 Initial revision glantau parents: diff changeset	9
986e461dc072 Initial revision glantau parents: diff changeset	10 Compiling with -DMMX_TRACE will cause detailed trace
986e461dc072 Initial revision glantau parents: diff changeset	11 output to be sent to stderr for each mmx operation.
986e461dc072 Initial revision glantau parents: diff changeset	12 This adds lots of code, and obviously slows execution to
986e461dc072 Initial revision glantau parents: diff changeset	13 a crawl, but can be very useful for debugging.
986e461dc072 Initial revision glantau parents: diff changeset	14
986e461dc072 Initial revision glantau parents: diff changeset	15 THIS SOFTWARE IS PROVIDED ``AS IS'' AND WITHOUT ANY
986e461dc072 Initial revision glantau parents: diff changeset	16 EXPRESS OR IMPLIED WARRANTIES, INCLUDING, WITHOUT
986e461dc072 Initial revision glantau parents: diff changeset	17 LIMITATION, THE IMPLIED WARRANTIES OF MERCHANTABILITY
986e461dc072 Initial revision glantau parents: diff changeset	18 AND FITNESS FOR ANY PARTICULAR PURPOSE.
986e461dc072 Initial revision glantau parents: diff changeset	19
986e461dc072 Initial revision glantau parents: diff changeset	20 1997-99 by H. Dietz and R. Fisher
986e461dc072 Initial revision glantau parents: diff changeset	21
986e461dc072 Initial revision glantau parents: diff changeset	22 Notes:
986e461dc072 Initial revision glantau parents: diff changeset	23 It appears that the latest gas has the pand problem fixed, therefore
986e461dc072 Initial revision glantau parents: diff changeset	24 I'll undefine BROKEN_PAND by default.
986e461dc072 Initial revision glantau parents: diff changeset	25 */
986e461dc072 Initial revision glantau parents: diff changeset	26
986e461dc072 Initial revision glantau parents: diff changeset	27 #ifndef _MMX_H
986e461dc072 Initial revision glantau parents: diff changeset	28 #define _MMX_H
986e461dc072 Initial revision glantau parents: diff changeset	29
986e461dc072 Initial revision glantau parents: diff changeset	30
986e461dc072 Initial revision glantau parents: diff changeset	31 /* Warning: at this writing, the version of GAS packaged
986e461dc072 Initial revision glantau parents: diff changeset	32 with most Linux distributions does not handle the
986e461dc072 Initial revision glantau parents: diff changeset	33 parallel AND operation mnemonic correctly. If the
986e461dc072 Initial revision glantau parents: diff changeset	34 symbol BROKEN_PAND is defined, a slower alternative
986e461dc072 Initial revision glantau parents: diff changeset	35 coding will be used. If execution of mmxtest results
986e461dc072 Initial revision glantau parents: diff changeset	36 in an illegal instruction fault, define this symbol.
986e461dc072 Initial revision glantau parents: diff changeset	37 */
986e461dc072 Initial revision glantau parents: diff changeset	38 #undef BROKEN_PAND
986e461dc072 Initial revision glantau parents: diff changeset	39
986e461dc072 Initial revision glantau parents: diff changeset	40
986e461dc072 Initial revision glantau parents: diff changeset	41 /* The type of an value that fits in an MMX register
986e461dc072 Initial revision glantau parents: diff changeset	42 (note that long long constant values MUST be suffixed
986e461dc072 Initial revision glantau parents: diff changeset	43 by LL and unsigned long long values by ULL, lest
986e461dc072 Initial revision glantau parents: diff changeset	44 they be truncated by the compiler)
986e461dc072 Initial revision glantau parents: diff changeset	45 */
986e461dc072 Initial revision glantau parents: diff changeset	46 typedef union {
986e461dc072 Initial revision glantau parents: diff changeset	47 long long q; /* Quadword (64-bit) value */
986e461dc072 Initial revision glantau parents: diff changeset	48 unsigned long long uq; /* Unsigned Quadword */
986e461dc072 Initial revision glantau parents: diff changeset	49 int d[2]; /* 2 Doubleword (32-bit) values */
986e461dc072 Initial revision glantau parents: diff changeset	50 unsigned int ud[2]; /* 2 Unsigned Doubleword */
986e461dc072 Initial revision glantau parents: diff changeset	51 short w[4]; /* 4 Word (16-bit) values */
986e461dc072 Initial revision glantau parents: diff changeset	52 unsigned short uw[4]; /* 4 Unsigned Word */
986e461dc072 Initial revision glantau parents: diff changeset	53 char b[8]; /* 8 Byte (8-bit) values */
986e461dc072 Initial revision glantau parents: diff changeset	54 unsigned char ub[8]; /* 8 Unsigned Byte */
986e461dc072 Initial revision glantau parents: diff changeset	55 float s[2]; /* Single-precision (32-bit) value */
986e461dc072 Initial revision glantau parents: diff changeset	56 } __attribute__ ((aligned (8))) mmx_t; /* On an 8-byte (64-bit) boundary */
986e461dc072 Initial revision glantau parents: diff changeset	57
986e461dc072 Initial revision glantau parents: diff changeset	58
986e461dc072 Initial revision glantau parents: diff changeset	59 /* Helper functions for the instruction macros that follow...
986e461dc072 Initial revision glantau parents: diff changeset	60 (note that memory-to-register, m2r, instructions are nearly
986e461dc072 Initial revision glantau parents: diff changeset	61 as efficient as register-to-register, r2r, instructions;
986e461dc072 Initial revision glantau parents: diff changeset	62 however, memory-to-memory instructions are really simulated
986e461dc072 Initial revision glantau parents: diff changeset	63 as a convenience, and are only 1/3 as efficient)
986e461dc072 Initial revision glantau parents: diff changeset	64 */
986e461dc072 Initial revision glantau parents: diff changeset	65 #ifdef MMX_TRACE
986e461dc072 Initial revision glantau parents: diff changeset	66
986e461dc072 Initial revision glantau parents: diff changeset	67 /* Include the stuff for printing a trace to stderr...
986e461dc072 Initial revision glantau parents: diff changeset	68 */
986e461dc072 Initial revision glantau parents: diff changeset	69
986e461dc072 Initial revision glantau parents: diff changeset	70 #include <stdio.h>
986e461dc072 Initial revision glantau parents: diff changeset	71
986e461dc072 Initial revision glantau parents: diff changeset	72 #define mmx_i2r(op, imm, reg) \
986e461dc072 Initial revision glantau parents: diff changeset	73 { \
986e461dc072 Initial revision glantau parents: diff changeset	74 mmx_t mmx_trace; \
986e461dc072 Initial revision glantau parents: diff changeset	75 mmx_trace.uq = (imm); \
986e461dc072 Initial revision glantau parents: diff changeset	76 fprintf(stderr, #op "_i2r(" #imm "=0x%08x%08x, ", \
986e461dc072 Initial revision glantau parents: diff changeset	77 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	78 __asm__ __volatile__ ("movq %%" #reg ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	79 : "=X" (mmx_trace) \
986e461dc072 Initial revision glantau parents: diff changeset	80 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	81 fprintf(stderr, #reg "=0x%08x%08x) => ", \
986e461dc072 Initial revision glantau parents: diff changeset	82 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	83 __asm__ __volatile__ (#op " %0, %%" #reg \
986e461dc072 Initial revision glantau parents: diff changeset	84 : /* nothing */ \
986e461dc072 Initial revision glantau parents: diff changeset	85 : "X" (imm)); \
986e461dc072 Initial revision glantau parents: diff changeset	86 __asm__ __volatile__ ("movq %%" #reg ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	87 : "=X" (mmx_trace) \
986e461dc072 Initial revision glantau parents: diff changeset	88 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	89 fprintf(stderr, #reg "=0x%08x%08x\n", \
986e461dc072 Initial revision glantau parents: diff changeset	90 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	91 }
986e461dc072 Initial revision glantau parents: diff changeset	92
986e461dc072 Initial revision glantau parents: diff changeset	93 #define mmx_m2r(op, mem, reg) \
986e461dc072 Initial revision glantau parents: diff changeset	94 { \
986e461dc072 Initial revision glantau parents: diff changeset	95 mmx_t mmx_trace; \
986e461dc072 Initial revision glantau parents: diff changeset	96 mmx_trace = (mem); \
986e461dc072 Initial revision glantau parents: diff changeset	97 fprintf(stderr, #op "_m2r(" #mem "=0x%08x%08x, ", \
986e461dc072 Initial revision glantau parents: diff changeset	98 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	99 __asm__ __volatile__ ("movq %%" #reg ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	100 : "=X" (mmx_trace) \
986e461dc072 Initial revision glantau parents: diff changeset	101 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	102 fprintf(stderr, #reg "=0x%08x%08x) => ", \
986e461dc072 Initial revision glantau parents: diff changeset	103 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	104 __asm__ __volatile__ (#op " %0, %%" #reg \
986e461dc072 Initial revision glantau parents: diff changeset	105 : /* nothing */ \
986e461dc072 Initial revision glantau parents: diff changeset	106 : "X" (mem)); \
986e461dc072 Initial revision glantau parents: diff changeset	107 __asm__ __volatile__ ("movq %%" #reg ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	108 : "=X" (mmx_trace) \
986e461dc072 Initial revision glantau parents: diff changeset	109 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	110 fprintf(stderr, #reg "=0x%08x%08x\n", \
986e461dc072 Initial revision glantau parents: diff changeset	111 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	112 }
986e461dc072 Initial revision glantau parents: diff changeset	113
986e461dc072 Initial revision glantau parents: diff changeset	114 #define mmx_r2m(op, reg, mem) \
986e461dc072 Initial revision glantau parents: diff changeset	115 { \
986e461dc072 Initial revision glantau parents: diff changeset	116 mmx_t mmx_trace; \
986e461dc072 Initial revision glantau parents: diff changeset	117 __asm__ __volatile__ ("movq %%" #reg ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	118 : "=X" (mmx_trace) \
986e461dc072 Initial revision glantau parents: diff changeset	119 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	120 fprintf(stderr, #op "_r2m(" #reg "=0x%08x%08x, ", \
986e461dc072 Initial revision glantau parents: diff changeset	121 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	122 mmx_trace = (mem); \
986e461dc072 Initial revision glantau parents: diff changeset	123 fprintf(stderr, #mem "=0x%08x%08x) => ", \
986e461dc072 Initial revision glantau parents: diff changeset	124 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	125 __asm__ __volatile__ (#op " %%" #reg ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	126 : "=X" (mem) \
986e461dc072 Initial revision glantau parents: diff changeset	127 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	128 mmx_trace = (mem); \
986e461dc072 Initial revision glantau parents: diff changeset	129 fprintf(stderr, #mem "=0x%08x%08x\n", \
986e461dc072 Initial revision glantau parents: diff changeset	130 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	131 }
986e461dc072 Initial revision glantau parents: diff changeset	132
986e461dc072 Initial revision glantau parents: diff changeset	133 #define mmx_r2r(op, regs, regd) \
986e461dc072 Initial revision glantau parents: diff changeset	134 { \
986e461dc072 Initial revision glantau parents: diff changeset	135 mmx_t mmx_trace; \
986e461dc072 Initial revision glantau parents: diff changeset	136 __asm__ __volatile__ ("movq %%" #regs ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	137 : "=X" (mmx_trace) \
986e461dc072 Initial revision glantau parents: diff changeset	138 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	139 fprintf(stderr, #op "_r2r(" #regs "=0x%08x%08x, ", \
986e461dc072 Initial revision glantau parents: diff changeset	140 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	141 __asm__ __volatile__ ("movq %%" #regd ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	142 : "=X" (mmx_trace) \
986e461dc072 Initial revision glantau parents: diff changeset	143 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	144 fprintf(stderr, #regd "=0x%08x%08x) => ", \
986e461dc072 Initial revision glantau parents: diff changeset	145 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	146 __asm__ __volatile__ (#op " %" #regs ", %" #regd); \
986e461dc072 Initial revision glantau parents: diff changeset	147 __asm__ __volatile__ ("movq %%" #regd ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	148 : "=X" (mmx_trace) \
986e461dc072 Initial revision glantau parents: diff changeset	149 : /* nothing */ ); \
986e461dc072 Initial revision glantau parents: diff changeset	150 fprintf(stderr, #regd "=0x%08x%08x\n", \
986e461dc072 Initial revision glantau parents: diff changeset	151 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	152 }
986e461dc072 Initial revision glantau parents: diff changeset	153
986e461dc072 Initial revision glantau parents: diff changeset	154 #define mmx_m2m(op, mems, memd) \
986e461dc072 Initial revision glantau parents: diff changeset	155 { \
986e461dc072 Initial revision glantau parents: diff changeset	156 mmx_t mmx_trace; \
986e461dc072 Initial revision glantau parents: diff changeset	157 mmx_trace = (mems); \
986e461dc072 Initial revision glantau parents: diff changeset	158 fprintf(stderr, #op "_m2m(" #mems "=0x%08x%08x, ", \
986e461dc072 Initial revision glantau parents: diff changeset	159 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	160 mmx_trace = (memd); \
986e461dc072 Initial revision glantau parents: diff changeset	161 fprintf(stderr, #memd "=0x%08x%08x) => ", \
986e461dc072 Initial revision glantau parents: diff changeset	162 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	163 __asm__ __volatile__ ("movq %0, %%mm0\n\t" \
986e461dc072 Initial revision glantau parents: diff changeset	164 #op " %1, %%mm0\n\t" \
986e461dc072 Initial revision glantau parents: diff changeset	165 "movq %%mm0, %0" \
986e461dc072 Initial revision glantau parents: diff changeset	166 : "=X" (memd) \
986e461dc072 Initial revision glantau parents: diff changeset	167 : "X" (mems)); \
986e461dc072 Initial revision glantau parents: diff changeset	168 mmx_trace = (memd); \
986e461dc072 Initial revision glantau parents: diff changeset	169 fprintf(stderr, #memd "=0x%08x%08x\n", \
986e461dc072 Initial revision glantau parents: diff changeset	170 mmx_trace.d[1], mmx_trace.d[0]); \
986e461dc072 Initial revision glantau parents: diff changeset	171 }
986e461dc072 Initial revision glantau parents: diff changeset	172
986e461dc072 Initial revision glantau parents: diff changeset	173 #else
986e461dc072 Initial revision glantau parents: diff changeset	174
986e461dc072 Initial revision glantau parents: diff changeset	175 /* These macros are a lot simpler without the tracing...
986e461dc072 Initial revision glantau parents: diff changeset	176 */
986e461dc072 Initial revision glantau parents: diff changeset	177
986e461dc072 Initial revision glantau parents: diff changeset	178 #define mmx_i2r(op, imm, reg) \
986e461dc072 Initial revision glantau parents: diff changeset	179 __asm__ __volatile__ (#op " %0, %%" #reg \
986e461dc072 Initial revision glantau parents: diff changeset	180 : /* nothing */ \
986e461dc072 Initial revision glantau parents: diff changeset	181 : "i" (imm) )
986e461dc072 Initial revision glantau parents: diff changeset	182
986e461dc072 Initial revision glantau parents: diff changeset	183 #define mmx_m2r(op, mem, reg) \
986e461dc072 Initial revision glantau parents: diff changeset	184 __asm__ __volatile__ (#op " %0, %%" #reg \
986e461dc072 Initial revision glantau parents: diff changeset	185 : /* nothing */ \
986e461dc072 Initial revision glantau parents: diff changeset	186 : "m" (mem))
986e461dc072 Initial revision glantau parents: diff changeset	187
986e461dc072 Initial revision glantau parents: diff changeset	188 #define mmx_r2m(op, reg, mem) \
986e461dc072 Initial revision glantau parents: diff changeset	189 __asm__ __volatile__ (#op " %%" #reg ", %0" \
986e461dc072 Initial revision glantau parents: diff changeset	190 : "=m" (mem) \
986e461dc072 Initial revision glantau parents: diff changeset	191 : /* nothing */ )
986e461dc072 Initial revision glantau parents: diff changeset	192
986e461dc072 Initial revision glantau parents: diff changeset	193 #define mmx_r2r(op, regs, regd) \
986e461dc072 Initial revision glantau parents: diff changeset	194 __asm__ __volatile__ (#op " %" #regs ", %" #regd)
986e461dc072 Initial revision glantau parents: diff changeset	195
986e461dc072 Initial revision glantau parents: diff changeset	196 #define mmx_m2m(op, mems, memd) \
986e461dc072 Initial revision glantau parents: diff changeset	197 __asm__ __volatile__ ("movq %0, %%mm0\n\t" \
986e461dc072 Initial revision glantau parents: diff changeset	198 #op " %1, %%mm0\n\t" \
986e461dc072 Initial revision glantau parents: diff changeset	199 "movq %%mm0, %0" \
986e461dc072 Initial revision glantau parents: diff changeset	200 : "=m" (memd) \
986e461dc072 Initial revision glantau parents: diff changeset	201 : "m" (mems))
986e461dc072 Initial revision glantau parents: diff changeset	202
986e461dc072 Initial revision glantau parents: diff changeset	203 #endif
986e461dc072 Initial revision glantau parents: diff changeset	204
986e461dc072 Initial revision glantau parents: diff changeset	205
986e461dc072 Initial revision glantau parents: diff changeset	206 /* 1x64 MOVe Quadword
986e461dc072 Initial revision glantau parents: diff changeset	207 (this is both a load and a store...
986e461dc072 Initial revision glantau parents: diff changeset	208 in fact, it is the only way to store)
986e461dc072 Initial revision glantau parents: diff changeset	209 */
986e461dc072 Initial revision glantau parents: diff changeset	210 #define movq_m2r(var, reg) mmx_m2r(movq, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	211 #define movq_r2m(reg, var) mmx_r2m(movq, reg, var)
986e461dc072 Initial revision glantau parents: diff changeset	212 #define movq_r2r(regs, regd) mmx_r2r(movq, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	213 #define movq(vars, vard) \
986e461dc072 Initial revision glantau parents: diff changeset	214 __asm__ __volatile__ ("movq %1, %%mm0\n\t" \
986e461dc072 Initial revision glantau parents: diff changeset	215 "movq %%mm0, %0" \
986e461dc072 Initial revision glantau parents: diff changeset	216 : "=X" (vard) \
986e461dc072 Initial revision glantau parents: diff changeset	217 : "X" (vars))
986e461dc072 Initial revision glantau parents: diff changeset	218
986e461dc072 Initial revision glantau parents: diff changeset	219
986e461dc072 Initial revision glantau parents: diff changeset	220 /* 1x32 MOVe Doubleword
986e461dc072 Initial revision glantau parents: diff changeset	221 (like movq, this is both load and store...
986e461dc072 Initial revision glantau parents: diff changeset	222 but is most useful for moving things between
986e461dc072 Initial revision glantau parents: diff changeset	223 mmx registers and ordinary registers)
986e461dc072 Initial revision glantau parents: diff changeset	224 */
986e461dc072 Initial revision glantau parents: diff changeset	225 #define movd_m2r(var, reg) mmx_m2r(movd, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	226 #define movd_r2m(reg, var) mmx_r2m(movd, reg, var)
986e461dc072 Initial revision glantau parents: diff changeset	227 #define movd_r2r(regs, regd) mmx_r2r(movd, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	228 #define movd(vars, vard) \
986e461dc072 Initial revision glantau parents: diff changeset	229 __asm__ __volatile__ ("movd %1, %%mm0\n\t" \
986e461dc072 Initial revision glantau parents: diff changeset	230 "movd %%mm0, %0" \
986e461dc072 Initial revision glantau parents: diff changeset	231 : "=X" (vard) \
986e461dc072 Initial revision glantau parents: diff changeset	232 : "X" (vars))
986e461dc072 Initial revision glantau parents: diff changeset	233
986e461dc072 Initial revision glantau parents: diff changeset	234
986e461dc072 Initial revision glantau parents: diff changeset	235 /* 2x32, 4x16, and 8x8 Parallel ADDs
986e461dc072 Initial revision glantau parents: diff changeset	236 */
986e461dc072 Initial revision glantau parents: diff changeset	237 #define paddd_m2r(var, reg) mmx_m2r(paddd, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	238 #define paddd_r2r(regs, regd) mmx_r2r(paddd, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	239 #define paddd(vars, vard) mmx_m2m(paddd, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	240
986e461dc072 Initial revision glantau parents: diff changeset	241 #define paddw_m2r(var, reg) mmx_m2r(paddw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	242 #define paddw_r2r(regs, regd) mmx_r2r(paddw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	243 #define paddw(vars, vard) mmx_m2m(paddw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	244
986e461dc072 Initial revision glantau parents: diff changeset	245 #define paddb_m2r(var, reg) mmx_m2r(paddb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	246 #define paddb_r2r(regs, regd) mmx_r2r(paddb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	247 #define paddb(vars, vard) mmx_m2m(paddb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	248
986e461dc072 Initial revision glantau parents: diff changeset	249
986e461dc072 Initial revision glantau parents: diff changeset	250 /* 4x16 and 8x8 Parallel ADDs using Saturation arithmetic
986e461dc072 Initial revision glantau parents: diff changeset	251 */
986e461dc072 Initial revision glantau parents: diff changeset	252 #define paddsw_m2r(var, reg) mmx_m2r(paddsw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	253 #define paddsw_r2r(regs, regd) mmx_r2r(paddsw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	254 #define paddsw(vars, vard) mmx_m2m(paddsw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	255
986e461dc072 Initial revision glantau parents: diff changeset	256 #define paddsb_m2r(var, reg) mmx_m2r(paddsb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	257 #define paddsb_r2r(regs, regd) mmx_r2r(paddsb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	258 #define paddsb(vars, vard) mmx_m2m(paddsb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	259
986e461dc072 Initial revision glantau parents: diff changeset	260
986e461dc072 Initial revision glantau parents: diff changeset	261 /* 4x16 and 8x8 Parallel ADDs using Unsigned Saturation arithmetic
986e461dc072 Initial revision glantau parents: diff changeset	262 */
986e461dc072 Initial revision glantau parents: diff changeset	263 #define paddusw_m2r(var, reg) mmx_m2r(paddusw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	264 #define paddusw_r2r(regs, regd) mmx_r2r(paddusw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	265 #define paddusw(vars, vard) mmx_m2m(paddusw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	266
986e461dc072 Initial revision glantau parents: diff changeset	267 #define paddusb_m2r(var, reg) mmx_m2r(paddusb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	268 #define paddusb_r2r(regs, regd) mmx_r2r(paddusb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	269 #define paddusb(vars, vard) mmx_m2m(paddusb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	270
986e461dc072 Initial revision glantau parents: diff changeset	271
986e461dc072 Initial revision glantau parents: diff changeset	272 /* 2x32, 4x16, and 8x8 Parallel SUBs
986e461dc072 Initial revision glantau parents: diff changeset	273 */
986e461dc072 Initial revision glantau parents: diff changeset	274 #define psubd_m2r(var, reg) mmx_m2r(psubd, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	275 #define psubd_r2r(regs, regd) mmx_r2r(psubd, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	276 #define psubd(vars, vard) mmx_m2m(psubd, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	277
986e461dc072 Initial revision glantau parents: diff changeset	278 #define psubw_m2r(var, reg) mmx_m2r(psubw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	279 #define psubw_r2r(regs, regd) mmx_r2r(psubw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	280 #define psubw(vars, vard) mmx_m2m(psubw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	281
986e461dc072 Initial revision glantau parents: diff changeset	282 #define psubb_m2r(var, reg) mmx_m2r(psubb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	283 #define psubb_r2r(regs, regd) mmx_r2r(psubb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	284 #define psubb(vars, vard) mmx_m2m(psubb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	285
986e461dc072 Initial revision glantau parents: diff changeset	286
986e461dc072 Initial revision glantau parents: diff changeset	287 /* 4x16 and 8x8 Parallel SUBs using Saturation arithmetic
986e461dc072 Initial revision glantau parents: diff changeset	288 */
986e461dc072 Initial revision glantau parents: diff changeset	289 #define psubsw_m2r(var, reg) mmx_m2r(psubsw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	290 #define psubsw_r2r(regs, regd) mmx_r2r(psubsw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	291 #define psubsw(vars, vard) mmx_m2m(psubsw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	292
986e461dc072 Initial revision glantau parents: diff changeset	293 #define psubsb_m2r(var, reg) mmx_m2r(psubsb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	294 #define psubsb_r2r(regs, regd) mmx_r2r(psubsb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	295 #define psubsb(vars, vard) mmx_m2m(psubsb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	296
986e461dc072 Initial revision glantau parents: diff changeset	297
986e461dc072 Initial revision glantau parents: diff changeset	298 /* 4x16 and 8x8 Parallel SUBs using Unsigned Saturation arithmetic
986e461dc072 Initial revision glantau parents: diff changeset	299 */
986e461dc072 Initial revision glantau parents: diff changeset	300 #define psubusw_m2r(var, reg) mmx_m2r(psubusw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	301 #define psubusw_r2r(regs, regd) mmx_r2r(psubusw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	302 #define psubusw(vars, vard) mmx_m2m(psubusw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	303
986e461dc072 Initial revision glantau parents: diff changeset	304 #define psubusb_m2r(var, reg) mmx_m2r(psubusb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	305 #define psubusb_r2r(regs, regd) mmx_r2r(psubusb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	306 #define psubusb(vars, vard) mmx_m2m(psubusb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	307
986e461dc072 Initial revision glantau parents: diff changeset	308
986e461dc072 Initial revision glantau parents: diff changeset	309 /* 4x16 Parallel MULs giving Low 4x16 portions of results
986e461dc072 Initial revision glantau parents: diff changeset	310 */
986e461dc072 Initial revision glantau parents: diff changeset	311 #define pmullw_m2r(var, reg) mmx_m2r(pmullw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	312 #define pmullw_r2r(regs, regd) mmx_r2r(pmullw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	313 #define pmullw(vars, vard) mmx_m2m(pmullw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	314
986e461dc072 Initial revision glantau parents: diff changeset	315
986e461dc072 Initial revision glantau parents: diff changeset	316 /* 4x16 Parallel MULs giving High 4x16 portions of results
986e461dc072 Initial revision glantau parents: diff changeset	317 */
986e461dc072 Initial revision glantau parents: diff changeset	318 #define pmulhw_m2r(var, reg) mmx_m2r(pmulhw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	319 #define pmulhw_r2r(regs, regd) mmx_r2r(pmulhw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	320 #define pmulhw(vars, vard) mmx_m2m(pmulhw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	321
986e461dc072 Initial revision glantau parents: diff changeset	322
986e461dc072 Initial revision glantau parents: diff changeset	323 /* 4x16->2x32 Parallel Mul-ADD
986e461dc072 Initial revision glantau parents: diff changeset	324 (muls like pmullw, then adds adjacent 16-bit fields
986e461dc072 Initial revision glantau parents: diff changeset	325 in the multiply result to make the final 2x32 result)
986e461dc072 Initial revision glantau parents: diff changeset	326 */
986e461dc072 Initial revision glantau parents: diff changeset	327 #define pmaddwd_m2r(var, reg) mmx_m2r(pmaddwd, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	328 #define pmaddwd_r2r(regs, regd) mmx_r2r(pmaddwd, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	329 #define pmaddwd(vars, vard) mmx_m2m(pmaddwd, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	330
986e461dc072 Initial revision glantau parents: diff changeset	331
986e461dc072 Initial revision glantau parents: diff changeset	332 /* 1x64 bitwise AND
986e461dc072 Initial revision glantau parents: diff changeset	333 */
986e461dc072 Initial revision glantau parents: diff changeset	334 #ifdef BROKEN_PAND
986e461dc072 Initial revision glantau parents: diff changeset	335 #define pand_m2r(var, reg) \
986e461dc072 Initial revision glantau parents: diff changeset	336 { \
986e461dc072 Initial revision glantau parents: diff changeset	337 mmx_m2r(pandn, (mmx_t) -1LL, reg); \
986e461dc072 Initial revision glantau parents: diff changeset	338 mmx_m2r(pandn, var, reg); \
986e461dc072 Initial revision glantau parents: diff changeset	339 }
986e461dc072 Initial revision glantau parents: diff changeset	340 #define pand_r2r(regs, regd) \
986e461dc072 Initial revision glantau parents: diff changeset	341 { \
986e461dc072 Initial revision glantau parents: diff changeset	342 mmx_m2r(pandn, (mmx_t) -1LL, regd); \
986e461dc072 Initial revision glantau parents: diff changeset	343 mmx_r2r(pandn, regs, regd) \
986e461dc072 Initial revision glantau parents: diff changeset	344 }
986e461dc072 Initial revision glantau parents: diff changeset	345 #define pand(vars, vard) \
986e461dc072 Initial revision glantau parents: diff changeset	346 { \
986e461dc072 Initial revision glantau parents: diff changeset	347 movq_m2r(vard, mm0); \
986e461dc072 Initial revision glantau parents: diff changeset	348 mmx_m2r(pandn, (mmx_t) -1LL, mm0); \
986e461dc072 Initial revision glantau parents: diff changeset	349 mmx_m2r(pandn, vars, mm0); \
986e461dc072 Initial revision glantau parents: diff changeset	350 movq_r2m(mm0, vard); \
986e461dc072 Initial revision glantau parents: diff changeset	351 }
986e461dc072 Initial revision glantau parents: diff changeset	352 #else
986e461dc072 Initial revision glantau parents: diff changeset	353 #define pand_m2r(var, reg) mmx_m2r(pand, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	354 #define pand_r2r(regs, regd) mmx_r2r(pand, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	355 #define pand(vars, vard) mmx_m2m(pand, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	356 #endif
986e461dc072 Initial revision glantau parents: diff changeset	357
986e461dc072 Initial revision glantau parents: diff changeset	358
986e461dc072 Initial revision glantau parents: diff changeset	359 /* 1x64 bitwise AND with Not the destination
986e461dc072 Initial revision glantau parents: diff changeset	360 */
986e461dc072 Initial revision glantau parents: diff changeset	361 #define pandn_m2r(var, reg) mmx_m2r(pandn, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	362 #define pandn_r2r(regs, regd) mmx_r2r(pandn, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	363 #define pandn(vars, vard) mmx_m2m(pandn, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	364
986e461dc072 Initial revision glantau parents: diff changeset	365
986e461dc072 Initial revision glantau parents: diff changeset	366 /* 1x64 bitwise OR
986e461dc072 Initial revision glantau parents: diff changeset	367 */
986e461dc072 Initial revision glantau parents: diff changeset	368 #define por_m2r(var, reg) mmx_m2r(por, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	369 #define por_r2r(regs, regd) mmx_r2r(por, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	370 #define por(vars, vard) mmx_m2m(por, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	371
986e461dc072 Initial revision glantau parents: diff changeset	372
986e461dc072 Initial revision glantau parents: diff changeset	373 /* 1x64 bitwise eXclusive OR
986e461dc072 Initial revision glantau parents: diff changeset	374 */
986e461dc072 Initial revision glantau parents: diff changeset	375 #define pxor_m2r(var, reg) mmx_m2r(pxor, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	376 #define pxor_r2r(regs, regd) mmx_r2r(pxor, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	377 #define pxor(vars, vard) mmx_m2m(pxor, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	378
986e461dc072 Initial revision glantau parents: diff changeset	379
986e461dc072 Initial revision glantau parents: diff changeset	380 /* 2x32, 4x16, and 8x8 Parallel CoMPare for EQuality
986e461dc072 Initial revision glantau parents: diff changeset	381 (resulting fields are either 0 or -1)
986e461dc072 Initial revision glantau parents: diff changeset	382 */
986e461dc072 Initial revision glantau parents: diff changeset	383 #define pcmpeqd_m2r(var, reg) mmx_m2r(pcmpeqd, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	384 #define pcmpeqd_r2r(regs, regd) mmx_r2r(pcmpeqd, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	385 #define pcmpeqd(vars, vard) mmx_m2m(pcmpeqd, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	386
986e461dc072 Initial revision glantau parents: diff changeset	387 #define pcmpeqw_m2r(var, reg) mmx_m2r(pcmpeqw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	388 #define pcmpeqw_r2r(regs, regd) mmx_r2r(pcmpeqw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	389 #define pcmpeqw(vars, vard) mmx_m2m(pcmpeqw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	390
986e461dc072 Initial revision glantau parents: diff changeset	391 #define pcmpeqb_m2r(var, reg) mmx_m2r(pcmpeqb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	392 #define pcmpeqb_r2r(regs, regd) mmx_r2r(pcmpeqb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	393 #define pcmpeqb(vars, vard) mmx_m2m(pcmpeqb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	394
986e461dc072 Initial revision glantau parents: diff changeset	395
986e461dc072 Initial revision glantau parents: diff changeset	396 /* 2x32, 4x16, and 8x8 Parallel CoMPare for Greater Than
986e461dc072 Initial revision glantau parents: diff changeset	397 (resulting fields are either 0 or -1)
986e461dc072 Initial revision glantau parents: diff changeset	398 */
986e461dc072 Initial revision glantau parents: diff changeset	399 #define pcmpgtd_m2r(var, reg) mmx_m2r(pcmpgtd, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	400 #define pcmpgtd_r2r(regs, regd) mmx_r2r(pcmpgtd, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	401 #define pcmpgtd(vars, vard) mmx_m2m(pcmpgtd, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	402
986e461dc072 Initial revision glantau parents: diff changeset	403 #define pcmpgtw_m2r(var, reg) mmx_m2r(pcmpgtw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	404 #define pcmpgtw_r2r(regs, regd) mmx_r2r(pcmpgtw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	405 #define pcmpgtw(vars, vard) mmx_m2m(pcmpgtw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	406
986e461dc072 Initial revision glantau parents: diff changeset	407 #define pcmpgtb_m2r(var, reg) mmx_m2r(pcmpgtb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	408 #define pcmpgtb_r2r(regs, regd) mmx_r2r(pcmpgtb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	409 #define pcmpgtb(vars, vard) mmx_m2m(pcmpgtb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	410
986e461dc072 Initial revision glantau parents: diff changeset	411
986e461dc072 Initial revision glantau parents: diff changeset	412 /* 1x64, 2x32, and 4x16 Parallel Shift Left Logical
986e461dc072 Initial revision glantau parents: diff changeset	413 */
986e461dc072 Initial revision glantau parents: diff changeset	414 #define psllq_i2r(imm, reg) mmx_i2r(psllq, imm, reg)
986e461dc072 Initial revision glantau parents: diff changeset	415 #define psllq_m2r(var, reg) mmx_m2r(psllq, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	416 #define psllq_r2r(regs, regd) mmx_r2r(psllq, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	417 #define psllq(vars, vard) mmx_m2m(psllq, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	418
986e461dc072 Initial revision glantau parents: diff changeset	419 #define pslld_i2r(imm, reg) mmx_i2r(pslld, imm, reg)
986e461dc072 Initial revision glantau parents: diff changeset	420 #define pslld_m2r(var, reg) mmx_m2r(pslld, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	421 #define pslld_r2r(regs, regd) mmx_r2r(pslld, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	422 #define pslld(vars, vard) mmx_m2m(pslld, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	423
986e461dc072 Initial revision glantau parents: diff changeset	424 #define psllw_i2r(imm, reg) mmx_i2r(psllw, imm, reg)
986e461dc072 Initial revision glantau parents: diff changeset	425 #define psllw_m2r(var, reg) mmx_m2r(psllw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	426 #define psllw_r2r(regs, regd) mmx_r2r(psllw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	427 #define psllw(vars, vard) mmx_m2m(psllw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	428
986e461dc072 Initial revision glantau parents: diff changeset	429
986e461dc072 Initial revision glantau parents: diff changeset	430 /* 1x64, 2x32, and 4x16 Parallel Shift Right Logical
986e461dc072 Initial revision glantau parents: diff changeset	431 */
986e461dc072 Initial revision glantau parents: diff changeset	432 #define psrlq_i2r(imm, reg) mmx_i2r(psrlq, imm, reg)
986e461dc072 Initial revision glantau parents: diff changeset	433 #define psrlq_m2r(var, reg) mmx_m2r(psrlq, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	434 #define psrlq_r2r(regs, regd) mmx_r2r(psrlq, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	435 #define psrlq(vars, vard) mmx_m2m(psrlq, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	436
986e461dc072 Initial revision glantau parents: diff changeset	437 #define psrld_i2r(imm, reg) mmx_i2r(psrld, imm, reg)
986e461dc072 Initial revision glantau parents: diff changeset	438 #define psrld_m2r(var, reg) mmx_m2r(psrld, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	439 #define psrld_r2r(regs, regd) mmx_r2r(psrld, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	440 #define psrld(vars, vard) mmx_m2m(psrld, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	441
986e461dc072 Initial revision glantau parents: diff changeset	442 #define psrlw_i2r(imm, reg) mmx_i2r(psrlw, imm, reg)
986e461dc072 Initial revision glantau parents: diff changeset	443 #define psrlw_m2r(var, reg) mmx_m2r(psrlw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	444 #define psrlw_r2r(regs, regd) mmx_r2r(psrlw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	445 #define psrlw(vars, vard) mmx_m2m(psrlw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	446
986e461dc072 Initial revision glantau parents: diff changeset	447
986e461dc072 Initial revision glantau parents: diff changeset	448 /* 2x32 and 4x16 Parallel Shift Right Arithmetic
986e461dc072 Initial revision glantau parents: diff changeset	449 */
986e461dc072 Initial revision glantau parents: diff changeset	450 #define psrad_i2r(imm, reg) mmx_i2r(psrad, imm, reg)
986e461dc072 Initial revision glantau parents: diff changeset	451 #define psrad_m2r(var, reg) mmx_m2r(psrad, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	452 #define psrad_r2r(regs, regd) mmx_r2r(psrad, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	453 #define psrad(vars, vard) mmx_m2m(psrad, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	454
986e461dc072 Initial revision glantau parents: diff changeset	455 #define psraw_i2r(imm, reg) mmx_i2r(psraw, imm, reg)
986e461dc072 Initial revision glantau parents: diff changeset	456 #define psraw_m2r(var, reg) mmx_m2r(psraw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	457 #define psraw_r2r(regs, regd) mmx_r2r(psraw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	458 #define psraw(vars, vard) mmx_m2m(psraw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	459
986e461dc072 Initial revision glantau parents: diff changeset	460
986e461dc072 Initial revision glantau parents: diff changeset	461 /* 2x32->4x16 and 4x16->8x8 PACK and Signed Saturate
986e461dc072 Initial revision glantau parents: diff changeset	462 (packs source and dest fields into dest in that order)
986e461dc072 Initial revision glantau parents: diff changeset	463 */
986e461dc072 Initial revision glantau parents: diff changeset	464 #define packssdw_m2r(var, reg) mmx_m2r(packssdw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	465 #define packssdw_r2r(regs, regd) mmx_r2r(packssdw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	466 #define packssdw(vars, vard) mmx_m2m(packssdw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	467
986e461dc072 Initial revision glantau parents: diff changeset	468 #define packsswb_m2r(var, reg) mmx_m2r(packsswb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	469 #define packsswb_r2r(regs, regd) mmx_r2r(packsswb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	470 #define packsswb(vars, vard) mmx_m2m(packsswb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	471
986e461dc072 Initial revision glantau parents: diff changeset	472
986e461dc072 Initial revision glantau parents: diff changeset	473 /* 4x16->8x8 PACK and Unsigned Saturate
986e461dc072 Initial revision glantau parents: diff changeset	474 (packs source and dest fields into dest in that order)
986e461dc072 Initial revision glantau parents: diff changeset	475 */
986e461dc072 Initial revision glantau parents: diff changeset	476 #define packuswb_m2r(var, reg) mmx_m2r(packuswb, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	477 #define packuswb_r2r(regs, regd) mmx_r2r(packuswb, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	478 #define packuswb(vars, vard) mmx_m2m(packuswb, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	479
986e461dc072 Initial revision glantau parents: diff changeset	480
986e461dc072 Initial revision glantau parents: diff changeset	481 /* 2x32->1x64, 4x16->2x32, and 8x8->4x16 UNPaCK Low
986e461dc072 Initial revision glantau parents: diff changeset	482 (interleaves low half of dest with low half of source
986e461dc072 Initial revision glantau parents: diff changeset	483 as padding in each result field)
986e461dc072 Initial revision glantau parents: diff changeset	484 */
986e461dc072 Initial revision glantau parents: diff changeset	485 #define punpckldq_m2r(var, reg) mmx_m2r(punpckldq, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	486 #define punpckldq_r2r(regs, regd) mmx_r2r(punpckldq, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	487 #define punpckldq(vars, vard) mmx_m2m(punpckldq, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	488
986e461dc072 Initial revision glantau parents: diff changeset	489 #define punpcklwd_m2r(var, reg) mmx_m2r(punpcklwd, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	490 #define punpcklwd_r2r(regs, regd) mmx_r2r(punpcklwd, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	491 #define punpcklwd(vars, vard) mmx_m2m(punpcklwd, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	492
986e461dc072 Initial revision glantau parents: diff changeset	493 #define punpcklbw_m2r(var, reg) mmx_m2r(punpcklbw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	494 #define punpcklbw_r2r(regs, regd) mmx_r2r(punpcklbw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	495 #define punpcklbw(vars, vard) mmx_m2m(punpcklbw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	496
986e461dc072 Initial revision glantau parents: diff changeset	497
986e461dc072 Initial revision glantau parents: diff changeset	498 /* 2x32->1x64, 4x16->2x32, and 8x8->4x16 UNPaCK High
986e461dc072 Initial revision glantau parents: diff changeset	499 (interleaves high half of dest with high half of source
986e461dc072 Initial revision glantau parents: diff changeset	500 as padding in each result field)
986e461dc072 Initial revision glantau parents: diff changeset	501 */
986e461dc072 Initial revision glantau parents: diff changeset	502 #define punpckhdq_m2r(var, reg) mmx_m2r(punpckhdq, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	503 #define punpckhdq_r2r(regs, regd) mmx_r2r(punpckhdq, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	504 #define punpckhdq(vars, vard) mmx_m2m(punpckhdq, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	505
986e461dc072 Initial revision glantau parents: diff changeset	506 #define punpckhwd_m2r(var, reg) mmx_m2r(punpckhwd, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	507 #define punpckhwd_r2r(regs, regd) mmx_r2r(punpckhwd, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	508 #define punpckhwd(vars, vard) mmx_m2m(punpckhwd, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	509
986e461dc072 Initial revision glantau parents: diff changeset	510 #define punpckhbw_m2r(var, reg) mmx_m2r(punpckhbw, var, reg)
986e461dc072 Initial revision glantau parents: diff changeset	511 #define punpckhbw_r2r(regs, regd) mmx_r2r(punpckhbw, regs, regd)
986e461dc072 Initial revision glantau parents: diff changeset	512 #define punpckhbw(vars, vard) mmx_m2m(punpckhbw, vars, vard)
986e461dc072 Initial revision glantau parents: diff changeset	513
986e461dc072 Initial revision glantau parents: diff changeset	514
986e461dc072 Initial revision glantau parents: diff changeset	515 /* Empty MMx State
986e461dc072 Initial revision glantau parents: diff changeset	516 (used to clean-up when going from mmx to float use
986e461dc072 Initial revision glantau parents: diff changeset	517 of the registers that are shared by both; note that
986e461dc072 Initial revision glantau parents: diff changeset	518 there is no float-to-mmx operation needed, because
986e461dc072 Initial revision glantau parents: diff changeset	519 only the float tag word info is corruptible)
986e461dc072 Initial revision glantau parents: diff changeset	520 */
986e461dc072 Initial revision glantau parents: diff changeset	521 #ifdef MMX_TRACE
986e461dc072 Initial revision glantau parents: diff changeset	522
986e461dc072 Initial revision glantau parents: diff changeset	523 #define emms() \
986e461dc072 Initial revision glantau parents: diff changeset	524 { \
986e461dc072 Initial revision glantau parents: diff changeset	525 fprintf(stderr, "emms()\n"); \
986e461dc072 Initial revision glantau parents: diff changeset	526 __asm__ __volatile__ ("emms"); \
986e461dc072 Initial revision glantau parents: diff changeset	527 }
986e461dc072 Initial revision glantau parents: diff changeset	528
986e461dc072 Initial revision glantau parents: diff changeset	529 #else
986e461dc072 Initial revision glantau parents: diff changeset	530
986e461dc072 Initial revision glantau parents: diff changeset	531 #define emms() __asm__ __volatile__ ("emms")
986e461dc072 Initial revision glantau parents: diff changeset	532
986e461dc072 Initial revision glantau parents: diff changeset	533 #endif
986e461dc072 Initial revision glantau parents: diff changeset	534
986e461dc072 Initial revision glantau parents: diff changeset	535 #endif
986e461dc072 Initial revision glantau parents: diff changeset	536

Mercurial > libavcodec.hg

annotate i386/mmx.h @ 0:986e461dc072 libavcodec