mplayer.hg: libmpeg2/idct

annotate libmpeg2/idct_mmx.c @ 17648:5963b50c2178

dwStart support for mencoder.

author	corey
date	Sun, 19 Feb 2006 09:34:37 +0000
parents	1385ec491ffb
children	0783dd397f74

rev	line source
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	1 /*
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	2 * idct_mmx.c
10303 2c0b6ec77d39 sync with libmpeg2 cvs alex parents: 9852 diff changeset	3 * Copyright (C) 2000-2003 Michel Lespinasse <walken@zoy.org>
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	4 * Copyright (C) 1999-2000 Aaron Holtzman <aholtzma@ess.engr.uvic.ca>
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	5 *
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	6 * This file is part of mpeg2dec, a free MPEG-2 video stream decoder.
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	7 * See http://libmpeg2.sourceforge.net/ for updates.
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	8 *
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	9 * mpeg2dec is free software; you can redistribute it and/or modify
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	10 * it under the terms of the GNU General Public License as published by
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	11 * the Free Software Foundation; either version 2 of the License, or
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	12 * (at your option) any later version.
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	13 *
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	14 * mpeg2dec is distributed in the hope that it will be useful,
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	15 * but WITHOUT ANY WARRANTY; without even the implied warranty of
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	16 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	17 * GNU General Public License for more details.
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	18 *
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	19 * You should have received a copy of the GNU General Public License
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	20 * along with this program; if not, write to the Free Software
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	21 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
14732 1385ec491ffb Mark locally modified files as such to comply more closely with GPL 2a. diego parents: 13864 diff changeset	22 *
1385ec491ffb Mark locally modified files as such to comply more closely with GPL 2a. diego parents: 13864 diff changeset	23 * Modified for use with MPlayer, see libmpeg-0.4.0.diff for the exact changes.
1385ec491ffb Mark locally modified files as such to comply more closely with GPL 2a. diego parents: 13864 diff changeset	24 * detailed CVS changelog at http://www.mplayerhq.hu/cgi-bin/cvsweb.cgi/main/
1385ec491ffb Mark locally modified files as such to comply more closely with GPL 2a. diego parents: 13864 diff changeset	25 * $Id$
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	26 */
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	27
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	28 #include "config.h"
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	29
13864 96259a2f2142 enable mmx support on x86_64 in libmpeg2 aurel parents: 12932 diff changeset	30 #if defined(ARCH_X86) \|\| defined(ARCH_X86_64)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	31
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	32 #include <inttypes.h>
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	33
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	34 #include "mpeg2.h"
12932 d0a8810e155c Importing libmpeg2 from mpeg2dec-0.4.0b henry parents: 10303 diff changeset	35 #include "attributes.h"
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	36 #include "mpeg2_internal.h"
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	37 #include "mmx.h"
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	38
12932 d0a8810e155c Importing libmpeg2 from mpeg2dec-0.4.0b henry parents: 10303 diff changeset	39 #define ROW_SHIFT 15
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	40 #define COL_SHIFT 6
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	41
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	42 #define round(bias) ((int)(((bias)+0.5) * (1<<ROW_SHIFT)))
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	43 #define rounder(bias) {round (bias), round (bias)}
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	44
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	45
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	46 #if 0
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	47 /* C row IDCT - its just here to document the MMXEXT and MMX versions */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	48 static inline void idct_row (int16_t * row, int offset,
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	49 int16_t * table, int32_t * rounder)
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	50 {
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	51 int C1, C2, C3, C4, C5, C6, C7;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	52 int a0, a1, a2, a3, b0, b1, b2, b3;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	53
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	54 row += offset;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	55
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	56 C1 = table[1];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	57 C2 = table[2];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	58 C3 = table[3];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	59 C4 = table[4];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	60 C5 = table[5];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	61 C6 = table[6];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	62 C7 = table[7];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	63
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	64 a0 = C4row[0] + C2row[2] + C4row[4] + C6row[6] + *rounder;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	65 a1 = C4row[0] + C6row[2] - C4row[4] - C2row[6] + *rounder;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	66 a2 = C4row[0] - C6row[2] - C4row[4] + C2row[6] + *rounder;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	67 a3 = C4row[0] - C2row[2] + C4row[4] - C6row[6] + *rounder;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	68
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	69 b0 = C1row[1] + C3row[3] + C5row[5] + C7row[7];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	70 b1 = C3row[1] - C7row[3] - C1row[5] - C5row[7];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	71 b2 = C5row[1] - C1row[3] + C7row[5] + C3row[7];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	72 b3 = C7row[1] - C5row[3] + C3row[5] - C1row[7];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	73
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	74 row[0] = (a0 + b0) >> ROW_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	75 row[1] = (a1 + b1) >> ROW_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	76 row[2] = (a2 + b2) >> ROW_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	77 row[3] = (a3 + b3) >> ROW_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	78 row[4] = (a3 - b3) >> ROW_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	79 row[5] = (a2 - b2) >> ROW_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	80 row[6] = (a1 - b1) >> ROW_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	81 row[7] = (a0 - b0) >> ROW_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	82 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	83 #endif
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	84
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	85
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	86 /* MMXEXT row IDCT */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	87
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	88 #define mmxext_table(c1,c2,c3,c4,c5,c6,c7) { c4, c2, -c4, -c2, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	89 c4, c6, c4, c6, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	90 c1, c3, -c1, -c5, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	91 c5, c7, c3, -c7, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	92 c4, -c6, c4, -c6, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	93 -c4, c2, c4, -c2, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	94 c5, -c1, c3, -c1, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	95 c7, c3, c7, -c5 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	96
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	97 static inline void mmxext_row_head (int16_t * const row, const int offset,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	98 const int16_t * const table)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	99 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	100 movq_m2r ((row+offset), mm2); / mm2 = x6 x4 x2 x0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	101
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	102 movq_m2r ((row+offset+4), mm5); / mm5 = x7 x5 x3 x1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	103 movq_r2r (mm2, mm0); /* mm0 = x6 x4 x2 x0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	104
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	105 movq_m2r (table, mm3); / mm3 = -C2 -C4 C2 C4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	106 movq_r2r (mm5, mm6); /* mm6 = x7 x5 x3 x1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	107
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	108 movq_m2r ((table+4), mm4); / mm4 = C6 C4 C6 C4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	109 pmaddwd_r2r (mm0, mm3); /* mm3 = -C4x4-C2x6 C4x0+C2x2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	110
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	111 pshufw_r2r (mm2, mm2, 0x4e); /* mm2 = x2 x0 x6 x4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	112 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	113
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	114 static inline void mmxext_row (const int16_t * const table,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	115 const int32_t * const rounder)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	116 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	117 movq_m2r ((table+8), mm1); / mm1 = -C5 -C1 C3 C1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	118 pmaddwd_r2r (mm2, mm4); /* mm4 = C4x0+C6x2 C4x4+C6x6 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	119
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	120 pmaddwd_m2r ((table+16), mm0); / mm0 = C4x4-C6x6 C4x0-C6x2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	121 pshufw_r2r (mm6, mm6, 0x4e); /* mm6 = x3 x1 x7 x5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	122
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	123 movq_m2r ((table+12), mm7); / mm7 = -C7 C3 C7 C5 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	124 pmaddwd_r2r (mm5, mm1); /* mm1 = -C1x5-C5x7 C1x1+C3x3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	125
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	126 paddd_m2r (rounder, mm3); / mm3 += rounder */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	127 pmaddwd_r2r (mm6, mm7); /* mm7 = C3x1-C7x3 C5x5+C7x7 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	128
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	129 pmaddwd_m2r ((table+20), mm2); / mm2 = C4x0-C2x2 -C4x4+C2x6 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	130 paddd_r2r (mm4, mm3); /* mm3 = a1 a0 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	131
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	132 pmaddwd_m2r ((table+24), mm5); / mm5 = C3x5-C1x7 C5x1-C1x3 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	133 movq_r2r (mm3, mm4); /* mm4 = a1 a0 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	134
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	135 pmaddwd_m2r ((table+28), mm6); / mm6 = C7x1-C5x3 C7x5+C3x7 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	136 paddd_r2r (mm7, mm1); /* mm1 = b1 b0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	137
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	138 paddd_m2r (rounder, mm0); / mm0 += rounder */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	139 psubd_r2r (mm1, mm3); /* mm3 = a1-b1 a0-b0 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	140
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	141 psrad_i2r (ROW_SHIFT, mm3); /* mm3 = y6 y7 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	142 paddd_r2r (mm4, mm1); /* mm1 = a1+b1 a0+b0 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	143
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	144 paddd_r2r (mm2, mm0); /* mm0 = a3 a2 + rounder */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	145 psrad_i2r (ROW_SHIFT, mm1); /* mm1 = y1 y0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	146
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	147 paddd_r2r (mm6, mm5); /* mm5 = b3 b2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	148 movq_r2r (mm0, mm4); /* mm4 = a3 a2 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	149
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	150 paddd_r2r (mm5, mm0); /* mm0 = a3+b3 a2+b2 + rounder */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	151 psubd_r2r (mm5, mm4); /* mm4 = a3-b3 a2-b2 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	152 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	153
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	154 static inline void mmxext_row_tail (int16_t * const row, const int store)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	155 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	156 psrad_i2r (ROW_SHIFT, mm0); /* mm0 = y3 y2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	157
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	158 psrad_i2r (ROW_SHIFT, mm4); /* mm4 = y4 y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	159
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	160 packssdw_r2r (mm0, mm1); /* mm1 = y3 y2 y1 y0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	161
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	162 packssdw_r2r (mm3, mm4); /* mm4 = y6 y7 y4 y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	163
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	164 movq_r2m (mm1, (row+store)); / save y3 y2 y1 y0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	165 pshufw_r2r (mm4, mm4, 0xb1); /* mm4 = y7 y6 y5 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	166
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	167 /* slot */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	168
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	169 movq_r2m (mm4, (row+store+4)); / save y7 y6 y5 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	170 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	171
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	172 static inline void mmxext_row_mid (int16_t * const row, const int store,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	173 const int offset,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	174 const int16_t * const table)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	175 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	176 movq_m2r ((row+offset), mm2); / mm2 = x6 x4 x2 x0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	177 psrad_i2r (ROW_SHIFT, mm0); /* mm0 = y3 y2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	178
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	179 movq_m2r ((row+offset+4), mm5); / mm5 = x7 x5 x3 x1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	180 psrad_i2r (ROW_SHIFT, mm4); /* mm4 = y4 y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	181
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	182 packssdw_r2r (mm0, mm1); /* mm1 = y3 y2 y1 y0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	183 movq_r2r (mm5, mm6); /* mm6 = x7 x5 x3 x1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	184
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	185 packssdw_r2r (mm3, mm4); /* mm4 = y6 y7 y4 y5 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	186 movq_r2r (mm2, mm0); /* mm0 = x6 x4 x2 x0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	187
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	188 movq_r2m (mm1, (row+store)); / save y3 y2 y1 y0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	189 pshufw_r2r (mm4, mm4, 0xb1); /* mm4 = y7 y6 y5 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	190
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	191 movq_m2r (table, mm3); / mm3 = -C2 -C4 C2 C4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	192 movq_r2m (mm4, (row+store+4)); / save y7 y6 y5 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	193
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	194 pmaddwd_r2r (mm0, mm3); /* mm3 = -C4x4-C2x6 C4x0+C2x2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	195
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	196 movq_m2r ((table+4), mm4); / mm4 = C6 C4 C6 C4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	197 pshufw_r2r (mm2, mm2, 0x4e); /* mm2 = x2 x0 x6 x4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	198 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	199
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	200
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	201 /* MMX row IDCT */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	202
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	203 #define mmx_table(c1,c2,c3,c4,c5,c6,c7) { c4, c2, c4, c6, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	204 c4, c6, -c4, -c2, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	205 c1, c3, c3, -c7, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	206 c5, c7, -c1, -c5, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	207 c4, -c6, c4, -c2, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	208 -c4, c2, c4, -c6, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	209 c5, -c1, c7, -c5, \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	210 c7, c3, c3, -c1 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	211
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	212 static inline void mmx_row_head (int16_t * const row, const int offset,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	213 const int16_t * const table)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	214 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	215 movq_m2r ((row+offset), mm2); / mm2 = x6 x4 x2 x0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	216
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	217 movq_m2r ((row+offset+4), mm5); / mm5 = x7 x5 x3 x1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	218 movq_r2r (mm2, mm0); /* mm0 = x6 x4 x2 x0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	219
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	220 movq_m2r (table, mm3); / mm3 = C6 C4 C2 C4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	221 movq_r2r (mm5, mm6); /* mm6 = x7 x5 x3 x1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	222
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	223 punpckldq_r2r (mm0, mm0); /* mm0 = x2 x0 x2 x0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	224
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	225 movq_m2r ((table+4), mm4); / mm4 = -C2 -C4 C6 C4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	226 pmaddwd_r2r (mm0, mm3); /* mm3 = C4x0+C6x2 C4x0+C2x2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	227
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	228 movq_m2r ((table+8), mm1); / mm1 = -C7 C3 C3 C1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	229 punpckhdq_r2r (mm2, mm2); /* mm2 = x6 x4 x6 x4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	230 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	231
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	232 static inline void mmx_row (const int16_t * const table,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	233 const int32_t * const rounder)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	234 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	235 pmaddwd_r2r (mm2, mm4); /* mm4 = -C4x4-C2x6 C4x4+C6x6 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	236 punpckldq_r2r (mm5, mm5); /* mm5 = x3 x1 x3 x1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	237
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	238 pmaddwd_m2r ((table+16), mm0); / mm0 = C4x0-C2x2 C4x0-C6x2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	239 punpckhdq_r2r (mm6, mm6); /* mm6 = x7 x5 x7 x5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	240
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	241 movq_m2r ((table+12), mm7); / mm7 = -C5 -C1 C7 C5 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	242 pmaddwd_r2r (mm5, mm1); /* mm1 = C3x1-C7x3 C1x1+C3x3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	243
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	244 paddd_m2r (rounder, mm3); / mm3 += rounder */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	245 pmaddwd_r2r (mm6, mm7); /* mm7 = -C1x5-C5x7 C5x5+C7x7 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	246
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	247 pmaddwd_m2r ((table+20), mm2); / mm2 = C4x4-C6x6 -C4x4+C2x6 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	248 paddd_r2r (mm4, mm3); /* mm3 = a1 a0 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	249
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	250 pmaddwd_m2r ((table+24), mm5); / mm5 = C7x1-C5x3 C5x1-C1x3 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	251 movq_r2r (mm3, mm4); /* mm4 = a1 a0 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	252
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	253 pmaddwd_m2r ((table+28), mm6); / mm6 = C3x5-C1x7 C7x5+C3x7 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	254 paddd_r2r (mm7, mm1); /* mm1 = b1 b0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	255
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	256 paddd_m2r (rounder, mm0); / mm0 += rounder */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	257 psubd_r2r (mm1, mm3); /* mm3 = a1-b1 a0-b0 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	258
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	259 psrad_i2r (ROW_SHIFT, mm3); /* mm3 = y6 y7 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	260 paddd_r2r (mm4, mm1); /* mm1 = a1+b1 a0+b0 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	261
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	262 paddd_r2r (mm2, mm0); /* mm0 = a3 a2 + rounder */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	263 psrad_i2r (ROW_SHIFT, mm1); /* mm1 = y1 y0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	264
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	265 paddd_r2r (mm6, mm5); /* mm5 = b3 b2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	266 movq_r2r (mm0, mm7); /* mm7 = a3 a2 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	267
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	268 paddd_r2r (mm5, mm0); /* mm0 = a3+b3 a2+b2 + rounder */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	269 psubd_r2r (mm5, mm7); /* mm7 = a3-b3 a2-b2 + rounder */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	270 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	271
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	272 static inline void mmx_row_tail (int16_t * const row, const int store)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	273 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	274 psrad_i2r (ROW_SHIFT, mm0); /* mm0 = y3 y2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	275
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	276 psrad_i2r (ROW_SHIFT, mm7); /* mm7 = y4 y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	277
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	278 packssdw_r2r (mm0, mm1); /* mm1 = y3 y2 y1 y0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	279
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	280 packssdw_r2r (mm3, mm7); /* mm7 = y6 y7 y4 y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	281
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	282 movq_r2m (mm1, (row+store)); / save y3 y2 y1 y0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	283 movq_r2r (mm7, mm4); /* mm4 = y6 y7 y4 y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	284
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	285 pslld_i2r (16, mm7); /* mm7 = y7 0 y5 0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	286
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	287 psrld_i2r (16, mm4); /* mm4 = 0 y6 0 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	288
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	289 por_r2r (mm4, mm7); /* mm7 = y7 y6 y5 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	290
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	291 /* slot */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	292
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	293 movq_r2m (mm7, (row+store+4)); / save y7 y6 y5 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	294 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	295
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	296 static inline void mmx_row_mid (int16_t * const row, const int store,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	297 const int offset, const int16_t * const table)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	298 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	299 movq_m2r ((row+offset), mm2); / mm2 = x6 x4 x2 x0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	300 psrad_i2r (ROW_SHIFT, mm0); /* mm0 = y3 y2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	301
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	302 movq_m2r ((row+offset+4), mm5); / mm5 = x7 x5 x3 x1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	303 psrad_i2r (ROW_SHIFT, mm7); /* mm7 = y4 y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	304
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	305 packssdw_r2r (mm0, mm1); /* mm1 = y3 y2 y1 y0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	306 movq_r2r (mm5, mm6); /* mm6 = x7 x5 x3 x1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	307
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	308 packssdw_r2r (mm3, mm7); /* mm7 = y6 y7 y4 y5 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	309 movq_r2r (mm2, mm0); /* mm0 = x6 x4 x2 x0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	310
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	311 movq_r2m (mm1, (row+store)); / save y3 y2 y1 y0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	312 movq_r2r (mm7, mm1); /* mm1 = y6 y7 y4 y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	313
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	314 punpckldq_r2r (mm0, mm0); /* mm0 = x2 x0 x2 x0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	315 psrld_i2r (16, mm7); /* mm7 = 0 y6 0 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	316
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	317 movq_m2r (table, mm3); / mm3 = C6 C4 C2 C4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	318 pslld_i2r (16, mm1); /* mm1 = y7 0 y5 0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	319
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	320 movq_m2r ((table+4), mm4); / mm4 = -C2 -C4 C6 C4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	321 por_r2r (mm1, mm7); /* mm7 = y7 y6 y5 y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	322
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	323 movq_m2r ((table+8), mm1); / mm1 = -C7 C3 C3 C1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	324 punpckhdq_r2r (mm2, mm2); /* mm2 = x6 x4 x6 x4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	325
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	326 movq_r2m (mm7, (row+store+4)); / save y7 y6 y5 y4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	327 pmaddwd_r2r (mm0, mm3); /* mm3 = C4x0+C6x2 C4x0+C2x2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	328 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	329
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	330
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	331 #if 0
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	332 /* C column IDCT - its just here to document the MMXEXT and MMX versions */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	333 static inline void idct_col (int16_t * col, int offset)
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	334 {
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	335 /* multiplication - as implemented on mmx */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	336 #define F(c,x) (((c) * (x)) >> 16)
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	337
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	338 /* saturation - it helps us handle torture test cases */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	339 #define S(x) (((x)>32767) ? 32767 : ((x)<-32768) ? -32768 : (x))
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	340
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	341 int16_t x0, x1, x2, x3, x4, x5, x6, x7;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	342 int16_t y0, y1, y2, y3, y4, y5, y6, y7;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	343 int16_t a0, a1, a2, a3, b0, b1, b2, b3;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	344 int16_t u04, v04, u26, v26, u17, v17, u35, v35, u12, v12;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	345
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	346 col += offset;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	347
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	348 x0 = col[0*8];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	349 x1 = col[1*8];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	350 x2 = col[2*8];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	351 x3 = col[3*8];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	352 x4 = col[4*8];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	353 x5 = col[5*8];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	354 x6 = col[6*8];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	355 x7 = col[7*8];
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	356
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	357 u04 = S (x0 + x4);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	358 v04 = S (x0 - x4);
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	359 u26 = S (F (T2, x6) + x2);
846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	360 v26 = S (F (T2, x2) - x6);
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	361
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	362 a0 = S (u04 + u26);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	363 a1 = S (v04 + v26);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	364 a2 = S (v04 - v26);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	365 a3 = S (u04 - u26);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	366
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	367 u17 = S (F (T1, x7) + x1);
846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	368 v17 = S (F (T1, x1) - x7);
846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	369 u35 = S (F (T3, x5) + x3);
846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	370 v35 = S (F (T3, x3) - x5);
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	371
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	372 b0 = S (u17 + u35);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	373 b3 = S (v17 - v35);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	374 u12 = S (u17 - u35);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	375 v12 = S (v17 + v35);
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	376 u12 = S (2 * F (C4, u12));
846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	377 v12 = S (2 * F (C4, v12));
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	378 b1 = S (u12 + v12);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	379 b2 = S (u12 - v12);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	380
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	381 y0 = S (a0 + b0) >> COL_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	382 y1 = S (a1 + b1) >> COL_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	383 y2 = S (a2 + b2) >> COL_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	384 y3 = S (a3 + b3) >> COL_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	385
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	386 y4 = S (a3 - b3) >> COL_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	387 y5 = S (a2 - b2) >> COL_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	388 y6 = S (a1 - b1) >> COL_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	389 y7 = S (a0 - b0) >> COL_SHIFT;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	390
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	391 col[0*8] = y0;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	392 col[1*8] = y1;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	393 col[2*8] = y2;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	394 col[3*8] = y3;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	395 col[4*8] = y4;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	396 col[5*8] = y5;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	397 col[6*8] = y6;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	398 col[7*8] = y7;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	399 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	400 #endif
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	401
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	402
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	403 /* MMX column IDCT */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	404 static inline void idct_col (int16_t * const col, const int offset)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	405 {
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	406 #define T1 13036
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	407 #define T2 27146
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	408 #define T3 43790
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	409 #define C4 23170
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	410
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	411 static const short _T1[] ATTR_ALIGN(8) = {T1,T1,T1,T1};
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	412 static const short _T2[] ATTR_ALIGN(8) = {T2,T2,T2,T2};
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	413 static const short _T3[] ATTR_ALIGN(8) = {T3,T3,T3,T3};
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	414 static const short _C4[] ATTR_ALIGN(8) = {C4,C4,C4,C4};
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	415
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	416 /* column code adapted from peter gubanov */
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	417 /* http://www.elecard.com/peter/idct.shtml */
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	418
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	419 movq_m2r (_T1, mm0); / mm0 = T1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	420
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	421 movq_m2r ((col+offset+18), mm1); /* mm1 = x1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	422 movq_r2r (mm0, mm2); /* mm2 = T1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	423
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	424 movq_m2r ((col+offset+78), mm4); /* mm4 = x7 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	425 pmulhw_r2r (mm1, mm0); /* mm0 = T1x1 /
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	426
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	427 movq_m2r (_T3, mm5); / mm5 = T3 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	428 pmulhw_r2r (mm4, mm2); /* mm2 = T1x7 /
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	429
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	430 movq_m2r ((col+offset+58), mm6); /* mm6 = x5 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	431 movq_r2r (mm5, mm7); /* mm7 = T3-1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	432
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	433 movq_m2r ((col+offset+38), mm3); /* mm3 = x3 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	434 psubsw_r2r (mm4, mm0); /* mm0 = v17 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	435
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	436 movq_m2r (_T2, mm4); / mm4 = T2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	437 pmulhw_r2r (mm3, mm5); /* mm5 = (T3-1)x3 /
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	438
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	439 paddsw_r2r (mm2, mm1); /* mm1 = u17 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	440 pmulhw_r2r (mm6, mm7); /* mm7 = (T3-1)x5 /
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	441
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	442 /* slot */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	443
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	444 movq_r2r (mm4, mm2); /* mm2 = T2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	445 paddsw_r2r (mm3, mm5); /* mm5 = T3x3 /
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	446
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	447 pmulhw_m2r ((col+offset+28), mm4);/* mm4 = T2x2 /
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	448 paddsw_r2r (mm6, mm7); /* mm7 = T3x5 /
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	449
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	450 psubsw_r2r (mm6, mm5); /* mm5 = v35 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	451 paddsw_r2r (mm3, mm7); /* mm7 = u35 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	452
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	453 movq_m2r ((col+offset+68), mm3); /* mm3 = x6 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	454 movq_r2r (mm0, mm6); /* mm6 = v17 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	455
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	456 pmulhw_r2r (mm3, mm2); /* mm2 = T2x6 /
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	457 psubsw_r2r (mm5, mm0); /* mm0 = b3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	458
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	459 psubsw_r2r (mm3, mm4); /* mm4 = v26 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	460 paddsw_r2r (mm6, mm5); /* mm5 = v12 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	461
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	462 movq_r2m (mm0, (col+offset+38)); /* save b3 in scratch0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	463 movq_r2r (mm1, mm6); /* mm6 = u17 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	464
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	465 paddsw_m2r ((col+offset+28), mm2);/* mm2 = u26 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	466 paddsw_r2r (mm7, mm6); /* mm6 = b0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	467
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	468 psubsw_r2r (mm7, mm1); /* mm1 = u12 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	469 movq_r2r (mm1, mm7); /* mm7 = u12 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	470
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	471 movq_m2r ((col+offset+08), mm3); /* mm3 = x0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	472 paddsw_r2r (mm5, mm1); /* mm1 = u12+v12 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	473
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	474 movq_m2r (_C4, mm0); / mm0 = C4/2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	475 psubsw_r2r (mm5, mm7); /* mm7 = u12-v12 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	476
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	477 movq_r2m (mm6, (col+offset+58)); /* save b0 in scratch1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	478 pmulhw_r2r (mm0, mm1); /* mm1 = b1/2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	479
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	480 movq_r2r (mm4, mm6); /* mm6 = v26 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	481 pmulhw_r2r (mm0, mm7); /* mm7 = b2/2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	482
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	483 movq_m2r ((col+offset+48), mm5); /* mm5 = x4 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	484 movq_r2r (mm3, mm0); /* mm0 = x0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	485
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	486 psubsw_r2r (mm5, mm3); /* mm3 = v04 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	487 paddsw_r2r (mm5, mm0); /* mm0 = u04 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	488
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	489 paddsw_r2r (mm3, mm4); /* mm4 = a1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	490 movq_r2r (mm0, mm5); /* mm5 = u04 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	491
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	492 psubsw_r2r (mm6, mm3); /* mm3 = a2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	493 paddsw_r2r (mm2, mm5); /* mm5 = a0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	494
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	495 paddsw_r2r (mm1, mm1); /* mm1 = b1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	496 psubsw_r2r (mm2, mm0); /* mm0 = a3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	497
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	498 paddsw_r2r (mm7, mm7); /* mm7 = b2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	499 movq_r2r (mm3, mm2); /* mm2 = a2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	500
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	501 movq_r2r (mm4, mm6); /* mm6 = a1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	502 paddsw_r2r (mm7, mm3); /* mm3 = a2+b2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	503
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	504 psraw_i2r (COL_SHIFT, mm3); /* mm3 = y2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	505 paddsw_r2r (mm1, mm4); /* mm4 = a1+b1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	506
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	507 psraw_i2r (COL_SHIFT, mm4); /* mm4 = y1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	508 psubsw_r2r (mm1, mm6); /* mm6 = a1-b1 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	509
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	510 movq_m2r ((col+offset+58), mm1); /* mm1 = b0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	511 psubsw_r2r (mm7, mm2); /* mm2 = a2-b2 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	512
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	513 psraw_i2r (COL_SHIFT, mm6); /* mm6 = y6 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	514 movq_r2r (mm5, mm7); /* mm7 = a0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	515
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	516 movq_r2m (mm4, (col+offset+18)); /* save y1 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	517 psraw_i2r (COL_SHIFT, mm2); /* mm2 = y5 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	518
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	519 movq_r2m (mm3, (col+offset+28)); /* save y2 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	520 paddsw_r2r (mm1, mm5); /* mm5 = a0+b0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	521
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	522 movq_m2r ((col+offset+38), mm4); /* mm4 = b3 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	523 psubsw_r2r (mm1, mm7); /* mm7 = a0-b0 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	524
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	525 psraw_i2r (COL_SHIFT, mm5); /* mm5 = y0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	526 movq_r2r (mm0, mm3); /* mm3 = a3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	527
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	528 movq_r2m (mm2, (col+offset+58)); /* save y5 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	529 psubsw_r2r (mm4, mm3); /* mm3 = a3-b3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	530
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	531 psraw_i2r (COL_SHIFT, mm7); /* mm7 = y7 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	532 paddsw_r2r (mm0, mm4); /* mm4 = a3+b3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	533
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	534 movq_r2m (mm5, (col+offset+08)); /* save y0 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	535 psraw_i2r (COL_SHIFT, mm3); /* mm3 = y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	536
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	537 movq_r2m (mm6, (col+offset+68)); /* save y6 */
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	538 psraw_i2r (COL_SHIFT, mm4); /* mm4 = y3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	539
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	540 movq_r2m (mm7, (col+offset+78)); /* save y7 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	541
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	542 movq_r2m (mm3, (col+offset+48)); /* save y4 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	543
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	544 movq_r2m (mm4, (col+offset+38)); /* save y3 */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	545 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	546
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	547
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	548 static const int32_t rounder0[] ATTR_ALIGN(8) =
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	549 rounder ((1 << (COL_SHIFT - 1)) - 0.5);
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	550 static const int32_t rounder4[] ATTR_ALIGN(8) = rounder (0);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	551 static const int32_t rounder1[] ATTR_ALIGN(8) =
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	552 rounder (1.25683487303); /* C1(C1/C4+C1+C7)/2 /
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	553 static const int32_t rounder7[] ATTR_ALIGN(8) =
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	554 rounder (-0.25); /* C1(C7/C4+C7-C1)/2 /
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	555 static const int32_t rounder2[] ATTR_ALIGN(8) =
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	556 rounder (0.60355339059); /* C2 * (C6+C2)/2 */
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	557 static const int32_t rounder6[] ATTR_ALIGN(8) =
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	558 rounder (-0.25); /* C2 * (C6-C2)/2 */
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	559 static const int32_t rounder3[] ATTR_ALIGN(8) =
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	560 rounder (0.087788325588); /* C3(-C3/C4+C3+C5)/2 /
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	561 static const int32_t rounder5[] ATTR_ALIGN(8) =
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	562 rounder (-0.441341716183); /* C3(-C5/C4+C5-C3)/2 /
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	563
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	564
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	565 #define declare_idct(idct,table,idct_row_head,idct_row,idct_row_tail,idct_row_mid) \
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	566 static inline void idct (int16_t * const block) \
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	567 { \
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	568 static const int16_t table04[] ATTR_ALIGN(16) = \
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	569 table (22725, 21407, 19266, 16384, 12873, 8867, 4520); \
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	570 static const int16_t table17[] ATTR_ALIGN(16) = \
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	571 table (31521, 29692, 26722, 22725, 17855, 12299, 6270); \
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	572 static const int16_t table26[] ATTR_ALIGN(16) = \
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	573 table (29692, 27969, 25172, 21407, 16819, 11585, 5906); \
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	574 static const int16_t table35[] ATTR_ALIGN(16) = \
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	575 table (26722, 25172, 22654, 19266, 15137, 10426, 5315); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	576 \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	577 idct_row_head (block, 0*8, table04); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	578 idct_row (table04, rounder0); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	579 idct_row_mid (block, 08, 48, table04); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	580 idct_row (table04, rounder4); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	581 idct_row_mid (block, 48, 18, table17); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	582 idct_row (table17, rounder1); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	583 idct_row_mid (block, 18, 78, table17); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	584 idct_row (table17, rounder7); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	585 idct_row_mid (block, 78, 28, table26); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	586 idct_row (table26, rounder2); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	587 idct_row_mid (block, 28, 68, table26); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	588 idct_row (table26, rounder6); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	589 idct_row_mid (block, 68, 38, table35); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	590 idct_row (table35, rounder3); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	591 idct_row_mid (block, 38, 58, table35); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	592 idct_row (table35, rounder5); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	593 idct_row_tail (block, 5*8); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	594 \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	595 idct_col (block, 0); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	596 idct_col (block, 4); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	597 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	598
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	599
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	600 #define COPY_MMX(offset,r0,r1,r2) \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	601 do { \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	602 movq_m2r (*(block+offset), r0); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	603 dest += stride; \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	604 movq_m2r (*(block+offset+4), r1); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	605 movq_r2m (r2, *dest); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	606 packuswb_r2r (r1, r0); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	607 } while (0)
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	608
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	609 static inline void block_copy (int16_t * const block, uint8_t * dest,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	610 const int stride)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	611 {
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	612 movq_m2r ((block+08), mm0);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	613 movq_m2r ((block+08+4), mm1);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	614 movq_m2r ((block+18), mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	615 packuswb_r2r (mm1, mm0);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	616 movq_m2r ((block+18+4), mm3);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	617 movq_r2m (mm0, *dest);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	618 packuswb_r2r (mm3, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	619 COPY_MMX (2*8, mm0, mm1, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	620 COPY_MMX (3*8, mm2, mm3, mm0);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	621 COPY_MMX (4*8, mm0, mm1, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	622 COPY_MMX (5*8, mm2, mm3, mm0);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	623 COPY_MMX (6*8, mm0, mm1, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	624 COPY_MMX (7*8, mm2, mm3, mm0);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	625 movq_r2m (mm2, *(dest+stride));
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	626 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	627
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	628
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	629 #define ADD_MMX(offset,r1,r2,r3,r4) \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	630 do { \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	631 movq_m2r ((dest+2stride), r1); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	632 packuswb_r2r (r4, r3); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	633 movq_r2r (r1, r2); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	634 dest += stride; \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	635 movq_r2m (r3, *dest); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	636 punpcklbw_r2r (mm0, r1); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	637 paddsw_m2r (*(block+offset), r1); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	638 punpckhbw_r2r (mm0, r2); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	639 paddsw_m2r (*(block+offset+4), r2); \
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	640 } while (0)
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	641
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	642 static inline void block_add (int16_t * const block, uint8_t * dest,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	643 const int stride)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	644 {
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	645 movq_m2r (*dest, mm1);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	646 pxor_r2r (mm0, mm0);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	647 movq_m2r (*(dest+stride), mm3);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	648 movq_r2r (mm1, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	649 punpcklbw_r2r (mm0, mm1);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	650 movq_r2r (mm3, mm4);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	651 paddsw_m2r ((block+08), mm1);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	652 punpckhbw_r2r (mm0, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	653 paddsw_m2r ((block+08+4), mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	654 punpcklbw_r2r (mm0, mm3);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	655 paddsw_m2r ((block+18), mm3);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	656 packuswb_r2r (mm2, mm1);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	657 punpckhbw_r2r (mm0, mm4);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	658 movq_r2m (mm1, *dest);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	659 paddsw_m2r ((block+18+4), mm4);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	660 ADD_MMX (2*8, mm1, mm2, mm3, mm4);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	661 ADD_MMX (3*8, mm3, mm4, mm1, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	662 ADD_MMX (4*8, mm1, mm2, mm3, mm4);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	663 ADD_MMX (5*8, mm3, mm4, mm1, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	664 ADD_MMX (6*8, mm1, mm2, mm3, mm4);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	665 ADD_MMX (7*8, mm3, mm4, mm1, mm2);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	666 packuswb_r2r (mm4, mm3);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	667 movq_r2m (mm3, *(dest+stride));
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	668 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	669
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	670
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	671 static inline void block_zero (int16_t * const block)
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	672 {
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	673 pxor_r2r (mm0, mm0);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	674 movq_r2m (mm0, (block+04));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	675 movq_r2m (mm0, (block+14));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	676 movq_r2m (mm0, (block+24));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	677 movq_r2m (mm0, (block+34));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	678 movq_r2m (mm0, (block+44));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	679 movq_r2m (mm0, (block+54));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	680 movq_r2m (mm0, (block+64));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	681 movq_r2m (mm0, (block+74));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	682 movq_r2m (mm0, (block+84));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	683 movq_r2m (mm0, (block+94));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	684 movq_r2m (mm0, (block+104));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	685 movq_r2m (mm0, (block+114));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	686 movq_r2m (mm0, (block+124));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	687 movq_r2m (mm0, (block+134));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	688 movq_r2m (mm0, (block+144));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	689 movq_r2m (mm0, (block+154));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	690 }
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	691
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	692
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	693 #define CPU_MMXEXT 0
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	694 #define CPU_MMX 1
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	695
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	696 #define dup4(reg) \
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	697 do { \
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	698 if (cpu != CPU_MMXEXT) { \
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	699 punpcklwd_r2r (reg, reg); \
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	700 punpckldq_r2r (reg, reg); \
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	701 } else \
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	702 pshufw_r2r (reg, reg, 0x00); \
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	703 } while (0)
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	704
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	705 static inline void block_add_DC (int16_t * const block, uint8_t * dest,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	706 const int stride, const int cpu)
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	707 {
12932 d0a8810e155c Importing libmpeg2 from mpeg2dec-0.4.0b henry parents: 10303 diff changeset	708 movd_v2r ((block[0] + 64) >> 7, mm0);
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	709 pxor_r2r (mm1, mm1);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	710 movq_m2r (*dest, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	711 dup4 (mm0);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	712 psubsw_r2r (mm0, mm1);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	713 packuswb_r2r (mm0, mm0);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	714 paddusb_r2r (mm0, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	715 packuswb_r2r (mm1, mm1);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	716 movq_m2r (*(dest + stride), mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	717 psubusb_r2r (mm1, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	718 block[0] = 0;
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	719 paddusb_r2r (mm0, mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	720 movq_r2m (mm2, *dest);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	721 psubusb_r2r (mm1, mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	722 movq_m2r ((dest + 2stride), mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	723 dest += stride;
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	724 movq_r2m (mm3, *dest);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	725 paddusb_r2r (mm0, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	726 movq_m2r ((dest + 2stride), mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	727 psubusb_r2r (mm1, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	728 dest += stride;
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	729 paddusb_r2r (mm0, mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	730 movq_r2m (mm2, *dest);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	731 psubusb_r2r (mm1, mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	732 movq_m2r ((dest + 2stride), mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	733 dest += stride;
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	734 movq_r2m (mm3, *dest);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	735 paddusb_r2r (mm0, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	736 movq_m2r ((dest + 2stride), mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	737 psubusb_r2r (mm1, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	738 dest += stride;
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	739 paddusb_r2r (mm0, mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	740 movq_r2m (mm2, *dest);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	741 psubusb_r2r (mm1, mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	742 movq_m2r ((dest + 2stride), mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	743 dest += stride;
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	744 movq_r2m (mm3, *dest);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	745 paddusb_r2r (mm0, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	746 movq_m2r ((dest + 2stride), mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	747 psubusb_r2r (mm1, mm2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	748 block[63] = 0;
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	749 paddusb_r2r (mm0, mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	750 movq_r2m (mm2, *(dest + stride));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	751 psubusb_r2r (mm1, mm3);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	752 movq_r2m (mm3, (dest + 2stride));
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	753 }
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	754
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	755
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	756 declare_idct (mmxext_idct, mmxext_table,
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	757 mmxext_row_head, mmxext_row, mmxext_row_tail, mmxext_row_mid)
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	758
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	759 void mpeg2_idct_copy_mmxext (int16_t * const block, uint8_t * const dest,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	760 const int stride)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	761 {
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	762 mmxext_idct (block);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	763 block_copy (block, dest, stride);
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	764 block_zero (block);
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	765 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	766
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	767 void mpeg2_idct_add_mmxext (const int last, int16_t * const block,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	768 uint8_t * const dest, const int stride)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	769 {
12932 d0a8810e155c Importing libmpeg2 from mpeg2dec-0.4.0b henry parents: 10303 diff changeset	770 if (last != 129 \|\| (block[0] & (7 << 4)) == (4 << 4)) {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	771 mmxext_idct (block);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	772 block_add (block, dest, stride);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	773 block_zero (block);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	774 } else
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	775 block_add_DC (block, dest, stride, CPU_MMXEXT);
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	776 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	777
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	778
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	779 declare_idct (mmx_idct, mmx_table,
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	780 mmx_row_head, mmx_row, mmx_row_tail, mmx_row_mid)
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	781
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	782 void mpeg2_idct_copy_mmx (int16_t * const block, uint8_t * const dest,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	783 const int stride)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	784 {
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	785 mmx_idct (block);
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	786 block_copy (block, dest, stride);
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	787 block_zero (block);
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	788 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	789
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	790 void mpeg2_idct_add_mmx (const int last, int16_t * const block,
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	791 uint8_t * const dest, const int stride)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	792 {
12932 d0a8810e155c Importing libmpeg2 from mpeg2dec-0.4.0b henry parents: 10303 diff changeset	793 if (last != 129 \|\| (block[0] & (7 << 4)) == (4 << 4)) {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	794 mmx_idct (block);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	795 block_add (block, dest, stride);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	796 block_zero (block);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	797 } else
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	798 block_add_DC (block, dest, stride, CPU_MMX);
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	799 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	800
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	801
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	802 void mpeg2_idct_mmx_init (void)
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	803 {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	804 extern uint8_t mpeg2_scan_norm[64];
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	805 extern uint8_t mpeg2_scan_alt[64];
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	806 int i, j;
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	807
36 846535ace7a2 libmpeg2-0.2.0 merge arpi_esp parents: 1 diff changeset	808 /* the mmx/mmxext idct uses a reordered input, so we patch scan tables */
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	809
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	810 for (i = 0; i < 64; i++) {
9852 47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	811 j = mpeg2_scan_norm[i];
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	812 mpeg2_scan_norm[i] = (j & 0x38) \| ((j & 6) >> 1) \| ((j & 1) << 2);
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	813 j = mpeg2_scan_alt[i];
47984e3f54ce Importing libmpeg2 from mpeg2dec-0.3.1 arpi parents: 1437 diff changeset	814 mpeg2_scan_alt[i] = (j & 0x38) \| ((j & 6) >> 1) \| ((j & 1) << 2);
1 3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	815 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	816 }
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	817
3b5f5d1c5041 Initial revision arpi_esp parents: diff changeset	818 #endif

Mercurial > mplayer.hg

annotate libmpeg2/idct_mmx.c @ 17648:5963b50c2178