libavcodec.hg: i386/dsputil_h264_template

annotate i386/dsputil_h264_template_mmx.c @ 2887:28084132c417 libavcodec

Move lrintf implementation from libavcodec/dsputil.h to libavutil/common.h where it makes more sense.

author	diego
date	Mon, 19 Sep 2005 23:26:47 +0000
parents	a49f140179e9
children	d772011258ec

rev	line source
2732 473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	1 /*
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	2 * Copyright (c) 2005 Zoltan Hidvegi <hzoli -a- hzoli -d- com>
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	3 *
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	4 * This library is free software; you can redistribute it and/or
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	5 * modify it under the terms of the GNU Lesser General Public
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	6 * License as published by the Free Software Foundation; either
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	7 * version 2 of the License, or (at your option) any later version.
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	8 *
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	9 * This library is distributed in the hope that it will be useful,
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	10 * but WITHOUT ANY WARRANTY; without even the implied warranty of
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	11 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	12 * Lesser General Public License for more details.
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	13 *
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	14 * You should have received a copy of the GNU Lesser General Public
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	15 * License along with this library; if not, write to the Free Software
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	16 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	17 */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	18
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	19 /**
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	20 * MMX optimized version of (put\|avg)_h264_chroma_mc8.
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	21 * H264_CHROMA_MC8_TMPL must be defined to the desired function name and
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	22 * H264_CHROMA_OP must be defined to empty for put and pavgb/pavgusb for avg.
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	23 */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	24 static void H264_CHROMA_MC8_TMPL(uint8_t dst/align 8/, uint8_t src/align 1/, int stride, int h, int x, int y)
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	25 {
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	26 uint64_t AA __align8;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	27 uint64_t DD __align8;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	28 unsigned long srcos = (long)src & 7;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	29 uint64_t sh1 __align8 = srcos * 8;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	30 uint64_t sh2 __align8 = 56 - sh1;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	31 int i;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	32
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	33 assert(x<8 && y<8 && x>=0 && y>=0);
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	34
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	35 asm volatile("movd %1, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	36 "movd %2, %%mm6\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	37 "punpcklwd %%mm4, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	38 "punpcklwd %%mm6, %%mm6\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	39 "punpckldq %%mm4, %%mm4\n\t" /* mm4 = x words */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	40 "punpckldq %%mm6, %%mm6\n\t" /* mm6 = y words */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	41 "movq %%mm4, %%mm5\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	42 "pmullw %%mm6, %%mm4\n\t" /* mm4 = x * y */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	43 "psllw $3, %%mm5\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	44 "psllw $3, %%mm6\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	45 "movq %%mm5, %%mm7\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	46 "paddw %%mm6, %%mm7\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	47 "movq %%mm4, %0\n\t" /* DD = x * y */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	48 "psubw %%mm4, %%mm5\n\t" /* mm5 = B = 8x - xy */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	49 "psubw %%mm4, %%mm6\n\t" /* mm6 = C = 8y - xy */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	50 "paddw %3, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	51 "psubw %%mm7, %%mm4\n\t" /* mm4 = A = xy - (8x+8y) + 64 */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	52 "pxor %%mm7, %%mm7\n\t"
2754 a49f140179e9 sort H.264 mmx dsp functions into their own file lorenm parents: 2732 diff changeset	53 : "=m" (DD) : "rm" (x), "rm" (y), "m" (ff_pw_64));
2732 473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	54
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	55 asm volatile("movq %%mm4, %0" : "=m" (AA));
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	56
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	57 src -= srcos;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	58 asm volatile(
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	59 /* mm0 = src[0..7], mm1 = src[1..8] */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	60 "movq %0, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	61 "movq %1, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	62 "psrlq %2, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	63 "psllq %3, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	64 "movq %%mm0, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	65 "psllq $8, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	66 "por %%mm1, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	67 "psrlq $8, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	68 "por %%mm4, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	69 : : "m" (src[0]), "m" (src[8]), "m" (sh1), "m" (sh2));
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	70
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	71 for(i=0; i<h; i++) {
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	72 asm volatile(
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	73 /* [mm2,mm3] = A * src[0..7] */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	74 "movq %%mm0, %%mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	75 "punpcklbw %%mm7, %%mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	76 "pmullw %0, %%mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	77 "movq %%mm0, %%mm3\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	78 "punpckhbw %%mm7, %%mm3\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	79 "pmullw %0, %%mm3\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	80
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	81 /* [mm2,mm3] += B * src[1..8] */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	82 "movq %%mm1, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	83 "punpcklbw %%mm7, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	84 "pmullw %%mm5, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	85 "punpckhbw %%mm7, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	86 "pmullw %%mm5, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	87 "paddw %%mm0, %%mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	88 "paddw %%mm1, %%mm3\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	89 : : "m" (AA));
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	90
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	91 src += stride;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	92 asm volatile(
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	93 /* mm0 = src[0..7], mm1 = src[1..8] */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	94 "movq %0, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	95 "movq %1, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	96 "psrlq %2, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	97 "psllq %3, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	98 "movq %%mm0, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	99 "psllq $8, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	100 "por %%mm1, %%mm0\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	101 "psrlq $8, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	102 "por %%mm4, %%mm1\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	103 : : "m" (src[0]), "m" (src[8]), "m" (sh1), "m" (sh2));
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	104
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	105 asm volatile(
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	106 /* [mm2,mm3] += C * src[0..7] */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	107 "movq %mm0, %mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	108 "punpcklbw %mm7, %mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	109 "pmullw %mm6, %mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	110 "paddw %mm4, %mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	111 "movq %mm0, %mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	112 "punpckhbw %mm7, %mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	113 "pmullw %mm6, %mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	114 "paddw %mm4, %mm3\n\t");
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	115
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	116 asm volatile(
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	117 /* [mm2,mm3] += D * src[1..8] */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	118 "movq %%mm1, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	119 "punpcklbw %%mm7, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	120 "pmullw %0, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	121 "paddw %%mm4, %%mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	122 "movq %%mm1, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	123 "punpckhbw %%mm7, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	124 "pmullw %0, %%mm4\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	125 "paddw %%mm4, %%mm3\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	126 : : "m" (DD));
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	127
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	128 asm volatile(
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	129 /* dst[0..7] = pack(([mm2,mm3] + 32) >> 6) */
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	130 "paddw %1, %%mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	131 "paddw %1, %%mm3\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	132 "psrlw $6, %%mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	133 "psrlw $6, %%mm3\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	134 "packuswb %%mm3, %%mm2\n\t"
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	135 H264_CHROMA_OP(%0, %%mm2)
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	136 "movq %%mm2, %0\n\t"
2754 a49f140179e9 sort H.264 mmx dsp functions into their own file lorenm parents: 2732 diff changeset	137 : "=m" (dst[0]) : "m" (ff_pw_32));
2732 473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	138 dst+= stride;
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	139 }
473ee06ec3a1 MMX code for (put\|avg)_h264_chroma_mc8 hzoli parents: diff changeset	140 }

Mercurial > libavcodec.hg

annotate i386/dsputil_h264_template_mmx.c @ 2887:28084132c417 libavcodec