libavcodec.hg: i386/fft

annotate i386/fft_sse.c @ 781:6f5e87957bcb libavcodec

new generic FFT/MDCT code for audio codecs

author	bellard
date	Mon, 28 Oct 2002 00:34:08 +0000
parents
children	64f1a11b5f86

rev	line source
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	1 /*
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	2 * FFT/MDCT transform with SSE optimizations
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	3 * Copyright (c) 2002 Fabrice Bellard.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	4 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	5 * This library is free software; you can redistribute it and/or
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	6 * modify it under the terms of the GNU Lesser General Public
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	7 * License as published by the Free Software Foundation; either
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	8 * version 2 of the License, or (at your option) any later version.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	9 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	10 * This library is distributed in the hope that it will be useful,
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	11 * but WITHOUT ANY WARRANTY; without even the implied warranty of
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	12 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	13 * Lesser General Public License for more details.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	14 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	15 * You should have received a copy of the GNU Lesser General Public
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	16 * License along with this library; if not, write to the Free Software
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	17 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	18 */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	19 #include "../dsputil.h"
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	20 #include <math.h>
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	21
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	22 #include <xmmintrin.h>
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	23
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	24 static const float p1p1p1m1[4] __attribute__((aligned(16))) =
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	25 { 1.0, 1.0, 1.0, -1.0 };
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	26
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	27 static const float p1p1m1m1[4] __attribute__((aligned(16))) =
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	28 { 1.0, 1.0, -1.0, -1.0 };
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	29
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	30 #if 0
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	31 static void print_v4sf(const char *str, __m128 a)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	32 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	33 float p = (float )&a;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	34 printf("%s: %f %f %f %f\n",
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	35 str, p[0], p[1], p[2], p[3]);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	36 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	37 #endif
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	38
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	39 /* XXX: handle reverse case */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	40 void fft_calc_sse(FFTContext s, FFTComplex z)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	41 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	42 int ln = s->nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	43 int j, np, np2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	44 int nblocks, nloops;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	45 register FFTComplex p, q;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	46 FFTComplex cptr, cptr1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	47 int k;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	48
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	49 np = 1 << ln;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	50
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	51 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	52 __m128 *r, a, b, a1, c1, c2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	53
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	54 r = (__m128 *)&z[0];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	55 c1 = (__m128 )p1p1m1m1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	56 c2 = (__m128 )p1p1p1m1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	57 j = (np >> 2);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	58 do {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	59 a = r[0];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	60 b = _mm_shuffle_ps(a, a, _MM_SHUFFLE(1, 0, 3, 2));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	61 a = _mm_mul_ps(a, c1);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	62 /* do the pass 0 butterfly */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	63 a = _mm_add_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	64
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	65 a1 = r[1];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	66 b = _mm_shuffle_ps(a1, a1, _MM_SHUFFLE(1, 0, 3, 2));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	67 a1 = _mm_mul_ps(a1, c1);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	68 /* do the pass 0 butterfly */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	69 b = _mm_add_ps(a1, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	70
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	71 /* multiply third by -i */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	72 b = _mm_shuffle_ps(b, b, _MM_SHUFFLE(2, 3, 1, 0));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	73 b = _mm_mul_ps(b, c2);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	74
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	75 /* do the pass 1 butterfly */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	76 r[0] = _mm_add_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	77 r[1] = _mm_sub_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	78 r += 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	79 } while (--j != 0);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	80 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	81 /* pass 2 .. ln-1 */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	82
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	83 nblocks = np >> 3;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	84 nloops = 1 << 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	85 np2 = np >> 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	86
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	87 cptr1 = s->exptab1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	88 do {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	89 p = z;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	90 q = z + nloops;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	91 j = nblocks;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	92 do {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	93 cptr = cptr1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	94 k = nloops >> 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	95 do {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	96 __m128 a, b, c, t1, t2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	97
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	98 a = (__m128 )p;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	99 b = (__m128 )q;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	100
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	101 /* complex mul */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	102 c = (__m128 )cptr;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	103 /* crere cimre */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	104 t1 = _mm_mul_ps(c,
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	105 _mm_shuffle_ps(b, b, _MM_SHUFFLE(2, 2, 0, 0)));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	106 c = (__m128 )(cptr + 2);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	107 /* -cimim creim */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	108 t2 = _mm_mul_ps(c,
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	109 _mm_shuffle_ps(b, b, _MM_SHUFFLE(3, 3, 1, 1)));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	110 b = _mm_add_ps(t1, t2);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	111
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	112 /* butterfly */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	113 (__m128 )p = _mm_add_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	114 (__m128 )q = _mm_sub_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	115
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	116 p += 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	117 q += 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	118 cptr += 4;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	119 } while (--k);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	120
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	121 p += nloops;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	122 q += nloops;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	123 } while (--j);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	124 cptr1 += nloops * 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	125 nblocks = nblocks >> 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	126 nloops = nloops << 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	127 } while (nblocks != 0);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	128 }

Mercurial > libavcodec.hg

annotate i386/fft_sse.c @ 781:6f5e87957bcb libavcodec