libavcodec.hg: i386/fft

annotate i386/fft_sse.c @ 2841:bceeca1bb30f libavcodec

vbr audio encode patch by (Justin Ruggles: jruggle, earthlink net) with changes by me int->float as video uses float too remove silent cliping to some per codec range, this should result in an error instead remove change to utils.c as its inconsistant with video

author	michael
date	Sun, 21 Aug 2005 20:27:00 +0000
parents	dd63cb7e5080
children	ef2149182f1c

rev	line source
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	1 /*
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	2 * FFT/MDCT transform with SSE optimizations
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	3 * Copyright (c) 2002 Fabrice Bellard.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	4 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	5 * This library is free software; you can redistribute it and/or
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	6 * modify it under the terms of the GNU Lesser General Public
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	7 * License as published by the Free Software Foundation; either
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	8 * version 2 of the License, or (at your option) any later version.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	9 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	10 * This library is distributed in the hope that it will be useful,
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	11 * but WITHOUT ANY WARRANTY; without even the implied warranty of
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	12 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	13 * Lesser General Public License for more details.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	14 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	15 * You should have received a copy of the GNU Lesser General Public
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	16 * License along with this library; if not, write to the Free Software
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	17 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	18 */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	19 #include "../dsputil.h"
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	20 #include <math.h>
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	21
968 64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	22 #ifdef HAVE_BUILTIN_VECTOR
64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	23
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	24 #include <xmmintrin.h>
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	25
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	26 static const float p1p1p1m1[4] __attribute__((aligned(16))) =
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	27 { 1.0, 1.0, 1.0, -1.0 };
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	28
968 64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	29 static const float p1p1m1p1[4] __attribute__((aligned(16))) =
64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	30 { 1.0, 1.0, -1.0, 1.0 };
64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	31
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	32 static const float p1p1m1m1[4] __attribute__((aligned(16))) =
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	33 { 1.0, 1.0, -1.0, -1.0 };
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	34
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	35 #if 0
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	36 static void print_v4sf(const char *str, __m128 a)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	37 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	38 float p = (float )&a;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	39 printf("%s: %f %f %f %f\n",
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	40 str, p[0], p[1], p[2], p[3]);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	41 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	42 #endif
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	43
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	44 /* XXX: handle reverse case */
1879 dd63cb7e5080 fft_() renamed into ff_fft_() patch by (Gildas Bazin <gbazin at altern dot org>) michael parents: 968 diff changeset	45 void ff_fft_calc_sse(FFTContext s, FFTComplex z)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	46 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	47 int ln = s->nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	48 int j, np, np2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	49 int nblocks, nloops;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	50 register FFTComplex p, q;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	51 FFTComplex cptr, cptr1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	52 int k;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	53
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	54 np = 1 << ln;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	55
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	56 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	57 __m128 *r, a, b, a1, c1, c2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	58
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	59 r = (__m128 *)&z[0];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	60 c1 = (__m128 )p1p1m1m1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	61 c2 = (__m128 )p1p1p1m1;
968 64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	62 if (s->inverse)
64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	63 c2 = (__m128 )p1p1m1p1;
64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	64 else
64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	65 c2 = (__m128 )p1p1p1m1;
64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	66
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	67 j = (np >> 2);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	68 do {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	69 a = r[0];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	70 b = _mm_shuffle_ps(a, a, _MM_SHUFFLE(1, 0, 3, 2));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	71 a = _mm_mul_ps(a, c1);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	72 /* do the pass 0 butterfly */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	73 a = _mm_add_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	74
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	75 a1 = r[1];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	76 b = _mm_shuffle_ps(a1, a1, _MM_SHUFFLE(1, 0, 3, 2));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	77 a1 = _mm_mul_ps(a1, c1);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	78 /* do the pass 0 butterfly */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	79 b = _mm_add_ps(a1, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	80
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	81 /* multiply third by -i */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	82 b = _mm_shuffle_ps(b, b, _MM_SHUFFLE(2, 3, 1, 0));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	83 b = _mm_mul_ps(b, c2);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	84
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	85 /* do the pass 1 butterfly */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	86 r[0] = _mm_add_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	87 r[1] = _mm_sub_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	88 r += 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	89 } while (--j != 0);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	90 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	91 /* pass 2 .. ln-1 */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	92
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	93 nblocks = np >> 3;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	94 nloops = 1 << 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	95 np2 = np >> 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	96
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	97 cptr1 = s->exptab1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	98 do {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	99 p = z;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	100 q = z + nloops;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	101 j = nblocks;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	102 do {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	103 cptr = cptr1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	104 k = nloops >> 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	105 do {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	106 __m128 a, b, c, t1, t2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	107
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	108 a = (__m128 )p;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	109 b = (__m128 )q;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	110
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	111 /* complex mul */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	112 c = (__m128 )cptr;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	113 /* crere cimre */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	114 t1 = _mm_mul_ps(c,
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	115 _mm_shuffle_ps(b, b, _MM_SHUFFLE(2, 2, 0, 0)));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	116 c = (__m128 )(cptr + 2);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	117 /* -cimim creim */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	118 t2 = _mm_mul_ps(c,
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	119 _mm_shuffle_ps(b, b, _MM_SHUFFLE(3, 3, 1, 1)));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	120 b = _mm_add_ps(t1, t2);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	121
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	122 /* butterfly */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	123 (__m128 )p = _mm_add_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	124 (__m128 )q = _mm_sub_ps(a, b);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	125
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	126 p += 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	127 q += 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	128 cptr += 4;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	129 } while (--k);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	130
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	131 p += nloops;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	132 q += nloops;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	133 } while (--j);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	134 cptr1 += nloops * 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	135 nblocks = nblocks >> 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	136 nloops = nloops << 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	137 } while (nblocks != 0);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	138 }
968 64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	139
64f1a11b5f86 added define for builtins use - inverse fix by Romain Dolbeau bellard parents: 781 diff changeset	140 #endif

Mercurial > libavcodec.hg

annotate i386/fft_sse.c @ 2841:bceeca1bb30f libavcodec