libavcodec.hg: fft.c annotate

annotate fft.c @ 12266:48d6738904a9 libavcodec

Fix SPLATB_REG mess. Used to be a if/elseif/elseif/elseif spaghetti, so this splits it into small optimization-specific macros which are selected for each DSP function. The advantage of this approach is that the sse4 functions now use the ssse3 codepath also without needing an explicit sse4 codepath.

author	rbultje
date	Sat, 24 Jul 2010 19:33:05 +0000
parents	a2e5b142776b
children

rev	line source
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	1 /*
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	2 * FFT/IFFT transforms
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	3 * Copyright (c) 2008 Loren Merritt
8629 04423b2f6e0b cosmetics: Remove pointless period after copyright statement non-sentences. diego parents: 8590 diff changeset	4 * Copyright (c) 2002 Fabrice Bellard
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	5 * Partly based on libdjbfft by D. J. Bernstein
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	6 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	7 * This file is part of FFmpeg.
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	8 *
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	9 * FFmpeg is free software; you can redistribute it and/or
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	10 * modify it under the terms of the GNU Lesser General Public
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	11 * License as published by the Free Software Foundation; either
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	12 * version 2.1 of the License, or (at your option) any later version.
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	13 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	14 * FFmpeg is distributed in the hope that it will be useful,
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	15 * but WITHOUT ANY WARRANTY; without even the implied warranty of
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	16 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	17 * Lesser General Public License for more details.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	18 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	19 * You should have received a copy of the GNU Lesser General Public
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	20 * License along with FFmpeg; if not, write to the Free Software
3036 0b546eab515d Update licensing information: The FSF changed postal address. diego parents: 2979 diff changeset	21 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	22 */
1106 1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	23
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	24 /**
11644 7dd2a45249a9 Remove explicit filename from Doxygen @file commands. diego parents: 11444 diff changeset	25 * @file
1106 1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	26 * FFT/IFFT transforms.
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	27 */
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	28
11444 6f1697664bf2 Replace many includes of libavutil/common.h with what is actually needed mru parents: 11370 diff changeset	29 #include <stdlib.h>
6f1697664bf2 Replace many includes of libavutil/common.h with what is actually needed mru parents: 11370 diff changeset	30 #include <string.h>
11370 4b3da727d832 Move FFT parts from dsputil.h to fft.h mru parents: 11122 diff changeset	31 #include "libavutil/mathematics.h"
4b3da727d832 Move FFT parts from dsputil.h to fft.h mru parents: 11122 diff changeset	32 #include "fft.h"
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	33
10407 57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	34 /* cos(2pix/n) for 0<=x<=n/4, followed by its reverse */
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	35 #if !CONFIG_HARDCODED_TABLES
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	36 COSTABLE(16);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	37 COSTABLE(32);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	38 COSTABLE(64);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	39 COSTABLE(128);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	40 COSTABLE(256);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	41 COSTABLE(512);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	42 COSTABLE(1024);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	43 COSTABLE(2048);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	44 COSTABLE(4096);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	45 COSTABLE(8192);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	46 COSTABLE(16384);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	47 COSTABLE(32768);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	48 COSTABLE(65536);
10400 866dffa620d1 Use hardcoded instead of runtime-calculated ff_cos_* tables if reimar parents: 10391 diff changeset	49 #endif
10407 57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	50 COSTABLE_CONST FFTSample * const ff_cos_tabs[] = {
10492 63910f7ba293 Pad ff_cos_tabs and ff_sin_tabs so that index n points to the table for n bits. reimar parents: 10407 diff changeset	51 NULL, NULL, NULL, NULL,
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	52 ff_cos_16, ff_cos_32, ff_cos_64, ff_cos_128, ff_cos_256, ff_cos_512, ff_cos_1024,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	53 ff_cos_2048, ff_cos_4096, ff_cos_8192, ff_cos_16384, ff_cos_32768, ff_cos_65536,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	54 };
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	55
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	56 static int split_radix_permutation(int i, int n, int inverse)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	57 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	58 int m;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	59 if(n <= 2) return i&1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	60 m = n >> 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	61 if(!(i&m)) return split_radix_permutation(i, m, inverse)*2;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	62 m >>= 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	63 if(inverse == !(i&m)) return split_radix_permutation(i, m, inverse)*4 + 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	64 else return split_radix_permutation(i, m, inverse)*4 - 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	65 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	66
10496 74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	67 av_cold void ff_init_ff_cos_tabs(int index)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	68 {
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	69 #if !CONFIG_HARDCODED_TABLES
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	70 int i;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	71 int m = 1<<index;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	72 double freq = 2*M_PI/m;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	73 FFTSample *tab = ff_cos_tabs[index];
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	74 for(i=0; i<=m/4; i++)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	75 tab[i] = cos(i*freq);
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	76 for(i=1; i<m/4; i++)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	77 tab[m/2-i] = tab[i];
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	78 #endif
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	79 }
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	80
8637 3f72756b0c5c Mark ff_fft_init with av_cold. alexc parents: 8636 diff changeset	81 av_cold int ff_fft_init(FFTContext *s, int nbits, int inverse)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	82 {
12047 c80c7a717156 Remove vestiges of radix-2 FFT mru parents: 11644 diff changeset	83 int i, j, n;
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	84
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	85 if (nbits < 2 \|\| nbits > 16)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	86 goto fail;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	87 s->nbits = nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	88 n = 1 << nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	89
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	90 s->revtab = av_malloc(n * sizeof(uint16_t));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	91 if (!s->revtab)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	92 goto fail;
12047 c80c7a717156 Remove vestiges of radix-2 FFT mru parents: 11644 diff changeset	93 s->tmp_buf = av_malloc(n * sizeof(FFTComplex));
c80c7a717156 Remove vestiges of radix-2 FFT mru parents: 11644 diff changeset	94 if (!s->tmp_buf)
c80c7a717156 Remove vestiges of radix-2 FFT mru parents: 11644 diff changeset	95 goto fail;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	96 s->inverse = inverse;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	97
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	98 s->fft_permute = ff_fft_permute_c;
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	99 s->fft_calc = ff_fft_calc_c;
11122 e45c852b6820 Fix build with --disable-mdct mru parents: 10496 diff changeset	100 #if CONFIG_MDCT
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	101 s->imdct_calc = ff_imdct_calc_c;
d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	102 s->imdct_half = ff_imdct_half_c;
10161 a349795e8dca Prepare for optimised forward MDCT implementations mru parents: 10153 diff changeset	103 s->mdct_calc = ff_mdct_calc_c;
11122 e45c852b6820 Fix build with --disable-mdct mru parents: 10496 diff changeset	104 #endif
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	105
10175 5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	106 if (ARCH_ARM) ff_fft_init_arm(s);
5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	107 if (HAVE_ALTIVEC) ff_fft_init_altivec(s);
5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	108 if (HAVE_MMX) ff_fft_init_mmx(s);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	109
12048 a2e5b142776b Indent mru parents: 12047 diff changeset	110 for(j=4; j<=nbits; j++) {
a2e5b142776b Indent mru parents: 12047 diff changeset	111 ff_init_ff_cos_tabs(j);
a2e5b142776b Indent mru parents: 12047 diff changeset	112 }
a2e5b142776b Indent mru parents: 12047 diff changeset	113 for(i=0; i<n; i++)
a2e5b142776b Indent mru parents: 12047 diff changeset	114 s->revtab[-split_radix_permutation(i, n, s->inverse) & (n-1)] = i;
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	115
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	116 return 0;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	117 fail:
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	118 av_freep(&s->revtab);
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	119 av_freep(&s->tmp_buf);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	120 return -1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	121 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	122
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	123 void ff_fft_permute_c(FFTContext s, FFTComplex z)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	124 {
12047 c80c7a717156 Remove vestiges of radix-2 FFT mru parents: 11644 diff changeset	125 int j, np;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	126 const uint16_t *revtab = s->revtab;
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	127 np = 1 << s->nbits;
12048 a2e5b142776b Indent mru parents: 12047 diff changeset	128 /* TODO: handle split-radix permute in a more optimal way, probably in-place */
a2e5b142776b Indent mru parents: 12047 diff changeset	129 for(j=0;j<np;j++) s->tmp_buf[revtab[j]] = z[j];
a2e5b142776b Indent mru parents: 12047 diff changeset	130 memcpy(z, s->tmp_buf, np * sizeof(FFTComplex));
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	131 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	132
8687 04200b454f3f Mark ff_fft_end av_cold. alexc parents: 8637 diff changeset	133 av_cold void ff_fft_end(FFTContext *s)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	134 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	135 av_freep(&s->revtab);
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	136 av_freep(&s->tmp_buf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	137 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	138
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	139 #define sqrthalf (float)M_SQRT1_2
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	140
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	141 #define BF(x,y,a,b) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	142 x = a - b;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	143 y = a + b;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	144 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	145
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	146 #define BUTTERFLIES(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	147 BF(t3, t5, t5, t1);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	148 BF(a2.re, a0.re, a0.re, t5);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	149 BF(a3.im, a1.im, a1.im, t3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	150 BF(t4, t6, t2, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	151 BF(a3.re, a1.re, a1.re, t4);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	152 BF(a2.im, a0.im, a0.im, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	153 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	154
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	155 // force loading all the inputs before storing any.
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	156 // this is slightly slower for small data, but avoids store->load aliasing
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	157 // for addresses separated by large powers of 2.
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	158 #define BUTTERFLIES_BIG(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	159 FFTSample r0=a0.re, i0=a0.im, r1=a1.re, i1=a1.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	160 BF(t3, t5, t5, t1);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	161 BF(a2.re, a0.re, r0, t5);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	162 BF(a3.im, a1.im, i1, t3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	163 BF(t4, t6, t2, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	164 BF(a3.re, a1.re, r1, t4);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	165 BF(a2.im, a0.im, i0, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	166 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	167
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	168 #define TRANSFORM(a0,a1,a2,a3,wre,wim) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	169 t1 = a2.re * wre + a2.im * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	170 t2 = a2.im * wre - a2.re * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	171 t5 = a3.re * wre - a3.im * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	172 t6 = a3.im * wre + a3.re * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	173 BUTTERFLIES(a0,a1,a2,a3)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	174 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	175
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	176 #define TRANSFORM_ZERO(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	177 t1 = a2.re;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	178 t2 = a2.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	179 t5 = a3.re;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	180 t6 = a3.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	181 BUTTERFLIES(a0,a1,a2,a3)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	182 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	183
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	184 /* z[0...8n-1], w[1...2n-1] */
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	185 #define PASS(name)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	186 static void name(FFTComplex z, const FFTSample wre, unsigned int n)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	187 {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	188 FFTSample t1, t2, t3, t4, t5, t6;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	189 int o1 = 2*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	190 int o2 = 4*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	191 int o3 = 6*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	192 const FFTSample *wim = wre+o1;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	193 n--;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	194 \
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	195 TRANSFORM_ZERO(z[0],z[o1],z[o2],z[o3]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	196 TRANSFORM(z[1],z[o1+1],z[o2+1],z[o3+1],wre[1],wim[-1]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	197 do {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	198 z += 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	199 wre += 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	200 wim -= 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	201 TRANSFORM(z[0],z[o1],z[o2],z[o3],wre[0],wim[0]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	202 TRANSFORM(z[1],z[o1+1],z[o2+1],z[o3+1],wre[1],wim[-1]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	203 } while(--n);\
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	204 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	205
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	206 PASS(pass)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	207 #undef BUTTERFLIES
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	208 #define BUTTERFLIES BUTTERFLIES_BIG
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	209 PASS(pass_big)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	210
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	211 #define DECL_FFT(n,n2,n4)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	212 static void fft##n(FFTComplex *z)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	213 {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	214 fft##n2(z);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	215 fft##n4(z+n4*2);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	216 fft##n4(z+n4*3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	217 pass(z,ff_cos_##n,n4/2);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	218 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	219
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	220 static void fft4(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	221 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	222 FFTSample t1, t2, t3, t4, t5, t6, t7, t8;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	223
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	224 BF(t3, t1, z[0].re, z[1].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	225 BF(t8, t6, z[3].re, z[2].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	226 BF(z[2].re, z[0].re, t1, t6);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	227 BF(t4, t2, z[0].im, z[1].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	228 BF(t7, t5, z[2].im, z[3].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	229 BF(z[3].im, z[1].im, t4, t8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	230 BF(z[3].re, z[1].re, t3, t7);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	231 BF(z[2].im, z[0].im, t2, t5);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	232 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	233
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	234 static void fft8(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	235 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	236 FFTSample t1, t2, t3, t4, t5, t6, t7, t8;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	237
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	238 fft4(z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	239
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	240 BF(t1, z[5].re, z[4].re, -z[5].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	241 BF(t2, z[5].im, z[4].im, -z[5].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	242 BF(t3, z[7].re, z[6].re, -z[7].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	243 BF(t4, z[7].im, z[6].im, -z[7].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	244 BF(t8, t1, t3, t1);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	245 BF(t7, t2, t2, t4);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	246 BF(z[4].re, z[0].re, z[0].re, t1);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	247 BF(z[4].im, z[0].im, z[0].im, t2);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	248 BF(z[6].re, z[2].re, z[2].re, t7);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	249 BF(z[6].im, z[2].im, z[2].im, t8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	250
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	251 TRANSFORM(z[1],z[3],z[5],z[7],sqrthalf,sqrthalf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	252 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	253
8590 7a463923ecd1 Change semantic of CONFIG_, HAVE_ and ARCH_. aurel* parents: 8104 diff changeset	254 #if !CONFIG_SMALL
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	255 static void fft16(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	256 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	257 FFTSample t1, t2, t3, t4, t5, t6;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	258
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	259 fft8(z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	260 fft4(z+8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	261 fft4(z+12);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	262
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	263 TRANSFORM_ZERO(z[0],z[4],z[8],z[12]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	264 TRANSFORM(z[2],z[6],z[10],z[14],sqrthalf,sqrthalf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	265 TRANSFORM(z[1],z[5],z[9],z[13],ff_cos_16[1],ff_cos_16[3]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	266 TRANSFORM(z[3],z[7],z[11],z[15],ff_cos_16[3],ff_cos_16[1]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	267 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	268 #else
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	269 DECL_FFT(16,8,4)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	270 #endif
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	271 DECL_FFT(32,16,8)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	272 DECL_FFT(64,32,16)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	273 DECL_FFT(128,64,32)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	274 DECL_FFT(256,128,64)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	275 DECL_FFT(512,256,128)
8590 7a463923ecd1 Change semantic of CONFIG_, HAVE_ and ARCH_. aurel* parents: 8104 diff changeset	276 #if !CONFIG_SMALL
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	277 #define pass pass_big
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	278 #endif
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	279 DECL_FFT(1024,512,256)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	280 DECL_FFT(2048,1024,512)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	281 DECL_FFT(4096,2048,1024)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	282 DECL_FFT(8192,4096,2048)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	283 DECL_FFT(16384,8192,4096)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	284 DECL_FFT(32768,16384,8192)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	285 DECL_FFT(65536,32768,16384)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	286
10391 74715d4288ad fft_dispatch array should be const reimar parents: 10175 diff changeset	287 static void (* const fft_dispatch[])(FFTComplex*) = {
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	288 fft4, fft8, fft16, fft32, fft64, fft128, fft256, fft512, fft1024,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	289 fft2048, fft4096, fft8192, fft16384, fft32768, fft65536,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	290 };
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	291
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	292 void ff_fft_calc_c(FFTContext s, FFTComplex z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	293 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	294 fft_dispatch[s->nbits-2](z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	295 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	296

Mercurial > libavcodec.hg

annotate fft.c @ 12266:48d6738904a9 libavcodec