libavcodec.hg: fft.c annotate

annotate fft.c @ 11032:01bd040f8607 libavcodec

Unroll main loop so the edge==0 case is seperate. This allows many things to be simplified away. h264 decoder is overall 1% faster with a mbaff sample and 0.1% slower with the cathedral sample, probably because the slow loop filter code must be loaded into the code cache for each first MB of each row but isnt used for the following MBs.

author	michael
date	Thu, 28 Jan 2010 01:24:25 +0000
parents	74b0c1a0851e
children	e45c852b6820

rev	line source
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	1 /*
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	2 * FFT/IFFT transforms
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	3 * Copyright (c) 2008 Loren Merritt
8629 04423b2f6e0b cosmetics: Remove pointless period after copyright statement non-sentences. diego parents: 8590 diff changeset	4 * Copyright (c) 2002 Fabrice Bellard
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	5 * Partly based on libdjbfft by D. J. Bernstein
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	6 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	7 * This file is part of FFmpeg.
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	8 *
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	9 * FFmpeg is free software; you can redistribute it and/or
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	10 * modify it under the terms of the GNU Lesser General Public
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	11 * License as published by the Free Software Foundation; either
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	12 * version 2.1 of the License, or (at your option) any later version.
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	13 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	14 * FFmpeg is distributed in the hope that it will be useful,
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	15 * but WITHOUT ANY WARRANTY; without even the implied warranty of
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	16 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	17 * Lesser General Public License for more details.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	18 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	19 * You should have received a copy of the GNU Lesser General Public
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	20 * License along with FFmpeg; if not, write to the Free Software
3036 0b546eab515d Update licensing information: The FSF changed postal address. diego parents: 2979 diff changeset	21 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	22 */
1106 1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	23
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	24 /**
8718 e9d9d946f213 Use full internal pathname in doxygen @file directives. diego parents: 8694 diff changeset	25 * @file libavcodec/fft.c
1106 1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	26 * FFT/IFFT transforms.
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	27 */
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	28
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	29 #include "dsputil.h"
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	30
10407 57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	31 /* cos(2pix/n) for 0<=x<=n/4, followed by its reverse */
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	32 #if !CONFIG_HARDCODED_TABLES
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	33 COSTABLE(16);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	34 COSTABLE(32);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	35 COSTABLE(64);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	36 COSTABLE(128);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	37 COSTABLE(256);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	38 COSTABLE(512);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	39 COSTABLE(1024);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	40 COSTABLE(2048);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	41 COSTABLE(4096);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	42 COSTABLE(8192);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	43 COSTABLE(16384);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	44 COSTABLE(32768);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	45 COSTABLE(65536);
10400 866dffa620d1 Use hardcoded instead of runtime-calculated ff_cos_* tables if reimar parents: 10391 diff changeset	46 #endif
10407 57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	47 COSTABLE_CONST FFTSample * const ff_cos_tabs[] = {
10492 63910f7ba293 Pad ff_cos_tabs and ff_sin_tabs so that index n points to the table for n bits. reimar parents: 10407 diff changeset	48 NULL, NULL, NULL, NULL,
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	49 ff_cos_16, ff_cos_32, ff_cos_64, ff_cos_128, ff_cos_256, ff_cos_512, ff_cos_1024,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	50 ff_cos_2048, ff_cos_4096, ff_cos_8192, ff_cos_16384, ff_cos_32768, ff_cos_65536,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	51 };
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	52
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	53 static int split_radix_permutation(int i, int n, int inverse)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	54 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	55 int m;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	56 if(n <= 2) return i&1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	57 m = n >> 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	58 if(!(i&m)) return split_radix_permutation(i, m, inverse)*2;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	59 m >>= 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	60 if(inverse == !(i&m)) return split_radix_permutation(i, m, inverse)*4 + 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	61 else return split_radix_permutation(i, m, inverse)*4 - 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	62 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	63
10496 74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	64 av_cold void ff_init_ff_cos_tabs(int index)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	65 {
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	66 #if !CONFIG_HARDCODED_TABLES
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	67 int i;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	68 int m = 1<<index;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	69 double freq = 2*M_PI/m;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	70 FFTSample *tab = ff_cos_tabs[index];
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	71 for(i=0; i<=m/4; i++)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	72 tab[i] = cos(i*freq);
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	73 for(i=1; i<m/4; i++)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	74 tab[m/2-i] = tab[i];
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	75 #endif
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	76 }
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	77
8637 3f72756b0c5c Mark ff_fft_init with av_cold. alexc parents: 8636 diff changeset	78 av_cold int ff_fft_init(FFTContext *s, int nbits, int inverse)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	79 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	80 int i, j, m, n;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	81 float alpha, c1, s1, s2;
6503 311c95dddb16 clean up FFT SIMD selection mru parents: 3947 diff changeset	82 int av_unused has_vectors;
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	83
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	84 if (nbits < 2 \|\| nbits > 16)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	85 goto fail;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	86 s->nbits = nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	87 n = 1 << nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	88
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	89 s->tmp_buf = NULL;
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	90 s->exptab = av_malloc((n / 2) * sizeof(FFTComplex));
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	91 if (!s->exptab)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	92 goto fail;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	93 s->revtab = av_malloc(n * sizeof(uint16_t));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	94 if (!s->revtab)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	95 goto fail;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	96 s->inverse = inverse;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	97
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	98 s2 = inverse ? 1.0 : -1.0;
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	99
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	100 s->fft_permute = ff_fft_permute_c;
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	101 s->fft_calc = ff_fft_calc_c;
d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	102 s->imdct_calc = ff_imdct_calc_c;
d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	103 s->imdct_half = ff_imdct_half_c;
10161 a349795e8dca Prepare for optimised forward MDCT implementations mru parents: 10153 diff changeset	104 s->mdct_calc = ff_mdct_calc_c;
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	105 s->exptab1 = NULL;
10175 5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	106 s->split_radix = 1;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	107
10175 5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	108 if (ARCH_ARM) ff_fft_init_arm(s);
5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	109 if (HAVE_ALTIVEC) ff_fft_init_altivec(s);
5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	110 if (HAVE_MMX) ff_fft_init_mmx(s);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	111
10175 5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	112 if (s->split_radix) {
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	113 for(j=4; j<=nbits; j++) {
10496 74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	114 ff_init_ff_cos_tabs(j);
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	115 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	116 for(i=0; i<n; i++)
10172 eda985c53dba ARM: 10l: fix large FFTs mru parents: 10162 diff changeset	117 s->revtab[-split_radix_permutation(i, n, s->inverse) & (n-1)] = i;
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	118 s->tmp_buf = av_malloc(n * sizeof(FFTComplex));
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	119 } else {
6504 978911ca654f indentation mru parents: 6503 diff changeset	120 int np, nblocks, np2, l;
978911ca654f indentation mru parents: 6503 diff changeset	121 FFTComplex *q;
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	122
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	123 for(i=0; i<(n/2); i++) {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	124 alpha = 2 * M_PI * (float)i / (float)n;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	125 c1 = cos(alpha);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	126 s1 = sin(alpha) * s2;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	127 s->exptab[i].re = c1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	128 s->exptab[i].im = s1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	129 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	130
6504 978911ca654f indentation mru parents: 6503 diff changeset	131 np = 1 << nbits;
978911ca654f indentation mru parents: 6503 diff changeset	132 nblocks = np >> 3;
978911ca654f indentation mru parents: 6503 diff changeset	133 np2 = np >> 1;
978911ca654f indentation mru parents: 6503 diff changeset	134 s->exptab1 = av_malloc(np * 2 * sizeof(FFTComplex));
978911ca654f indentation mru parents: 6503 diff changeset	135 if (!s->exptab1)
978911ca654f indentation mru parents: 6503 diff changeset	136 goto fail;
978911ca654f indentation mru parents: 6503 diff changeset	137 q = s->exptab1;
978911ca654f indentation mru parents: 6503 diff changeset	138 do {
978911ca654f indentation mru parents: 6503 diff changeset	139 for(l = 0; l < np2; l += 2 * nblocks) {
978911ca654f indentation mru parents: 6503 diff changeset	140 *q++ = s->exptab[l];
978911ca654f indentation mru parents: 6503 diff changeset	141 *q++ = s->exptab[l + nblocks];
975 e05d525505c5 fft altivec by Romain Dolbeau - simplified patch, test it on PPC with fft-test and wma decoding bellard parents: 971 diff changeset	142
6504 978911ca654f indentation mru parents: 6503 diff changeset	143 q->re = -s->exptab[l].im;
978911ca654f indentation mru parents: 6503 diff changeset	144 q->im = s->exptab[l].re;
978911ca654f indentation mru parents: 6503 diff changeset	145 q++;
978911ca654f indentation mru parents: 6503 diff changeset	146 q->re = -s->exptab[l + nblocks].im;
978911ca654f indentation mru parents: 6503 diff changeset	147 q->im = s->exptab[l + nblocks].re;
978911ca654f indentation mru parents: 6503 diff changeset	148 q++;
978911ca654f indentation mru parents: 6503 diff changeset	149 }
978911ca654f indentation mru parents: 6503 diff changeset	150 nblocks = nblocks >> 1;
978911ca654f indentation mru parents: 6503 diff changeset	151 } while (nblocks != 0);
978911ca654f indentation mru parents: 6503 diff changeset	152 av_freep(&s->exptab);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	153
7543 f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	154 /* compute bit reverse table */
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	155 for(i=0;i<n;i++) {
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	156 m=0;
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	157 for(j=0;j<nbits;j++) {
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	158 m \|= ((i >> j) & 1) << (nbits-j-1);
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	159 }
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	160 s->revtab[i]=m;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	161 }
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	162 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	163
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	164 return 0;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	165 fail:
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	166 av_freep(&s->revtab);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	167 av_freep(&s->exptab);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	168 av_freep(&s->exptab1);
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	169 av_freep(&s->tmp_buf);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	170 return -1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	171 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	172
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	173 void ff_fft_permute_c(FFTContext s, FFTComplex z)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	174 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	175 int j, k, np;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	176 FFTComplex tmp;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	177 const uint16_t *revtab = s->revtab;
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	178 np = 1 << s->nbits;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	179
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	180 if (s->tmp_buf) {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	181 /* TODO: handle split-radix permute in a more optimal way, probably in-place */
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	182 for(j=0;j<np;j++) s->tmp_buf[revtab[j]] = z[j];
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	183 memcpy(z, s->tmp_buf, np * sizeof(FFTComplex));
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	184 return;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	185 }
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	186
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	187 /* reverse */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	188 for(j=0;j<np;j++) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	189 k = revtab[j];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	190 if (k < j) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	191 tmp = z[k];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	192 z[k] = z[j];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	193 z[j] = tmp;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	194 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	195 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	196 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	197
8687 04200b454f3f Mark ff_fft_end av_cold. alexc parents: 8637 diff changeset	198 av_cold void ff_fft_end(FFTContext *s)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	199 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	200 av_freep(&s->revtab);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	201 av_freep(&s->exptab);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	202 av_freep(&s->exptab1);
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	203 av_freep(&s->tmp_buf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	204 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	205
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	206 #define sqrthalf (float)M_SQRT1_2
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	207
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	208 #define BF(x,y,a,b) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	209 x = a - b;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	210 y = a + b;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	211 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	212
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	213 #define BUTTERFLIES(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	214 BF(t3, t5, t5, t1);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	215 BF(a2.re, a0.re, a0.re, t5);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	216 BF(a3.im, a1.im, a1.im, t3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	217 BF(t4, t6, t2, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	218 BF(a3.re, a1.re, a1.re, t4);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	219 BF(a2.im, a0.im, a0.im, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	220 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	221
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	222 // force loading all the inputs before storing any.
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	223 // this is slightly slower for small data, but avoids store->load aliasing
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	224 // for addresses separated by large powers of 2.
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	225 #define BUTTERFLIES_BIG(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	226 FFTSample r0=a0.re, i0=a0.im, r1=a1.re, i1=a1.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	227 BF(t3, t5, t5, t1);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	228 BF(a2.re, a0.re, r0, t5);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	229 BF(a3.im, a1.im, i1, t3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	230 BF(t4, t6, t2, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	231 BF(a3.re, a1.re, r1, t4);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	232 BF(a2.im, a0.im, i0, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	233 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	234
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	235 #define TRANSFORM(a0,a1,a2,a3,wre,wim) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	236 t1 = a2.re * wre + a2.im * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	237 t2 = a2.im * wre - a2.re * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	238 t5 = a3.re * wre - a3.im * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	239 t6 = a3.im * wre + a3.re * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	240 BUTTERFLIES(a0,a1,a2,a3)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	241 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	242
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	243 #define TRANSFORM_ZERO(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	244 t1 = a2.re;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	245 t2 = a2.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	246 t5 = a3.re;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	247 t6 = a3.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	248 BUTTERFLIES(a0,a1,a2,a3)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	249 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	250
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	251 /* z[0...8n-1], w[1...2n-1] */
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	252 #define PASS(name)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	253 static void name(FFTComplex z, const FFTSample wre, unsigned int n)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	254 {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	255 FFTSample t1, t2, t3, t4, t5, t6;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	256 int o1 = 2*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	257 int o2 = 4*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	258 int o3 = 6*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	259 const FFTSample *wim = wre+o1;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	260 n--;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	261 \
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	262 TRANSFORM_ZERO(z[0],z[o1],z[o2],z[o3]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	263 TRANSFORM(z[1],z[o1+1],z[o2+1],z[o3+1],wre[1],wim[-1]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	264 do {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	265 z += 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	266 wre += 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	267 wim -= 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	268 TRANSFORM(z[0],z[o1],z[o2],z[o3],wre[0],wim[0]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	269 TRANSFORM(z[1],z[o1+1],z[o2+1],z[o3+1],wre[1],wim[-1]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	270 } while(--n);\
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	271 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	272
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	273 PASS(pass)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	274 #undef BUTTERFLIES
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	275 #define BUTTERFLIES BUTTERFLIES_BIG
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	276 PASS(pass_big)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	277
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	278 #define DECL_FFT(n,n2,n4)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	279 static void fft##n(FFTComplex *z)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	280 {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	281 fft##n2(z);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	282 fft##n4(z+n4*2);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	283 fft##n4(z+n4*3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	284 pass(z,ff_cos_##n,n4/2);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	285 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	286
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	287 static void fft4(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	288 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	289 FFTSample t1, t2, t3, t4, t5, t6, t7, t8;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	290
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	291 BF(t3, t1, z[0].re, z[1].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	292 BF(t8, t6, z[3].re, z[2].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	293 BF(z[2].re, z[0].re, t1, t6);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	294 BF(t4, t2, z[0].im, z[1].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	295 BF(t7, t5, z[2].im, z[3].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	296 BF(z[3].im, z[1].im, t4, t8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	297 BF(z[3].re, z[1].re, t3, t7);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	298 BF(z[2].im, z[0].im, t2, t5);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	299 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	300
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	301 static void fft8(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	302 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	303 FFTSample t1, t2, t3, t4, t5, t6, t7, t8;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	304
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	305 fft4(z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	306
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	307 BF(t1, z[5].re, z[4].re, -z[5].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	308 BF(t2, z[5].im, z[4].im, -z[5].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	309 BF(t3, z[7].re, z[6].re, -z[7].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	310 BF(t4, z[7].im, z[6].im, -z[7].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	311 BF(t8, t1, t3, t1);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	312 BF(t7, t2, t2, t4);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	313 BF(z[4].re, z[0].re, z[0].re, t1);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	314 BF(z[4].im, z[0].im, z[0].im, t2);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	315 BF(z[6].re, z[2].re, z[2].re, t7);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	316 BF(z[6].im, z[2].im, z[2].im, t8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	317
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	318 TRANSFORM(z[1],z[3],z[5],z[7],sqrthalf,sqrthalf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	319 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	320
8590 7a463923ecd1 Change semantic of CONFIG_, HAVE_ and ARCH_. aurel* parents: 8104 diff changeset	321 #if !CONFIG_SMALL
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	322 static void fft16(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	323 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	324 FFTSample t1, t2, t3, t4, t5, t6;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	325
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	326 fft8(z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	327 fft4(z+8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	328 fft4(z+12);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	329
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	330 TRANSFORM_ZERO(z[0],z[4],z[8],z[12]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	331 TRANSFORM(z[2],z[6],z[10],z[14],sqrthalf,sqrthalf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	332 TRANSFORM(z[1],z[5],z[9],z[13],ff_cos_16[1],ff_cos_16[3]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	333 TRANSFORM(z[3],z[7],z[11],z[15],ff_cos_16[3],ff_cos_16[1]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	334 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	335 #else
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	336 DECL_FFT(16,8,4)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	337 #endif
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	338 DECL_FFT(32,16,8)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	339 DECL_FFT(64,32,16)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	340 DECL_FFT(128,64,32)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	341 DECL_FFT(256,128,64)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	342 DECL_FFT(512,256,128)
8590 7a463923ecd1 Change semantic of CONFIG_, HAVE_ and ARCH_. aurel* parents: 8104 diff changeset	343 #if !CONFIG_SMALL
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	344 #define pass pass_big
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	345 #endif
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	346 DECL_FFT(1024,512,256)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	347 DECL_FFT(2048,1024,512)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	348 DECL_FFT(4096,2048,1024)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	349 DECL_FFT(8192,4096,2048)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	350 DECL_FFT(16384,8192,4096)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	351 DECL_FFT(32768,16384,8192)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	352 DECL_FFT(65536,32768,16384)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	353
10391 74715d4288ad fft_dispatch array should be const reimar parents: 10175 diff changeset	354 static void (* const fft_dispatch[])(FFTComplex*) = {
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	355 fft4, fft8, fft16, fft32, fft64, fft128, fft256, fft512, fft1024,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	356 fft2048, fft4096, fft8192, fft16384, fft32768, fft65536,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	357 };
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	358
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	359 void ff_fft_calc_c(FFTContext s, FFTComplex z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	360 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	361 fft_dispatch[s->nbits-2](z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	362 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	363

Mercurial > libavcodec.hg

annotate fft.c @ 11032:01bd040f8607 libavcodec