libavcodec.hg: fft.c annotate

annotate fft.c @ 11980:263b4ef7ad87 libavcodec

tablegen: implement and use WRITE_ARRAY macros Two macros (WRITE_ARRAY and WRITE_ARRAY_2D) take the prefix (modifiers) (not all tables are static, and they might not be constant either), the type, and the name of the array. It'll be copied with same name and type, and with the correct size of the currently-defined object.

author	flameeyes
date	Sun, 27 Jun 2010 12:21:12 +0000
parents	7dd2a45249a9
children	c80c7a717156

rev	line source
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	1 /*
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	2 * FFT/IFFT transforms
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	3 * Copyright (c) 2008 Loren Merritt
8629 04423b2f6e0b cosmetics: Remove pointless period after copyright statement non-sentences. diego parents: 8590 diff changeset	4 * Copyright (c) 2002 Fabrice Bellard
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	5 * Partly based on libdjbfft by D. J. Bernstein
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	6 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	7 * This file is part of FFmpeg.
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	8 *
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	9 * FFmpeg is free software; you can redistribute it and/or
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	10 * modify it under the terms of the GNU Lesser General Public
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	11 * License as published by the Free Software Foundation; either
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	12 * version 2.1 of the License, or (at your option) any later version.
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	13 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	14 * FFmpeg is distributed in the hope that it will be useful,
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	15 * but WITHOUT ANY WARRANTY; without even the implied warranty of
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	16 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	17 * Lesser General Public License for more details.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	18 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	19 * You should have received a copy of the GNU Lesser General Public
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3746 diff changeset	20 * License along with FFmpeg; if not, write to the Free Software
3036 0b546eab515d Update licensing information: The FSF changed postal address. diego parents: 2979 diff changeset	21 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	22 */
1106 1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	23
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	24 /**
11644 7dd2a45249a9 Remove explicit filename from Doxygen @file commands. diego parents: 11444 diff changeset	25 * @file
1106 1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	26 * FFT/IFFT transforms.
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	27 */
1e39f273ecd6 per file doxy michaelni parents: 1009 diff changeset	28
11444 6f1697664bf2 Replace many includes of libavutil/common.h with what is actually needed mru parents: 11370 diff changeset	29 #include <stdlib.h>
6f1697664bf2 Replace many includes of libavutil/common.h with what is actually needed mru parents: 11370 diff changeset	30 #include <string.h>
11370 4b3da727d832 Move FFT parts from dsputil.h to fft.h mru parents: 11122 diff changeset	31 #include "libavutil/mathematics.h"
4b3da727d832 Move FFT parts from dsputil.h to fft.h mru parents: 11122 diff changeset	32 #include "fft.h"
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	33
10407 57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	34 /* cos(2pix/n) for 0<=x<=n/4, followed by its reverse */
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	35 #if !CONFIG_HARDCODED_TABLES
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	36 COSTABLE(16);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	37 COSTABLE(32);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	38 COSTABLE(64);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	39 COSTABLE(128);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	40 COSTABLE(256);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	41 COSTABLE(512);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	42 COSTABLE(1024);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	43 COSTABLE(2048);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	44 COSTABLE(4096);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	45 COSTABLE(8192);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	46 COSTABLE(16384);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	47 COSTABLE(32768);
57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	48 COSTABLE(65536);
10400 866dffa620d1 Use hardcoded instead of runtime-calculated ff_cos_* tables if reimar parents: 10391 diff changeset	49 #endif
10407 57acce8b1380 Move/add COSTABLE/SINTABLE macros to dsputil to add extern definitions reimar parents: 10400 diff changeset	50 COSTABLE_CONST FFTSample * const ff_cos_tabs[] = {
10492 63910f7ba293 Pad ff_cos_tabs and ff_sin_tabs so that index n points to the table for n bits. reimar parents: 10407 diff changeset	51 NULL, NULL, NULL, NULL,
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	52 ff_cos_16, ff_cos_32, ff_cos_64, ff_cos_128, ff_cos_256, ff_cos_512, ff_cos_1024,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	53 ff_cos_2048, ff_cos_4096, ff_cos_8192, ff_cos_16384, ff_cos_32768, ff_cos_65536,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	54 };
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	55
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	56 static int split_radix_permutation(int i, int n, int inverse)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	57 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	58 int m;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	59 if(n <= 2) return i&1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	60 m = n >> 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	61 if(!(i&m)) return split_radix_permutation(i, m, inverse)*2;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	62 m >>= 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	63 if(inverse == !(i&m)) return split_radix_permutation(i, m, inverse)*4 + 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	64 else return split_radix_permutation(i, m, inverse)*4 - 1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	65 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	66
10496 74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	67 av_cold void ff_init_ff_cos_tabs(int index)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	68 {
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	69 #if !CONFIG_HARDCODED_TABLES
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	70 int i;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	71 int m = 1<<index;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	72 double freq = 2*M_PI/m;
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	73 FFTSample *tab = ff_cos_tabs[index];
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	74 for(i=0; i<=m/4; i++)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	75 tab[i] = cos(i*freq);
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	76 for(i=1; i<m/4; i++)
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	77 tab[m/2-i] = tab[i];
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	78 #endif
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	79 }
74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	80
8637 3f72756b0c5c Mark ff_fft_init with av_cold. alexc parents: 8636 diff changeset	81 av_cold int ff_fft_init(FFTContext *s, int nbits, int inverse)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	82 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	83 int i, j, m, n;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	84 float alpha, c1, s1, s2;
6503 311c95dddb16 clean up FFT SIMD selection mru parents: 3947 diff changeset	85 int av_unused has_vectors;
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	86
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	87 if (nbits < 2 \|\| nbits > 16)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	88 goto fail;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	89 s->nbits = nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	90 n = 1 << nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	91
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	92 s->tmp_buf = NULL;
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	93 s->exptab = av_malloc((n / 2) * sizeof(FFTComplex));
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	94 if (!s->exptab)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	95 goto fail;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	96 s->revtab = av_malloc(n * sizeof(uint16_t));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	97 if (!s->revtab)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	98 goto fail;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	99 s->inverse = inverse;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	100
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	101 s2 = inverse ? 1.0 : -1.0;
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	102
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	103 s->fft_permute = ff_fft_permute_c;
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	104 s->fft_calc = ff_fft_calc_c;
11122 e45c852b6820 Fix build with --disable-mdct mru parents: 10496 diff changeset	105 #if CONFIG_MDCT
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	106 s->imdct_calc = ff_imdct_calc_c;
d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	107 s->imdct_half = ff_imdct_half_c;
10161 a349795e8dca Prepare for optimised forward MDCT implementations mru parents: 10153 diff changeset	108 s->mdct_calc = ff_mdct_calc_c;
11122 e45c852b6820 Fix build with --disable-mdct mru parents: 10496 diff changeset	109 #endif
8974 d7968d68b2a5 prettyprinting whitespace cosmetics diego parents: 8718 diff changeset	110 s->exptab1 = NULL;
10175 5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	111 s->split_radix = 1;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	112
10175 5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	113 if (ARCH_ARM) ff_fft_init_arm(s);
5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	114 if (HAVE_ALTIVEC) ff_fft_init_altivec(s);
5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	115 if (HAVE_MMX) ff_fft_init_mmx(s);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	116
10175 5cf49858179a Move per-arch fft init bits into the corresponding subdirs mru parents: 10172 diff changeset	117 if (s->split_radix) {
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	118 for(j=4; j<=nbits; j++) {
10496 74b0c1a0851e Add ff_init_ff_cos_tabs function and use it in rdft.c to ensure that the reimar parents: 10492 diff changeset	119 ff_init_ff_cos_tabs(j);
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	120 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	121 for(i=0; i<n; i++)
10172 eda985c53dba ARM: 10l: fix large FFTs mru parents: 10162 diff changeset	122 s->revtab[-split_radix_permutation(i, n, s->inverse) & (n-1)] = i;
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	123 s->tmp_buf = av_malloc(n * sizeof(FFTComplex));
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	124 } else {
6504 978911ca654f indentation mru parents: 6503 diff changeset	125 int np, nblocks, np2, l;
978911ca654f indentation mru parents: 6503 diff changeset	126 FFTComplex *q;
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	127
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	128 for(i=0; i<(n/2); i++) {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	129 alpha = 2 * M_PI * (float)i / (float)n;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	130 c1 = cos(alpha);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	131 s1 = sin(alpha) * s2;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	132 s->exptab[i].re = c1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	133 s->exptab[i].im = s1;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	134 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	135
6504 978911ca654f indentation mru parents: 6503 diff changeset	136 np = 1 << nbits;
978911ca654f indentation mru parents: 6503 diff changeset	137 nblocks = np >> 3;
978911ca654f indentation mru parents: 6503 diff changeset	138 np2 = np >> 1;
978911ca654f indentation mru parents: 6503 diff changeset	139 s->exptab1 = av_malloc(np * 2 * sizeof(FFTComplex));
978911ca654f indentation mru parents: 6503 diff changeset	140 if (!s->exptab1)
978911ca654f indentation mru parents: 6503 diff changeset	141 goto fail;
978911ca654f indentation mru parents: 6503 diff changeset	142 q = s->exptab1;
978911ca654f indentation mru parents: 6503 diff changeset	143 do {
978911ca654f indentation mru parents: 6503 diff changeset	144 for(l = 0; l < np2; l += 2 * nblocks) {
978911ca654f indentation mru parents: 6503 diff changeset	145 *q++ = s->exptab[l];
978911ca654f indentation mru parents: 6503 diff changeset	146 *q++ = s->exptab[l + nblocks];
975 e05d525505c5 fft altivec by Romain Dolbeau - simplified patch, test it on PPC with fft-test and wma decoding bellard parents: 971 diff changeset	147
6504 978911ca654f indentation mru parents: 6503 diff changeset	148 q->re = -s->exptab[l].im;
978911ca654f indentation mru parents: 6503 diff changeset	149 q->im = s->exptab[l].re;
978911ca654f indentation mru parents: 6503 diff changeset	150 q++;
978911ca654f indentation mru parents: 6503 diff changeset	151 q->re = -s->exptab[l + nblocks].im;
978911ca654f indentation mru parents: 6503 diff changeset	152 q->im = s->exptab[l + nblocks].re;
978911ca654f indentation mru parents: 6503 diff changeset	153 q++;
978911ca654f indentation mru parents: 6503 diff changeset	154 }
978911ca654f indentation mru parents: 6503 diff changeset	155 nblocks = nblocks >> 1;
978911ca654f indentation mru parents: 6503 diff changeset	156 } while (nblocks != 0);
978911ca654f indentation mru parents: 6503 diff changeset	157 av_freep(&s->exptab);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	158
7543 f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	159 /* compute bit reverse table */
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	160 for(i=0;i<n;i++) {
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	161 m=0;
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	162 for(j=0;j<nbits;j++) {
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	163 m \|= ((i >> j) & 1) << (nbits-j-1);
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	164 }
f04ff5a6fb55 indent lorenm parents: 7542 diff changeset	165 s->revtab[i]=m;
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	166 }
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	167 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	168
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	169 return 0;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	170 fail:
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	171 av_freep(&s->revtab);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	172 av_freep(&s->exptab);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	173 av_freep(&s->exptab1);
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	174 av_freep(&s->tmp_buf);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	175 return -1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	176 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	177
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	178 void ff_fft_permute_c(FFTContext s, FFTComplex z)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	179 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	180 int j, k, np;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	181 FFTComplex tmp;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	182 const uint16_t *revtab = s->revtab;
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	183 np = 1 << s->nbits;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	184
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	185 if (s->tmp_buf) {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	186 /* TODO: handle split-radix permute in a more optimal way, probably in-place */
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	187 for(j=0;j<np;j++) s->tmp_buf[revtab[j]] = z[j];
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	188 memcpy(z, s->tmp_buf, np * sizeof(FFTComplex));
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	189 return;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	190 }
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	191
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	192 /* reverse */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	193 for(j=0;j<np;j++) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	194 k = revtab[j];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	195 if (k < j) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	196 tmp = z[k];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	197 z[k] = z[j];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	198 z[j] = tmp;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	199 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	200 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	201 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	202
8687 04200b454f3f Mark ff_fft_end av_cold. alexc parents: 8637 diff changeset	203 av_cold void ff_fft_end(FFTContext *s)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	204 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	205 av_freep(&s->revtab);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	206 av_freep(&s->exptab);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	207 av_freep(&s->exptab1);
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	208 av_freep(&s->tmp_buf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	209 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	210
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	211 #define sqrthalf (float)M_SQRT1_2
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	212
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	213 #define BF(x,y,a,b) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	214 x = a - b;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	215 y = a + b;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	216 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	217
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	218 #define BUTTERFLIES(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	219 BF(t3, t5, t5, t1);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	220 BF(a2.re, a0.re, a0.re, t5);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	221 BF(a3.im, a1.im, a1.im, t3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	222 BF(t4, t6, t2, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	223 BF(a3.re, a1.re, a1.re, t4);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	224 BF(a2.im, a0.im, a0.im, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	225 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	226
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	227 // force loading all the inputs before storing any.
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	228 // this is slightly slower for small data, but avoids store->load aliasing
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	229 // for addresses separated by large powers of 2.
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	230 #define BUTTERFLIES_BIG(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	231 FFTSample r0=a0.re, i0=a0.im, r1=a1.re, i1=a1.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	232 BF(t3, t5, t5, t1);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	233 BF(a2.re, a0.re, r0, t5);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	234 BF(a3.im, a1.im, i1, t3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	235 BF(t4, t6, t2, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	236 BF(a3.re, a1.re, r1, t4);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	237 BF(a2.im, a0.im, i0, t6);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	238 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	239
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	240 #define TRANSFORM(a0,a1,a2,a3,wre,wim) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	241 t1 = a2.re * wre + a2.im * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	242 t2 = a2.im * wre - a2.re * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	243 t5 = a3.re * wre - a3.im * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	244 t6 = a3.im * wre + a3.re * wim;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	245 BUTTERFLIES(a0,a1,a2,a3)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	246 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	247
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	248 #define TRANSFORM_ZERO(a0,a1,a2,a3) {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	249 t1 = a2.re;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	250 t2 = a2.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	251 t5 = a3.re;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	252 t6 = a3.im;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	253 BUTTERFLIES(a0,a1,a2,a3)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	254 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	255
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	256 /* z[0...8n-1], w[1...2n-1] */
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	257 #define PASS(name)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	258 static void name(FFTComplex z, const FFTSample wre, unsigned int n)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	259 {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	260 FFTSample t1, t2, t3, t4, t5, t6;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	261 int o1 = 2*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	262 int o2 = 4*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	263 int o3 = 6*n;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	264 const FFTSample *wim = wre+o1;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	265 n--;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	266 \
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	267 TRANSFORM_ZERO(z[0],z[o1],z[o2],z[o3]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	268 TRANSFORM(z[1],z[o1+1],z[o2+1],z[o3+1],wre[1],wim[-1]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	269 do {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	270 z += 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	271 wre += 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	272 wim -= 2;\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	273 TRANSFORM(z[0],z[o1],z[o2],z[o3],wre[0],wim[0]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	274 TRANSFORM(z[1],z[o1+1],z[o2+1],z[o3+1],wre[1],wim[-1]);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	275 } while(--n);\
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	276 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	277
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	278 PASS(pass)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	279 #undef BUTTERFLIES
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	280 #define BUTTERFLIES BUTTERFLIES_BIG
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	281 PASS(pass_big)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	282
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	283 #define DECL_FFT(n,n2,n4)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	284 static void fft##n(FFTComplex *z)\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	285 {\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	286 fft##n2(z);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	287 fft##n4(z+n4*2);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	288 fft##n4(z+n4*3);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	289 pass(z,ff_cos_##n,n4/2);\
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	290 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	291
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	292 static void fft4(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	293 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	294 FFTSample t1, t2, t3, t4, t5, t6, t7, t8;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	295
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	296 BF(t3, t1, z[0].re, z[1].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	297 BF(t8, t6, z[3].re, z[2].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	298 BF(z[2].re, z[0].re, t1, t6);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	299 BF(t4, t2, z[0].im, z[1].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	300 BF(t7, t5, z[2].im, z[3].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	301 BF(z[3].im, z[1].im, t4, t8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	302 BF(z[3].re, z[1].re, t3, t7);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	303 BF(z[2].im, z[0].im, t2, t5);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	304 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	305
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	306 static void fft8(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	307 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	308 FFTSample t1, t2, t3, t4, t5, t6, t7, t8;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	309
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	310 fft4(z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	311
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	312 BF(t1, z[5].re, z[4].re, -z[5].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	313 BF(t2, z[5].im, z[4].im, -z[5].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	314 BF(t3, z[7].re, z[6].re, -z[7].re);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	315 BF(t4, z[7].im, z[6].im, -z[7].im);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	316 BF(t8, t1, t3, t1);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	317 BF(t7, t2, t2, t4);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	318 BF(z[4].re, z[0].re, z[0].re, t1);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	319 BF(z[4].im, z[0].im, z[0].im, t2);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	320 BF(z[6].re, z[2].re, z[2].re, t7);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	321 BF(z[6].im, z[2].im, z[2].im, t8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	322
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	323 TRANSFORM(z[1],z[3],z[5],z[7],sqrthalf,sqrthalf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	324 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	325
8590 7a463923ecd1 Change semantic of CONFIG_, HAVE_ and ARCH_. aurel* parents: 8104 diff changeset	326 #if !CONFIG_SMALL
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	327 static void fft16(FFTComplex *z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	328 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	329 FFTSample t1, t2, t3, t4, t5, t6;
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	330
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	331 fft8(z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	332 fft4(z+8);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	333 fft4(z+12);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	334
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	335 TRANSFORM_ZERO(z[0],z[4],z[8],z[12]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	336 TRANSFORM(z[2],z[6],z[10],z[14],sqrthalf,sqrthalf);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	337 TRANSFORM(z[1],z[5],z[9],z[13],ff_cos_16[1],ff_cos_16[3]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	338 TRANSFORM(z[3],z[7],z[11],z[15],ff_cos_16[3],ff_cos_16[1]);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	339 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	340 #else
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	341 DECL_FFT(16,8,4)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	342 #endif
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	343 DECL_FFT(32,16,8)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	344 DECL_FFT(64,32,16)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	345 DECL_FFT(128,64,32)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	346 DECL_FFT(256,128,64)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	347 DECL_FFT(512,256,128)
8590 7a463923ecd1 Change semantic of CONFIG_, HAVE_ and ARCH_. aurel* parents: 8104 diff changeset	348 #if !CONFIG_SMALL
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	349 #define pass pass_big
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	350 #endif
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	351 DECL_FFT(1024,512,256)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	352 DECL_FFT(2048,1024,512)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	353 DECL_FFT(4096,2048,1024)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	354 DECL_FFT(8192,4096,2048)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	355 DECL_FFT(16384,8192,4096)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	356 DECL_FFT(32768,16384,8192)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	357 DECL_FFT(65536,32768,16384)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	358
10391 74715d4288ad fft_dispatch array should be const reimar parents: 10175 diff changeset	359 static void (* const fft_dispatch[])(FFTComplex*) = {
7542 a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	360 fft4, fft8, fft16, fft32, fft64, fft128, fft256, fft512, fft1024,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	361 fft2048, fft4096, fft8192, fft16384, fft32768, fft65536,
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	362 };
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	363
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	364 void ff_fft_calc_c(FFTContext s, FFTComplex z)
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	365 {
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	366 fft_dispatch[s->nbits-2](z);
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	367 }
a8a8205a9081 split-radix FFT lorenm parents: 7263 diff changeset	368

Mercurial > libavcodec.hg

annotate fft.c @ 11980:263b4ef7ad87 libavcodec