libavcodec.hg: mdct.c annotate

annotate mdct.c @ 5729:81fff8db79cc libavcodec

2.5x faster compute_autocorr() overall flac encoding: 15-50% faster on core2, 8-30% on k8, 2-20% on p4 (depending on compression_level)

author	lorenm
date	Fri, 28 Sep 2007 06:06:18 +0000
parents	c8c591fe26f8
children	5077d1562573

rev	line source
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	1 /*
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	2 * MDCT/IMDCT transforms
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	3 * Copyright (c) 2002 Fabrice Bellard.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	4 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3036 diff changeset	5 * This file is part of FFmpeg.
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3036 diff changeset	6 *
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3036 diff changeset	7 * FFmpeg is free software; you can redistribute it and/or
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	8 * modify it under the terms of the GNU Lesser General Public
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	9 * License as published by the Free Software Foundation; either
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3036 diff changeset	10 * version 2.1 of the License, or (at your option) any later version.
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	11 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3036 diff changeset	12 * FFmpeg is distributed in the hope that it will be useful,
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	13 * but WITHOUT ANY WARRANTY; without even the implied warranty of
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	14 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	15 * Lesser General Public License for more details.
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	16 *
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	17 * You should have received a copy of the GNU Lesser General Public
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3036 diff changeset	18 * License along with FFmpeg; if not, write to the Free Software
3036 0b546eab515d Update licensing information: The FSF changed postal address. diego parents: 2967 diff changeset	19 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	20 */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	21 #include "dsputil.h"
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	22
1106 1e39f273ecd6 per file doxy michaelni parents: 970 diff changeset	23 /**
1e39f273ecd6 per file doxy michaelni parents: 970 diff changeset	24 * @file mdct.c
1e39f273ecd6 per file doxy michaelni parents: 970 diff changeset	25 * MDCT/IMDCT transforms.
1e39f273ecd6 per file doxy michaelni parents: 970 diff changeset	26 */
1e39f273ecd6 per file doxy michaelni parents: 970 diff changeset	27
1e39f273ecd6 per file doxy michaelni parents: 970 diff changeset	28 /**
1e39f273ecd6 per file doxy michaelni parents: 970 diff changeset	29 * init MDCT or IMDCT computation.
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	30 */
794 670009af4fc2 avoid name clash bellard parents: 781 diff changeset	31 int ff_mdct_init(MDCTContext *s, int nbits, int inverse)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	32 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	33 int n, n4, i;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	34 float alpha;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	35
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	36 memset(s, 0, sizeof(*s));
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	37 n = 1 << nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	38 s->nbits = nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	39 s->n = n;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	40 n4 = n >> 2;
970 a521e0ecc5a8 use av_malloc instead of malloc bellard parents: 794 diff changeset	41 s->tcos = av_malloc(n4 * sizeof(FFTSample));
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	42 if (!s->tcos)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	43 goto fail;
970 a521e0ecc5a8 use av_malloc instead of malloc bellard parents: 794 diff changeset	44 s->tsin = av_malloc(n4 * sizeof(FFTSample));
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	45 if (!s->tsin)
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	46 goto fail;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	47
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	48 for(i=0;i<n4;i++) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	49 alpha = 2 * M_PI * (i + 1.0 / 8.0) / n;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	50 s->tcos[i] = -cos(alpha);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	51 s->tsin[i] = -sin(alpha);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	52 }
1879 dd63cb7e5080 fft_() renamed into ff_fft_() patch by (Gildas Bazin <gbazin at altern dot org>) michael parents: 1106 diff changeset	53 if (ff_fft_init(&s->fft, s->nbits - 2, inverse) < 0)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	54 goto fail;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	55 return 0;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	56 fail:
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	57 av_freep(&s->tcos);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	58 av_freep(&s->tsin);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	59 return -1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	60 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	61
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	62 /* complex multiplication: p = a * b */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	63 #define CMUL(pre, pim, are, aim, bre, bim) \
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	64 {\
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	65 float _are = (are);\
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	66 float _aim = (aim);\
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	67 float _bre = (bre);\
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	68 float _bim = (bim);\
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	69 (pre) = _are * _bre - _aim * _bim;\
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	70 (pim) = _are * _bim + _aim * _bre;\
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	71 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	72
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	73 /**
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	74 * Compute inverse MDCT of size N = 2^nbits
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	75 * @param output N samples
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	76 * @param input N/2 samples
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	77 * @param tmp N/2 samples
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	78 */
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	79 void ff_imdct_calc(MDCTContext s, FFTSample output,
794 670009af4fc2 avoid name clash bellard parents: 781 diff changeset	80 const FFTSample input, FFTSample tmp)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	81 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	82 int k, n8, n4, n2, n, j;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	83 const uint16_t *revtab = s->fft.revtab;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	84 const FFTSample *tcos = s->tcos;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	85 const FFTSample *tsin = s->tsin;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	86 const FFTSample in1, in2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	87 FFTComplex z = (FFTComplex )tmp;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	88
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	89 n = 1 << s->nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	90 n2 = n >> 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	91 n4 = n >> 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	92 n8 = n >> 3;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	93
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	94 /* pre rotation */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	95 in1 = input;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	96 in2 = input + n2 - 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	97 for(k = 0; k < n4; k++) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	98 j=revtab[k];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	99 CMUL(z[j].re, z[j].im, in2, in1, tcos[k], tsin[k]);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	100 in1 += 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	101 in2 -= 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	102 }
1879 dd63cb7e5080 fft_() renamed into ff_fft_() patch by (Gildas Bazin <gbazin at altern dot org>) michael parents: 1106 diff changeset	103 ff_fft_calc(&s->fft, z);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	104
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	105 /* post rotation + reordering */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	106 /* XXX: optimize */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	107 for(k = 0; k < n4; k++) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	108 CMUL(z[k].re, z[k].im, z[k].re, z[k].im, tcos[k], tsin[k]);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	109 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	110 for(k = 0; k < n8; k++) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	111 output[2*k] = -z[n8 + k].im;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	112 output[n2-1-2*k] = z[n8 + k].im;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	113
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	114 output[2*k+1] = z[n8-1-k].re;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	115 output[n2-1-2*k-1] = -z[n8-1-k].re;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	116
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	117 output[n2 + 2*k]=-z[k+n8].re;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	118 output[n-1- 2*k]=-z[k+n8].re;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	119
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	120 output[n2 + 2*k+1]=z[n8-k-1].im;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	121 output[n-2 - 2 * k] = z[n8-k-1].im;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	122 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	123 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	124
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	125 /**
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	126 * Compute MDCT of size N = 2^nbits
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	127 * @param input N samples
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	128 * @param out N/2 samples
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	129 * @param tmp temporary storage of N/2 samples
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	130 */
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	131 void ff_mdct_calc(MDCTContext s, FFTSample out,
794 670009af4fc2 avoid name clash bellard parents: 781 diff changeset	132 const FFTSample input, FFTSample tmp)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	133 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	134 int i, j, n, n8, n4, n2, n3;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	135 FFTSample re, im, re1, im1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	136 const uint16_t *revtab = s->fft.revtab;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	137 const FFTSample *tcos = s->tcos;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	138 const FFTSample *tsin = s->tsin;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	139 FFTComplex x = (FFTComplex )tmp;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	140
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	141 n = 1 << s->nbits;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	142 n2 = n >> 1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	143 n4 = n >> 2;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	144 n8 = n >> 3;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	145 n3 = 3 * n4;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	146
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	147 /* pre rotation */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	148 for(i=0;i<n8;i++) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	149 re = -input[2i+3n4] - input[n3-1-2*i];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	150 im = -input[n4+2i] + input[n4-1-2i];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	151 j = revtab[i];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	152 CMUL(x[j].re, x[j].im, re, im, -tcos[i], tsin[i]);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	153
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	154 re = input[2i] - input[n2-1-2i];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	155 im = -(input[n2+2i] + input[n-1-2i]);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	156 j = revtab[n8 + i];
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	157 CMUL(x[j].re, x[j].im, re, im, -tcos[n8 + i], tsin[n8 + i]);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	158 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	159
1879 dd63cb7e5080 fft_() renamed into ff_fft_() patch by (Gildas Bazin <gbazin at altern dot org>) michael parents: 1106 diff changeset	160 ff_fft_calc(&s->fft, x);
2967 ef2149182f1c COSMETICS: Remove all trailing whitespace. diego parents: 1879 diff changeset	161
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	162 /* post rotation */
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	163 for(i=0;i<n4;i++) {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	164 re = x[i].re;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	165 im = x[i].im;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	166 CMUL(re1, im1, re, im, -tsin[i], -tcos[i]);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	167 out[2*i] = im1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	168 out[n2-1-2*i] = re1;
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	169 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	170 }
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	171
794 670009af4fc2 avoid name clash bellard parents: 781 diff changeset	172 void ff_mdct_end(MDCTContext *s)
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	173 {
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	174 av_freep(&s->tcos);
6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	175 av_freep(&s->tsin);
1879 dd63cb7e5080 fft_() renamed into ff_fft_() patch by (Gildas Bazin <gbazin at altern dot org>) michael parents: 1106 diff changeset	176 ff_fft_end(&s->fft);
781 6f5e87957bcb new generic FFT/MDCT code for audio codecs bellard parents: diff changeset	177 }

Mercurial > libavcodec.hg

annotate mdct.c @ 5729:81fff8db79cc libavcodec