libavcodec.hg: dca.c comparison

comparison dca.c @ 11625:1492bdc1d9d0 libavcodec

DCA: optimise dca_subsubframe() 8% faster overall on Cortex-A8.

author	mru
date	Tue, 13 Apr 2010 10:15:00 +0000
parents	bb17732c00ef
children	4c120a633832

comparison

equal deleted inserted replaced

-:a01c36c52702
+:1492bdc1d9d0
 int subsubframe = s->current_subsubframe;
 const float *quant_step_table;
 /* FIXME */
-float subband_samples[DCA_PRIM_CHANNELS_MAX][DCA_SUBBANDS][8];
+LOCAL_ALIGNED_16(float, subband_samples, [DCA_PRIM_CHANNELS_MAX], [DCA_SUBBANDS][8]);
+LOCAL_ALIGNED_16(int, block, [8]);
 /*
 * Audio data
 */
 /* Select the mid-tread linear quantizer */
 int abits = s->bitalloc[k][l];
 float quant_step_size = quant_step_table[abits];
-float rscale;
 /*
 * Determine quantization index code book and its type
 */
 /*
 * Extract bits from the bit stream
 */
 if(!abits){
 memset(subband_samples[k][l], 0, 8 * sizeof(subband_samples[0][0][0]));
-}else if(abits >= 11 || !dca_smpl_bitalloc[abits].vlc[sel].table){
+} else {
+/* Deal with transients */
+int sfi = s->transition_mode[k][l] && subsubframe >= s->transition_mode[k][l];
+float rscale = quant_step_size * s->scale_factor[k][l][sfi] * s->scalefactor_adj[k][sel];
+if(abits >= 11 || !dca_smpl_bitalloc[abits].vlc[sel].table){
 if(abits <= 7){
 /* Block code */
 int block_code1, block_code2, size, levels;
-int block[8];
 size = abits_sizes[abits-1];
 levels = abits_levels[abits-1];
 block_code1 = get_bits(&s->gb, size);
 /* FIXME Should test return value */
 decode_blockcode(block_code1, levels, block);
 block_code2 = get_bits(&s->gb, size);
 decode_blockcode(block_code2, levels, &block[4]);
-for (m = 0; m < 8; m++)
-subband_samples[k][l][m] = block[m];
 }else{
 /* no coding */
 for (m = 0; m < 8; m++)
-subband_samples[k][l][m] = get_sbits(&s->gb, abits - 3);
+block[m] = get_sbits(&s->gb, abits - 3);
 }
 }else{
 /* Huffman coded */
 for (m = 0; m < 8; m++)
-subband_samples[k][l][m] = get_bitalloc(&s->gb, &dca_smpl_bitalloc[abits], sel);
+block[m] = get_bitalloc(&s->gb, &dca_smpl_bitalloc[abits], sel);
 }
-/* Deal with transients */
+s->dsp.int32_to_float_fmul_scalar(subband_samples[k][l],
-if (s->transition_mode[k][l] &&
+block, rscale, 8);
-subsubframe >= s->transition_mode[k][l])
+}
-rscale = quant_step_size * s->scale_factor[k][l][1];
-else
-rscale = quant_step_size * s->scale_factor[k][l][0];
-rscale *= s->scalefactor_adj[k][sel];
-for (m = 0; m < 8; m++)
-subband_samples[k][l][m] *= rscale;
 /*
 * Inverse ADPCM if in prediction mode
 */
 if (s->prediction_mode[k][l]) {

Mercurial > libavcodec.hg

comparison dca.c @ 11625:1492bdc1d9d0 libavcodec