libavcodec.hg: h264.c comparison

comparison h264.c @ 1184:05a2ac8978ad libavcodec

faster 8x8 & 16x16 plane prediction by skal (massimin at planet-d dot net)

author	michaelni
date	Sat, 12 Apr 2003 22:49:54 +0000
parents	fea03d2c4946
children	f3c659bfdb8e

comparison

equal deleted inserted replaced

-:03b97d87dcdd
+:05a2ac8978ad
 ((uint32_t*)(src+i*stride))[3]= 0x01010101U*128U;
 }
 }
 static void pred16x16_plane_c(uint8_t *src, int stride){
-uint8_t *cm = cropTbl + MAX_NEG_CROP;
+int i, j, k;
-int i, dx, dy, dc;
+int a;
-int temp[16];
+uint8_t *cm = cropTbl + MAX_NEG_CROP;
+const uint8_t * const src0 = src+7-stride;
-dc= 16*(src[15-stride] + src[-1+15*stride]);
+const uint8_t *src1 = src+8*stride-1;
+const uint8_t *src2 = src1-2*stride;      // == src+6*stride-1;
-dx=dy=0;
+int H = src0[1] - src0[-1];
-for(i=1; i<9; i++){
+int V = src1[0] - src2[ 0];
-dx += i*(src[7+i-stride] - src[7-i-stride]);
+for(k=2; k<=8; ++k) {
-dy += i*(src[-1+(7+i)*stride] - src[-1+(7-i)*stride]);
+src1 += stride; src2 -= stride;
-}
+H += k*(src0[k] - src0[-k]);
-dx= (5*dx+32)>>6;
+V += k*(src1[0] - src2[ 0]);
-dy= (5*dy+32)>>6;
+}
+H = ( 5*H+32 ) >> 6;
-dc += 16;
+V = ( 5*V+32 ) >> 6;
-//FIXME modifiy dc,dx,dy to avoid -7
+a = 16*(src1[0] + src2[16] + 1) - 7*(V+H);
+for(j=16; j>0; --j) {
-for(i=0; i<16; i++)
+int b = a;
-temp[i]= dx*(i-7) + dc;
+a += V;
+for(i=-16; i<0; i+=4) {
-if(   (dc - ABS(dx)*8 - ABS(dy)*8)>>5 < 0
+src[16+i] = cm[ (b    ) >> 5 ];
-|| (dc + ABS(dx)*8 + ABS(dy)*8)>>5 > 255){
+src[17+i] = cm[ (b+  H) >> 5 ];
+src[18+i] = cm[ (b+2*H) >> 5 ];
-for(i=0; i<16; i++){
+src[19+i] = cm[ (b+3*H) >> 5 ];
-int j;
+b += 4*H;
-for(j=0; j<16; j++)
+}
-src[j + i*stride]= cm[ (temp[j] + dy*(i-7))>>5 ];
+src += stride;
 }
-}else{
-for(i=0; i<16; i++){
-int j;
-for(j=0; j<16; j++)
-src[j + i*stride]= (temp[j] + dy*(i-7))>>5;
-}
-}
 }
 static void pred8x8_vertical_c(uint8_t *src, int stride){
 int i;
 const uint32_t a= ((uint32_t*)(src-stride))[0];
 ((uint32_t*)(src+i*stride))[1]= dc3;
 }
 }
 static void pred8x8_plane_c(uint8_t *src, int stride){
-uint8_t *cm = cropTbl + MAX_NEG_CROP;
+int j, k;
-int i, dx, dy, dc;
+int a;
-int temp[8];
+uint8_t *cm = cropTbl + MAX_NEG_CROP;
+const uint8_t * const src0 = src+3-stride;
-dc= 16*(src[7-stride] + src[-1+7*stride]);
+const uint8_t *src1 = src+4*stride-1;
+const uint8_t *src2 = src1-2*stride;      // == src+2*stride-1;
-dx=dy=0;
+int H = src0[1] - src0[-1];
-for(i=1; i<5; i++){
+int V = src1[0] - src2[ 0];
-dx += i*(src[3+i-stride] - src[3-i-stride]);
+for(k=2; k<=4; ++k) {
-dy += i*(src[-1+(3+i)*stride] - src[-1+(3-i)*stride]);
+src1 += stride; src2 -= stride;
-}
+H += k*(src0[k] - src0[-k]);
-dx= (17*dx+16)>>5;
+V += k*(src1[0] - src2[ 0]);
-dy= (17*dy+16)>>5;
+}
+H = ( 17*H+16 ) >> 5;
-dc += 16;
+V = ( 17*V+16 ) >> 5;
-//FIXME modifiy dc,dx,dy to avoid -3
+a = 16*(src1[0] + src2[8]+1) - 3*(V+H);
+for(j=8; j>0; --j) {
-for(i=0; i<8; i++)
+int b = a;
-temp[i]= dx*(i-3) + dc;
+a += V;
+src[0] = cm[ (b    ) >> 5 ];
-if(   (dc - ABS(dx)*4 - ABS(dy)*4)>>5 < 0
+src[1] = cm[ (b+  H) >> 5 ];
-|| (dc + ABS(dx)*4 + ABS(dy)*4)>>5 > 255){
+src[2] = cm[ (b+2*H) >> 5 ];
+src[3] = cm[ (b+3*H) >> 5 ];
-for(i=0; i<8; i++){
+src[4] = cm[ (b+4*H) >> 5 ];
-int j;
+src[5] = cm[ (b+5*H) >> 5 ];
-for(j=0; j<8; j++)
+src[6] = cm[ (b+6*H) >> 5 ];
-src[j + i*stride]= cm[ (temp[j] + dy*(i-3))>>5 ];
+src[7] = cm[ (b+7*H) >> 5 ];
-}
+src += stride;
-}else{
+}
-for(i=0; i<8; i++){
-int j;
-for(j=0; j<8; j++)
-src[j + i*stride]= (temp[j] + dy*(i-3))>>5;
-}
-}
 }
 static inline void mc_dir_part(H264Context *h, Picture *pic, int n, int square, int chroma_height, int delta, int list,
 uint8_t *dest_y, uint8_t *dest_cb, uint8_t *dest_cr,
 int src_x_offset, int src_y_offset,

Mercurial > libavcodec.hg

comparison h264.c @ 1184:05a2ac8978ad libavcodec