libavcodec.hg: ppc/h264_altivec.c comparison

comparison ppc/h264_altivec.c @ 5159:883a5619f52f libavcodec

Use a faster way to compute 255-val: Instead of creating a vector of all 255s, and then doing the subtraction, nor of the vector with itself: saves one instruction and a register. Patch by Graham Booker % gbooker A tamu P edu%

author	gpoirier
date	Sat, 16 Jun 2007 18:59:10 +0000
parents	68d85146620a
children	830b9dd36fef

comparison

equal deleted inserted replaced

-:65b1bfb3a74c
+:883a5619f52f
 #define h264_deblock_p0_q0(p0, p1, q0, q1, tc0masked) {                                           \
 \
 const vector unsigned char A0v = vec_sl(vec_splat_u8(10), vec_splat_u8(4));                   \
 \
 register vector unsigned char pq0bit = vec_xor(p0,q0);                                        \
-register vector unsigned char temp;                                                           \
 register vector unsigned char q1minus;                                                        \
 register vector unsigned char p0minus;                                                        \
 register vector unsigned char stage1;                                                         \
 register vector unsigned char stage2;                                                         \
 register vector unsigned char vec160;                                                         \
 register vector unsigned char delta;                                                          \
 register vector unsigned char deltaneg;                                                       \
 \
-temp = (vector unsigned char)vec_cmpeq(p0, p0);                                               \
+q1minus = vec_nor(q1, q1);                 /* 255 - q1 */                                     \
-q1minus = vec_xor(temp, q1);               /* 255 - q1 */                                     \
 stage1 = vec_avg(p1, q1minus);             /* (p1 - q1 + 256)>>1 */                           \
 stage2 = vec_sr(stage1, vec_splat_u8(1));  /* (p1 - q1 + 256)>>2 = 64 + (p1 - q1) >> 2 */     \
-p0minus = vec_xor(temp, p0);               /* 255 - p0 */                                     \
+p0minus = vec_nor(p0, p0);                 /* 255 - p0 */                                     \
 stage1 = vec_avg(q0, p0minus);             /* (q0 - p0 + 256)>>1 */                           \
 pq0bit = vec_and(pq0bit, vec_splat_u8(1));                                                    \
 stage2 = vec_avg(stage2, pq0bit);          /* 32 + ((q0 - p0)&1 + (p1 - q1) >> 2 + 1) >> 1 */ \
 stage2 = vec_adds(stage2, stage1);         /* 160 + ((p0 - q0) + (p1 - q1) >> 2 + 1) >> 1 */  \
 vec160 = vec_ld(0, &A0v);                                                                     \

Mercurial > libavcodec.hg

comparison ppc/h264_altivec.c @ 5159:883a5619f52f libavcodec