libavcodec.hg: arm/h264dsp_neon.S comparison

comparison arm/h264dsp_neon.S @ 8626:8d425ee85ddb libavcodec

ARM: simplify ff_put/avg_h264_chroma_mc4/8_neon definitions, no code change

author	mru
date	Sun, 18 Jan 2009 20:43:11 +0000
parents	9281a8a9387a
children	23f7711e777e

comparison

equal deleted inserted replaced

-:6f1b210e58d1
+:8d425ee85ddb
 vtrn.16         \r4, \r5
 vtrn.16         \r6, \r7
 .endm
 /* chroma_mc8(uint8_t *dst, uint8_t *src, int stride, int h, int x, int y) */
-.macro  h264_chroma_mc8 avg=0
+.macro  h264_chroma_mc8 type
+function ff_\type\()_h264_chroma_mc8_neon, export=1
 push            {r4-r7, lr}
 ldrd            r4,  [sp, #20]
-.if \avg
+.ifc \type,avg
 mov             lr,  r0
 .endif
 pld             [r1]
 pld             [r1, r2]
 vmlal.u8        q9,  d5,  d3
 vrshrn.u16      d16, q8,  #6
 vld1.64         {d6, d7}, [r5], r4
 pld             [r1]
 vrshrn.u16      d17, q9,  #6
-.if \avg
+.ifc \type,avg
 vld1.64         {d20}, [lr,:64], r2
 vld1.64         {d21}, [lr,:64], r2
 vrhadd.u8       q8,  q8,  q10
 .endif
 vext.8          d7,  d6,  d7,  #1
 vmull.u8        q9,  d6,  d0
 vmlal.u8        q9,  d4,  d1
 vld1.64         {d6}, [r5], r4
 vrshrn.u16      d16, q8,  #6
 vrshrn.u16      d17, q9,  #6
-.if \avg
+.ifc \type,avg
 vld1.64         {d20}, [lr,:64], r2
 vld1.64         {d21}, [lr,:64], r2
 vrhadd.u8       q8,  q8,  q10
 .endif
 subs            r3,  r3,  #2
 vmlal.u8        q9,  d7,  d1
 pld             [r1]
 vext.8          d5,  d4,  d5,  #1
 vrshrn.u16      d16, q8,  #6
 vrshrn.u16      d17, q9,  #6
-.if \avg
+.ifc \type,avg
 vld1.64         {d20}, [lr,:64], r2
 vld1.64         {d21}, [lr,:64], r2
 vrhadd.u8       q8,  q8,  q10
 .endif
 vld1.64         {d6, d7}, [r1], r2
 vst1.64         {d16}, [r0,:64], r2
 vst1.64         {d17}, [r0,:64], r2
 bgt             5b
 pop             {r4-r7, pc}
+.endfunc
 .endm
 /* chroma_mc4(uint8_t *dst, uint8_t *src, int stride, int h, int x, int y) */
-.macro  h264_chroma_mc4 avg=0
+.macro  h264_chroma_mc4 type
+function ff_\type\()_h264_chroma_mc4_neon, export=1
 push            {r4-r7, lr}
 ldrd            r4,  [sp, #20]
-.if \avg
+.ifc \type,avg
 mov             lr,  r0
 .endif
 pld             [r1]
 pld             [r1, r2]
 vadd.i16        d16, d16, d17
 vadd.i16        d17, d18, d19
 vrshrn.u16      d16, q8,  #6
 subs            r3,  r3,  #2
 pld             [r1]
-.if \avg
+.ifc \type,avg
 vld1.32         {d20[0]}, [lr,:32], r2
 vld1.32         {d20[1]}, [lr,:32], r2
 vrhadd.u8       d16, d16, d20
 .endif
 vext.8          d7,  d6,  d7,  #1
 vmull.u8        q9,  d4,  d1
 vld1.32         {d4[1]},  [r5], r4
 vadd.i16        d16, d16, d17
 vadd.i16        d17, d18, d19
 vrshrn.u16      d16, q8,  #6
-.if \avg
+.ifc \type,avg
 vld1.32         {d20[0]}, [lr,:32], r2
 vld1.32         {d20[1]}, [lr,:32], r2
 vrhadd.u8       d16, d16, d20
 .endif
 subs            r3,  r3,  #2
 vtrn.32         d4,  d5
 vadd.i16        d16, d16, d17
 vadd.i16        d17, d18, d19
 pld             [r1]
 vrshrn.u16      d16, q8,  #6
-.if \avg
+.ifc \type,avg
 vld1.32         {d20[0]}, [lr,:32], r2
 vld1.32         {d20[1]}, [lr,:32], r2
 vrhadd.u8       d16, d16, d20
 .endif
 vld1.64         {d6},     [r1], r2
 vst1.32         {d16[0]}, [r0,:32], r2
 vst1.32         {d16[1]}, [r0,:32], r2
 bgt             5b
 pop             {r4-r7, pc}
+.endfunc
 .endm
 .text
 .align
-function ff_put_h264_chroma_mc8_neon, export=1
+h264_chroma_mc8 put
-h264_chroma_mc8
+h264_chroma_mc8 avg
-.endfunc
+h264_chroma_mc4 put
+h264_chroma_mc4 avg
-function ff_avg_h264_chroma_mc8_neon, export=1
-h264_chroma_mc8 avg=1
-.endfunc
-function ff_put_h264_chroma_mc4_neon, export=1
-h264_chroma_mc4
-.endfunc
-function ff_avg_h264_chroma_mc4_neon, export=1
-h264_chroma_mc4 avg=1
-.endfunc
 /* H.264 loop filter */
 .macro h264_loop_filter_start
 ldr             ip,  [sp]

Mercurial > libavcodec.hg

comparison arm/h264dsp_neon.S @ 8626:8d425ee85ddb libavcodec