libavcodec.hg: arm/dsputil_neon.S comparison

comparison arm/dsputil_neon.S @ 11443:361a5fcb4393 libavcodec

ARM: set size of asm functions in object files

author	mru
date	Tue, 09 Mar 2010 16:17:56 +0000
parents	5c5b864d66e1
children	659f16d04776

comparison

equal deleted inserted replaced

-:fe32d9ba1c86
+:361a5fcb4393
 .endm
 .macro pixfunc pfx name suf rnd_op args:vararg
 function ff_\pfx\name\suf\()_neon, export=1
 \name \rnd_op \args
-.endfunc
+endfunc
 .endm
 .macro pixfunc2 pfx name args:vararg
 pixfunc \pfx \name
 pixfunc \pfx \name \args
 .endm
 function ff_put_h264_qpel16_mc00_neon, export=1
 mov             r3,  #16
-.endfunc
+endfunc
 pixfunc  put_ pixels16
 pixfunc2 put_ pixels16_x2,  _no_rnd, vhadd.u8
 pixfunc2 put_ pixels16_y2,  _no_rnd, vhadd.u8
 pixfunc2 put_ pixels16_xy2, _no_rnd, vshrn.u16, 1
 function ff_avg_h264_qpel16_mc00_neon, export=1
 mov             r3,  #16
-.endfunc
+endfunc
 pixfunc  avg_ pixels16,, 1
 function ff_put_h264_qpel8_mc00_neon, export=1
 mov             r3,  #8
-.endfunc
+endfunc
 pixfunc  put_ pixels8
 pixfunc2 put_ pixels8_x2,   _no_rnd, vhadd.u8
 pixfunc2 put_ pixels8_y2,   _no_rnd, vhadd.u8
 pixfunc2 put_ pixels8_xy2,  _no_rnd, vshrn.u16, 1
 function ff_avg_h264_qpel8_mc00_neon, export=1
 mov             r3,  #8
-.endfunc
+endfunc
 pixfunc  avg_ pixels8,, 1
 function ff_put_pixels_clamped_neon, export=1
 vld1.64         {d16-d19}, [r0,:128]!
 vst1.64         {d4},      [r1,:64], r2
 vst1.64         {d5},      [r1,:64], r2
 vst1.64         {d6},      [r1,:64], r2
 vst1.64         {d7},      [r1,:64], r2
 bx              lr
-.endfunc
+endfunc
 function ff_put_signed_pixels_clamped_neon, export=1
 vmov.u8         d31, #128
 vld1.64         {d16-d17}, [r0,:128]!
 vqmovn.s16      d0, q8
 vadd.u8         d6, d6, d31
 vadd.u8         d7, d7, d31
 vst1.64         {d6},      [r1,:64], r2
 vst1.64         {d7},      [r1,:64], r2
 bx              lr
-.endfunc
+endfunc
 function ff_add_pixels_clamped_neon, export=1
 mov             r3, r1
 vld1.64         {d16},   [r1,:64], r2
 vld1.64         {d0-d1}, [r0,:128]!
 vst1.64         {d2},    [r3,:64], r2
 vqmovun.s16     d6, q3
 vst1.64         {d4},    [r3,:64], r2
 vst1.64         {d6},    [r3,:64], r2
 bx              lr
-.endfunc
+endfunc
 function ff_float_to_int16_neon, export=1
 subs            r2,  r2,  #8
 vld1.64         {d0-d1},  [r1,:128]!
 vcvt.s32.f32    q8,  q0,  #16
 bx              lr
 3:      vshrn.s32       d4,  q8,  #16
 vshrn.s32       d5,  q9,  #16
 vst1.64         {d4-d5},  [r0,:128]!
 bx              lr
-.endfunc
+endfunc
 function ff_float_to_int16_interleave_neon, export=1
 cmp             r3, #2
 ldrlt           r1, [r1]
 blt             ff_float_to_int16_neon
 vld1.64         {d0-d1},  [r4,:128]!
 vcvt.s32.f32    q0,  q0,  #16
 vld1.64         {d2-d3},  [r4,:128]!
 vcvt.s32.f32    q1,  q1,  #16
 b               6b
-.endfunc
+endfunc
 function ff_vector_fmul_neon, export=1
 mov             r3,  r0
 subs            r2,  r2,  #8
 vld1.64         {d0-d3},  [r0,:128]!
 vld1.64         {d6-d7},  [r1,:128]!
 vst1.64         {d18-d19},[r3,:128]!
 vmul.f32        q9,  q1,  q3
 3:      vst1.64         {d16-d19},[r3,:128]!
 bx              lr
-.endfunc
+endfunc
 function ff_vector_fmul_window_neon, export=1
 VFP     vdup.32         q8,  d0[0]
 NOVFP   vld1.32         {d16[],d17[]}, [sp,:32]
 push            {r4,r5,lr}
 vrev64.32       q11, q11
 vswp            d22, d23
 vst1.64         {d20,d21},[r0,:128]!
 vst1.64         {d22,d23},[ip,:128], r5
 pop             {r4,r5,pc}
-.endfunc
+endfunc
 #if CONFIG_VORBIS_DECODER
 function ff_vorbis_inverse_coupling_neon, export=1
 vmov.i32        q10, #1<<31
 subs            r2,  r2,  #4
 vadd.f32        q1,  q0,  q2
 vsub.f32        q0,  q0,  q3
 vst1.32         {d2-d3},  [r0,:128]!
 vst1.32         {d0-d1},  [r1,:128]!
 bx              lr
-.endfunc
+endfunc
 #endif
 function ff_vector_fmul_scalar_neon, export=1
 VFP     len .req r2
 NOVFP   len .req r3
 vst1.32         {q0},[r0,:128]!
 subs            len, len, #4
 bgt             3b
 bx              lr
 .unreq          len
-.endfunc
+endfunc
 function ff_vector_fmul_sv_scalar_2_neon, export=1
 VFP     vdup.32         d16, d0[0]
 NOVFP   vdup.32         d16, r3
 NOVFP   ldr             r3,  [sp]
 vst1.32         {d5},[r0,:64]!
 b               1b
 2:      vst1.32         {d4},[r0,:64]!
 vst1.32         {d5},[r0,:64]!
 bx              lr
-.endfunc
+endfunc
 function ff_vector_fmul_sv_scalar_4_neon, export=1
 VFP     vdup.32         q10, d0[0]
 NOVFP   vdup.32         q10, r3
 NOVFP   ldr             r3,  [sp]
 vmul.f32        q0,  q0,  q1
 vst1.32         {q0},[r0,:128]!
 subs            r3,  r3,  #4
 bgt             3b
 pop             {pc}
-.endfunc
+endfunc
 function ff_sv_fmul_scalar_2_neon, export=1
 VFP     len .req r2
 NOVFP   len .req r3
 VFP     vdup.32         q8,  d0[0]
 vst1.32         {q1},[r0,:128]!
 b               1b
 2:      vst1.32         {q1},[r0,:128]!
 bx              lr
 .unreq          len
-.endfunc
+endfunc
 function ff_sv_fmul_scalar_4_neon, export=1
 VFP     len .req r2
 NOVFP   len .req r3
 VFP     vdup.32         q8,  d0[0]
 vst1.32         {q0},[r0,:128]!
 subs            len, len, #4
 bgt             1b
 bx              lr
 .unreq          len
-.endfunc
+endfunc
 function ff_butterflies_float_neon, export=1
 1:      vld1.32         {q0},[r0,:128]
 vld1.32         {q1},[r1,:128]
 vsub.f32        q2,  q0,  q1
 vst1.32         {q2},[r1,:128]!
 vst1.32         {q1},[r0,:128]!
 subs            r2,  r2,  #4
 bgt             1b
 bx              lr
-.endfunc
+endfunc
 function ff_scalarproduct_float_neon, export=1
 vmov.f32        q2,  #0.0
 1:      vld1.32         {q0},[r0,:128]!
 vld1.32         {q1},[r1,:128]!
 bgt             1b
 vadd.f32        d0,  d4,  d5
 vpadd.f32       d0,  d0,  d0
 NOVFP   vmov.32         r0,  d0[0]
 bx              lr
-.endfunc
+endfunc
 function ff_int32_to_float_fmul_scalar_neon, export=1
 VFP     vdup.32         q0,  d0[0]
 VFP     len     .req    r2
 NOVFP   vdup.32         q0,  r2
 b               1b
 2:      vst1.32         {q9}, [r0,:128]!
 vst1.32         {q10},[r0,:128]!
 bx              lr
 .unreq  len
-.endfunc
+endfunc
 function ff_vector_fmul_reverse_neon, export=1
 add             r2,  r2,  r3,  lsl #2
 sub             r2,  r2,  #32
 mov             r12, #-32
 vld1.32         {q2-q3},  [r2,:128], r12
 vst1.32         {q8-q9},  [r0,:128]!
 b               1b
 2:      vst1.32         {q8-q9},  [r0,:128]!
 bx              lr
-.endfunc
+endfunc
 function ff_vector_fmul_add_neon, export=1
 ldr             r12, [sp]
 vld1.32         {q0-q1},  [r1,:128]!
 vld1.32         {q8-q9},  [r2,:128]!
 vld1.32         {q2-q3},  [r3,:128]!
 vst1.32         {q12-q13},[r0,:128]!
 b               1b
 2:      vst1.32         {q12-q13},[r0,:128]!
 bx              lr
-.endfunc
+endfunc
 function ff_vector_clipf_neon, export=1
 VFP     vdup.32         q1,  d0[1]
 VFP     vdup.32         q0,  d0[0]
 NOVFP   vdup.32         q0,  r2
 vst1.f32        {q9},[r0,:128]!
 b               1b
 2:      vst1.f32        {q8},[r0,:128]!
 vst1.f32        {q9},[r0,:128]!
 bx              lr
-.endfunc
+endfunc

Mercurial > libavcodec.hg

comparison arm/dsputil_neon.S @ 11443:361a5fcb4393 libavcodec