libavcodec.hg: arm/dsputil_arm

comparison arm/dsputil_arm_s.S @ 8678:6c256fc075e3 libavcodec

ARM: change alignment of loops in put_pixels*_arm to 32

author	mru
date	Tue, 27 Jan 2009 16:06:41 +0000
parents	7a463923ecd1
children	9c1ea156d893

comparison

equal deleted inserted replaced

-:3c484b73ca73
+:6c256fc075e3
 add \Rd0, \Rn0, \Rd0, lsr #1
 add \Rd1, \Rn1, \Rd1, lsr #1
 .endm
 @ ----------------------------------------------------------------
-.align 8
+.align 5
 function put_pixels16_arm, export=1
 @ void func(uint8_t *block, const uint8_t *pixels, int line_size, int h)
 @ block = word aligned, pixles = unaligned
 pld [r1]
 stmfd sp!, {r4-r11, lr} @ R14 is also called LR
 pld [r1]
 subs r3, r3, #1
 add r0, r0, r2
 bne 1b
 ldmfd sp!, {r4-r11, pc}
-.align 8
+.align 5
 2:
 ldmia r1, {r4-r8}
 add r1, r1, r2
 ADJ_ALIGN_QUADWORD_D 1, r9, r10, r11, r12, r4, r5, r6, r7, r8
 pld [r1]
 subs r3, r3, #1
 stmia r0, {r9-r12}
 add r0, r0, r2
 bne 2b
 ldmfd sp!, {r4-r11, pc}
-.align 8
+.align 5
 3:
 ldmia r1, {r4-r8}
 add r1, r1, r2
 ADJ_ALIGN_QUADWORD_D 2, r9, r10, r11, r12, r4, r5, r6, r7, r8
 pld [r1]
 subs r3, r3, #1
 stmia r0, {r9-r12}
 add r0, r0, r2
 bne 3b
 ldmfd sp!, {r4-r11, pc}
-.align 8
+.align 5
 4:
 ldmia r1, {r4-r8}
 add r1, r1, r2
 ADJ_ALIGN_QUADWORD_D 3, r9, r10, r11, r12, r4, r5, r6, r7, r8
 pld [r1]
 subs r3, r3, #1
 stmia r0, {r9-r12}
 add r0, r0, r2
 bne 4b
 ldmfd sp!, {r4-r11,pc}
-.align 8
 5:
 .word 1b
 .word 2b
 .word 3b
 .word 4b
 .endfunc
 @ ----------------------------------------------------------------
-.align 8
+.align 5
 function put_pixels8_arm, export=1
 @ void func(uint8_t *block, const uint8_t *pixels, int line_size, int h)
 @ block = word aligned, pixles = unaligned
 pld [r1]
 stmfd sp!, {r4-r5,lr} @ R14 is also called LR
 pld [r1]
 stmia r0, {r4-r5}
 add r0, r0, r2
 bne 1b
 ldmfd sp!, {r4-r5,pc}
-.align 8
+.align 5
 2:
 ldmia r1, {r4-r5, r12}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD 1, r4, r5, r12
 pld [r1]
 subs r3, r3, #1
 stmia r0, {r4-r5}
 add r0, r0, r2
 bne 2b
 ldmfd sp!, {r4-r5,pc}
-.align 8
+.align 5
 3:
 ldmia r1, {r4-r5, r12}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD 2, r4, r5, r12
 pld [r1]
 subs r3, r3, #1
 stmia r0, {r4-r5}
 add r0, r0, r2
 bne 3b
 ldmfd sp!, {r4-r5,pc}
-.align 8
+.align 5
 4:
 ldmia r1, {r4-r5, r12}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD 3, r4, r5, r12
 pld [r1]
 subs r3, r3, #1
 stmia r0, {r4-r5}
 add r0, r0, r2
 bne 4b
 ldmfd sp!, {r4-r5,pc}
-.align 8
 5:
 .word 1b
 .word 2b
 .word 3b
 .word 4b
 .endfunc
 @ ----------------------------------------------------------------
-.align 8
+.align 5
 function put_pixels8_x2_arm, export=1
 @ void func(uint8_t *block, const uint8_t *pixels, int line_size, int h)
 @ block = word aligned, pixles = unaligned
 pld [r1]
 stmfd sp!, {r4-r10,lr} @ R14 is also called LR
 subs r3, r3, #1
 stmia r0, {r8-r9}
 add r0, r0, r2
 bne 1b
 ldmfd sp!, {r4-r10,pc}
-.align 8
+.align 5
 2:
 ldmia r1, {r4-r5, r10}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD_D 1, r6, r7, r4, r5, r10
 ADJ_ALIGN_DOUBLEWORD_D 2, r8, r9, r4, r5, r10
 subs r3, r3, #1
 stmia r0, {r4-r5}
 add r0, r0, r2
 bne 2b
 ldmfd sp!, {r4-r10,pc}
-.align 8
+.align 5
 3:
 ldmia r1, {r4-r5, r10}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD_D 2, r6, r7, r4, r5, r10
 ADJ_ALIGN_DOUBLEWORD_D 3, r8, r9, r4, r5, r10
 subs r3, r3, #1
 stmia r0, {r4-r5}
 add r0, r0, r2
 bne 3b
 ldmfd sp!, {r4-r10,pc}
-.align 8
+.align 5
 4:
 ldmia r1, {r4-r5, r10}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD_D 3, r6, r7, r4, r5, r10
 pld [r1]
 subs r3, r3, #1
 stmia r0, {r8-r9}
 add r0, r0, r2
 bne 4b
 ldmfd sp!, {r4-r10,pc} @@ update PC with LR content.
-.align 8
 5:
 .word 0xFEFEFEFE
 .word 2b
 .word 3b
 .word 4b
 .endfunc
-.align 8
+.align 5
 function put_no_rnd_pixels8_x2_arm, export=1
 @ void func(uint8_t *block, const uint8_t *pixels, int line_size, int h)
 @ block = word aligned, pixles = unaligned
 pld [r1]
 stmfd sp!, {r4-r10,lr} @ R14 is also called LR
 subs r3, r3, #1
 stmia r0, {r8-r9}
 add r0, r0, r2
 bne 1b
 ldmfd sp!, {r4-r10,pc}
-.align 8
+.align 5
 2:
 ldmia r1, {r4-r5, r10}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD_D 1, r6, r7, r4, r5, r10
 ADJ_ALIGN_DOUBLEWORD_D 2, r8, r9, r4, r5, r10
 subs r3, r3, #1
 stmia r0, {r4-r5}
 add r0, r0, r2
 bne 2b
 ldmfd sp!, {r4-r10,pc}
-.align 8
+.align 5
 3:
 ldmia r1, {r4-r5, r10}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD_D 2, r6, r7, r4, r5, r10
 ADJ_ALIGN_DOUBLEWORD_D 3, r8, r9, r4, r5, r10
 subs r3, r3, #1
 stmia r0, {r4-r5}
 add r0, r0, r2
 bne 3b
 ldmfd sp!, {r4-r10,pc}
-.align 8
+.align 5
 4:
 ldmia r1, {r4-r5, r10}
 add r1, r1, r2
 ADJ_ALIGN_DOUBLEWORD_D 3, r6, r7, r4, r5, r10
 pld [r1]
 subs r3, r3, #1
 stmia r0, {r8-r9}
 add r0, r0, r2
 bne 4b
 ldmfd sp!, {r4-r10,pc} @@ update PC with LR content.
-.align 8
 5:
 .word 0xFEFEFEFE
 .word 2b
 .word 3b
 .word 4b
 .endfunc
 @ ----------------------------------------------------------------
-.align 8
+.align 5
 function put_pixels8_y2_arm, export=1
 @ void func(uint8_t *block, const uint8_t *pixels, int line_size, int h)
 @ block = word aligned, pixles = unaligned
 pld [r1]
 stmfd sp!, {r4-r11,lr} @ R14 is also called LR
 subs r3, r3, #1
 stmia r0, {r8-r9}
 add r0, r0, r2
 bne 6b
 ldmfd sp!, {r4-r11,pc}
-.align 8
+.align 5
 2:
 ldmia r1, {r4-r6}
 add r1, r1, r2
 pld [r1]
 ADJ_ALIGN_DOUBLEWORD 1, r4, r5, r6
 RND_AVG32 r10, r11, r7, r8, r4, r5, r12
 stmia r0, {r10-r11}
 add r0, r0, r2
 bne 6b
 ldmfd sp!, {r4-r11,pc}
-.align 8
+.align 5
 3:
 ldmia r1, {r4-r6}
 add r1, r1, r2
 pld [r1]
 ADJ_ALIGN_DOUBLEWORD 2, r4, r5, r6
 RND_AVG32 r10, r11, r7, r8, r4, r5, r12
 stmia r0, {r10-r11}
 add r0, r0, r2
 bne 6b
 ldmfd sp!, {r4-r11,pc}
-.align 8
+.align 5
 4:
 ldmia r1, {r4-r6}
 add r1, r1, r2
 pld [r1]
 ADJ_ALIGN_DOUBLEWORD 3, r4, r5, r6
 stmia r0, {r10-r11}
 add r0, r0, r2
 bne 6b
 ldmfd sp!, {r4-r11,pc}
-.align 8
 5:
 .word 0xFEFEFEFE
 .word 2b
 .word 3b
 .word 4b
 .endfunc
-.align 8
+.align 5
 function put_no_rnd_pixels8_y2_arm, export=1
 @ void func(uint8_t *block, const uint8_t *pixels, int line_size, int h)
 @ block = word aligned, pixles = unaligned
 pld [r1]
 stmfd sp!, {r4-r11,lr} @ R14 is also called LR
 subs r3, r3, #1
 stmia r0, {r8-r9}
 add r0, r0, r2
 bne 6b
 ldmfd sp!, {r4-r11,pc}
-.align 8
+.align 5
 2:
 ldmia r1, {r4-r6}
 add r1, r1, r2
 pld [r1]
 ADJ_ALIGN_DOUBLEWORD 1, r4, r5, r6
 NO_RND_AVG32 r10, r11, r7, r8, r4, r5, r12
 stmia r0, {r10-r11}
 add r0, r0, r2
 bne 6b
 ldmfd sp!, {r4-r11,pc}
-.align 8
+.align 5
 3:
 ldmia r1, {r4-r6}
 add r1, r1, r2
 pld [r1]
 ADJ_ALIGN_DOUBLEWORD 2, r4, r5, r6
 NO_RND_AVG32 r10, r11, r7, r8, r4, r5, r12
 stmia r0, {r10-r11}
 add r0, r0, r2
 bne 6b
 ldmfd sp!, {r4-r11,pc}
-.align 8
+.align 5
 4:
 ldmia r1, {r4-r6}
 add r1, r1, r2
 pld [r1]
 ADJ_ALIGN_DOUBLEWORD 3, r4, r5, r6
 NO_RND_AVG32 r10, r11, r7, r8, r4, r5, r12
 stmia r0, {r10-r11}
 add r0, r0, r2
 bne 6b
 ldmfd sp!, {r4-r11,pc}
-.align 8
 5:
 .word 0xFEFEFEFE
 .word 2b
 .word 3b
 .word 4b
 add r0, r0, r2
 bge 6b
 ldmfd sp!, {r4-r11,pc}
 .endm
-.align 8
+.align 5
 function put_pixels8_xy2_arm, export=1
 @ void func(uint8_t *block, const uint8_t *pixels, int line_size, int h)
 @ block = word aligned, pixles = unaligned
 pld [r1]
 stmfd sp!, {r4-r11,lr} @ R14 is also called LR
 bic r1, r1, #3
 ldrne pc, [r5]
 1:
 RND_XY2_EXPAND 0
-.align 8
+.align 5
 2:
 RND_XY2_EXPAND 1
-.align 8
+.align 5
 3:
 RND_XY2_EXPAND 2
-.align 8
+.align 5
 4:
 RND_XY2_EXPAND 3
 5:
 .word 0x03030303
 .word 0x02020202
 .word 0xFCFCFCFC >> 2
 .word 0x0F0F0F0F
 .endfunc
-.align 8
+.align 5
 function put_no_rnd_pixels8_xy2_arm, export=1
 @ void func(uint8_t *block, const uint8_t *pixels, int line_size, int h)
 @ block = word aligned, pixles = unaligned
 pld [r1]
 stmfd sp!, {r4-r11,lr} @ R14 is also called LR
 bic r1, r1, #3
 ldrne pc, [r5]
 1:
 RND_XY2_EXPAND 0
-.align 8
+.align 5
 2:
 RND_XY2_EXPAND 1
-.align 8
+.align 5
 3:
 RND_XY2_EXPAND 2
-.align 8
+.align 5
 4:
 RND_XY2_EXPAND 3
 5:
 .word 0x03030303
 .word 0x01010101
 .word 0xFCFCFCFC >> 2
 .word 0x0F0F0F0F
 .endfunc
+.align 5
 @ void ff_add_pixels_clamped_ARM(int16_t *block, uint8_t *dest, int stride)
 function ff_add_pixels_clamped_ARM, export=1
 push            {r4-r10}
 mov             r10, #8
 1:

Mercurial > libavcodec.hg

comparison arm/dsputil_arm_s.S @ 8678:6c256fc075e3 libavcodec