libavcodec.hg: arm/dsputil_neon

annotate arm/dsputil_neon_s.S @ 10266:8695a5f212fc libavcodec

Factorize duplicated code in at1_imdct_block()

author	vitor
date	Thu, 24 Sep 2009 21:24:58 +0000
parents	64dd9515b93b
children	bcf5c5551b3c

rev	line source
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	1 /*
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	2 * ARM NEON optimised DSP functions
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	3 * Copyright (c) 2008 Mans Rullgard <mans@mansr.com>
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	4 *
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	5 * This file is part of FFmpeg.
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	6 *
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	7 * FFmpeg is free software; you can redistribute it and/or
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	8 * modify it under the terms of the GNU Lesser General Public
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	9 * License as published by the Free Software Foundation; either
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	10 * version 2.1 of the License, or (at your option) any later version.
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	11 *
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	12 * FFmpeg is distributed in the hope that it will be useful,
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	13 * but WITHOUT ANY WARRANTY; without even the implied warranty of
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	14 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	15 * Lesser General Public License for more details.
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	16 *
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	17 * You should have received a copy of the GNU Lesser General Public
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	18 * License along with FFmpeg; if not, write to the Free Software
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	19 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	20 */
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	21
10046 1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	22 #include "config.h"
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	23 #include "asm.S"
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	24
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	25 preserve8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	26 .fpu neon
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	27 .text
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	28
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	29 .macro pixels16 avg=0
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	30 .if \avg
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	31 mov ip, r0
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	32 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	33 1: vld1.64 {d0, d1}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	34 vld1.64 {d2, d3}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	35 vld1.64 {d4, d5}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	36 pld [r1, r2, lsl #2]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	37 vld1.64 {d6, d7}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	38 pld [r1]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	39 pld [r1, r2]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	40 pld [r1, r2, lsl #1]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	41 .if \avg
9451 93c20dd3da43 Add guaranteed alignment for loading dest pixels in avg_pixels16_neon conrad parents: 9345 diff changeset	42 vld1.64 {d16,d17}, [ip,:128], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	43 vrhadd.u8 q0, q0, q8
9451 93c20dd3da43 Add guaranteed alignment for loading dest pixels in avg_pixels16_neon conrad parents: 9345 diff changeset	44 vld1.64 {d18,d19}, [ip,:128], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	45 vrhadd.u8 q1, q1, q9
9451 93c20dd3da43 Add guaranteed alignment for loading dest pixels in avg_pixels16_neon conrad parents: 9345 diff changeset	46 vld1.64 {d20,d21}, [ip,:128], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	47 vrhadd.u8 q2, q2, q10
9451 93c20dd3da43 Add guaranteed alignment for loading dest pixels in avg_pixels16_neon conrad parents: 9345 diff changeset	48 vld1.64 {d22,d23}, [ip,:128], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	49 vrhadd.u8 q3, q3, q11
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	50 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	51 subs r3, r3, #4
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	52 vst1.64 {d0, d1}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	53 vst1.64 {d2, d3}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	54 vst1.64 {d4, d5}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	55 vst1.64 {d6, d7}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	56 bne 1b
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	57 bx lr
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	58 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	59
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	60 .macro pixels16_x2 vhadd=vrhadd.u8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	61 1: vld1.64 {d0-d2}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	62 vld1.64 {d4-d6}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	63 pld [r1]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	64 pld [r1, r2]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	65 subs r3, r3, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	66 vext.8 q1, q0, q1, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	67 \vhadd q0, q0, q1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	68 vext.8 q3, q2, q3, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	69 \vhadd q2, q2, q3
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	70 vst1.64 {d0, d1}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	71 vst1.64 {d4, d5}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	72 bne 1b
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	73 bx lr
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	74 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	75
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	76 .macro pixels16_y2 vhadd=vrhadd.u8
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	77 vld1.64 {d0, d1}, [r1], r2
2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	78 vld1.64 {d2, d3}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	79 1: subs r3, r3, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	80 \vhadd q2, q0, q1
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	81 vld1.64 {d0, d1}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	82 \vhadd q3, q0, q1
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	83 vld1.64 {d2, d3}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	84 pld [r1]
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	85 pld [r1, r2]
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	86 vst1.64 {d4, d5}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	87 vst1.64 {d6, d7}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	88 bne 1b
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	89 bx lr
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	90 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	91
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	92 .macro pixels16_xy2 vshrn=vrshrn.u16 no_rnd=0
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	93 vld1.64 {d0-d2}, [r1], r2
2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	94 vld1.64 {d4-d6}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	95 .if \no_rnd
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	96 vmov.i16 q13, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	97 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	98 pld [r1]
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	99 pld [r1, r2]
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	100 vext.8 q1, q0, q1, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	101 vext.8 q3, q2, q3, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	102 vaddl.u8 q8, d0, d2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	103 vaddl.u8 q10, d1, d3
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	104 vaddl.u8 q9, d4, d6
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	105 vaddl.u8 q11, d5, d7
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	106 1: subs r3, r3, #2
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	107 vld1.64 {d0-d2}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	108 vadd.u16 q12, q8, q9
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	109 pld [r1]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	110 .if \no_rnd
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	111 vadd.u16 q12, q12, q13
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	112 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	113 vext.8 q15, q0, q1, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	114 vadd.u16 q1 , q10, q11
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	115 \vshrn d28, q12, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	116 .if \no_rnd
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	117 vadd.u16 q1, q1, q13
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	118 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	119 \vshrn d29, q1, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	120 vaddl.u8 q8, d0, d30
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	121 vld1.64 {d2-d4}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	122 vaddl.u8 q10, d1, d31
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	123 vst1.64 {d28,d29}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	124 vadd.u16 q12, q8, q9
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	125 pld [r1, r2]
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	126 .if \no_rnd
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	127 vadd.u16 q12, q12, q13
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	128 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	129 vext.8 q2, q1, q2, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	130 vadd.u16 q0, q10, q11
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	131 \vshrn d30, q12, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	132 .if \no_rnd
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	133 vadd.u16 q0, q0, q13
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	134 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	135 \vshrn d31, q0, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	136 vaddl.u8 q9, d2, d4
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	137 vaddl.u8 q11, d3, d5
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	138 vst1.64 {d30,d31}, [r0,:128], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	139 bgt 1b
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	140 bx lr
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	141 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	142
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	143 .macro pixels8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	144 1: vld1.64 {d0}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	145 vld1.64 {d1}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	146 vld1.64 {d2}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	147 pld [r1, r2, lsl #2]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	148 vld1.64 {d3}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	149 pld [r1]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	150 pld [r1, r2]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	151 pld [r1, r2, lsl #1]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	152 subs r3, r3, #4
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	153 vst1.64 {d0}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	154 vst1.64 {d1}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	155 vst1.64 {d2}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	156 vst1.64 {d3}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	157 bne 1b
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	158 bx lr
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	159 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	160
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	161 .macro pixels8_x2 vhadd=vrhadd.u8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	162 1: vld1.64 {d0, d1}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	163 vext.8 d1, d0, d1, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	164 vld1.64 {d2, d3}, [r1], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	165 vext.8 d3, d2, d3, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	166 pld [r1]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	167 pld [r1, r2]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	168 subs r3, r3, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	169 vswp d1, d2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	170 \vhadd q0, q0, q1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	171 vst1.64 {d0}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	172 vst1.64 {d1}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	173 bne 1b
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	174 bx lr
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	175 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	176
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	177 .macro pixels8_y2 vhadd=vrhadd.u8
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	178 vld1.64 {d0}, [r1], r2
2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	179 vld1.64 {d1}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	180 1: subs r3, r3, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	181 \vhadd d4, d0, d1
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	182 vld1.64 {d0}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	183 \vhadd d5, d0, d1
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	184 vld1.64 {d1}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	185 pld [r1]
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	186 pld [r1, r2]
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	187 vst1.64 {d4}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	188 vst1.64 {d5}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	189 bne 1b
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	190 bx lr
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	191 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	192
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	193 .macro pixels8_xy2 vshrn=vrshrn.u16 no_rnd=0
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	194 vld1.64 {d0, d1}, [r1], r2
2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	195 vld1.64 {d2, d3}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	196 .if \no_rnd
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	197 vmov.i16 q11, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	198 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	199 pld [r1]
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	200 pld [r1, r2]
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	201 vext.8 d4, d0, d1, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	202 vext.8 d6, d2, d3, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	203 vaddl.u8 q8, d0, d4
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	204 vaddl.u8 q9, d2, d6
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	205 1: subs r3, r3, #2
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	206 vld1.64 {d0, d1}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	207 pld [r1]
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	208 vadd.u16 q10, q8, q9
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	209 vext.8 d4, d0, d1, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	210 .if \no_rnd
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	211 vadd.u16 q10, q10, q11
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	212 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	213 vaddl.u8 q8, d0, d4
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	214 \vshrn d5, q10, #2
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	215 vld1.64 {d2, d3}, [r1], r2
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	216 vadd.u16 q10, q8, q9
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	217 pld [r1, r2]
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	218 .if \no_rnd
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	219 vadd.u16 q10, q10, q11
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	220 .endif
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	221 vst1.64 {d5}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	222 \vshrn d7, q10, #2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	223 vext.8 d6, d2, d3, #1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	224 vaddl.u8 q9, d2, d6
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	225 vst1.64 {d7}, [r0,:64], r2
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	226 bgt 1b
9581 2b3b9358bee7 ARM: Use fewer register in NEON put_pixels _y2 and _xy2 conrad parents: 9580 diff changeset	227 bx lr
8334 6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	228 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	229
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	230 .macro pixfunc pfx name suf rnd_op args:vararg
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	231 function ff_\pfx\name\suf\()_neon, export=1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	232 \name \rnd_op \args
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	233 .endfunc
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	234 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	235
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	236 .macro pixfunc2 pfx name args:vararg
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	237 pixfunc \pfx \name
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	238 pixfunc \pfx \name \args
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	239 .endm
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	240
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	241 function ff_put_h264_qpel16_mc00_neon, export=1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	242 mov r3, #16
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	243 .endfunc
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	244
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	245 pixfunc put_ pixels16
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	246 pixfunc2 put_ pixels16_x2, _no_rnd, vhadd.u8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	247 pixfunc2 put_ pixels16_y2, _no_rnd, vhadd.u8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	248 pixfunc2 put_ pixels16_xy2, _no_rnd, vshrn.u16, 1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	249
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	250 function ff_avg_h264_qpel16_mc00_neon, export=1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	251 mov r3, #16
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	252 .endfunc
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	253
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	254 pixfunc avg_ pixels16,, 1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	255
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	256 function ff_put_h264_qpel8_mc00_neon, export=1
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	257 mov r3, #8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	258 .endfunc
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	259
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	260 pixfunc put_ pixels8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	261 pixfunc2 put_ pixels8_x2, _no_rnd, vhadd.u8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	262 pixfunc2 put_ pixels8_y2, _no_rnd, vhadd.u8
6bdd6dfc3574 ARM: NEON optimised put_pixels functions mru parents: diff changeset	263 pixfunc2 put_ pixels8_xy2, _no_rnd, vshrn.u16, 1
8492 639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	264
9580 51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	265 function ff_put_pixels_clamped_neon, export=1
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	266 vld1.64 {d16-d19}, [r0,:128]!
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	267 vqmovun.s16 d0, q8
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	268 vld1.64 {d20-d23}, [r0,:128]!
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	269 vqmovun.s16 d1, q9
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	270 vld1.64 {d24-d27}, [r0,:128]!
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	271 vqmovun.s16 d2, q10
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	272 vld1.64 {d28-d31}, [r0,:128]!
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	273 vqmovun.s16 d3, q11
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	274 vst1.64 {d0}, [r1,:64], r2
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	275 vqmovun.s16 d4, q12
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	276 vst1.64 {d1}, [r1,:64], r2
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	277 vqmovun.s16 d5, q13
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	278 vst1.64 {d2}, [r1,:64], r2
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	279 vqmovun.s16 d6, q14
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	280 vst1.64 {d3}, [r1,:64], r2
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	281 vqmovun.s16 d7, q15
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	282 vst1.64 {d4}, [r1,:64], r2
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	283 vst1.64 {d5}, [r1,:64], r2
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	284 vst1.64 {d6}, [r1,:64], r2
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	285 vst1.64 {d7}, [r1,:64], r2
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	286 bx lr
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	287 .endfunc
51e8f5ab8f1e ARM: NEON put_pixels_clamped conrad parents: 9451 diff changeset	288
9345 e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	289 function ff_put_signed_pixels_clamped_neon, export=1
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	290 vmov.u8 d31, #128
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	291 vld1.64 {d16-d17}, [r0,:128]!
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	292 vqmovn.s16 d0, q8
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	293 vld1.64 {d18-d19}, [r0,:128]!
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	294 vqmovn.s16 d1, q9
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	295 vld1.64 {d16-d17}, [r0,:128]!
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	296 vqmovn.s16 d2, q8
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	297 vld1.64 {d18-d19}, [r0,:128]!
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	298 vadd.u8 d0, d0, d31
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	299 vld1.64 {d20-d21}, [r0,:128]!
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	300 vadd.u8 d1, d1, d31
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	301 vld1.64 {d22-d23}, [r0,:128]!
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	302 vadd.u8 d2, d2, d31
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	303 vst1.64 {d0}, [r1,:64], r2
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	304 vqmovn.s16 d3, q9
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	305 vst1.64 {d1}, [r1,:64], r2
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	306 vqmovn.s16 d4, q10
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	307 vst1.64 {d2}, [r1,:64], r2
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	308 vqmovn.s16 d5, q11
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	309 vld1.64 {d24-d25}, [r0,:128]!
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	310 vadd.u8 d3, d3, d31
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	311 vld1.64 {d26-d27}, [r0,:128]!
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	312 vadd.u8 d4, d4, d31
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	313 vadd.u8 d5, d5, d31
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	314 vst1.64 {d3}, [r1,:64], r2
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	315 vqmovn.s16 d6, q12
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	316 vst1.64 {d4}, [r1,:64], r2
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	317 vqmovn.s16 d7, q13
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	318 vst1.64 {d5}, [r1,:64], r2
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	319 vadd.u8 d6, d6, d31
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	320 vadd.u8 d7, d7, d31
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	321 vst1.64 {d6}, [r1,:64], r2
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	322 vst1.64 {d7}, [r1,:64], r2
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	323 bx lr
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	324 .endfunc
e0a7a6338526 ARM: NEON optimized put_signed_pixels_clamped conrad parents: 9344 diff changeset	325
9344 9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	326 function ff_add_pixels_clamped_neon, export=1
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	327 mov r3, r1
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	328 vld1.64 {d16}, [r1,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	329 vld1.64 {d0-d1}, [r0,:128]!
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	330 vaddw.u8 q0, q0, d16
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	331 vld1.64 {d17}, [r1,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	332 vld1.64 {d2-d3}, [r0,:128]!
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	333 vqmovun.s16 d0, q0
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	334 vld1.64 {d18}, [r1,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	335 vaddw.u8 q1, q1, d17
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	336 vld1.64 {d4-d5}, [r0,:128]!
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	337 vaddw.u8 q2, q2, d18
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	338 vst1.64 {d0}, [r3,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	339 vqmovun.s16 d2, q1
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	340 vld1.64 {d19}, [r1,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	341 vld1.64 {d6-d7}, [r0,:128]!
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	342 vaddw.u8 q3, q3, d19
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	343 vqmovun.s16 d4, q2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	344 vst1.64 {d2}, [r3,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	345 vld1.64 {d16}, [r1,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	346 vqmovun.s16 d6, q3
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	347 vld1.64 {d0-d1}, [r0,:128]!
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	348 vaddw.u8 q0, q0, d16
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	349 vst1.64 {d4}, [r3,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	350 vld1.64 {d17}, [r1,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	351 vld1.64 {d2-d3}, [r0,:128]!
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	352 vaddw.u8 q1, q1, d17
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	353 vst1.64 {d6}, [r3,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	354 vqmovun.s16 d0, q0
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	355 vld1.64 {d18}, [r1,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	356 vld1.64 {d4-d5}, [r0,:128]!
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	357 vaddw.u8 q2, q2, d18
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	358 vst1.64 {d0}, [r3,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	359 vqmovun.s16 d2, q1
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	360 vld1.64 {d19}, [r1,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	361 vqmovun.s16 d4, q2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	362 vld1.64 {d6-d7}, [r0,:128]!
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	363 vaddw.u8 q3, q3, d19
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	364 vst1.64 {d2}, [r3,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	365 vqmovun.s16 d6, q3
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	366 vst1.64 {d4}, [r3,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	367 vst1.64 {d6}, [r3,:64], r2
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	368 bx lr
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	369 .endfunc
9ea1ea6db616 ARM: NEON optimised add_pixels_clamped mru parents: 8698 diff changeset	370
8492 639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	371 function ff_float_to_int16_neon, export=1
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	372 subs r2, r2, #8
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	373 vld1.64 {d0-d1}, [r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	374 vcvt.s32.f32 q8, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	375 vld1.64 {d2-d3}, [r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	376 vcvt.s32.f32 q9, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	377 beq 3f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	378 bics ip, r2, #15
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	379 beq 2f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	380 1: subs ip, ip, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	381 vshrn.s32 d4, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	382 vld1.64 {d0-d1}, [r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	383 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	384 vshrn.s32 d5, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	385 vld1.64 {d2-d3}, [r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	386 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	387 vshrn.s32 d6, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	388 vst1.64 {d4-d5}, [r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	389 vshrn.s32 d7, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	390 vld1.64 {d16-d17},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	391 vcvt.s32.f32 q8, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	392 vld1.64 {d18-d19},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	393 vcvt.s32.f32 q9, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	394 vst1.64 {d6-d7}, [r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	395 bne 1b
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	396 ands r2, r2, #15
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	397 beq 3f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	398 2: vld1.64 {d0-d1}, [r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	399 vshrn.s32 d4, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	400 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	401 vld1.64 {d2-d3}, [r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	402 vshrn.s32 d5, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	403 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	404 vshrn.s32 d6, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	405 vst1.64 {d4-d5}, [r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	406 vshrn.s32 d7, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	407 vst1.64 {d6-d7}, [r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	408 bx lr
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	409 3: vshrn.s32 d4, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	410 vshrn.s32 d5, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	411 vst1.64 {d4-d5}, [r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	412 bx lr
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	413 .endfunc
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	414
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	415 function ff_float_to_int16_interleave_neon, export=1
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	416 cmp r3, #2
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	417 ldrlt r1, [r1]
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	418 blt ff_float_to_int16_neon
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	419 bne 4f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	420
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	421 ldr r3, [r1]
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	422 ldr r1, [r1, #4]
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	423
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	424 subs r2, r2, #8
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	425 vld1.64 {d0-d1}, [r3,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	426 vcvt.s32.f32 q8, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	427 vld1.64 {d2-d3}, [r3,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	428 vcvt.s32.f32 q9, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	429 vld1.64 {d20-d21},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	430 vcvt.s32.f32 q10, q10, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	431 vld1.64 {d22-d23},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	432 vcvt.s32.f32 q11, q11, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	433 beq 3f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	434 bics ip, r2, #15
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	435 beq 2f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	436 1: subs ip, ip, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	437 vld1.64 {d0-d1}, [r3,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	438 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	439 vsri.32 q10, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	440 vld1.64 {d2-d3}, [r3,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	441 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	442 vld1.64 {d24-d25},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	443 vcvt.s32.f32 q12, q12, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	444 vld1.64 {d26-d27},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	445 vsri.32 q11, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	446 vst1.64 {d20-d21},[r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	447 vcvt.s32.f32 q13, q13, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	448 vst1.64 {d22-d23},[r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	449 vsri.32 q12, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	450 vld1.64 {d16-d17},[r3,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	451 vsri.32 q13, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	452 vst1.64 {d24-d25},[r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	453 vcvt.s32.f32 q8, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	454 vld1.64 {d18-d19},[r3,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	455 vcvt.s32.f32 q9, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	456 vld1.64 {d20-d21},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	457 vcvt.s32.f32 q10, q10, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	458 vld1.64 {d22-d23},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	459 vcvt.s32.f32 q11, q11, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	460 vst1.64 {d26-d27},[r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	461 bne 1b
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	462 ands r2, r2, #15
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	463 beq 3f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	464 2: vsri.32 q10, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	465 vld1.64 {d0-d1}, [r3,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	466 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	467 vld1.64 {d2-d3}, [r3,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	468 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	469 vld1.64 {d24-d25},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	470 vcvt.s32.f32 q12, q12, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	471 vsri.32 q11, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	472 vld1.64 {d26-d27},[r1,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	473 vcvt.s32.f32 q13, q13, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	474 vst1.64 {d20-d21},[r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	475 vsri.32 q12, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	476 vst1.64 {d22-d23},[r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	477 vsri.32 q13, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	478 vst1.64 {d24-d27},[r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	479 bx lr
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	480 3: vsri.32 q10, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	481 vsri.32 q11, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	482 vst1.64 {d20-d23},[r0,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	483 bx lr
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	484
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	485 4: push {r4-r8,lr}
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	486 cmp r3, #4
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	487 lsl ip, r3, #1
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	488 blt 4f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	489
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	490 @ 4 channels
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	491 5: ldmia r1!, {r4-r7}
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	492 mov lr, r2
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	493 mov r8, r0
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	494 vld1.64 {d16-d17},[r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	495 vcvt.s32.f32 q8, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	496 vld1.64 {d18-d19},[r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	497 vcvt.s32.f32 q9, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	498 vld1.64 {d20-d21},[r6,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	499 vcvt.s32.f32 q10, q10, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	500 vld1.64 {d22-d23},[r7,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	501 vcvt.s32.f32 q11, q11, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	502 6: subs lr, lr, #8
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	503 vld1.64 {d0-d1}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	504 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	505 vsri.32 q9, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	506 vld1.64 {d2-d3}, [r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	507 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	508 vsri.32 q11, q10, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	509 vld1.64 {d4-d5}, [r6,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	510 vcvt.s32.f32 q2, q2, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	511 vzip.32 d18, d22
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	512 vld1.64 {d6-d7}, [r7,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	513 vcvt.s32.f32 q3, q3, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	514 vzip.32 d19, d23
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	515 vst1.64 {d18}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	516 vsri.32 q1, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	517 vst1.64 {d22}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	518 vsri.32 q3, q2, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	519 vst1.64 {d19}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	520 vzip.32 d2, d6
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	521 vst1.64 {d23}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	522 vzip.32 d3, d7
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	523 beq 7f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	524 vld1.64 {d16-d17},[r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	525 vcvt.s32.f32 q8, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	526 vst1.64 {d2}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	527 vld1.64 {d18-d19},[r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	528 vcvt.s32.f32 q9, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	529 vst1.64 {d6}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	530 vld1.64 {d20-d21},[r6,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	531 vcvt.s32.f32 q10, q10, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	532 vst1.64 {d3}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	533 vld1.64 {d22-d23},[r7,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	534 vcvt.s32.f32 q11, q11, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	535 vst1.64 {d7}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	536 b 6b
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	537 7: vst1.64 {d2}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	538 vst1.64 {d6}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	539 vst1.64 {d3}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	540 vst1.64 {d7}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	541 subs r3, r3, #4
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	542 popeq {r4-r8,pc}
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	543 cmp r3, #4
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	544 add r0, r0, #8
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	545 bge 5b
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	546
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	547 @ 2 channels
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	548 4: cmp r3, #2
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	549 blt 4f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	550 ldmia r1!, {r4-r5}
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	551 mov lr, r2
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	552 mov r8, r0
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	553 tst lr, #8
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	554 vld1.64 {d16-d17},[r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	555 vcvt.s32.f32 q8, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	556 vld1.64 {d18-d19},[r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	557 vcvt.s32.f32 q9, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	558 vld1.64 {d20-d21},[r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	559 vcvt.s32.f32 q10, q10, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	560 vld1.64 {d22-d23},[r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	561 vcvt.s32.f32 q11, q11, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	562 beq 6f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	563 subs lr, lr, #8
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	564 beq 7f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	565 vsri.32 d18, d16, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	566 vsri.32 d19, d17, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	567 vld1.64 {d16-d17},[r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	568 vcvt.s32.f32 q8, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	569 vst1.32 {d18[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	570 vsri.32 d22, d20, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	571 vst1.32 {d18[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	572 vsri.32 d23, d21, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	573 vst1.32 {d19[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	574 vst1.32 {d19[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	575 vld1.64 {d18-d19},[r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	576 vcvt.s32.f32 q9, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	577 vst1.32 {d22[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	578 vst1.32 {d22[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	579 vld1.64 {d20-d21},[r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	580 vcvt.s32.f32 q10, q10, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	581 vst1.32 {d23[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	582 vst1.32 {d23[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	583 vld1.64 {d22-d23},[r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	584 vcvt.s32.f32 q11, q11, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	585 6: subs lr, lr, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	586 vld1.64 {d0-d1}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	587 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	588 vsri.32 d18, d16, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	589 vld1.64 {d2-d3}, [r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	590 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	591 vsri.32 d19, d17, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	592 vld1.64 {d4-d5}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	593 vcvt.s32.f32 q2, q2, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	594 vld1.64 {d6-d7}, [r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	595 vcvt.s32.f32 q3, q3, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	596 vst1.32 {d18[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	597 vsri.32 d22, d20, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	598 vst1.32 {d18[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	599 vsri.32 d23, d21, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	600 vst1.32 {d19[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	601 vsri.32 d2, d0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	602 vst1.32 {d19[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	603 vsri.32 d3, d1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	604 vst1.32 {d22[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	605 vsri.32 d6, d4, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	606 vst1.32 {d22[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	607 vsri.32 d7, d5, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	608 vst1.32 {d23[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	609 vst1.32 {d23[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	610 beq 6f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	611 vld1.64 {d16-d17},[r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	612 vcvt.s32.f32 q8, q8, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	613 vst1.32 {d2[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	614 vst1.32 {d2[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	615 vld1.64 {d18-d19},[r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	616 vcvt.s32.f32 q9, q9, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	617 vst1.32 {d3[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	618 vst1.32 {d3[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	619 vld1.64 {d20-d21},[r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	620 vcvt.s32.f32 q10, q10, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	621 vst1.32 {d6[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	622 vst1.32 {d6[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	623 vld1.64 {d22-d23},[r5,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	624 vcvt.s32.f32 q11, q11, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	625 vst1.32 {d7[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	626 vst1.32 {d7[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	627 bgt 6b
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	628 6: vst1.32 {d2[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	629 vst1.32 {d2[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	630 vst1.32 {d3[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	631 vst1.32 {d3[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	632 vst1.32 {d6[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	633 vst1.32 {d6[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	634 vst1.32 {d7[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	635 vst1.32 {d7[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	636 b 8f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	637 7: vsri.32 d18, d16, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	638 vsri.32 d19, d17, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	639 vst1.32 {d18[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	640 vsri.32 d22, d20, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	641 vst1.32 {d18[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	642 vsri.32 d23, d21, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	643 vst1.32 {d19[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	644 vst1.32 {d19[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	645 vst1.32 {d22[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	646 vst1.32 {d22[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	647 vst1.32 {d23[0]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	648 vst1.32 {d23[1]}, [r8], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	649 8: subs r3, r3, #2
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	650 add r0, r0, #4
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	651 popeq {r4-r8,pc}
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	652
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	653 @ 1 channel
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	654 4: ldr r4, [r1],#4
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	655 tst r2, #8
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	656 mov lr, r2
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	657 mov r5, r0
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	658 vld1.64 {d0-d1}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	659 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	660 vld1.64 {d2-d3}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	661 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	662 bne 8f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	663 6: subs lr, lr, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	664 vld1.64 {d4-d5}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	665 vcvt.s32.f32 q2, q2, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	666 vld1.64 {d6-d7}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	667 vcvt.s32.f32 q3, q3, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	668 vst1.16 {d0[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	669 vst1.16 {d0[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	670 vst1.16 {d1[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	671 vst1.16 {d1[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	672 vst1.16 {d2[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	673 vst1.16 {d2[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	674 vst1.16 {d3[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	675 vst1.16 {d3[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	676 beq 7f
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	677 vld1.64 {d0-d1}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	678 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	679 vld1.64 {d2-d3}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	680 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	681 7: vst1.16 {d4[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	682 vst1.16 {d4[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	683 vst1.16 {d5[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	684 vst1.16 {d5[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	685 vst1.16 {d6[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	686 vst1.16 {d6[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	687 vst1.16 {d7[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	688 vst1.16 {d7[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	689 bgt 6b
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	690 pop {r4-r8,pc}
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	691 8: subs lr, lr, #8
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	692 vst1.16 {d0[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	693 vst1.16 {d0[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	694 vst1.16 {d1[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	695 vst1.16 {d1[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	696 vst1.16 {d2[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	697 vst1.16 {d2[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	698 vst1.16 {d3[1]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	699 vst1.16 {d3[3]}, [r5,:16], ip
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	700 popeq {r4-r8,pc}
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	701 vld1.64 {d0-d1}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	702 vcvt.s32.f32 q0, q0, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	703 vld1.64 {d2-d3}, [r4,:128]!
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	704 vcvt.s32.f32 q1, q1, #16
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	705 b 6b
639169d7fad5 ARM: NEON optimised float_to_int16 mru parents: 8359 diff changeset	706 .endfunc
8697 307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	707
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	708 function ff_vector_fmul_neon, export=1
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	709 mov r3, r0
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	710 subs r2, r2, #8
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	711 vld1.64 {d0-d3}, [r0,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	712 vld1.64 {d4-d7}, [r1,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	713 vmul.f32 q8, q0, q2
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	714 vmul.f32 q9, q1, q3
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	715 beq 3f
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	716 bics ip, r2, #15
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	717 beq 2f
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	718 1: subs ip, ip, #16
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	719 vld1.64 {d0-d1}, [r0,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	720 vld1.64 {d4-d5}, [r1,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	721 vmul.f32 q10, q0, q2
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	722 vld1.64 {d2-d3}, [r0,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	723 vld1.64 {d6-d7}, [r1,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	724 vmul.f32 q11, q1, q3
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	725 vst1.64 {d16-d19},[r3,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	726 vld1.64 {d0-d1}, [r0,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	727 vld1.64 {d4-d5}, [r1,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	728 vmul.f32 q8, q0, q2
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	729 vld1.64 {d2-d3}, [r0,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	730 vld1.64 {d6-d7}, [r1,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	731 vmul.f32 q9, q1, q3
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	732 vst1.64 {d20-d23},[r3,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	733 bne 1b
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	734 ands r2, r2, #15
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	735 beq 3f
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	736 2: vld1.64 {d0-d1}, [r0,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	737 vld1.64 {d4-d5}, [r1,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	738 vst1.64 {d16-d17},[r3,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	739 vmul.f32 q8, q0, q2
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	740 vld1.64 {d2-d3}, [r0,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	741 vld1.64 {d6-d7}, [r1,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	742 vst1.64 {d18-d19},[r3,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	743 vmul.f32 q9, q1, q3
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	744 3: vst1.64 {d16-d19},[r3,:128]!
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	745 bx lr
307b176f91e7 ARM: NEON optimised vector_fmul mru parents: 8492 diff changeset	746 .endfunc
8698 24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	747
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	748 function ff_vector_fmul_window_neon, export=1
9969 5cca2790d582 ARM: handle VFP register arguments in ff_vector_fmul_window_neon() mru parents: 9581 diff changeset	749 VFP vdup.32 q8, d0[0]
5cca2790d582 ARM: handle VFP register arguments in ff_vector_fmul_window_neon() mru parents: 9581 diff changeset	750 NOVFP vld1.32 {d16[],d17[]}, [sp,:32]
8698 24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	751 push {r4,r5,lr}
9969 5cca2790d582 ARM: handle VFP register arguments in ff_vector_fmul_window_neon() mru parents: 9581 diff changeset	752 VFP ldr lr, [sp, #12]
5cca2790d582 ARM: handle VFP register arguments in ff_vector_fmul_window_neon() mru parents: 9581 diff changeset	753 NOVFP ldr lr, [sp, #16]
8698 24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	754 sub r2, r2, #8
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	755 sub r5, lr, #2
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	756 add r2, r2, r5, lsl #2
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	757 add r4, r3, r5, lsl #3
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	758 add ip, r0, r5, lsl #3
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	759 mov r5, #-16
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	760 vld1.64 {d0,d1}, [r1,:128]!
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	761 vld1.64 {d2,d3}, [r2,:128], r5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	762 vld1.64 {d4,d5}, [r3,:128]!
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	763 vld1.64 {d6,d7}, [r4,:128], r5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	764 1: subs lr, lr, #4
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	765 vmov q11, q8
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	766 vmla.f32 d22, d0, d4
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	767 vmov q10, q8
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	768 vmla.f32 d23, d1, d5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	769 vrev64.32 q3, q3
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	770 vmla.f32 d20, d0, d7
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	771 vrev64.32 q1, q1
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	772 vmla.f32 d21, d1, d6
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	773 beq 2f
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	774 vmla.f32 d22, d3, d7
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	775 vld1.64 {d0,d1}, [r1,:128]!
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	776 vmla.f32 d23, d2, d6
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	777 vld1.64 {d18,d19},[r2,:128], r5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	778 vmls.f32 d20, d3, d4
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	779 vld1.64 {d24,d25},[r3,:128]!
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	780 vmls.f32 d21, d2, d5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	781 vld1.64 {d6,d7}, [r4,:128], r5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	782 vmov q1, q9
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	783 vrev64.32 q11, q11
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	784 vmov q2, q12
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	785 vswp d22, d23
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	786 vst1.64 {d20,d21},[r0,:128]!
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	787 vst1.64 {d22,d23},[ip,:128], r5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	788 b 1b
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	789 2: vmla.f32 d22, d3, d7
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	790 vmla.f32 d23, d2, d6
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	791 vmls.f32 d20, d3, d4
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	792 vmls.f32 d21, d2, d5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	793 vrev64.32 q11, q11
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	794 vswp d22, d23
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	795 vst1.64 {d20,d21},[r0,:128]!
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	796 vst1.64 {d22,d23},[ip,:128], r5
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	797 pop {r4,r5,pc}
24a7b5d0eb27 ARM: NEON optimised vector_fmul_window mru parents: 8697 diff changeset	798 .endfunc
10046 1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	799
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	800 #if CONFIG_VORBIS_DECODER
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	801 function ff_vorbis_inverse_coupling_neon, export=1
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	802 vmov.i32 q10, #1<<31
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	803 subs r2, r2, #4
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	804 mov r3, r0
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	805 mov r12, r1
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	806 beq 3f
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	807
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	808 vld1.32 {d24-d25},[r1,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	809 vld1.32 {d22-d23},[r0,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	810 vcle.s32 q8, q12, #0
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	811 vand q9, q11, q10
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	812 veor q12, q12, q9
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	813 vand q2, q12, q8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	814 vbic q3, q12, q8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	815 vadd.f32 q12, q11, q2
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	816 vsub.f32 q11, q11, q3
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	817 1: vld1.32 {d2-d3}, [r1,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	818 vld1.32 {d0-d1}, [r0,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	819 vcle.s32 q8, q1, #0
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	820 vand q9, q0, q10
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	821 veor q1, q1, q9
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	822 vst1.32 {d24-d25},[r3, :128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	823 vst1.32 {d22-d23},[r12,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	824 vand q2, q1, q8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	825 vbic q3, q1, q8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	826 vadd.f32 q1, q0, q2
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	827 vsub.f32 q0, q0, q3
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	828 subs r2, r2, #8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	829 ble 2f
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	830 vld1.32 {d24-d25},[r1,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	831 vld1.32 {d22-d23},[r0,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	832 vcle.s32 q8, q12, #0
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	833 vand q9, q11, q10
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	834 veor q12, q12, q9
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	835 vst1.32 {d2-d3}, [r3, :128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	836 vst1.32 {d0-d1}, [r12,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	837 vand q2, q12, q8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	838 vbic q3, q12, q8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	839 vadd.f32 q12, q11, q2
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	840 vsub.f32 q11, q11, q3
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	841 b 1b
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	842
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	843 2: vst1.32 {d2-d3}, [r3, :128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	844 vst1.32 {d0-d1}, [r12,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	845 bxlt lr
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	846
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	847 3: vld1.32 {d2-d3}, [r1,:128]
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	848 vld1.32 {d0-d1}, [r0,:128]
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	849 vcle.s32 q8, q1, #0
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	850 vand q9, q0, q10
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	851 veor q1, q1, q9
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	852 vand q2, q1, q8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	853 vbic q3, q1, q8
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	854 vadd.f32 q1, q0, q2
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	855 vsub.f32 q0, q0, q3
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	856 vst1.32 {d2-d3}, [r0,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	857 vst1.32 {d0-d1}, [r1,:128]!
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	858 bx lr
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	859 .endfunc
1e651d94b35f ARM: NEON optimised vorbis_inverse_coupling mru parents: 9969 diff changeset	860 #endif
10221 2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	861
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	862 function ff_vector_fmul_scalar_neon, export=1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	863 VFP len .req r2
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	864 NOVFP len .req r3
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	865 VFP vdup.32 q8, d0[0]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	866 NOVFP vdup.32 q8, r2
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	867 bics r12, len, #15
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	868 beq 3f
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	869 vld1.32 {q0},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	870 vld1.32 {q1},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	871 1: vmul.f32 q0, q0, q8
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	872 vld1.32 {q2},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	873 vmul.f32 q1, q1, q8
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	874 vld1.32 {q3},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	875 vmul.f32 q2, q2, q8
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	876 vst1.32 {q0},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	877 vmul.f32 q3, q3, q8
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	878 vst1.32 {q1},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	879 subs r12, r12, #16
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	880 beq 2f
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	881 vld1.32 {q0},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	882 vst1.32 {q2},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	883 vld1.32 {q1},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	884 vst1.32 {q3},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	885 b 1b
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	886 2: vst1.32 {q2},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	887 vst1.32 {q3},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	888 ands len, len, #15
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	889 bxeq lr
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	890 3: vld1.32 {q0},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	891 vmul.f32 q0, q0, q8
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	892 vst1.32 {q0},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	893 subs len, len, #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	894 bgt 3b
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	895 bx lr
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	896 .unreq len
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	897 .endfunc
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	898
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	899 function ff_vector_fmul_sv_scalar_2_neon, export=1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	900 VFP vdup.32 d16, d0[0]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	901 NOVFP vdup.32 d16, r3
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	902 NOVFP ldr r3, [sp]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	903 vld1.32 {d0},[r1,:64]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	904 vld1.32 {d1},[r1,:64]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	905 1: subs r3, r3, #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	906 vmul.f32 d4, d0, d16
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	907 vmul.f32 d5, d1, d16
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	908 ldr r12, [r2], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	909 vld1.32 {d2},[r12,:64]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	910 ldr r12, [r2], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	911 vld1.32 {d3},[r12,:64]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	912 vmul.f32 d4, d4, d2
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	913 vmul.f32 d5, d5, d3
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	914 beq 2f
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	915 vld1.32 {d0},[r1,:64]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	916 vld1.32 {d1},[r1,:64]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	917 vst1.32 {d4},[r0,:64]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	918 vst1.32 {d5},[r0,:64]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	919 b 1b
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	920 2: vst1.32 {d4},[r0,:64]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	921 vst1.32 {d5},[r0,:64]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	922 bx lr
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	923 .endfunc
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	924
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	925 function ff_vector_fmul_sv_scalar_4_neon, export=1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	926 VFP vdup.32 q10, d0[0]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	927 NOVFP vdup.32 q10, r3
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	928 NOVFP ldr r3, [sp]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	929 push {lr}
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	930 bics lr, r3, #7
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	931 beq 3f
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	932 vld1.32 {q0},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	933 vld1.32 {q2},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	934 1: ldr r12, [r2], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	935 vld1.32 {q1},[r12,:128]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	936 ldr r12, [r2], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	937 vld1.32 {q3},[r12,:128]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	938 vmul.f32 q8, q0, q10
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	939 vmul.f32 q8, q8, q1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	940 vmul.f32 q9, q2, q10
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	941 vmul.f32 q9, q9, q3
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	942 subs lr, lr, #8
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	943 beq 2f
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	944 vld1.32 {q0},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	945 vld1.32 {q2},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	946 vst1.32 {q8},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	947 vst1.32 {q9},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	948 b 1b
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	949 2: vst1.32 {q8},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	950 vst1.32 {q9},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	951 ands r3, r3, #7
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	952 popeq {pc}
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	953 3: vld1.32 {q0},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	954 ldr r12, [r2], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	955 vld1.32 {q1},[r12,:128]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	956 vmul.f32 q0, q0, q10
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	957 vmul.f32 q0, q0, q1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	958 vst1.32 {q0},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	959 subs r3, r3, #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	960 bgt 3b
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	961 pop {pc}
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	962 .endfunc
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	963
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	964 function ff_sv_fmul_scalar_2_neon, export=1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	965 VFP len .req r2
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	966 NOVFP len .req r3
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	967 VFP vdup.32 q8, d0[0]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	968 NOVFP vdup.32 q8, r2
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	969 ldr r12, [r1], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	970 vld1.32 {d0},[r12,:64]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	971 ldr r12, [r1], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	972 vld1.32 {d1},[r12,:64]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	973 1: vmul.f32 q1, q0, q8
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	974 subs len, len, #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	975 beq 2f
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	976 ldr r12, [r1], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	977 vld1.32 {d0},[r12,:64]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	978 ldr r12, [r1], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	979 vld1.32 {d1},[r12,:64]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	980 vst1.32 {q1},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	981 b 1b
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	982 2: vst1.32 {q1},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	983 bx lr
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	984 .unreq len
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	985 .endfunc
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	986
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	987 function ff_sv_fmul_scalar_4_neon, export=1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	988 VFP len .req r2
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	989 NOVFP len .req r3
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	990 VFP vdup.32 q8, d0[0]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	991 NOVFP vdup.32 q8, r2
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	992 1: ldr r12, [r1], #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	993 vld1.32 {q0},[r12,:128]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	994 vmul.f32 q0, q0, q8
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	995 vst1.32 {q0},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	996 subs len, len, #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	997 bgt 1b
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	998 bx lr
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	999 .unreq len
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1000 .endfunc
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1001
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1002 function ff_butterflies_float_neon, export=1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1003 1: vld1.32 {q0},[r0,:128]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1004 vld1.32 {q1},[r1,:128]
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1005 vsub.f32 q2, q0, q1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1006 vadd.f32 q1, q0, q1
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1007 vst1.32 {q2},[r1,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1008 vst1.32 {q1},[r0,:128]!
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1009 subs r2, r2, #4
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1010 bgt 1b
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1011 bx lr
2791393081ff ARM: NEON optimisations for some dsputil functions mru parents: 10047 diff changeset	1012 .endfunc
10228 b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1013
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1014 function ff_scalarproduct_float_neon, export=1
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1015 vmov.f32 q2, #0.0
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1016 1: vld1.32 {q0},[r0,:128]!
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1017 vld1.32 {q1},[r1,:128]!
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1018 vmla.f32 q2, q0, q1
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1019 subs r2, r2, #4
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1020 bgt 1b
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1021 vadd.f32 d0, d4, d5
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1022 vpadd.f32 d0, d0, d0
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1023 NOVFP vmov.32 r0, d0[0]
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1024 bx lr
b783894a1c62 ARM: NEON optimised scalarproduct_float mru parents: 10221 diff changeset	1025 .endfunc
10253 64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1026
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1027 function ff_int32_to_float_fmul_scalar_neon, export=1
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1028 VFP vdup.32 q0, d0[0]
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1029 VFP len .req r2
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1030 NOVFP vdup.32 q0, r2
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1031 NOVFP len .req r3
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1032
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1033 vld1.32 {q1},[r1,:128]!
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1034 vcvt.f32.s32 q3, q1
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1035 vld1.32 {q2},[r1,:128]!
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1036 vcvt.f32.s32 q8, q2
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1037 1: subs len, len, #8
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1038 pld [r1, #16]
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1039 vmul.f32 q9, q3, q0
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1040 vmul.f32 q10, q8, q0
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1041 beq 2f
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1042 vld1.32 {q1},[r1,:128]!
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1043 vcvt.f32.s32 q3, q1
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1044 vld1.32 {q2},[r1,:128]!
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1045 vcvt.f32.s32 q8, q2
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1046 vst1.32 {q9}, [r0,:128]!
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1047 vst1.32 {q10},[r0,:128]!
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1048 b 1b
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1049 2: vst1.32 {q9}, [r0,:128]!
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1050 vst1.32 {q10},[r0,:128]!
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1051 bx lr
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1052 .unreq len
64dd9515b93b ARM: NEON optimised int32_to_float_fmul_scalar mru parents: 10228 diff changeset	1053 .endfunc

Mercurial > libavcodec.hg

annotate arm/dsputil_neon_s.S @ 10266:8695a5f212fc libavcodec