libavcodec.hg: ppc/float_altivec.c annotate

annotate ppc/float_altivec.c @ 6323:e6da66f378c7 libavcodec

mpegvideo.h has two function declarations with the 'inline' specifier but no definition for those functions. The C standard requires a definition to appear in the same translation unit for any function declared with 'inline'. Most of the files including mpegvideo.h do not define those functions. Fix this by removing the 'inline' specifiers from the header. patch by Uoti Urpala

author	diego
date	Sun, 03 Feb 2008 17:54:30 +0000
parents	d5ba514e3f4a
children	f7cbb7733146

rev	line source
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	1 /*
49082584828a altivec float optimizations lu_zero parents: diff changeset	2 * Copyright (c) 2006 Luca Barbato <lu_zero@gentoo.org>
49082584828a altivec float optimizations lu_zero parents: diff changeset	3 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3659 diff changeset	4 * This file is part of FFmpeg.
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3659 diff changeset	5 *
c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3659 diff changeset	6 * FFmpeg is free software; you can redistribute it and/or
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	7 * modify it under the terms of the GNU Lesser General Public
49082584828a altivec float optimizations lu_zero parents: diff changeset	8 * License as published by the Free Software Foundation; either
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3659 diff changeset	9 * version 2.1 of the License, or (at your option) any later version.
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	10 *
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3659 diff changeset	11 * FFmpeg is distributed in the hope that it will be useful,
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	12 * but WITHOUT ANY WARRANTY; without even the implied warranty of
49082584828a altivec float optimizations lu_zero parents: diff changeset	13 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
49082584828a altivec float optimizations lu_zero parents: diff changeset	14 * Lesser General Public License for more details.
49082584828a altivec float optimizations lu_zero parents: diff changeset	15 *
49082584828a altivec float optimizations lu_zero parents: diff changeset	16 * You should have received a copy of the GNU Lesser General Public
3947 c8c591fe26f8 Change license headers to say 'FFmpeg' instead of 'this program/this library' diego parents: 3659 diff changeset	17 * License along with FFmpeg; if not, write to the Free Software
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	18 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
49082584828a altivec float optimizations lu_zero parents: diff changeset	19 */
49082584828a altivec float optimizations lu_zero parents: diff changeset	20
5010 d5ba514e3f4a Add libavcodec to compiler include flags in order to simplify header diego parents: 4387 diff changeset	21 #include "dsputil.h"
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	22
49082584828a altivec float optimizations lu_zero parents: diff changeset	23 #include "gcc_fixes.h"
49082584828a altivec float optimizations lu_zero parents: diff changeset	24
49082584828a altivec float optimizations lu_zero parents: diff changeset	25 #include "dsputil_altivec.h"
49082584828a altivec float optimizations lu_zero parents: diff changeset	26
49082584828a altivec float optimizations lu_zero parents: diff changeset	27 static void vector_fmul_altivec(float dst, const float src, int len)
49082584828a altivec float optimizations lu_zero parents: diff changeset	28 {
49082584828a altivec float optimizations lu_zero parents: diff changeset	29 int i;
49082584828a altivec float optimizations lu_zero parents: diff changeset	30 vector float d0, d1, s, zero = (vector float)vec_splat_u32(0);
49082584828a altivec float optimizations lu_zero parents: diff changeset	31 for(i=0; i<len-7; i+=8) {
49082584828a altivec float optimizations lu_zero parents: diff changeset	32 d0 = vec_ld(0, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	33 s = vec_ld(0, src+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	34 d1 = vec_ld(16, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	35 d0 = vec_madd(d0, s, zero);
49082584828a altivec float optimizations lu_zero parents: diff changeset	36 d1 = vec_madd(d1, vec_ld(16,src+i), zero);
49082584828a altivec float optimizations lu_zero parents: diff changeset	37 vec_st(d0, 0, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	38 vec_st(d1, 16, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	39 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	40 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	41
49082584828a altivec float optimizations lu_zero parents: diff changeset	42 static void vector_fmul_reverse_altivec(float dst, const float src0,
49082584828a altivec float optimizations lu_zero parents: diff changeset	43 const float *src1, int len)
49082584828a altivec float optimizations lu_zero parents: diff changeset	44 {
49082584828a altivec float optimizations lu_zero parents: diff changeset	45 int i;
49082584828a altivec float optimizations lu_zero parents: diff changeset	46 vector float d, s0, s1, h0, l0,
49082584828a altivec float optimizations lu_zero parents: diff changeset	47 s2, s3, zero = (vector float)vec_splat_u32(0);
49082584828a altivec float optimizations lu_zero parents: diff changeset	48 src1 += len-4;
49082584828a altivec float optimizations lu_zero parents: diff changeset	49 for(i=0; i<len-7; i+=8) {
49082584828a altivec float optimizations lu_zero parents: diff changeset	50 s1 = vec_ld(0, src1-i); // [a,b,c,d]
49082584828a altivec float optimizations lu_zero parents: diff changeset	51 s0 = vec_ld(0, src0+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	52 l0 = vec_mergel(s1, s1); // [c,c,d,d]
49082584828a altivec float optimizations lu_zero parents: diff changeset	53 s3 = vec_ld(-16, src1-i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	54 h0 = vec_mergeh(s1, s1); // [a,a,b,b]
49082584828a altivec float optimizations lu_zero parents: diff changeset	55 s2 = vec_ld(16, src0+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	56 s1 = vec_mergeh(vec_mergel(l0,h0), // [d,b,d,b]
49082584828a altivec float optimizations lu_zero parents: diff changeset	57 vec_mergeh(l0,h0)); // [c,a,c,a]
49082584828a altivec float optimizations lu_zero parents: diff changeset	58 // [d,c,b,a]
49082584828a altivec float optimizations lu_zero parents: diff changeset	59 l0 = vec_mergel(s3, s3);
49082584828a altivec float optimizations lu_zero parents: diff changeset	60 d = vec_madd(s0, s1, zero);
49082584828a altivec float optimizations lu_zero parents: diff changeset	61 h0 = vec_mergeh(s3, s3);
49082584828a altivec float optimizations lu_zero parents: diff changeset	62 vec_st(d, 0, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	63 s3 = vec_mergeh(vec_mergel(l0,h0),
49082584828a altivec float optimizations lu_zero parents: diff changeset	64 vec_mergeh(l0,h0));
49082584828a altivec float optimizations lu_zero parents: diff changeset	65 d = vec_madd(s2, s3, zero);
49082584828a altivec float optimizations lu_zero parents: diff changeset	66 vec_st(d, 16, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	67 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	68 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	69
49082584828a altivec float optimizations lu_zero parents: diff changeset	70 static void vector_fmul_add_add_altivec(float dst, const float src0,
49082584828a altivec float optimizations lu_zero parents: diff changeset	71 const float src1, const float src2,
49082584828a altivec float optimizations lu_zero parents: diff changeset	72 int src3, int len, int step)
49082584828a altivec float optimizations lu_zero parents: diff changeset	73 {
49082584828a altivec float optimizations lu_zero parents: diff changeset	74 int i;
49082584828a altivec float optimizations lu_zero parents: diff changeset	75 vector float d, s0, s1, s2, t0, t1, edges;
49082584828a altivec float optimizations lu_zero parents: diff changeset	76 vector unsigned char align = vec_lvsr(0,dst),
49082584828a altivec float optimizations lu_zero parents: diff changeset	77 mask = vec_lvsl(0, dst);
49082584828a altivec float optimizations lu_zero parents: diff changeset	78
49082584828a altivec float optimizations lu_zero parents: diff changeset	79 #if 0 //FIXME: there is still something wrong
49082584828a altivec float optimizations lu_zero parents: diff changeset	80 if (step == 2) {
49082584828a altivec float optimizations lu_zero parents: diff changeset	81 int y;
49082584828a altivec float optimizations lu_zero parents: diff changeset	82 vector float d0, d1, s3, t2;
49082584828a altivec float optimizations lu_zero parents: diff changeset	83 vector unsigned int sel =
49082584828a altivec float optimizations lu_zero parents: diff changeset	84 vec_mergeh(vec_splat_u32(-1), vec_splat_u32(0));
49082584828a altivec float optimizations lu_zero parents: diff changeset	85 t1 = vec_ld(16, dst);
49082584828a altivec float optimizations lu_zero parents: diff changeset	86 for (i=0,y=0; i<len-3; i+=4,y+=8) {
49082584828a altivec float optimizations lu_zero parents: diff changeset	87
49082584828a altivec float optimizations lu_zero parents: diff changeset	88 s0 = vec_ld(0,src0+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	89 s1 = vec_ld(0,src1+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	90 s2 = vec_ld(0,src2+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	91
49082584828a altivec float optimizations lu_zero parents: diff changeset	92 // t0 = vec_ld(0, dst+y); //[x x x\|a]
49082584828a altivec float optimizations lu_zero parents: diff changeset	93 // t1 = vec_ld(16, dst+y); //[b c d\|e]
49082584828a altivec float optimizations lu_zero parents: diff changeset	94 t2 = vec_ld(31, dst+y); //[f g h\|x]
49082584828a altivec float optimizations lu_zero parents: diff changeset	95
49082584828a altivec float optimizations lu_zero parents: diff changeset	96 d = vec_madd(s0,s1,s2); // [A B C D]
49082584828a altivec float optimizations lu_zero parents: diff changeset	97
49082584828a altivec float optimizations lu_zero parents: diff changeset	98 // [A A B B]
49082584828a altivec float optimizations lu_zero parents: diff changeset	99
49082584828a altivec float optimizations lu_zero parents: diff changeset	100 // [C C D D]
49082584828a altivec float optimizations lu_zero parents: diff changeset	101
49082584828a altivec float optimizations lu_zero parents: diff changeset	102 d0 = vec_perm(t0, t1, mask); // [a b c d]
49082584828a altivec float optimizations lu_zero parents: diff changeset	103
49082584828a altivec float optimizations lu_zero parents: diff changeset	104 d0 = vec_sel(vec_mergeh(d, d), d0, sel); // [A b B d]
49082584828a altivec float optimizations lu_zero parents: diff changeset	105
49082584828a altivec float optimizations lu_zero parents: diff changeset	106 edges = vec_perm(t1, t0, mask);
49082584828a altivec float optimizations lu_zero parents: diff changeset	107
49082584828a altivec float optimizations lu_zero parents: diff changeset	108 t0 = vec_perm(edges, d0, align); // [x x x\|A]
49082584828a altivec float optimizations lu_zero parents: diff changeset	109
49082584828a altivec float optimizations lu_zero parents: diff changeset	110 t1 = vec_perm(d0, edges, align); // [b B d\|e]
49082584828a altivec float optimizations lu_zero parents: diff changeset	111
49082584828a altivec float optimizations lu_zero parents: diff changeset	112 vec_stl(t0, 0, dst+y);
49082584828a altivec float optimizations lu_zero parents: diff changeset	113
49082584828a altivec float optimizations lu_zero parents: diff changeset	114 d1 = vec_perm(t1, t2, mask); // [e f g h]
49082584828a altivec float optimizations lu_zero parents: diff changeset	115
49082584828a altivec float optimizations lu_zero parents: diff changeset	116 d1 = vec_sel(vec_mergel(d, d), d1, sel); // [C f D h]
49082584828a altivec float optimizations lu_zero parents: diff changeset	117
49082584828a altivec float optimizations lu_zero parents: diff changeset	118 edges = vec_perm(t2, t1, mask);
49082584828a altivec float optimizations lu_zero parents: diff changeset	119
49082584828a altivec float optimizations lu_zero parents: diff changeset	120 t1 = vec_perm(edges, d1, align); // [b B d\|C]
49082584828a altivec float optimizations lu_zero parents: diff changeset	121
49082584828a altivec float optimizations lu_zero parents: diff changeset	122 t2 = vec_perm(d1, edges, align); // [f D h\|x]
49082584828a altivec float optimizations lu_zero parents: diff changeset	123
49082584828a altivec float optimizations lu_zero parents: diff changeset	124 vec_stl(t1, 16, dst+y);
49082584828a altivec float optimizations lu_zero parents: diff changeset	125
49082584828a altivec float optimizations lu_zero parents: diff changeset	126 t0 = t1;
49082584828a altivec float optimizations lu_zero parents: diff changeset	127
49082584828a altivec float optimizations lu_zero parents: diff changeset	128 vec_stl(t2, 31, dst+y);
49082584828a altivec float optimizations lu_zero parents: diff changeset	129
49082584828a altivec float optimizations lu_zero parents: diff changeset	130 t1 = t2;
49082584828a altivec float optimizations lu_zero parents: diff changeset	131 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	132 } else
49082584828a altivec float optimizations lu_zero parents: diff changeset	133 #endif
49082584828a altivec float optimizations lu_zero parents: diff changeset	134 if (step == 1 && src3 == 0)
49082584828a altivec float optimizations lu_zero parents: diff changeset	135 for (i=0; i<len-3; i+=4) {
4387 05ab6e897ffd 10l, there is a corner case afterall... lu_zero parents: 3947 diff changeset	136 t0 = vec_ld(0, dst+i);
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	137 t1 = vec_ld(15, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	138 s0 = vec_ld(0, src0+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	139 s1 = vec_ld(0, src1+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	140 s2 = vec_ld(0, src2+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	141 edges = vec_perm(t1 ,t0, mask);
49082584828a altivec float optimizations lu_zero parents: diff changeset	142 d = vec_madd(s0,s1,s2);
3659 dd55fb216497 Proper fix for the corner case that would have been corrected before, praise&blame to me and exg in equal shares lu_zero parents: 3657 diff changeset	143 t1 = vec_perm(d, edges, align);
dd55fb216497 Proper fix for the corner case that would have been corrected before, praise&blame to me and exg in equal shares lu_zero parents: 3657 diff changeset	144 t0 = vec_perm(edges, d, align);
dd55fb216497 Proper fix for the corner case that would have been corrected before, praise&blame to me and exg in equal shares lu_zero parents: 3657 diff changeset	145 vec_st(t1, 15, dst+i);
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	146 vec_st(t0, 0, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	147 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	148 else
49082584828a altivec float optimizations lu_zero parents: diff changeset	149 ff_vector_fmul_add_add_c(dst, src0, src1, src2, src3, len, step);
49082584828a altivec float optimizations lu_zero parents: diff changeset	150 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	151
49082584828a altivec float optimizations lu_zero parents: diff changeset	152 void float_to_int16_altivec(int16_t dst, const float src, int len)
49082584828a altivec float optimizations lu_zero parents: diff changeset	153 {
49082584828a altivec float optimizations lu_zero parents: diff changeset	154 int i;
49082584828a altivec float optimizations lu_zero parents: diff changeset	155 vector float s0, s1;
49082584828a altivec float optimizations lu_zero parents: diff changeset	156 vector signed int t0, t1;
49082584828a altivec float optimizations lu_zero parents: diff changeset	157 vector signed short d0, d1, d;
49082584828a altivec float optimizations lu_zero parents: diff changeset	158 vector unsigned char align;
49082584828a altivec float optimizations lu_zero parents: diff changeset	159 if(((long)dst)&15) //FIXME
49082584828a altivec float optimizations lu_zero parents: diff changeset	160 for(i=0; i<len-7; i+=8) {
49082584828a altivec float optimizations lu_zero parents: diff changeset	161 s0 = vec_ld(0, src+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	162 s1 = vec_ld(16, src+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	163 t0 = vec_cts(s0, 0);
49082584828a altivec float optimizations lu_zero parents: diff changeset	164 d0 = vec_ld(0, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	165 t1 = vec_cts(s1, 0);
49082584828a altivec float optimizations lu_zero parents: diff changeset	166 d1 = vec_ld(15, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	167 d = vec_packs(t0,t1);
49082584828a altivec float optimizations lu_zero parents: diff changeset	168 d1 = vec_perm(d1, d0, vec_lvsl(0,dst+i));
49082584828a altivec float optimizations lu_zero parents: diff changeset	169 align = vec_lvsr(0, dst+i);
3657 ff6720290478 Fix float_to_int16, unaligned case, broken by the previous commit lu_zero parents: 3583 diff changeset	170 d0 = vec_perm(d1, d, align);
ff6720290478 Fix float_to_int16, unaligned case, broken by the previous commit lu_zero parents: 3583 diff changeset	171 d1 = vec_perm(d, d1, align);
3581 49082584828a altivec float optimizations lu_zero parents: diff changeset	172 vec_st(d0, 0, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	173 vec_st(d1,15, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	174 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	175 else
49082584828a altivec float optimizations lu_zero parents: diff changeset	176 for(i=0; i<len-7; i+=8) {
49082584828a altivec float optimizations lu_zero parents: diff changeset	177 s0 = vec_ld(0, src+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	178 s1 = vec_ld(16, src+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	179 t0 = vec_cts(s0, 0);
49082584828a altivec float optimizations lu_zero parents: diff changeset	180 t1 = vec_cts(s1, 0);
49082584828a altivec float optimizations lu_zero parents: diff changeset	181 d = vec_packs(t0,t1);
49082584828a altivec float optimizations lu_zero parents: diff changeset	182 vec_st(d, 0, dst+i);
49082584828a altivec float optimizations lu_zero parents: diff changeset	183 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	184 }
49082584828a altivec float optimizations lu_zero parents: diff changeset	185
49082584828a altivec float optimizations lu_zero parents: diff changeset	186 void float_init_altivec(DSPContext* c, AVCodecContext *avctx)
49082584828a altivec float optimizations lu_zero parents: diff changeset	187 {
49082584828a altivec float optimizations lu_zero parents: diff changeset	188 c->vector_fmul = vector_fmul_altivec;
49082584828a altivec float optimizations lu_zero parents: diff changeset	189 c->vector_fmul_reverse = vector_fmul_reverse_altivec;
49082584828a altivec float optimizations lu_zero parents: diff changeset	190 c->vector_fmul_add_add = vector_fmul_add_add_altivec;
49082584828a altivec float optimizations lu_zero parents: diff changeset	191 if(!(avctx->flags & CODEC_FLAG_BITEXACT))
49082584828a altivec float optimizations lu_zero parents: diff changeset	192 c->float_to_int16 = float_to_int16_altivec;
49082584828a altivec float optimizations lu_zero parents: diff changeset	193 }

Mercurial > libavcodec.hg

annotate ppc/float_altivec.c @ 6323:e6da66f378c7 libavcodec