libavcodec.hg: i386/h264dsp

comparison i386/h264dsp_mmx.c @ 4527:481763d70193 libavcodec

prevent h.264 MC related functions from being inlined (yes this is much faster the code just doesnt fit in the code cache otherwise)

author	michael
date	Fri, 16 Feb 2007 21:21:07 +0000
parents	6e5dcbdbfeba
children	33c6fe489f62

comparison

equal deleted inserted replaced

-:30b8672a2357
+:481763d70193
 "paddw "#F", "#A"           \n\t"\
 "paddw "#A", %%mm6          \n\t"\
 "movq %%mm6, "#OF"(%1)      \n\t"
 #define QPEL_H264(OPNAME, OP, MMX)\
-static void OPNAME ## h264_qpel4_h_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
+static av_noinline void OPNAME ## h264_qpel4_h_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
 int h=4;\
 \
 asm volatile(\
 "pxor %%mm7, %%mm7          \n\t"\
 "movq %5, %%mm4             \n\t"\
 : "+a"(src), "+c"(dst), "+m"(h)\
 : "d"((long)srcStride), "S"((long)dstStride), "m"(ff_pw_5), "m"(ff_pw_16)\
 : "memory"\
 );\
 }\
-static void OPNAME ## h264_qpel4_h_lowpass_l2_ ## MMX(uint8_t *dst, uint8_t *src, uint8_t *src2, int dstStride, int src2Stride){\
+static av_noinline void OPNAME ## h264_qpel4_h_lowpass_l2_ ## MMX(uint8_t *dst, uint8_t *src, uint8_t *src2, int dstStride, int src2Stride){\
 int h=4;\
 asm volatile(\
 "pxor %%mm7, %%mm7          \n\t"\
 "movq %0, %%mm4             \n\t"\
 "movq %1, %%mm5             \n\t"\
 : "D"((long)src2Stride), "S"((long)dstStride)\
 : "memory"\
 );\
 }while(--h);\
 }\
-static void OPNAME ## h264_qpel4_v_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
+static av_noinline void OPNAME ## h264_qpel4_v_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
 src -= 2*srcStride;\
 asm volatile(\
 "pxor %%mm7, %%mm7          \n\t"\
 "movd (%0), %%mm0           \n\t"\
 "add %2, %0                 \n\t"\
 : "+a"(src), "+c"(dst)\
 : "S"((long)srcStride), "D"((long)dstStride), "m"(ff_pw_5), "m"(ff_pw_16)\
 : "memory"\
 );\
 }\
-static void OPNAME ## h264_qpel4_hv_lowpass_ ## MMX(uint8_t *dst, int16_t *tmp, uint8_t *src, int dstStride, int tmpStride, int srcStride){\
+static av_noinline void OPNAME ## h264_qpel4_hv_lowpass_ ## MMX(uint8_t *dst, int16_t *tmp, uint8_t *src, int dstStride, int tmpStride, int srcStride){\
 int h=4;\
 int w=3;\
 src -= 2*srcStride+2;\
 while(w--){\
 asm volatile(\
 : "S"((long)dstStride), "m"(ff_pw_32)\
 : "memory"\
 );\
 }\
 \
-static void OPNAME ## h264_qpel8_h_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
+static av_noinline void OPNAME ## h264_qpel8_h_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
 int h=8;\
 asm volatile(\
 "pxor %%mm7, %%mm7          \n\t"\
 "movq %5, %%mm6             \n\t"\
 "1:                         \n\t"\
 : "d"((long)srcStride), "S"((long)dstStride), "m"(ff_pw_5), "m"(ff_pw_16)\
 : "memory"\
 );\
 }\
 \
-static void OPNAME ## h264_qpel8_h_lowpass_l2_ ## MMX(uint8_t *dst, uint8_t *src, uint8_t *src2, int dstStride, int src2Stride){\
+static av_noinline void OPNAME ## h264_qpel8_h_lowpass_l2_ ## MMX(uint8_t *dst, uint8_t *src, uint8_t *src2, int dstStride, int src2Stride){\
 int h=8;\
 asm volatile(\
 "pxor %%mm7, %%mm7          \n\t"\
 "movq %0, %%mm6             \n\t"\
 :: "m"(ff_pw_5)\
 : "memory"\
 );\
 }while(--h);\
 }\
 \
-static inline void OPNAME ## h264_qpel8or16_v_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride, int h){\
+static av_noinline void OPNAME ## h264_qpel8or16_v_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride, int h){\
 int w= 2;\
 src -= 2*srcStride;\
 \
 while(w--){\
 asm volatile(\
 }\
 src += 4-(h+5)*srcStride;\
 dst += 4-h*dstStride;\
 }\
 }\
-static inline void OPNAME ## h264_qpel8or16_hv_lowpass_ ## MMX(uint8_t *dst, int16_t *tmp, uint8_t *src, int dstStride, int tmpStride, int srcStride, int size){\
+static av_noinline void OPNAME ## h264_qpel8or16_hv_lowpass_ ## MMX(uint8_t *dst, int16_t *tmp, uint8_t *src, int dstStride, int tmpStride, int srcStride, int size){\
 int h = size;\
 int w = (size+8)>>2;\
 src -= 2*srcStride+2;\
 while(w--){\
 asm volatile(\
 }\
 \
 static void OPNAME ## h264_qpel8_v_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
 OPNAME ## h264_qpel8or16_v_lowpass_ ## MMX(dst  , src  , dstStride, srcStride, 8);\
 }\
-static void OPNAME ## h264_qpel16_v_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
+static av_noinline void OPNAME ## h264_qpel16_v_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
 OPNAME ## h264_qpel8or16_v_lowpass_ ## MMX(dst  , src  , dstStride, srcStride, 16);\
 OPNAME ## h264_qpel8or16_v_lowpass_ ## MMX(dst+8, src+8, dstStride, srcStride, 16);\
 }\
 \
-static void OPNAME ## h264_qpel16_h_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
+static av_noinline void OPNAME ## h264_qpel16_h_lowpass_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\
 OPNAME ## h264_qpel8_h_lowpass_ ## MMX(dst  , src  , dstStride, srcStride);\
 OPNAME ## h264_qpel8_h_lowpass_ ## MMX(dst+8, src+8, dstStride, srcStride);\
 src += 8*srcStride;\
 dst += 8*dstStride;\
 OPNAME ## h264_qpel8_h_lowpass_ ## MMX(dst  , src  , dstStride, srcStride);\
 OPNAME ## h264_qpel8_h_lowpass_ ## MMX(dst+8, src+8, dstStride, srcStride);\
 }\
 \
-static void OPNAME ## h264_qpel16_h_lowpass_l2_ ## MMX(uint8_t *dst, uint8_t *src, uint8_t *src2, int dstStride, int src2Stride){\
+static av_noinline void OPNAME ## h264_qpel16_h_lowpass_l2_ ## MMX(uint8_t *dst, uint8_t *src, uint8_t *src2, int dstStride, int src2Stride){\
 OPNAME ## h264_qpel8_h_lowpass_l2_ ## MMX(dst  , src  , src2  , dstStride, src2Stride);\
 OPNAME ## h264_qpel8_h_lowpass_l2_ ## MMX(dst+8, src+8, src2+8, dstStride, src2Stride);\
 src += 8*dstStride;\
 dst += 8*dstStride;\
 src2 += 8*src2Stride;\
 \
 static void OPNAME ## h264_qpel16_hv_lowpass_ ## MMX(uint8_t *dst, int16_t *tmp, uint8_t *src, int dstStride, int tmpStride, int srcStride){\
 OPNAME ## h264_qpel8or16_hv_lowpass_ ## MMX(dst  , tmp  , src  , dstStride, tmpStride, srcStride, 16);\
 }\
 \
-static void OPNAME ## pixels4_l2_shift5_ ## MMX(uint8_t *dst, int16_t *src16, uint8_t *src8, int dstStride, int src8Stride, int h)\
+static av_noinline void OPNAME ## pixels4_l2_shift5_ ## MMX(uint8_t *dst, int16_t *src16, uint8_t *src8, int dstStride, int src8Stride, int h)\
 {\
 asm volatile(\
 "movq       %5,  %%mm6          \n\t"\
 "movq      (%1), %%mm0          \n\t"\
 "movq    24(%1), %%mm1          \n\t"\
 OP(%%mm1, (%2,%4), %%mm5, d)\
 :"+a"(src8), "+c"(src16), "+d"(dst)\
 :"S"((long)src8Stride), "D"((long)dstStride), "m"(ff_pw_16)\
 :"memory");\
 }\
-static void OPNAME ## pixels8_l2_shift5_ ## MMX(uint8_t *dst, int16_t *src16, uint8_t *src8, int dstStride, int src8Stride, int h)\
+static av_noinline void OPNAME ## pixels8_l2_shift5_ ## MMX(uint8_t *dst, int16_t *src16, uint8_t *src8, int dstStride, int src8Stride, int h)\
 {\
 asm volatile(\
 "movq       %0,  %%mm6          \n\t"\
 ::"m"(ff_pw_16)\
 );\

Mercurial > libavcodec.hg

comparison i386/h264dsp_mmx.c @ 4527:481763d70193 libavcodec