Files · 7ff53f324c6084b7add14f58fe9cc68f05f3b365 · submodule / libyuv

I422ToYUY2Row_AVX2 use vpmovzxbd instead of vpermq · 7ff53f32

Frank Barchard authored Feb 02, 2018

I422ToYUY2Row_AVX2 optimized from 7 cycles per 32 pixels to 6 cycles.
Instead of 2 vpermq and vpunpcklbw:
vmovdqu    (%1),%%xmm2
vmovdqu    0x00(%1,%2,1),%%xmm3
lea        0x10(%1),%1
vpermq     $0xd8,%%ymm2,%%ymm2
vpermq     $0xd8,%%ymm3,%%ymm3
vpunpcklbw %%ymm3,%%ymm2,%%ymm2

..use vpmovzxbd to expand the bytes to shorts, then vpslld and vpor
vpmovzxbd  (%1),%%ymm2
vpmovzxbd  0x00(%1,%2,1),%%ymm3
vpslld     $0x10,%%ymm3,%%ymm3
vpor       %%ymm3,%%ymm2,%%ymm2
which reduces the port 5 bottleneck by 1 cycle.

Bug: libyuv:556
Test: out/Release/libyuv_unittest --gtest_filter=*I42?To*UY*Opt

I422ToYUY2Row_AVX2 optimization

Improve performance of AVX2 code by avoiding vpermq

Bug: libyuv:556
Test: /usr/local/google/home/fbarchard/iaca-lin64/bin/iaca.sh -reduceout -arch BDW out/Release/obj/libyuv_internal/row_gcc.o
Change-Id: Ie36732da23ecea1ffcc6b297bacc962780b59ef1
Reviewed-on: https://chromium-review.googlesource.com/898067
Commit-Queue: Frank Barchard <fbarchard@chromium.org>
Reviewed-by: richard winterton <rrwinterton@gmail.com>

7ff53f32

Name	Last commit	Last update
build_overrides		Loading commit data...
docs		Loading commit data...
include		Loading commit data...
infra/config		Loading commit data...
source		Loading commit data...
tools_libyuv		Loading commit data...
unit_test		Loading commit data...
util		Loading commit data...
.clang-format		Loading commit data...
.gitignore		Loading commit data...
.gn		Loading commit data...
.vpython		Loading commit data...
AUTHORS		Loading commit data...
Android.bp		Loading commit data...
Android.mk		Loading commit data...
BUILD.gn		Loading commit data...
CM_linux_packages.cmake		Loading commit data...
CMakeLists.txt		Loading commit data...
DEPS		Loading commit data...
LICENSE		Loading commit data...
LICENSE_THIRD_PARTY		Loading commit data...
OWNERS		Loading commit data...
PATENTS		Loading commit data...
PRESUBMIT.py		Loading commit data...
README.chromium		Loading commit data...
README.md		Loading commit data...
all.gyp		Loading commit data...
cleanup_links.py		Loading commit data...
codereview.settings		Loading commit data...
download_vs_toolchain.py		Loading commit data...
gyp_libyuv		Loading commit data...
gyp_libyuv.py		Loading commit data...
libyuv.gni		Loading commit data...
libyuv.gyp		Loading commit data...
libyuv.gypi		Loading commit data...
libyuv_nacl.gyp		Loading commit data...
libyuv_test.gyp		Loading commit data...
linux.mk		Loading commit data...
public.mk		Loading commit data...
pylintrc		Loading commit data...
winarm.mk		Loading commit data...

README.md