modules · 2938860b3f292e600cfb7404faa78660ca86516c · submodule / opencv

Provide a few AVX512 optimized functions for the DNN module · 2938860b

Arjan van de Ven authored Dec 25, 2017

This patch adds AVX512 optimized fastConv as well as the hookups
needed to get these called in the convolution_layer.

AVX512 fastConv is code-identical on a C level to the AVX2 one,
but is measurably faster due to AVX512 having more registers available
to cache results in.
Signed-off-by: Arjan van de Ven <arjan@linux.intel.com>

2938860b

Name	Last commit	Last update
..
calib3d		Loading commit data...
core		Loading commit data...
cudaarithm		Loading commit data...
cudabgsegm		Loading commit data...
cudacodec		Loading commit data...
cudafeatures2d		Loading commit data...
cudafilters		Loading commit data...
cudaimgproc		Loading commit data...
cudalegacy		Loading commit data...
cudaobjdetect		Loading commit data...
cudaoptflow		Loading commit data...
cudastereo		Loading commit data...
cudawarping		Loading commit data...
cudev		Loading commit data...
dnn		Loading commit data...
features2d		Loading commit data...
flann		Loading commit data...
highgui		Loading commit data...
imgcodecs		Loading commit data...
imgproc		Loading commit data...
java		Loading commit data...
js		Loading commit data...
ml		Loading commit data...
objdetect		Loading commit data...
photo		Loading commit data...
python		Loading commit data...
shape		Loading commit data...
stitching		Loading commit data...
superres		Loading commit data...
ts		Loading commit data...
video		Loading commit data...
videoio		Loading commit data...
videostab		Loading commit data...
viz		Loading commit data...
world		Loading commit data...
CMakeLists.txt		Loading commit data...