Workaround for nested fused op: run FusedOpDecomposition twice.

1bc3b21a · Adam Rogowiec · 94649220 · 1bc3b21a · 1bc3b21a
Commit 1bc3b21a authored May 22, 2019 by Adam Rogowiec
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 0 deletions

gpu_compiled_function.cpp src/ngraph/runtime/gpu/gpu_compiled_function.cpp +1 -0

intelgpu_backend.cpp src/ngraph/runtime/intelgpu/intelgpu_backend.cpp +2 -0

No files found.
--- a/src/ngraph/runtime/gpu/gpu_compiled_function.cpp
+++ b/src/ngraph/runtime/gpu/gpu_compiled_function.cpp
@@ -172,6 +172,7 @@ void runtime::gpu::GPUCompiledFunction::compile()
    pass_manager.register_pass<runtime::gpu::pass::BatchNormCache>();
    pass_manager.register_pass<ngraph::pass::LikeReplacement>();
    pass_manager.register_pass<ngraph::pass::FusedOpDecomposition>();
+    pass_manager.register_pass<ngraph::pass::FusedOpDecomposition>();
    pass_manager.register_pass<runtime::gpu::pass::GPULayout>(this);
    pass_manager.register_pass<ngraph::pass::AssignLayout<descriptor::layout::DenseTensorLayout>>();
    pass_manager.register_pass<ngraph::pass::GetOutputElementElimination>();

--- a/src/ngraph/runtime/intelgpu/intelgpu_backend.cpp
+++ b/src/ngraph/runtime/intelgpu/intelgpu_backend.cpp
@@ -425,6 +425,8 @@ shared_ptr<runtime::Executable>
    {
        pass_manager.register_pass<ngraph::pass::FusedOpDecomposition>(
            IntelGPUBackend::is_supported_impl);
+        pass_manager.register_pass<ngraph::pass::FusedOpDecomposition>(
+            IntelGPUBackend::is_supported_impl);
    }

    if (m_disable_backend_optimizations < 1)