Implement cuDNN conv2D grad. #32

dan-zheng · 2018-10-18T19:15:51Z

Make conv2D_batch_grad backend-defined.
Implement cuDNN conv2D_batch_grad.
Enable gradR_loss on GPU.
(Not related) Implement TensorR transfer ops.

Conv2D is fully implemented for cuDNN.

- Make `conv2D_batch_grad` backend-defined. - Implement cuDNN `conv2D_batch_grad`.

- Add `fillInPlace` and `copyFloatArray` to `Backend` trait. - Add default implementation of `copyTensorData`, calling `copyFloatArray`. - Implement `fillInPlace` and `copyFloatArray` for GPU.

Update backend todo list.

Accumulate adjoint values in `conv2D_batch_grad`.

dan-zheng added 4 commits October 18, 2018 12:42

Implement conv2D grad on cudNN.

ca56e6f

- Make `conv2D_batch_grad` backend-defined. - Implement cuDNN `conv2D_batch_grad`.

Enable gradR_loss on GPU.

4d4a337

- Add `fillInPlace` and `copyFloatArray` to `Backend` trait. - Add default implementation of `copyTensorData`, calling `copyFloatArray`. - Implement `fillInPlace` and `copyFloatArray` for GPU.

Implement TensorR transfer ops.

dcb90ff

Update backend todo list.

Fix cuDNN conv2D_batch_grad, add test.

5ee53d4

Accumulate adjoint values in `conv2D_batch_grad`.

dan-zheng requested a review from feiwang3311 October 18, 2018 19:15

dan-zheng changed the title ~~Implement conv2D grad on cuDNN.~~ Implement cuDNN conv2D grad. Oct 18, 2018

Merge branch 'master' into cudnn-conv2d

535c1bb

feiwang3311 merged commit 663632d into feiwang3311:master Oct 19, 2018

dan-zheng deleted the cudnn-conv2d branch October 22, 2018 01:56

TiarkRompf mentioned this pull request Oct 22, 2018

Accelerated Backends (CPU & GPU) #8

Open

18 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Implement cuDNN conv2D grad. #32

Implement cuDNN conv2D grad. #32

dan-zheng commented Oct 18, 2018

Implement cuDNN conv2D grad. #32

Implement cuDNN conv2D grad. #32

Conversation

dan-zheng commented Oct 18, 2018