fused_embedding_eltwise_layernorm_op and skip_layernorm_op support fp16 #44969

yuanlehome · 2022-08-08T03:46:54Z

PR types

Others

PR changes

Others

Describe

该PR效果：fused_embedding_eltwise_layernorm_op 和 skip_layernorm_op 算子添加对fp16的支持

测试模型：

import paddle
from paddle.static import InputSpec
import numpy as np
import os
import paddle.inference as inference

class EmbEwLnNet(paddle.nn.Layer):
    def __init__(self):
        super(EmbEwLnNet, self).__init__()
        self.embedding_layer1 = paddle.nn.Embedding(1024, 256, sparse=True)
        self.embedding_layer2 = paddle.nn.Embedding(1024, 256, sparse=True)
        self.embedding_layer3 = paddle.nn.Embedding(1024, 256, sparse=True)
        self.layer_norm = paddle.nn.LayerNorm(256)

    def forward(self, x1, x2, x3):
        x = self.embedding_layer1(x1) + self.embedding_layer2(x2)
        x = x + self.embedding_layer3(x3)
        x = self.layer_norm(x)
        return x


class SkipLnNet(paddle.nn.Layer):
    def __init__(self):
        super(SkipLnNet, self).__init__()
        self.layer_norm = paddle.nn.LayerNorm(256)

    def forward(self, x1, x2):
        x = x1 + x2
        x = self.layer_norm(x)
        return x

测试环境：
GPU Compute Capability: 7.5, Driver API Version: 11.4, Runtime API Version: 11.2, cuDNN Version: 8.1.
with warmup: 100 and repeats: 10000

fused_embedding_eltwise_layernorm_op算子

gpu原生

model	gpu
float	0.336549 ms
float16	0.165548 ms

trt加速

model	trt32	trt16
float	0.336706 ms	0.346024 ms
float16	0.338106 ms	0.284455 ms

skip_layernorm_op算子

gpu原生

model	gpu
float	0.27069 ms
float16	0.148987 ms

trt加速

model	trt32	trt16
float	0.293951 ms	-
float16	-	0.307114 ms

paddle-bot · 2022-08-08T03:46:58Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

CLAassistant · 2022-08-08T03:46:59Z

All committers have signed the CLA.

…d skip_layernorm_op

…norm_op_plugin

…evelop

jiweibo

LGTM

fused_embedding_eltwise_layernorm_op and skip_layernorm_op support fp16

c39f846

yuanlehome force-pushed the develop branch 3 times, most recently from 0bce992 to 76c989b Compare August 8, 2022 06:36

adjust register condition for fused_embedding_eltwise_layernorm_op an…

1626c00

…d skip_layernorm_op

yuanlehome force-pushed the develop branch from 76c989b to 1626c00 Compare August 8, 2022 09:25

yuanlehome added 6 commits August 8, 2022 10:06

Serializer support half

bc50cbd

Update skip_layernorm_op_plugin.cu

ececc6f

adjust supportsFormat for emb_eltwise_layernorm_plugin and skip_layer…

09deea8

…norm_op_plugin

update PADDLE_ENFORCE_EQ content

43e9043

fix some bugs

691a92a

fix SkipLayerNormKernel2 bug

d067122

yuanlehome force-pushed the develop branch from 8231ea3 to 89d7e44 Compare August 11, 2022 09:14

fix some bugs

786c6ea

yuanlehome force-pushed the develop branch from 3b28c1d to 786c6ea Compare August 11, 2022 13:53

yuanlehome and others added 7 commits August 11, 2022 21:54

Merge branch 'develop' into develop

4a7111e

add trt_skip_layernorm_fuse_pass in GpuPassStrategy

7dd06a6

Merge branch 'develop' into develop

1e97ed0

-

0d2cb5d

Merge branch 'develop' of https://github.com/yuanlehome/Paddle into d…

d85fce8

…evelop

update ernie serialize cache dir

3ec5712

close skip layernorm op plugin withfp16

f60ea0d

yuanlehome force-pushed the develop branch from 1cfc863 to f60ea0d Compare August 15, 2022 06:26

Merge branch 'develop' into develop

bbcc349

jiweibo approved these changes Aug 15, 2022

View reviewed changes

jiweibo merged commit ac0553a into PaddlePaddle:develop Aug 15, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fused_embedding_eltwise_layernorm_op and skip_layernorm_op support fp16 #44969

fused_embedding_eltwise_layernorm_op and skip_layernorm_op support fp16 #44969

yuanlehome commented Aug 8, 2022 •

edited

Loading

paddle-bot bot commented Aug 8, 2022

CLAassistant commented Aug 8, 2022 •

edited

Loading

jiweibo left a comment

fused_embedding_eltwise_layernorm_op and skip_layernorm_op support fp16 #44969

fused_embedding_eltwise_layernorm_op and skip_layernorm_op support fp16 #44969

Conversation

yuanlehome commented Aug 8, 2022 • edited Loading

PR types

PR changes

Describe

paddle-bot bot commented Aug 8, 2022

CLAassistant commented Aug 8, 2022 • edited Loading

jiweibo left a comment

Choose a reason for hiding this comment

yuanlehome commented Aug 8, 2022 •

edited

Loading

CLAassistant commented Aug 8, 2022 •

edited

Loading