TextCNN：理解与实践

主要需要更改的地方是

数据读取部分我用的torchtext并且需要设定长度.
在maxpool里面设置windows的大小的长度是句子长度-1而不是2.

详细更改内容参考代码。

流程图：

输入：[batch_size, seqence_length]

经过embedding：[batch_size, sequence_length, embedding_size]

使用：unsqueeze(1)，变成CNN可以进行卷积的维度[batch_size, 1, sequence_length, embedding_size]这个1相当于是channel的维度。本来卷积的CNN的输入数据就是[batch_size, in_channel, height, width]，这里的channel就是RGB。

出问题：

RuntimeError: Function AddmmBackward returned an invalid gradient at index 1 - got [128, 3] but expected shape compatible with [128, 147]

torch.Size([128, 100, 50]) embedding_X.shape [batch_size, sequence_length, embedding_size]

torch.Size([128, 1, 100, 50]) embedding_X.unsqueeze(1) add channel(=1) [batch, channel(=1), sequence_length, embedding_size]

==torch.Size([128, 3, 49, 1]) conv [batch_size, output_channel, 1, 1]==

torch.Size([128, 147]) [batch_size, output_channel11]

torch.Size([128, 5])

torch.Size([128])

在卷积的那步出错了，卷积的结果应当是[128,3,1,1]。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

TextCNN从理论到实践.md

TextCNN从理论到实践.md

TextCNN：理解与实践

Files

TextCNN从理论到实践.md

Latest commit

History

TextCNN从理论到实践.md

File metadata and controls

TextCNN：理解与实践