你好,在elmo中,我看到输入的长度只是限制在200以内,但是每个句子的长度都不同,那么最后训练的向量的输出的形状是(batchsize, 200, dim)吗?在elmo中,是否允许padding以后的句子呢?如果允许,是不是就是以空格作为padding呢,我看tensorflow_hub中就是这样封装的。
你好,在elmo中,我看到输入的长度只是限制在200以内,但是每个句子的长度都不同,那么最后训练的向量的输出的形状是(batchsize, 200, dim)吗?在elmo中,是否允许padding以后的句子呢?如果允许,是不是就是以空格作为padding呢,我看tensorflow_hub中就是这样封装的。