Lorsque vous écrivez cnn avec pytorch, utilisez torch.nn et écrivez comme suit
conv1 = torch.nn.Conv2d(in_channels , out_channels , kernel_size , stride , padding)
Puisque in_channel et out_channels sont le nombre de canaux dans le noyau, ils n'ont rien à voir avec la taille de l'image.
C'est la taille de la couche de regroupement et la taille de la foulée qui déterminent la taille de l'image d'entrée et de sortie (carte des caractéristiques). Donc, lors de l'empilement de deux ou plusieurs couches de cnn, je pense que cela fonctionnera si vous prenez soin de rendre le out_channel de la couche précédente égal à l'in_channel de la couche suivante.
Recommended Posts