Compartilhamento de tecnologia

Como continuar o treinamento depois de salvar o modelo pytorch localmente

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

No PyTorch, você pode salvar e carregar o modelo e continuar o treinamento seguindo estas etapas:

  1. Salvar modelo

    Geralmente existem duas maneiras de salvar um modelo:

    • Salve todo o modelo (incluindo estrutura de rede, pesos, etc.):

      torch.save(model, 'model.pth')
    • Apenas o state_dict do modelo (contendo apenas parâmetros de peso) é salvo. Este método é recomendado porque economiza espaço de armazenamento e é mais flexível ao carregar:

      torch.save(model.state_dict(), 'model_weights.pth')
  2. Modelo de carga

    Correspondentemente, existem duas maneiras de carregar o modelo:

    • Se você salvou o modelo inteiro antes, poderá carregá-lo diretamente da seguinte maneira:

      model = torch.load('model.pth')
    • Se você salvou state_dict antes, precisará instanciar um modelo com a mesma estrutura do modelo original e depois passarload_state_dict()Método para carregar pesos:

      1. # 实例化一个与原模型结构相同的模型
      2. model = YourModelClass()
      3. # 加载保存的state_dict
      4. model.load_state_dict(torch.load('model_weights.pth'))
      5. # 确保将模型转移到正确的设备上(例如GPU或CPU)
      6. device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
      7. model.to(device)
  3. continuar treinando

    Depois de carregar o modelo, você pode continuar o treinamento. Certifique-se de ter definido a função de perda e o otimizador e de que seus estados estejam carregados corretamente (se você os salvou anteriormente).Depois, basta seguir o processo normal de treinamento

    1. # 定义损失函数和优化器
    2. criterion = nn.CrossEntropyLoss()
    3. optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
    4. # 如果之前保存了优化器状态,也可以加载
    5. optimizer.load_state_dict(torch.load('optimizer.pth'))
    6. # 开始训练
    7. for epoch in range(num_epochs):
    8. for inputs, labels in dataloader:
    9. inputs, labels = inputs.to(device), labels.to(device)
    10. optimizer.zero_grad()
    11. outputs = model(inputs)
    12. loss = criterion(outputs, labels)
    13. loss.backward()
    14. optimizer.step()

Dessa forma, você pode continuar treinando o modelo de onde o salvou pela última vez.