📚 Módulo 9: Gerenciamento de Recursos e Problemas Comuns

Mesmo com QLoRA, é possível o esgotamento de memória no Colab. Estratégias:

Comece com 1 ou 2. Compense com gradient_accumulation_steps.

Reduza de 512 para 256 ou 384 se o conteúdo permitir.

model = torch.compile(model)

Pode acelerar o treinamento e reduzir a memória, mas nem sempre é estável.

torch.cuda.empty_cache()

Útil após carregar o modelo ou entre experimentos.

Normal se carregado com trust_remote_code=True ou usando PEFT. Não é crítico.

Use optim="adamw_bnb_8bit" ou optim="paged_adamw_8bit" em TrainingArguments.

Ignorar. Trainer lida com o modo automaticamente.

← Module8

Course: AI-course3

Language: PT

Lesson: Module9