log_gpu_memory='min_max' leads to error in parsing metrics keys #9010

cosw0t · 2021-08-20T08:49:54Z

🐛 Bug

log_gpu_memory='min_max' raises:

/usr/local/lib/python3.7/dist-packages/pytorch_lightning/trainer/connectors/logger_connector/logger_connector.py in _log_gpus_metrics(self)
    227     def _log_gpus_metrics(self):
    228         for key, mem in self.gpus_metrics.items():
--> 229             gpu_id = int(key.split("/")[0].split(":")[1])
    230             if gpu_id in self.trainer.accelerator_connector.parallel_device_ids:
    231                 self.trainer.lightning_module.log(key, mem, prog_bar=False, logger=True, on_step=True, on_epoch=False)

To Reproduce

https://colab.research.google.com/drive/13Q_YzybNXDRL7gBZsluIRqfBIq21G3Et?usp=sharing

The text was updated successfully, but these errors were encountered:

cosw0t added bug Something isn't working help wanted Open to be worked on labels Aug 20, 2021

SkafteNicki mentioned this issue Aug 20, 2021

Fig logging with log_gpu_memory='min_max' #9013

Merged

12 tasks

thomasw21 mentioned this issue Aug 20, 2021

[bugfix] Resolve memory not logged when missing metrics #8174

Merged

11 tasks

ananthsub mentioned this issue Aug 22, 2021

Revamp Device Stats Logging #9032

Closed

awaelchli closed this as completed in #9013 Aug 24, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

log_gpu_memory='min_max' leads to error in parsing metrics keys #9010

log_gpu_memory='min_max' leads to error in parsing metrics keys #9010

cosw0t commented Aug 20, 2021

log_gpu_memory='min_max' leads to error in parsing metrics keys #9010

log_gpu_memory='min_max' leads to error in parsing metrics keys #9010

Comments

cosw0t commented Aug 20, 2021

🐛 Bug

To Reproduce