a233fceb859593143dbc29226f483f29253976ae,fairseq/multiprocessing_trainer.py,MultiprocessingTrainer,_async_backward_and_opt,#MultiprocessingTrainer#Any#Any#Any#,197

Before Change


        nccl.all_reduce(flat_grads)

        // normalize grads
        if grad_denom != 0:
            flat_grads.div_(grad_denom)

        // clip grads
        grad_norm = self._clip_grads_(flat_grads, self.args.clip_norm)

        // copy reduced grads back
        self._set_model_grads_(flat_grads)

After Change


                // backward pass
                self.loss.backward()
            except RuntimeError as e:
                if "out of memory" in str(e):
                    print("| WARNING: ran out of memory on GPU //{}, skipping batch".format(device_id))
                    oom = True
                    if hasattr(torch.cuda, "empty_cache"):
                        torch.cuda.empty_cache()
                    self.optimizer.zero_grad()
                else:
                    raise e

        // all-reduce grads and rescale by grad_denom
        self._all_reduce_and_rescale_grads(grad_denom)

        // clip grads
        grad_norm = torch.nn.utils.clip_grad_norm(self.model.parameters(), self.args.clip_norm)

In pattern: SUPERPATTERN

Frequency: 3

Non-data size: 4

Instances

Link

Project Name: pytorch/fairseq

Commit Name: a233fceb859593143dbc29226f483f29253976ae

Time: 2017-12-06

Author: myleott@fb.com

File Name: fairseq/multiprocessing_trainer.py

Class Name: MultiprocessingTrainer

Method Name: _async_backward_and_opt

Link

Project Name: open-mmlab/mmcv

Commit Name: 50a33950a4b23c614152696e6f979ae978233432

Time: 2020-10-14

Author: swanxinjiang@gmail.com

File Name: mmcv/runner/hooks/sync_buffer.py

Class Name: SyncBuffersHook

Method Name: after_epoch