e70bdb2d089ae283781c45b8d97963823a984baa,ch10/00_pong_pg.py,,,#,51

Before Change


            for p in net.parameters():
                grad_max = max(grad_max, p.grad.abs().max().data.cpu().numpy()[0])
                grad_means += (p.grad ** 2).mean().sqrt().data.cpu().numpy()[0]
                grad_vars += torch.var(p.grad).data.cpu().numpy()[0]
                grad_count += 1

            writer.add_scalar("baseline", baseline, step_idx)

After Change


            kl_div_v = -((new_prob_v / prob_v).log() * prob_v).sum(dim=1).mean()
            writer.add_scalar("kl", kl_div_v.data.cpu().numpy()[0], step_idx)

            grads = np.concatenate([p.grad.data.cpu().numpy().flatten()
                                    for p in net.parameters()
                                    if p.grad is not None])

            writer.add_scalar("baseline", baseline, step_idx)
            writer.add_scalar("entropy", entropy_v.data.cpu().numpy()[0], step_idx)
            writer.add_scalar("batch_scales", np.mean(batch_scales), step_idx)

In pattern: SUPERPATTERN

Frequency: 3

Non-data size: 3

Instances

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: e70bdb2d089ae283781c45b8d97963823a984baa

Time: 2017-12-15

Author: max.lapan@gmail.com

File Name: ch10/00_pong_pg.py

Class Name:

Method Name:

Link

Project Name: kengz/SLM-Lab

Commit Name: 861657d2c9b321961994c8cdd0e58b6c4fe0645f

Time: 2018-09-03

Author: kengzwl@gmail.com

File Name: slm_lab/agent/algorithm/sil.py

Class Name: SIL

Method Name: sample

Link

Project Name: facebookresearch/SentEval

Commit Name: 117abf20e0cab8340d5f4f5c31b904845f94f4b1

Time: 2017-10-05

Author: gyorgy@orosz.link

File Name: senteval/tools/classifier.py

Class Name: PyTorchClassifier

Method Name: predict_proba