tdl/lecture_7 at master · deeppavlov/tdl

History

Name		Name	Last commit message	Last commit date
parent directory ..
GD_dynamics_part2.pdf		GD_dynamics_part2.pdf
README.md		README.md

README.md

This lecture:

For sufficiently wide nets with one hidden layer GD learns correct predictions on train set in time independent from number of parameters (https://openreview.net/forum?id=S1eK3i09YQ).

Slides; video.

Next lecture announcement:

Information bottleneck method (https://arxiv.org/abs/physics/0004057).

Phases of learning (https://arxiv.org/abs/1703.00810), critics (https://openreview.net/forum?id=ry_WPG-A-&noteId=ry_WPG-A-).

Representation learning, cross-entropy decomposition (https://arxiv.org/abs/1706.01350).

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

lecture_7

lecture_7

README.md

Files

lecture_7

Directory actions

More options

Directory actions

More options

Latest commit

History

lecture_7

Folders and files

parent directory

README.md