Skip to content

Latest commit

 

History

History
22 lines (14 loc) · 1.12 KB

DEQ.md

File metadata and controls

22 lines (14 loc) · 1.12 KB

Deep Equilibrium Models

https://arxiv.org/abs/1909.01377

概要

系列データに対してneural ODE(層数無限のDNN)として考えた時の不動点をblack-box RootFindingにより探す。

”暗黙的な微分”を使って解析的に解が解けるところがbackpopagationに対する利点 neural ODEの系譜なのでメモリ使用量が少ない。

self-attention transformers, trellis networksなどに対して適用している。

WikiText-103 データセットを用いた検証を行なっている。

本文9ページ

実装

https://github.com/locuslab/deq

関連?

一方でDNNの学習過程に平均場理論を適用することでは初期値を秩序相とカオス相の境界に置くことで勾配の消失、発散を起こさず学習ができるという研究がある。