- twitter.com zhiyuanli_/status/1469167649972269061Stochastic Differential Equation (SDE) has been widely used to model and understand SGD, e.g., the famous Linear Scaling Rule follows directly from it. But is this heuristic approximation really valid in deep learning practice? paper: http...
- vk.com topic-44016343_29223109Но скорость не удовлетворяет требованиям и сейчас как я понимаю есть некоторые попытки это решить: (1) лаборатория Y/ Bengio и Y.Lecun сделали реализации на GPU (2) Использование ПЛИСов и специальных кристалов. http...
- ailev.livejournal.com 1079851.htmlМне задавали недавно вопросы про электронные мозговые протезы -- насколько это может быть реально? Вот несколько пруфлинков: -- главная статья с подробным описанием эксперимента на приматах тут: http...