• Stochastic Differential Equation (SDE) has been widely used to model and understand SGD, e.g., the famous Linear Scaling Rule follows directly from it. But is this heuristic approximation really valid in deep learning practice? paper: http...
  • Но скорость не удовлетворяет требованиям и сейчас как я понимаю есть некоторые попытки это решить: (1) лаборатория Y/ Bengio и Y.Lecun сделали реализации на GPU (2) Использование ПЛИСов и специальных кристалов. http...
  • Мне задавали недавно вопросы про электронные мозговые протезы -- насколько это может быть реально? Вот несколько пруфлинков: -- главная статья с подробным описанием эксперимента на приматах тут: http...