conference

NIPS

NIPS 2016

生成模型

highlight
GAN

Plug & Play Generative Networks - Ian Goodfellow

VAE

Variational Inference- David Blei
最有影响的是重新参数化(reparameterization)的技巧,该技巧可以通过随机变量实现反向传播,同时也推动了变自编码器上最新进展。

SAGA

SAGA VS BFGS - Francis Bach
https://arxiv.org/abs/1407.0202

others
Exponential Family Embeddings

一种多类型数据的全新强大的嵌入(embedding)技术,带来了用户使用嵌入技术评估数据的可能性。

Unsupervised Learning for Physical Interaction through Video Prediction

利用机器人的推动动作的数据来规划可能的未来。传统的代理(agent)学习算法严重依赖于监督,而这种类型的方法或许是机器人和类似领域未来的新方法。

Improving Variational Inference with Inverse Autoregressive Flow

结合了变分推断的最新进展和自动回归网络(autoregressive network)的一些想法,得出更好的编码模型。

强化学习

highlight
Value Iteration Network

该论文的主要创新在于其模型包含了一个可微分的「规划模块(planning module),这让网络可以做出规划并更好地泛化到其它从未见过的领域。

Sequential Neural Models with Stochastic Layers

将 状态空间模型(State Space Model)的想法和 RNN 结合起来,充分利用了两个领域的最好的东西。

Phased LSTMs

将「time gate」添加到了 LSTM 中,这显著改善了针对长序列数据的优化和表现。

Bayesian Intermittent Demand Forecasting for Large Inventories

讨论了针对大型库存的贝叶斯间断需求预测

Fast and Provably Good Seedings for k-Means

K-means 是许多数据科学应用的核心算法。不过,找到好的聚类中心(cluster centers)常常要依赖良好的初始化。Olivier Bachem 在论文《Fast and Provably Good Seedings for k-Means》中表明,他们可以获得良好的 centroid seeds,速度比当前最佳的算法(k-Means++)快几个数量级。更妙的是,他们还有代码,「pip install kmc2」= g2g。

others
Attend, Infer, Repeat: Fast Scene Understanding with Generative Models

提出了一种极具启发性的理解图像中场景的方法。使用贝叶斯和变分推理(Bayesian and Variational Inference),该论文的作者构建了一个可以无需任何监督就能理解图像中的数字、地址和物体类型的模型。这引起了较大的关注,因为他们的模型可以在训练样本之外的分布上进行推理/推导。当然,该模型确实需要一些特别的需求,但它们也提供了新的有趣的研究探索路径。

DeepMath—Deep Sequence Models for Premise Selection

提出的深度学习方法可以持续不断突破新的领域。一个来自 Google Research 的研究团队(包括 François Chollet and Geoffrey Irving)展示了世界上第一个使用深度学习进行自动理论证明(automated theorem proving)的案例。这项成果有助于加速系统的正确性证明,并可替代对该领域的专家所设计的特征的需求(其与自然语言有类似但也不同的结构)。它们可以自动选择与推理过程中的当前状态相关的操作运算,这个过程可以被扩展到其它领域,是一个非常激动人心的研究方向。

# Supervised Word Mover’s Distance

词嵌入帮助改变了许多自然语言处理任务,去年《Word Movers Distance》提供一种使用它们的嵌入在不同文档进行摘要的方法。对监督任务(比如,文本分类)而言,这可以更进一步。《Supervised Word Mover’s Distance》提出了可以执行仿射变换(affine transformation)和重新调整权重(re-weightings)的方法来提供分类,实现了有效的当前最佳的表现。

应用:机器人与汽车

Learning to Poke by Poking: Experiential Learning of Intuitive Physics。

他们使用了几百个小时数据(让机器人通过戳的动作来移动物体获得的)搭建了一个系统,机器人可以四处移动物体即使它从未见过这些物体。系统使用了 CNNs 来观察世界,有两个理解相关物理世界的模型。前向模型(forward model),用来预测一个动作/戳的结果,以及一个能够获取当前状况并将之映射到行动中的逆模型(inverse model)。通过一系列令人信服的视频,很明显,机器人已经学会如何相当普遍地四处移动物体。

似然推理、Dessert 类比(Dessert analogies)