论文题目
机器学习在固体材料科学中的最新进展和应用,Recent advances and applications of machine learning in solidstate materials science
论文简介
近年来进入材料科学工具箱的最令人兴奋的工具之一是机器学习。这些统计方法已经证明能够大大加快基础和应用研究的速度。目前,我们正在见证一个爆炸性的工作,开发和应用机器学习的固态系统。我们对本课题的最新研究进行了全面的综述和分析。作为起点,我们介绍了材料科学中的机器学习原理、算法、描述符和数据库。我们继续描述不同的机器学习方法,以发现稳定的材料并预测其晶体结构。然后我们讨论了大量的定量结构-性质关系的研究,以及用机器学习代替第一性原理方法的各种方法。我们回顾了如何应用主动学习和基于代理的优化来改进rational设计过程和相关的应用实例。两个主要的问题总是机器学习模型的可解释性和从中获得的物理理解。因此,我们考虑可解释性的不同方面及其在材料科学中的重要性。最后,针对计算材料科学面临的各种挑战,提出了解决方案和未来的研究路径。
论文作者
Jonathan Schmidt,Mário R. G. Marques,来自马丁路德大学 物理研究所
本文综述了元学习在图像分类、自然语言处理和机器人技术等领域的应用。与深度学习不同,元学习使用较少的样本数据集,并考虑进一步改进模型泛化以获得更高的预测精度。我们将元学习模型归纳为三类: 黑箱适应模型、基于相似度的方法模型和元学习过程模型。最近的应用集中在将元学习与贝叶斯深度学习和强化学习相结合,以提供可行的集成问题解决方案。介绍了元学习方法的性能比较,并讨论了今后的研究方向。
主题: A Review on Deep Learning Techniques for Video Prediction
摘要: 预测,预期和推理未来结果的能力是智能决策系统的关键组成部分。鉴于深度学习在计算机视觉中的成功,基于深度学习的视频预测已成为有前途的研究方向。视频预测被定义为一种自我监督的学习任务,它代表了一个表示学习的合适框架,因为它展示了提取自然视频中潜在模式的有意义的表示的潜在能力。视频序列预测的深度学习方法。我们首先定义视频预测的基础知识,以及强制性的背景概念和最常用的数据集。接下来,我们会仔细分析根据拟议的分类法组织的现有视频预测模型,突出显示它们的贡献及其在该领域的意义。数据集和方法的摘要均附有实验结果,有助于在定量基础上评估现有技术。通过得出一些一般性结论,确定开放研究挑战并指出未来的研究方向来对本文进行总结。
题目: Data Science in Economics
摘要:
本文介绍了经济学中数据科学的发展现状,通过在数据科学中的一个新的分类应用和方法的研究进展。数据科学的研究进展分为三类:深度学习模型、集成模型和混合模型。应用领域包括股票市场、市场营销、电子商务、企业银行和加密货币。Prisma方法是一种系统的文献综述方法,用于保证调查的质量。结果表明,混合模型的发展趋势为51%以上的文献采用了混合模型。另一方面,我们发现基于RMSE精度度量的混合模型具有比其他算法更高的预测精度,然而这是预期的趋势走向先进的深度学习模型。
题目: Exploring Benefits of Transfer Learning in Neural Machine Translation
摘要: 众所周知,神经机器翻译需要大量的并行训练语句,这通常会妨碍它在低资源语言对上的优势。本文探讨了跨语言迁移学习在神经网络中的应用,以解决资源匮乏的问题。我们提出了几种转移学习方法来重用预先训练在高资源语言对上的模型。我们特别注意技术的简单性。我们研究了两种情形:(a)当我们重用高资源模型而不事先修改其训练过程时;(b)当我们可以预先准备第一阶段的高资源模型用于转移学习时。对于前一个场景,我们通过重用其他研究人员训练的模型,提出了一种概念证明方法。在后一种情况下,我们提出了一种在翻译性能上得到更大改进的方法。除了提出的技术外,我们还着重于对迁移学习技术进行深入的分析,并试图对迁移学习的改进有所启发。我们展示了我们的技术如何解决低资源语言的特定问题,甚至在高资源转移学习中也是适用的。我们通过研究转移学习在各种情况下的潜在缺陷和行为,例如,在人为损坏的训练语料库下,或者在固定的模型部分下。
作者简介: Tom Kocmi,查尔斯特大学,数学与物理学院,形式与应用语言学研究所博士,他的主要研究方向是基于神经网络的机器翻译。个人主页:https://ufal.mff.cuni.cz/tom-kocmi
主题: Algorithmic Machine Learning and Data Science
介绍: 本课程数学严谨,需要以前的机器学习课程(例如CS-UY 4563、CS-GY 6923或ECE-GY 6143)和以前的算法设计和分析课程(例如CS-UY 2413、CS-GY 6033或CS-GY 6043)为基础。
讲师介绍: Christopher Musco,纽约大学坦顿工程学院计算机科学与工程的助理教授。他的研究是关于机器学习和数据科学的算法基础。他在麻省理工学院完成了计算机科学博士学位。在麻省理工学院之前,他是Redfin的工程师。
论文题目
数据科学中有关矩阵方法的文献综述:A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE
论文摘要
高效的数值线性代数是所有科学和工业学科中许多应用的核心组成部分。通过这项调查,我们想说明,随着数据和计算资源的可用性推动了许多新的发展,数字线性代数在支持和改进数据科学计算方面已经发挥并正在发挥关键作用。从数据中提取信息的研究已成为业务,工程,基础研究甚至文化的主要驱动力。 在这里,我们将数据科学视为借鉴了机器学习,数据挖掘和许多其他数学领域(例如优化或统计)的要素。 此外,我们要指出,为了从数据中获取信息,不一定意味着数据很大,但通常它们是这样的。
论文作者
MARTIN STOLL
题目: Machine learning and the physical sciences
摘要:
机器学习(ML)包含广泛的算法和建模工具,用于大量的数据处理任务,这些任务近年来已经进入大多数科学学科。本文有选择地回顾了机器学习与物理科学接口的最新研究进展。这包括由物理洞察力驱动的ML的概念发展,机器学习技术在物理中的几个领域的应用以及这两个领域之间的交叉。在介绍了机器学习方法和原理的基本概念之后,举例说明了如何用统计物理来理解ML中的方法,然后介绍了ML方法在粒子物理和宇宙学、量子多体物理、量子计算、化学和材料物理中的应用。此外,还强调了针对加速ML的新型计算体系结构的研究和开发。每个部分都描述了最近的成功以及特定领域的方法和挑战。
作者简介:
Giuseppe Carleo于2018年加入了位于美国计算量子物理中心的Flatiron研究所。2007年,他在罗马大学获得物理学学士学位;2011年,他在意大利国际高等研究学院获得凝聚态理论博士学位。他在法国光学研究所和瑞士苏黎世联邦理工学院获得博士后。他也是苏黎世联邦理工学院计算量子物理学的讲师。Carleo的主要研究方向是发展先进的数值算法来研究强相互作用量子系统的挑战性问题。他的研究应用范围包括凝聚态物质、超冷原子和量子计算。他对量子蒙特卡罗方法的发展做出了贡献,包括平衡和动态特性,包括时变蒙特卡罗和神经网络量子态。在CCQ,他正在开发和推广基于人工智能的新技术来解决量子问题。他是开源项目NetKet的创始人和开发负责人。
讲座题目
Recent Progress in Zeroth Order Optimization and Its Applications to Adversarial Robustness in Data Mining and Machine Learning
讲座简介
当梯度的显式表达式很难或不可能获得时,零阶(ZO)优化越来越被用来解决大数据和机器学习问题。它通过有效梯度估计近似全梯度实现无梯度优化。最近的一些重要应用包括:a)产生对深度神经网络的预测规避、黑箱对抗攻击;b)计算能力有限的在线网络管理;c)黑箱/复杂系统的参数推断;d)根据损失函数部分反馈的bandit优化她的对手所揭示的价值观。 本教程旨在全面介绍ZO优化方法在理论和应用方面的最新进展。在理论方面,我们将讨论ZO算法的收敛速度和迭代复杂性分析,并与它们的一阶对应进行比较。在应用方面,我们将重点介绍ZO优化在研究深层神经网络鲁棒性方面的一个很有吸引力的应用-从黑箱机器学习模型生成对抗性示例的实用有效的对抗性攻击。我们还将总结有关ZO优化、大数据挑战和一些开放式数据挖掘和机器学习问题的潜在研究方向。
讲座嘉宾
Pin-Yu Chen 是麻省理工学院-IBM人工智能实验室,IBM Thomas J.Watson研究中心,可信人工智能小组和PI的研究人员。最近的研究重点是对抗性机器学习和神经网络的鲁棒性,更广泛地说,使机器学习值得信赖。我的研究兴趣还包括图形学习、网络数据分析及其在数据挖掘、机器学习、信号处理和网络安全中的应用。
论文主题: Recent Advances in Deep Learning for Object Detection
论文摘要: 目标检测是计算机视觉中的基本视觉识别问题,并且在过去的几十年中已得到广泛研究。目标检测指的是在给定图像中找到具有精确定位的特定目标,并为每个目标分配一个对应的类标签。由于基于深度学习的图像分类取得了巨大的成功,因此近年来已经积极研究了使用深度学习的对象检测技术。在本文中,我们对深度学习中视觉对象检测的最新进展进行了全面的调查。通过复习文献中最近的大量相关工作,我们系统地分析了现有的目标检测框架并将调查分为三个主要部分:(i)检测组件,(ii)学习策略(iii)应用程序和基准。在调查中,我们详细介绍了影响检测性能的各种因素,例如检测器体系结构,功能学习,建议生成,采样策略等。最后,我们讨论了一些未来的方向,以促进和刺激未来的视觉对象检测研究。与深度学习。
【北京邮电大学】机器学习在材料科学中的应用综述,Machine learning in materials science https://onlinelibrary.wiley.com/doi/pdf/10.1002/inf2.12028