转载机器之心报道 编辑:泽南、小舟这可能是当今最全面、最新的深度学习概述之一。 爆火的深度学习领域,最近又有了热门学习资料。
近日,麻省理工出版社的新书《Understanding Deep Learning》(深入理解深度学习)迎来了中文版。
这本书一共分为 21 个章节,涵盖了深度学习领域的许多关键概念,包括基本构建、Transformer 架构、图神经网络 GNN、强化学习 RL、扩散模型等等。对于不论是初学者,还是已有工作经验的开发者来说都有极高的价值。
GitHub 链接:https://github.com/careywyr/UnderstandingDeepLearning-ZH-CN * 书籍原链接:https://udlbook.github.io/udlbook/
目前,该书的英文电子版下载量已达到 34.4 万。
该书的实体版本在去年 12 月正式发布,全书共 541 页,不过它的电子版一直在继续更新。目前在网站上,作者还提供了 68 个 Python 笔记本练习,可以帮助读者通过编程实践加深理解。
本书希望以准确易懂的方式,向人们介绍深度学习的基础思想,旨在帮助刚入门的读者理解深度学习背后的原理。对于想要深入理解本书内容的读者来说,只需要本科水平的数学知识就能读懂。
具体来说,该书在前面的部分介绍了深度学习模型,并讨论了如何训练、评估这些模型,如何提高它们的性能的方法。在接下来的部分,作者会带领我们考察专门用于图像、文本和图数据的架构。后续的章节探讨了生成模型和强化学习。倒数第二章探讨了这些以及其他尚未完全理解的方面。最后一章讨论了 AI 伦理。
目录
第一章 - Introduction 介绍 第二章 - Supervised learning 监督学习 第三章 - Shallow neural networks 浅层神经网络 第四章 - Deep neural networks 深度神经网络 第五章 - Loss functions 损失函数 第六章 - Fitting models 训练模型 第七章 - Gradients and initialization 梯度和初始化 第八章 - Measuring performance 性能评估 第九章 - Regularization 正则化 第十章 - Convolutional networks 卷积网络 第十一章 - Residual networks 残差网络 第十二章 - Transformers 第十三章 - Graph neural networks 图神经网络 第十四章 - Unsupervised learning 无监督学习 第十五章 - Generative adversarial networks 生成对抗网络 第十六章 - Normalizing flows 标准化流 第十七章 - Variational autoencoders 变分自编码器 第十八章 - Diffusion models 扩散模型 第十九章 - Deep reinforcement learning 深度强化学习 第二十章 - Why does deep learning work? 为什么深度学习有效? 第二十一章 - Deep learning and ethics 深度学习与伦理
作者介绍
《深入理解深度学习》的作者是英国巴斯大学(University of Bath)计算机科学教授 Simon J.D. Prince,他专注于研究计算机视觉和计算机图形学。
领英资料显示,Simon J.D. Prince 十几年来一直在研究机构从事计算机科学和 AI 研究工作,例如曾在软件开发公司 Anthropics Technology 担任 7 年首席科学家。2022 年,他加入巴斯大学任名誉教授。
Simon J.D. Prince 已在顶级会议(CVPR、ICCV、SIGGRAPH 等)上发表超过 50 篇论文。他还是《计算机视觉:模型、学习和推理》的作者。
无人驾驶飞行器(UAV)又称无人机,它的发展给航空业带来了革命性的变化,并已成为现代战争的一部分。无人机最初是为军队开发的,用于执行对人类来说 "枯燥、肮脏或危险 "的任务,如今,无人机已被用于支持大量非军事任务,如治安和监视、航空摄影、包裹递送、森林火灾监测和扑救、农业、基础设施检查和科学工作等。无人机的军事用途始于越南战争,但在伊拉克冲突以及后来的阿富汗冲突中都有广泛使用。最近,在阿塞拜疆与亚美尼亚的冲突中,智能无人机的使用使阿塞拜疆明显占了上风。土耳其的 TB-2 无人机被乌克兰非常有效地用于收集情报,以对付强大得多的俄罗斯。显然,无人驾驶飞机技术现已成为增强战斗力的手段。
大多数无人机都有一名操控员,他从远程位置驾驶无人机,通过安全的通信链路控制无人机的使用。人工智能(IA)和机器学习(ML)以及高速机载计算的进步使无人机能够自主运行。在大多数空中任务中,无人机正在迅速取代人类。无人机被用于空中加油,无人驾驶旋翼机在移动的船只上自主着陆,无人机利用太阳能执行长时间飞行任务,还有无人驾驶或可选择有人驾驶的战斗机。无人机正在成千上万地组成完全协调的飞行群。有人机-无人机空中编队,即一架有人机控制一组无人机。这种编队将利用两种类型的优势。作战无人机正被用于情报、监视和侦察(ISR)、电子战、地面打击任务和空中作战。大型无人机执行货运任务的工作已经开始。实际上,有朝一日无人机将执行所有类型的空中任务。
无人机的尺寸和重量多种多样。无人机的分类还与其最大工作高度和航程有关。无人机可以小到昆虫,也可以大到客机。飞行高度带可以与有人驾驶飞机一样高。如果人类不在平台上,续航时间甚至可以长达数月。同样,无人机在进行高 "g "机动时也不再受人类生理机能的限制。无人机可以以超音速飞行,以后甚至可以以高超音速飞行。太空已经被无人系统所占据,因此,航空航天领域未来也会有更多的无人系统。
实际上,世界上所有重要的空军部队都拥有无人机。许多国家都在制造无人机和小型无人机。美国、以色列和中国在无人机制造领域处于全球领先地位。土耳其也正在成为一个重要的出口国。数以百万计的业余无人机在全球各地飞行。四旋翼无人机是业余无线电遥控飞机和玩具广泛流行的例证。
无人驾驶航空通勤飞行器已经过测试,很快就会出现在空中。这需要国际民用航空组织(ICAO)的规定,包括空中规则。还有适航认证问题。无人机遥控驾驶员需要进行分类,并获得有效期为 10 年的遥控驾驶员培训组织(RPTO)认证。必须为市内通勤指定特定的城市空中走廊。空中交通管理将面临新的动态。无人机销售也需要通过独特的识别号码和许可证进行监管。
战斗无人机拥有更大的自主权,可以在没有决策干预的情况下自由攻击和杀害人类,这涉及伦理和法律问题,需要加以解决。在无人机中,人类仍将以某种形式处于环路中,即使这意味着决定算法并拥有一定的优先权或否决权。设计板上的大多数高端未来飞机仍以飞行员为中心。因此,尽管无人驾驶飞行器取得了进步,但飞行员仍需要一些年才能看到空中的彩虹和高空的日落。
在伊拉克、阿富汗和伊朗等国,无人机曾被用来追踪和杀害人类。最近,一个配备致命武器的自主杀人机器人在利比亚袭击人类。无人机正被用于定点清除重要人物。2020 年 1 月 3 日,伊朗少将卡西姆-苏莱曼尼在巴格达国际机场被美军无人机击毙。2022 年 5 月初,911 袭击的实施者之一艾曼-扎瓦希里(Ayman al-Zawahiri)在喀布尔的一次超视距无人机袭击行动中丧生,当时他作为塔利班的客人居住在喀布尔。
无人机已被用于走私武器和毒品。恐怖分子可以利用无人机攻击目标,甚至击落飞机。携带小型手榴弹的无人机群可以神风特攻队的方式飞入大型集会,制造混乱。
由于无人机已成为一种强大的空中武器平台,使用反无人驾驶航空系统使其失效就变得非常重要。由于无人机体积小、特征低,探测总是会延迟。先进的雷达和光电探测手段正在不断发展。可以通过动能手段使用硬杀伤武器击落无人机,也可以使用电子战技术使其失效,或发射一张网缠住旋翼。
反无人机系统(C-UAS)技术的兴起主要是由于在民用和战时环境中不断扩大使用无人机(体积小、价格低的系统)所带来的新威胁。与探测系统一样,没有一种拦截系统是完全有效的。由于无人机技术的扩散,反无人机系统将不可避免地成为未来所有冲突中无处不在的武器。这些反无人机系统必须足够灵活,能够探测到各种形状和大小的无人机并使其失效。
本专著试图对无人机和反无人机技术在军事和民用领域的发展进行环境扫描,以及这些技术如何试图改变现代战争的性质,从低强度冲突到全面战争。
该专著分为三个部分,首先从历史角度介绍了无人机作为空中力量的一个要素是如何演变的。
第一部分用六章介绍了无人机技术,涉及无人机的组件、操作、技术进步以及影响其操作的法律问题等各个方面。
第二部分有两章,涉及与反无人机系统有关的操作和技术方面。
第三部分有两章,总结了目前使用这些系统的启示,以及在塑造这两种系统未来发展方向方面的经验教训。最后一章总结了无人机和反无人机的主题。
《构建LLM应用》深入探讨了LLMs提供的基本概念、前沿技术和实际应用,最终为扩展AI能力的大型基础模型(LFMs)的出现铺平了道路。 本书首先深入介绍了LLMs。接着,我们探索了各种主流的架构框架,包括专有模型(GPT 3.5/4)和开源模型(Falcon LLM),分析它们的独特优势和差异。随后,重点介绍了基于Python的轻量级框架LangChain。我们引导读者通过使用LLMs和强大的工具包创建能够从非结构化数据中检索信息并与结构化数据交互的智能代理。此外,书中还探讨了超越语言建模的LFMs领域,涵盖各种AI任务和模态,如视觉和音频。 无论你是经验丰富的AI专家还是该领域的新手,这本书都是你解锁LLMs全部潜力并开启智能机器新时代的路线图。
本书适合希望通过LLMs构建应用的软件工程师和数据科学家。本书也适合对应用LLM主题感兴趣的技术领导者、学生和研究人员。 我们不假设读者之前有LLM的相关经验,但读者应具备基本的机器学习/软件工程基础,以理解和应用内容。
在完成了金融学学士学位后,Valentina Alto于2021年获得数据科学硕士学位。她在微软开始了职业生涯,担任Azure解决方案专家,自2022年以来,主要专注于在制造和制药行业工作,与数据和AI解决方案相关。Valentina与系统集成商紧密合作,特别关注部署结合现代数据平台、数据网格框架和机器学习及人工智能应用的云架构。 在学术研究过程中,她热衷于AI和Python编程,积极撰写有关统计、机器学习、深度学习和AI的技术文章,并在各种出版物上发表。
通过理论理解深度强化学习(deep RL)中最流行的库,本新版专注于深度RL的最新进展,采用代码学习的方法,使读者能够理解并复现该领域的最新研究。
本书介绍了从游戏、机器人到金融的新代理环境,帮助读者尝试将强化学习应用于不同领域。多智能体强化学习章节涵盖了多个智能体的竞争方式,另一章节则专注于广泛使用的深度RL算法——近端策略优化(Proximal Policy Optimization, PPO)。读者将了解如何通过大型语言模型(如ChatGPT)使用人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)来提升对话能力。
本书还将介绍在多个云系统上使用代码和在Hugging Face Hub等平台上部署模型的步骤。代码采用Jupyter Notebook格式,可以在Google Colab等深度学习云平台上运行,允许读者根据自己的需求调整代码。无论是在游戏、机器人还是生成AI应用中,《Deep Reinforcement Learning with Python》都将帮助您保持技术前沿。
本书适合希望提升对深度RL理解并获取实际实现RL算法技能的软件工程师和机器学习开发者。通过本书,您将能够从头开始实现并优化RL算法,掌握前沿技术应用于实际项目。
《移动计算的未来》带领读者全面了解快速发展的移动技术领域。书籍以详尽探讨该领域的基础概念为开端,深入解析边缘计算这一变革性技术。随后的章节涵盖了移动计算的各个方面,涉及可持续农业解决方案、最新的移动硬件和设计趋势,以及人工智能在移动环境中的重要作用。书中重点介绍了智能移动助手,强调了机器学习的影响。读者将了解塑造可持续移动技术的环保创新以及移动计算在智慧城市中的实际应用。书中还详细探讨了隐私和安全挑战,提供了保护用户数据的强大策略。其他章节则介绍了增强现实和虚拟现实在现代移动计算环境中的变革潜力。书中还探索了如多模态人工智能嵌入区块链安全的智能学生监控等创新方法,以及移动计算与心理健康分析的独特交集。书籍在结尾对变革性技术及其与移动计算的融合进行了前瞻性探讨,提供了在创新前沿导航的宝贵见解。总体而言,本书是寻求全面了解未来移动技术的个人必不可少的资源。
**《C++中的面向对象软件设计》**通过研究优质和劣质代码,学习面向对象设计的基础知识!设计良好的应用程序运行更高效,错误更少,更易于修订和维护。《C++中的面向对象软件设计》通过引人入胜的“前后对比”方法,向你展示了糟糕软件的样子,并教你如何通过良好的设计原则和模式来修复它。在《C++中的面向对象软件设计》中,你将发现:
通过设计-编码-测试的迭代改进代码
收集需求以确保你正在开发正确的应用程序
解决编程问题的设计原则,如封装和委托
包括观察者设计模式在内的设计模式,修复架构问题
使用递归和多线程简化常见解决方案 《C++中的面向对象软件设计》是一本至关重要的指南,帮助你构建由专业人士交付的高性能应用程序——所有这些都使用经过行业验证的设计原则和模式。你将学习如何收集和分析需求,以确保你正在构建客户真正需要的东西,通过迭代开发追溯错误,并建立一个设计模式工具箱,用于排除应用程序架构中的常见问题。书中的示例使用C++17编写,但其通用原则可以应用于任何面向对象的语言。购买印刷版图书可免费获得来自Manning Publications的PDF和ePub格式的电子书。关于技术良好的设计是优秀软件的基础。掌握面向对象设计原则是创建运行快速、错误少、长久耐用应用程序的最可靠方法。本书专为新手C++程序员编写,以易读的方式引导你掌握设计优秀软件的艺术。关于本书《C++中的面向对象软件设计》以清晰、无行话的语言介绍了面向对象设计原则、实践和模式。立刻熟悉的前后对比示例突显了良好设计的好处。每一章都充满了友好的对话,预见你的疑问并帮助指出你可能忽略的细节。在此过程中,你将获得关于地道C++风格的提示,使你的代码更具特色。书中内容
设计-编码-测试迭代
常见编程问题的设计原则
用通俗语言解释的架构设计模式
递归和多线程 读者对象示例使用C++17编写。作者简介罗纳德·马克(Ronald Mak)是圣荷西州立大学面向对象分析与设计的高评价讲师。他的职业生涯包括担任NASA和JPL的高级计算机科学家,参与了诸如火星探测器和猎户座航天器等重大任务。罗纳德的专业领域包括IBM的研究,劳伦斯利弗莫尔国家实验室的企业软件战略,以及苹果和Sun Microsystems的高级职位。他拥有斯坦福大学的数学科学和计算机科学学位,并拥有12项软件专利。《C++中的面向对象软件设计》是他的第六本书。目录****第一部分