“一图胜千言”

为图像处理课程设计(IP)旨在研究生和大四本科生,在任何领域的工程,这本书从第一章概述如何安装摄像头成像雷达的核磁共振成像和猫形态图像,然后继续覆盖广泛的图像处理主题。IP主题包括:图像插值、放大、缩略图和锐化、边缘检测、噪声滤波、模糊图像的去模糊、监督和非监督学习、图像分割等。

成为VIP会员查看完整内容
0
53
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

智能时代,AI 中台是企业管理能力、企业活力、企业“智力”提升的重要动力来源。思考企业的未来,AI 中台将是企业在复杂时代下生存和发展的“必需品”和“必修课”。

日前,百度智能云与人工智能产业发展联盟联合发布了《AI 中台白皮书(2021年)》。AI 中台作为全栈式、集约化、自动化的生产力工具箱,是实现AI技术在各行业中快速研发、共享复用和部署管理的智能化底座和关键基础设施。白皮书旨在深入剖析 AI 中台体系架构与内涵,探讨能力建设路径和行业赋能方案,以期与业界分享,共同推动我国人工智能产业创新发展与行业智能化升级。

白皮书指出,AI 中台是实现智能化能力普惠的必备基础设施,负责构建企业的 AI 生产力,一般包括 AI 技术服务平台、AI 研发平台、AI 管理运行三大核心。

白皮书展开论述了 AI 中台所应具备的四大关键能力。概括来看,AI 数据需求趋于精细化、场景化,健全的数据服务体系会是AI 中台的基础;自动机器学习技术加速演进,AI 研发平台成为了技术普惠的关键;AI 部署运行愈加复杂,体系化工具成为了规模化应用的保障;AI 模型已经成为了企业新型资产,AI 资产化管理势在必行。

企业如何建设自己的 AI 中台体系呢?白皮书给出了两类建设路径和三大要素支撑。

面向企业智能化升级的不同阶段,AI 中台建设有两类路径:一类是对于处于 AI 能力起步期的企业,会先从 AI 能力直接赋能,再逐步发展到自主建模和个性化创新,构建 AI 能力创新底座;另外是面向已具备专业 AI 建模专家及算法团队的企业,可以聚焦个性化 AI 研发能力的构建,进而大幅提升 AI 模型落地应用推广效率。

三大要素则是企业智能化升级的坚实支撑。在基础设施建设方面,AI 中台支撑企业完成软件部署,并与已有的私有云、数据中台、视频平台等 IT 设施进行对接集成。支持企业结合自身业务场景,构建 AI 应用能力,围绕 AI 中台软件、基础应用集成、业务应用集成三大模块,打造企业 AI 能力的核心技术底座。

在组织能力建设方面,AI 中台为企业提供组织变革、流程创新、人才培养等方面建议,通过建立组织保障机制,明确机构中包括模型生产、服务管理、运维保障在内的各个工作组职责及流程,确保 AI中台管理组织的高效运转。此外,帮助企业持续培养人工智能相关的技术开发人员及运营管理人员,保证 AI 能力开发管理的人才供给。

在运营优化方面,AI 应用实际投产后,企业需结合业务反馈数据不断进行优化调整,确保应用成效。

借助高效灵活的适配能力,AI 中台已在制造、能源、金融、城市、医疗等诸多行业落地应用并取得显著成效,切实解决企业生产运行痛点,满足企业设计、生产、管理、销售和运维等个性化场景需求。

展望未来,AI 中台作为企业智能中枢,在不断完善提升自身能力的同时,将成为伴随企业成长、构筑核心竞争力的重要抓手和关键支撑。未来2-5年,AI 中台将作为创新型企业运转不可或缺的基础设施;未来5-10年,AI 中台将融入企业成长的全生命周期,企业建设、应用和运营 AI 中台的能力,将成为衡量未来发展潜力和成长价值的关键指标,助力构筑企业核心竞争力。

以 AI 中台助力行业高质量发展,提升国家供给侧水平,将在数字社会与智能经济时代获得发展先机。过去二十年,移动互联网对人类社会的影响集中体现在 C 端,即需求端;但在 AI 时代,人工智能将更多从 B 端,即供给端改变。AI 中台作为“ AI 大生产平台”的生产力载体,从更好推进 AI 行业落地、实现技术价值增值角度,正在加快帮助企业适应新形势、新变化与新挑战。AI 中台技术所带来的行业变革,将是一场更彻底的供给侧改革,成为推动国家迈进智能未来时代的重要力量。

人工智能革命将个体价值的创造释放提升到前所未有高度,AI 中台通过推动行业智能变革为社会带来更为光明的未来。AI 中台赋能能力正在从通用行业(如制造、金融、教育等)向专业精细化行业(如生物医药、化学化工、半导体等)延伸拓展,帮助企业不断拓展应用视野和创新边界,推动人类社会创新进步。AI 中台将帮助企业追求更有创造力、影响力和领导力的自我价值实现,为整个智能社会带来更大提升空间、更多发展可能。

成为VIP会员查看完整内容
1
46

数据科学概率导论

这本书是大学概率论的入门教材。它有一个使命: 阐明我们在科学和工程中使用的概率工具的动机、直觉和含义。从超过五年的课程教学中,我提炼出了我认为是概率方法的核心。我把这本书放在数据科学的背景下,以强调数据(计算)和概率(理论)在我们这个时代的不可分离性。

地址: https://probability4datascience.com/index.html

概率论是电子工程和计算机科学中最有趣的学科之一。它将我们喜爱的工程原理与现实联系起来,这是一个充满不确定性的世界。然而,因为概率是一门非常成熟的学科,单是本科生的课本就可能在图书馆的书架上摆满好几排书。当文学如此丰富时,挑战就变成了一个人如何在深入细节的同时洞察到洞察力。例如,你们中的许多人以前使用过正态随机变量,但你们是否想过“钟形”是从哪里来的?每一门概率课都会教你抛硬币,但是“抛硬币”在今天的机器学习中有什么用呢?数据科学家使用泊松随机变量来模拟互联网流量,但是这个漂亮的泊松方程是从哪里来的呢?这本书的目的是填补这些知识的差距,这是所有数据科学学生必不可少的。

这就引出了本书的三个目标。(i) 动机: 在数学定义、定理、方程的海洋中,为什么我们要把时间花在这个主题上,而不是其他的? (ii) 直觉: 当进行推导时,在这些方程之外是否有几何解释或物理学?(iii) 言外之意: 当我们学习了一个话题后,我们可以解决哪些新问题?本书的目标读者是电子工程和计算机科学专业的本科生三、四年级和一年级研究生。先决条件是标准的本科线性代数和微积分,除了需要傅里叶变换的特征函数部分。一门信号与系统的本科课程就足够了,即使是在学习这本书的同时选修。

这本书的篇幅适合两学期的课程。教师被鼓励使用最适合他们的课程的章节集。例如,基本概率课程可以使用第1-5章作为主干。关于样本统计的第6章适合希望获得概率收敛理论见解的学生。关于回归的第七章和关于估计的第八章最适合学习机器学习和信号处理的学生。第9章讨论了对现代数据分析至关重要的置信区间和假设检验。第10章介绍了随机过程。我的随机过程方法更适合于信息处理和通信系统,这通常与电气工程专业的学生更相关。

本书特色:

涵盖范围广,从经典的概率论到现代数据分析技术 概念的几何和图形解释 与MATLAB / Python紧密集成 机器学习的实际应用

目录内容

Chapter 1 Mathematical Background Chapter 2 Probability Chapter 3 Discrete Random Variables Chapter 4 Continuous Random Variables Chapter 5 Joint Distributions Chapter 6 Sample Statistics Chapter 7 Regression Chapter 8 Estimation Chapter 9 Confidence and Hypothesis Chapter 10 Random Processes

成为VIP会员查看完整内容
0
45

在过去的几十年里,组合优化和图论——作为组合学的整个领域——经历了特别快速的发展。这一事实有多种原因;一个是,例如,应用组合论证已经变得越来越普遍。然而,数学之外的两个发展可能更为重要:首先,组合优化的许多问题直接产生于工程和管理的日常实践:确定交通或通信网络中最短或最可靠的路径,最大或相容的流量,或最短的线路;规划交通网络的连接;协调项目;解决供需问题。第二,随着越来越高效的计算机系统的发展,那些属于运筹学的任务的实际实例已经可以得到。此外,组合优化问题对复杂性理论也很重要,复杂性理论是数学和理论计算机科学的交叉领域,涉及算法分析。组合优化是数学中令人着迷的一部分,它的魅力——至少对我来说——很大程度上来自于它的跨学科性和实用性。本书主要介绍了可以用图论方法表述和处理的组合优化部分;既不考虑线性规划理论,也不考虑多面体组合理论。

https://www.springer.com/gp/book/9783642322778

成为VIP会员查看完整内容
0
40

本文档包含了物理模拟环境中与深度学习相关的所有内容的实用和全面的介绍。尽可能多地,所有主题都以Jupyter形式提供了实际操作的代码示例,以便快速入门。除了标准的监督学习数据,我们将着眼于物理损失约束,更紧密耦合的学习算法与可微分模拟,以及强化学习和不确定性建模。我们生活在一个激动人心的时代: 这些方法有巨大的潜力从根本上改变计算机模拟所能达到的效果。

在本文中,我们将介绍将物理模型引入深度学习的不同方法,即基于物理的深度学习(PBDL)方法。为了增加集成的紧密性,将引入这些算法变体,并将讨论不同方法的优缺点。重要的是要知道每种不同的技术在哪些场景中特别有用。

成为VIP会员查看完整内容
0
38

摘要

科学研究的一个基本目标是了解因果关系。然而,尽管因果关系在生命和社会科学中发挥着关键作用,但在自然语言处理(NLP)中却没有同等的重要性,后者传统上更重视预测任务。随着因果推理和语言处理融合的跨学科研究的兴起,这种区别正开始消失。然而,关于NLP中因果关系的研究仍然分散在各个领域,没有统一的定义、基准数据集和对剩余挑战的清晰表述。在这项综述中,我们巩固了跨学术领域的研究,并将其置于更广阔的NLP景观中。我们介绍了估计因果效应的统计挑战,包括文本作为结果、治疗或解决混淆的手段的设置。此外,我们还探讨了因果推理的潜在用途,以改善NLP模型的性能、鲁棒性、公平性和可解释性。因此,我们为计算语言学界提供了一个统一的因果推理概述。

引言

许多科学领域对将融入文本为数据越来越感兴趣(例如,Roberts et al., 2014; Pryzant et al., 2017; Zhang et al., 2020a)。自然语言处理(NLP)研究人员可能不熟悉这些领域的一个关键特性,是强调因果推理,通常用于评估策略干预。例如,在推荐一种新的药物治疗之前,临床医生想知道这种药物对疾病进展的因果关系。因果推理涉及到一个通过干预创造的反事实世界的问题:如果我们给病人用药,他们的疾病进展会如何?正如我们下面所解释的,在观察数据中,因果关系并不等同于服用药物的患者与其观察到的疾病进展之间的相关性。现在有大量关于使用传统(非文本)数据集进行有效推理的技术的文献(例如,Morgan and Winship, 2015),但将这些技术应用于自然语言数据提出了新的和基本的挑战。

相反,在经典的NLP应用中,目标只是做出准确的预测:任何统计相关性通常都被认为是可接受的,不管潜在的因果关系是什么。然而,随着NLP系统越来越多地部署在具有挑战性和高风险的场景中,我们不能依赖通常的假设,即训练和测试数据是相同分布的,我们可能不会满足于无法解释的黑箱预测器。对于这两个问题,因果关系提供了一条有希望的前进道路: 数据生成过程中因果结构的领域知识可以提示归纳偏差,导致更鲁棒的预测器,而预测器本身的因果视图可以提供关于其内部工作的新见解。

这篇调查论文的核心主张是,探究因果关系和NLP之间的联系,有可能推进社会科学和NLP研究者的目标。我们将因果关系和自然语言处理的交集分为两个不同的领域: 从文本中估计因果效应,以及使用因果形式主义使自然语言处理方法更可靠。我们将用两个例子来说明这种区别。

NLP帮助因果关系。文本数据的因果推理涉及几个不同于典型因果推理设置的挑战:文本是高维的,需要复杂的建模来衡量语义上有意义的因素,如主题,并需要仔细思考,以形式化因果问题对应的干预。从主题模型到上下文嵌入,自然语言处理在建模语言方面的发展为从文本中提取所需信息以估计因果效应提供了有前景的方法。然而,我们需要新的假设,以确保使用NLP方法导致有效的因果推理。我们将在第3节讨论从文本中估计因果效应的现有研究,并强调这些挑战和机遇。

因果关系可以帮助NLP。为了解决NLP方法带来的稳健性和可解释性挑战,我们需要新的标准来学习超越利用相关性的模型。例如,我们希望预测器对于我们对文本所做的某些更改是不变的,例如在保持ground truth标签不变的情况下更改格式。利用因果关系来发展新的准则,为建立可靠的、可解释的自然语言处理方法提供服务,这是相当有希望的。与文本因果推理的研究领域相比,因果关系和NLP研究的这一领域较少被理解,尽管最近的经验成功很好地推动了这一领域的研究。在第4节中,我们涵盖了现有的研究,并回顾了使用因果关系来改进自然语言处理的挑战和机遇。

该论文调研了文本数据在因果推理中的作用(Egami et al., 2018; Keith et al., 2020)。在本文中,我们采取了一个更广泛的视角,将因果关系和自然语言处理的交集分为两个截然不同的研究线,即估计因果效应和因果驱动的自然语言处理方法。在阅读了本文之后,我们设想读者将对以下内容有一个广泛的理解:

  • 使用文本数据和NLP方法所特有的统计和因果挑战;
  • 在评估文本效果和应用因果关系来
  • 改进NLP方法方面的开放问题。
成为VIP会员查看完整内容
0
37

该系列课程由DeepMind研究人员教授,与伦敦大学学院(UCL)合作创建,为学生提供现代强化学习的全面介绍。

本课程包括13个讲座,该系列涵盖了基础的强化学习和规划的序列决策问题,在进入更高级的主题和现代深度RL算法之前。它让学生详细了解各种主题,包括马尔可夫决策过程,基于样本的学习算法(如(双)Q-learning, SARSA),深度强化学习,等等。它还探索了更高级的主题,如非策略学习、多步骤更新和资格跟踪,以及在实现深度强化学习算法(如彩虹DQN)时的概念和实际考虑。

DeepMind研究科学家和工程师Hado van Hasselt, Diana Borsa和Matteo Hessel领导了一份针对硕士以上学生的关于RL和深度RL的13部分独立介绍。

第1讲: 强化学习的介绍

研究科学家Hado van Hasselt介绍了强化学习课程,并解释了强化学习与人工智能的关系。

第二讲: 探索与控制

研究科学家哈多·范·哈塞尔特(Hado van Hasselt)探讨了为什么学习主体同时平衡探索和利用已获得的知识很重要。

第三讲: MDPs与动态规划

研究科学家Diana Borsa解释了如何用动态规划解决MDPs,以提取准确的预测和良好的控制策略。

第4讲: 动态规划算法的理论基础

研究科学家Diana Borsa将动态规划算法作为收缩映射进行研究,观察它们何时以及如何收敛到正确的解。

第五讲:无模型预测

研究科学家Hado van Hasselt对无模型预测及其与蒙特卡罗和时域差分算法的关系进行了更深入的研究。

第6讲:无模型控制

研究科学家Hado van Hasselt研究了策略改进的预测算法,从而产生了可以从抽样经验中学习良好行为策略的算法。

第7讲:函数近似

研究科学家Hado van Hasselt解释了如何将深度学习与强化学习相结合,以实现“深度强化学习”。

第8讲: 规划与模型

研究工程师Matteo Hessel解释了如何学习和使用模型,包括像Dyna和蒙特卡罗树搜索(MCTS)这样的算法。

第9讲: 策略梯度和Actor-Critic方法

研究科学家Hado van Hasselt涵盖了可以直接学习策略的策略算法和结合价值预测以更有效学习的Actor-Critic算法。

第10讲: 近似动态规划

研究科学家Diana Borsa介绍了近似动态规划,探讨了我们可以从理论上说的近似算法的性能。

第11讲: 多步骤和间歇策略

研究科学家Hado van Hasselt讨论了多步和离线策略算法,包括各种减少方差的技术。

第12讲: 深度强化学习#1

研究工程师Matteo Hessel讨论了深度RL的实际考虑和算法,包括如何使用自区分(即Jax)实现这些。

第13讲: 深度强化学习#2

研究工程师Matteo Hessel介绍了作为辅助任务的一般值函数和GVFs,并解释了如何处理算法中的可扩展问题。

成为VIP会员查看完整内容
0
34

这完全修订第二版介绍统计模式识别。一般来说,模式识别涵盖了广泛的问题:它被应用于工程问题,如字符识别和波形分析,以及生物学和心理学的大脑建模。统计决策和估计,这是本书的主要主题,被认为是研究模式识别的基础。这本书是适当的为模式识别的入门课程的文本,并作为在该领域的工作者的参考书。每一章包含计算机项目以及练习。

https://www.elsevier.com/books/introduction-to-statistical-pattern-recognition/fukunaga/978-0-08-047865-4

成为VIP会员查看完整内容
0
34

https://link.springer.com/book/10.1007/978-3-319-55444-0

这本引人入胜的和清晰的书面教科书/参考提供了一个必要的介绍,迅速兴起的跨学科领域的数据科学。它侧重于成为一名优秀的数据科学家的基本原则,以及建立收集、分析和解释数据的系统所需的关键技能。

《数据科学设计手册》是一个实用的见解来源,它突出了分析数据中真正重要的东西,并提供了对如何使用这些核心概念的直观理解。这本书没有强调任何特定的编程语言或数据分析工具套件,而是着重于重要设计原则的高层讨论。

《数据科学概论》是一门易于阅读的课程,理想情况下,它能满足本科生和早期研究生的需求。它揭示了这门学科如何处于统计学、计算机科学和机器学习的交叉点,具有自己独特的分量和特点。这些和相关领域的从业者会发现这本书非常适合自学。

成为VIP会员查看完整内容
0
32

学习方法的跨学科框架——包括统计学、神经网络和模糊逻辑,本书提供了从数据中学习依赖的原则和方法的统一处理。它建立了一个通用的概念框架,其中可以应用统计学、神经网络和模糊逻辑的各种学习方法,这表明了一些基本原则是当今在统计学、工程学和计算机科学中提出的大多数新方法的基础。书中有一百多幅插图、案例分析和实例,使其成为一本非常有价值的书。

第一部分:概念和理论(第1-4章)。

在第一章的介绍和动机的基础上,我们在第二章给出了归纳学习问题的形式化描述,并介绍了从数据中学习的主要概念和问题。特别地,它描述了一个叫做归纳原理的重要概念。第3章描述了统计中采用的规则化(或惩罚)框架。第四章介绍了Vapnik的统计学习理论(SLT),为有限数据预测学习提供了理论基础。SLT,又名VC理论,对于理解在神经网络、统计和模式识别中开发的各种学习方法,以及开发新的方法,如支持向量机(在第9章中描述)和非归纳学习设置(在第10章中描述)非常重要。

第二部分构造性学习方法(第5-8章)。

这部分描述了回归、分类和密度近似问题的学习方法。目的是展示源于统计、神经网络和信号处理的方法的概念相似性,并讨论它们的相对优势和局限性。只要有可能,我们将构造学习方法与第一部分的概念框架联系起来。第5章描述了各种方法中常用的非线性优化策略。第6章描述了密度近似的方法,包括统计、神经网络和信号处理技术用于数据约简和降维。第7章提供了统计和神经网络回归方法的描述。第8章描述了分类方法。

第三部分: 基于VC的学习方法(第9章和第10章)。

在这里,我们描述了源自VC理论的构造性学习方法。这包括用于几个归纳学习问题的支持向量机(或基于边际的方法)(在第9章)和各种非归纳学习公式(在第10章描述)。

成为VIP会员查看完整内容
0
30

近年来,为顺应新一轮科技革命和产业变革发展趋势,国家提出加快新型基础设施建设并做出一系列决策部署,同时首次将“新基建”写入政府工作报告。新型基础设施更侧重于以信息网络为基础,综合集成新一代信息技术,围绕数据的感知、传输、存储、计算、处理和安全等环节,所形成的基础设施体系对于经济社会数字化发展至关重要,亦有利于加快推动形成国内大循环为主体,国内国际双循环互相促进的新发展格局。因此,“新基建”甫一出场,便引起了社会各界的广泛关注。

中国信息通信研究院作为工业和信息化部直属科研事业单位,在新基建所涉及的5G、人工智能、工业互联网、物联网、数据中心、信息网络等诸多领域拥有长期的研究和丰厚的积淀,在其重大战略、规划、政策、标准和测试认证等方面,为我国信息通信产业的发展提供了有力支撑。为响应国家加快新型基础设施建设的号召,中国信通院聚焦新基建发展中的核心关键问题,依托网络及信息安全、基础设施及产业数据两大优势,聚焦5G、工业互联网、数据中心、新型技术四大核心领域,深耕交通、医疗、金融、能源等融合领域,强化规划咨询、标准研制、试验平台、认证服务、检测评测、应用示范等服务,已经形成了新基建全业务链综合服务能力,迭代更新《新基建产品手册(第四版)》(以下简称《产品手册》)。

成为VIP会员查看完整内容
0
29

看看我们最具影响力的一些科学期刊,比如《新英格兰医学杂志》和《美国医学协会杂志》。在这些期刊或其他高影响因子期刊上发表文章,可能会导致临床实践和政策的重大变化。这些高影响力的出版物有什么共同点? 除了有一个伟大的想法和一个执行良好的研究,他们也有一个清晰和引人注目的叙述,使研究对他们的观众容易理解。有无数重要的科学发现从未意识到它们的潜在影响,因为它们被埋没在写得很差的手稿中。

写一个清晰和引人注目的手稿的重要性不仅仅适用于顶级出版物。即使你是一个经验丰富的作家和研究人员,你的大部分工作也不会出现在这些杂志上。但是你仍然应该以同样的清晰和专注来写作,因为这将增加你的作品的影响力,无论它在哪里出版。你的研究的影响受限于你有效地交流研究结果和工作影响的能力。

也许严肃对待写作最重要的原因不仅仅是手稿。成为一个更有效的作家将教会你如何将复杂的想法表达成有逻辑性和清晰的叙述。这种技能对于学术研究人员经常遇到的其他职责是必要的: 公开演讲、论文写作或机构领导职位。我们指出,写作技能对整体职业发展的可转移性,以帮助你证明为成为一名有效的沟通者所需要的时间是合理的。

本章的其余部分分为两部分。首先,我们概述了科学手稿中应该包含的关键内容的结构。它借鉴了Gil Welch的开创性工作——“为提交医学期刊准备手稿:书面记录”[1]——随着时间的推移,我们已经采用并定制了它。其次,我们提供一些实用的建议,如何提高你的写作过程。这些教训直接来自我们作为作者的学习曲线,我们作为同行评议者的观察,以及与学员一起工作的经验。

论文结构

论文一般包含一下结构:

  • 摘要
  • 介绍
  • 方法
  • 结果
  • 讨论
  • 表和数据

在每个章节中应该包含的细节上,各刊物有所不同。在每本杂志的网站上,你都可以找到“作者说明”,详细说明任何偏离这种格式的地方。下面我们将分别讨论每一节。

摘要 Abstract

什么是摘要? 论文摘要部分是研究文章的摘要(通常不超过300字)。它通常遵循与文章相同的格式(即介绍、方法、结果和结论),但采用缩写形式。

虽然你的主要手稿可能包括多个发现,摘要只有空间集中在一个或两个关键发现。因此,你应该花时间思考哪个是最重要的。花点时间确保你的介绍、方法、结果和结论在摘要中是一致的。例如,你的论文可能会检查多种结果(如并发症、死亡率、成本),但你只打算抽象地关注死亡率和成本。你的介绍、方法、结果和结论都应该针对这两个结果。如果你在摘要中陈述研究了三种结果,但在摘要的结果中只报告了两种,读者会感到非常困惑。

摘要三角色

摘要从你开始写作、提交到发表,有三个不同的角色 (图9.1)。

  1. 写作时: 改进你的研究问题。

  2. 一旦提交:说服编辑这篇论文同行评审的价值。

3.发表后:阅读文章剩余部分指引。

引言 Introduction

引言的目的是为问题提供背景,创造一个知识缺口,并预排你的研究计划。我们觉得用三个不同的段落更有效地做到这一点(图9.2)。

第1段: 给出问题的背景

引言的第一段应该让读者关注主题。它需要让读者快速了解为什么这个主题是重要的。例如,如果你的论文是在评估一项联邦支付政策,你就需要帮助读者快速理解为什么要制定这项政策,以及现在什么是重要的。

第二段: 创造一个知识缺口

第二段需要通过在已知和未知之间创造一个知识缺口沟来引起读者的好奇心。你不应该在这里总结关于这个主题的所有文献,但要强调与你的研究问题有关的紧张或不确定的领域。你在这段中引入的知识缺口应该与你的研究将解决的结果直接相关。

第三段: 预览你的工作计划

引言的第三段应该预览你的工作计划,也就是说,简要说明你将如何弥补在前一段讨论的知识差距。保存方法部分的详细信息,但只需说明将要使用的数据库和结果。同样,结果应该与你刚刚创造的知识差距直接一致。如果你写了前两段正确的动机为什么主题是重要的,突出了有知识差距的领域,那么这段应该是容易写的。

方法

方法部分应该解释研究是如何进行的。对于不同的研究设计(如随机对照试验、调查数据、定性访谈等),在这里需要报道什么有不同的约定。我们建议查看您的目标期刊和/或您的导师以前的文章,以了解这一节是如何组织的。对于许多论文,方法部分将包括以下小节:

数据源——您使用了什么数据?(例如,医疗保险索赔)

患者群体,你研究的是谁?(例如,所有接受结直肠癌手术的患者)

结果——你衡量的是什么?(例如,30天并发症,再入院)

统计分析——你用了什么方法?(如多变量logistic回归)

结果

结果部分详细说明了分析的结果。这应该在多段报告,以描述病人的特征开始。如果适用,下一段应描述被比较群体的医院特征。

讨论

讨论部分是您将前面三个部分(介绍、方法和结果)联系在一起并将它们放入主题的更广泛的上下文中的机会。在这一节中,我们通常使用5段方法,包括4个组件(图9.3)。

成为VIP会员查看完整内容
0
29

本书在建构型理论(CTT)的形式结构中发展了信息概念的哲学和逻辑解释,以一种与信息哲学的多种当代观点并行的方式。在此概念框架的基础上,提出了逻辑推导的解析性问题并提出了解决方案。

本文首先介绍了CTT的正式结构,特别关注了类型理论中被当前研究者忽视的一些主题。这个处理是特别为有哲学背景的逻辑学家制定的,但不忽略所有的技术和形式性质的完整制定。分析性的问题通过一个历史和理论导向的形式化被引入,从康德和博尔扎诺开始,随着它的发展,直到信息概念的引入,扩展了在当代Hintikka辩论中引入的一些研究线。信息的语义方法被重新考虑在一个建设性的方法认识论,导致知识系统的理论分析。这允许基于CTT的形式化的某些典型操作和Kripke模型的形式化属性的形式结构的表示,其中信息和知识的概念被定义为认识论上的不同。这些定义涉及到建构性认识论的扩展,为由验证的概念和相关的意义理论所决定的极其开放的问题提供了新的材料。

信息与知识为知识过程的建构性解释提供了一个有趣的新视角,表明了这种方法对认知问题的逻辑建模的可靠性,并从一个更重要的当代哲学视角提出了一个统一的框架。

https://www.springer.com/gp/book/9781402061691

成为VIP会员查看完整内容
0
26

计算成像涉及成像硬件和计算机算法的联合设计,以创建具有前所未有能力的新型成像系统。近年来,这些能力包括以每秒一万亿帧的速度运行的摄像机,可以看到长期以来被认为是光学上无法分辨的小病毒的显微镜,以及捕捉黑洞图像的望远镜。这篇文章提供了一个全面和最新的介绍,这是一个迅速发展的领域,视觉,图形,信号处理,和光学的收敛。它可以作为计算机成像课程的教学资源,也可以作为专业人员的参考。

本文首先介绍了一个成像工具包,包括光学、图像传感器和照明,以及一个计算工具包,介绍了建模、数学工具、基于模型的反演、数据驱动的反演技术和混合反演技术。然后它检查光的不同形式,集中在全光功能,它描述了光线的自由度。最后,本文概述了光传输技术,描述了获得微米级三维形状或优化无噪声成像、光学计算和非视线成像的成像系统。在整个过程中,它讨论了计算成像方法在一系列应用领域的使用,包括摄影、自动驾驶和医学成像。章末练习有助于将材料置于上下文中。

https://imagingtext.github.io/

目录内容:

1 Introduction to Computational Imaging

PART I: TOOLKITS

2 Imaging Toolkit

3 Computational Toolkit

II PART II: PLENOPTIC IMAGING

4 Spatially Coded Imaging

5 Temporally Coded Imaging

6 Light Field Imaging and Display

7 Polarimetric Imaging

8 Spectral Imaging

III PART III: SHADING AND TRANSPORT OF LIGHT

9 Programmable Illumination and Shading

10 Light Transport

成为VIP会员查看完整内容
0
27

这是一本不同的信号和系统教科书: 信号和系统的工程应用作为概念和数学模型被集成到演示中,而不是仅仅展示概念和模型,让学生思考它与工程的关系。

本教材的前六章涵盖了连续时间信号和系统的基本概念,包括拉普拉斯变换和傅里叶变换。第7章和第8章给出了第1-6章的离散时间版本,强调了相似点和类比点,并且经常使用连续时间结果来推导离散时间结果。这两章是为了向读者介绍离散时间信号和系统的世界。第1-8章重点介绍的概念包括:补偿器反馈配置(第四章);能谱密度,群延迟,指数傅里叶级数的扩展覆盖(章节5);图像滤波,希尔伯特变换,单边带(SSB),零和一阶保持插值(章节6);Cooley-Tukey FFT(第七章);双边z变换和用于非最小相位反褶积(章节8)。

第9章介绍离散时间信号处理的常用概念,包括数据窗、FIR和IIR滤波器设计、多速率信号处理、自相关和互相关。它还包括一些非传统的概念,包括频谱图、多速率信号处理的应用、音乐五度圈在音频信号处理中的应用,以及自相关和互相关在生物医学中的一些应用。

第10章包括图像处理,离散时间小波(包括Smith-Barnwell条件和Haar和Daubechies离散时间小波展开),以及压缩感知的介绍。这是作者所知的第一本二年级到初中的教科书,允许学生应用压缩感知概念。应用包括:图像去噪使用二维滤波;图像小波变换的阈值化和收缩去噪利用维纳滤波器进行图像反卷积;“有效的”图像反卷积使用ISTA;图像修复;并利用二维DFT值的部分知识进行图像重建。问题允许学生将这些技术应用到实际的图像中,并通过做来学习,而不仅仅是阅读。

https://ss2.eecs.umich.edu/

成为VIP会员查看完整内容
0
27

报告研究团队由布朗大学计算机科学教授Michael L. Littman教授担任团队主席,来自学术界和行业研究实验室的17名成员组成,成员包括计算机科学、工程学、法律学、政治学、政策学、社会学和经济学学者。

与5年前的第一份报告明确侧重于AI在北美城市的影响相比,这次报告的重点是更深入地探讨AI对全球人类和社会的影响。

专业性。报告由该领域核心多学科研究人员组成的研究小组编写——这些专家将创建人工智能算法或研究其对社会的影响作为他们的主要专业活动,并且已经这样做了很多年。作者牢牢扎根于人工智能领域,并提供「内部」视角。

长期性。这是一项长期的纵向研究,报告计划每五年发布一次,持续100年。2021年9月的这份报告是计划中的系列研究中的第二份报告,第一份报告于2016年9月1日发表后,在大众媒体上广为报道,并全球多项人工智能课程中被广泛使用。

本报告的受众主要有四类:

对于一般公众来说,它对人工智能现状及其潜力做出了无障碍、科学和技术准确的描述。

对于工业界来说,报告指出了相关技术和法律和道德上的挑战,可能有助于指导资源配置。

对地方、国家和国际政府来说,报告有助于更好地规划人工智能技术的综合治理。

最后,对于人工智能研究人员和研究机构而言,报告有助于确定研究的优先级,并考虑人工智能研究及其应用提出的经济、道德和法律问题。

成为VIP会员查看完整内容
0
25

行业、学术界和政府对熟练数据科学从业者的需求正在迅速增长。这本书介绍的概念和技能,可以帮助你解决现实世界的数据分析挑战。它涵盖了概率、统计推断、线性回归和机器学习的概念。它还可以帮助你开发R编程、dplyr数据处理、ggplot2数据可视化、用插入符号构建算法、用UNIX/Linux shell组织文件、用Git和GitHub控制版本、用knitr和R markdown编写可复制的文档。这本书分为六个部分: R,数据可视化,数据争论,概率,推理和回归与R,机器学习和生产力工具。每一部分有几个章节,作为一个讲座。这本书包括几十个练习分布在大多数章节。

成为VIP会员查看完整内容
0
25

如今,随着人们越来越重视个人隐私权、政策法规愈发严格、数据协作和隐私保护矛盾日益凸出,隐私计算已然成为全球新兴的一大产业。

而联邦学习(Federated Learning)作为一种隐私保护的重要解决方案之一,近年来也得到了飞速的发展和足够多的关注。

在今年 7 月发布的 2021 年度Gartner 技术成熟度曲线中,联邦学习被首次纳入“隐私计算的技术成熟度曲线 — 2021”,根据此次 Gartner 预测内容,在 2021-2025 年这一周期中,联邦学习将发挥主流作用,引导该领域的商业化大潮。

近日,清华大学人工智能研究院知识智能中心和清华—中国工程院知识智能联合研究中心和智谱 AI 联合发布了《2021 联邦学习全球研究与应用趋势报告》(以下简称“报告”),报告从科研论文、专利、书籍、行业应用、学者地图与画像、技术发展趋势等多个角度,全景展示和分析了联邦学习技术自从 2016 年被提出以来至 2020 年的重要进展,并展望了该技术的未来发展方向与前景。

主要核心要点如下:

  • 联邦学习科研发展呈现出整体热度逐年上升态势。研究论文产出量以及专利申请受理量均以中美两国为领先主导;全球该领域学者也主要聚集在这两个国家;

  • 联邦学习高被引论文半数以上来自中美两国,两国间的合作论文数量也是全球最多;

  • 联邦学习论文研究和专利申请的热点主要聚焦在机器学习方法、模型训练、隐私保护三方面;

  • 企业比学术机构更积极地开展联邦学习相关研究,不仅在专利申请量前十机构之中占八席,而且引领论文量前十机构,也是联邦学习系统框架的主要推出者;

  • 行业应用研究方向呈现出不断与区块链、物联网、车辆交互、5G等技术融合的态势。

成为VIP会员查看完整内容
0
24

这本典型的数据结构课程,介绍了基本的数据结构和算法的集合,可以使用任何不同的编程语言进行教学。近年来,越来越多的学院开始采用Python语言向学生介绍编程和问题解决。与c++和Java等其他语言相比,Python提供了一些优势,其中最重要的是Python有一个简单的语法,更容易学习。本书通过为数据结构课程提供以Python为中心的文本,扩展了Python的使用。该语言干净的语法和强大的特性贯穿始终,但这些特性的底层机制也得到了充分的探索,不仅揭示了“魔力”,而且研究了它们的总体效率。正文由14章和4个附录组成。前四章介绍了与抽象数据类型、数据结构和算法相关的基本概念。后面的章节将在这些早期概念的基础上介绍更高级的主题,并向学生介绍更多的抽象数据类型和更高级的数据结构。这本书包含了几个主题的线索,在整个文本中,主题是重新访问在不同的章节作为适当的。

成为VIP会员查看完整内容
0
24

这本书涵盖了用R总结数据的基本探索性技术。这些技术通常在正式建模开始之前应用,可以帮助开发更复杂的统计模型。探索技术对于消除或强化关于世界的潜在假设也很重要,这些假设可以通过你所拥有的数据来解决。我们将详细介绍R中的绘图系统以及构造信息数据图形的一些基本原则。我们还将介绍一些用于可视化高维数据的常见多元统计技术。

这本书教你使用R来有效地可视化和探索复杂的数据集。探索性数据分析是数据科学过程的一个关键部分,因为它允许您尖锐地提出问题并改进建模策略。这本书是基于行业领先的约翰霍普金斯数据科学专业,最广泛订阅的数据科学培训项目创建。

成为VIP会员查看完整内容
0
24
登录查看的更多。 返回顶部
本周荟萃主题
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
新闻
新闻,是指报纸、电台、电视台、互联网等媒体经常使用的记录与传播信息的 [2] 一种文体,是反映时代的一种文体。新闻概念有广义与狭义之分。广义上:除了发表于报刊、广播、互联网、电视上的评论与专文外的常用文本都属于新闻,包括消息、通讯、特写、速写(有的将速写纳入特写之列)等等; [3] 狭义上:消息是用概括的叙述方式,以较简明扼要的文字,迅速及时地报道附近新近发生的、有价值的事实,使一定人群了解。新闻一般包括标题、导语、主体、背景和结语五部分。前三者是主要部分,后二者是辅助部分。写法以叙述为主兼或有议论、描写、评论等。新闻是包含海量资讯的新闻服务平台,真实反映每时每刻的重要事件。您可以搜索新闻事件、热点话题、人物动态、产品资讯等,快速了解它们的最新进展。
图灵奖
图灵奖(A.M. Turing Award,又译“杜林奖”),由 美国计算机协会(ACM)于1966年设立,又叫“A.M. 图灵奖”,专门奖励那些对计算机事业作出重要贡献的个人。其名称取自计算机科学的先驱、英国科学家 阿兰·麦席森·图灵
Top