找到有合适技能的人。本书阐明了创建高效能数据集成团队的最佳实践,使您能够理解计划、设计和监视一次性迁移和日常集成系统的技能和需求、文档和解决方案。

数据的增长是爆炸式的。随着跨企业系统的多个信息源的不断到达,将这些系统组合成一个单一的、内聚的、可记录的单元变得比以往任何时候都更加重要。但是,与其他软件规程相比,集成的方法有很大的不同,它要求能够编写代码、协作并将复杂的业务规则分解为可伸缩的模型。

数据迁移和集成可能很复杂。在许多情况下,项目团队将实际的迁移保留到项目的最后一个周末,任何问题都可能导致错过最后期限,或者在最坏的情况下导致需要在部署后进行协调的数据损坏。本书详细介绍了如何进行战略规划以避免这些最后时刻的风险,以及如何为未来的集成项目构建正确的解决方案。

你会学到什么

  • 理解集成的“语言”,以及它们在优先级和所有权方面的关系
  • 创建有价值的文档,带领您的团队从发现到部署
  • 研究当今市场上最重要的集成工具
  • 监视您的错误日志,并查看输出如何增加持续改进的周期
  • 为整个企业提供有价值的集成解决方案

这本书是给谁看的

构建相应实践的执行和集成团队领导。它也适用于需要额外熟悉ETL工具、集成过程和相关项目可交付成果的集成架构师、开发人员和业务分析人员

成为VIP会员查看完整内容
0
58

相关内容

科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值。

首先加速介绍R生态系统、编程语言和工具,包括R脚本和RStudio。通过使用许多例子和项目,这本书教你如何将数据导入R,以及如何使用R处理这些数据。一旦基础扎实,《实用R 4》的其余部分将深入具体的项目和例子,从使用R和LimeSurvey运行和分析调查开始。接下来,您将使用R和MouselabWeb执行高级统计分析。然后,您将看到在没有统计信息的情况下R如何工作,包括如何使用R自动化数据格式化、操作、报告和自定义函数。

本书的最后一部分讨论了在服务器上使用R;您将使用R构建一个脚本,该脚本可以运行RStudio服务器并监视报表源的更改,以便在发生更改时向用户发出警报。这个项目包括定期电子邮件提醒和推送通知。最后,您将使用R创建一个定制的个人最重要信息的每日纲要报告,例如天气报告、每日日历、待办事项等等。这演示了如何自动化这样一个过程,以便用户每天早上导航到相同的web页面并获得更新的报告。

你将学到什么

  • 设置并运行R脚本,包括在新机器上的安装以及下载和配置R
  • 使用RStudio Server将任何机器变成可从任何地方访问的强大数据分析平台
  • 编写基本的脚本并修改现有的脚本以满足自己的需要。
  • 在R中创建基本的HTML报告,根据需要插入信息
  • 构建一个基本的R包并发布它

这本书是给谁的

  • 建议您之前接触过统计学、编程和SAS,但不是必需的。
成为VIP会员查看完整内容
0
50

通过这个紧凑的实用指南,开始使用Python进行数据分析。这本书包括三个练习和一个用正确的格式从Python代码中获取数据的案例研究。使用Python学习数据分析还可以帮助您使用分析发现数据中的意义,并展示如何可视化数据。

每一节课都尽可能是独立的,允许您根据需要插入和退出示例。如果您已经在使用Python进行数据分析,那么您会发现您希望知道如何使用Python来完成许多事情。然后,您可以将这些技术直接应用到您自己的项目中。

如果您不使用Python进行数据分析,那么本书从一开始就带您了解基础知识,为您在该主题中打下坚实的基础。当你阅读完这本书的时候,你会对如何使用Python进行数据分析有更好的理解。

你将学到什么

  • 从Python代码中获取数据
  • 准备数据及其格式
  • 找出数据的意义
  • 使用iPython可视化数据

这本书是给谁的

想学习使用Python进行数据分析的同学。建议您具有Python方面的经验,但不是必需的,因为您需要具有数据分析或数据科学方面的经验。

成为VIP会员查看完整内容
0
92

通过机器学习的实际操作指南深入挖掘数据

机器学习: 为开发人员和技术专业人员提供实践指导和全编码的工作示例,用于开发人员和技术专业人员使用的最常见的机器学习技术。这本书包含了每一个ML变体的详细分析,解释了它是如何工作的,以及如何在特定的行业中使用它,允许读者在阅读过程中将所介绍的技术融入到他们自己的工作中。机器学习的一个核心内容是对数据准备的强烈关注,对各种类型的学习算法的全面探索说明了适当的工具如何能够帮助任何开发人员从现有数据中提取信息和见解。这本书包括一个完整的补充教师的材料,以方便在课堂上使用,使这一资源有用的学生和作为一个专业的参考。

机器学习的核心是一种基于数学和算法的技术,它是历史数据挖掘和现代大数据科学的基础。对大数据的科学分析需要机器学习的工作知识,它根据从训练数据中获得的已知属性形成预测。机器学习是一个容易理解的,全面的指导,为非数学家,提供明确的指导,让读者:

  • 学习机器学习的语言,包括Hadoop、Mahout和Weka
  • 了解决策树、贝叶斯网络和人工神经网络
  • 实现关联规则、实时和批量学习
  • 为安全、有效和高效的机器学习制定战略计划

通过学习构建一个可以从数据中学习的系统,读者可以在各个行业中增加他们的效用。机器学习是深度数据分析和可视化的核心,随着企业发现隐藏在现有数据中的金矿,这一领域的需求越来越大。对于涉及数据科学的技术专业人员,机器学习:为开发人员和技术专业人员提供深入挖掘所需的技能和技术。

成为VIP会员查看完整内容
0
91

《2020技术趋势报告》(Tech Trends 2020)提出的2020年五大重点趋势为:

数字孪生:连结现实与数字世界

长期以来,使用虚拟的模型来优化流程、产品或服务的想法并不新鲜。但随着具有更复杂的仿真和建模能力、更好的互操作性和IoT传感器以及电力系统可视化的数字化仿真平台和工具的广泛使用,使企业逐渐意识到创建更精细、更具动态感的数字化仿真模型成为可能。我们可以看到数字孪生技术能够在提高生产效率、优化供应链、改变预测域维护、有效缓解交通拥堵等领域发挥重要作用。越来越多的企业,特别是那些从产品销售向产品+服务捆绑销售转变的企业,或销售即服务的企业,正在广泛应用数字孪生技术。随着企业能力和成熟度的不断提升,我们可以预见未来会有更多企业使用数字孪生技术进行流程优化、数据驱动决策,和设计新产品、新服务及业务模型。从长远来看,要释放数字孪生技术的全部潜力,需要整合整个生态系统中的所有系统与数据。

架构觉醒

越来越多的技术和首席高管们逐渐意识到,此刻,技术架构领域的科学在战略上比以往任何时候都更加重要。事实上,为了在被技术创新打乱的市场中保持竞争力,成熟企业就需要不断改进他们的架构——这个过程可以从改变技术架构师在企业内扮演的角色开始。在接下来的几个月里,我们期待有更多企业将架构师从传统象牙塔转移到新的阵地。这些富有才华但没有被充分利用的技术人才将通过担任服务和系统的职责,参与到系统运营当中。这种转变的目的非常明确:把经验最丰富的架构师安排到最需要他们的地方,比如,加入设计复杂技术的软件开发团队。同时,加大对架构师的人才培养,在整个企业范围内提升他们的战略价值,有助于把这一IT岗位的职能演化为数字经济中的竞争优势。

技术道德与信任

在不断变化的趋势中,先锋企业越来越意识到,企业内部每一个受技术影响的方面都可能成为取得或失去信任的关键。对他们而言,信任更是一个关键的企业目标,而不仅是合规或公共关系问题。如今,信任更作为先锋企业的一个全方位承诺,确保企业内部的技术、流程和人员等各个方面都能够齐心协力,维持众多利益相关者所期待的高度信任。企业领导者也开始重新评估他们在产品、服务以及有关数据管理、合作伙伴关系和员工培训等相关领域的策略是如何构建信任的。CIO们也纷纷强调“技术道德”,并开发出一套工具用来辅助企业:当企业需要引入并使用颠覆性技术时,能够准确洞察其中的道德困境。同时,那些将企业价值观和技术道德贯穿整个企业的领导者们正在向世人展示他们“从善”的承诺,这有助于与利益相关者建立长期的互信关系。

人感体验平台

越来越多的人工智能(AI)解决方案——将被称为“情感计算”或“情感AI”——正在重新定义我们感受技术的方式。在接下来的几个月里,更多的公司将积极响应人们对AI技术日益增长且没有被满足的需求,从而更好地了解人类感情并与人类互动。回顾历史,计算机一直无法将事件与人类的情感或情感因素联系起来,但这种情况正因创新者目前大规模地将情商(EQ)添加到技术的智商(IQ)中而发生改变。人感体验平台就是将人工智能技术、以人为本的设计和目前神经学研究相结合,从而能够识别人的情绪状态及背景内容,然后做出适当地响应。事实上,利用人感智能平台进行认知和大规模使用情感数据的能力确实是企业未来发展的一大重要机遇。

财务与IT的未来

就在技术战略日渐成为企业业务战略的核心部分同时,人们对其在改进结果上的要求也有所增加。为了实现这一目标,我们相信会有越来越多的IT和财务领域的领导者将会共同努力,设计灵活的流程与方法,以敏捷速度进行经营管理与创新。无论是为了支持创新、抵御颠覆或实现数字化转型,IT都需要财务的支持,以便反思并对技术创新进行有效治理,适应敏捷方法,获得创新资本。同时,避免向支持创新的新型财务、预算和会计流程的过渡一蹴而就。但对于CIO和CFO来说,他们都有强烈的动机去寻找有效资助创新的方法。有些公司已经开始顺应这一趋势,并大力探索未来的各种可能性。他们处于领先地位,而且很可能率先享受到由财务以敏捷的速度资助创新所带来的竞争优势。

成为VIP会员查看完整内容
0
105

识别、分析和改进性能低下的查询,这些查询会损害用户体验并导致业务收入损失。这本书将帮助您通过一个多步骤的过程,使查询调优成为您日常生活中不可分割的一部分,这个过程包括监视执行时间、识别用于优化的候选查询、分析它们的当前性能,以及改进它们以更快地交付结果和更少的开销。作者Jesper Krogh系统地讨论了这些步骤以及执行这些步骤的数据源和工具。

MySQL 8查询性能调优旨在帮助您使用多种策略提高查询性能。您将了解如何使用传统的解释命令和新的解释分析工具来分析查询。您还将看到如何使用Visual Explain特性来提供执行计划的可视化视图。索引的覆盖范围包括索引策略和索引统计信息,您将了解如何使用直方图来提供关于倾斜数据分布的输入,优化器可以使用这些数据分布来提高查询性能。您将了解锁,以及如何研究锁问题。您将了解MySQL优化器是如何工作的,包括新的散列连接算法,以及如何在需要时更改优化器的行为以交付更快的执行时间。您将获得取悦应用程序用户所需的工具和技能,并从企业计算资源中获取最大的价值。

你会学到什么

  • 监视查询性能,以识别性能差的执行器
  • 选择能够提供最大收益的查询进行优化
  • 使用解释分析和可视化解释等工具分析查询
  • 通过广泛的策略改进慢速查询
  • 正确地部署索引和直方图,以帮助创建快速执行计划
  • 理解和分析锁以解决争用并提高吞吐量

这本书是给谁看的

熟悉MySQL并需要参与查询调优的数据库管理员和SQL开发人员。虽然需要一些MySQL经验,但是不需要预先了解查询性能调优。

成为VIP会员查看完整内容
0
32

使用谷歌Dialogflow循序渐进、亲身实践地构建可用于生产的企业认知虚拟助理。这本书提供了各种认知技术选择的概述,并深入探讨了认知虚拟代理,以处理各种行业(如旅游和天气)中复杂的现实生活用例。

您将更深入地研究实现诸如输入/输出上下文、后续意图、操作和参数以及处理复杂的多重意图等功能的认知虚拟助理的高级功能。通过将您的认知机器人与Facebook messenger集成,您将了解如何与第三方消息传递平台集成。您还将与第三方api集成,以使用webhook丰富您的认知机器人。

使用谷歌Dialogflow的认知虚拟助理消除了认知平台的复杂性,并提供丰富的指导,您可以在开发自己的认知机器人时使用。本书深入介绍了谷歌对话框流,并从基础开始,为那些刚开始使用谷歌对话框流的开发人员提供了一个实际的指导。本书中提供的所有代码都将以脚本和配置文件的形式提供,这允许您尝试示例并以有趣的方式扩展它们。

你会学到什么

  • 利用谷歌Dialogflow技术开发认知机器人
  • 使用高级功能来处理复杂的对话场景
  • 通过了解用户的情绪来丰富机器人的对话
  • 参见开发认知机器人的最佳实践
  • 通过与第三方服务集成来增强认知机器人
成为VIP会员查看完整内容
0
49

简介:

机器学习和深度学习以深远的方式影响着世界,从我们与技术产品的交互方式以及彼此之间的交互方式来看,这些技术正在影响我们的关系,工作方式以及我们如何融入生活。如今,在可预见的将来,智能机器会成为社会文化和社会经济关系赖以生存的核心。

机器学习可以描述为用于基于特定数据集中变量(也称为特征或属性)之间的一组交互作用来预测或分类未来事件的工具和技术。另一方面,深度学习扩展了一种称为神经网络的机器学习算法,用于学习计算机难以执行的复杂任务。这些任务可能包括识别面部表情和理解具有各种上下文含义的语言。

数据对机器学习和深度学习的兴起以及未来的性能提高至关重要。自二十世纪初以来,生成和存储的数据量呈指数级增长。庞大数据的增长部分归因于Internet的兴起和处理器的小型化,这些处理器已抑制了“物联网(IoT)”技术。这些大量的数据使训练计算机学习不可能使用显式指令集的复杂任务成为可能。

本书的目的是为读者提供构建学习模型的基本原理和工具。机器学习和深度学习正在迅速发展,对于初学者而言,机器学习和深度学习常常令人感到困惑和困惑。许多人不知道从哪里开始。本书使初学者可以了解有关感兴趣的问题,并利用机器学习和深度学习技术的理论基础和实际步骤进行深入研究。

本书分为八个部分。其细分如下:

•第1部分:Google Cloud Platform入门

•第2部分:数据科学的编程基础

•第3部分:机器学习简介

•第4部分:实践中的机器学习

•第5部分:深度学习简介

•第6部分:实践中的深度学习

•第7部分:Google Cloud Platform上的高级分析/机器学习

•第8部分:在GCP上实现生产化机器学习解决方案

本书代码的地址:https://github.com/Apress/building-ml-and-dl-models-on-gcp

作者介绍:

Ekaba Bisong是T4G的数据主管。 他之前曾在Pythian担任数据科学家/数据工程师。 此外,他还与卡尔顿大学的智能系统实验室有项目合作,其研究重点是学习系统(包括自动学习和强化学习),机器学习和深度学习。 Ekaba是Google认证的专业数据工程师和机器学习的Google开发人员专家。

技术顾问:

Vikram Tiwari是Omni Labs,Inc.的联合创始人,负责处理所有技术。他还是机器学习和Google Cloud Platform的Google Developer Expert。他在各种会议上发表演讲,并举办有关云和机器学习主题的动手研讨会。他喜欢与初创企业和开发人员作为导师合作,以帮助他们应对自己的研究中的各种挑战。除了工作外,他还在旧金山的Google Developer Group Cloud运营着一个开发人员社区。

Gonzalo Gasca Meza是在GCP机器学习平台上工作的开发人员程序工程师。他研究方向是TensorFlow和机器学习基础架构。 Gonzalo拥有牛津大学的计算机科学学士学位和软件工程硕士学位。加入Google之前,Gonzalo致力于语音和视频通信的企业级产品。

部分目录:

成为VIP会员查看完整内容
0
24

简介: Google一直是引入突破性技术和产品的先驱。在效率和规模方面,TensorFlow也不例外,因此,编写本书只是向读者介绍TensorFlow核心团队所做的这些重要更改。本书着重于机器学习方面的TensorFlow的不同应用,并更深入地探讨了方法的最新变化。对于那些想要用TensorFlow进行机器学习的人来说,这本书是一个很好的参考点。本书分为三个部分。第一篇:使用TensorFlow 2.0进行数据处理。第二部分:使用TensorFlow 2.0构建机器学习和深度学习模型。它还包括使用TensorFlow 2.0的神经语言编程(NLP)。第三部分介绍了如何在环境中保存和部署TensorFlow 2.0模型。这本书对数据分析人员和数据工程师也很有用,因为它涵盖了使用TensorFlow 2.0处理大数据的步骤。想要过渡到数据科学和机器学习领域的读者也会发现,本书提供了实用的入门指南,以后可能会出现更复杂的方面。书中提供的案例研究和示例使您很容易理解和理解相关的基本概念。本书的优势在于其简单性以及将机器学习应用于有意义的数据集。

目录:

  • Chapter 1:tenforflow 2.0介绍
    • tensor
    • TensorFlow 1.0与 Tensorflow 2.0的对比
    • Tensorflow 2.0安装于基础操作
  • Chapter 2:tenforflow 与监督学习
    • 监督机器学习是什么
    • TF2.0实现线性回归
    • 使用TF和Keras的线性回归应用
    • TF2.0实现逻辑回归
    • TF2.0实现boosted树
  • Chapter 3:tenforflow与深度神经网络
    • 什么是神经网络
    • 前向传播与反向传播
    • TF2.0构建神经网络
    • 深度神经网络
    • TF2.0构建深度神经网络
    • 使用Keras模型估量
    • 总结
  • Chapter 4:图片与Tensorflow
    • 图片处理
    • 卷积神经网络
    • TF2.0与卷积神经网络
    • 迁移学习
    • TF2.0与变分自编码器
    • 总结
  • Chapter 5:TF2.0与自然语言处理(NLP)
    • NLP概述
    • 文本处理
    • 文本分类与TF
    • TF projector
  • Chapter 6:TF模型
    • TF部署
    • 模型部署的Python
    • 基于TF的Keras模型
成为VIP会员查看完整内容
0
148

主题: Towards Automatic Machine Learning Pipeline Design

简介: 数据收集量的迅速增加,使决策的瓶颈迅速从缺乏数据转向缺乏数据科学家,以帮助分析收集的数据。此外,用于数据分析的新潜在解决方案和方法的发布速度已经超过了人类数据科学家所能遵循的速度。同时,我们注意到数据科学家在分析过程中执行的许多任务都可以自动化。自动机器学习(AutoML)研究和解决方案试图使部分甚至整个数据分析过程自动化。我们解决了自动化研究中的两个挑战: 首先,如何表示适合元学习的ML程序;第二,如何改进自动系统的评估,使之能够比较各种方法,而不仅仅是预测。为此,我们设计并实现了一个ML程序框架,该框架提供了以标准方式描述ML程序所需的所有组件。该框架是可扩展的,框架的组件之间是解耦的,例如,该框架可以用来描述使用神经网络的ML程序。我们为执行框架中描述的程序提供参考工具。我们还设计并实现了一个服务,一个元学习数据库,它存储由不同的自动化系统生成的执行ML程序的信息。

我们通过测量使用框架与执行直接调用底层库的ML程序的计算开销来评估框架。我们注意到框架的ML程序执行时间比不使用该框架的ML程序慢一个数量级,内存使用量是不使用该框架的ML程序的两倍。 通过比较使用我们的框架的10个不同的AutoML系统,我们展示了我们的框架评估AutoML系统的能力。结果表明,该框架既可以用来描述一组不同的ML程序,又可以用来明确地确定哪个自动化系统生成了最佳的ML程序。在许多情况下,生成的ML程序的性能优于由人类专家编写的ML程序。

成为VIP会员查看完整内容
0
22
小贴士
相关资讯
如何做数据治理?
智能交通技术
6+阅读 · 2019年4月20日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
9+阅读 · 2018年10月29日
占坑!利用 JenKins 持续集成 iOS 项目时遇到的问题
软件工程师如何转型人工智能?
机器学习算法与Python学习
6+阅读 · 2018年4月26日
【知识图谱】 一个有效的知识图谱是如何构建的?
产业智能官
36+阅读 · 2018年4月5日
如何解决自然语言处理中 90% 的问题
AI研习社
4+阅读 · 2018年2月15日
相关论文
Mi Luo,Fei Chen,Pengxiang Cheng,Zhenhua Dong,Xiuqiang He,Jiashi Feng,Zhenguo Li
4+阅读 · 2020年2月13日
One-Shot Federated Learning
Neel Guha,Ameet Talwalkar,Virginia Smith
6+阅读 · 2019年3月5日
MID-Fusion: Octree-based Object-Level Multi-Instance Dynamic SLAM
Binbin Xu,Wenbin Li,Dimos Tzoumanikas,Michael Bloesch,Andrew Davison,Stefan Leutenegger
8+阅读 · 2018年12月20日
Mehdi Mohammadi,Ala Al-Fuqaha,Mohsen Guizani,Jun-Seok Oh
3+阅读 · 2018年10月9日
Pengkai Zhu,Hanxiao Wang,Tolga Bolukbasi,Venkatesh Saligrama
5+阅读 · 2018年3月19日
Gui-Song Xia,Xiang Bai,Jian Ding,Zhen Zhu,Serge Belongie,Jiebo Luo,Mihai Datcu,Marcello Pelillo,Liangpei Zhang
14+阅读 · 2018年1月27日
Rene Grzeszick,Sebastian Sudholt,Gernot A. Fink
5+阅读 · 2018年1月26日
Vincent Dumoulin,Francesco Visin
6+阅读 · 2018年1月11日
Xiangyu Zhao,Liang Zhang,Zhuoye Ding,Dawei Yin,Yihong Zhao,Jiliang Tang
12+阅读 · 2018年1月5日
Top