【人工智能】关于神经网络:你需要知道这些;AI创业公司大列表

2019 年 2 月 7 日 产业智能官

关于神经网络:你需要知道这些

机器之心编译



神经网络(NN)几乎可以在每个领域帮助我们用创造性的方式解决问题。本文将介绍神经网络的相关知识。读后你将对神经网络有个大概了解,它是如何工作的?如何创建神经网络?


本文涉及以下内容:


  • 神经网络的发展历史

  • 什么是真正的神经网络?

  • 单元/神经元

  • 权重/参数/连接

  • 偏置项

  • 超参数

  • 激活函数

  • 神经网络学习时发生了什么?

  • 实现细节(如何管理项目中的所有因素)

  • 关于神经网络的更多信息(更多资源链接)


神经网络的发展历史


我们简单回顾一下神经网络的发展历程,如果你想了解更多关于其发展历程的信息,请看这篇维基百科的文章(https://en.wikipedia.org/wiki/Artificial_neural_network#History),它是本章节的基础。


神经网络起源于 WarrenMcCulloch 和 Walter Pitts 于 1943 年首次建立的神经网络模型。他们的模型完全基于数学和算法,由于缺乏计算资源,模型无法测试。


后来,在 1958 年,Frank Rosenblatt 创建了第一个可以进行模式识别的模型,改变了现状。即感知器。但是他只提出了 notation 和模型。实际的神经网络模型仍然无法测试,此前的相关研究也较少。


第一批可以测试并具有多个层的神经网络于 1965 年由 Alexey Ivakhnenko 和 Lapa 创建。


之后,由于机器学习模型具有很强可行性,神经网络的研究停滞不前。很多人认为这是因为 Marvin Minsky 和 Seymour Papert 在 1969 年完成的书《感知机》(Perceptrons)导致的。


然而,这个停滞期相对较短。6 年后,即 1975 年,Paul Werbos 提出反向传播,解决了 XOR 问题,并且使神经网络的学习效率更高。


1992 年,最大池化(max-pooling)被提出,这有助于 3D 目标识别,因为它具备平移不变性,对变形具备一定鲁棒性。


2009 年至 2012 年间,JürgenSchmidhuber 研究小组创建的循环神经网络和深度前馈神经网络获得了模式识别和机器学习领域 8 项国际竞赛的冠军。


2011 年,深度学习神经网络开始将卷积层与最大池化层合并,然后将其输出传递给几个全连接层,再传递给输出层。这些被称为卷积神经网络。


在这之后还有更多的研究。


什么是神经网络?


了解神经网络的一个好方法是将它看作复合函数。你输入一些数据,它会输出一些数据。


3 个部分组成了神经网络的的基本架构:


  • 单元/神经元

  • 连接/权重/参数

  • 偏置项


你可以把它们看作建筑物的「砖块」。根据你希望建筑物拥有的功能来安排砖块的位置。水泥是权重。无论权重多大,如果没有足够的砖块,建筑物还是会倒塌。然而,你可以让建筑以最小的精度运行(使用最少的砖块),然后逐步构建架构来解决问题。


我将在后面的章节中更多地讨论权重、偏置项和单元。


单元/神经元


作为神经网络架构三个部分中最不重要的部分,神经元是包含权重和偏置项的函数,等待数据传递给它们。接收数据后,它们执行一些计算,然后使用激活函数将数据限制在一个范围内(多数情况下)。


我们将这些单元想象成一个包含权重和偏置项的盒子。盒子从两端打开。一端接收数据,另一端输出修改后的数据。数据首先进入盒子中,将权重与数据相乘,再向相乘的数据添加偏置项。这是一个单元,也可以被认为是一个函数。该函数与下面这个直线方程类似:


想象一下有多个直线方程,超过 2 个可以促进神经网络中的非线性。从现在开始,你将为同一个数据点(输入)计算多个输出值。这些输出值将被发送到另一个单元,然后神经网络会计算出最终输出值。


权重/参数/连接


作为神经网络最重要的部分,这些(和偏置项)是用神经网络解决问题时必须学习的数值。这就是你现在需要知道的。


偏置项


这些数字代表神经网络认为其在将权重与数据相乘之后应该添加的内容。当然,它们经常出错,但神经网络随后也学习到最佳偏置项。


超参数


超参数必须手动设置。如果将神经网络看作一台机器,那么改变机器行为的 nob 就是神经网络的超参数。


你可以阅读我的另一篇文章(https://towardsdatascience.com/gas-and-nns-6a41f1e8146d),了解如何优化神经网络超参数。


激活函数


也称为映射函数(mapping function)。它们在 x 轴上输入数据,并在有限的范围内(大部分情况下)输出一个值。大多数情况下,它们被用于将单元的较大输出转换成较小的值。你选择的激活函数可以大幅提高或降低神经网络的性能。如果你喜欢,你可以为不同的单元选择不同的激活函数。


以下是一些常见的激活函数:


  • Sigmoid



Sigmoid 函数


  • Tanh




tanh 函数


  • ReLU:修正线性单元



修正线性单元函数


  • Leaky ReLU



Leaky ReLU 函数



这是神经网络在任何问题中都可获得复杂度的原因。增加层(具备单元)可增加神经网络输出的非线性。


每个层都包含一定数量的单元。大多数情况下单元的数量完全取决于创建者。但是,对于一个简单的任务而言,层数过多会增加不必要的复杂性,且在大多数情况下会降低其准确率。反之亦然。


每个神经网络有两层:输入层和输出层。二者之间的层称为隐藏层。下图所示的神经网络包含一个输入层(8 个单元)、一个输出层(4 个单元)和 3 个隐藏层(每层包含 9 个单元)。



深度神经网络


具有两个或更多隐藏层且每层包含大量单元的神经网络称为深度神经网络,它催生了深度学习这一新的学习领域。上图所示神经网络就是这样一个例子。


神经网络学习时发生了什么?


教神经网络解决问题的最常见方式是使用梯度下降。梯度下降相关内容,参见:https://hackernoon.com/gradient-descent-aynk-7cbe95a778da。


除梯度下降外,另一种常见的训练神经网络方法是使用反向传播。使用这种方法,神经网络输出层的误差会通过微积分中的链式规则向后传播。这对于没有微积分知识的初学者来说可能会难以理解,但也不要被吓倒,反向传播相关内容,推荐阅读:http://neuralnetworksanddeeplearning.com/chap2.html。


训练神经网络有许多注意事项。但对于初学者来说,没有必要在一篇文章中了解全部。


实现细节(如何管理项目中的所有因素)


为了解释如何管理项目中的所有因素,我创建了一个 Jupyter Notebook,包含一个学习 XOR 逻辑门的小型神经网络。Jupyter Notebook 地址:https://github.com/Frixoe/xor-neural-network/blob/master/XOR-Net-Notebook.ipynb。


在查看并理解 Notebook 内容后,你应该对如何构建基础神经网络有一个大致的了解。


Notebook 创建的神经网络的训练数据以矩阵排列,这是常见的数据排列方式。不同项目中的矩阵维度可能会有所不同。


大量数据通常分为两类:训练数据(60%)和测试数据(40%)。神经网络先使用训练数据,然后在测试数据上测试网络的准确率。




AI创业公司大列表


原文 / 专知


AI创业公司/团队

来源:https://github.com/lipiji/AIStartups


国内

  • 第四范式:http://www.4paradigm.com/ :戴文渊、杨强教授

  • 商汤科技: http://www.sensetime.com/cn , 香港中文大学汤晓鸥教授及其团队。该实验室cv技术一流。

  • 范数科技:http://www.lpnorm.com/ , 文本生成,自动写作,数据汇聚、抽取,知识图谱,人工智能。

  • 明略数据:http://www.mininglamp.com/index

  • 普林科技:http://www.princetechs.com/ , 普林科技是一家专业从事大数据建模与分析,为金融、移动运营商、交通物流、医疗卫生等相关领域客户提供服务的咨询服务公司。普林科技在北京、上海均设有办事处,并拥有位于美国普林斯顿的研发中心,公司核心成员均拥有世界顶尖高校教育背景及顶级大数据企业工作经历,涵盖国际应用数学、计算机和金融领域专家。http://www.xtecher.com/Website/Article/view?aid=100

  • 图森:http://www.tusimple.com/ ,图森是一家位于中国北京和美国圣迭戈的人工智能广告公司。由中国连续创业者和美国顶尖院校科学家共同创办。图森是图片内嵌原生广告的缔造者——我们根据互联网媒体上的图片和文字内容信息及用户行为,自动将合适的广告以原生的方式植入图片内,实现一种全新、高效的广告投放。 @winsty 大神在。

  • TalkingData: https://www.talkingdata.net/ ,北京腾云天下科技公司的产品,这是一家专注于移动互联网综合数据服务的创业公司,几位创始人以前都是Oracle的同事。

  • 格林深瞳:http://deepglint.com/

  • Face++ : http://www.faceplusplus.com.cn/ , 人脸识别

  • DataStory数说故事:http://www.datastory.com.cn/ ,

  • DeepCare: http://www.deepcare.com/ , 医疗

  • 车瑞科技:http://www.cherui.cn/ ,基于视觉的行车安全。

  • 思派网络: 肿瘤数据银行 中国的“Flatiron” ,2016年1月份完成A轮逾千万美元融资, 2016年6月份完成B轮融资。

  • 文因互联(Memect): http://memect.cn/ 金融数据知识图谱,语义搜索引擎

  • 图普科技 :https://open.tuputech.com/ , 基于深度学习的图像识别技术多维度解读图片和视频

  • 玻森 : http://bosonnlp.com/ , 玻森中文语义开放平台提供使用简单、功能强大、性能可靠的中文自然语言分析云服务。

  • 医渡云: http://www.yiducloud.com.cn/ , 致力于通过世界领先的大数据技术,助力医院及医生,为患者提供更好的医疗服务

  • 博云视觉 : http://www.boyunvision.com.cn/ , 博云视觉(北京)科技有限公司是一家专注于视觉搜索与分析技术研究和应用的科技创新公司。公司核心创始团队来自于北京大学数字视频编解码国家工程实验室,多年来致力于视觉搜索与分析算法的深度研究,以及产业化应用。

  • 医学 : http://www.hintontech.cn/ , AI4MED致力于将人工智能技术应用于医疗领域这些技术包括:知识表示与推理, 机器学习, 概率图模型, 深度学习.

  • Viscovery : http://viscovery.cn/ , Viscovery于2010年开始研究移动端的图像识别技术,经过了多年图像识别技术研发的累积,以及实地操作大量客户落地场景的基础之上,成功开发出智能视频探索平台VDS。独有全方位视频内容识别引擎,智能识别七大标的,人脸,图片/商标,文字,声音,动作,物件,场景;自动在视频中产生信息、标签、商品等大量内容,增加广告投放或电商交易收入,实现将流量转换成营收之目标。

  • 森亿智能: https://www.synyi.com/ , 杜绝一切医疗数据的浪费。团队已获由真格基金领投的天使轮融资。

  • 码隆科技:http://www.malongtech.cn/ , 一家专注于引领深度学习与计算机视觉技术突破的人工智能公司,致力于打造全球领先的视觉决策引擎,并为企业提供国际领先、定制化的计算机视觉解决方案。

  • 桃树: http://www.taodatarobot.com/ , 整合企业内部数据和外部数据,把纷繁复杂的原始数据自动转化为决策数据

  • Momenta :Momenta成立于2016年9月初,是一个致力于打造无人车大脑,专注基于深度学习的环境感知、高精度地图、驾驶决策技术的团队。产品包括不同级别的自动驾驶方案,以及衍生出的大数据服务。Momenta团队来源于清华大学、麻省理工学院、微软亚洲研究院等。其中有世界顶尖的深度学习专家,例如图像识别领域最先进的框架Faster R-CNN和ResNet的作者,mageNet 2015、MS COCO Challenge 2015多项比赛冠军。因此团队拥有深厚的技术积累和极强的技术原创力。

  • 小鱼在家: http://www.zaijia.com/ , 小鱼在家主打音视频通讯的家庭陪伴功能,今年2015年1月上市,6月开始量产,至今已经不短。据CEO宋晨枫介绍,用户反馈非常正面,80%的应用都是围绕着孩子,20%左右是围绕着老人,用户的黏性也不错,用户平均每天6-8次通话,每周累计通话75分钟,周活跃终端比例达到90%。他们也进驻了几十家线下体验店,线下销量在稳步上涨,但仍比线上少很多。

  • 驭势科技 : http://www.uisee.com/ , 为10亿人交付安全、舒适、低成本的自动驾驶技术、产品和服务。驭势科技团队主要由三支顶尖技术团队强强联合组成,其中包括英特尔中国研究院总监级工程师为主、有10年以上软硬件设计和优化经验的系统团队、中国顶尖的计算机视觉和人工智能团队(来自格灵深瞳),和2013年智能车未来挑战赛冠军团队的自动驾驶技术带头人。

  • 思必驰 : http://www.aispeech.com/ , 思必驰初创于2007年,由剑桥大学团队创立于英国剑桥高新区,2008年回国创业。是国内唯一拥有人机对话技术,国际上极少数拥有自主产权、中英文综合语音技术(语音识别、语音合成、自然语言理解、声纹识别、性别及年龄识别、情绪识别等)的公司之一,其语音技术曾经多次在美国国家标准局、美国国防部、国际研究机构评测中夺得冠军,被中国和英国政府评为高新技术企业。思必驰团队使命:智能硬件和物联网时代,让人机交互更有用、有趣。

  • 达闼科技 , http://cn.cloudminds.com , 成立于2015年初,云端智能机器人运营商,专注于实现云端智能机器人运营级别的安全云计算网络、大型混合人工智能机器学习平台、以及安全智能终端和机器人控制器技术研究。公司由国家“千人计划”首批特聘专家、前美国UT斯达康公司CTO、中国移动研究院院长黄晓庆先生发起成立,软银国际孙正义先生是创始股东之一。

  • iPIN : http://ipin.com , iPIN 致力于打造一个更加广泛的商业认知平台,涵盖商业语言理解和智能信息分析。iPIN 的 AI+ 模块已经被广泛应用到教育、招聘、生涯规划、法律、金融等各种商业场景,帮助人们在充满挑战的环境中更高效地工作,实现决策智能化。

  • 神策数据:https://www.sensorsdata.cn , 数据管理、分析、可视化。

  • 天壤智能: https://tianrang.com , CEO是薛贵荣博士。

  • Clare.AI https://www.clare.ai/ , 香港创业公司,chatbot在银行金融领域的客户服务应用。

  • WifiPix http://www.wifipix.com , 数据采集、分析、管理。

  • DT稿王 :http://writingmaster.cn , DT稿王的价值在于发挥大数据的优势,通过智能化服务,提高写作效率、优化内容、提升内容创作的质和量; 并提供丰富的资讯产品和技术服务,达到事半功倍的效果。

  • 宜远智能 : http://yiyuan.ai/ , 医疗影像、机器学习。

  • 麦迪雷达 : MediRadar , 专注于消化道方向,MediRadar致力于将深度学习应用于医疗影像自动化诊断。

  • 蓦然认知 : http://mor.ai , 蓦然认知(又名:小蓦机器人)是一家以认知计算、自然语言理解技术为核心的人工智能公司,提供信号处理+语音+ 语义+云端服务自动对接的一站式智能交互解决方案。

  • 阡寻科技 : http://www.chancein.cn/ , NLP在金融应用。

  • 语知科技 : http://www.yuzhinlp.com/  NLP服务。

  • 页码科技 :https://www.eyespage.com/ , 搜索和推荐。

  • 深知无限 :http://www.aitcbeijing.com/ , 文本挖掘,信息抽取。

  • 图玛深维 : http://www.12sigma.cn , 医学。

  • 香侬科技:  Jiwei Li在。

  • 竹间智能: http://www.emotibot.com/ ,聊天、客服等的机器人。


国外

  • api.ai : https://api.ai/ , Build brand-unique, natural language interactions for bots, applications, services, and devices.

  • Palantir:https://www.palantir.com/

  • Algo AI: https://www.argo.ai/ , 福特斥资10亿美元投资自动驾驶初创公司Argo AI

  • Auto X: http://www.autox.ai/ , 肖健雄,自动驾驶。

  • MagicLeap : http://www.magicleap.com/ , 虚拟现实 增强现实

  • Apaca : http://www.alpaca.ai/ , AI和金融的结合

  • Orbit : http://www.orbitsentiment.com/  金融类NLP。

  • landing.ai : https://www.landing.ai/ , Andrew Ng的公司。

  • Predicta : https://www.predicta.com/ 自动化市场情报公司 Predicta, Inc. (Mcminnville, OR, 97128) 完成融资 $1,100,997 美元,创建了一项人工智能服务,自动对品牌及其产品进行市场调查。客户包括快销品公司,包括化妆品、户外和体育用品、家居装饰、食品和饮料等。Predicta 把网络上公开的大量非结构化数据提炼成关于任何主题的关于消费者感知,思想和感受的简单直观的情报。 来自@硅新社

  • Syllabs , https://www.syllabs.com/ , An agency of robot writers that turn your data into texts (articles, customized emails, reports, product info sheets etc.). Give a voice to your data. After being configured by our linguists, each robot can write several thousand quality texts per hour. Besides, our robots are multilingual!

  • arria:http://www.arria.com/ ,自然语言生成。

  • Yseop : https://yseop.com/ , Yseop is an artificial intelligence enterprise software company whose natural language generation products automate reasoning, dialog, and writing in multiple languages. Yseop offers Yseop Compose, the only self-service enterprise-level language generation technology on the market. Yseop also builds bespoke solutions helping businesses leverage data, automate business processes, and aid in their digital transformation.

  • Automated Insights: https://automatedinsights.com/ , Automated Insights(前3轮共融资1080万美金,并于2015年被美国私募股权基金 Vista Equity Partners以8000万美金的价格收购).Automated Insights的主要产品是WordSmith,该产品已经在美国联合通讯社(The Associated Press)和雅虎得到成功应用,用于撰写财新和体育类报道。让人惊叹的是,美联社在采用Automated Insights的文本生成技术后,每季度可以撰写的财报新闻数量从300篇增加到了4300篇,生产力得到了极大的提高。

  • AlchemyAPI:http://www.alchemyapi.com/ , deep learning、NLP等的API,demo也不错。

  • Alphasense: https://www.alpha-sense.com/ , 是一个解决专业信息获取和碎片问题的金融搜索引擎。Alphasense面向金融投资领域,从文件/新闻和研究中集合所有投资信息并进行语义分析,在全球公司数据中进行趋势分析。其使命愿景是从大量噪音中寻找有价值的信息,专注信息丰富度和碎片化基本问题,从而大大提高金融人士的工作效率,节省工作时间。 from@文因互联

  • Agolo http://www.agolo.com/ ,  Agolo利用机器学习、自然语言处理以及大数据技术来简化和合成数据信息。简单的来说,有了Agolo之后,用户不用去看散落在各处的新闻,文档和企业数据。Agolo实时整合这些数据,并创建概要文档,为用户获取信息提供帮助。

  • Alterra :http://alterra.ai/en/ , Alterra.ai 采用人工神经网路不需要写代码,实现预定机票的机器人。摆脱了正则表达式写各种规则。

  • Everstring:http://www.everstring.com/ , 团队很强大。

  • Enlitic: http://www.enlitic.com/ , Enlitic于2014年8月在三藩市成立,采用深度学习和图像分析帮助医生做出诊断并标记出医学图像中的异常,从而让医疗更加精确和更有效率。例如,Enlitic可以分析X光、核磁共振成像或CT扫描得到的医学图像,然后找出数据中的趋势或单个图像中的异常情况。

  • Clarifai: http://www.clarifai.com/ , CV领域的创业公司,基于DL的结果非常好,公司价值就不知道了。

  • RealFace : http://www.realfacetech.com/ , 人脸识别公司,被苹果收购。2017年。

  • CrunchBase : https://www.crunchbase.com , CrunchBase是一个以Web 2.0方式表达的创业公司数据库,包含了创始人,关键雇员,财务状况,收购新闻以及其他重要事件。此外,CrunchBase也包含了知名创业人物及投资者的信息。CrunchBase开始于2007年。

  • CYC: http://www.cyc.com/ , Cycorp is a leading provider of semantic technologies that bring a new level of intelligence and common sense reasoning to a wide variety of software applications.

  • DeepArt : https://deepart.io , Neural Art

  • Diffbot: https://www.diffbot.com/ , 信息抽取

  • Ersatz:http://www.ersatz1.com/ , deep learning解决客户的问题。

  • Etleap :http://etleap.com/ , Etleap推出云端的数据清洗产品。 该公司的创始人曾经是VigLink的CTO, 深为理解工程师和分析师在数据ETL过程中花费的大量时间, 因此离职后创办了Etleap来解决这个痛点。 数据清洗这个领域的重头玩家当属Informatica, 今年早期私有化。Talend,聚焦在Hadoop的数据整合公司正在IPO准备当中。初创公司如Trifacta和Paxata在过去的两年中使得这个领域更加迷人。

  • Semantic Machines: http://www.semanticmachines.com/ 自动问答和对话

  • SalesPredict : http://www.salespredict.com/ , SalesPredict公司创建于2012年,专门通过该公司的分析服务来帮助企业增加收入,SalesPredict的分析服务可以预测业务的理想潜力与发展前景,因此帮助企业提升他们与实际客户的转化率,从而达成最终的交易协议。

  • GrowingIO:https://www.growingio.com/ ,一个网站和移动端数据分析平台,通过数据分析驱动企业决策

  • GoButler : http://www.gobutler.com/ , 24小时私人助理,通过短信帮你订外卖,帮你买机票等等(与Magic是竞争对手)。

  • Cortica : Cortica提供专业级的图像识别技术,它的原理是仿照人类在识别图像时大脑皮质中神经网络的图像处理的方式。它的联合创始人兼CEO Igal Raichelgauz称,这项技术源自他之前在以色列理工学院的实验室,对于大脑组织的研究。该公司将他们的产品出售给出版商和广告商,用以展示与页面图片内容相关的广告内容

  • Semantria:总部位于马萨诸塞州艾摩斯特市,它是文本分析老将Lexalytics的一款副产品,他通过API和Excel插件实现功能,而不需要安装软件。它的创始人兼CEO Oleg Rogynskyy称,公司通过整合更多深度学习的方法和扩展除维基百科(Lexalytics 引擎获取语义知识的地方)之外的数据源,来提高服务的精度

  • wise.io: http://about.wise.io/ ,有个非常好的随即森林的工具,WiseRF

  • http://www.ispeech.org/ ,做语音的公司

  • datumbox API:http://www.datumbox.com/machine-learning-api/ ,Datumbox API提供主客观句判断,twitter情感分类,话题抽取,垃圾邮件检测,相似文档检测等功能

  • http://prediction.io/ ,PredictionIO is an open source machine learning server for software developers to create predictive features, such as personalization, recommendation and content discovery.

  • http://vicarious.com/ , Vicarious is developing machine learning software based on the computational principles of the human brain. Our first technology is a visual perception system that interprets the contents of photographs and videos in a manner similar to humans. Powering this technology is a new computational paradigm we call the Recursive Cortical Network ™.

  • ClearStory: http://www.clearstorydata.com/ ,它不仅可以帮助公司客户收集和处理来自网络和大公司数据源,还能结合分析公司客户的私有数据,以帮助公司客户更好地发觉商业契机和新的趋势,而且通过将信息可视化,帮助客户用最简单的方式了解和处理信息。

  • Swift IQ, He has already been providing machine learning tools to help businesses convert their data assets to APIs. Now they are banking on a future where MLaaS will become a necessity for businesses that want to create compelling, contextual shopper experiences.

  • idibon: http://idibon.com ,Idibon helps companies understand their language data. Using cutting-edge natural language processing, Idibon takes unstructured data like emails, instant messages and social media, and provides structured answers to key business intelligence questions.

  • Indico : https://indico.io/ , Combine your skills with the power of machine learning to discover the true potential of your text and image data.

  • etcML:http://www.etcml.com/ ,斯坦福的文本处理工具

  • ClearStory :http://www.clearstorydata.com/ , 商业世界中数据量不断扩大,有很多大数据公司都在解决商业智能和数据分析的需求。ClearStory也是其中一家,它也会从不同数据源收集信息并进行分析,供企业做决策参考。首先,ClearStory 将各种分散的数据源整合起来,每个数据源都由各自的特性和 API,而 ClearStory 将会首先寻找不同层级的数据之间的联系。其次,ClearStory 将会重建一个新的数据层,并用图形化的方式将此展现给数据分析师们。

  • Paxata: http://www.paxata.com/ , Paxata 成立于 2012 年,其联合创始人兼 CEO 是 Prakash Nanduri。在数据服务领域,存储和提供数据来源的数据管理系统(如 Hadoop)和利用数据的分析应用之间普遍存在的一道鸿沟,即分析应用在对数据分析之前需要抽取、处理和整合多个来源的数据才能进行分析。这个数据准备的过程以往大都需要人工处理,耗时费力,Paxata 的目的就是要填补这道鸿沟。Paxata 的解决方案包括连接、发掘、转换、合并、发布、协作控制等功能。其中连接可将多种来源的数据(Hadoop 等,支持 Excel、文本文件、关系数据库、XML、JSON 等格式)接入然后自动解析数据。发掘功能可支持全文检索、交互式文本及数字过滤器、直方图、热点图等帮助识别错误与重复或缺失数据;转换功能可实时完成数据的分解、连接、去重、空行检测等。合并功能则可自动检测多数据集的共同属性然后合并为单一视图。数据准备的结果可以发布到各种 BI 工具上。

  • Affectiva : http://www.affdex.com/ ,成立于 2009 年的 Affectiva 是一个基于云端的面部情绪识别解析服务公司,通过面部动作编码(Facial Coding)——捕捉识别对象的面部动作如皱眉、挑眉、傻笑、微笑等等判断人们的情绪。目前还主要用于市场营销,但 Affectiva 下月会面向第三方开发者推出其 SDK 开发工具。此前它已获得总计 2020 万美元的投资(李嘉诚参与过其投资),共有员工 35 名。

  • Granify 和 Commerce Sciences 都算和识别潜在消费顾客的服务,是为了促进销售的。而另一方面,如果能识别出欺诈用户,那则是可帮电商企业降低风险。欺诈识别这个领域国内有 Xiaoclick 在做,国外公司则有Signifyd和Sift Science。

  • 0xdata:http://0xdata.com/ ,H2O makes hadoop do math! H2O scales statistics, machine learning and math over BigData. H2O is extensible and users can build blocks using simple math legos in the core. H2O keeps familiar interfaces like R, Excel & JSON so that big data enthusiasts & & experts can explore, munge, model and score datasets using a range of simple to advanced algorithms. Data collection is easy. Decision making is hard. H2O makes it fast and easy to derive insights from your data through faster and better predictive modeling. H2O has a vision of online scoring and modeling in a single platform.

  • Alpine:http://alpinenow.com/ ,Alpine Data Labs是在大数据时代中弄潮的最新一家初创企业,该公司刚刚获得了 1600 万美元的融资,此轮融资由 Sierra Ventures、Mission Ventures 等提供。

  • frrole:http://frrole.com/ ,Frrole helps media and brands discover the most insightful and relevant information from Twitter conversations.

  • Framed Data : http://framed.io/ , Square 宣布正式收购数据服务工具 Framed Data 团队。Square 收购 Framed Data 的目的就在于此需要对每个客户进行详细的风险分析,并确定他们将要偿还贷款的利率是多少。Framed Data 此前获得过 200 万美元的种子轮融资,在做数据分析引擎,帮开发者了解用户行为。举例来说,开发者把应用的数据提交到 Framed Data 上,Framed Data 会使用一些机器学习模型来读取这些数据,进而描绘出用户的行为。当用户行为被描绘出来后,Framed Data 就可以把它和已经存在的用户数据库做对比,这样也就能利用过去的用户行为数据来识别出那些高风险、可能会离开的用户。在机器学习和数据科学领域,拿到的数据越多,精确程度自然就越高。 [2015-3-15]

  • http://rekognition.com ,从名字就看出是做什么的来了。。

  • AYLIEN:http://aylien.com/text-api ,人家的APi做的真好,还有商业化呢~

  • http://www.cortica.com/ ,也是一个有图像和机器学习技术的公司

  • http://idibon.com/ ,自然语言处理、舆情分析。

  • PlaceIQ :http://www.placeiq.com/ ,基于地理位置提供移动广告的初创公司PlaceIQ却对外宣称其已获得了 1500 万美元的 C 轮融资。http://www.36kr.com/p/209596.html

  • skyphrase:https://skyphrase.com/ ,Siri、IBM 的 Watson、Google Now、微软明年也要推 Cortana 了,雅虎也坐不住了。该公司刚刚收购了一家自然语言处理技术初创公司—— SkyPhrase。它马上会加入 Yahoo Labs。这项技术今后的主要任务应该是改进雅虎的现有产品。比如交互式游戏梦幻体育游戏这项 Yahoo 投入可观的业务。去年,Forbes 报道称,Gmail 和 Twitter 的相关技术支持就是 SkyPhrase 提供的,允许用户跟机器说“人话”得到个性化的搜索结果。比如“NANA 发的带图微博”,或者“Jane 发给我的包含照片的电子邮件”——这样复杂的信息 Siri 是理解不动的。这个公司还开发了两款应用,其中一款能让用户查看梦幻足球的比分统计数据,另一款应用与 Google Analytics 整合发挥作用。

  • http://www.emotient.com/ ,识别认得面部表情来做一些事情,例如在google眼睛、电子商务中

  • http://thinknum.com/ ,Thinknum is a web platform for financial analysis. Collaborate on investment research with users from around the world.

  • http://www.visenze.com/ ,视觉产品现在是互联网的前沿。有很多家公司都是人们消费内容的流行站点,但是搜索还依然由文本来控制。新加坡的创业公司ViSenze为图片提供了视觉搜索和图像识别的方案,主要面向电子商务和广告客户,希望改变这一局面。

  • http://www.orcam.com/ ,OrCam 是一家以色列的初创企业,由希伯来大学的教授 Amnon Shashua 和 Ziv Aviram 联合创办。OrCam 是一套视觉分析系统,由绑定在眼镜上的小型摄像头和一套处理系统组成。该处理系统内置了飞思卡尔的芯片,后者高速应用处理器可运行复杂的计算机视觉算法,从而对看到的东西进行解析,然后通过骨导语音告诉穿戴者——弱视群体。

  • http://www.syntun.com.cn/ ,“星图数据”是一家成立于2009年的大数据“DaaS”创业公司,他们致力于为传统制造业公司提供完整的在线产品销售数据信息,并生成直观的可视化报告。

  • http://www.flatiron.com/ ,Flatiron Health 是一家想用大数据改变肿瘤医疗行业的科技公司,面对全美仅有 4% 的确诊肿瘤病人会参与临床医疗试验,而剩下的 96% 的治疗数据则以不可持续的、非结构化的方式被留存,很难对整体行业产生贡献的现状,Flatiron 打造了一个 OncologyCloud(肿瘤学云平台),希望通过将病人电子病历(EMR)中的临床数据以及医疗费用数据进行提取和整合,使之可以实时地被肿瘤学专家获取,让他们能根据过去的治疗结果来制定新的医疗方案。

  • http://www.curalate.com/ ,Curalate 运用图像识别技术,分析用户在社交网站,如 Pinterest、Instgram 和 Tumblr 上分享的图片,从而了解什么类型的图片会获得高转发量。如果图片附有描述文字,那么文字信息也会被采集并分析。Curalate 根据所得数据帮助客户决定应该展示什么类型的图片、如何描述商品、甚至在网站首页和促销邮件上应该放置什么商品。目前的客户包括各大快消品牌、出版商及零售商。

  • http://graymatics.com/ ,Graymatics is a cognitive media processing company. Specifically, we have developed a technology that can almost magically recognize and categorize image and video content. We enable computers and mobile devices to scan just about any photo or video in the world and tell you what they are about and who or what is in them. nus Prof Shuisheng Yan做首席科学家。

  • http://emcien.com/ ,Predict what's next, discover hidden patterns and solve complex problems with Emcien's simple tools.

  • http://scyfer.nl/ ,Professor Max Welling参与的创业公司。

  • Guidewave consulting LLC http://guidewaveconsulting.com/ ,还记得那篇用twitter中用户的情绪来预测股市的paper么,Twitter mood predicts the stock market,这就是作者成立的公司了。

  • Malluba : http://www.maluuba.com/ , Advancing the collective intelligence of humans and machines through Deep Learning. Yoshua Bengio as the advisor. 2017年被微软收购了。

  • mobileye :http://www.mobileye.com/ , 特斯拉的自动驾驶辅助系统就是来源于这家以色列的公司,牛。。

  • Moodstocks : https://moodstocks.com/ , Google在昨日(7月6日)宣布正式收购法国创业公司Moodstacks。该公司主要为智能手机开发以机器学习为基础的图像识别技术,其API被开发者们形容为“影像界的Shazam(一款知名音乐识别软件)”。

  • Nara:http://www.nara.me/ 餐馆推荐

  • Nugit : https://nugit.co , Nugit所研发的人工智能能够实时的从不同的数据源对数据进行提取集成。同时Nugit还具有自然语言生成技术,能够从数据中得出结论同时转化为智能、设计精美的报告并通过电子邮件或PPT呈现出

  • http://www.recommind.com/ ,PLSA作者。

  • http://www.wiseathena.com ,Big data startup Wise Athena has presented this week their novel approach to churn prediction based on deep learning technology. This way, the San Francisco based company becomes the first company to apply deep learning to customer churn prediction.

  • Open AI : https://openai.com , advance digital intelligence in the way that is most likely to benefit humanity as a whole, unconstrained by a need to generate financial return.

  • Persado : http://www.persado.com/ ,用机器来写广告的 Persado 刚刚获得了 2100 万美元的 B 轮融资。

  • Predata : http://www.predata.com/ , 2016 年 4 月 7 日,据每日邮报报道,总部位于美国华盛顿的初创企业 Predata 宣称,其开发的“少数派报告”式软件可以精确预测发生下次恐怖袭击的几率。

  • Rubikloud's http://rubikloud.com/

  • stitchfix.com:word2vec相关应用

  • zestfinance: http://www.zestfinance.com/ 大数据金融风控

  • looker:http://www.looker.com/ 商业智能

  • Equivio:http://www.equivio.com/ ,Equivio是一家提供有关法律合规的文本分析方案的公司。Equivio为法律领域提供一种名为Zoom的机器学习平台,该平台已通过法院审核,它改变了电子取证的业务流程。现在Zoom正在领导着信息治理的转型。Zoom的用户包括数百家龙头企业,律师事务所与莫谈国事机构。Zoom在有效整理所收集文件的同时,也量化与可视化了各机构的决策空间。所以你可以通过Zoom以微观和宏观的方式来查你所需。

  • Narrative Science http://www.narrativescience.com/ , Narrative Science于 2010 年 1 月 1 月在芝加哥成立,致力于通过多重数据源为用户自动生成可读性文本。 NLG

  • metamind :https://www.metamind.io/ ,斯坦福深度学习博士Richard Socher貌似并未直接赶赴普林斯顿大学担任教职,而是在硅谷进行深度学习创业,目前得到800万美金的资金支持。据其介绍,其网站能通过点鼠标以及托、拉、提、拽的操作进行深度学习模型训练。DEMO: http://t.cn/RzKkWDY Wired:http://t.cn/RzKkWDl

  • Import.io:https://www.import.io/ , Import.io 是一家大数据初创企业,成立于 2012年,总部位于英国伦敦。它的数据析取平台可以将网站、论坛等来源的结构化数据析取出来,供客户用于大数据分析。

  • Prisma :http://prisma-ai.com/  Neural Art

  • Synapsify:http://www.gosynapsify.com/ , 非结构化文本的观点提取, Synapsify构建了能在语义上阅读和学习类似人类书写内容的应用,可以用于加速发现、观点提取和建议。这家公司的愿景是让所有人都可以在没有技术专家和资源的情况下使用机器智能得到可操作的观点和发现,并从中受益。(from机器之心)

  • statmuse : https://www.statmuse.com/ , 帮助普通用户通过自然语言查询 NBA 数据的初创企业 StatMuse 刚刚获得了 1000 万美元的 A 轮融资。

  • Sprinklr : https://www.sprinklr.com/ , Sprinklr 成立于2009年,总部位于纽约,是一家为企业用户提供社交媒体跨平台整合管理工具和服务的公司。利用 Sprinklr 的社交媒体管理平台,企业用户可以在这一个平台上同时管理多个社交媒体上的内容、广告,分析数据,开展营销活动,了解用户体验,销售,等等。此外,Sprinklr在2015年推出了“体验云”(Experience Cloud)服务,提供了19个社交媒体管理模块,可以让品牌商在23个社交渠道和品牌网站上持续地创建、管理和优化有价值的用户体验。

  • Solvvy: https://www.solvvy.com/ ,  Solvvy位于美国加利福尼亚州帕洛阿尔托,是一家机器学习初创公司,旨在用领先的机器学习技术重塑企业的客户体验。该公司的第一个产品是Solvvy for Support,能帮助企业在没有人为干预的情况下回答大量的支持请求。在提交请求时,用户使用日常语言陈述他们的问题,Solvvy则可以用精确的答案来解答问题,这消除了客户的等待时间。如果某个特定的问题需要人工来解答,则会被转接到人工支持。由于整个过程减少了客服人员的参与,及时而准确的回答在提高客户满意度的同时,也降低了企业的成本。

  • Trifacta : https://www.trifacta.com/ , 新闻:大数据清理软件公司Trifacta 融资3500 万美元

  • Twentybn: https://www.twentybn.com/ , We teach machines to perceive the world like humans  视频理解

  • The Curious AI Company : http://www.thecuriousaicompany.com/ , 无监督学习, Ladder Networks technology

  • VisionLabs : http://www.visionlabs.ru/en/ , VisionLabs 成立于2012年,其开发的 Luna 面部识别软件能基于照片或视频图像,帮助企业客户立刻识别、验证客户。Luna软件不仅拥有高质量的识别能力,而且也有先进的类型识别技术.

  • ZestFinance : https://www.zestfinance.com/ , 北京时间7月18日下午消息,百度今天宣布,该公司将向美国金融科技公司ZestFinance进行数额未明的投资,后者将机器学习与大数据分析融合起来提供更加精准的信用评分。 作为此次投资的一部分,百度将使用ZestFinance的技术来判断其用户的信用。例如,如果未成年人用户在工作日搜索视频游戏,表示此人可能没有工作,而且不是学生,这项数据便可以用于判断此人的信用状况。

  • BOXFiSH(盒子鱼英语): https://www.boxfish.cn/ , 2016年11月16日,BOXFiSH(盒子鱼英语) CEO黎小说宣布公司已完成B+轮融资,同时宣布BOXFiSH8.0运用AI技术解决教育难题的智能平台上线,并探讨未来人工智能如何更好为教育服务。

  • dorabot :http://www.dorabot.com/ , 机器人。

  • Wonder Workshop(奇幻工房) : https://www.makewonder.com/ , Wonder Workshop 创立于 2012 年,产品还未上线时曾获得 144 万美元的支持,去年 5 月获得 690 万美元 A 轮融资。截至目前,Dash 和 Dot 这两款机器人已经在全球范围内 7000 家小学、幼儿园和早教机构使用,其中 4000 家在美国境内,销售额超过 350 万美元。另外,Wonder Workshop 去年推出了面向全球所有用户的编程比赛,报名人数超过 5000。

  • Heuritech http://www2.heuritech.com/ , 数据抽取和结构化。

  • Jukedeck : https://www.jukedeck.com/ , Use artificial intelligence to revolutionise the way people and companies make and consume music.

  • veritone , https://www.veritone.com/ , 国人工智能(AI)创业公司Veritone日前正式提交了IPO招股书,计划融资1500万美元,股票代码定为“VERI”。Veritone开发出了一个专属人工智能平台,旨在充分利用认知计算的能力。这是一个基于云的开放式平台,目前已整合了40多个知名认知计算引擎,主要来自谷歌(微博)、微软、IBM和惠普等公司。其目的是从大量的音频,视频和结构化数据中提取各种有价值的信息。

  • Drive.ai : https://www.drive.ai/ , 自动驾驶。

  • AKA : http://www.akaintelligence.com/ , 机器人家庭教师Musio在日本首次亮相:主打个性化.

  • Babylon Health : https://www.babylonhealth.com/ , Babylon Health 的最主要产品是一款集合了人工智能 (聊天机器人:triage)、供用户和医疗专业人士进行视频交流、并提供相关咨询方案的 APP。这笔新融资将用于进一步提升 AI 的功能拓展,包括提供 AI 的诊断(而不是更简单的分类咨询),这一功能计划在今年晚些时候推出。Babylon Health 创立于 2013 年,在2016 年完成了 2500 万美元的 A 轮融资。

  • Ada Health : https://ada.com/ , 医疗诊断咨询app。

  • Conversable , http://conversable.com/ , Conversational Intelligence is about giving end users what they want.

  • DeepMap : https://www.deepmap.ai/ , 自动驾驶。

  • Plus.AI : http://plus.ai/ , 自动驾驶。

  • Roadstar.ai : http://roadstar.ai , 自动驾驶。

  • Pony.ai  : 自动驾驶

  • Jingchi.ai : 自动驾驶。

  • KITT.ai : http://kitt.ai/  , NLP

  • Embodied Intelligence : Pieter Abbeel大神参与的公司。 Embodied Intelligence wants to use AI and VR to teach robots new skills, like how to manipulate wires, much faster.  

  • NovuMind : http://www.novumind.com/ 不知道做啥的

  • Roadstar: http://roadstar.ai/  自动驾驶



玩具

  • GateBox: http://gatebox.ai/ , 全息投影式的智能机器人Gatebox就走了不一样的思路。跟一般的智能机器人不一样,它可能并不会在家里跑来跑去,这个全息投影出来的萌妹管家能做的就是安静的站在哪里等着你回家。想想初音未来的火热,阿宅们应该非常能接受这种机器人的设定。整个角色的设定跟初音有点类似,从产品的Demo视频来看,语音系统也没有生硬的机械感,更像动漫中的女仆在跟你对话。跟现在的智能机器人的功能非常相似,Gatebox也是一个智能家居系统,你可以通过它控制家里各种设备的开关。




Security

  • RiskIQ :https://www.riskiq.com/ , RiskIQ 创立于 2009 年,总部位于旧金山,致力于让企业及组织客户能够访问安全智能和应用程序,从而保护数字攻击面、定位业务风险。客户能够随时发现和处理恶意软件、恶意广告和恶意 App,降低网络、移动及社交工具的威胁。RiskIQ 通过全球代理网络每天持续扫描数以千万计的网站,随时向客户报告异常情况。据悉美国前十大金融机构中有八家都适用 RiskIQ 追踪监控企业 web 和移动应用资产。


其他手机页

  • SIFT作者David Lowe收集的计算机视觉公司: The Computer Vision Industry - http://www.cs.ubc.ca/~lowe/vision.html




工业互联网




产业智能官  AI-CPS


加入知识星球“产业智能研究院”:产业OT技术(工艺+精益+自动化+机器人)和新一代IT技术(云计算+大数据+物联网+区块链+人工智能)深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的机器智能认知计算系统实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链



版权声明产业智能官(ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。



登录查看更多
1

相关内容

最新!Yann Lecun 纽约大学Spring2020深度学习课程,附PPT下载
专知会员服务
112+阅读 · 2019年12月24日
神经网络与深度学习,复旦大学邱锡鹏老师
专知会员服务
116+阅读 · 2019年9月24日
AI创业公司大列表
专知
4+阅读 · 2019年1月14日
【人工智能】深度学习的应用和价值、深度学习综述
【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上
机器学习研究会
4+阅读 · 2018年3月10日
从零开始:教你如何训练神经网络
机器之心
5+阅读 · 2017年12月11日
一文读懂深度学习(附学习资源)
深度学习世界
6+阅读 · 2017年11月9日
三天速成!香港科技大学TensorFlow课件分享
机器之心
11+阅读 · 2017年10月7日
推荐|斯坦福大学机器学习:神经网络的表示!
全球人工智能
5+阅读 · 2017年9月20日
EfficientDet: Scalable and Efficient Object Detection
Arxiv
6+阅读 · 2019年11月20日
Arxiv
4+阅读 · 2018年9月11日
Arxiv
4+阅读 · 2018年9月6日
Arxiv
5+阅读 · 2018年4月22日
VIP会员
相关资讯
AI创业公司大列表
专知
4+阅读 · 2019年1月14日
【人工智能】深度学习的应用和价值、深度学习综述
【吴恩达deeplearning.ai笔记二】通俗讲解神经网络上
机器学习研究会
4+阅读 · 2018年3月10日
从零开始:教你如何训练神经网络
机器之心
5+阅读 · 2017年12月11日
一文读懂深度学习(附学习资源)
深度学习世界
6+阅读 · 2017年11月9日
三天速成!香港科技大学TensorFlow课件分享
机器之心
11+阅读 · 2017年10月7日
推荐|斯坦福大学机器学习:神经网络的表示!
全球人工智能
5+阅读 · 2017年9月20日
Top
微信扫码咨询专知VIP会员