有没有大神知道,有什么好用的大数据可视化工具?

关注者
86
被浏览
52,667
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

之前有一个回答非常详尽,这里就不赘述:有哪些值得推荐的数据可视化工具?

下面再补充介绍3款国外的数据可视化工具:

1、统计计算的R项目

R通过图形和可视化功能为统计计算和数据处理提供了完善的软件环境。该软件(以源代码格式)可在GNU公共许可证下获得,并且与UNIX,Mac和Windows操作系统兼容。R使用S统计编程语言,被认为是该古老的FORTRAN替代产品的现代实现。

R能够运行而不更改为S编写的代码。考虑到S在统计研究中的持续流行,R为有兴趣探索此领域的人们提供了一个开源替代方案。该软件可以轻松生成出版质量的图形,包括数学符号和公式。

在Mac OS X上运行的R环境

R的功能包括集成的数据处理和存储,对数组和矩阵计算有用的运算符,大量的数据分析工具,前面提到的显示和打印图形功能。它还包括一种简单的编程语言,其中包含条件,循环,递归函数以及输入和输出语句。数据编辑器和数据对象浏览器增加了整体便利性。

需要更多计算能力的用户可以利用用C,C ++和FORTRAN编写并已编译并链接到R的函数。它提供了使用C代码直接在R中操纵数据对象的功能。可能性几乎是无限的。

R支持一个封装框架,封装由CRAN(综合R归档网络)社区中的其他人开发的图形和公式功能。除了轻松扩展R环境之外,这还使新用户能够更快地加快速度。有兴趣的用户可以花整整一个下午的时间浏览可用软件包的列表。

具有统计重点和一定程度的编程能力的数据专业人员需要检查R环境。它是一个有价值的工具,可以展示充满活力的开源开发社区的创造力。在S(在某种程度上是FORTRAN)的支持下,R扩展了那些开创性的统计计算机语言的遗产。

2、Weka将高级可视数据挖掘引入Java

Weka是GNU公共许可证下基于Java的机器学习数据挖掘算法的集合。Weka最初 是由新西兰怀卡托大学的机器学习小组开发的,具有一个典型的开源软件社区的强大社区。Weka代表怀卡托知识分析环境。它也是新西兰本土鸟类的名字。

分析软件公司Pentaho还是Weka开发背后的主要赞助商。他们为希望在其专有软件中使用该工具的公司提供商业许可。Pentaho的商业智能软件利用Weka进行数据挖掘和预测分析功能。

Weka的数据挖掘算法可直接从Java代码调用,也可以将其应用于要挖掘的实际数据对象。Weka至少需要Java版本1.4,而该产品的最新版本则需要1.5或1.6。Weka与Linux,Windows和Mac OS X兼容。虽然Weka在Java环境中更轻松地工作,但是进取的Windows用户可以通过.NET Framework来利用Weka

除了其数据可视化功能外,Weka还允许进行数据预处理,分类,聚类,回归和关联规则定义。它使用JDBC连接到关系数据库源。它也可以读取CSV文件。无法进行多表数据挖掘,Weka通常只处理单个表或关系数据库查询的结果。

该软件的界面同时具有窗口浏览器和命令行界面,两者均具有相似的功能。除了数据可视化工具外,Weka的资源管理器还具有单独的面板,其中包含前面提到的各种数据挖掘实用程序。

Weka的资源管理器界面的作用

Morgan Kauffman出版了一本书,名为《数据挖掘–实用机器学习工具和技术》,这是学习Weka平台的更好方法之一。它提供了数据挖掘的一般概述,同时包括专门介绍如何通过使用Weka来利用这些知识的部分。怀卡托大学还拥有一个专门针对数据挖掘框架的Wiki

有兴趣进一步发展数据挖掘或分析知识的数据专​​业人员应该努力下载,安装和探索Weka的世界。其积极的支持社区可以回答任何问题或提供见解。

3、Gephi –交互式开放图谱平台

Gephi通过其高端交互功能促进对图网络的详细分析。 Gephi通过GNU GPL许可证免费提供,与Windows,Linux和Mac OS X兼容。该工具被视为“ Photoshop for Graphs”。

使用Gephi绘制数据点

Gephi增强功能是使用Netbeans框架以Java开发的,由Gephi Consortium管理,该组织与非营利性公司的法文等效。它的成员包括SciencesPo Medialab和Neo Technology,后者是Neo4j图形数据库背后的人们。谷歌还赞助了Gephi,并将其作为“代码之夏”学生发展计划的一部分。

Gephi的最终目标是通过提供直观且丰富多彩的方式来可视化潜伏在图形数据中的模式,从而促进数据分析师的工作。它对于探索性数据分析的实践很有用,并且很好地补充了传统的统计分析。Gephi允许以CSV和GEXF格式导入数据,并能够连接到数据源以进行实时数据分析。

利用开放源代码OpenGL图形框架,Gephi包含快速的图形可视化功能,从而可以在大型数据集中更轻松地发现图案。它处理包含多达50,000个节点和一百万个边的图形。Gephi还具有用于动态过滤和实时图形处理的工具。

Gephi最先进的算法(包括基于力的和多层的)支持图形布局的效率和质量。用户可以在运行数据集时更改调色板和其他设置,从而提高了工作的整体分析效率。

分析社交图是Gephi统计和指标框架的核心功能。该工具提供社区检测以及紧密度,中间度,聚类系数,PageRank等指标。Gephi还提供创新的动态网络分析实用程序。