开源免费的数据分析与可视化工具
参与大数据、人工智能相关的项目的技术人员,掌握一些数据工具对项目建设至关重要。本文推荐一些优秀的开源数据分析与可视化工具,可以在从数据清洗到可视化等过程提高工作效率。
1.Apache Superset
https://github.com/apache/superset
Apache Superset是一个开源数据挖掘以及数据可视化平台,用户不需要编程知识就可以创建交互式仪表盘。平台支持各种数据源,提供丰富的可视化组件,并允许自定义仪和共享表盘。
平台在功能性方面,它集成了各种数据库和数据仓库,并提供了一个强大的SQL编辑器。在安全性方面,平台可通过基于角色的访问控制和身份验证。在可扩展性方面,它允许添加自定义功能,并且也有一个大型的、活跃的开源社区。
2.Metabase
https://github.com/metabase/metabase
Metabase是一个开源的商业智能工具,具有友好的用户界面、强大的数据可视化功能和交互式仪表板。它支持与各种数据源集成,支持实时查询,并提供自动报告。
Metabase还提供数据探索和发现工具,通过基于角色的访问控制以确保安全。它可以私有化部署,为项目提供了较为灵活的方案。
3.OpenRefine
https://github.com/OpenRefine/OpenRefine
OpenRefine是一个基于Java的数据管理和分析工具。支持用户使用Web端实现数据加工、可视化和功能扩展。
OpenRefine的主要功能包括挖掘、集群、协调、无限撤销/重做、隐私和Wiki。
4.Insights
https://github.com/mariusandra/insights
Insights是一个用于可视化地挖掘PostgreSQL数据库的工具,在图形的生成具有较强优势。
它支持PostgreSQL连接,自动检测发现数据库,允许连接到多个数据库,并允许模式编辑和添加自定义SQL字段。
它还提供数据挖掘、过滤器、基于时间的图形、键盘导航、保存的视图和固定的字段等功能。
安装如下:
复制
npm install -g insightsinsights initinsights startbr
5.Retentioneering
https://github.com/retentioneering/retentioneering-tools
Retentioneering是一个Python库,它主要用于分析点击流、用户轨迹和事件日志变等,并产生比漏斗分析,以便更广泛和更深入理解用户行为。
使用Retentioneering来探索用户行为,细分用户,并形成关于是什么驱使用户采取期望的行动或远离产品的假设。
Retentioneering使用点击流数据来构建行为细分,突出显示影响您的转化率,保留和收入的用户行为中的事件和模式。Retentioneering库是专门为数据分析师、营销分析师、产品所有者、经理以及任何负责提高产品质量的人创建的。
Retentioneering作为Cyberter环境的组成部分,它扩展了pandas、NetworkX、scikit-learn库的功能,以更有效地处理顺序事件数据。Retentioneering优化工具是交互式的,专为分析研究而量身定制,因此,非Python专家也可使用它。只需几行代码,就可以处理数据,探索用户行为地图,并进行可视化。
6.FlyFish
飞鱼(FlyFish)是一个数据可视化编码平台。通过简易的方式快速创建数据模型,通过拖拉拽的形式,快速生成一套数据可视化解决方案。
功能包括:
项目管理:项目用于代表具体的业务需求场景,是多个应用、组件的集合。
应用开发:支持开发大屏应用,可开发单页面或是多页面路由的大屏应用。
组件开发:组件为最小粒度的项目基础,通过创建和开发组件拼凑出最终的可视化大屏展示。
模板库:可将开发完成的应用/组件分别上传到对应的模板库中,可在已有模板的基础上快速创建新的项目。
数据源管理:可接入 MySQL、Http 等多个数据库数据生成对应数据源,供创建项目时组件对数据进行调用。
数据查询:支持根据数据表进行 SQL 查询,精准定位数据源中具体数据并封装保存,也可将查询到的数据重新组合,供组件直接调用。
7.AKShare
https://github.com/akfamily/akshar
AKShare是一个开源财经数据Python接口库,旨在简化获取财务数据的过程。它需要Python(64 bit)3.8或更高版本。
将本文加入收藏夹
新闻详情