本文是我在使用 Pandora 大数据平台的过程中遇到的问题总结,希望可以帮助到大家。
心动不如行动,赶紧开始使用 Pandora 来构建属于你们自己的大数据平台吧。
大数据是什么?
大数据(英语:Big data),又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。在总数据量相同的情况下,与个别分析独立的小型数据集(Data set)相比,将各个小型数据集合并后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定即时交通路况等;这样的用途正是大型数据集盛行的原因。【摘自维基百科】
大数据平台又是什么?
我先给大家看看使用 Pandora 大数据平台构建的一些效果图吧。
Grafana 统计监控:
配置告警后的告警历史
触发警戒值之后还会发邮件的哦(带图的哦)
日志上报后的查询界面
上面这些图表和功能,有没有让你心动呢?
基本介绍
Pandora 潘多拉是一套面向海量数据,以及基础技术人员的,管理大数据传输、计算、存储和分析的大数据平台。
Pandora 共包含五个组件级服务:
组件服务 | 概述 |
---|---|
大数据工作流引擎 | 数据接收,(实时/离线)计算和导出(支持多种数据格式:HTTP,日志检索服务,时序数据库,对象存储); |
时序数据库 | 时间序列数据库(高速存储,聚合和检索); |
日志检索服务 | 海量日志存储和检索; |
报表工作室 | 基于数据快速制作动态/静态报表,生成气象观测台; |
XSpark | 基于 Spark 和容器云,快速进行海量数据分析与可视化; |
如何开始?
目前 Pandora 大数据平台产品处于有限开放、免费试用阶段,你可以联系七牛的销售或客服申请开通试用,也可以发送邮件给 pandora[AT]qiniu.com 注明您的公司名称及联系方式,申请试用。他们在收到申请后一个工作日内为您审核。
- 申请注册七牛账号,登录之后的界面如下:
- 申请 Pandora 大数据平台的相关权限,通过之后登录的界面如下:
从图中,我们可以看出,侧边栏多了大数据工作流引擎、时序数据库、日志检索,容器应用市场,这是 Pandora 包含的 5 个组件的入口。
- 容器应用市场
准备工作
Pandora 大数据平台的基本流程如下:
- 通过(logkit/SDK/API )打数据到工作流(workflow);
- 在 workflow 中,进行数据计算和导出 (可导出到 TSDB/LogDB/HTTP/对象存储);
- 然后在 TSDB/LogDB 中查询数据,或通过 Grafana 进行图表绘制。
其中几个组件服务的基本情况:
- 实时工作流、离线工作流(实时的数据源和消息队列的数据存储时间是2天);
- 时序数据库:创建仓库(类比:数据库)、序列(类比:表)[最大的数据存储时限是30天];
- 日志检索:创建仓库[数据存储时限:最大可设置为永久]
- 容器应用市场:目前官方应用提供有Grafana,Kibana,XSpark;(这 3 个默认是没有开通的,还需要再申请开通),第三方应用暂无;