Spark部署模式与作业提交一、作业提交1.1 spark-submitSpark 所有模式均使用 spark-submit 命令提交作业,其格式如下: ./bin/spark-submit \ --class <main-class> \ # 应用程序主入口类 -- ...
SparkSQL常用聚合函数
聚合函数Aggregations一、简单聚合1.1 数据准备{"EMPNO": 7369,"ENAME": "SMITH","JOB": "CLERK","MGR": 7902,"HIREDATE": "1980-12-17 00:00:00","SAL": 800.00,"COMM": ...
DataFrame和Dataset简介
DataFrame和Dataset简介一、Spark SQL简介Spark SQL 是 Spark 中的一个子模块,主要用于操作结构化数据。它具有以下特点: 能够将 SQL 查询与 Spark 程序无缝混合,允许您使用 SQL 或 DataFrame API 对结构化数据进行查询; 支持多种开发语 ...
HBase Java API 的基本使用
HBase Java API 的基本使用一、简述截至到目前 ,HBase 有两个主要的版本,分别是 1.x 和 2.x ,两个版本的 Java API 有所不同,1.x 中某些方法在 2.x 中被标识为 @deprecated 过时。 同时你使用的客户端的版本必须与服务端版本保持一致,如果用 2.x ...
Hbase 常用 Shell 命令
Hbase 常用 Shell 命令一、基本命令打开 Hbase Shell: # hbase shell 1.1 获取帮助# 获取帮助help# 获取命令的详细信息help 'status' 1.2 查看服务器状态status 1.3 查看版本信息version 二、关于表的操作2.1 查看 ...