Apache Spark题库_Apache Spark试题_Apache Spark在线答题_Apache Spark搜题在线使用

【单项选择题】 下列哪项工具用于交互式调试Spark代码()

【单项选择题】 Spark主要是由以下哪种编程语言构建的()

【单项选择题】 下列哪项工具用于提交Spark任务()

【单项选择题】 以下哪项不属于Spark架构的组成部分()

【单项选择题】 下列参数中哪个参数用于开启动态资源分配()

【单项选择题】 以下哪个参数用于指定driver依赖第三方jar的路径()

【单项选择题】 以下哪个选项是spark.serializer的默认值()

【单项选择题】 Yarn模式下spark.executor.cores的默认值是()

【单项选择题】 Spark UI的默认端口是()

【单项选择题】 Spark UI的端口被占用后的默认重试次数是()

【单项选择题】 RDD的算子分为哪两类()

【单项选择题】 以下RDD算子不属于Transformation类的是()

【单项选择题】 以下不属于RDD原生算子的是()

【单项选择题】 以下属于RDD原生算子的是()

【单项选择题】 以下属于Spark编程模型的是()

【单项选择题】 以下用于分组的RDD算子是()

【单项选择题】 以下用于排序的RDD算子是()

【单项选择题】 以下用于关联的RDD算子是()

【单项选择题】 以下用于重分区的RDD算子是()

【单项选择题】 Spark SQL编程的上下文类()

【单项选择题】 Spark SQL中的DecimalType对应底层哪个类型()

【单项选择题】 语句“SELECT slice(array(1,2,3,4),2,2);”的结果...

【单项选择题】 语句“SELECT slice(array(1,2,3,4),-2,2);”的结...

【单项选择题】 语句“SELECT date_format(’2016-04-08’,’y’);...

【单项选择题】 Spark2.0版本之后,DataFrame类与Dataset类的关系是()

【单项选择题】 Dataset创建临时表的方法()

【单项选择题】 spark是已创建的SparkSession实例,读取json文件的正确代码是()

【单项选择题】 df是已创建的DataFrame实例,写入parquet文件的正确代码是()

【单项选择题】 以下不属于spark.sql.parquet.compression.codec可选值的是()

【单项选择题】 spark.sql.autoBroadcastJoinThreshold参数的默认值是()

【单项选择题】 下列哪项可作为spark.sql.orc.impl参数的值()

【单项选择题】 以下哪项不属于Spark SQL的关联类型()

【单项选择题】 Spark用于描述RDD依赖关系的模型是()

【单项选择题】 下列Spark算子中不会产生shuffle的算子是()

【单项选择题】 sc是已创建的SparkContext实例,data是已创建的数组,使用data创建RD...

【单项选择题】 RDD的默认Storage Level是()

【单项选择题】 以下哪项不属于Spark组件()

【单项选择题】 下列哪个参数用于指定Spark on Yarn的任务队列()

【单项选择题】 下列哪项用于查看Spark on Yarn任务日志()

【单项选择题】 下列哪项参数用于设置executor数目()

【单项选择题】 下列哪项不属于Flink基本概念()

【单项选择题】 Flink架构采用的容错策略是()

【单项选择题】 下列选项不包含在Flink架构中的是()

【单项选择题】 下列选项中可以判断作业是否积压的指标是()

【单项选择题】 下列选项中不能作为Flink集群部署方式的是()

【单项选择题】 下列选项中可以作为Flink集群HA解决方案的是()

【单项选择题】 下列有关Flink架构思想正确的是()

【单项选择题】 下列选项中不属于Flink内置State Backend的是()

【单项选择题】 下列选项中属于Flink支持的时间模型的是()

【单项选择题】 Flink处理事件时间乱序使用的模型是()

【单项选择题】 下列选项中属于Flink一致性定义的是()

【单项选择题】 下列选项中不属于Flink SQL内置Catalog的是()

【单项选择题】 下列选项中不属于Flink流类型的是()

【单项选择题】 以下Flink SQL语句用于设置时区的是()

【单项选择题】 Flink 1.13版本之前,Flink SQL尚未支持下列哪个Window()

【单项选择题】 下列选项中不属于Flink组件的是()

【单项选择题】 下列选项中用于配置Flink JobManager总内存大小的是()

【单项选择题】 下列选项中用于配置Flink TaskManager总内存大小的是()

【单项选择题】 下列选项中关于Flink Native K8s部署和Standalone K8s的说法正...

【单项选择题】 Presto独特的优势是()

【单项选择题】 下列选项中不属于Presto query状态的是()

【单项选择题】 下列选项中用于设置Presto task并行度的参数是()

【单项选择题】 Presto可以从哪个Connector获取集群运行信息()

【单项选择题】 Presto一般使用下列哪个Connector评估集群计算性()

【单项选择题】 下列选项中用于查询Presto SQL语句执行计划的关键字是()

【单项选择题】 Presto的架构是()

【单项选择题】 Presto架构中负责解析SQL语句的组件是()

【单项选择题】 Presto主要有下列哪种语言开发()

【单项选择题】 什么是Alluxio()

【单项选择题】 下列选项中哪项不是Alluxio的组件()

【单项选择题】 Alluxio的写入策略不包括()

【单项选择题】 Alluxio的写入类型可靠性最低的是()

【单项选择题】 Alluxio罗列目录的命令是()

【单项选择题】 Alluxio挂载UFS的命令是()

【单项选择题】 Alluxio持久化的命令是()

【单项选择题】 Alluxio SDS支持挂载下列哪些系统()

【单项选择题】 Alluxio汇报集群健康情况的命令是()

【单项选择题】 “alluxio-start.sh master”命令的作用是()

【单项选择题】 下列选项中用于配置Alluxio写入类型的是()

【单项选择题】 下列选项中用于配置Alluxio读取类型的是()

【单项选择题】 下列选项中用于执行Alluxio distributed任务的组件是()

【单项选择题】 下列选项中不能作为Alluxio底层存储的系统是()

【单项选择题】 Alluxio主要是使用哪种语言开发的()

【单项选择题】 验证Alluxio集群正在运行的命令是()

【单项选择题】 当缓存数据和底层数据不一致时,Alluxio删除命令指定那个参数可以强...

【单项选择题】 Alluxio Master向其他Alluxio节点复制目录使用的命令是()

【单项选择题】 Alluxio检查一致性的命令是()

【多项选择题】 Spark官方API中常用于统计分析的语言是()

【多项选择题】 可以使用如下哪种包管理工具构建Spark工程()

【多项选择题】 下列关于RDD的说法正确的是()

【多项选择题】 Spark SQL适合以下哪种场景()

【多项选择题】 以下哪项属于Spark SQL的优化方式()

【多项选择题】 下列选项中属于Alluxio特性的是()

【判断题】 Spark on Yarn支持动态资源分配。

【判断题】 Spark on Yarn的应用并行度受内存使用量影响。

【判断题】 Spark on K8s可以使用多种部署模式(deploy-mode)。

【判断题】 当RDD内的元素需要建立JDBC连接时,可以使用map操作。

【判断题】 当RDD内的元素需要建立JDBC连接时,可以使用mapPartition操作。

【判断题】 RDD是可变数据集。

【判断题】 RDD是分布式的。

微信扫一扫,使用拍照搜题小程序

微信扫一扫,免费拍照搜题