spark面试题以及答案(spark常见面试题)

spark面试题以及答案(spark常见面试题)Spark Core 面试篇 01 一 简答题 1 Spark master 使用 zookeeper 进行 HA 的 有哪些数据保存在 Zookeeper 答 spark 通过这个参数 spark deploy zookeeper dir 指定 master 数据在 zookeeper 中保存的位置 包括 Worker Driver 和 Application 以及 Executors standby 节点要从 zk 中 获得数据信息 恢复集群运行状态 才能对外继续提供服务 作业提交资源申请等 在恢复前是不能接受请求的 另外



  1. 粗粒度模式(Coarse-grained Mode):每个应用程序的运行环境由一个Dirver和若干个Executor组成,其中,每个Executor占用若干资源,内部可运行多个Task(对应多少个“slot”)。应用程序的各个任务正式运行之前,需要将运行环境中的资源全部申请好,且运行过程中要一直占用这些资源,即使不用,最后程序运行结束后,回收这些资源。
  2. 细粒度模式(Fine-grained Mode):鉴于粗粒度模式会造成大量资源浪费,Spark On Mesos还提供了另外一种调度模式:细粒度模式,这种模式类似于现在的云计算,思想是按需分配。
    8.Spark技术栈有哪些组件,每个组件都有什么功能,适合什么应用场景?
    答:可以画一个这样的技术栈图先,然后分别解释下每个组件的功能和场景




二、选择题

  1. Spark 的四大组件下面哪个不是 (D )
    A.Spark Streaming B. Mlib
    C Graphx D.Spark R




  1. Spark Job 默认的调度模式 (A )
    A FIFO B FAIR
    C 无 D 运行时指定




  1. 关于广播变量,下面哪个是错误的 (D )
    A 任何函数调用 B 是只读的
    C 存储在各个节点 D 存储在磁盘或 HDFS





  2. 关于累加器,下面哪个是错误的 (D )
    A 支持加法 B 支持数值类型
    C 可并行 D 不支持自定义类型





今天的文章 spark面试题以及答案(spark常见面试题)分享到此就结束了,感谢您的阅读。
编程小号
上一篇 2026-03-08 13:06
下一篇 2026-03-08 13:33

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ri-ji/51494.html