当前位置: > 财经>正文

Hadoop试题解析

2023-07-17 02:44:48 互联网 未知 财经

Hadoop试题解析

单选

1.

下列哪个属性是mapred-site.xml中的配置?( C  )

        A.dfs.replication

        B.fs.fsdefaultFS

        C.mapreduce.framework.name

        D.yarn.resourcemanager.address

A: 设置副本数    hdfs-site.xml 

B:设置namenode节点对应的主机     core-site.xml

C:指定MapReduce所依赖的运行框架为YARN

D:指定ResourceManager对应的主机     yarn-site.xml

2.

关于Hadoop单击模式和伪分布模式的说法正确的是? ( A  )

        A.后者比前者增加的HDFS的输入输出以及可检查内存的使用情况

        B.两者都不与守护进程交互,避免复杂性

        C.单机模式不使用HDFS,但加载守护进程

        D.两者都启动守护进程,且守护进程运行在一台机器上

3.

关于Haoop体系架构说法不正确的是?    (  D ) 

        A.NameNode管理文件系统的命名空间

        B. HDFS集群有两类节点以管理者和工作者模式运行

        C.HDFS上的文件也被分为块大小的多个块文件作为独立的存储单元

        D.NameNode永久保存记录着每个文件中各个块所在的数据节点和位置信息

D: namenode也记录着每个文件中各个块所在的数据节点信息,但它并不永久保存块的位置信息,因为这些信息会在系统启动时由数据节点重建

4.

以下关于HDFS中Block的说法正确的是?  (  C ) 

        A.一个磁盘有自己的块大小,一般为512个字节,HDFS中的块大小与本地磁盘保持一致

        B. 为了 容错,一般Block的默认备份为1份,并且会尽量考虑到网络到网络

        C.由于分布式文件系统中使用Block来抽象数据存储,由于文件的分块不需要存储同一台机器上,所以HDFS为文件可以大于每个单独的磁盘大小。

        D.数据文件的各个Block主要存储在namenode上

5.

HDFS文件系统中一个gzip文件大小75MB,客户端设置Block的大小为默认,请问此文件占用几个Block? (   )

A. 1B. 3C. 2D. 4 版本不同,默认大小不同。64M、128M都正确。 在Apache Hadoop中默认是64M,Cloudera Hadoop版本中默认是128M

6.

HDFS中的block默认保存几份?( C  )

A. 1份B. 不确定C. 3份D. 2份

7.

下面选项中哪两个进程是分别负责管理HDFS数据存储和备份元数据信息的?( A )

A. NameNode、SecondaryNameNodeB. NameNode、JobtrackerC. Datanode,SecondaryNameNodeD. NameNode、DataNode

SecondaryNameNode:备份文件

8.

关于HDFS的文件写入,正确的是( C  )

A. 用户可以在文件任意位置进行修改B. 复制的文件块默认都存在同一机架上C. 默认将文件块复制成三份存放D. 支持多用户对同一文件的写操作

9.

关于Hadoop FileSystem的说法不正确的是( A )

A、FileSystem中有很多方法,跟File中的方法一致,如exists,delete,mkdir,create等等一些常用的文件操作方法

B、FileStatus中有一系列的方法,可以得到文件的信息。如:getLen()得到文件的长度,以字节的形式

C、globStatus()方法返回于其路径匹配的所有文件的FileStatus队形数据,并按路径排序。

D、FileStatus对象存储文件和目录的元数据

创建目录:mkdir>>mkdirs

10.

下列不是FileSystem类的常见方法的是( D )

A. getDefaultPort()B. getScheme()C. getStatus()D. Path()

方法名没有大写

11.

下列描述中不符合Map/Reduce的是( D   )

A. Map结束后,Partitioner会将相同Key分到同一个组交给Reduce进程B. Map/Reduce是函数式的设计思想C. Map是将数据映射成Key/Value再交给ReduceD. Reduce先运行,然后运行Map

map:分解

reduce:分组

12.

MapReduce编程模型中以下组件哪个是最后执行的? ( B  )

A. PartitionerB. ReducerC. MapperD. RecordReader

13.

有关MapReduce的输入输出,说法错误的是( B  )

A、

版权声明: 本站仅提供信息存储空间服务,旨在传递更多信息,不拥有所有权,不承担相关法律责任,不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请发送邮件至 举报,一经查实,本站将立刻删除。