首页 > 编程知识 正文

大数据开发面试问题(大数据与云计算试题2019)

时间:2023-05-03 06:00:20 阅读:88332 作者:4780

总结大数据的问题,帮助准备在金三银四找好工作的伙伴们。 只有跨越笔试这个关口,才能在下一个关口大显身手!

2019整理最新的大数据问题和回答

一、如何检查namenode是否正常运行? 重新启动namenode的命令是什么?

在节点信息和浏览器中显示,通过脚本监视

Hadoop -达蒙. sh开始名称

HDFS -达蒙. sh开始名称

二、hdfs存储的结构是怎么样的?

1 )客户端发送文件写入请求,namenode检查文件是否存在,如果存在,则直接返回错误消息。 否则,将其发送到客户端的可用名称节点

2 )客户端屏蔽文件,并行保存在不同节点的datanode中,发送完成后,客户端同时向namenode和datanode发送信息

3 ) namenode收到客户端信息后,向datanode发送确信信息

4 ) datanode收到namenode和datanode两者的确认消息后,提交写入操作。

三、combiner在hadoop中的作用是什么?

如果map生成的数据太大,带宽会成为瓶颈,在不影响最终结果的情况下,如何压缩传输到Reduce的数据? 一个方法是使用Combiner。 Combiner被称为本地Reduce。 Reduce的最终输入是Combiner的输出。

四、你们的数据库是怎么导入hive的? 有问题吗

导入hive时,如果数据库中有blob或text字段,将报告错误。 解决方案在sqoop备忘录中。 我们发现,从Oracle数据库向Hive导入数据时,带有clob字段的表中的数据混乱,部分字段全部发生空空行。

由于项目中的CLOB字段没有实际的分析目的,因此考虑删除CLOB字段。

此外,为了避免CLOB字段出现任何问题,请按如下方式禁用HIVE的CLOB字段:

[ Hadoop @ masters qoop-1.4.5 ] $ CD $ sq OOP _主页/连接

[ Hadoop @主配置] $ vioraoop-site.XML

删除以下属性的注释,并将value更改为true

属性

nameoraoop.import.omit.lobs.and.long/name

值真/值

说明if true,OraOop will omit BLOB,CLOB,nclobandlongcolumnsduringanimport。

/描述

/属性

有些表有clob字段,但不能排除。 因为需要其他字段,所以在导入时指定--columns进行导入

sqoopimport---- hive-import---- hive -数据库测试---创建- hive -表---连接JDBC--用户名用户

--bindir//scratch---outdir/Java-- -表AAA-- -列id,名称'-m1--空字符串'n ' -编号

五、hdfs-site.xml的三个主要属性?

dfs.name.dir决定元数据的存储路径以及DFS的存储方式(磁盘或远程)

dfs.data.dir决定数据存储库的路径

fs.checkpoint.dir用于第二个名称

六、可以在Windows上运行Hadoop吗?

我建议你不要做那种事。 RedHatLinux和Ubuntu才是Hadoop操作系统的最佳选择。 由于Hadoop安装会出现各种问题,因此通常不使用Windows。 因此,Windows绝不是Hadoop的推荐系统。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。