Python 连接hive(Linux)

Python018

Python 连接hive(Linux),第1张

之所以选择基于Linux系统用Python连接hive,是因为在window下会出现Hadoop认证失败的问题。会出现执行python脚本的机器无目标hive的kerberos认证信息类似错误,也会出现sasl调用问题:

该错误我尝试多次,未能解决(有知道window下解决方案的欢迎留言),所以建议使用Linux系统。

VMware Workstation +Ubuntu

网上教程很多,本文推荐一个教程: https://blog.csdn.net/stpeace/article/details/78598333

主要是以下四个包:

在安装包sasl的过程会出现麻烦,主要是Ubuntu中缺乏sasl.h的问题,这里可以通过下面语句解决

这和centos有一些区别。

本文是基于本机虚拟机用Python连接的公司测试环境的hive(生产环境和测试环境是有隔离的,生产环境需要堡垒机才能连接)

因缺乏工程和计算机基础的知识,对很多的地方都了解的不够深入,欢迎大神指点,最后向以下两位大佬的帖子致谢:

[1] https://www.zhihu.com/question/269333988/answer/581126392

[2] https://mp.weixin.qq.com/s/cdFxkphMtJASQ7-nKt13mg

现在的大多数行业往往都拥有大量服务器,如何安全并高效的管理这些服务器便成为每个系统运维或安全运维人员的必要工作。而比较常见的方案就是搭建堡垒机环境作为线上服务器的入口,所有服务器只能先通过堡垒机进行登陆再访问。

运维人员在维护的过程中,首先要统一登录到这台服务器上,然后从这台服务器再登录到目标设备进行维护。

堡垒机来防止绕过的方式是所有的服务器都只允许堡垒机这台主机的IP进行网络连接。那么我们就必须连接到这台堡垒机上,才能进行下一步连接服务器的操作。想要连接这台堡垒机,堡垒机就需要对外开放端口,对外开放端口了就一定会有风险。

Jumpserver 是全球首款完全开源的堡垒机,使用 GNU GPL v2.0 开源协议,是符合 4A 的运维安全审计系统。

Jumpserver 使用 Python / Django 进行开发,遵循 Web 2.0 规范,配备了业界领先的 Web Terminal 解决方案,交互界面美观、用户体验好。

Jumpserver 采纳分布式架构,支持多机房跨区域部署,支持横向扩展,无资产数量及并发限制。

改变世界,从一点点开始。

标星(star) :10058

拷贝(fork) :3090

贡献人数 :67

仓库大小 :52 MB

最后更新 :2019-08-18

代码提交活跃

主要语言:JavaScript

语言比例:JavaScript:61.72%、Python:15.89%、HTML:12.31%、CSS:9.84%、TSQL:0.14%、Shell:0.09%、Dockerfile:0.02%

Jumpserver 多云环境下更好用的堡垒机

核心功能

https://github.com/jumpserver/jumpserver