文章详情页

如何在Win10系统使用Python3连接Hive

浏览：108日期：2022-06-28 10:23:29

由于数据存放在大数据平台的Hive数据仓库中，我需要在Win10系统上利用Python3连接Hive，然后读取数据，进行探索、分析和挖掘工作。

我通过网上查找资料和实际测试，把Win10系统Python3成功连接Hive配置总结如下。

第一步：安装依赖库

pip install bitarraypip install bit_arraypip install thriftpip install thriftpypip install pure_saslpip install --no-deps thrift-sasl==0.2.1

提示：若是无法安装，也可以点击如下网址，

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载，然后进行本地化安装。

第二步：安装impyla库

我采用本地化安装方式，先下载impyla库的whl，如下图：

如何在Win10系统使用Python3连接Hive

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示：上面的绝对路径根据你自己的情况而定

第三步：测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过，表示利用impala连接Hive配置成功。

简单示例：

从Hive的一张表读取100条记录，放到pandas的DataFrame里面。

参考代码：

from impala.dbapi import connect #用来连接Hive的函数from impala.util import as_pandas #用来把数据结构转换为pandasconn = connect(host=’my.host.com’, port=21050)cursor = conn.cursor()cursor.execute(’SELECT * FROM mytable LIMIT 100’)df = as_pandas(cursor)cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容，更多关于Python3连接Hive的资料请关注好吧啦网其它相关文章！

上一条：Win7意外删除的文件如何恢复？Win7意外删除的文件恢复方法下一条：Win10电脑0x00000bcb共享打印机无法连接怎么办？

相关文章：

1. OPENBSD上的ADSL和防火墙设置配置2. 如何在电脑PC上启动Windows11和Linux双系统3. Debian11怎么添加桌面快捷图标? Debian桌面快捷方式的添加方法4. Win11找不到回收站怎么办？Win11显示回收站的方法5. Win11系统怎么隐藏文件夹？Windows11如何隐藏某个文件夹？6. 统信uos操作系统怎么激活? 统信UOS系统家庭版激活教程7. win11内置摄像头怎么调清晰度? win11摄像头模糊不清晰的解决办法8. Win10如何去除驱动数字签名？Win10去除驱动数字签名的方法9. 统信uos系统怎么进行打印测试页和删除打印机?10. Windows Modules Installer Worker是什么进程?硬盘占用100%的原因分析

排行榜

					
					Windows Vista系统自带防火墙高级设置
win11卡在登录界面
Win7系统中如何禁用windows media cente功能
win10系统打开录音文件夹的方法
Win10系统中使用anaconda的conda activate激活环境时报错应该怎么解决？
win10系统解决开始菜单没反应的方法
Win10系统开启账户“登录选项”功能的方法
Win10 ie浏览器在哪里？
win7如何禁用家庭组？win7禁用家庭组的方法
Win7系统如何修改切换窗口数量？
Win10 20H2文件夹隐藏了怎么显示？
				

热门标签