亲宝软件园·资讯

展开

腾讯云上搭建hive3.1.2 手把手教你在腾讯云上搭建hive3.1.2的方法

萝莉巴索小布丁 人气:0

环境准备

所有操作开始前,先确定hadoop版本已经装好。具体可以看我的另一篇博客
搭建hadoop3.x

mysql安装

先把安装包放到software文件夹,并解压到mysql-lib中

[root@master software]# ll
总用量 1422372
-rw-r--r-- 1 root root 312850286 7月  2 15:00 apache-hive-3.1.2-bin.tar.gz
-rw-r--r-- 1 root root 338075860 7月  2 09:39 hadoop-3.1.3.tar.gz
-rw-r--r-- 1 root root 195013152 7月  2 09:36 jdk-8u212-linux-x64.tar.gz
-rw-r--r-- 1 root root 609556480 7月  2 15:08 mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar
-rw-r--r-- 1 root root  985600 7月  2 14:44 mysql-connector-java-5.1.37.jar
[root@master software]# mkdir mysql-lib
[root@master software]# tar -xf mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar -C ./mysql-lib/
[root@master software]# cd mysql-lib/
[root@master mysql-lib]# ll
总用量 595272
-rw-r--r-- 1 7155 31415 45109364 9月 30 2019 mysql-community-client-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415  318768 9月 30 2019 mysql-community-common-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415  7037096 9月 30 2019 mysql-community-devel-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 49329100 9月 30 2019 mysql-community-embedded-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 23354908 9月 30 2019 mysql-community-embedded-compat-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 136837816 9月 30 2019 mysql-community-embedded-devel-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415  4374364 9月 30 2019 mysql-community-libs-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415  1353312 9月 30 2019 mysql-community-libs-compat-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 208694824 9月 30 2019 mysql-community-server-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 133129992 9月 30 2019 mysql-community-test-5.7.28-1.el7.x86_64.rpm

先处理一下环境,因为centos自带mariadb,会产生冲突,所以要先卸载

[root@master mysql-lib]# rpm -qa|grep mariadb
mariadb-libs-5.5.56-2.el7.x86_64
[root@master mysql-lib]# sudo rpm -e --nodeps mariadb-libs 
# 查看一下是不是卸载干净了
[root@master mysql-lib]# rpm -qa|grep mariadb
[root@master mysql-lib]# rpm -qa|grep mysql

没什么问题了就可以安装了,一定要按顺序安装

[root@master mysql-lib]# ll
总用量 595284
-rw-r--r-- 1 7155 31415 45109364 9月 30 2019 mysql-community-client-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415  318768 9月 30 2019 mysql-community-common-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415  7037096 9月 30 2019 mysql-community-devel-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 49329100 9月 30 2019 mysql-community-embedded-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 23354908 9月 30 2019 mysql-community-embedded-compat-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 136837816 9月 30 2019 mysql-community-embedded-devel-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415  4374364 9月 30 2019 mysql-community-libs-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415  1353312 9月 30 2019 mysql-community-libs-compat-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 208694824 9月 30 2019 mysql-community-server-5.7.28-1.el7.x86_64.rpm
-rw-r--r-- 1 7155 31415 133129992 9月 30 2019 mysql-community-test-5.7.28-1.el7.x86_64.rpm
[root@master mysql-lib]# sudo rpm -ivh mysql-community-common-5.7.28-1.el7.x86_64.rpm
警告:mysql-community-common-5.7.28-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY
准备中...             ################################# [100%]
正在升级/安装...
  1:mysql-community-common-5.7.28-1.e################################# [100%]
[root@master mysql-lib]# sudo rpm -ivh mysql-community-libs-5.7.28-1.el7.x86_64.rpm
警告:mysql-community-libs-5.7.28-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY
准备中...             ################################# [100%]
正在升级/安装...
  1:mysql-community-libs-5.7.28-1.el7################################# [100%]
[root@master mysql-lib]# sudo rpm -ivh mysql-community-libs-compat-5.7.28-1.el7.x86_64.rpm
警告:mysql-community-libs-compat-5.7.28-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY
准备中...             ################################# [100%]
正在升级/安装...
  1:mysql-community-libs-compat-5.7.2################################# [100%]
[root@master mysql-lib]# sudo rpm -ivh mysql-community-client-5.7.28-1.el7.x86_64.rpm
警告:mysql-community-client-5.7.28-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY
准备中...             ################################# [100%]
正在升级/安装...
  1:mysql-community-client-5.7.28-1.e################################# [100%]

安装到第5个时,如果centos是最小化安装的,那会报这个问题

[root@master mysql-lib]# sudo rpm -ivh mysql-community-server-5.7.28-1.el7.x86_64.rpm
警告:mysql-community-server-5.7.28-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY
错误:依赖检测失败:
    libnuma.so.1()(64bit) 被 mysql-community-server-5.7.28-1.el7.x86_64 需要
    libnuma.so.1(libnuma_1.1)(64bit) 被 mysql-community-server-5.7.28-1.el7.x86_64 需要
    libnuma.so.1(libnuma_1.2)(64bit) 被 mysql-community-server-5.7.28-1.el7.x86_64 需要
[root@master mysql-lib]# yum install -y libaio
[root@master mysql-lib]# yum install -y numactl

然后再尝试安装就没问题了

[root@master mysql-lib]# sudo rpm -ivh mysql-community-server-5.7.28-1.el7.x86_64.rpm
警告:mysql-community-server-5.7.28-1.el7.x86_64.rpm: 头V3 DSA/SHA1 Signature, 密钥 ID 5072e1f5: NOKEY
准备中...             ################################# [100%]
正在升级/安装...
  1:mysql-community-server-5.7.28-1.e################################# [100%]

清理历史残余文件

[root@master mysql-lib]# cat /etc/my.cnf
# For advice on how to change settings please see
# http://dev.mysql.com/doc/refman/5.7/en/server-configuration-defaults.html

[mysqld]
#
# Remove leading # and set to the amount of RAM for the most important data
# cache in MySQL. Start at 70% of total RAM for dedicated server, else 10%.
# innodb_buffer_pool_size = 128M
#
# Remove leading # to turn on a very important data integrity option: logging
# changes to the binary log between backups.
# log_bin
#
# Remove leading # to set options mainly useful for reporting servers.
# The server defaults are faster for transactions and fast SELECTs.
# Adjust sizes as needed, experiment to find the optimal values.
# join_buffer_size = 128M
# sort_buffer_size = 2M
# read_rnd_buffer_size = 2M
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock

# Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0

log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid

看到了mysql目录是/var/lib/mysql

#进入这个地址 看看是否有历史残余文件
[root@master mysql-lib]# cd /var/lib/mysql
# 没东西就没问题,有就都删了
[root@master mysql]# ll
总用量 0

初始化mysql

[root@master mysql]# sudo mysqld --initialize --user=mysql

看下默认密码

[root@master mysql]# cat /var/log/mysqld.log 
2020-07-02T07:29:10.095244Z 0 [Warning] TIMESTAMP with implicit DEFAULT value is deprecated. Please use --explicit_defaults_for_timestamp server option (see documentation for more details).
2020-07-02T07:29:11.331738Z 0 [Warning] InnoDB: New log files created, LSN=45790
2020-07-02T07:29:11.498492Z 0 [Warning] InnoDB: Creating foreign key constraint system tables.
2020-07-02T07:29:11.590436Z 0 [Warning] No existing UUID has been found, so we assume that this is the first time that this server has been started. Generating a new UUID: b94654a6-bc35-11ea-a160-525400f3e388.
2020-07-02T07:29:11.600554Z 0 [Warning] Gtid table is not ready to be used. Table 'mysql.gtid_executed' cannot be opened.
2020-07-02T07:29:13.093996Z 0 [Warning] CA certificate ca.pem is self signed.
2020-07-02T07:29:13.522160Z 1 [Note] A temporary password is generated for root@localhost: p;oK<M)<_8p/

密码是p;oK<M)<_8p/,复制一下,进入mysql

进入mysql

启动mysql服务

[root@master mysql]# systemctl start mysqld
[root@master mysql]# systemctl status mysqld
● mysqld.service - MySQL Server
  Loaded: loaded (/usr/lib/systemd/system/mysqld.service; enabled; vendor preset: disabled)
  Active: active (running) since 四 2020-07-02 15:31:00 CST; 10s ago
   Docs: man:mysqld(8)
      http://dev.mysql.com/doc/refman/en/using-systemd.html
 Process: 5617 ExecStart=/usr/sbin/mysqld --daemonize --pid-file=/var/run/mysqld/mysqld.pid $MYSQLD_OPTS (code=exited, status=0/SUCCESS)
 Process: 5497 ExecStartPre=/usr/bin/mysqld_pre_systemd (code=exited, status=0/SUCCESS)
 Main PID: 5624 (mysqld)
  Tasks: 27
  Memory: 205.4M
  CGroup: /system.slice/mysqld.service
      └─5624 /usr/sbin/mysqld --daemonize --pid-file=/var/run/mysqld/mysqld.p...

7月 02 15:30:55 master systemd[1]: Starting MySQL Server...
7月 02 15:31:00 master systemd[1]: Started MySQL Server.

进入mysql

$ mysql -u root -p

提示输入密码,输入刚刚复制的密码

成功进入mysql后,设置我们的mysql密码,这个自己记住哈~

#设置密码为你的密码
mysql> set password = password("你的密码");

接下来设置root用户的权限,允许任意ip连接,为后面的hive连接做准备

mysql> use mysql;
mysql> select host,user from user;
+-----------+---------------+
| host   | user     |
+-----------+---------------+
| localhost | mysql.session |
| localhost | mysql.sys   |
| localhost | root     |
+-----------+---------------+
3 rows in set (0.00 sec)

mysql> update mysql.user set host='%' where user='root';
Query OK, 1 row affected (0.00 sec)
Rows matched: 1 Changed: 1 Warnings: 0
# 权限高的在最上面(新版本优化的)
mysql> select host,user from user;
+-----------+---------------+
| host   | user     |
+-----------+---------------+
| %     | root     |
| localhost | mysql.session |
| localhost | mysql.sys   |
+-----------+---------------+
3 rows in set (0.00 sec)

--这步一定要做,是刷新配置的,不然密码无法生效
mysql> flush privileges;
Query OK, 0 rows affected (0.00 sec)

mysql> quit

然后再尝试用更改后的密码登录一下,成功了就是配置好了。

安装Hive

到/home/centos/software目录下,解压apache-hive-3.1.2-bin.tar.gz到/home/centos/module/目录下面

[root@master software]# tar -zxvf apache-hive-3.1.2-bin.tar.gz -C /home/centos/module/

进入module文件夹,把文件名改一下

[root@master module]# ll
总用量 12
drwxr-xr-x 9 root  root  4096 7月  2 15:40 apache-hive-3.1.2-bin
drwxr-xr-x 11 centos centos 4096 7月  2 11:51 hadoop-3.1.3
drwxr-xr-x 7   10  143 4096 4月  2 2019 jdk1.8.0_212
[root@master module]# mv apache-hive-3.1.2-bin/ hive
[root@master module]# ll
总用量 12
drwxr-xr-x 11 centos centos 4096 7月  2 11:51 hadoop-3.1.3
drwxr-xr-x 9 root  root  4096 7月  2 15:40 hive
drwxr-xr-x 7   10  143 4096 4月  2 2019 jdk1.8.0_212

配置环境变量

[root@master module]# vim /etc/profile.d/my_env.sh 
#HIVE_HOME
export HIVE_HOME=/home/centos/module/hive
export PATH=$PATH:$HIVE_HOME/bin

加载环境变量,并验证是否成功

[root@master module]# source /etc/profile
[root@master module]# echo $HIVE_HOME
/home/centos/module/hive

解决日志Jar包冲突

hadoop和hive之间的log4j版本冲突,要把hive的lib文件夹中的jar包名字改一下,无法启用即可。就直接在文件名后加.bak即可。

[atguigu@hadoop102 lib]$ mv log4j-slf4j-impl-2.10.0.jar log4j-slf4j-impl-2.10.0.jar.bak

[atguigu@hadoop102 lib]$ ll | grep log4j
-rw-rw-r--. 1 atguigu atguigu  63835 4月 15 00:34 log4j-1.2-api-2.10.0.jar
-rw-rw-r--. 1 atguigu atguigu  255485 4月 15 00:24 log4j-api-2.10.0.jar
-rw-rw-r--. 1 atguigu atguigu 1597622 4月 15 00:24 log4j-core-2.10.0.jar
-rw-rw-r--. 1 atguigu atguigu  24173 4月 15 00:24 log4j-slf4j-impl-2.10.0.jar.bak
-rw-rw-r--. 1 atguigu atguigu  32060 4月 15 00:34 log4j-web-2.10.0.jar

hive元数据配置到mysql

将MySQL的JDBC驱动拷贝到Hive的lib目录下

[root@master lib]# cp /home/centos/software/mysql-connector-java-5.1.37.jar ./

看看是否拷贝成功

[root@master lib]# ll | grep mysql-con
-rw-r--r-- 1 root root  985600 7月  2 15:47 mysql-connector-java-5.1.37.jar

配置metastore到mysql

在$HIVE_HOME/conf目录下新建hive-site.xml文件,

[root@master conf]# vim hive-site.xml

有三个值需要你改一下

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl" rel="external nofollow" ?>
<configuration>
  <!-- jdbc连接的URL -->
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://腾讯云内网ip:3306/metastore?useSSL=false</value>
</property>

  <!-- jdbc连接的Driver-->
  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
</property>

    <!-- jdbc连接的username-->
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
  </property>

  <!-- jdbc连接的password -->
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>你的mysql密码</value>
  </property>
  <!-- Hive默认在HDFS的工作目录 -->
  <property>
    <name>hive.metastore.warehouse.dir</name>
    <value>/user/hive/warehouse</value>
  </property>
  
  <!-- Hive元数据存储版本的验证 -->
  <property>
    <name>hive.metastore.schema.verification</name>
    <value>false</value>
  </property>
  <!-- 指定存储元数据要连接的地址 -->
  <property>
    <name>hive.metastore.uris</name>
    <value>thrift://腾讯云内网ip:9083</value>
  </property>
  <!-- 指定hiveserver2连接的端口号 -->
  <property>
  <name>hive.server2.thrift.port</name>
  <value>10000</value>
  </property>
  <!-- 指定hiveserver2连接的host -->
  <property>
    <name>hive.server2.thrift.bind.host</name>
    <value>你本机的hostname</value>
  </property>
  <!-- 元数据存储授权 -->
  <property>
    <name>hive.metastore.event.db.notification.api.auth</name>
    <value>false</value>
  </property>
  
  <!-- hiveserver2的高可用参数,开启此参数可以提高hiveserver2的启动速度 -->
<property>
  <name>hive.server2.active.passive.ha.enable</name>
  <value>true</value>
</property>

</configuration>

把改好的内容粘进去后,保存退出

启动hive

初始化元数据库

登录mysql,创建hive元数据库

mysql> create database metastore;
Query OK, 1 row affected (0.00 sec)

退出,初始化hive元数据库

# 让hive在metastore中创建初始化的表
[atguigu@hadoop102 software]$ schematool -initSchema -dbType mysql -verbos

再次进入mysql,检查一下,可以看到已经创建好了(有74张表)

mysql> use metastore;
mysql> show tables;

创建一个启动脚本,不然每次写那么长让它后台启动实在太烦了。

[root@master bin]# vim hs.sh 

添加如下内容

#!/bin/bash
HIVE_LOG_DIR=$HIVE_HOME/logs
#判断有没有这个目录,没有就创建
if [ ! -d $HIVE_LOG_DIR ]
then
	mkdir -p $HIVE_LOG_DIR
fi
#检查进程是否运行正常,参数1为进程名,参数2为进程端口
#status
function check_process()
{
	#/dev/null 黑洞 不要的流都放到这里销毁
  pid=$(ps -ef 2>/dev/null | grep -v grep | grep -i $1 | awk '{print $2}')
  ppid=$(netstat -nltp 2>/dev/null | grep $2 | awk '{print $7}' | cut -d '/' -f 1)
  echo $pid
  [[ "$pid" =~ "$ppid" ]] && [ "$ppid" ] && return 0 || return 1
}

#start
function hive_start()
{
  metapid=$(check_process HiveMetastore 9083)
  #看懂这行即可 ,这行是让服务后台启动的
  cmd="nohup hive --service metastore >$HIVE_LOG_DIR/metastore.log 2>&1 &"
  cmd=$cmd" sleep 4; hdfs dfsadmin -safemode wait >/dev/null 2>&1"
  [ -z "$metapid" ] && eval $cmd || echo "Metastroe服务已启动"
  server2pid=$(check_process HiveServer2 10000)
  #看懂这行即可 ,这行是让服务后台启动的
  cmd="nohup hive --service hiveserver2 >$HIVE_LOG_DIR/hiveServer2.log 2>&1 &"
  [ -z "$server2pid" ] && eval $cmd || echo "HiveServer2服务已启动"
}

#stop
function hive_stop()
{
  metapid=$(check_process HiveMetastore 9083)
  [ "$metapid" ] && kill $metapid || echo "Metastore服务未启动"
  server2pid=$(check_process HiveServer2 10000)
  [ "$server2pid" ] && kill $server2pid || echo "HiveServer2服务未启动"
}

case $1 in
"start")
  hive_start
  ;;
"stop")
  hive_stop
  ;;
"restart")
  hive_stop
  sleep 2
  hive_start
  ;;
"status")
  check_process HiveMetastore 9083 >/dev/null && echo "Metastore服务运行正常" || echo "Metastore服务运行异常"
  check_process HiveServer2 10000 >/dev/null && echo "HiveServer2服务运行正常" || echo "HiveServer2服务运行异常"
  ;;
*)
  echo Invalid Args!
  echo 'Usage: '$(basename $0)' start|stop|restart|status'
  ;;
esac

保存退出,给脚本加权限

$ chmod +x hs.sh

现在来启动吧(启动前要确认hadoop是已启动,且运行正常的哦)

[root@master bin]# hs.sh start
[root@master bin]# jps
32177 SecondaryNameNode
514 NodeManager
20788 Jps
31396 NameNode
32652 ResourceManager
20253 RunJar
31757 DataNode
991 JobHistoryServer

可以看到启动成功了,我们用脚本来看下状态

[root@master bin]# hs.sh status
Metastore服务运行异常
HiveServer2服务运行异常

你会惊奇的发现,居然有一个运行异常,这是怎么回事?其实是因为它启动比较慢,不信你过了两分钟再看

[root@master bin]# hs.sh status
Metastore服务运行正常
HiveServer2服务运行正常

hive jdbc访问

beeline

如果你不是用root来搭建的hadoop,那这里根据自己的设置更改

#必须用root访问,因为jdbc的管理员是root,不然没权限 -n后面是要登录的用户
[atguigu@hadoop102 bin]$ beeline -u jdbc:hive2://master:10000 -n root
Connecting to jdbc:hive2://master:10000
Connected to: Apache Hive (version 3.1.2)
Driver: Hive JDBC (version 3.1.2)
Transaction isolation: TRANSACTION_REPEATABLE_READ
Beeline version 3.1.2 by Apache Hive
0: jdbc:hive2://master:10000> 

这样就是成功进入了,退出的话

0: jdbc:hive2://master:10000> !quit
Closing: 0: jdbc:hive2://master:10000

hive命令行

[atguigu@hadoop102 bin]$ hive
#一堆信息
hive>

这样就是成功进入了,退出的话是quit;接下来就可以玩hive啦!

历史记录

他俩的历史记录都在家目录中

$ cd ~
$ ls -a

可以到有一个.hivehistory文件和.beeline文件夹,历史记录会在你quit这个JDBC后写入。

hive运行日志配置

Hive的log默认存放在当前用户名下下,我们把hive本身的运行日志也放到这个logs里,方便以后查看。

(1)修改$HIVE_HOME/conf/hive-log4j.properties.template文件名称为hive-log4j.properties

$ mv hive-log4j2.properties.template hive-log4j.properties
$ vim hive-log4j.properties 

(2)在hive-log4j.properties文件中修改log存放位置

property.hive.log.dir=/home/centos/module/hive/logs

hive启动jvm堆内存设置

新版本的hive启动的时候,默认申请的jvm堆内存大小为256M,jvm堆内存申请的太小,导致后期开启本地模式,执行复杂的sql时经常会报错:java.lang.OutOfMemoryError: Java heap space,因此最好提前调整一下HADOOP_HEAPSIZE这个参数。

[atguigu@hadoop102 conf]$ cp hive-env.sh.template hive-env.sh
[atguigu@hadoop102 conf]$ vim hive-env.sh

将hive-env.sh其中的参数 export HADOOP_HEAPSIZE=1024的注释放开

做完以上所有配置,重启hive。

windows端连接hive

推荐dbeaver,连接前记得来到安全组,开放10000端口

具体配置步骤如下

然后

测试连接,等个1分钟左右基本上就可以成功了
后面就在Windows上好好玩hive吧~

加载全部内容

相关教程
猜你喜欢
用户评论