Hive之set参数大全-21_代码007(未授权)

本文介绍: 在 Hive 中，是一个配置参数，用于指定是否启用用户定义表函数（UDTF）的自动进度报告。该参数用于控制是否在执行用户定义表函数（UDTF）时自动报告进度。自动进度报告允许用户在执行长时间运行的 UDTF 时获得进度信息。默认情况下，的值通常是未设置，由 Hive 使用其默认的进度报告策略。你可以通过 Hive 的配置文件或者在 Hive 命令行中使用SET命令来配置这个参数。该参数通常是一个布尔值，表示是否启用 UDTF 的自动进度报告。true表示启用，false表示禁用。

在 Hive 中，hive.tez.smb.number.waves 是一个配置参数，用于指定 Tez 执行引擎中的Sort-Merge-Bucket（SMB）连接操作的并行度。以下是有关该参数的一些解释：

示例：

-- 设置 Tez 执行引擎中 SMB 连接操作的并行度为 2
SET hive.tez.smb.number.waves=2;
-- 默认值为0.5,这个参数的默认值表示 Hive 将根据一定的启发式规则自动确定 Sort-Merge-Bucket（SMB）连接操作的并行度

请注意，具体的配置和效果可能会根据 Hive 的版本以及其他环境因素而有所不同。在进行更改之前，建议查阅相应版本的官方文档以获取最准确的信息。

在 Hive 中，hive.tez.task.scale.memory.reserve-fraction.min 是一个配置参数，用于指定 Tez 任务在动态调整内存分配时，保留的最小内存比例。以下是有关该参数的一些解释：

示例：

-- 设置 Tez 任务在动态调整内存分配时，保留的最小内存比例为 0.1
SET hive.tez.task.scale.memory.reserve-fraction.min=0.1;

在 Hive 中，hive.tez.task.scale.memory.reserve.fraction 是一个配置参数，用于指定 Tez 任务在动态调整内存分配时，保留的内存比例。以下是有关该参数的一些解释：

-- 设置 Tez 任务在动态调整内存分配时，保留的内存比例为 0.2
SET hive.tez.task.scale.memory.reserve.fraction=0.2;

在 Hive 中，hive.tez.task.scale.memory.reserve.fraction.max 是一个配置参数，用于指定 Tez 任务在动态调整内存分配时，允许保留的最大内存比例。以下是有关该参数的一些解释：

-- 设置 Tez 任务在动态调整内存分配时，允许保留的最大内存比例为 0.3
SET hive.tez.task.scale.memory.reserve.fraction.max=0.3;

在 Hive 中，hive.timedout.txn.reaper.interval 是一个配置参数，用于指定事务回收器（transaction reaper）定期运行的时间间隔。以下是有关该参数的一些解释：

-- 设置事务回收器定期运行的时间间隔为 300 秒
SET hive.timedout.txn.reaper.interval=300s;

在 Hive 中，hive.timedout.txn.reaper.start 是一个配置参数，用于指定事务回收器（transaction reaper）的启动时间。以下是有关该参数的一些解释：

-- 设置事务回收器启动的时间为 30 秒
SET hive.timedout.txn.reaper.start=30s;

在 Hive 中，hive.transactional.concatenate.noblock 是一个配置参数，用于指定在执行事务合并（transactional concatenate）操作时是否使用非阻塞模式。以下是有关该参数的一些解释：

-- 设置在执行事务合并操作时使用非阻塞模式
SET hive.transactional.concatenate.noblock=true;

在 Hive 中，hive.transactional.events.mem 是一个配置参数，用于指定在执行事务事件处理期间，用于存储事件的内存大小。以下是有关该参数的一些解释：

-- 设置用于存储事务事件的内存大小为 512 兆字节
SET hive.transactional.events.mem=512m;

在 Hive 中，hive.transactional.table.scan 是一个配置参数，用于指定是否启用事务性表的扫描功能。以下是有关该参数的一些解释：

-- 启用事务性表的扫描功能
SET hive.transactional.table.scan=true;

在 Hive 中，hive.transform.escape.input 是一个配置参数，用于指定是否启用 Hive 转换时对输入数据进行转义。以下是有关该参数的一些解释：

-- 启用 Hive 转换时对输入数据的转义
SET hive.transform.escape.input=true;

在 Hive 中，hive.transpose.aggr.join 是一个配置参数，用于指定是否启用转置表操作中的聚合连接（aggregation join）。以下是有关该参数的一些解释：

-- 启用转置表操作中的聚合连接
SET hive.transpose.aggr.join=true;

在 Hive 中，hive.trigger.validation.interval 是一个配置参数，用于指定触发器验证的时间间隔。以下是有关该参数的一些解释：

-- 设置触发器验证的时间间隔为 60000 毫秒（即 60 秒）
SET hive.trigger.validation.interval=60000;

在 Hive 中，hive.txn.heartbeat.threadpool.size 是一个配置参数，用于指定事务心跳线程池的大小。以下是有关该参数的一些解释：

-- 设置事务心跳线程池的大小为 10
SET hive.txn.heartbeat.threadpool.size=10;

在 Hive 中，hive.txn.manager 是一个配置参数，用于指定事务管理器的实现。事务管理器负责管理和控制 Hive 中的事务。以下是有关该参数的一些解释：

-- 设置 Hive 使用的事务管理器为 DbTxnManager
SET hive.txn.manager=org.apache.hadoop.hive.ql.lockmgr.DbTxnManager;
-- org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager

在 Hive 中，hive.txn.manager.dump.lock.state.on.acquire.timeout 是一个配置参数，用于指定当事务在获取锁时超时时是否记录锁状态信息。以下是有关该参数的一些解释：

-- 当事务在获取锁时发生超时时记录锁状态信息
SET hive.txn.manager.dump.lock.state.on.acquire.timeout=true;

在 Hive 中，hive.txn.max.open.batch 是一个配置参数，用于指定事务处理过程中最大的批量操作数。以下是有关该参数的一些解释：

-- 设置事务处理中一次提交的最大批量操作数为 1000
SET hive.txn.max.open.batch=1000;

在 Hive 中，hive.txn.operational.properties 是一个配置参数，用于指定用于操作性事务（Operational Transactions）的其他配置属性。以下是有关该参数的一些解释：

-- 设置操作性事务的其他配置属性
SET hive.txn.operational.properties=spark.executor.memory=2g,spark.executor.cores=2;

在 Hive 中，hive.txn.strict.locking.mode 是一个配置参数，用于指定 Hive 是否采用严格的锁定模式。以下是有关该参数的一些解释：

-- 启用严格的锁定模式
SET hive.txn.strict.locking.mode=true;

在 Hive 中，hive.txn.timeout 是一个配置参数，用于指定事务的超时时间。以下是有关该参数的一些解释：

-- 设置事务的超时时间为 600 秒
SET hive.txn.timeout=600;

在 Hive 中，hive.txn.xlock.iow 是一个配置参数，用于指定在进行独占锁（exclusive lock）时是否使用增强的 XLock（Transaction Lock）机制。以下是有关该参数的一些解释：

-- 启用增强的 XLock 机制
SET hive.txn.xlock.iow=true;

在 Hive 中，hive.typecheck.on.insert 是一个配置参数，用于指定是否在插入数据时进行类型检查。以下是有关该参数的一些解释：

-- 启用在插入数据时进行类型检查
SET hive.typecheck.on.insert=true;

在 Hive 中，hive.udtf.auto.progress 是一个配置参数，用于指定是否启用用户定义表函数（UDTF）的自动进度报告。以下是有关该参数的一些解释：

-- 启用 UDTF 的自动进度报告
SET hive.udtf.auto.progress=true;

在 Hive 中，hive.unlock.numretries 是一个配置参数，用于指定在释放锁时的重试次数。以下是有关该参数的一些解释：

-- 设置释放锁时的重试次数为 5 次
SET hive.unlock.numretries=5;

在 Hive 中，hive.use.orc.codec.pool 是一个配置参数，用于指定是否启用 ORC 文件格式的编解码器池。以下是有关该参数的一些解释：

-- 启用 ORC 文件格式的编解码器池
SET hive.use.orc.codec.pool=true;

在 Hive 中，hive.user.install.directory 是一个配置参数，用于指定用户安装 Hive 时的目录。以下是有关该参数的一些解释：

示例：用户在安装 Hive 时手动选择安装目录 /usr/local/hive。

tar -xzf apache-hive-x.y.z-bin.tar.gz
mv apache-hive-x.y.z /usr/local/hive

在 Hive 中，hive.variable.substitute 是一个配置参数，用于指定是否在 SQL 查询中替换变量。以下是有关该参数的一些解释：

-- 启用变量替换
SET hive.variable.substitute=true;

在 Hive 中，hive.variable.substitute.depth 是一个配置参数，用于指定在进行变量替换时的深度限制。以下是有关该参数的一些解释：

-- 设置变量替换的深度限制为 10
SET hive.variable.substitute.depth=10;

在 Hive 中，hive.vectorized.adaptor.suppress.evaluate.exceptions 是一个配置参数，用于指定是否在矢量化执行期间抑制评估异常。以下是有关该参数的一些解释：

sqlCopy code-- 启用抑制矢量化执行期间的评估异常
SET hive.vectorized.adaptor.suppress.evaluate.exceptions=true;

在 Hive 中，hive.vectorized.adaptor.usage.mode 是一个配置参数，用于指定矢量化执行适配器的使用模式。以下是有关该参数的一些解释：

-- 设置矢量化执行适配器的使用模式为自适应模式
SET hive.vectorized.adaptor.usage.mode=adaptive;

在 Hive 中，hive.vectorized.adaptor.usage.mode 配置参数的 all 模式是一种特殊的设置，表示强制启用矢量化执行适配器。以下是有关该设置的一些解释：

sqlCopy code-- 强制启用矢量化执行适配器
SET hive.vectorized.adaptor.usage.mode=all;

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

指定 Tez 执行引擎中的Sort-Merge-Bucket（SMB）连接操作的并行度

指定 Tez 任务在动态调整内存分配时，保留的最小内存比例

指定 Tez 任务在动态调整内存分配时，保留的内存比例

指定 Tez 任务在动态调整内存分配时，允许保留的最大内存比例

指定事务回收器（transaction reaper）定期运行的时间间隔

指定事务回收器（transaction reaper）的启动时间

指定在执行事务合并（transactional concatenate）操作时是否使用非阻塞模式

指定在执行事务事件处理期间，用于存储事件的内存大小

是否启用事务性表的扫描功能

是否启用 Hive 转换时对输入数据进行转义

是否启用转置表操作中的聚合连接（aggregation join）

指定触发器验证的时间间隔

指定事务心跳线程池的大小

指定事务管理器的实现

指定当事务在获取锁时超时时是否记录锁状态信息

指定事务处理过程中最大的批量操作数

指定用于操作性事务（Operational Transactions）的其他配置属性

指定 Hive 是否采用严格的锁定模式

指定事务的超时时间

指定在进行独占锁（exclusive lock）时是否使用增强的 XLock（Transaction Lock）机制

是否在插入数据时进行类型检查

U

指定是否启用用户定义表函数（UDTF）的自动进度报告

指定在释放锁时的重试次数

是否启用 ORC 文件格式的编解码器池

指定用户安装 Hive 时的目录

V

是否在 SQL 查询中替换变量

指定在进行变量替换时的深度限制

指定是否在矢量化执行期间抑制评估异常

指定矢量化执行适配器的使用模式

发表回复取消回复