Spark_日期参数解析参数-spark.sql.legacy.timeParserPolicy

本文介绍: 在Spark 3.0之前的版本中，日期和时间解析使用 java.text.SimpleDa t eFo r mat，它在解析某些日期和时间格式时可能较为宽松。例如，它可能允许日期字符串中的月份部分超过12，或日期部分超过31，并尝试自动调整。如果你的代码中有日期和时间解析，并且你升级到了Spark 3.0或更高版本，那么你可能需要关注这个配置选项，以确保代码的兼容性和期望行为。如果你的日期和时间字符串格式严格并始终遵循ISO标准，或者你希望采用更严格的解析策略，那么你应该使用默认的。在Ap ac he Spark中，

在Spark 3.0之前的版本中，日期和时间解析使用 java.text.SimpleDa teFo r mat，它在解析某些日期和时间格式时可能较为宽松。例如，它可能允许日期字符串中的月份部分超过12，或日期部分超过31，并尝试自动调整。这种宽松的解析方式在某些情况下可能会导致意外的结果。

从Spark 3.0开始，默认的解析策略变得更加严格，使用 java.time.format.Da teTi meForm a tter来解析日期和时间格式。这种新的解析器严格遵守ISO标准，并且不会进行前面提到的自动调整。

例如，如果你想在Spark 3.0或更高版本中保持与以前版本相同的宽松解析行为，可以设置

spark.conf.set("spark.sql.legacy.timeParserPolicy", "LEGACY")

./bin/spark-submit --conf "spark.sql.legacy.timeParserPolicy=LEGACY" ...

如果你的代码中有日期和时间解析，并且你升级到了Spark 3.0或更高版本，那么你可能需要关注这个配置选项，以确保代码的兼容性和期望行为。如果你的日期和时间字符串格式严格并始终遵循ISO标准，或者你希望采用更严格的解析策略，那么你应该使用默认的CORRECTED策略。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。