cleaner code

apache · Jul 26, 2022 · fb4b473 · fb4b473
1 parent 979eda6
commit fb4b473
Show file tree

Hide file tree

Showing 11 changed files with 32 additions and 28 deletions.
diff --git a/hudi-client/hudi-spark-client/src/main/scala/org/apache/hudi/HoodieSparkUtils.scala b/hudi-client/hudi-spark-client/src/main/scala/org/apache/hudi/HoodieSparkUtils.scala
@@ -59,7 +59,6 @@ private[hudi] trait SparkVersionsSupport {
   def gteqSpark3_2: Boolean = getSparkVersion >= "3.2"
   def gteqSpark3_2_1: Boolean = getSparkVersion >= "3.2.1"
   def gteqSpark3_3: Boolean = getSparkVersion >= "3.3"
-  def gteqSpark3_3_0: Boolean = getSparkVersion >= "3.3.0"
 }
 
 object HoodieSparkUtils extends SparkAdapterSupport with SparkVersionsSupport {

diff --git a/hudi-client/hudi-spark-client/src/main/scala/org/apache/hudi/SparkAdapterSupport.scala b/hudi-client/hudi-spark-client/src/main/scala/org/apache/hudi/SparkAdapterSupport.scala
@@ -27,7 +27,7 @@ import org.apache.spark.sql.hudi.SparkAdapter
 trait SparkAdapterSupport {
 
   lazy val sparkAdapter: SparkAdapter = {
-    val adapterClass =  if (HoodieSparkUtils.gteqSpark3_3_0) {
+    val adapterClass =  if (HoodieSparkUtils.isSpark3_3) {
       "org.apache.spark.sql.adapter.Spark3_3Adapter"
     } else if (HoodieSparkUtils.isSpark3_2) {
       "org.apache.spark.sql.adapter.Spark3_2Adapter"

diff --git a/hudi-client/hudi-spark-client/src/main/scala/org/apache/spark/sql/hudi/SparkAdapter.scala b/hudi-client/hudi-spark-client/src/main/scala/org/apache/spark/sql/hudi/SparkAdapter.scala
@@ -28,9 +28,7 @@ import org.apache.spark.sql.catalyst.InternalRow
 import org.apache.spark.sql.catalyst.encoders.ExpressionEncoder
 import org.apache.spark.sql.catalyst.expressions.{AttributeReference, Expression, InterpretedPredicate}
 import org.apache.spark.sql.catalyst.parser.ParserInterface
-import org.apache.spark.sql.catalyst.plans.JoinType
-import org.apache.spark.sql.catalyst.plans.logical.{Command, Join, LogicalPlan, SubqueryAlias}
-import org.apache.spark.sql.catalyst.{AliasIdentifier, TableIdentifier}
+import org.apache.spark.sql.catalyst.plans.logical.{Command, LogicalPlan, SubqueryAlias}
 import org.apache.spark.sql.execution.datasources.parquet.ParquetFileFormat
 import org.apache.spark.sql.execution.datasources.{FilePartition, FileScanRDD, LogicalRelation, PartitionedFile, SparkParsePartitionUtil}
 import org.apache.spark.sql.internal.SQLConf
@@ -157,7 +155,7 @@ trait SparkAdapter extends Serializable {
    * Resolve [[DeleteFromTable]]
    * SPARK-38626 condition is no longer Option in Spark 3.3
    */
-  def resolveDeleteFromTable(dft: Command,
+  def resolveDeleteFromTable(deleteFromTable: Command,
                              resolveExpression: Expression => Expression): LogicalPlan
 
   /**

diff --git a/hudi-spark-datasource/README.md b/hudi-spark-datasource/README.md
@@ -55,7 +55,7 @@ has no class since hudi only supports spark 2.4.4 version, and it acts as the pl
 ### To improve:
 Spark3.3 support time travel syntax link [SPARK-37219](https://issues.apache.org/jira/browse/SPARK-37219). 
 Once Spark 3.3 released. The files in the following list will be removed:
-* hudi-spark3.3.x's `HoodieSpark3_3ExtendedSqlAstBuilder.scala`、`HoodieSpark3_3ExtendedSqlParser.scala`、`TimeTravelRelation.scala`、`SqlBase.g4`、`HoodieSqlBase.g4`
+* hudi-spark3.3.x's `HoodieSpark3_3ExtendedSqlAstBuilder.scala`, `HoodieSpark3_3ExtendedSqlParser.scala`, `TimeTravelRelation.scala`, `SqlBase.g4`, `HoodieSqlBase.g4`
 Tracking Jira: [HUDI-4468](https://issues.apache.org/jira/browse/HUDI-4468)
 
 Some other improvement undergoing:

diff --git a/...asource/hudi-spark/src/main/scala/org/apache/spark/sql/hudi/analysis/HoodieAnalysis.scala b/...asource/hudi-spark/src/main/scala/org/apache/spark/sql/hudi/analysis/HoodieAnalysis.scala
@@ -46,15 +46,15 @@ object HoodieAnalysis {
 
   def customOptimizerRules: Seq[RuleBuilder] = {
     if (HoodieSparkUtils.gteqSpark3_1) {
-      var nestedSchemaPruningClass = "ClassName"
-      if (HoodieSparkUtils.gteqSpark3_3) {
-        nestedSchemaPruningClass = "org.apache.spark.sql.execution.datasources.Spark33NestedSchemaPruning"
-      } else if (HoodieSparkUtils.gteqSpark3_2) {
-        nestedSchemaPruningClass = "org.apache.spark.sql.execution.datasources.Spark32NestedSchemaPruning"
-      } else {
-        // spark 3.1
-        nestedSchemaPruningClass = "org.apache.spark.sql.execution.datasources.Spark31NestedSchemaPruning"
-      }
+      val nestedSchemaPruningClass =
+        if (HoodieSparkUtils.gteqSpark3_3) {
+          "org.apache.spark.sql.execution.datasources.Spark33NestedSchemaPruning"
+        } else if (HoodieSparkUtils.gteqSpark3_2) {
+          "org.apache.spark.sql.execution.datasources.Spark32NestedSchemaPruning"
+        } else {
+          // spark 3.1
+          "org.apache.spark.sql.execution.datasources.Spark31NestedSchemaPruning"
+        }
 
       val nestedSchemaPruningRule = ReflectionUtils.loadClass(nestedSchemaPruningClass).asInstanceOf[Rule[LogicalPlan]]
       Seq(_ => nestedSchemaPruningRule)
@@ -84,7 +84,7 @@ object HoodieAnalysis {
         session => ReflectionUtils.loadClass(spark3ResolveReferencesClass, session).asInstanceOf[Rule[LogicalPlan]]
 
       val resolveAlterTableCommandsClass =
-        if (HoodieSparkUtils.gteqSpark3_3_0)
+        if (HoodieSparkUtils.gteqSpark3_3)
           "org.apache.spark.sql.hudi.Spark33ResolveHudiAlterTableCommand"
         else "org.apache.spark.sql.hudi.Spark32ResolveHudiAlterTableCommand"
       val resolveAlterTableCommands: RuleBuilder =

diff --git a/...rce/hudi-spark/src/test/scala/org/apache/spark/sql/hudi/TestAlterTableDropPartition.scala b/...rce/hudi-spark/src/test/scala/org/apache/spark/sql/hudi/TestAlterTableDropPartition.scala
@@ -18,6 +18,7 @@
 package org.apache.spark.sql.hudi
 
 import org.apache.hudi.DataSourceWriteOptions._
+import org.apache.hudi.HoodieSparkUtils
 import org.apache.hudi.common.util.PartitionPathEncodeUtils
 import org.apache.hudi.config.HoodieWriteConfig
 import org.apache.hudi.keygen.{ComplexKeyGenerator, SimpleKeyGenerator}
@@ -210,8 +211,14 @@ class TestAlterTableDropPartition extends HoodieSparkSqlTestBase {
     spark.sql(s"""insert into $tableName values (1, "z3", "v1", "2021-10-01"), (2, "l4", "v1", "2021-10-02")""")
 
     // specify duplicate partition columns
-    checkExceptionContain(s"alter table $tableName drop partition (dt='2021-10-01', dt='2021-10-02')")(
-      "Found duplicate keys ")
+    if (HoodieSparkUtils.gteqSpark3_3) {
+      checkExceptionContain(s"alter table $tableName drop partition (dt='2021-10-01', dt='2021-10-02')")(
+        "Found duplicate keys `dt`")
+    } else {
+      checkExceptionContain(s"alter table $tableName drop partition (dt='2021-10-01', dt='2021-10-02')")(
+        "Found duplicate keys 'dt'")
+    }
+
 
     // drop 2021-10-01 partition
     spark.sql(s"alter table $tableName drop partition (dt='2021-10-01')")

diff --git a/...hudi-spark/src/test/scala/org/apache/spark/sql/hudi/procedure/TestCallCommandParser.scala b/...hudi-spark/src/test/scala/org/apache/spark/sql/hudi/procedure/TestCallCommandParser.scala
@@ -82,7 +82,7 @@ class TestCallCommandParser extends HoodieSparkSqlTestBase {
   }
 
   test("Test Call Parse Error") {
-    if (HoodieSparkUtils.gteqSpark3_3_0) {
+    if (HoodieSparkUtils.gteqSpark3_3) {
       checkParseExceptionContain("CALL cat.system radish kebab")("Syntax error at or near 'CALL'")
     } else {
       checkParseExceptionContain("CALL cat.system radish kebab")("mismatched input 'CALL' expecting")

diff --git a/...rk-datasource/hudi-spark2/src/main/scala/org/apache/spark/sql/adapter/Spark2Adapter.scala b/...rk-datasource/hudi-spark2/src/main/scala/org/apache/spark/sql/adapter/Spark2Adapter.scala
@@ -131,9 +131,9 @@ class Spark2Adapter extends SparkAdapter {
     new Spark2HoodieFileScanRDD(sparkSession, readFunction, filePartitions)
   }
 
-  override def resolveDeleteFromTable(dft: Command,
+  override def resolveDeleteFromTable(deleteFromTable: Command,
                                       resolveExpression: Expression => Expression): DeleteFromTable = {
-    val deleteFromTableCommand = dft.asInstanceOf[DeleteFromTable]
+    val deleteFromTableCommand = deleteFromTable.asInstanceOf[DeleteFromTable]
     val resolvedCondition = deleteFromTableCommand.condition.map(resolveExpression)
     DeleteFromTable(deleteFromTableCommand.table, resolvedCondition)
   }

diff --git a/...asource/hudi-spark3.1.x/src/main/scala/org/apache/spark/sql/adapter/Spark3_1Adapter.scala b/...asource/hudi-spark3.1.x/src/main/scala/org/apache/spark/sql/adapter/Spark3_1Adapter.scala
@@ -66,9 +66,9 @@ class Spark3_1Adapter extends BaseSpark3Adapter {
     new Spark31HoodieFileScanRDD(sparkSession, readFunction, filePartitions)
   }
 
-  override def resolveDeleteFromTable(dft: Command,
+  override def resolveDeleteFromTable(deleteFromTable: Command,
                                       resolveExpression: Expression => Expression): DeleteFromTable = {
-    val deleteFromTableCommand = dft.asInstanceOf[DeleteFromTable]
+    val deleteFromTableCommand = deleteFromTable.asInstanceOf[DeleteFromTable]
     val resolvedCondition = deleteFromTableCommand.condition.map(resolveExpression)
     DeleteFromTable(deleteFromTableCommand.table, resolvedCondition)
   }

diff --git a/...asource/hudi-spark3.2.x/src/main/scala/org/apache/spark/sql/adapter/Spark3_2Adapter.scala b/...asource/hudi-spark3.2.x/src/main/scala/org/apache/spark/sql/adapter/Spark3_2Adapter.scala
@@ -63,9 +63,9 @@ class Spark3_2Adapter extends BaseSpark3Adapter {
     new Spark32HoodieFileScanRDD(sparkSession, readFunction, filePartitions)
   }
 
-  override def resolveDeleteFromTable(dft: Command,
+  override def resolveDeleteFromTable(deleteFromTable: Command,
                                       resolveExpression: Expression => Expression): DeleteFromTable = {
-    val deleteFromTableCommand = dft.asInstanceOf[DeleteFromTable]
+    val deleteFromTableCommand = deleteFromTable.asInstanceOf[DeleteFromTable]
     val resolvedCondition = deleteFromTableCommand.condition.map(resolveExpression)
     DeleteFromTable(deleteFromTableCommand.table, resolvedCondition)
   }

diff --git a/...asource/hudi-spark3.3.x/src/main/scala/org/apache/spark/sql/adapter/Spark3_3Adapter.scala b/...asource/hudi-spark3.3.x/src/main/scala/org/apache/spark/sql/adapter/Spark3_3Adapter.scala
@@ -64,9 +64,9 @@ class Spark3_3Adapter extends BaseSpark3Adapter {
   }
 
 
-  override def resolveDeleteFromTable(dft: Command,
+  override def resolveDeleteFromTable(deleteFromTable: Command,
                                       resolveExpression: Expression => Expression): DeleteFromTable = {
-    val deleteFromTableCommand = dft.asInstanceOf[DeleteFromTable]
+    val deleteFromTableCommand = deleteFromTable.asInstanceOf[DeleteFromTable]
     DeleteFromTable(deleteFromTableCommand.table, resolveExpression(deleteFromTableCommand.condition))
   }