trinodb · findepi · Mar 11, 2022 · Mar 9, 2022 · Mar 9, 2022 · Mar 9, 2022
diff --git a/core/trino-main/src/main/java/io/trino/sql/DynamicFilters.java b/core/trino-main/src/main/java/io/trino/sql/DynamicFilters.java
@@ -362,7 +362,7 @@ public static final class Function
     {
         private Function() {}
 
-        private static final String NAME = "$internal$dynamic_filter_function";
+        public static final String NAME = "$internal$dynamic_filter_function";
 
         @TypeParameter("T")
         @SqlType(BOOLEAN)

diff --git a/core/trino-main/src/main/java/io/trino/sql/planner/ConnectorExpressionTranslator.java b/core/trino-main/src/main/java/io/trino/sql/planner/ConnectorExpressionTranslator.java
@@ -33,6 +33,7 @@
 import io.trino.spi.type.Type;
 import io.trino.spi.type.TypeSignature;
 import io.trino.spi.type.VarcharType;
+import io.trino.sql.DynamicFilters;
 import io.trino.sql.PlannerContext;
 import io.trino.sql.analyzer.TypeSignatureProvider;
 import io.trino.sql.tree.AstVisitor;
@@ -58,6 +59,7 @@
 import java.util.Map;
 import java.util.Optional;
 
+import static com.google.common.base.Preconditions.checkArgument;
 import static com.google.common.base.Verify.verify;
 import static com.google.common.collect.ImmutableList.toImmutableList;
 import static io.airlift.slice.SliceUtf8.countCodePoints;
@@ -239,6 +241,7 @@ protected Optional<ConnectorExpression> visitFunctionCall(FunctionCall node, Voi
             }
 
             String functionName = ResolvedFunction.extractFunctionName(node.getName());
+            checkArgument(!DynamicFilters.Function.NAME.equals(functionName), "Dynamic filter has no meaning for a connector, it should not be translated into ConnectorExpression");
 
             if (LiteralFunction.LITERAL_FUNCTION_NAME.equalsIgnoreCase(functionName)) {
                 Object value = evaluateConstant(node);

diff --git a/...no-main/src/main/java/io/trino/sql/planner/iterative/rule/PushPredicateIntoTableScan.java b/...no-main/src/main/java/io/trino/sql/planner/iterative/rule/PushPredicateIntoTableScan.java
@@ -49,6 +49,8 @@
 import io.trino.sql.tree.Expression;
 import io.trino.sql.tree.NodeRef;
 
+import java.util.ArrayList;
+import java.util.List;
 import java.util.Map;
 import java.util.Objects;
 import java.util.Optional;
@@ -60,9 +62,10 @@
 import static io.trino.SystemSessionProperties.isAllowPushdownIntoConnectors;
 import static io.trino.matching.Capture.newCapture;
 import static io.trino.spi.expression.Constant.TRUE;
+import static io.trino.sql.DynamicFilters.isDynamicFilter;
 import static io.trino.sql.ExpressionUtils.combineConjuncts;
-import static io.trino.sql.ExpressionUtils.filterDeterministicConjuncts;
-import static io.trino.sql.ExpressionUtils.filterNonDeterministicConjuncts;
+import static io.trino.sql.ExpressionUtils.extractConjuncts;
+import static io.trino.sql.planner.DeterminismEvaluator.isDeterministic;
 import static io.trino.sql.planner.iterative.rule.Rules.deriveTableStatisticsForPushdown;
 import static io.trino.sql.planner.plan.Patterns.filter;
 import static io.trino.sql.planner.plan.Patterns.source;
@@ -162,16 +165,12 @@ public static Optional<PlanNode> pushFilterIntoTableScan(
             return Optional.empty();
         }
 
-        Expression predicate = filterNode.getPredicate();
-
-        // don't include non-deterministic predicates
-        Expression deterministicPredicate = filterDeterministicConjuncts(plannerContext.getMetadata(), predicate);
-        Expression nonDeterministicPredicate = filterNonDeterministicConjuncts(plannerContext.getMetadata(), predicate);
+        SplitExpression splitExpression = splitExpression(plannerContext, filterNode.getPredicate());
 
         DomainTranslator.ExtractionResult decomposedPredicate = DomainTranslator.getExtractionResult(
                 plannerContext,
                 session,
-                deterministicPredicate,
+                splitExpression.getDeterministicPredicate(),
                 symbolAllocator.getTypes());
 
         TupleDomain<ColumnHandle> newDomain = decomposedPredicate.getTupleDomain()
@@ -201,7 +200,7 @@ public static Optional<PlanNode> pushFilterIntoTableScan(
                     node.getAssignments(),
                     combineConjuncts(
                             plannerContext.getMetadata(),
-                            deterministicPredicate,
+                            splitExpression.getDeterministicPredicate(),
                             // Simplify the tuple domain to avoid creating an expression with too many nodes,
                             // which would be expensive to evaluate in the call to isCandidate below.
                             domainTranslator.toPredicate(session, newDomain.simplify().transformKeys(assignments::get))));
@@ -214,14 +213,18 @@ public static Optional<PlanNode> pushFilterIntoTableScan(
         }
 
         // check if new domain is wider than domain already provided by table scan
-        if (constraint.predicate().isEmpty() && newDomain.contains(node.getEnforcedConstraint())) {
+        if (constraint.predicate().isEmpty() &&
+                // TODO do we need to track enforced ConnectorExpression in TableScanNode?
+                TRUE.equals(connectorExpression.orElse(TRUE)) &&
+                newDomain.contains(node.getEnforcedConstraint())) {
             Expression resultingPredicate = createResultingPredicate(
                     plannerContext,
                     session,
                     symbolAllocator,
                     typeAnalyzer,
+                    splitExpression.getDynamicFilter(),
                     TRUE_LITERAL,
-                    nonDeterministicPredicate,
+                    splitExpression.getNonDeterministicPredicate(),
                     decomposedPredicate.getRemainingExpression());
 
             if (!TRUE_LITERAL.equals(resultingPredicate)) {
@@ -290,8 +293,9 @@ public static Optional<PlanNode> pushFilterIntoTableScan(
                 session,
                 symbolAllocator,
                 typeAnalyzer,
+                splitExpression.getDynamicFilter(),
                 domainTranslator.toPredicate(session, remainingFilter.transformKeys(assignments::get)),
-                nonDeterministicPredicate,
+                splitExpression.getNonDeterministicPredicate(),
                 remainingDecomposedPredicate);
 
         if (!TRUE_LITERAL.equals(resultingPredicate)) {
@@ -319,24 +323,56 @@ private static void verifyTablePartitioning(
         verify(newTablePartitioning.equals(oldTablePartitioning), "Partitioning must not change after predicate is pushed down");
     }
 
+    private static SplitExpression splitExpression(PlannerContext plannerContext, Expression predicate)
+    {
+        Metadata metadata = plannerContext.getMetadata();
+
+        List<Expression> dynamicFilters = new ArrayList<>();
+        List<Expression> deterministicPredicates = new ArrayList<>();
+        List<Expression> nonDeterministicPredicate = new ArrayList<>();
+
+        for (Expression conjunct : extractConjuncts(predicate)) {
+            if (isDynamicFilter(conjunct)) {
+                // dynamic filters have no meaning for connectors, so don't pass them
+                dynamicFilters.add(conjunct);
+            }
+            else {
+                if (isDeterministic(conjunct, metadata)) {
+                    deterministicPredicates.add(conjunct);
+                }
+                else {
+                    // don't include non-deterministic predicates
+                    nonDeterministicPredicate.add(conjunct);
+                }
+            }
+        }
+
+        return new SplitExpression(
+                combineConjuncts(metadata, dynamicFilters),
+                combineConjuncts(metadata, deterministicPredicates),
+                combineConjuncts(metadata, nonDeterministicPredicate));
+    }
+
     static Expression createResultingPredicate(
             PlannerContext plannerContext,
             Session session,
             SymbolAllocator symbolAllocator,
             TypeAnalyzer typeAnalyzer,
+            Expression dynamicFilter,
             Expression unenforcedConstraints,
             Expression nonDeterministicPredicate,
             Expression remainingDecomposedPredicate)
     {
         // The order of the arguments to combineConjuncts matters:
-        // * Unenforced constraints go first because they can only be simple column references,
+        // * Dynamic filters go first because they cannot fail,
+        // * Unenforced constraints go next because they can only be simple column references,
         //   which are not prone to logic errors such as out-of-bound access, div-by-zero, etc.
         // * Conjuncts in non-deterministic expressions and non-TupleDomain-expressible expressions should
         //   retain their original (maybe intermixed) order from the input predicate. However, this is not implemented yet.
         // * Short of implementing the previous bullet point, the current order of non-deterministic expressions
         //   and non-TupleDomain-expressible expressions should be retained. Changing the order can lead
         //   to failures of previously successful queries.
-        Expression expression = combineConjuncts(plannerContext.getMetadata(), unenforcedConstraints, nonDeterministicPredicate, remainingDecomposedPredicate);
+        Expression expression = combineConjuncts(plannerContext.getMetadata(), dynamicFilter, unenforcedConstraints, nonDeterministicPredicate, remainingDecomposedPredicate);
 
         // Make sure we produce an expression whose terms are consistent with the canonical form used in other optimizations
         // Otherwise, we'll end up ping-ponging among rules
@@ -377,4 +413,33 @@ public static TupleDomain<ColumnHandle> computeEnforced(TupleDomain<ColumnHandle
                 "Enforced tuple domain cannot be determined. Connector returned an unenforced TupleDomain that contains columns not in predicate.");
         return TupleDomain.withColumnDomains(enforcedDomains);
     }
+
+    private static class SplitExpression
+    {
+        private final Expression dynamicFilter;
+        private final Expression deterministicPredicate;
+        private final Expression nonDeterministicPredicate;
+
+        public SplitExpression(Expression dynamicFilter, Expression deterministicPredicate, Expression nonDeterministicPredicate)
+        {
+            this.dynamicFilter = requireNonNull(dynamicFilter, "dynamicFilter is null");
+            this.deterministicPredicate = requireNonNull(deterministicPredicate, "deterministicPredicate is null");
+            this.nonDeterministicPredicate = requireNonNull(nonDeterministicPredicate, "nonDeterministicPredicate is null");
+        }
+
+        public Expression getDynamicFilter()
+        {
+            return dynamicFilter;
+        }
+
+        public Expression getDeterministicPredicate()
+        {
+            return deterministicPredicate;
+        }
+
+        public Expression getNonDeterministicPredicate()
+        {
+            return nonDeterministicPredicate;
+        }
+    }
 }
diff --git a/...main/java/io/trino/sql/planner/iterative/rule/RemoveRedundantPredicateAboveTableScan.java b/...main/java/io/trino/sql/planner/iterative/rule/RemoveRedundantPredicateAboveTableScan.java
@@ -141,6 +141,7 @@ public Result apply(FilterNode filterNode, Captures captures, Context context)
                 session,
                 context.getSymbolAllocator(),
                 typeAnalyzer,
+                TRUE_LITERAL, // Dynamic filters are included in decomposedPredicate.getRemainingExpression()
                 new DomainTranslator(plannerContext).toPredicate(session, unenforcedDomain.transformKeys(assignments::get)),
                 nonDeterministicPredicate,
                 decomposedPredicate.getRemainingExpression());

diff --git a/plugin/trino-base-jdbc/src/test/java/io/trino/plugin/jdbc/BaseJdbcConnectorTest.java b/plugin/trino-base-jdbc/src/test/java/io/trino/plugin/jdbc/BaseJdbcConnectorTest.java
@@ -222,10 +222,8 @@ public void testAggregationPushdown()
         assertConditionallyPushedDown(
                 getSession(),
                 "SELECT regionkey, sum(nationkey) FROM nation WHERE name LIKE '%N%' GROUP BY regionkey",
-                false, // TODO: hasBehavior(SUPPORTS_PREDICATE_EXPRESSION_PUSHDOWN_WITH_LIKE), --  currently, applyAggregation is not invoked after applyFilter with expression
-                hasBehavior(SUPPORTS_PREDICATE_EXPRESSION_PUSHDOWN_WITH_LIKE)
-                        ? node(AggregationNode.class, node(TableScanNode.class))
-                        : node(FilterNode.class, node(TableScanNode.class)));
+                hasBehavior(SUPPORTS_PREDICATE_EXPRESSION_PUSHDOWN_WITH_LIKE),
+                node(FilterNode.class, node(TableScanNode.class)));
         // aggregation on varchar column
         assertThat(query("SELECT count(name) FROM nation")).isFullyPushedDown();
         // aggregation on varchar column with GROUPING

diff --git a/plugin/trino-cassandra/src/main/java/io/trino/plugin/cassandra/CassandraMetadata.java b/plugin/trino-cassandra/src/main/java/io/trino/plugin/cassandra/CassandraMetadata.java
@@ -202,6 +202,10 @@ public ColumnMetadata getColumnMetadata(ConnectorSession session, ConnectorTable
     public Optional<ConstraintApplicationResult<ConnectorTableHandle>> applyFilter(ConnectorSession session, ConnectorTableHandle tableHandle, Constraint constraint)
     {
         CassandraTableHandle handle = (CassandraTableHandle) tableHandle;
+        if (handle.getPartitions().isPresent() || !handle.getClusteringKeyPredicates().isEmpty()) {
+            // TODO support repeated applyFilter
+            return Optional.empty();
+        }
 
         CassandraPartitionResult partitionResult = partitionManager.getPartitions(handle, constraint.getSummary());
 
@@ -232,6 +236,7 @@ public Optional<ConstraintApplicationResult<ConnectorTableHandle>> applyFilter(C
                         handle.getSchemaName(),
                         handle.getTableName(),
                         Optional.of(partitionResult.getPartitions()),
+                        // TODO this should probably be AND-ed with handle.getClusteringKeyPredicates()
                         clusteringKeyPredicates),
                         unenforcedConstraint,
                         false));

diff --git a/...in/trino-cassandra/src/main/java/io/trino/plugin/cassandra/CassandraPartitionManager.java b/...in/trino-cassandra/src/main/java/io/trino/plugin/cassandra/CassandraPartitionManager.java
@@ -33,6 +33,7 @@
 import java.util.Set;
 import java.util.stream.Stream;
 
+import static com.google.common.base.Preconditions.checkArgument;
 import static com.google.common.base.Predicates.in;
 import static com.google.common.base.Predicates.not;
 import static com.google.common.collect.ImmutableSet.toImmutableSet;
@@ -53,6 +54,9 @@ public CassandraPartitionManager(CassandraSession cassandraSession)
 
     public CassandraPartitionResult getPartitions(CassandraTableHandle cassandraTableHandle, TupleDomain<ColumnHandle> tupleDomain)
     {
+        // TODO support repeated applyFilter
+        checkArgument(cassandraTableHandle.getPartitions().isEmpty(), "getPartitions() currently does not take into account table handle's partitions");
+
         CassandraTable table = cassandraSession.getTable(cassandraTableHandle.getSchemaTableName());
 
         // fetch the partitions

diff --git a/plugin/trino-cassandra/src/main/java/io/trino/plugin/cassandra/CassandraTableHandle.java b/plugin/trino-cassandra/src/main/java/io/trino/plugin/cassandra/CassandraTableHandle.java
@@ -22,8 +22,11 @@
 import java.util.List;
 import java.util.Objects;
 import java.util.Optional;
+import java.util.stream.Stream;
 
+import static java.lang.String.format;
 import static java.util.Objects.requireNonNull;
+import static java.util.stream.Collectors.joining;
 
 public class CassandraTableHandle
         implements ConnectorTableHandle
@@ -105,6 +108,21 @@ public boolean equals(Object obj)
     @Override
     public String toString()
     {
-        return schemaName + ":" + tableName;
+        String string = format("%s:%s", schemaName, tableName);
 String sql = "SELECT " + getProjection(client, columns, columnExpressions); 
 sql += getFrom(client, baseRelation, accumulator::add); 
 List<String> clauses = toConjuncts(client, session, connection, tupleDomain, accumulator::add); 
 if (additionalPredicate.isPresent()) { 
     clauses = ImmutableList.<String>builder() 
             .addAll(clauses) 
             .add(additionalPredicate.get()) 
             .build(); 
 } 
 if (!clauses.isEmpty()) { 
     sql += " WHERE " + Joiner.on(" AND ").join(clauses); 
 } 
 sql += getGroupBy(client, groupingSets); 
 String sql = "SELECT " + getProjection(client, columns, columnExpressions); 
 sql += getFrom(client, baseRelation, accumulator::add); 
  
 List<String> clauses = toConjuncts(client, session, connection, tupleDomain, accumulator::add); 
 if (additionalPredicate.isPresent()) { 
     clauses = ImmutableList.<String>builder() 
             .addAll(clauses) 
             .add(additionalPredicate.get()) 
             .build(); 
 } 
 if (!clauses.isEmpty()) { 
     sql += " WHERE " + Joiner.on(" AND ").join(clauses); 
 } 
  
 sql += getGroupBy(client, groupingSets); 
+        if (this.partitions.isPresent()) {
+            List<CassandraPartition> partitions = this.partitions.get();
+            string += format(
+                    " %d partitions %s",
+                    partitions.size(),
+                    Stream.concat(
+                                    partitions.subList(0, Math.min(partitions.size(), 3)).stream(),
+                                    partitions.size() > 3 ? Stream.of("...") : Stream.of())
+                            .map(Object::toString)
+                            .collect(joining(", ", "[", "]")));
+        }
+        if (!clusteringKeyPredicates.isEmpty()) {
+            string += format(" constraint(%s)", clusteringKeyPredicates);
+        }
+        return string;
     }
 }
diff --git a/plugin/trino-cassandra/src/main/java/io/trino/plugin/cassandra/CassandraType.java b/plugin/trino-cassandra/src/main/java/io/trino/plugin/cassandra/CassandraType.java
@@ -78,6 +78,7 @@
 import static java.lang.Float.floatToRawIntBits;
 import static java.lang.Float.intBitsToFloat;
 import static java.lang.Math.toIntExact;
+import static java.lang.String.format;
 import static java.util.Objects.requireNonNull;
 
 public class CassandraType
@@ -682,4 +683,15 @@ public int hashCode()
     {
         return Objects.hash(kind, trinoType, argumentTypes);
     }
+
+    @Override
+    public String toString()
+    {
+        String string = format("%s(%s", kind, trinoType);
+        if (!argumentTypes.isEmpty()) {
+            string += "; " + argumentTypes;
+        }
+        string += ")";
+        return string;
+    }
 }
diff --git a/testing/trino-server-dev/etc/catalog/cassandra.properties b/testing/trino-server-dev/etc/catalog/cassandra.properties
@@ -0,0 +1,4 @@
+connector.name=cassandra
+# Can be used with `bin/ptl env up --environment singlenode-cassandra --without-trino`
+cassandra.contact-points=localhost
+cassandra.allow-drop-table=true
diff --git a/testing/trino-server-dev/etc/config.properties b/testing/trino-server-dev/etc/config.properties
@@ -32,6 +32,7 @@ plugin.bundles=\
   ../../plugin/trino-password-authenticators/pom.xml, \
   ../../plugin/trino-iceberg/pom.xml,\
   ../../plugin/trino-blackhole/pom.xml,\
+  ../../plugin/trino-cassandra/pom.xml,\
   ../../plugin/trino-memory/pom.xml,\
   ../../plugin/trino-jmx/pom.xml,\
   ../../plugin/trino-raptor-legacy/pom.xml,\