From 83688f37e7ece12292f892b1b9f0d6d7ab7706d5 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 13 Feb 2022 23:07:25 -0800
Subject: [PATCH 001/130] Store index of pivot row

---
 packages/adelus/src/Adelus_factor.hpp    | 5 +++++
 packages/adelus/src/Adelus_xlu_solve.hpp | 2 +-
 2 files changed, 6 insertions(+), 1 deletion(-)

diff --git a/packages/adelus/src/Adelus_factor.hpp b/packages/adelus/src/Adelus_factor.hpp
index 51907824510b..19902e69d5e5 100644
--- a/packages/adelus/src/Adelus_factor.hpp
+++ b/packages/adelus/src/Adelus_factor.hpp
@@ -140,6 +140,7 @@ void factor(ZDView& ZV,                    // matrix and rhs
   int cur_col_i, cur_col_j, cur_row_i, cur_row_j, act_col_i, act_row_j, update_i, update_j;
   int sav_col_i, sav_col_j, sav_piv_row_i, sav_piv_row_j, act_piv_row_i, piv_row_i;
   int cur_col1_row_i, piv_col1_row_i;
+  int sav_pivot_vec_i;
 
   int ringdist,rdist;
   long type,bytes;
@@ -217,6 +218,8 @@ void factor(ZDView& ZV,                    // matrix and rhs
   sav_piv_row_i=0; sav_piv_row_j=0; // location for next row being saved for gemm update
   update_i=0; update_j=0;           // location of remaining local matrix
 
+  sav_pivot_vec_i = 0;              // location to store name of pivot row
+
 #ifdef GET_TIMING
   xpivmsgtime=bcastpivstime=bcastpivrtime=bcastcolstime=bcastcolrtime=bcastrowtime=sendrowtime=recvrowtime=0.0;
   copycoltime=copyrowtime=copyrow1time=copypivrowtime=copypivrow1time=pivotswaptime=0.0;
@@ -344,6 +347,7 @@ void factor(ZDView& ZV,                    // matrix and rhs
       xpivmsgtime += (MPI_Wtime()-t1);
 #endif
 
+      pivot_vec_view(sav_pivot_vec_i) = pivot.row;
       gpivot_row = pivot.row;
       pivot_mag = abs(pivot.entry);
       if (pivot_mag == 0.0) {
@@ -450,6 +454,7 @@ void factor(ZDView& ZV,                    // matrix and rhs
       act_row_j++;
       sav_piv_row_j++;
       cols_used++;
+      sav_pivot_vec_i++;
     }
     else {
 
diff --git a/packages/adelus/src/Adelus_xlu_solve.hpp b/packages/adelus/src/Adelus_xlu_solve.hpp
index d88ad034f91e..32151d3a77af 100644
--- a/packages/adelus/src/Adelus_xlu_solve.hpp
+++ b/packages/adelus/src/Adelus_xlu_solve.hpp
@@ -132,7 +132,7 @@ void lusolve_(ZDView& ZV, int *matrix_size, int *num_procsr, int *num_rhs, doubl
   // Allocate arrays for factor/solve
   typedef Kokkos::View<value_type*,  Kokkos::LayoutLeft, memory_space> ViewType1D;
   typedef Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space> ViewType2D;
-  typedef Kokkos::View<int*, Kokkos::LayoutLeft, memory_space> ViewIntType1D;
+  typedef Kokkos::View<int*, Kokkos::LayoutLeft, Kokkos::HostSpace> ViewIntType1D;
 
   totmem += (blksz) * (my_rows) * sizeof(ADELUS_DATA_TYPE);             //col1_view
   totmem += blksz * (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);//row1_view

From a81924aab09ab4f5108060adaf01e2cca71a35e0 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 13 Feb 2022 23:45:12 -0800
Subject: [PATCH 002/130] Add factor code

---
 packages/adelus/src/Adelus_x_factor.hpp | 176 ++++++++++++++++++++++++
 1 file changed, 176 insertions(+)
 create mode 100644 packages/adelus/src/Adelus_x_factor.hpp

diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
new file mode 100644
index 000000000000..8f6eff9a54ae
--- /dev/null
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -0,0 +1,176 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#ifndef __ADELUS_XLU_HPP__
+#define __ADELUS_XLU_HPP__
+
+#include <stdio.h>
+#include <stdlib.h>
+#include <math.h>
+#include "Adelus_defines.h"
+#include "mpi.h"
+#include "Adelus_vars.hpp"
+#include "Adelus_macros.h"
+#include "Adelus_block.h"
+#include "Adelus_factor.hpp"
+#include "Adelus_pcomm.hpp"
+#include "Adelus_mytime.hpp"
+#include "Kokkos_Core.hpp"
+
+#ifdef ADELUS_HAVE_TIME_MONITOR
+#include "Teuchos_TimeMonitor.hpp"
+#endif
+
+namespace Adelus {
+
+template<class ZDView, class IDView>
+inline
+void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView pivot, double *secs)
+{
+#ifdef ADELUS_HAVE_TIME_MONITOR
+  using Teuchos::TimeMonitor;
+#endif
+
+  using value_type      = typename ZDView::value_type;
+#ifdef PRINT_STATUS
+  using execution_space = typename ZDView::device_type::execution_space;
+#endif
+  using memory_space    = typename ZDView::device_type::memory_space;
+
+  double run_secs;              // time (in secs) during which the prog ran
+  double tsecs;                 // intermediate storage of timing info
+  int totmem;
+
+  // Determine who I am (me ) and the total number of nodes (nprocs_cube)
+  MPI_Comm_size(MPI_COMM_WORLD,&nprocs_cube);
+  MPI_Comm_rank(MPI_COMM_WORLD, &me);
+
+  nrows_matrix = *matrix_size;
+  ncols_matrix = *matrix_size;
+  nprocs_row   = *num_procsr;
+
+  totmem=0;                      // Initialize the total memory used
+  nprocs_col = nprocs_cube/nprocs_row;
+  max_procs = (nprocs_row < nprocs_col) ? nprocs_col : nprocs_row;
+
+  // Set up communicators for rows and columns
+  myrow = mesh_row(me);
+  mycol = mesh_col(me);
+
+  MPI_Comm_split(MPI_COMM_WORLD,myrow,mycol,&row_comm);
+
+  MPI_Comm_split(MPI_COMM_WORLD,mycol,myrow,&col_comm);
+
+  // Distribution for the matrix on me
+  my_first_col = mesh_col(me);
+  my_first_row = mesh_row(me);
+
+  my_rows = nrows_matrix / nprocs_col;
+  if (my_first_row < nrows_matrix % nprocs_col)i
+    ++my_rows;
+  my_cols = ncols_matrix / nprocs_row;
+  if (my_first_col < ncols_matrix % nprocs_row)
+    ++my_cols;
+
+  // blksz parameter must be set
+  blksz = DEFBLKSZ;
+
+#ifdef PRINT_STATUS
+  printf("Rank %i -- factor_() Begin LU with blksz %d, value_type %s, execution_space %s, memory_space %s\n", me, blksz, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+#endif
+
+  // Allocate arrays for factor/solve
+  typedef Kokkos::View<value_type*,  Kokkos::LayoutLeft, memory_space> ViewType1D;
+  typedef Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space> ViewType2D;
+
+  totmem += (blksz) * (my_rows) * sizeof(ADELUS_DATA_TYPE);             //col1_view
+  totmem += blksz * (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);//row1_view
+  totmem += (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);        //row2_view
+  totmem += (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);        //row3_view
+  
+  ViewType2D    col1_view      ( "col1_view",      my_rows, blksz );
+  ViewType2D    row1_view      ( "row1_view",      blksz, my_cols + blksz + nrhs );
+  ViewType1D    row2_view      ( "row2_view",      my_cols + blksz + nrhs );
+  ViewType1D    row3_view      ( "row3_view",      my_cols + blksz + nrhs );
+
+  {
+  // Factor the system
+
+  tsecs = get_seconds(0.0);
+
+  initcomm();
+
+#ifdef PRINT_STATUS
+  printf("OpenMP or Cuda: Rank %i -- factor() starts ...\n", me);
+#endif
+#ifdef ADELUS_HAVE_TIME_MONITOR
+  {
+    TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: factor"));
+#endif
+    factor(ZV,
+           col1_view,
+           row1_view,
+           row2_view, 
+           row3_view, 
+           pivot);
+#ifdef ADELUS_HAVE_TIME_MONITOR
+  }
+#endif
+
+  tsecs = get_seconds(tsecs);
+
+  run_secs = (double) tsecs;
+
+  // Solve time secs
+
+  *secs = run_secs;
+  showtime("Total time in Factor",&run_secs);
+  }
+}
+
+}//namespace Adelus
+
+#endif

From 632c5dcde77673fc59a73db19cdc3f70272b4cda Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 14 Feb 2022 00:22:50 -0800
Subject: [PATCH 003/130] Add Adelus factor interface

---
 packages/adelus/src/Adelus.hpp | 40 ++++++++++++++++++++++++++++++++++
 1 file changed, 40 insertions(+)

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index e9bcb31c2039..dbba73795bc1 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -49,6 +49,7 @@
 #include <Kokkos_View.hpp>
 #include <Adelus_defines.h>
 #include <Adelus_xlu_solve.hpp>
+#include <Adelus_x_factor.hpp>
 #include <Adelus_distribute.hpp>
 #include <mpi.h>
 
@@ -134,6 +135,45 @@ namespace Adelus {
 
   }
 
+  /// Adelus Factor
+  /// Factors the dense matrix for later solve
+
+  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
+  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
+  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
+  /// \param matrix_size (In) -- order of the dense matrix
+  /// \param num_procsr (In)  -- number of processors for a row
+  /// \param pivot (In)       -- Kokkos View that has the pivot vector
+  /// \param secs (Out)       -- factor and solve time in seconds
+
+  template<class ZDView, class IDView>
+  inline
+  void Factor( ZDView AA,
+               int my_rows_,
+               int my_cols_,
+               int* matrix_size,
+               int* num_procsr,
+               IDView pivot,
+               double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+
+#ifdef PRINT_STATUS
+    printf("Factor (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr);
+#endif
+
+    lu_(AA,
+        matrix_size,
+        num_procsr,
+        pivot,
+        secs);
+
+    // Permute the lower triangular matrix
+    // dpermute_(AA, pivot);
+
+  }
+
 #ifdef ZCPLX
   /// Adelus FactorSolve_devPtr
   /// Matrix and rhs are packed and passed as device pointer

From 948aa603346e0bd3ba7342754b9477b7c204368d Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 20 Feb 2022 14:53:07 -0800
Subject: [PATCH 004/130] Some other changes

---
 packages/adelus/src/Adelus.hpp          |  10 +-
 packages/adelus/src/Adelus_perm_mat.hpp | 167 ++++++++++++++++++++++++
 packages/adelus/src/Adelus_x_factor.hpp |  37 ++++--
 packages/adelus/src/CMakeLists.txt      |   2 +
 4 files changed, 200 insertions(+), 16 deletions(-)
 create mode 100644 packages/adelus/src/Adelus_perm_mat.hpp

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index dbba73795bc1..cf9454a6485e 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -49,6 +49,7 @@
 #include <Kokkos_View.hpp>
 #include <Adelus_defines.h>
 #include <Adelus_xlu_solve.hpp>
+#include <Adelus_perm_mat.hpp>
 #include <Adelus_x_factor.hpp>
 #include <Adelus_distribute.hpp>
 #include <mpi.h>
@@ -143,7 +144,7 @@ namespace Adelus {
   /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
   /// \param matrix_size (In) -- order of the dense matrix
   /// \param num_procsr (In)  -- number of processors for a row
-  /// \param pivot (In)       -- Kokkos View that has the pivot vector
+  /// \param permute (In)     -- Kokkos View that has the global pivot vector
   /// \param secs (Out)       -- factor and solve time in seconds
 
   template<class ZDView, class IDView>
@@ -153,7 +154,7 @@ namespace Adelus {
                int my_cols_,
                int* matrix_size,
                int* num_procsr,
-               IDView pivot,
+               IDView permute,
                double* secs ) {
     int rank;
 
@@ -166,12 +167,9 @@ namespace Adelus {
     lu_(AA,
         matrix_size,
         num_procsr,
-        pivot,
+        permute,
         secs);
 
-    // Permute the lower triangular matrix
-    // dpermute_(AA, pivot);
-
   }
 
 #ifdef ZCPLX
diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
new file mode 100644
index 000000000000..449f6fe7f20d
--- /dev/null
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -0,0 +1,167 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#ifndef __ADELUS_PERMMAT_HPP__
+#define __ADELUS_PERMMAT_HPP__
+
+#include <math.h>
+#include <stdio.h>
+#include <stdlib.h>
+#include <mpi.h>
+#include "Adelus_defines.h"
+#include "Adelus_macros.h"
+#include "Adelus_mytime.hpp"
+#include "Kokkos_Core.hpp"
+
+extern int me;	               // processor id information
+extern int nprocs_row;         // num of procs to which a row is assigned
+extern int nprocs_col;         // num of procs to which a col is assigned
+extern int nrows_matrix;       // number of rows in the matrix
+extern int ncols_matrix;       // number of cols in the matrix
+extern int my_rows;            // num of rows I own
+extern int my_cols;            // num of cols I own
+extern int myrow;
+extern int mycol;
+extern MPI_Comm col_comm;
+
+namespace Adelus {
+
+  template<class IDView>
+  inline 
+  void exchange_pivots(IDView& lpiv_view, IDView& permute) {
+    int j,k; // loop counter
+  
+    MPI_Status msgstatus;
+  
+    int i,rank_row,k_row,pivot_col;
+
+    //  First gather the permutation vector to processor 0 in row_comm
+    if (myrow == 0 || mycol == 0) {
+      for (k=0;k<=nrows_matrix-1;k++) {
+        pivot_col = k%nprocs_row;
+        k_row = k%nprocs_col;
+        rank_row = k_row*nprocs_row;
+        if (me == pivot_col) {
+          j=k/nprocs_row;
+          MPI_Send(lpiv_view.data()+j,1,MPI_INT,rank_row,0,MPI_COMM_WORLD);
+        }
+        if (me == rank_row) {
+          i=k/nprocs_col;
+          MPI_Recv(permute.data()+i,1,MPI_INT,pivot_col,0,MPI_COMM_WORLD,&msgstatus);
+        }
+      }
+    }
+    MPI_Barrier(MPI_COMM_WORLD);
+    // Broadcast to the rest of the processors  in row_comm
+    MPI_Bcast(permute,my_rows,MPI_INT,0,row_comm);
+  }// End of function exchange_pivots
+  
+  template<class ZDView, class IDView>
+  inline
+  void permute_mat(ZDView& ZV, IDView& lpiv_view, IDView& permute) {
+    //NOTE: Currently assuming ZV residing in host memory
+    using value_type  = typename ZDView::value_type;
+    int j, k;  // loop counter
+    int J;     // global column index
+
+    MPI_Status msgstatus;
+  
+    int pivot_row, k_row;
+    value_type tmpr, tmps;
+
+#ifdef GET_TIMING
+   double exchpivtime,permutemattime,t1;
+
+   t1 = MPI_Wtime();
+#endif
+
+    exchange_pivots(lpiv_view, permute);
+
+#ifdef GET_TIMING
+    exchpivtime = MPI_Wtime()-t1;
+
+    t1 = MPI_Wtime();
+#endif
+  
+    for (j=0;j<=my_cols-1;j++) {
+      J=j*nprocs_row+mycol;
+      for (k=J+1;k<=nrows_matrix-1;k++) {
+        k_row=k%nprocs_col;
+        if (myrow==k_row)
+          pivot_row=permute(k/nprocs_col);
+        MPI_Bcast(&pivot_row,1,MPI_INT,k_row,col_comm);
+        if (k != pivot_row) {
+          if (myrow == k_row) {
+            tmps = ZV(k/nprocs_col, J/nprocs_row);
+            MPI_Send((char *)(&tmps),sizeof(value_type),MPI_CHAR,pivot_row%nprocs_col,2,col_comm);
+          }
+          if (myrow == pivot_row%nprocs_col) {
+            tmps = ZV(pivot_row/nprocs_col, J/nprocs_row);
+            MPI_Send((char *)(&tmps),sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
+          }
+          if (myrow == k_row) {
+            MPI_Recv((char *)(&tmpr),sizeof(value_type),MPI_CHAR,pivot_row%nprocs_col,3,col_comm,&msgstatus);
+            ZV(k/nprocs_col, J/nprocs_row) = tmpr;
+          }
+          if (myrow == pivot_row%nprocs_col) {
+            MPI_Recv((char *)(&tmpr),sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
+            ZV(pivot_row/nprocs_col, J/nprocs_row)  = tmpr;
+          }
+        }// End of if (k != pivot_row)
+      }// End of for (k=J+1;k<=nrows_matrix-2;k++)
+    }// End of for (j=0;j<=my_cols-1;j++)
+
+#ifdef GET_TIMING
+    permutemattime = MPI_Wtime()-t1;
+
+    showtime("Time to exchange pivot information",&exchpivtime);
+    showtime("Time to permute matrix",&permutemattime);    
+#endif
+  }// End of function permute_mat. */
+
+}//namespace Adelus
+
+#endif
diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
index 8f6eff9a54ae..cb1c6df08a14 100644
--- a/packages/adelus/src/Adelus_x_factor.hpp
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -56,6 +56,7 @@
 #include "Adelus_macros.h"
 #include "Adelus_block.h"
 #include "Adelus_factor.hpp"
+#include "Adelus_perm_mat.hpp"
 #include "Adelus_pcomm.hpp"
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
@@ -68,7 +69,7 @@ namespace Adelus {
 
 template<class ZDView, class IDView>
 inline
-void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView pivot, double *secs)
+void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
@@ -130,11 +131,13 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView pivot, double *se
   totmem += blksz * (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);//row1_view
   totmem += (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);        //row2_view
   totmem += (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);        //row3_view
+  totmem += my_cols * sizeof(int);                                      //lpiv_view
   
-  ViewType2D    col1_view      ( "col1_view",      my_rows, blksz );
-  ViewType2D    row1_view      ( "row1_view",      blksz, my_cols + blksz + nrhs );
-  ViewType1D    row2_view      ( "row2_view",      my_cols + blksz + nrhs );
-  ViewType1D    row3_view      ( "row3_view",      my_cols + blksz + nrhs );
+  ViewType2D  col1_view ( "col1_view", my_rows, blksz );
+  ViewType2D  row1_view ( "row1_view", blksz, my_cols + blksz + nrhs );
+  ViewType1D  row2_view ( "row2_view", my_cols + blksz + nrhs );
+  ViewType1D  row3_view ( "row3_view", my_cols + blksz + nrhs );
+  IDView      lpiv_view ( "lpiv_view", my_cols );
 
   {
   // Factor the system
@@ -155,19 +158,33 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView pivot, double *se
            row1_view,
            row2_view, 
            row3_view, 
-           pivot);
+           lpiv_view);
 #ifdef ADELUS_HAVE_TIME_MONITOR
   }
 #endif
 
-  tsecs = get_seconds(tsecs);
+  // Permute the lower triangular matrix
+  //NOTE: Currently doing matrix permutation in host memory
+  ZDView::HostMirror h_ZV = Kokkos::create_mirror_view( ZV );
+  Kokkos::deep_copy (h_ZV, ZV);
 
-  run_secs = (double) tsecs;
+#ifdef ADELUS_HAVE_TIME_MONITOR
+  {
+    TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: matrix permutation"));
+#endif
+    permute_mat(h_ZV, lpiv_view, permute);
+#ifdef ADELUS_HAVE_TIME_MONITOR
+  }
+#endif
+
+  Kokkos::deep_copy (ZV, h_ZV);
 
-  // Solve time secs
+  tsecs = get_seconds(tsecs);
 
+  run_secs = (double) tsecs;
+  
   *secs = run_secs;
-  showtime("Total time in Factor",&run_secs);
+  showtime("Total time in Factor (inl. matrix permutation)",&run_secs);
   }
 }
 
diff --git a/packages/adelus/src/CMakeLists.txt b/packages/adelus/src/CMakeLists.txt
index 9ce34c2b37da..c58cc6c1d307 100644
--- a/packages/adelus/src/CMakeLists.txt
+++ b/packages/adelus/src/CMakeLists.txt
@@ -61,8 +61,10 @@ IF (TPL_ENABLE_MPI)
     Adelus_pcomm.hpp
     Adelus_perm1.hpp
     Adelus_solve.hpp
+    Adelus_perm_mat.hpp
     Adelus_vars.hpp
     Adelus_xlu_solve.hpp
+    Adelus_x_factor.hpp
     Adelus.hpp
     BlasWrapper_copy_spec.hpp
     BlasWrapper_copy.hpp

From 88a11c074c4447d7d20abd1d627e77da61723b27 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 20 Feb 2022 14:57:35 -0800
Subject: [PATCH 005/130] Some other changes

---
 packages/adelus/src/Adelus.hpp | 1 -
 1 file changed, 1 deletion(-)

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index cf9454a6485e..bd9366a9c444 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -49,7 +49,6 @@
 #include <Kokkos_View.hpp>
 #include <Adelus_defines.h>
 #include <Adelus_xlu_solve.hpp>
-#include <Adelus_perm_mat.hpp>
 #include <Adelus_x_factor.hpp>
 #include <Adelus_distribute.hpp>
 #include <mpi.h>

From 8b1bea3284defbb620d68e07cc3ba5a8e42ad3af Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 20 Feb 2022 15:28:59 -0800
Subject: [PATCH 006/130] Fix some compile errors

---
 packages/adelus/src/Adelus_x_factor.hpp | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
index cb1c6df08a14..868cd905dd05 100644
--- a/packages/adelus/src/Adelus_x_factor.hpp
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -110,7 +110,7 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double
   my_first_row = mesh_row(me);
 
   my_rows = nrows_matrix / nprocs_col;
-  if (my_first_row < nrows_matrix % nprocs_col)i
+  if (my_first_row < nrows_matrix % nprocs_col)
     ++my_rows;
   my_cols = ncols_matrix / nprocs_row;
   if (my_first_col < ncols_matrix % nprocs_row)
@@ -165,7 +165,7 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double
 
   // Permute the lower triangular matrix
   //NOTE: Currently doing matrix permutation in host memory
-  ZDView::HostMirror h_ZV = Kokkos::create_mirror_view( ZV );
+  typename ZDView::HostMirror h_ZV = Kokkos::create_mirror_view( ZV );
   Kokkos::deep_copy (h_ZV, ZV);
 
 #ifdef ADELUS_HAVE_TIME_MONITOR

From 91ca05e1aa85956c8a85d4437b11769084501469 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Tue, 22 Feb 2022 22:44:58 -0800
Subject: [PATCH 007/130] Add solve interface

---
 packages/adelus.zip                     | Bin 0 -> 141064 bytes
 packages/adelus/src/Adelus.hpp          |  43 +++++-
 packages/adelus/src/Adelus_forward.hpp  | 134 +++++++++++++++++++
 packages/adelus/src/Adelus_perm_mat.hpp |  54 ++++----
 packages/adelus/src/Adelus_perm_rhs.hpp | 127 ++++++++++++++++++
 packages/adelus/src/Adelus_x_factor.hpp |  36 ++---
 packages/adelus/src/Adelus_x_solve.hpp  | 167 ++++++++++++++++++++++++
 packages/adelus/src/CMakeLists.txt      |   5 +-
 8 files changed, 515 insertions(+), 51 deletions(-)
 create mode 100644 packages/adelus.zip
 create mode 100644 packages/adelus/src/Adelus_forward.hpp
 create mode 100644 packages/adelus/src/Adelus_perm_rhs.hpp
 create mode 100644 packages/adelus/src/Adelus_x_solve.hpp

diff --git a/packages/adelus.zip b/packages/adelus.zip
new file mode 100644
index 0000000000000000000000000000000000000000..9fe3e8b2aa413bc758fc535a6c8b611289a0396d
GIT binary patch
literal 141064
zcmb5UV~}V;+O1i(ZR?b6>y&NVwr$(CZQHhO+g0bD?r&mxy6>HincR^X`_Enx8L`)s
zk?*_YB!NMo0RAyV8l{!~`SO1)-~c!P`bNf9&W?1-N{|4+fG>~+hkvKD8#DkQh@%$(
zz&{tczXB+KKY;)M`740m5Au2l3;>`60RRB^F99iWArToxk$>uhJwqD&WB!Luvr50s
zAuB@nD;1b0MV8>D8}d~#kCS<L%lbq@YEi<peEeA&wz?GQguqV^Q&Uu%I`zijil2VO
zp!@A~rvKUGq%74860L7XSCFpH9C$s%4Hv#jrpehpeK7pu`epkXPq)*H{;9qLOJ{~Q
zzlz7@MgyRAh4v-Z>m3juur0oorIhJrs4Yj5C78rTzqLTJwe=*#0&|FXNxK62qP+V2
zN(pc;)1GuIe5v8;M@<zs$(Q$tN#pwSXl3l3)i<1=jj(%?ywoyE%8g!!i>(HH_I<I)
z$b?gqpPUeU+XL68&~3|4`_)vqM-?7%bhXrGCRRw^$%prHl8~)lO@gX=+x=zQFKKJf
z-Stm7B0Xmm(t;gWZR3HNZtKY#&=$DI!a}drU|lvh!S&7!8*9|AXn^2;WC!(I`7y;)
zxR#ON-DF;rPG{-EoO#PKoDTOVv_znUdvbI965A!v>%yvuWv~|^-v&y6)YmhDkdYi@
zu}f}FBwTAtgedwM^UaTFG9%&Hs~snD*V-P`fFRS7tRTJeXTO6VaGKE-@JI_)SZ0#r
za>LX$n9zQ>7t)ut6zM+~9%pFzIp}s3R~}I5^@PbWO~*TNCG?pTug+|0vhb+V%=v9K
zzdO*|;4{FmIBxrzSioSS!710cZ1>Ed;OJ%wdG_jQz<xMJP79a#(j!bDAE{y0e=9EG
zotEFuHeDvm<vj%V7$*SNurc-`Ldxp-u&La|{DSEMP9c5k2L3T7Hs?zvSjkkn3-Y7a
zZIFVlAwp2kLJJ>DL7akyRj(mLwaiCUK1FnRP&`q`I)WZhcf_o<3!N6BeA3p_hR8-d
z1p0+(m9|7gt3al&I3``g9`_<##%^pdja&iCLO^$iontOXl~Q8J0wM5apJV<@PMa2W
zisQoYF$o{DZbVoN@A3?SnO9Ez3`RndSPmNxTH}rmM^gWRmdGqf`ODEilpX?7vyoIa
zi18g=cJ8Gu&P&?i5wy&prfDwtq;BewWQ+`B_&7SO{R4I(D?*(=-z`Wu1Jox-ppic6
z(mh|ePFn9+0S%kx;VM8*<(&pA&;rwhy#Ih3+PRRWy^C0jk;I80U=wxJTRa79bL}ij
z5Zut)Ct+&3n70y*u}5k+!IYuYOoqQz@E-aqo!@)1URBs<GOiusSus*>)83smU;d0D
z47Bb@H16%5zJHH`f+0rwj$S94hF$vewEt<J=H9bS=}e}*{u(X;Nf$YBP?zP$=VI`f
z+1oBO@>VO^w{3^}dQbK=w8XcG{#}D_;e)S;(vw0UMR(GBedD5jYq02c;4t$D-|IZq
zm-GkhAE@|0vj+ZOs4#ZZx3;q~{uguRVxaz$75`$+KcHns9sGs=7eRF5000F4yU_nI
zOxMW4+{M^|*3i!G|EAeLi1r^8n$~o8+#IX_qnm4>qUi#NM53^>_KfG;#ZN-QP$Cu*
z8k=gBPoO6@00amIU`~bY`|30c2*V#&VAO7r>;^e?f0=Xh_W^DW?AExhWlLFa0J{^0
z(>a5$L$DdlJ)hT0k6UKo;HWvh&X_+Sd?{^AGPAv~z2H3OEXNO);TK)X4wgrd#vijZ
z2v+1PVtyGs=Zw}zp{`dHEP%x1%s=G<J9o+uzKp5bm*YdriWZ6;A<33cSa6%sU@N4L
z#$_X=xh%6>xqRN;>2a6r`8bcN>j8Ti#5+9PXK0U6VTL<pmJ*jz90iY{jlTD<V;}*^
zSxC=~BgrVz%}$e80KRw^$NF@Qk_X~WFcz$LN1`!IZAjqab2<QL4EN&*WI`OiV$&!I
zV~pkYJ?NAY1Os$y@biB&m*8m#D@?xa7vgkO7<nLp3OJ(@i)uq03zCH3WFX041+gR_
zCA~@01JSfOl4sN<bLfLvYX|1wPoBdG2$H|(T-pnS2Y_KvYRFeTfTZZ~Kb$qEHhwb6
zMkFYM5McxodQR!vlHCiYiVGi$+#;>mh{vk*XCx|%8s7p0e#j;mFP>=%F1r9Y8uQ^I
z)4ph|StD^eL2)-g1G_pYmU?<SD9|R7Kq2S9@!w*|=`-<r4V#+_go-!;#F;8gLZU^X
z7pSxM1)V07lV=uPPD%iEo=?fkjTJ>JL=E1`Nf6%mc3Q+s(7&~Kn#WNC$@vW233ZvY
zh@YG_0Qo#YpnM5mx9;zq9r{?p*K@b!-)Q}o*|Z=;c*0NHmfys}D%!So8L4)8-5^Lk
zL_B{HEn4icjs<XDV)82?^`zVuyM?m1sTOzylbD)xDdqW?D${BHtzF~>N+P|$243jm
zxWxco#E19fDHKU?Tm4eE&am040zC@G4WMn{UDrX(*u}tw%Yfy_|1quO%4`Pg+T9<g
zrO}t`zFyA`ieXsEQ<p&;2po=%gC+*1c8OuM)|z4MRmZDNkK%Z@&Tr<2tKo|;L|jHf
z^SIL05)xLxLxhar>BwDY6TiKKiWx%}TKHnd-7w}{yJ}!XJT-^qWyV&$|Lgq8j$YM>
zy9tJXnGw_54^Ur#g<Cf!)S9e?HOh+~<MsEoj_U8E%$?r|Fm{%Lw`j=rwUZ;T1?RB5
z#I#UB=6wYCw$v2(d1C2nQiSP*Vs#t}ngw>Af$@wQ3(YlL*Orx=O?54y{P>$flHl3R
z{=Js@R3tz1AQOhHK1zspBlxJ$ENP<RpAl)*@YY5;%%T|d!TOqMu!;JQqGkLVpS!8d
z`Z@=H)Xe(E?)u?Pi;n#==T!bY?7h}PLNkmmnibnZxcNpRb)?0=%6Gsdc;=evc6oa3
z<X_I|av1G-*`LUqb-vDInTb#7NM`G@J52`d<+Y5K@NmMt@o^G=OsCTUO%O+h?vTds
z<9Nv<fl@h@FxdCK2JIySK`hHiC4`a`JAxeMQx_T8F_BPR1gH+40mqk$FrWx|ib8x@
zT=^QpaoVcimCZp9f;5Gl^aH0a#EtAlxl;i2vcUE~LSo!)EZLhLwd{)Co-L5Pelujx
zrG?NQYlsPh5sC>Cwq2Pp>rzjyLFvwE`IkUGeM~Z(vri&~IlS}FYl>mxoO~E&PzRz+
z?%3Nojc27hVG_HAM{}1MT}gnw`aBD<sR`QgJ`y9qJD;FStQ&QY$;vCpSEYdRlE8;+
z9FUct{yt9V>!m`~Cn`bnud)0EGIyA+!KwSEmY38OdvjYjWFs1fHH{V-`Ak`}c`-5B
zC%&_$$f=ur@!H;2@8lbM^&XcuO{h5!!OL;K#1h8kcmV9B^L^-AaQj{VTP<Em7iAN}
z?++kWv+cAjYlo&?bhrODi*5C;Y(9s9J~mfgzE^Da-3~$cA6t(OaFI#5G{_a_;V52m
z+l$h)RO(Y#Jurm*!!t`kX7nZ=c;xOax*(X)0VytWTUqgX{K~O}AQZ3UBk0ihHGnKc
zo?p&0U>SNzzwwNA-BM7r<~(%kKBD9<0;$$k+Jq^BP!ycNZdpK&E3z-E9#=7q6+y7;
zj_|qRnS++-q~vS#?BX^Nn(9!OcI4GyG15Tu@w&|1!Kq1?q|=b(g0JU7QHL#SJigS=
zOEXo-?m{8uFNO#-&Zr6WLT0R&=;qffZ(mk^*07y40K$ez`Tf!slG-NON1pwi*n3I`
z^7EDY^zB);GL-tK?Yb;8Hbgd;BWnGqs+IYs?}RVHPZC*v=j%H~$^V`=0*dhxC1fMh
zEo299g^JGlbz$dEL$>h~tuVPDwZz~K8i__$tBU7OjXd7<fMWS(+GZQa82b*gz;vw5
zX@50XCK+%5yJj$PPau>tJD+J-*Ka=U;EVz%O2m8bZKKP}VaN-R0|y^2V|NkABa?@^
zmdvGVwnf7~xC`6hyR;oDdOF8qDXB-Bi+q>kZ{^_z5gqPBSrM!^#!Gkz!hTx-*bBwY
zdQ@Zen*E&$)^@ikhHK&g>TT@9B>Dv#^@a>f>fr-Nb<U``sRekL+E^Lqfwa3PQi1XN
z^Z|(a)SgY=UF50Meq76pv~c0_hrTu}DPp)}f{Of(*^u8>(;R*ZwzrF>F1-p1xbP7r
zXFgQbj@tWAqxudSF-d2_7?=;69k=4z_pC2#OF_S&d0MO$@M1S;qaPUk%NamyM_gX;
zIjHRtzy0_SyZR*d+~xR|zZqUOdz=a@!T6jj5$Gcqc}P*qM=;JGqu*{>2}r#VwKMys
zdk^P>d68`wUX%8_H<WND`&oz82YQN!<6ed0Xh($CYE=r9)9RIM^o$;09Og#FdOHa(
zF%_bTq#N^6sTC&4UW#JE&%Pm`Bp=hVEDi-SdAFVtN91iU0}!@#abdlh)1_M=(tBDn
zDtMor7GwLg-mgk|bwSkBDDETU!BdYljtj}=pI?CCq!Uz96wl5Fqv8?PD-(J75sZ=%
zX(D1HC4zG~T)Ps&BJ(+0gtp8Cjh4TN=LupbkBOg@-d{B^uU|qaj(+E{55}?%5OQx&
zB%Z|306y8@xM26w0u!`%rwbq`ZfUJJAR5V*QKrR%>FPWE{sL5q{L0tMNw$+xTVGV%
zqpwAEL|8dwj*0$GNRKNdPWPUK9L58^eZYjAJe8su21*LM;!qSofkDL@%^!$-^@?Ef
zOj<}Xphy!Dcob|G^zG`-ui(!QEO<vX;Bpha1IT&ldHwOWHPh7Is%p+WOc@vSaDJBV
ztc@IJ*QN$^#4IU=0G}S`M7qJC<^eyJQSFh;T*GS!UR5_`F4AS#_A6oXy*HbjdnBJr
zvbABxYBOUwmH<nHKheB<#o#W>o-t5+Be9Y%Oc~?@uU4md#n9e-RpYSOM}>DPjbNJ9
zdM6DQK}PlR<0eSq^#5aPKjXBGFI1_~Z;l?0(f;M)wCym4Ni)$<Eu6gPD4;d6Q$b*m
zQ+dxrfK_vqjQj{euEQ@@#~p%RaQ$lY>Eh~T8EXTUvW|5VsTPJ=WcEGj?z(k;b{Syw
zo6P_`4+QwW8&J|Hi4Z-%&jS(~t&>UtchkDfXxJ>Jy_w>GF2hcQiEx93Fbx@EOqQVp
z)`f(EUS%N^)R-8F@|GQbp7DB4T;h%R#?GlQiPcCa_*5s(Tp^tb-}_k~lYn(Q=42+7
zf>jKz(2+Av!EZK3YfI6DKW?s0+AzH}pz!!g0<)FBGg|_W@9pUlb2p2VJ+6rWdgwuO
z<Osqei+5v{V7Lb#gR1j+`V33`Svsj`F!*qRMa8Ph1Bfq^!4VCV3?td#P$((ACw-12
zEbGag@lZRLv;k>3HBK!&^Ax&j{nl%Pi2nUR)J^U&da>Ir2ZT+JN3tmP{uznUCu+A8
zQoF4uo8tccPS7AlkB;b+WyU8YZ<XCAp-ALu%zU42Gl$k;*(~fXt^xfcx`TSR8F`4j
z_;t~gf99M!0v{yjqk(vB0x|_B5=NWc&fqZ#Jh6F9?MnS5+d2<Dtse+9+Z3M2%pm;M
zoD}9eEgR%ay*r{+<=0yBamQZg5LwY?iRjC{DWBxW<M2?v76nd%YaGUs1@%>f5(Kch
z9Op92*uXt^m-8c>Y%Ds1cKu@lg}9eb6cedcYM`4Ww{Z}<3)%#&7{?6{m(9%D6fAUm
z+mV&diB*F1C@*CuH2DZlu~Q4xfEQ@7tTWL0+)ru8+SYEv0JZ$Yto`KgZVrL;P-eo-
zP--Kv$KWbI{~|#)uafN#dl&>JY-NyiD^_{T03Oq2ti{5k78N0NTJ#}Dg;3n|DS;#2
zoQKg#`d>yxY~A~1d{}EHz14}Uwd-hWj|$4(t%PfhB3OK!F&fkG<3xS#NYZNg{a^v5
z1!ingc99Sz1V)8@Tzt~MY40~s>VPrZfYDCNXUYcD0TpxQw(o#Hb_DiGvjge-S}32Q
zVQh#sPK8|?8>B<fYzn4~MADbGF`aMkO^WHeQ@i!+UD|=dsRd|me+)|Lw*hHYov{U>
zDR6K`yR$!PN&-~{d`GqGt%lnh`9$vRPGk|v@J0I7$I*4_Xp}qwm9Y}yZ=$maY8XoU
z_fj4?G~jlWelbkbpr?enf#6DWp8~E39bjOs29RiyG-Ru}h~*{nSu{)e01R7P7zjzk
z7$1NG;xP^SHOV>?8?MK})*V?Lj;(@OLzK$U5;Sn^rm51&5BXcN`@aSJ5=Qky)_X{k
zZ_0yU_JS8w8<^}F*yr8v$3MYnKg<MkwLfyJA(l$dZL3S>N-<|JeuVGxvM}t&>~yrZ
z0~F#BT?M}K2Y|N=rN}V47qjx)P6G~HT6G=la~Cf-i}cs@p+ROlOAN?&OQN;v!l|f-
zG}d#xiWT`f%HYx-8Y?jrpG0ZhSH`8{x*}>YZ6sN@dVzKE6d<k*fb_2`5`IWL<mBMj
zgSBPGDW&4drzQOTl_B&3r>MWFbJF<7kDJE>9LMM=RZNy}cE{QHqmQ~cCom8trf<vM
zLkW}Tb&GHKrqLVQo;EFaec7Vq71S1a@-TG)$3LkL5(sMzIf@+$U2!88XxCe<uy#3`
z7NZ8j1NZR-2`D-Q-Q6DwW6JWNk!i5m8u%-*tMn0+eQ;OiLJujlk9D%n`9uLu=Hes8
z`3ViBg<u0Hp_WFHV1o?eaC-A1V&G+7wCSPFq0J#$N9~uG^}(MnV(D!GUe0-EhkjWT
z29aN^e%#GVdF+X-d)de8M`&}6)W|F0HG2(B?zk&u1MI#EmqI9|PZzt5g&os5v9k5l
zwi=H<SdvT5=b*=*v7SP`M-)F+GI!@aw;Zp6?y@UKNJ`dt{3r?w(a6P*HSQr<sxozH
z9B$yZZ8}wLg>kEg@c=4ySf=5r&Z({r$pEo!RR}+-8`10MdqDC%23UG@IDBBQWY=0I
zD3}B_p(y-OjYUBDW~0NvrG>~nF-dO`G>65rqQG?C7N6VRfzfMmhxF{;z@d?+f~j%j
zsgGIQFh{3lr>Eo|<HuA?B?K7-MkKLO-;(8UF2lkjXzrWv@O}3wSX1mbmW1O2icMVP
z`CmU9j6<>R!V*<F$XXyi9WK&xIAM?s`!vEaxukAu`hBt3@f`7b_u+IpaLrd0<_P}R
z^?&+6R)R~p))Z!C=^CGV*Bdww^P`3DFM&Lt+HLQ(tl4{v-8JKTZ|QDxeYOOCp)dSl
zt~oE4IiGiAeB!laTYS%=s8TUfO8Qhe1ldMjWf~Lmz0&%1JFc?sL!`P^z!ZCwj8TU}
zC$I<f{R^VIXStgu@NOX6Zbvh)W_f&1^gG7;vqy2DGa{v~E7$?(S$3e~Ds51LzRHbJ
z!?6o-R+|^ve$LV+2&7a!eB6}f6VbKK9tt&J2CgN2cXirEZ$<X_F};iRm*f!aPHsD2
z^RRe*_AjBErh3a|hG|#rg0)<{)E6#jNPAHFS8rM2DR|M<)Mrl#<~3>$D?%*Z6l<fF
z#~-21k1zu?+~eS4sum$Gqg_DrbUL~#B<$fy@n9<H15PCOXtp<Kw9N7fV{bQgSk*ck
zp}O-@g34wdXvFgdiqKDV3904Eo0h#WC?S>KQ{Y|3UB-z&$Kaw`mDcu2$_{-9pQflo
zv-4kzqE&4Hskm<?kTl4F7w;NkZZ27$>$DK&oc^6KYhZMG5e~zdn{V3~x_V!BNKKXo
zjjRSN!G$t?F%%83%c?p;qR_C3T;7I6qneoSZ4UnRea>z<s>YEQx#rQaLBKw63JtLl
zbWq_cJJo2Dl2W^Kb4Lc?tNdmWZ6D()RLh>lBeaou+?uan7!=^KMc0c29f_Y%6Wd>W
zcaKzhmj}XiN;;MGvw@5u?%f$}lw_}lh2wrbx2V3Pxg4sdV@fMNGN+KznAKM6%C&3j
zD&~6>L-Xe%?ijLKHIsx{DnfgZDM0-o4c7iMFF6sa!m%=N!Lf^yN)@ZKElC|xRx84t
zE<!1~fz6+|jpmr3;x72w)+#4#2`jD~jy`Xln*;UQ=FcQz4Nfh0Jf*%d`1#q+>#wH9
zOk^|K0Z{W^xHyDd&yV({30ZT6f7B(N-*u`lG=6&9JT>o<gVfx5RuO!Fv<~javF{>6
zk0RX`#_3Mi&!{fvD|?{0Z$vqAM;YGqlp@`pPiK_6RwS35n|J7TXt&b0Ey$?UC&NsZ
zpfX2yE2jiOIxjoHw-5+|z_~o0dJ)RpvPCBvF@)4!^Pm$B{xrDL^!1&9?!@S=zep}u
zLuq&I%Q%Tj-%vi(vNnnV{6L0HLCQ8VWSx&<w+LVX3=@<6v6FcJ5>5&UZiBLuhniQ7
z^Befp-c2&~t%TArLWCmAfP_7yE^S>bJejcsLaI&YgF!T7%_sv?UIOf(Q2R(Tt^hf3
z|HmY+3`@z~=L6+obKu?hxY7Xe6~-<1<8#Ls@ZSrM5FV=jL4TVa=+FQFxc__MQAk?f
z(pbve(aDk4$<67%RUM;MtZg&t5q@%X?F~QUB)sRFyenG7nb~Qer5Opd$)p97(nhfL
zOr}~aCVY3(NkAxMu*)MZI#1g@XHvO(L*}bF2<c5AgVUht2T-Lah}0loGNFJ6xMkH)
zBu1Fp=+qkw)`5fI2`8Z-^}#N<q>ws*bnAkQyD)^!-x9%oO{!^>_~-RXkeyk${nnbz
zk>1~a-%RY^W1)u9Fbrsy9C>*_QG;=i&ZjQ(3y{!zKp_cbk#-1EcL{Tdf#LNy&`;wZ
zaQ*e8FAk(nA~|)AcvCJ|Lq9G=GU>8En;~K;HYrFXIint;K!SnqAYl0Nx+pSmLq~~<
z?wMvEaY1@A5<!_>AkmnYAGUG|9Q!s{5yOSszx8ChH{Bc41&haHzo|6bCR*)j3jw`{
z37R2Jh7WG&X_0?wW}uU(e|?xh2fazE5==Iq5xA9EVJSGx5Q<Mx-?7p*1=c$Bh!T3w
zgZ<bbKdB19rX&Y(FFURwkJ(Vv26A`=0A#j$XQ+seXXP~W>1hk-5~?vLW4pJOvn$F<
zqtRxl+g@UcTpL{-+syCD>41hNAHca*a-80_>#-*tiFPxajW_(cSV-@Epnb_S?+Lxi
z*zK2B3#46{a$=#+rLwo3wzdN`zwd6af)t%HsmI)zy$N^zWVu)ndf7KCG^!<rXo3|`
z^DF`sP;aQ?>4B;F2|e_L)SXn4>4C4_8=I0q?Y%k_nI-cv*0F*H+fO)hIJmb3TXUN(
zA3dy@wI`QkQDNV#kO!d%g(&N|<pOj{J#a|kRYqph-2*q+wanLX<DW=Yu&aCcT_hRv
z3_-+IZe0mFavxIWDg(RTm;M+cb^DXAyEkL<BTB=~E?Gwl*eSbDeZn!luw^EB8Ce?Z
z(pFO%;F-oOt@zlSmwDl{e6Yz1(1SA3)geO(V$*3RU6}hOCjg%|<K+P9==zc#<>mZd
z{!qysVZpNUZ3hLqYvbm%AeM3PqYSbMpHuS1#_Kp$AIlbuSnL7$%q&6e=5bciPy0ac
z4KsDJ2qo%Azof6BqPOp;XYtvF*u9_5lD@TmWT`h}&CDjswlK8>fOoO7FkkP>Smq;w
zm9t{R%h}@kE0GkF#_Mr{aBw9NQR7ecZ}%7gYSlRCD@sEA(4KQ0<lgI2S~D4~Kbe#g
zd+#SpjM~sUJ-_c(e7S%xNS7ctI**>Qug-${<No}IwX3#x!C3xUyY+7$6ZK!#{{L?2
zZWU?UO?HItPgR&Kyn;MsS{{_{c_iG*X5nfvx`b|oDq(U#BY6Z;0)hEIJwo0^A(=+5
z*m~ZGAvis+CLvk(2KFuNzy|_lug2B+or`m2Upm_sTk2ud8X^IcNg%r8s66DsH6E8V
zA&OM+Z8v$gC&>6#g^v!pCwdt*%+1aSrt^4M+c(mla?UX@8!l){l>)05n#GYKO}xIZ
z-Ue}y;pgz;$PF6`znpS+F`-Ey``?YOpkarOh$+w+2?BKLsS9x0#?J7$8iJEdEK`O_
zAj?i^01PJDk$XX2v4zqw^h_vd>Wua{f`_w-`-*{&l)B2;BMOfu^g&71<kT2if=O|S
zf@`>wo~wI7goUhYiHp^fAZWwZ?$P(GN;`H07gL;Fp(F%5w(Z*qec>|7qSTQfQwWn<
z^TfkAUPm^TOlnr-lFEZR03w^esl-}W^RDdZpt@DPm)ku^rTU;dMv2qJm4IsB?tL#)
z<*Uy5K7(iA4Y3YVg*r$iNi=IoqZRER6>@%er|ol82cK`3nlm7xJp#3JFem%?dF!6i
z%2!Z!{`PfG8huZXqfeqnMSLjG!(4Dqno|vzzxn#E{c-~d4BRa~MW*4)Z*>#-1OAb(
z6~^G3T9e$Qq3pIgMaSXh*@O)1n{vZ^!nPP~4Iof+N6U*@>b)0Df;}RFMG6UPh()~e
zbz-j`bBV-elqDMDY03iPolnaq4~1>WB{tbH;`+Byy~qp1YR11Rul%rC;F1-RR01ez
zivU66ZUjfvlkw?k$mdJjWMgEL5%1AVij(zx(uBhzBaB7;Zp6FG<;&R7j^@Tr5|Mwb
zeB7$iT-<Uy+Ww5Er0wS;cOwpSI4yqIsf=OFp04KNXtVhx{7x@#0*>?R6mG&Emuub<
zsq{u0=UtjRk@_P})jMBbm*_c;$?}8MH)HkZzOQ7p-vwPk+$8`K2TQA_kVep>w<8KW
zEnwg%6@0n*IPi(?Yttdt5@Xu9>ZbWtS4u_4T-k6N>UvjN(pcMt4;QYYLh9zU@twjt
zQvLJITrDF2@*Y3bUbzf<8EtOQ+e#zR@-pXu=?}Nj1+C`@P}VWV(C+_xgAn##9yGN6
zd#wKdXb&brHZ8>h0RV7=0|4Ovr;NZq0}i@|wl*f_rnF|X<~INBoX$>`kImpm7~TCw
zNqp0DFrR&TUSPhrlMSa3uIqj=j-<!K)=RCEy#0E~7MZP#c-a6aq@J=hHTm<Wo{p7q
z7&dBTN;7!t9v%KBNY>L^0|jYz#d8oF<5nje)=C+8ww_rJr3zcV$d4|$0yfEB1|PM|
zcHd;}lKjP8HY=uwaRv|A7xVtzYy?j$HW+uSP1LL@PWFxj8yg<K-$-z<kpgNC(>id$
zM_q`}$c7HRHIrJ!r7}@FhRGL=EKuvXeSu>I2^yB-(AnRdt+9LRYkdmd)T&)?#~g9=
zO|U8vCb0|qr2Ta!iK7uMzK8IR-<)}X+pcr)e0X{K5G7L7m$@wZhU{wgZ<*dn37n9(
zJ4X!dPeCxuej_Uj?iBi1+!)JRV$a+=y+%jmxM%nWt0x~bcgi8lO|Rapu+P>670;E$
zj_gcu)54J#K!uMdo?6qm0TY49Vzu<Dzi=|DvDzyDK{zy0K0Uq_L46U?cOpK8ot>Xq
zCrn3q)vZ`%bd&Ok12iLT`2y>5_c(_v<%0h=ZfS4f^9O}uJx6(74U~=o8Rfchl$@dR
z5M+v&_c}8pgP^$OSja|WOUdw4*C3bh<WCBr{zifeT%Z!mi^_5ugtd7KENBnToju{y
zOVs-yWY;LP7#GJ6Fs6<`j<Gu~i%vuQ>(13r!ZK<SVlnEl`B;z$x5H`e$tUrQ3{t81
z;r<e=UPY5XznJ*KuX?3tG}fY)8u3PaL`A+Rw>?@ktEp2fpEMqFuBi=i57$&86>j<E
z7|+{iL9<+$^UAn;21EZt@Lf8V>7kPOC1ye{YK%B{;)gp5jo?zhZEgh8aXE2)ig?N4
zW?q+5W`*xy?Dxr?9Ta+;oNx61>8JlIdXpFpkZ<ufhyw@sfB4UZjqQwWjErpz&5a#t
z|LLIrmc@Z~ft|m*cZz^_fQ5O6ac~ZIwTBIZw{v=NadL%Kxtp1tnV}0&*eMrrFXtG}
z(CU}t`2i%%`SFS2rSKqFAgt*pT$>h77_HDHBxz>mAjTiZLNOEs@(MuB^1=zUX9p&U
zorE-VP<sLd_?P4VkskVg#*d)?WmO|v!~gO7KVn1wH4g9(5!DLAldHdeuLc7EK>K$Q
zVOuwM6LTwLRbzwyw*6}5Nt;c2gsw{}v~f~VWJm#7ScJTg>Jppp0OHo^alN8s=^!HI
zgoZ20-fl?=2RxZMJV6Xrep=JN<6IG=Vw?9AXrJ*5!v~5kaPQHK6N4_4fm?SKAq3G|
zK^a9tbi12?-Fp-@ORxbW`uE~G&D3Y$?RO?d$bGCEcjjp1W@R5JHEh7P-J@8xq!=^0
z7A0~rwYQ!n^Zd3|yIM1be2GFGlmcnBN<a-U;Ih?i%?fsojb1G!EQ$&$1x=%tcpi#n
zQd#;iH3-HrErf+~I1Gp{f2iB7pG0*F_aKag4O?D3Ch0m4;v~Ikave&uzGlr62ZWL4
z@3n>{POQG0<rRIWiqJR;3Z;?9Za%&c`YwuK!<-08Ax?w}8!Cljav!NghcgYwNV^hd
zrJ}u1%huTmBxBL{CU{G^jim0mNognMlQQ{|HF^)Sgb9Cfkxwj*b8J+M;p>+oe6<!b
zjMcJ7VDmz#BD@Lb$v8bn(lUe%i;k=(+n%VA`|J372%F<RsUT8~X~B&)8=|wtt9GB?
z*qRXV&aBES$9mBR9IGQp>O|^FBfl<NS)eMyG7e=Osv|~_!3%R+pxOiS9=C6yqF4Rn
zqi*I1(y2YMch--eL2$pqiSe@eM_5W!&Uw~VESX97IfuP48e?Q7Nv_^G>9lHFaJsPp
zT#NM{#1l1KvjS_1VqGgO7lyIG8pla;$nNb}vc5YU4{A%k#kat6emP8NGIXQGb~PV|
zXs)Sg>WIi|ujUh0@&zdf`!ed-Rk|;o6opJ=)eZ{fa{sw7>j;)eCm2-R-e&J%tzH6{
z^_QyYUT`86`j98R*2bmey{us&2<cI{Y7RAj!KV`kcS>6*wMqvJ7mF3R4Ia=QlI`*(
zJMVpTC;zQw()MWJ-n{!b4|@{1-s%?jro-#`a2jA~6QIYOO^3{`;lms))1Rn``Z+g_
z97Q&iMJd+P69pHL>4ru3A>L&H{`KseI!Z{#1I%{RuluhX?LWNJ9ZF?E1Ofoi3HkR{
z`|sW{|BDYdU2AvRzi#|*=80C3wEdgo>%qSBO}jDg9OGQW@zf*`sXrqIZLp>TL`!0C
zSrfyd5m%S-_3kA!)^z9+fw!lQ$Qpgc_;}fNeOkgi^=vf!z|p$w8rqCa*(ChohhN^+
zDt(3Tua~ttN9G+|S&|YTo9l*llkUwx+49FL-e&6VHpNfp)UM?4>D8%Ll||gla&zDX
zou?4Eic4LoOo-GXITV)=<RJUo%J2OWkZ%OpkRa$B6As(W)Z0kWywFUnD~`ne*t+vd
zh3wK%$E-*x|NTyDq3<v4xnrn3)M_yYb+?dp=u%>nbsFsw+;==C5Gjik^5z3mGHS4U
znpnock|Bz~A`xb*NY6`z)lqnUjlcmwdRXlfok7K+wAk5Aa_VXnn)k<vE{-4XHFn%=
zf|V`>i&dDfpzZl0DcV8_z@m_qVE-9$A?pKUt44h3%+M)?7{Fj}Ctp!=8G0rcVV+>K
zADwgF|7qO0?<81*Va-b8Fu59xVs+tJh_czjirY2N)mi;L*BUj;^@@Xn!ru^AOLqxm
z2|IBNdO9N{0t=YXpg9phz@UDZOD}30;+Dhbdc^ad%ZYy1rzi8{pb2$qMlsYD*5
zL)et*rMoB{DCryT4L36vDeom;n$o!rL|rI%4FX{oh8Nnj<s3FTx-xU?(0SSlZ6*S;
z0n@|7kK-lg_q2Le@~bqN5R)fqngo1eD^WBpi#sfsW<op*gSyS%d`UOsYa=(GWD#Hd
zbqH2CB;_Q7?ZdB0&$RQlmZ}zZ*9`1eChPN>-{)y>dL2E}#mzLza(<hRDq4Hp8O|eX
z3R!#0arhljq`*NNeM<D96=t>pOcq|YoXYOukVc5o1qQvx2vFo$x_^8QoP3qPB>i&t
zfTZTgoELF8yxKqO*4wYybbQ)AV^dvEQ=x}EI1OGp%X9nt?P2`AZKdl(s_oEBaiC;t
z*+pE_75113$8^CR8<OT$K<m`uru}-xH(r^|Th&wt%EFWHp+t^Dad6XoC9v#_=-;l4
zpN4B54U6HPsVP{SWujJw!BCR!>vU)&SM@<W-92$|(F-rfw#><Xia|?9j-f{?UUf@b
z2ZsAO*;c5O99&NAg<BW}Wg#rSY|NzD&24>D8dcY`T^ekMEV?kfSgMd@zq4!51QxpV
zkt}s7dKeq%MxE~=09KAz;m0DbhkVRk(_kB(Ef~?$CFGvU5RS{;{7Dfe;eH{LR7^aH
z4#DhjVG^1Auz)=g&7x#`JB@>dc3o@C5G#|BZkcchr?-hDPKJBueAGE6+EbMp7FsxR
zpu6+(PuYO0dM#GC>b_mhJNAkna2(N^&_2}0D+2b*FkK(A+A}~7DTxj#spt%yh1fmJ
z!bPDE4L&tA!75xWN;(;r#9$^{wlct=EFH8>S;@TLsPO#({deTV>FSyDlK}u=lmDIn
zjvQ-!CkJykT}DP-V|!XtbCdsuo#8cQIc%6kIy<OfG%D^UvH281`;CJgG>YN;;cXUn
z6jxZZt!+{gc7KvKFjrU|tw_yr_uSh|4kptc4p-BYtE=IgshzJ|7oXi@qo5$^k$Urb
zo;u!c?;;h)CZ|Vw`+5ZTLL<YIgR_s^=je#y;^=fxH1ZYSi`~gN-%uEs6+5sIB<R5L
zK0SKbI{P1dRya}Y7@se83UC`#P7DFPD0P7o*7lWTxz0dV@)-uUPi5J&@LR|d;$88S
zL{6K$HBe*n1U8);GWhxGoLUEb&IcRa%6p}w8LUm~J3M>-svOo&N>#e-ErRb+nHvUw
zfque#{e8r~v9hx?H90LWK?4N`2@4GmQ4<vx85<oR0eyLUadUNd5z;m&pz50P>PlNP
zs{oePKE$z=mY0~Bnwy-Ro*%%ay}7%wv$eOOqot>*tF5nr10)Z3V`pn`!^hW^mzkTL
zpZ@*%`|<PK#>dFX%FE2n&d<=^SPW_$AdU5mubH@0y7gyp3#blavE6ag$rZF0QN{a>
z0&oikk#Bq3q5`wyiwJq~DvRWgvW|rOrdX4}b%*C-Vs*iqPctR&b+w&T1R&1$kcV)h
zbrP4r{*Z`r#$}>+ocECl%sQ9u>jynzx0;PMt_Yd@a*O;OkBSAoGROuH#|@k*c|U<v
z#GKR5Nuj!n<rjV&L66~+jAxrYNw~rNla1-0H&>|k2pVTiq4O@k<o%S7?0T<qGY?X?
z!5x&FM2A5{x5Iv|=ykaoq=Iv^^7UsuV-P?tb!(*SeBS`KlcooW!{Qf;hGQ?&E-^yc
zc2pmCdR=%k-+R)#52I?X41r=;ch4R!P?ho(YqEh0PlHspkT0rkXM3MI&Xpa!x<K`i
zx++lK;yRy0Z{t{FVPQ9%HZ1ySDHcS*3iEC}(c^=9G?~ku&Km&}jvmoBo6kt`H{*$E
zHxkRm8__4wn`sZ2UFu50xC$=<3=%owBxJVU9!ab}@dGEW1B-x{)50R)D+XHi5(*{;
z=Kk$czNmQ4C&J#YUjf3!b}g^{784blZz|kXqW6A1PuH~`J62rlk^%#p963AYQ*ANf
zhsHrO#nYATAb(@&p#0)gm0K8q?GL4Z@<pBmp3;>Lt?Z&~nFCfHZO-yPMx2|AMS9B<
zM=0q|n^}xkV3`eAubP<;VCebYI1pWYMR^%K$X^`L8$mTrgkuI37sQ3XBKrJZo!GlX
zA$WlT^oUB0^Y_Fk!QlC|bE_xwhMaw>vCYDXEx5F5VFrjDXCb*OylkOetSE<psPR+<
z6)miq+Iqmglbp+>-3e7z>WPWRlIvF-;6-vABCDH`&*`c`4Dqb%D?fF&8ea`wJ<?s`
z1LKw<Z-KjZp0ZkK+MN>1DO7-Ee^*ra?t?0Me^jZGd!iA<|2ATssR7f-$0gEa*I
z^uaLa;HAb+ZP_pf*tMiwW|nM8{R1VZ_3V_%rhj^%!LBvNnyIs}4c_{PTdom<tu7%r
z*}r^vf?O(6BNAQbE}+(~nL=EDnEG`CPu?>2d=*>ir~1qP-Xjn%2V)W<;6(Y++kN&q
zER4-Gvy#eKE(txf`ggJGH}Ne+lhsl^@pb2ICz#yb<q24?&+g>N9kBH%sazADkV@6M
zLHT4I{Pnj_9lwtK@7|^HTxd?D?~LkF=PdG7D11g+VioQj9@@T8xb7T<8lWiAhyh$H
z(@Qvl9#areE1y)gxx>QIn-1YBSL0k;OP#X(L>*w!PlWwRf>m!*gRJuG7zKm4j{wOX
zPA<Ghu*?Wb8H(*gOeyMG17<%OdrW*?&4jNDAp`;7ZPsp=MNHiKW3uVBacPR6q_-i)
zXRDOE%w~uXlq*4Te({lGGU+S>e3>grXYTbS(Fgh;W&g1tlt)}OL799#pr?}T^Ix<s
zw);^5xO2Rlc7H@egEGX);pg_$h_$<ZF!*8#y}y;esWKn%8Rm_iO$8ozakBWlRV>y>
zP-V|e**}gX-Q=GN3e-&k!>B*<1#Nlgi(fa_#hYq4ke838V{x`*8e!xASj~6Hxj!JE
z6;Gl?qGE%u5~OP*DvHk=a^~ujNqP|$q>U5^-njI`kYqj6IxiG_YX<<`84eEJw^4_V
zwhjpciGNR}p}Euelkf{mMaZ?9=0dZOL|9fYjT0h`LvYT9!_1(YP~a9lV*N>R#^`U1
zQP{`fn9a<ELs7rOC|r|h;N+%G%o@anPX#%3kV^(nMASp^3#|cF>c&(EkRRZGkNDaa
zwq&@O3KxD!BT}))iYMk+zZg?}lKMi802k*ISQB5cg@FmG0$VOJ-HrgUUrxTyEOjV1
zwc`8JppuQ0V`9;n_enBC+nCHC4SP(b)UYO}`SZIlfTvwy(BPp|1|=eXCc1ww;oFhC
zxg?qmzeWdRoo%hg;gHC;#Ctqu<a9W<$NQHPYqef}@KpP1{gEEuk9J|ZZxa`0KZ~Y8
zmZ;DYPsCP+Q++S{WDYWIS6rdrMU%{lqp5$0wPK^A3BXisB8yo2<>VwYd({$xbKO8+
z$Y6m;4TFoCWUily_jr6A8X??9($aPsI%SnxuTeyQsQF3r2Czl7(+TLw1lM<7+bT#T
z4=r(@K#gh5vJh!#OF+Lgn64PgnChK@Xg7+_rleh|(yv*!rCpS|3siNCj>85bvM|{D
zANttY7j=oOXP?`-Vuk+5w6i4p&+snbuKaZ4Yj!ZxJw!ZOKA-GXo`TC)`A&6BG4b1X
zpc9XKnc7$t#WH8#lO%1*N*ko)y<BPyXoB?+@)lNf`-AM@bfe5N=`8{fel%aLr*`sp
z-NLmP)sx?u!TPk09ZNwo47aoyX-~9UNv(XOjZeOMa&z^HvpkWtyjuGxOLi`LySg{>
zC_2@VKy5m-){Ps^E$2qek?rlGO0Su|WhukL8DmQgAjLN~;iI4#?bs(>Pjy~gPYf&j
znU}9W*U<?Zn%Lw0Z0=N{+A(~|zYklYIrru56mHs<SjITY5gGi14s9MnJ1oo5I&w$-
z9ke`2`RH%I^UIU0-#wpocg22O@NhUjP|`ZJ5w>CQe2}fvp?p{Q#j|SB=})*i?qmF=
zdtvz`P<XzdTJd;k7MN{R<yXB~>JRXi7bS(Lt_8i4x$T}l8EobYCGsGIw&)DP)QIXb
zyT93qE`TnDDhVa`X>dNt#9I~#_hTA6cTB#09xd0>a_ubWN(p_P64W2m&*Ic`v8S!j
zOOxm1iVEbSGWe0I(PrOL(F1?XH5%<;GBAB2(bzU(cgb>h|CXLPy(Xtp_ue-xt3ZyF
z<dW(tQM@;iNqW@32u;Pt5yuh@^ilmHRVavq9yuC+>b<`(JNcD9<mncaEm|0ME;?r<
z`VKos&b|wUdEdH%x-FZPUv}pArF)8EJ{jT{6X?S2AWd3!QR}^0KF7G<0Xr60L{j^#
zf^~F!DxSK>^7ds4l9dQ!{+3HvEw*ND$0gPkUG&A~&oaLHW(W4Ho|gM#+FlV;SEUag
zc&1N^-}LS%spK~{pd^l!xa&Xi_Y`+x=PjEJ>&~`&)}OOi^M>$858F|5{U(}!im<hC
zcY~;>0^^a$OkV;=F-Mno6^ZFj@^v})aH(w%$Y}PC%5T@T{7eFM5#0$|;$FU8)2XZd
zZsc-)a1YGY@(!HxOm68M9|$CW@{E@WpsaZ-umuvf{ir5#L6rK{zxw3_c7<Z~;xYML
zDgb7%sZ43UPuV)S1qod>2>lia2yDWf48zjo@`j|t2;^WNx98Q#o;LaSUa`?{P6gb#
zW|nWiK1z9%7m9uBLc9?d@<A^mlRPh`E4ig#M>GGBmRrMq;RcOBwE$pYk4eybf*I5p
zH#LiAl@Z~&69u>r?kEPUy1b{u3tM#r*A@qZ1FcIh0w-7dw__u=?`pw&NCV80A|~B*
zI18?(j!c$_wodg&r;1`o#l}}T8zts3wCDZCqr2``oVP%>Joc%fz^q(gY+T@7o<%|0
zl+}h^6rv#~jZxs!V_KwsZL2S8$C?JxUzsQFWT1IO4D&b3<mKn0mzdhJ!3$GlHa=lK
z9_+;}q_D)4&<C_U_>35(n#0l5$Bicg;iQShM6*Njo<+38OpT*lb(?XNw{q-3%z9p;
zbC@`YE*2=r*k_^tX;HTWhoGban;IW!v+`G3Hmfu~#FAXMe5;-ys#3b!YRNqJt~vPL
zE*#U*v@C5%zMp#nMlMk#TJ;I#jWjw)mK^v!{HeY%womevcpu~YJA!qIoM@Vs_nJvM
z<odi-_c5j9`MIS&jYG3|^;b?ezG?1cGAlsFAn9J01mUXwQhu(?RGY)6VYFmo?N%as
z4H4C+RXR3~sf41vx|WrV;`R&oQgClg`yV94pT1+t`IL+2BUPf!flS&8Bk|g?Yhlnh
z%ZJ6=8>E1a`hkbtJ6Pndt;DJxBv$t2DGq@}#x5f3DqXC&!2&d6WlwddV_ov#<WFXW
z^-73NH}m#b9%F^=cw<>f@!lCbGpBi^7xOi7K$P}hNs;}E0qF}!U6TvgiA*eN%*sOk
z{?s+sZwvy!I^;@Hrh@aa-s=kNDhB)Gam?~HxT%N&;SpeZ<*C|iJ)TcAcdP0jXNz5Y
zWjGu;0Jp208fj3q+L>8Ata?uB1NG6K{(3u_6S}4j{+qWw6{RQA`TXv;hsF`aki9=%
zFA^qsq@U^5IxCj5PnOG{Fo~4sOZj+kp(X|sG~)LCQ6T+aH#Go6K!Na|pt$k3!KZ_t
zLDpy12RVl%_H1aFR-D$YB;z(F_hYAXW})_fC?i^5B#l_~>uAvEU@EKZlnLfkH|S1+
zeGhbDKrfTN?5WJVsD1Jynevs})R6VfGL5Hf^e1v?%QPr+)h~2(H=;ESV5oNrrd<6$
zJCr5Pw%#v9Ff~n(GzTYH$tJ(7CsTZn^^#MAZy$kg0pzd1z&-f`J0Cb3phUAFHn+Ph
zsp5ZpDWMsNl7~Bzi+7TbuaaLr#a+XbQFKh$i}pAX?E-1r#<91uAVUWG$3*NlaoY?L
zqeLQ>3pJNdwOQiSSs-e$bgHnrE3tYjBRYN=4vbtpg)AA1Y8@%g(g~{E5LhnF!D`#F
zu^4S)cVt3t@787@m9sPWTMhI_5|Nl)Tu|L!WKLbUXrJ{PJRfSapuw)hi<NV_JZE#i
zWn~{NbcUFfpA7RH`FDg!HN7OuqRt4M!@p2=kwWyG$!2_JurWJF&9fYNINw5AQiM`A
zNA|~&%W(>_fX#E_&3|xRXrSeK<P(~)b|I-LP10!a>M9PBZxBoaqK;LhPFtLfR~?Qf
zdGj~0%^|T)>9hDOS}t(|`2LZ#%jF!-r}%yGLH0h<-pQ%FMMjfLW+`6>S1>Qrv;wd<
z-Y;)0u4c?zw4bqjRK5zKX7RvN=7J*4a^N>^$2`+x{_tR)BHH(bFx~mt^Q(cSYh=15
zXjxexPFIo+2{kWuhaL~a`C4zXGY}1j`t4hrrLBdKtfL~T@B}rQp=#G(TWS6{XG1FA
zovg>Wzoi5LCh#}$4v_@{^BjepHyw^nzx<<Kq?g0o)^iqkW_1Szv^<QBx}jAL2(!cj
zL2-k|=F{G1@{)J*nAt#!PB3c&buT@Kn4aq7fx;y-f6!yki(9#<a#J=$;VLicb{kaL
zE}q2?b~H(>O=mZM%NU!EF`-F8zuWrtECQ~W-DEO^!(9z7750xreIxS*Y-oyqVo5kf
z$sx+t{dno2OYb3eo@HV;^6~a~j`pnhrogoM^%XE{_pO%@$O-bL!9z7!(<NHvMatZ5
z*t7YXn#F;zt97Gm8H33qo=d{WQW*fkqOFEnd^Hg~?yR{7iFZE!6=$)b#}Uf3Y~oWE
zJ3>^19O{P4*I*8b{2JGH4HG{TY}>P}QYUZ+U2dJMep$8!h7M%e;MwyNkVPOWxK4fA
z{*$+I(`93&MT1IEDWU~e9-;_9Sc>f>EFj}DTyY}o__QdgVF;mlQ?<J?uEK}4+TeHc
z-VfwvOY^4yy>({zEr5>!w)7x?a5wS0{vLP(onmdVots#)S)CyUXoa93UWX?t_$O*7
zhlpnd64)=e51|n7(bsbFVbLGLtI5OJuY$z&tz}5nD>^d4ZxrGgegdCO*g}-h#rZ+9
zpzrD+>Cm%zg@SmR;GA=ex2jtR=8{G(WXup8rFhxaF}#9h>>zx&{a6@e>eeG%7`k~W
zCq5YPkv^d~!yXSgT)Wk!>_MhtC4*u}&5fGmGJS^wNU~3cm%{s`E1!wAaPy}%nH6Dx
zj)?s*PWnpLXTJ?&vo6J=U5zRoM$?2#vjkzti70`nJASgKkP?oHi{XM$jP|%{m&Aif
z=PX}DB#uQ;NhZd)^H{SBz+m-^HN^gSN|E4ng1)KKHB6g%bF`x<s_nEKTb^uug>Xx;
zvgVy8<B6_@)uXb<$lW4I879EhFS<^S*!U6rI1aj+^zYBTw84xZ{cDQP^WCO9@gc#N
z-4rb`<kvwjzR|Ya1GfZ)w2|G6CbjISwG*sQFxz|5@4@!NiPsOX$L4BDTa*&46n#M6
z^IsCzTv<Z}gOb2Q&DYgtz40D{`Q?<rPeI67#&uuLAUwMp%fed@3GGKly<MWK?F2my
z&VD|f++2X_8n)W{@*3~bp*y-~=l)eV1~4kya4M|fs((adZojpAJ~}&)x;bIgz4@z4
z9B5*F)khrEtPeFFt+Y!D(sjeH$(XfnH*^Qx>vf>jxcD@R-Ly<2bZk{MH2JK|qP4Ln
zbv+O3q^7#>=WR&m@=i#*fkO97&gVtBjkLoJpE*4YnSF)yoWh}-+JSd)4mDEm(v#E(
zKLr1Ds(iIFm&uIy8fR5j_Sv2+-`mEZYx2eDTRde#s$XAGMUtjQcKl3#{DCCuMWk=|
z^(E)K-|C&-Xq^e&%*DD@XPI2OYj3V;&$MMuvU7!{-bz%Vj6tfPv0mT43#o<4oUjHe
z6w=}45_;fT_?2m(;zE8*ENjHeGd$OF+Uk-SsH0`yM?;#CSePjR`>6{r+ofpZ2%N4&
zWrS5ry^1_zL3IUN(`@{46UrCU5EiZ6Y@HfGr*8(|AOI|G>e)6ps4?;QL{$cN?D5p^
z|0SW@IyjSXTOe^c?-yi?e9Z~(-N|&#%$-_B)1l3U%~0#wrPqd%(fw`;`g87Y_-60f
zQ0)OOyi~PHMZ;T`zO8!7=H|0y^HdivjD8Dx9X8Et$IClT$en%iGYHFD!E;s2Z9YNC
z<!#%B{otw+`q@O#`VM`q&viOc{=g6BjsK=^diW_2y`wQOVgB<lfSoM;QEylRZ<;pm
z_|VnpJcL;~|EoDZR(&dlLKKJwjZM6|?&62uNp!7NXlZfSn}g2YT_(sQgKb2ar-XjN
zHpnJ-PfJWgIAbq%Co*^UWM&sv7X>C(XYG310iM%4Ei*W$)JT^qMq55iS7|N=`sk}2
z0Ct7obU<|;mjYZeWHzW0m<g#`<cIEM&N(}j2?y+ZT+}eerFGwWa9333TgHX_$(Cqj
z4>K?RAn|<SV!fpLe-U;LLBc3ebe@@iY}>YN+qP}nwr$(CZQHiZyezUvs*)_a7hQMV
z)qT!)&rP7MpwWm>cuA)r7^{IDN(JwnRh9SieW9=R5n!{OKD$4M^;iWH&Ghk&7h%ht
z-3`W)?)~potiVASm173J4tydle)@tuw%f0{mJ!#c<TD#X&Ur=;Wh=R)3GD{uG2WZf
zClmx1gFc@aJ!lksa-`eeT>U<*ysZcSFzvMHr;vWutc^qE0UV%V445&gXsyP7vlyPk
zKK347rehZO#|G*57k@*z9X*Llt43C@R=c`-W*2yFkL72aiV1_$gnN&l<x@yX<7`@E
zzEMeg{kBIweRx|yg$?>$U<r?bMF4M-WG)6RE=eR+()e~diO@6-g9`UjFYiSDNr(JO
z0f;f|@4rA9L&E?wc)^+>$GO?b)v2p2ehdPwy4E@lr~DT+xUZ1Ic<{k6G7^V+e&XPi
zLi2J9?X=ay6O{(0iu5smAaz{&yK>z}{(b5kCE7~*SG9zI!6o_!+8=*z4Evc_W1>es
zEFlmUgIi8B8TXM#E=^O5Vfpl=huq78_lp)XqX+u!$A93+a{mVt!X*ffk(@B&#|oCn
z9{mdjSr^+%_$!CZifJ{}ysMXI3wu)0-1gJc_hE-Js$YMv{s$GZ7MR;drw2ufxUK_5
zkYb<%=kuaRZmrS#t4EIgaEg#7-G;yH8FXv|`r%AWmi#=HCdWsM0l~|1)B7XZw91V{
zG@YA_F4ft$g{Ft#DT^s4RYHUzG1u9jOpJzWp8FlF-bf^})o4f+;@5~TJeeQmKv{FY
z!e@F>si#24r1A;|-gsP}5t&pGR^w;9QG0D5<;AF~KJw5ZMQUuYv7uhZiSSKNm2A2C
zG4MoHU-eCvb*N(j+UBb0fgp^q$GLZb%&z@QgV3Aw#mn2&D5x!5%uQQpw?J4X;CtXU
zSZAZb1dV=32T>k+Bm&k{s<~@3GSq(3YE?{jGD$@hdo*AX&PwU}{i^TU6`DWjjJ1g|
z`c)L{m_|}-cqXw%Ic{2isQ}gZSoC8?pp%(kY%zmszx6Y>75R#l5G43H&wIB++2(Uc
zv?&`2ZM%#1!wP#c2@Hm+Gj#XT*{OF)kkh3G##IBKT57oRW726D3$w+DQUZSF%pkjL
zigU104}TbMb8HRok@?Qf>CIfvmeI2C+j1S?^bPmLbD{i7P0+4nr`%>BEGU@Jc4p4-
zgg-P#GwPyRZ{FS@#~9(zH8E>l(Qx%L`%gCm#9SkPtHC<MB_nfqzc8;S{OS0qYw;RN
zdIWtWs<KlpFO83xr$pIWdL@|V3EGPY7kDk$=Ug9#RMa=n3MkO`mTJ_}f6K;-Ch$r?
zFLA%;XaDo4>q9dbaUua~I^M0NO>Wxa2}){fYTMNFq-Mchps03lf|qx#{E$N^0Y|;R
z@m#nFzYDyRmgdZ!u0Pzk52aps+ZEfm<ozvjJB8Po*KR4_=74Cf@*Ps=zka%Yyut0k
zDmh}5L;RwN=`^2|MS2?K0ycVvxBq+@7m~!`vl^@2!mSMUfQxcE6Sz-0vJ~OstqQ#@
z<<ph+Qv8e{C3-4NG&wVTbf$k0-~}FBq%_IGI3pK?UU|^3WtR^~yfDBWwb^|G(DX-k
z%fYGHR|iqEJ~(c!kEg#mPG!;?UuYtQbv_2nh0w>p^@W$Ec4PEh>AO<(<;X=-R-#Rm
zKOqefFzSfe5@PG$CdW2`F@FCxq`X&9zZdWn1WuoO7<&kl4Pb56^djHJoAVhbXKxP}
zq|H)JZuE9Yix_F8C1Ld@exLtqs$ej~pOZ{^JR<@Tb)2pLosWNua9J?lXC_fvp!k!_
zhji@TSp-k<GP&GMqCFph=DD)q>1+8|#pKQ~`?MxzD+@E$SJ%xiwk2M(i8Od&i$A-O
z9hu23yaZDSm62+NY@YGGWX%Jy!(<(<iC|N!Gz^P@Q5!Mq;=TK|I7~BpJWAKUjQYM0
z6qlGBcnD_mUL0;XS!8xQQs_hrQ6@TJ3=BfTzl$nl8%Al|J0U}2qKni>p*(H@B~v;;
zBf&GGLasS3+posIc&UVhi}$kJ_YE3O)yfFH%h}wq2RWNLkm?{$*e1NhtKfrp6Jt9z
zU3};04%Y**90WDXZ~Zo*%(&y_^(dr3^Uwf!^r`y6*QOMd%sqKZ)ET2YDJmaT7G+Lg
zxSP<)SPBkBd$K5Th`P0|xy5inKc<1{2=Tu87E499<I<(f^Eg?n^rTtLNNFus;E<AW
zxyRq3$PK*p)5UGl@tGm*;<49QmiONIQFU2iqcEZ)IdVR2R(SnaegS@3>7Wrel^Z1j
zb>cI>@AxbCPZ>!DjLi1K+n$*We{&0o*T~6IQ_%Cr8{F(GEavXnA#8nZL{?M;f6@>o
z3q#M<_E6|l7}9=P70^fVF#B;M`}!j`e<3zH2hXf$K+aI`Ac{9G9gCAwucv2R?2}43
z^r{+(H<6r8drI7ZDdr(4P5`hR!eV@6I9$?(<CFMUD2BB?iQuvau@u@~^=!F?{}q-t
zwo8_V^oovc%3PV$S%UnZVI9wObcI3Pmq=6I@T|qhy)?(tQ4g>r&Z|7hjyswf$G!zm
zS{?yvEHAc0#9x7VYbX1fTJ8RIFDAJd!WjxIee;yRvWB(W&%}T;QM-epcd2KaxaGH!
zdiNyq*~V4eX5gGO()&^jZ&XsqRu<PNwoX<GzlU#T_>TliUfZgrH;xo=Pr8gTn@Wz?
z&YNuW>>%8GNmxwc%1t>q_V74~1Vo&ILS3(SiqQlN7Tk>ed$1o2Jj$cP#XJ4>yV?sp
zKfvk@j<@kN{bPz!$^w*(@h{R4gEbYd;D$`+#Ev(G*S(7bT9xo%%s+vZm&s?aVxsK2
zd%OlDj_E?VvQt!3v{B2fH=~ZLpO4jso}Nv>nR7!VH{Ys&=DA&(c*Nt2KdS;=wm4Ic
z?i#?%;e!7Bcwi<^^KevatoIF-Tz1bB#$mMo?t*Ms47E{usH=smUQel{$Jz7C;0M(u
z+t<AJB~E{p@Wz36P`OJ~=bpEvBih8502Pv(64L_V>L*w2&^JbZz9{oxmzLZKiwt{G
zP1+XJZ5Q_*uMwuT!(HQM@8`=-^^-!ArI*N7SSZ3vuL+${YD6-Zp=~3WgU(b%zFZ)c
zcr43qB%i{L>4mvhHVx%&#A3X;#j*IUK%=%I-ng?5;+n2Km0Qv#T)IgW&9|1(TT_I%
zG!}=NFjXb47W2KTiI>QtobfN8jZvXaB!@TaOJyq0;jh~N5H-uogi@<z8}nfEF!;rb
z6c6whc#OFe_d~rEhC~!1*5dic{IEk(8CQUZ5y;bTSp-87H-6d^|DWlNxl<s7hL3Bf
z)!7JFe<G!wBc{1p_`jV!RTZ9V32)n_G{HnwK`dO_C%%8y4$!pY5c<b>xEaq?A339*
zeZ7{ch2($h+f@`xc*l~ItGK2Nqt=d$SDc|_gZehC%i}D8S3pEi7v0CH8woAN%j(2`
z;?qF=?cVRS=V7FNa3;`=&GEZeKh!2S;x-c%4_XQ;<o5j|?~xk&iGqt@Y4;!@ykJp8
zthrW$Cg^NQ+XQh)iH!D;qz2L>WV~3f%sbhRtHuBM2lyJEC~*Bc=#f<<`6-u~^icV9
zs3WwnO}=yk?H6n$N6Fq60dP$SrS{QVEz+aKm~<gn-kzY;OUx%*scBGuv0VDKWaSHQ
zI|S~mfs_Lp-dxG6l<kDe(~xYQEqcu7q>vln%k!;!4Uxr^snbp`@bHb3y$#FD&vpF~
z(+jRM|1@V_*<oC?P}IR5Aw+T5%JsAMl^c9H&4Gf!C1_<g>f3>4um)MX0(@jfUD;w|
zM_6&#5V4d`W2z6Bn)s*SxsuC%8cHfWnaJ-qUA{T4t~5+`ukNlQ6u$e2U@M~Yp8cN1
zQP3?Ew=<E3w<03DBU>m~c4(uX1`j^S7?X9V3>Z<89gwJ*!7wr7C6|6fR0wJY@AeH*
z9ujCS0z#trX+u?JPYkh~6*1>0Gs%MkI0&Tz<c5OUKobw8Vgv*onsrlW7Z(WY#Shjf
zdb)hGQEr2>Wa)CL;vq;sq^Lx?h$R$*>HZb5VTNGjX8ifmnxR%~X_TJjVG0eMdZs34
z7L~$fNx{&@Szp9dIKYvE%e=NpbYx0lXFz(NR>b3!reU3y+9Uzzx;=Scbrjy#vWnGe
zl+yYf`Arro6HcuaoF-WurJRdoY(Mg<s59)4?l{mQd0uJVluYjwLdT;#mMuRTdZ8dE
zhyZy<z^jH8C<|&B%4=@;=x+RD<x|w(7=qF$*UC&-<DgjESmNYp(&c!<;E1B(I1kBA
z*~)HN>%dCzRhr@D8SIz`!h;tjvSLdt#W_u4NQ(NtgsOj+Z7uT*mE&2?^DU}Xn5<NY
z!MXh2Wj}`by^h9H%mS977}-VS|Jn2#Bi&~^p(~5A4h8;e;-HcHot_Q}w8e70u&Z|O
z?9*1<v8#KUJB#^)91RW~H*xp%a!@lrtSq`oz)eY@&BvnTDH9U7A(&P|$HQKfd4MY+
zd%M!n5&z&5cJocl=#==^D=kRSEi<C$!ZC>zR1`J%o|h%3iL6&#Y}6Wvw-nUU9aQFv
z!sCSslJ~%7&A|Ri+PauU>+}?b)y3Y*rmVFk?zVYv*5SZgd7Pw{o&b(#&#U`V8XeY8
z=(aRYjB`)MvlrC!ov=3wN`#zy^t#Kq^GBx<+-*^qk}{zp75w%DUUz2u+Gt`{YQl$B
zIG%J9WG7PHw?Q$f5plk*Gf5h%L}Ixuy3~g%Jpya}2wXKT0$D(LHZ&lfkhc6-K&hy3
zF7wp*q4+CaJJ}WPM?FPEM``rQ@7G$?=joF+DSnSCE99=010XVSQsC6e5bzH-z$@OX
zz&Y8wHjQ7kFN)5kR5#V*TO%{8nlcz3h3gK+&?=zVRxSTNQ4eCP2Fbq}Sin938QF_j
zoBYd~O%GyE`mZ!pkuC)qfF`fTecL5QNQLfR8MShZ>bWP(aP7HqjT!MiaeM_;7Ht7;
z#80uDV>_-}*B@R#6;WJ)H4ogFHuI{@0Wr;WNRRfUOC*yCiPKJ=7{ycV@q%6GzP>}G
zK+qppAty6)^w<-K%m5ZkkbiqzCb2>=a@(dz#Th9`7wK*ZId+ZZG1vtxMMiTl^yq|Q
zL_xt4ti&n<L)B}YllLVKIW?A?!VO0QLO64&N7gY2cT1b;#VyM`liT~rGqnfO)QSqQ
zDlkbG?Ut%T`hKbs5=YE?$32fw0be_~2f-|XVtPz(BeF5NCLd7*7y5o&bDX^pdVI@>
zQS^img^}-)5Ll711d}Pl;@fhgku<Mm^%_Mcy!TER<K?`^GS1p&LO%P*y-o7niihg1
zO?RtRZp)osYxXzstQKfyz-Nn($;Pbk2F>$EjrWF4<HjxgHLT=y?8}vU6V|#Rw(Jwf
zy%%S$i3>a)NBBGz4GyQcImg&Ar|y}H!keq2k*gvhr}<p=Gi;WvStr_1NBUFe&ZkSg
zscSt!C;OcCHmo+Td57C@$NO^!sCP$jV~23uw!zxco0@vz|Af-Eu5)`O$pHYW|6Az)
z7bxxjN2JyKPa@5~jnuvzuta{0LfIa&xp_p=f<m{r1SC)^U>_N-7J=A3kSiGYEq?!2
zK6@W_Aj<0X_bw-ABV%Wb#|d|q%_+ApEU&vTyFC42A0`#c*4QprkLjnG&CQj`l^MxQ
zt%2F4+3mA#yw=p#*1}SBRPI&pDQ_<S4;zBGaThp|10y1tpD<zEZu|SMolOE@`?*EF
z&CoaJ+!Qa@co^pIKjU~9dBb{@>mH7MYqkUJ#`7i-a|s9eJ%f<538%|?cnS0=I|b4u
zk_=MYtCa`yRBAf~BoTC#iu?2W-pNayZso9IXGt?JU<WEO&yQbUo*o@2BqTUAWQd5c
zsL;sp2!8xMc)0jDdAa#Hdb;{LTU!|yGf7WgU0GXEQ&m?%LnWqW;K1tY5(_gcQ%iGe
zlZ&&f)64Vg6AbhZ7A7t_Hbzbwv9#38^z0N3H7!+5b#0X`JWFeftIO-_4;D5qR!(+q
zmX5ZrR>GL=u8};sm<>dc_jKiodcr(_+r1*WT0V0FbrRp2Wk*AD@-kfi4|A|kJ#`0V
z=m)82O(k_H2$}IlR+W10Mhek|P}VJ_2y~GbY?r4{9PGCwKB}IO$?`DN)K3oHtzRX7
z#qKXrZ9cAAd9m;t;ptFYdnlBO&KrK<!6v}HDzbrNAzGS>AI+}KB5bDaHnY^3cn9au
z>5D_rKxIfHgljXm;)(C;m~%$IPkBz>&hS2Pz_DX1F44Cdh}k?E>Ldz>YYZ3KCBy=(
zRSYRO;AnUFw{<O*_PX5sQhZ`<q7as2^G<7X#Om>n1)UFNmY^}4!@0r?g3X#N7YV}V
zL|j($dgEMCJBcTlv}M)9lr&JOs$lZU+oYfb6X8I|$yb{2OU&%JsjGhka$T)K{H@v(
zoW7Ie9%Nj$WfoH0fyBCc#{AF#FA?ZM31My^e=8emHwxRCR8=A6&gC19X|wD*4pIbq
zKyZwV8h`fo#f*LdtqdbTY14U1en7>%G=aF_$&FcwQbZPbk4$6;-9qi$4&Cj??TGx-
z(-U?aN^FGM?m~HV#hrok+3}F8i%Ira?uB+qes~D@$sUV6#kX0K358N7Xw8Rl|A9~H
z)R`$M=4IYrxS<7_3NubxI2{l!Y|hMLTeLQwi;{Q3Xw~Oms+l8L#BA(n&v1INrBP#z
zDT+H{B82b~kQ}rvYzXD$_}c1)DkG%j>GU2Yz7L6QdUBqd0UOotqwmq&T}@|}hO$+Q
zg*GE4eTuHbx282z2#8jRG5qhqyOs4y)oSIdc6s#!k_rKc1J;bY@XWR4p`phxOse;o
zYuBuqYg#s56QkXW`|T-QpS}Zl0j(+}jo*-zeSexM`DUsLjvZ?d*K`sH7bZJHi4Nb@
z2dfS{n~(<A$0*5lCG4yaJE$bLaE75tV)Nt@J$5(OPYUp9<Y=8Ww-~E8T^%H*GH0&o
zi=|b~m7=5BhWayGw~WRW94;gUDe{c%4a@DmwN9Dx8EYHnEr;zH?B(pEy0qM0>8DbW
zxPwphi=k*Cnjc7Lb~AqHCpr+|iD|k+qT(Fb^dcC^`&Vu;XI3Ek$AMJC#JU{QE!JA}
zZdnGceOG15j510=?*k!VL=4)aXW>&V4!76Ty8Hwik<$+7UE4aAH}4?~kG`vs*KlVw
zpvmRUlrED{57Tze42IVA;nDEsY6(j~NDe*}Zr7qZ=BQH}hQVbbE8FSBRcup#an)-?
z)J4)$|F8&_CJwFbC=sW1O219mo`+I}&($oDir@P)@6~VREw2Rq9g=hZE=%u@3Wd6n
z^~u^Zd(N?mLiqeU?(_ToMt&vvZQd`B{hr#9&Of*3Ahe*iTT`Yb%kRWTb1KlnnvB(Y
zO%fZKx8>be-oUMJLk|nLV40>+8F9KpV_5A%eZ+<+ql@H2?X^?_lqk}UH7h;!xxt_i
z4>O|RSWVoWqZXW2)4shSf=>k;m{p2=gW!&*1(%B83zLSO_`>10rauUlI++-+P)ffF
z+p@{0O9-$<joN~{IF)x*awyDA66Bq`!K$_4%SXvmCk=&mD7(uXqT4tJrXUB8zO(h*
zGuP8Rk)Y)}2gsW?x8?TdF3%O(IZCG&OuRH=XkZ83@VJ#kJ{m_JcZ1&p!Q+ThHG{?P
z#z)E<`6Q!5fyYipN$>8eJruY9B9lTt+e_K^1=z)TZbW=IFEH;p&|F=5gndfoF`@N2
zrOT8jl1lGzfurzB`&{Re4ipK0U=}#0jnAi&kUGBB29D^XazJbF>zI*q+|y@j0#z3;
zaRv8boq`7!CQ&7aB7%ps7kHa1wchM6KL{?FU{1M&Er^pY$mIk;iej&ECs6nV{ouyF
z1u0?-onz_!d818T-pmum6nYV4c=LrUs;M8!0m>8Wn09$y^<LD@;dATSN{dafUGIHw
z6+=`e4Y12{6{P?CPe?XEl!Ti7B!ujExBi*(b1kLkpOGJA`xqRakPXj7tU5c^76)r>
zY5yMZmCP*pF03%xq&Y>sX7RX1riE8gg7r<sc9H~O_$3f1HxKsl-Q==PXz8M)HF<c^
zSXsgXtDSd~15e1KDJSGcCX=2G-7IXz6iKSIOEPJ$*<1FEIjWRYjJo>us!XG6b_ASl
zT5~t2C$$w_SgDn}3b1*cmBx-;;tTu!BW%L$d4;fLG+E0YB)yH4U!m_;c#QA29u|tN
z$&06XAiJ3TtKy`n)IdHa8$(Zk%3V#GdkiXjL}lfDVB<-^a^6c(FHUr`t6-;u2x7t9
zS<|tqe54KW=wlv@HPE8X`US4vwZb{pJ{NELIdbW9ZRJo~PQ1(9^}i}S$1pDZI=ES+
zZ`rk5SJ=g6vDdgqn*=_*3gdB<b3JluO-)OVZwol}UZBO{<b?{nfRW2e8WNz4R5fh-
zL$@yF+<+Hl;*F<#xn(Z<lm9heh`V84WsXwtXs_MRU<kIZ9<PwzlXrYYU!~?ifB)W&
zWWD!3f00tM<rpo=dw*I$bT<hInJk@M{y=Z-YaFk!TiQSL?oMc}1TJhe8T4jYsPO!b
zXtJMD1LyNN`7HpV=zvk_N0M#8t88UzwFzq~HAO&PN6if9V^FHD$`d9Ig>+lTfi-*G
zCrn)Zl(UuAp3Z$$Tg!XC`P9~)PS_b^RV=>+k#CCMk?&_+db<lCp+&<L*4OG#eiQQ5
zh0Q`!Ws7*e8{(l$TR#)d(yRK7lI_$!l|{0-8@Lubq*DtfwDdet`XiCmsf}D@b9F<&
zMxv!%<4wAaTGJ}UHD=VS*~{Yk=MIT|DyeO=eTs-DSb;n8c!5SPWN)<cLu+1BB|~(4
zVJ=lDrLee?x*Rb!?A~W3$<aG6jmy{5`c&5VX?cd01*|XeQv4hE(kF??ho|YR_<d)I
zR;jAxrgYit)9pIP-`L9AJ>BzSMv1ZUHidGaGv>NuVOyEB`9U`#tD$%GRD`wd3A`dJ
zssNfLVx^nY7+4#@(Dbz&NHFt?05&8mCYFfmvJ_D4v}`nF<eF?;B^7jbxmYHY(Ne{G
z7rKCO(5ZA0D)+Y<*?shJiuy^g1}0$<)}=Xd#_6DIRPqKFcfHZ-Cd=#62CjPtH)k_7
z^_9phCc!&a&be5db@dx@M7g-sKf^XZllHj0lRFj2Jr{JneD{?(M<h8Hw%wae&S&Yy
zM(U4u*RJPZ`X{46*XYughJ;U>{D(N~26E^PyWpSST~~RNm;38M1<85z{CSK@j*3UV
zYw=gjls`9f$LlkXnKl)lIwsljhXeA3ww){HJWzlWfS5c0p*`^Mtc&h>Mrdr`EpAW7
zvkr$L58}`t!A|K21_97t27h0WnwQ@-iZxjVs&41VpC82y><{w_<S#x>MvD}XCo&M7
zEN63+V?o`I`7B59kSh-|#>XEc6{T-rzR%i2CP*L;2MHA(rjrGxLKI}|FYrhVpf1X6
z9*bMraOiac`EdH^rsqa$Xg}`y76A|pY5_7)2Ue1=A3`{9s31=ia<ykE#|!!fsXSiS
z8b1o5KBZ~CB&=Q_sLqA&4S*;rhoHZL%1VCu?Z&g6M#u~fH4_EaB{aCfDKs@U^tL*9
zx@wSzGI+K#=ox=7>|RG>+xOuz&aC!+UlBz`tQ^gYSf|g^gL{67n<02d!E)dTcgzp^
z)J1T*6X%^63fVRt0bLQRh!Am@Wq*gdqJJ6bse&{P8hM%@r|O3{!+<dZ6N4)0zh?lA
zG9SB98i!ExVCZl0U#OqAp)-O}w2nhm{9<g*aiq$+eM&>L3aXPL@x$;Vqoug)=r5v^
zs!{ZhK*@s=m#h(yWEJRj1aL2T#8Or?3wzX5O)LUd3*j37x<wZthEa3HvX|}UdQiOE
zHoPAxPYpj`$t}R%Ks=y%aal={5|B)4l!$OGL|&)B6Iy=e!=3r;yE=n=eMwzg>&_mz
z&U@&sZ>d5!dK^FwgfbIB8Uqjnq!fFRO~OwO%vbVdasOpyvV`q5nB=hLXn_F)bV<Kf
zM_-iDIngX)4?CheACaYHVW4GVAX%b!9E{)sDFwdLprm1dgQBb;V=HM#8e}S56P7sr
z_f(Q%b-Lr3TV#caBMT?UN(y5UjznAhGmybPmFcqxlSp`Sm6){n#-i*xhm_A$dTYM9
ztGlVgeqw8CyeVe#A!mlGOv<cpYU50<s0clpE{maf^Hqn<L0<x`OX@2C($bvy=-ZUL
zWctg%*6}lIKFxT51$WUkGm<Kd;ra7F#Zlv;czE;~BwgU_2dGbpKyMGq3LMpH04;yh
zz02pXOWdDks`EDU(v}YD?}EhN2CLd_CpR}bSx|ekH9Q{eSHPY(x4^4F5bY!?qbDKH
zVw2N7H#w9{MnOktV<e)NhydHeSwU5ZrX;|0nB<cUqKI29*=>VIRgVx&z&i-?K6trZ
zcRi|Iuz>DL3lEPa)N{3Y?xbOJ$VurBck_63&!pkl3mljNH!(INg+beN;<$2W!ps|F
zBjqRZGMt0?^HC89-XT#^!$%%^bU;DhADur28gousaI#B8gOjwvq^uhOE&uxRUMxuy
zh=*7>+wLpg$f);QU3M)U_8WzF-<`c(9yjTMGA`or-5&FoVt!tBy(B<S4@~cY{bD#6
zRt0ii`Nyp>f!XkT^r%1)Hv3V`<{l=I7yuQZ<n1C^sxGDLu#oE!v`+dI%NjB5eZq^!
zs5efjCsxICWGUEfDSp&>G(;2URD{7za}vX0q@6`oL2%t|rCKcAN%-V|mpV+k2GCG$
zXQ+zm*dKZY&suqcDQ()RW6A|3UfD>xctg=3xyjh@kVnLnfAfkAx8RoEB-&($P`%bl
z&E3IOl7GOZ?=ZbU<0_rxWPEfAd(<n#UCDWaeqn+BSt$1`@~4^!+h692h7}fY!)k4p
zXuM#?3P2^Xp)bngimIXxD!=P<dr4u^@Pv3&%kM6Qfz<g34=WQACau$}p~KM@pVQSW
z*1Hlatt{kgNV#qY5d%l;WcJi$?FydW8_8lJF19L(aI6q}iZN{$<*7b#R>xJgqg}1O
zUn{p7U+lfA7La}pfp>Y17~iO@!Z_@OT55-?Z}DY@o=l~|ZLMO5YIsgPyPi7c-Z@0A
zwmy`R<yx$M3V)i_xN?g%X|5G~+tE8|<8*U2?fqvu62i6*1Fq><93z-Ncd81uB6xm7
zd5nLAS+>`LEQ)%p^5kqNnk)e=SWib;>Aaqe<ZQU~Y-v)=d<(Xx)csC!Y!9SH-^7-Q
z6qy3t8q<^d3GwC)UFHK`zmO6hif@`)?pZVt8`fqUhr^|~Z;t;;QX?Z&<K3^8;yQY8
zYx<D1NXmLj+BEUemm3tfaP+m>6`y*%1RlD5Q4MZp4s9lIK_0Mfp0!kH+g&wBVAJTA
zW2BlXq(X&kVCowEbj6ElrK+UuazoYJ@frpeK#wes@OoD+a<>&Cukthb?XumbsZfRu
z7y#2g_UL?+#6ff_CJWfAwVs5hstZ7R(g~?fOXn~>_&TB_R9SS6MxJ>}1}9Tmq<PBR
z4g&UooVxo7)+GyNHyG74w8&QJn<M_P&J%=BV4Y?F_+H~|;hsYBmPCNLTENznWnhbg
zl?u^Lb%(c>rv7S}){$N_JC9>z_C9&4#m%K|Rrj=Qe#+)=olUhT!rCV+*!}A^N%n-w
z%8q|kPZD+g&Q<?V{aQ9OtKjuy3=t2t<V><1k3ULQ?4|@|uk%HH<5+tur8oi$Ytt-A
zotH;j3^)a8`7DA1WO=K#Y${L0#`f?pFF~*8V>&B`E+*5ehfEC+?$jI9PcCnE3D~$%
zg?YXsjJMzluYo;1RHVgNh^%m52`T`C_O`d?J!<G!K|c}`>e@0(YDGKLN2NW&{KD2U
zz2Y)Tqfhq7eBnp0&AoBd$5KefK3+!642*7>VQ^iJVwsLq)sC9I*@M=QfKMPiwSN4J
zknXD@qR3Jk?ZypX$Pjju9w?F`T#_c3k}A}aE~<m2B?LKPFgpGb(1rL{5Ft;)N7jOq
zR4bVzDw%BUDBh7ZDV5s0D77#ty-+B1P%6zNF4cT4-Bc^7Z1FXyDfKWd{irPkRWIQr
zG7)_;8C4tWF!6broBpQ+nbw)Y*O`ryn5Dg#F;Fn!QJI}ynYNjlHtEjQHqQP$<?52H
z{1DsD<(5w8EKTD~PwOm6<DmR<Q)G9U(DN;^iAiSkLFFw}MUgUP`rTU_;Ctt8>L1`;
zb-!$U7kz@DZd!C+g<Rc(EWABcgGOb~nQkbdz3I_?=A*UO{%1&|x%1JqywLc@>qyu8
zAa?bPD>gefIYfAvT|8YcYpqap@BwRVig>(FN8T)c?U#hyjL6NUu2`teUY7dl%26!N
z!mZHs1<_q$aVuoxsG(`a)@3b}>HuukTrbyTuE|~8!b|T1|63s;+g#xTTB@w%V~H}g
zF*Wn4RiiUc^#K9T_YB0ksWe#N<TUZ=wv~B*os9VX>^>F+@P>V`IPm$y=5}ESVeVp(
zY<fsFI;y%H)t($BVsDu9;_3D)+F#P%WNA<|Q3*4{IcPdC<DY)X7#m<~(z8p2w61Nm
zZ7H{{1fesCRCTDNLgmVWsaz^~x$=W)Rc=W7b<INk$r?{yY40t$@HB+?z7qShB)Z9-
zy7nBns&UNQaDIPWy_PkwM22yeI`X{m{aKa%F%^BEjF`Jk?w^!iXdS+;UA{)`xZ6d)
zX?6JPexydwY+ll6GiwymZqu@*Q+!L?Qeoch*{PqIWYyB@!z*f>ZSCTj`Ai;(A8+l-
ztL`gWZ*Jr4I-|DN_x!nY82;=6G%Ou3DjRmI19P2mbN%r7^O4<Z-P^DvzQCI-p(*Lz
zWxU@|@O8cSx7kDI&8zYQuH<w763JunQR_I!8*Tz2%@aauJ*sp1lXP_rUV&ANid`dS
z%M%&-imcH6m5(PpmW(1pp_Wegz|{-BYe1{}+_+oy<D|^hXuxGR4a&3S-uhdLhsSU>
zbWE2I_0=*-$)xSN-m^cYa<OD~GtF&<N#69NWQS7Cn#dtKN5x@*CH=LXrPf1?A>sks
zW(=OBae~XXDA6@upToMtQ^2tGvCFjE*m-|=Q@;CrMyXREnp-o?U50JY0TB{3#Y7lu
z%|`Eyh)lml-X6WqZKNfJu{}=JDpd?sXOz?_LHW%}@528?#M+>(6K@qO;2M)#qD2FB
zq;OvBbL1_Gmni*?&FUqsQfW3t*tt$hf9Jye-CFd109-d@atN|Nn(`~Ef4a6c`g~K;
z!MrMu|3eBH)Abpdds3awjM5z)QIzWgI;ct9yoO5sHTcB}@sX(h3mU|$#`%w7`}Zfj
zke(@YURXneM>4|Q(4-;+l-=`RQHOWne?^2E3IFY=tPKkcC~%0FidZ)_nnGF3j*tJH
z)<I5*j*X6Z-Tw(3WVCyhon1Q6_$3+ztOV!z2>mDWa*LA2%0;%F{RR#4p>ofLj;fto
z?bhy45cwQwXH|r7yIZ7yQOsI<`9>LY>~z#^q0dk2JGPAq%W0-5u#z=4MIRY~_gJ(|
zM>SUW5-WVhkFAf1n(W~L!{?-dIsKY?V7y#~fM>oG^_s<SJa(S{j)Nw@VYyh@#~Ma!
z3I>M6sj)x?3}syHs6-u^z)EHAdawAkQ0+*0*m%XmncDlZ!M%6ha)0bD*K}0oT^sVP
z9eDi^s$dLHts9O_g<K6lPB{zv_F$;UD>X1!lb%}Gm*^V&kbH^BRYuyTuAsAy?3Kw4
zx_H$x$hYZ@SgqQ&j%RJw_n{K6uBNI`!~Ursw6iMM(!4jq_6cRv;pM2-)PZ2k!kU@z
zN|D^);#|}8RMS=W)w1*UXhdO~n*(Iy?V<i0H1+hbp2=mnbB)~Lc0XkFF&ce)&nM+%
zUAX0Ztl=p<nYNku3*fEw?JBY-Pd#VI15gLwLs3gT)pxh|AXBfuew_3)k@+#|3=5$L
z3hM41Xt0{8)yTsodEvctY5JnV!#nuC(gTnah>bY-MS%7M&U-^zCCZbW0v*Z#ozAQW
z`Y|{Tqntj-i(R%nRXbpWPo+O~mOhr3z~)Val5H%@J3MhcYn_@9-vt>m36<=~BlF(R
zR$Jpb&3npze;Bx`3L7$0zVsMLuu{e=Vxu2tNh(i@mtX2G!!=zAV<qD$T^JgoE=3SS
z1Bq=@=c*#;ieyOc9aEpUp3;bm-@4^NHY<vpsU`Pe&4^ghfBcc#I>Ve$yz4VI_<N7m
zSgEzH&(3<a;ap$D8L8Q-2u7h<v;no$0tVJ6IfZ>&GD4=-Znw2~j|6Nvr^zT}nRs{1
zNG+gEwX8_Xyrv{w+#*bmk%DBwu;FX1X8cHR$~|st6>Pkbmo!cmHYE@0u1dU0q4AnE
z*6CalL8~0U_2i2StaYdCv)w@a<ZDw_#R6QmO{LxA#xip+yV<7PrAOW^+F*Tb=DP;?
z@qBJgJpQ1^L-{b5GPj*B-r<*c;FZTV*RZzb-*Mos(C+f4`kax?Fc2Q?dkAW(>u$JW
zJ#s$mMltv|;JT&vHX}jJC-+A*_h(oPp9XoVJG_V=R})0;S%~J0%fDV9m?B8{5&c{%
zyb0*pD<%Y|g^YK;zW&4c9>JYn{&wt3s(OFas~f*P8OZP6UpWX*-8@+cZXmTS$UyLR
zVWitW@ac?huJh|oR`vFg6^7B)yXM(_>EOnG<LThmrLr~W-q|5Z=-rhjE84GZ_iaBD
z%fOcSZEt#ztqkF_QU9!AO(^Z+^vc6qF5N>oi0wOTM;rI0OFpa;d?FgW!<RjY?n*S7
zac<|K7^si-@&n4mfbiN+8HLtt>y|I|^NODfo5SPJ*URJE4D0oHJ48rKCYyP1#e3cU
z7(r6rMZ<mhi5EkmJFh(A>vP?P>v4DwED$RAu{rcbzlU$!`(pXUxh*gU+pB)44*aH%
zntqzVT*5Fk8*6IoBWkCmKtVXdS!}LC01r7~16}~56f_aM-%P7BXXL7QKGscW_;QGJ
zcB#;;2wO?vKEU-^zaTWehBIX~B9j9Lr7HImO58dAgipy&H;0U~Jl;3GRDAcr7>-}b
zm;tF!ShiP=s>-?Z9?Hh}S%}U4i-k5$eEnc6>#+{S^p$*|v<Vg87g)5e%Ycj`>5wQ)
zQuDB*h1(ThK$!nd2WqCy_FJV>cZBcaz<CV?SB#oqHNi<KIIhOBCd1I?@oh&K9YG?m
zIi=u5)cP(KX=i`zg8%DMOVC1P{7U*a=LcRkC++4i>^vg8?U^z$yGgQXvtgG_f$g%r
zHQAD6PnN(&<aSk*?VYub(=prD@%*_xX}x2)2Oj33^5$+rfEyHFh`>BTu8BfiT1orN
z3ll#`Gqh4uy8MImqq)i79JFrcJVXKMnL$*{e_r=EF^zEU^=l;aO(uNd5FopkIc%S-
zn5kl&pk2};0BL7Uqoa*_vQqkvCB^^g(n066T?)~03+#REpaJNIr^HZw$5rF>0i%Wd
zbt7f~X(AVyXd+KaUK$~I-{t+u$tz@J^%z>vKB+$uX!d%DEV5W!+8<~`wY8RoWFv$f
z@xf&7!epu9WI|SXD3uSQSw=?9S?-TBYR5n!%Wzn!dtqi}B8I}rC|W&?8H~2!s1QfJ
zUs*}T44gerpxNCfEZ>3+lqYxZ={d9F0Cf<U&jP_;d8!o5x)dsl$51->aI6dWm1(lW
z*4V>n92C`tKlkH>8MapILPq5^%F~(Dyu7|jhWWkUn|m?Akbp`HJTF(>PajX+)u1jB
zZlvu^3WKCYkU)9AaN-y|>D2w<;m3ep(j3gDe{b418&-)-eO(sW3`J;NXvVEpp2obD
zCN^bw^epP>e&J9E$`=Tvv23Jxbf0&dOu@VKh4YNDA#LeJh)t%QU$q1+zPd2y^A$Cc
z>~tX}X<7ncxIQY+X&58ovijYP+eE5Q$+LXy$Y!SOq2c{>=YOFh^7`7W>wjfPEuToF
zGMR|$zmR%vydbKR<8q1gOK?d^$)}_RgJ>qkA2N3JL6Hh`2QyN%F$m=?aG0~Tc6gF!
zxvRG}$@JUJj)tXHGJ%p{+>DwXnO#;h>RNuyPRall<6AWv)3nNQz@uk7P-V4N+qzTw
zn@2wF%^_Fu>Q_*IdqViHhul8VfQkAZCffvUOCjc`fo8tpJMnmw&T7os4CmjW1`&-*
zP%e^RUpK#FJbf=81mql8Z@f=$99Hl==ig}j+pHhn^f#d9=481~#u*8&wJx7OHXm8E
zas-;nmd3<<6wB217+k0vCs%TPGa$#-HQ06TREf`C>p9&DLEmD-!oXU4V~<+$iketf
ztXS4|UCW~?FtJpJYp8awHnb@#Sl-wT;I5vf??tOh@z)D6@<5NZDGSi6IJ!ZQ9>1_S
zDNmPk*u(Sgz`_CU$PgYE-i>vE7riJ9@haBuGuj??UI4EH44fo^YL8KPEgGl;SmsTt
z1M!ZEBkR+uuEKxfD!7re+lzI3!LaSJ|C-UkvXb7WdH-OEM<((R_>g1;5Jg~_7v|t*
ziN30Sb7J2#o4g9Px}NxRS|;C{@s+GU0Bwi2gca$7&Fq=D-OXDloTko?<X>_D^9<GB
zaA)WG2oG_5!p%6>UBvsY`I`*hpH82lV5-=LqakU{0WT0k2Z@<4?$sD8V7q(eg2R>#
z75jc`wn9qCKogO^YPPRtY;kc`?-S0vXEa|^Ia5{ns~pFUKy5$31^`a+hHU4=VR@Tn
zF5XM$?ZM<7oH|nh15&RF9bkCwedXOl#KGJwzXcN3#98xOrM87y4kzAvrZ8xRrABNG
zMtKfs4j&9_jN1t?sM8L_ywSZ!O+SmkUBW2JeE^X<SiTJ}AjqiDgakmHH-eR(XH+DT
z6${K9O88%n{&?CY{+x^4k4pF%7+o{?av{<q6`Sxd&ZGmT^`<Q<2^fr17|Jf_TFz&s
zMd&4MU|DWuOLBj&qq=pZdiA7JjUP;ch`?chd|hmRr!^dwe)*Y$Ir6YskS-Y|+%!=c
z&I5rt$DCpyqcbHgdHCl5k_i=PE1{r&k$RhkemdA9%`+RY3)T1NTU|5s^ReMG33!Dn
z$d5Ruk9La7ZDtFr8u;B_oQ%;vYVa`*bG6}gC<Q@e$(7b0rL@n0s=r{K=i?MIkS<{C
z?1U?Zb_!mh6QW_X2Nmj*ESIV5rY<vq=`iytHQVWuMl^f{k*FrMswkH#EOJ#me3dd%
z6*oqeC+b%YgRBnqZJKK~DLHIBe3=qb85@R~Jt~>h37jXIjWEfStU(VL|97NIXNQ1O
zau~pP`?Hy_>o^5FvG|{0<($ffdtr{Z{-whmVRoEd7bb_*NZ1h=LX7Y1PZ5Faxw#fp
z%-Uu&euG_qwjDst`EW3><`nQCgo=G2Q*RO}=qV&H@D$ZLH9!WRbLj6>eLx4G02yb8
zEv1E{#3!=77`_MSI5U>TtU~39o>2$EktzU--^UeLtPmI>+#z-xat;7UE~$wn3D^(B
zddQ%xiQ=td=`}!16#53_D)%?C&uS%6ca@K%IDGrKxnkx?oP{xe7Q(W;FwOY(c}mA<
za`+op8bE;iy@9Oc9!*Op%S_AGK8(g?UtRamEpYl&K!?IZFc+s=)!?U`&b#pTxxK{J
zCUOVlrvHn6&WrwBnS5INaqU7f3X@U~m%&Wo{bTp^8y?V;fxrD|H5+v2oWE||FjL}e
ze+8zvrH$Vi?b5V+QO-nsmWO>U-hA6_ujsxs0SKR6XR?qnCS>wU48%9$zRleoS>-XA
z^nExkj5i2mQ7P0SZrBt#zamDFG+`6Rs!-QCpuJ?dD)$kTbo--4=5m%al>$<~rZ_dT
zG9SXo&^eMXHjoOqkH3UnfanIo;IRaHIW@ip?)y#xMHwdMq0}^LFVt0u<aic8g;v4g
z>Jt!W%21~ae!G5Cm&R<jJ>%~49n!wJ?veB4`EA6vXUTb}<Z}$fv$MB3r_wnvv#wZ0
zKM4a9O3=dS35eU-KKkIG`=eI|<BLBBk!nYbTT{f;sbl+cvr7!WO%&g7bisRI!pl7!
z?ZI8mW6mtWKLQC0j(#O#eT*mv*C41#LZJN4L;a}^n9b{_xrOv_Y~e*GH@1Im#Fuu?
z#&b}R7%X{_1Q#BJKuttPU5MF~j(1Pw8U2Jb$WN#{l3%~33a6>22Zgyd$riOK43Vil
zyb-@q!tA_prS+_n0%Z?L^Cpa>C$@$tjGZWsxhQOQBa{bJ?D{BpT2#Gn%H@*Ezl$}?
z&(*-hDwq3IFQt?)w3IRFRnpuUyCf+I63Puflu9+BKuML3dqmo!RqT2MGeS|i7pfe(
z-jP|<6c>Wt_DjzLWufxO7l{m80f$axeW%@ul=!1`scB|*<Pwtg0(KZ`(aDxIDUHM{
z^*YCebLIWhEE-AJdo9`%u~zQyk#)iPP&$Z0MI#<KBw^d`o8SN86~O^~d`!gL*BOhg
z9Z5|mi9#1Kh$8+=SOQ#fzOC6LbA*twNB}q=w-xcp9_hP!a#Kt2ZIY9b1NdcvHOdmg
z>!IpCAZV`zt+2Vo3B7A6r=5wb&Wc;W^K?;TdxVEiYL{{L8gKd>H!Bv*-6TU17k8tW
zv7VQGHJ^L>6w>nJ^&GQso7A63n60jD-vY)z0^&rIL}sGc!x(`OgD1@-poLvn#YMf@
zk0+V!U13L1=%r7`Vn3l&j(D=>yr-~(8iNUkGS8~V&OPUA)H5iXz1%IcKRoiU7lGMu
zGiROXbxwEZO3<4uP$wIj0T9f_hm#zT!uKX}lO}0O{Jti|Qohvom@tx0{0+oKjFR$5
zoHx9~qyd|%aL}>F5eBPM!HgwC&N@>Lp6SD*x3*Hga&l<aQh_L(r{5J2P$XCb`_OjO
zK6Ny4%eo|K+V617waQl`(mRUoyO;w2F&wbyx1dDmoq!V`7?2{0M)anJM*iwct9!Dm
zH9!i4rpe(d5KPA1Xzv}ZFN)nT2Pt~<8t98V*PJ^_#9LQ$hzw;&snnUFt5lefNoDfW
zF({T~f2!Lb2zcvBQ@0A{Rz@5y5$7{fkmy5+HXpYJ&8{e&q*ez`NF#jj1PSh|3R&U*
zdWbK**)T<^hBj?kK6A(N8@+4BS%oLYip6=B^WT^EJJr>$PsXxZOWL52;Br6>jWh3!
zOsXOLsubqabG<8*w<ytkwaqxN)vUFBTtw<9`O$;~tB34J!bH-k_=<<Sm(oxwuz0<r
z(SMy;zB62eH64XT{e*2#nNTn?hW~*6_rSc3>%HASYyf~o3jhG5|D8?zU-`EGub{je
z9;^Q*+$QXOP}#d)s!E!3c5PHuIgL~l3X30x5@IAi9vve8OB6yt0H;UikNf_-T7w3K
zThy-W?ychVsi#3qzqq|{du!J7>^Xk0z!9DN>U|PA8&kb1VcQDcEQ(W=q+7BtXil?9
zE>lSjd7$}DbcZ@Q(X8nnNoorOu~oUQNm_>L*2(-9qG?){QZL66(JjSgqEk16?Ar$R
zJj&_je$fvyLA<grQB)`P*K5^6847xs^a4L%QRnN9L3&RGP;CEX9p4{ey9fN6?o8X&
zy5kLZJo!oawe-r7J+r&-2kA!);at*9ub{C;9oB`n2;^G7QSJ`3ae`S-PW#%)ec3&*
z69)kR1egn?e|@G^A2jn!I$nT8+ZDM7{H5}e=a2I{l>pt#>%P~`2GY>u*@FXct}sji
zMF47owR>V7A0&QF#Q81Bb7SK0e=vSd^5e~d>ssqg18H*)4G1F!7WEKcOmP#0&R^kk
zLZM4ZtG+PGm(MMgh$Rjy@i$1PFO!xbz_S<34!I&TWIia6ty0-+e)qWQLI3a110Rk0
zUYu4;&<!^XcQEG+bLKCN3Gi=B(<2DWE>rl8(nmq)^z?H&51w<JFtqAGNBh4)h3f-S
zD?a53(+<5l<;_OICKl-W|E|A=9ph=)4tVB6?>kC{1n*TR7{x@>jwB5t>~AiNtGEH;
zP{m#)lg5|iFxAm2qVYSL_0w@QyOY%X&cAmJ**i00>`b3@{ebSGN%3Y9FutE<X<&Nf
z6j1<$-yj>HQ8^<XrE?AqK=^xf;%&OaV8ky4jHB0YAE7Ch^!`0ucQ%7w%POl>v4)rU
z4DbTWAAl+}7NZy-?5>cfhXJ@#Kq;<w1zm|*=6FPrhu@v|kkn&b#;c?c29R7N?FfLY
z6Gaf{mkBltxVd{Q^*qBZK)3eH1Zl}D0j!g1+w%7b*Gp%RgEU}^Kv3}(8>CjW3vH&^
z3&|VcsdFulqcBi$YXiHoUhR_>b2I_a%REAt$H0d#U;CTD=;I7nl&lKin!xsNJ_(o$
z^;md8bf*XU-?~C1uJ8gE=1?lf^l)npI-&7ve0Sx6D4-A9+<ogo`sMMKqtG~40BF8{
z6Gj_-?w9GK4NF$BQZt75Erum&Tlw<H0I+?pu^WiXKg9utf1@JTP|8l_hVak;_Krx0
zrhnm?CeezEy3x~%fwn?kye{OSUI!7wHisS&FcuC@2=cQ;Tb-f8Z#|HW*Iwez+1!js
zq+A7%1%2U12Z{(2<CPuo;4U);)^yhh$`n9w#ne%6)Mw7YgxL<FlvC2h5tTf=>r{^>
z{dV0>m$6KnEor!|@`)K=6k|JU(WGIL<ZxiK%uiSAmSHWLldYq>BPCl3!jvqbU%F$Q
zP$~8{J4XoS0O2>S82CdjW9}nhruGX2`T{aH$^pV4%mq5F+<iP{8Q3}V_Pr_`$X?;M
zOdUdnl?y}pw=``Z30`?iDl2!&+*>VoJJhROD~AK6<b)F45mOOkz>tND$AnRa4<Wt@
zV3KlF!?d38D#O)p06mMuM6jGoePhKpK~8D1y;97(456)f#;n2%51245UXufsn_`i_
zVF2a9buLx>odBaMHVOqC!WZ2}7n1$wEc=_d2ZT5x0Y&QP=fx5-^)<zH1rOK9lQ^EG
zEzQ6eN7$Mr_4*Mc=e&JeB$X#W*jtE~hRENe?laYdL=7*Qy(w(FXb;_|mr!%A1ox0r
zESi>Qq)VIhaxNU8G8;we{{U+?rcui!oGMA#zaw3PDf&a>$rr@x5}}a(uHVg`K0nV9
z0+cg{{Py+F3ES73<q#?Z7HFR_K#d6oh?t_8m*4}0&;O&`73vP%U+W!U()HJ|S;QAF
z=M0Pm!i(J`>|*JM#0}QBK&y}j^eZ}%9WaLfmtuZ+vtqq7@O3*zVa;>(3g&Ca`!WYn
zPbsm{2u}%XVgSPZg(v}aSBxLCKr!lQdOTU6Jq+O1|6Z`;BC&26SYt~`YYQ6m(azOX
z*q$$72cH}>HY=T#gdeX&IW{SY&QhOXeQ0g$Mi}eet^gQZ{p~E~4CaW)#56jN<y^c^
zqM1ExinT2PAS1Pi>wztptn4CR<<5dNNz^bVR@Nlp$K976U3&rIjl5bR%*pxhb10(!
zt{iOD06Ooke@0XRe+*In!d=PRI*b5@que>VidfaX{XLC)n%6NL8-Px~6`*_lM3mg0
z_KONSX&RI;v|EI)D4#Jh5eyUt=TH&4U`7D=f`$T<lK@`_MM;SBXyYx6$&c|G_7p!>
znsHzGUIS1g20a-W4NznPl+J6@AW-lTEswlAn&NiXHiE911p>#3e<VPCwHzZAbZ^)(
z$TJy4L?v`&fK=7%=n6HnGEQmKH4jQ$6?CxR_N3TrXIKnuCY<QG@M~zF6{d9;0((KF
zHAdVPbU@mNy(E2I{UQv01eQoD(oZ0S;>!dKVODxO8a~4O#9|toxGSHn1yq`f{d&n`
zX<_Dg8*GQwlP|@+Prw)`^$nQlky{6|1|OU*dmZf`+m-J+{~+Z#^TMY}<tpS5X^Ua<
zM$Uf9!lH_PC2pcr_^<su-lvnVk>z=y{ZcBe9QFSo?3|iJ0fIE!wr$(CZM$#Vwr$(C
zZQHhO-nO}Sc4s4Y9%knuBkC7aMP+_@PT~r3<k_YcozA*h2`LxY#?BF*dMg(Q>eTi-
z#Ps(2`Nt;ytW<tVhd2OeNxYHkyqL)yLzl}v@)aB+UGiViWSZONHo2r4WXY)wnk3ZC
z2^XyG!=ZjI;fD{NR@1Y-&m2v0II?iOKyug*<ERbpdzhL_ilT*np|c&z_!0cUJXy~+
z&2dpv8FwM6C8$_d@ZuGPivXPbKmHEj1Fc|SsbQe;#rl7#=i*~Zr%TIa@A){b07KzY
zwv-ct@IB*>nXKcBLp#_b*c9sJ;0IJ?5s5a#l5uDU>?Cv}LD8GQGV_+GRtYaIfM}EF
zs8--aw3i+i-p~=yWp0CzQ5uFrC^fwl6~m)r8hLtTT&2(tlr&MY#|2P8`V=BIVvcTr
z_R4Mc-jkTaIqJ^TecRSB<nRKDiku0zH2{jW_aAnW8hT^>gt*i}r(*Vd$!w@AD%USz
zg8S32X9efFL;LYmy;wc@|Hb0K*#%Od?+$xmlx3_jZLGb?$>ACt)(<6>0AiqGSP6SV
z=JK1@2CN1T%Wk^pJa2ZgHqP4#iXb7G=J!2J1BEIPDeY6`9P2R?9xtc@NGYD;1ujx%
zb1CW!q=`E@^)Hfz*4c#Nt*WQ7LcWD?_rHnB32xT^e32%FMc0BLtvJ|`DEhgd$bU2q
z7JbmT1h%8J4Jjd+g)oYM8<b*a6Dj?e<5)tX-Y?9j7gG(#j}s^aTKf@@l-BZhW8gya
z^S-Pxj4}^5B6#@ivzd7<%8~?qwJ*qoM3nfz`?KT9nzG69WR6xvDuKYxaQY%=<fug<
zTv;N}#}6V2HgADIr-VpPmikviUMNPSV%8<o>3czsQb~|@Rq9(P7fY#Y@K~(eQCG=6
zZJO;gy*K~v`6>s9MX5M2hGw(TjfZ$EM8zVPo@V0#T{?Kc?}oWE6mlun&xdQ?vw5P$
z>MdAmGEDN@_29$g|I~Z22?)FKUB!hiodzONE}0<J2^9+~)S*dCS8pLOm$?1&EE)KO
z^Oub`EM2(g5yZnTe4f~Njr69JpDp5lB;8Es&589a<n!m?0$hV&Tqf%{7QM-b7Ad<9
zC#eo5pn0Jer#C#LP$_Q%_{hc{kbA2wqtz$xo|&x*QbP-3di!yGlI~OI;KK6pd^Yv7
z=cn}h&3;@>of6T5kIDpv5yT*RLRBvvqbUm!L~9vQo>i#?{W>naV#fg!v)YsB3A>X~
z1r$)ov^^hpV9`KT9mNou7aITNMc=yDocsh<8d7XI1jj0)h+$%B!B<b|zLg98J}@aV
zS2JKct{%7v?x~^=!(|SkdqQibdJ5s~7eD=mmLuQQk3M{@tZ-ESR__)Sgiz(uDlWYQ
z8PJ%JT~n4?$3OxE94Uc#pcx=4Ne4F(nbTJV?jYKKnjSHC+{saOV$xiAOu*qlB~Kg{
z20hg~kzOfS;RH0{f|1z*qkG0~cDK1@H&5?)dc(d}9&nbmhrUefIW82i;o{Dn<g{zN
zGV~jlKX~QHWY{OOaK|1UW(+vSpHXiwD@ax-aQ>l(m}Lh!#Rj_{sjK_Lu@wBn@xHGo
zn)4KPlqKeJn7Yjg0zlLYhR3G*Q@@ycgt0=TPVl}NhX8IDM1Jwte$dV_OwYOkzOrfi
zuP%nL()B=G_pHl@R@v0r7P$qCM}XiG9RVY?KMk<NEJo=<N&A|iGxn1zM&0s}_vbPo
z4p04ad)g6F<6|Pm>&jxZ;@VBFP2@*H=C-OoO~e6QsW>C2xiV|$VDgY`53T7?z@z#U
z!3YhlDW>6V@cb|BBG?Gt+gn@C3}r9e8xdntb`K-j8+B=5Lk_5l8gk(cId8104yOir
z^^mbUq(+#S(fa1y%rJjnhRo+J7O#lX6<AML%pelTie}RE(tDw|fGBpFng&iV>AFW-
zbR6P(P-Nkpr59hFPirNBM_tVWzk<7`1RmTJ5HWC7h6+<vS)kRVqoCXZFhr;UCh9o?
zN@w?9(B!|GC^4)!$(%WCnw81LiHjr?QktMyQIs61lXuZZsvx;>TP9)jhVGXRC{K#w
zLg8VpK^1h(BE~watsJTyFSHO-MXwdA=<e_DHstTqYaVKMVy~Xli4HE|f`6`~<todY
zmDr0sVHkpILHJ=I(~xVDRc!b&ND|$r%0z&{`O<p0>*|6y0F>Ri+ZYjk8YS@>i<5Xw
zKjnI3?-yY7^}hHE?k(@Qhy=wRI=$Y%!0~MxD64&EW8R||50;{47r5_ML^iQJraNXb
zwdr8N0LK^xQVW=Va#Sr1yz{mx&nT=*o90(jX1N}ru+6>2TlX<Ucq>ih?)N5qAhyW4
zQS-7L@64%u{EpFokG~UK3xI!>wY5-Y(z1~))pX%bubn!fGu9|Z$9VK*!fyn_x*ZIh
zmp~<&D~Tm)LX8i~m!Ut2(jK`-ks0Gt=B_z+x`}sW*!M^#C?3Ldcg~t?5RR&DGWf6Z
z+`u1y>d*YlF9i#C9l#j?BVr>q8QZw6?dUH3<TB>tY@l>H2_oU%g%Ut@lNGX!vIg7b
zz<$S#h)_C+7B{Oa6br#Pt2P|r8sOTNoJ1D41%PKsBGdEYz?9$I<>EM5xc1A?F*{6<
zPPWoNHEryTkr+a?Jkdik+=!sTPF)uGEf9iI->+VCX5ssOw=AkwK;Q{~@Pk_`v@#Oo
zCcrb<Y%lRm<AUvQNibL{UEbDHXB!J;Y(6s>^;1JBVjd_}(Uu|=iW)3>{_4SrBhQB;
z{}%eiTh`8+nn&KX+RK~>fgmw8%9utrc(=n~hG3NR^tI^g&D4SyI`^j1Y(?YzeJ+`S
zfy=i|jpK98#v~65(3|Pd^w8^bU*M6y@|UD-STox?nF1?W9i@{t5Jz?k3JStX;(~0l
z+`PWcvc~pNx8z|;Azh-7>*1(LjZ&XT7($gAcjCQcM#F7Ka@v&vR4yf%3#M^PP%8p=
zUGI<04?~gWfM6kSrx0QsjZtT(fN++DgY@xZ#PZq2rxff9g*dwsoU6h<2kq>cmp8))
z|9P6UlN&|DNY3mM5Ty%3HHX_ouk!OOQZdcSot~i^oEf30vi5%$(YRMl9h=@$Ox(sS
z8$&ITvQo(*f(5l5ih~OlLIJl(qxd$|V}Q>GfOoO&I-wf7LlSH8wWg*Q1d&S5F%pWa
zjW>XtxBxfq6qv?$kK&0`QDbvU1T*(<obXR$nNQ)zVCSNsR#rk{CWz?l6eg<ea|#b&
zvo#I$>69$Calk-phigcq3|K<yh;enVxPpsbto5c3*(R_Rb;&Kk*^)Ht*vQRP>aLWU
z+Fgtk)ud1+k?{PcT-kc*BwmT;6U%l-wI&6DYG<_zBT((|Hchdq`5TN&{ug7r-xcYR
z+W8<jY2W=7VV-j6@?25qjML^Ip*3CW!I##E$Dbc7`;xfk9^l8_nqjQlvWT<vA025-
zCd$q-{@xldu5p}n`Hx&7>9$(S!ZXGc$7i_RxXpR>#-j)%90fyz@kB{WEK_hgml;Gu
z9n5pc?gJ^|Lrq5y6h6@cIc<5vQE)B0VQ9R!!!FC<Zaq@E>cqZR=1v2D#vETPd@H~;
zkag6M+D;<m(R!{h9aJtBbDLfFzPLgGKVLBQN@^?D*C$)JNGB<`eO;y57`-ZM7qHWY
z!(mI5$gcHb4lv-)cF&Wv$pmjez|(onyK{U;;E9f6uJd8A6x0~1yAxpLdi$w5L)JG<
zS*#m{hl`1*JdP!1q)RoAF6CT>R|=nCJcMbAXR+34E~Kj@E&D+1?0uR?sJkNZpTP;`
zp`s3#iNL{~L^p>A0860p$i90U0f39WXoS^lsWm{%SGrSm`>!NHzqhlVS@5OlyDDvz
zFunU$p?E1+APFNn@FAeCl}&DgKBF=}|2?^k>^IH~ZN<XSd_{~si`(Mumy<WsvgH)$
zV8K-(=<|(HlO0bBlD$6$@y1EB!j7I0y}{VoXci9w`i%B~g2C*C<5@KbC8b><uI$R;
znqKH$Eb7>6#=2A&Q$WBdQQ`BYWg<XOV%=ae90g)Ev9qEzg(E*`y@IV9!EG9hA7*g6
zdN09aT92wy`)nZLfvC(gnr^PXF1(kle_E~8Z7XWmhrK_V`=^k%j78m~WvP_@J)5YH
zN)?$$t=ibS(%sx83^_TcjHvkmTdJ94=RovnoaMY>s6akuj?gGP`;tY5b-FOc*w|bL
zLGJ4)rl5PHP`-Exagsb{H5!6Zb~o^{rs#dC?7`Z9*~d&qP69_-<URw)m-j-oREE8>
z`|k99Eod21IVjPDZ6Y^GrgAB+LUcJ+1RYwEn?%hGP(%<QNn@q@+3K799h;*<ro5HG
zsb^NjJJjKnOuAs9Svb_g<{ay+NRQuCajG65)vy;4_vW%Fg_;H=5CvmmHvF$r3JU;n
ziwje3G(vrBqn6)I$S%Ik7lmEPG5cGJr3y*8Y2C1jJE_N;r)T7F%o>5~<;qJPrN)G)
z4@T52sP|tXMGq>(s>a9}B?3{;*f{`&Av5D!P*gKURCoaoD4cHpl%odS=d^mx9@UoC
z1J~{2pjAF6kgXMT5C_pR96u}2b95qGIN~cMXm4hp543`JhM1oQ9{*99IkyZ+AV^dZ
zY?GK(@al1h%~fu~t5|PaM+m)sq_%jyy19!Y)&Z_^MPaCI69*hp7pK<mdSYMd2N+Pq
zS|6yaZqo-ucM8}4I%wv{Vq=A^9D}JNDi9~PgzlzHs-fwU1vQa_AyEol;Vg%%hN!x2
z?wQ<vAEF%6xW4UQe;;Z)c!2NIH8~MBGBCOAnNQazh9<BW(@8BeO~>#ky|Z$FOxKd<
za3{6FRi$tByzOv!h>5092BhmpOqz}FTPDURjNje=EIa<~&vZ1|eYWFkC(Wrl^2^0{
z^2fL;fm~;c33zk@Qot$LmdB9)x;J*dkuUo`IGI~fg=z`N5On^T1l8`87KqvBZR&2P
zr*G3af$Fg+I}{lCqgO7V8kbw!b(Vw(vD2;%@eK%%<qps$Owl&LB-+rHMgyH5zD1?3
zF?pVpL8G@Ozy?(`*-f2dm>e|nW3?UodZwtG&2gapz<4rl(W*X-ry{^^X<V5r{`P!Y
zbg)mXR2-&03&E`vZ31--$&8&UAjL9Y=g<lqWk4fV6b*&?x6NRp)6gQnU<N+*VCGY}
zk6bwlqV~r5#ydbkfvpnEDX5O?xhv_B+R5&=yh<T-uem04{5@;RZ@FBA76BTS6uwMU
z7>L#1&>qK~KF2F@c*EVH0!St)fX>Fz_@r;M@Z_H=IC7F!!kKdiPBr`HXqwpgzE~@_
zTtnTw;&UvZF>(4s<EHF!n>&fWsw9>vWl`0l^OCK!$hOVuvf_wGr=qNOdr-}RaWfGt
zRfmd4Gqk;ZhW>ribU4!6Ji{!GQvwZ7jmt4USt$9TidnL>SVWk6x0ZzyJkM)|`2wvm
zwQZ`z`1=|sx>!Y@mJBmIJyW|mzhW1`I2~di>1=Co<W=raq;px`W@hz$^N+qeb(%pU
zZES<Khh1NptVJtU991(3HMe8WLRg%>|JhR2!c0DU-cJXA?p*DM@*MtWdP*<eD?Ej-
zc-kFYF<WM7J}RzE;@VEu5Z%HAC$o6$dVYF>#;H4QBZhd>!c$5WFntepLK&2{<l#Hu
z*~i3jlEBU3(Y@L$4T~B2*a=6o?~i`f@kqA^@Qw3KoM2fNSwefq(OGbz30<%*n)+m1
zyomcW2lmU#1AN50SMQGY^cm%I-Q!c*;V3@6isZ(Fj!?35V9lMU0VR%W<3pmxv{FIc
zP_(0cNplv>ZJ=2fDmaG6zJ3}Rv;_0N->XX3y1T8q0Z7j2WF)ePEj+MPTBAe1q={--
zlmA*ts0etw=WGN@1^>Z-Xsop&aE=Vl3BvNUdHqtD3YLfWR!)B!_Om?^dGbZS89{mf
zKJ4xr_nE_8$!$G($9hv?#5vg<QMBGs(cb929x0~FA8*()e3uByI9->$_s3oHQ#i8;
z%QR3Erc!7OdC$fp+9+ufp4x~&29H^|=uVlSom0Lqb!?CWwBMK{wfevZdTuSq-FD#F
zvX#yzzr6eWeD4U)8yQgzxjzz62~I1az6E~-ll^g|S<*+SV%DZ6OCoq@eX2|%luV*0
zm(ernojEUJ>mX#(Qe(u<1cZ^3hS;jq!7&yAkd++`^u(d&2}-}J!j1ipQaBxejUCL$
zB3hinfCqe~mu8jqRWd(BKpKaVF*bx*Fk!)Vnh?#Y876<d%#Fwd>ZfbWx3M*do=W9$
z23um3W9C{-P<M+NbXnFCGTr53@R*zk1VtIuSHTsOE_>v%N+oItA8fSIvvjTSi!H8B
z@EG|bOL@k_B&n<w5mrptW4WZ7olhG$md$&rYwK{=ItP{bqp*73H^%DZ5#8+NLKsk+
z*DJRewU*OwVOE%u+Kq#IO9TVNm|@SUF9-TAgNOkDPsiv{sD=|f7yf1|dnpgN4x_8;
zb_T<IVD6AP3uE<{kG7UG0T8iOf!_eCfQ4yS4c6)7g#%q$QjEpmBFV7yQ2MsMDJOEb
z0<gBbWwZbI8y^#=_uam}44)V>w+$Gz&$PK>90<1;9#X=!ZH2^9QK0}MZd1nI>jTUN
zVy9}Cn+T!D5b7RHu(EL_{F>(vH)85mfRGc;9F=rv$UwIcRwJ|_`HV-SCgzN4y;ZXi
z^MKNV+h<pV5un;RX9=_mn=n>u0Y0P)#W$$gYo*hLv_Q!8VwO^VtCZm~j=c8$9*mg+
z>AinXRh{M@lR;S_^xwHAee;Ll9&)1i%7NdP`^Va!@T5oD4QcqK*vB$k{M;c8svn{X
z>+1B>;U*VQ5<zH05M6yR5Lw(K?}%R}A^98<jfx)S{;6)L-~}w_jO6UQM*jsD<BWG0
zLUWfXL`woH+>WhPUgZ{?J&u!$np&J9AtjD(0&R^v1so*OX)5PIpPb+HENf%V1=&Ud
zc3#;!vEiQDnjg6}Wil6-8?|_HIc$f0%A>^)jk{U4ITy4>RiH{56+8O9=m$QHW-Oo1
zF9ZzAqS^AO60q@bM&m+dX_114YQN_LjYFRDrQ9|tXE?Ljul;pHJ}FO0tD##sH7caU
ztJBNE9HucaSgm!9#X^BASm({!%zh|f_}I9kQ9}rdnp3hc5w<LVgakH5Mly5vm=iRN
zvLWaqiEaXB@CpfMFyd{Qerll!ci)fhvgchUFQ?ph!?Jg{!SH|;Cr@^VVD!lP{3(lT
zxu9?O=0>85DsfUEbPE5ie9IiUYmW{cMT-$&3JmOY$34eo`i1|m!coCzvtYu1*3ti{
z|3~xvAHq>X7Yl1+y?-aC|KBu~n2_Gk!j|69z{wm6%J`pN)Xc<|;Qx+c|7k{{{_E^k
z54`4yfB*nM@?ZToTp7mykt?J2tc@HyBqCseKuHORSOJ*07%n9Vxk$N4ySTHnLolNs
zePi2-ScJ)1Yy_Mz+mm<ud$;Svzs)<hGxtxq{ZMFVYHtl@El=Z{D&A=~t7e;P+D9{z
zp=vYZ$JzB`ma$S(Z9PNV0HE=E;5SkK8*y(9bINa+tAF&>hm4(+1`%8^A@z`%YJ|Pk
zbu&)HhRW<(GzDKkJ0?=}tAa*<^lD39hc^)pNgNg_U!>B`G&VH{aoDFat*SFDv))o0
zSQjo~B;JN?d$?SQu1M=f5>emt7#kK`QB?Jb2eTm!rzpycT~}T`+1gO@ZRM>c$4Kg<
zeS2=L&kf>WFDx)d`ZLl$OHNi+3Eb)JE-f)fTVQQ|i=Cyt1F6l~No)upQHjC%HgXcs
zIjXMsIvmZTR5=>^bN|k|gKTvUo~YivXh|jq2no8MJMnxZu0+O%>7snrKRmd(OL+_#
zdcAYotN(|HYogpu6!>8H>CpG>YeaY<c^gbe@r#uB9s>+A&&xYtvEi6~k~47u$YkEx
z-yjS>K>yvnHU8UCy;*<6xVQNBFAiQ4?AOJZ1Tc-MX6(3Oig9fnpO64-b{$iplHM7l
z>Ak9vo<LfIf+#Ddk=>qTI_}{zwezTktL`Rd%kOcW@s}rR%i>M56Ldrm0D6kqVN>ta
zl1JE*nRA=%McGi@Lbi&l_K?D4*fpHt%L?2h*{`CBuphY_mE#YvlJ3&}Q{1YDPc2%^
zvsC3tVhatU2Us`FpR+%UXWA67NGH0PH|j)>)sx7gaRU>Ki^YRP2FywCGEji*gVb5d
z{i8cZVvu<&F)B=K%619d<I79T2>{4?dr?~(0y3q`owqT5R)PqprL6q!?B2;6I@T*m
zRM)e90fga7F_R4TMWLA^O!8h6<Fs-5w{CB(mfE?hHv_t8aA#F%d&D*Vigm((kZf7^
zDs7!skTAF@d%_}aoEkp-J5-HidS$nbWKi^17p2+Sk!W6bl6~ID#_^4F={)+?637eN
zw?9Km6vJfHQp?BrG@sI_hTP99=(FsSuRj~34Z2_-+#dgEcU>N23x!c&0aJg~IQf1#
zUXFn3Avbj9A{%KRvadI*k-sZAr6qduJOFfvV4rlw$4H&DROgNSIIEd_L4CBp*YNKv
zN392Ed%1!pXF>jWy_HPErpFuMZhqdH_BFyZ^;;ycc4V9Ar9DD40L{<{{LQ+q)^}}@
zUhfEV@l3Pfj?MbxRyQ?(89d(q0myCar6jYW_}#Gy$OYU<r)$gC;bn%-EHW;8<%B3S
z{K7Jo)!ABE7E%QlER6^%L!i@9aWVSIIJ@@Bv)Gnv%rR77YYdWYW$0Ji(75BFmjBpl
zWh~NM`^b?E2pRo-sJ`$>OEd{Y=K@X@GTBvFsjoI4IddG>QpMwhRRq`ER1a1ZSPvv*
z64306tlGvoGm07;dW)h*N0|2y71lW|mrSpQ6IcGK-sd&ylw4x&sMC%=D&Y~mNklF}
z<P?XyMs|}bsil5H?xK?r?5fnA^2<P}qHZfv_b^8;BdrkA^>Upfo0TZCSom2xtF!hf
z#E^J}kf<>G5@8lpSBo5QyW$St0WR=qZwMpvv~C5mz5FP|e4t#mJJD$r#-aJOv+Fxq
zReAF6`0>KeZU_CY?Uk-V;=A%j_5yQj07LT1#UtsVHGbh`*QQYIE8F%Qvd9}(f<WC6
z^228*Qa*vCQU0kGNz<QcSc}R-k1FPS`0AZ?v1)`7+$M=(u9Lk%LqxUPeR?k5^!>S^
zk2zO*6alJQLFsE<@n+cE0-izeH*+Eko;%ha+WC6YAUB-m=r6Zy*3yW7Ck&h;1;^zj
zS^(Ro-|tJi67s{so!fXzKlHQ}p4lFE>da!vL7AHOf=6Iho89K|af)0w$))f077Q%g
z^RLUnLFpW@9-szm;$M~q*(s+xQV_4V!@sla%7xZq{0<{kn#^Aw36=e`IERTsHa~_n
z7<vv0s}ncML!&|xSv=CgQYt{>cXCbL@Zz19;&0bTn6q9J8>TJAFP3bz{f^-arKV(6
zdW;Djy7xzBq(^4kb{)ia!}3>GODN%OLAkIo=!5)FbN-XE*(iD7o1Le%g_C=)NHRas
z4l`R|D&exC@|~(3r$snaB=I21x(aK7HMQhQ<O|BaVYMNz<xrR~fIQ*ze_xG|yJ$3F
zc%r9j!q*!fkdY6X^8%<#(;G{bV(Cq}W@l@H0d*<}ggKH>j?_Lv!OM&Bn3L2_)WGaP
zsIrh|O$B!*LoEF(XBnG3!fa6!&GS784z}%tUMJ^xRIwr$ol5@P2%wHt+Jyu^rs!=~
zHCt9TTN#}Sy56jaom1`T4u*7MxW$9YxBRF~3n_!x(#`BK0apfq3iS+O6`FtIKS)L4
z2D`BO5v%~&;PvRvSU(V|4D`M-I_yNM#`cA(9@wl22i2kLN-6j@<#T(I^XePnhKXs4
z$e#@gU1#bt<=>;EBPthH%XU@sXrOSE#J7STfY~(f>^v}?`gfMJK-v6KPUwSjH+L}V
z%xr%_2vXlwl^_edOry6nc5)ozEfoD7zQMBUc8l0qkZwFU%<9_2&EIPFzF%Hqlk)5I
z@9c;vTlEU@rB$KidAoLD*wC`Q&M58F1nOM%qaR(i_iI>*gS}HXF#?1x+7WHXHj%ka
zi+-iNa_L-fSO+aAE{a$q7;?}lhPgj|)Tk?9?|xpmbjV6x(H#OP`_NE6tVv_2LnO5K
z>2}&i8%kI!KX&jjB)Df|PIz56+YLP)ZvPuNXN!PZ1_lWUHc1}2t3Ycn>}j(N*T0Kx
z>bxDlA>I8+x9YVW*v9AuWh`k=4%6abIW3BG8!^~TzSAGWX*REOPkc++cQh&#J()XP
zeW!w8hg=#?<NN!V&$pdXQ;{BVETHItiC3nqGl=JxZ+Of6iF<9@&+c%?x@tyuqBJg`
z_N-8~X|_95IV)#$r~rT36o2brU{mU8>}*`GK{o?i3#j0Ds6X?f{JH{(RW!Xaf@q``
z14~`?5);R#V5gg~Xh}H+f9e)K{5%!vEH0jfng=$l-NptrW)#NV(4zWYHA>lxytY62
z#&WBOY&6rbtai3(G5V?7c!Mmf4p|KO*5jMsX9J--hE>pHk2~tlf1R`d<#6DF7SSx1
ze)G-bW4IK*{86ENd^s$QWy_G26y*###FpX7o&5Qh_M3l9g1vz#LTJF>&;Tu^w9Y{p
z=J7?@Iu793cgCwQWsfH9+V@*dmg~cM-*jAQCCsVl9qO?2*X!zXmOOgLxg8}k=)(5-
zx<+GbpE|B{ciSW{A@yTpZ0dBhh4-p|_TwF-Em8vHW6a!aEv0#B-V;3xeCe4dX43_J
z^w+(A!sl_WSbgStsG{tG_hE1tPpa=np1RSXJ#?6}|Idf@?Bxr5M}>ULLsgVNZyzma
zG%1hzhsH&*a9iP+nS(r%n!1D2Jf{Pjp%na)-Se7@L8l(=L=T;lCH{%v?nKUWzt~Ir
zPe+!goqd)ZzkG6NeJ)Qn1lr(fLKu2=M4Z)i54*M(U>HaX{5bPP-%D|iAG$mcLpkq~
zIE~q~kyU{ipjW?3)!t~z-nSt^Z{c5~(iM;5=aRs&+%i>Q-F?fdBa`A4O_93}ar<vw
z1#@Zpvn>R*uRIxPHkwGn>=Z&)yP)=0;kR1cmZiR+ykMxU;6_SIBVOjiJE)XR_!Pf7
zA69FkA`G&z1Cl7aNPZ+LezegVbpOG{E!S_|vswl^oZaT4UlYn{dzx&Kh3Y<CyRAgH
zZ{fV7EP&_0`*!>EdyU{Dm-Pj8pV2kMR6F;eZ6dTOBCYix+%cjoI%2pzA8=^wKEAVM
z=u*LH{)@HI7oEsxyC&#qB3NA}DAbti`sKFavDgkaS&XRE(YRf+*qfGRoe>SO-^j?-
zrKncD$l6{w$|oY)Lk8P~I7&1VjWp$P*(eU$D8QJJ-i^48kw{!bwu`$+I=iK|is+j^
zks&4<ua^m{2YwV2P*=uAwieJMHW5mAQQ8(xp4?*pB%pnQq}Ugt*d8`e)zR8DG88*8
zTcc9x(or*VszBgZc+I4LS~dzrB@fmn1$aZ~^N>NC3R8=a@;t*7pU8Xf!iT>lG$nHh
z43b1*?f2=Vmj6b1BIZozr+3H3i6`Yui|mh-B*@g<a(C?O-()zB{3Hoa9N2Wh4h=X}
zhD)5)$*n?3^1I?TF#E*QRvbd$SB;}<8Z^Z6=g7Mz(TZmm+bLBvZId$8STw&?@TTof
zqFU^^Eb+c9IyWvo+bX%Ee2Xya^j(FG$98HUv`;j3S=e(a{pqL_G1J&J*1+e$7Fx^^
zRa(y7bZRn_!Zj`@V){my1#Hc5ZJo7p$8@&gui0Fp*~l^6Y&s+ufc(IllE%FJ7%=m?
zpj?>6&b0so(ZnX!wfMLZcjp9mzsPj|fi%=i+2A}`*nq*zxIxv02-!Y;!NJX6qj!}j
zeAzBu-PX>$W&@hj1-hm4$+N#ApeylbxXnWpxYg|DiDaB?I43wEo#d3*57h8Aa^Am_
zolMpcI2ClqB@u=}3a&zdQHO$Rk!`V|6hJgi0eXyY4iQIqb&zR=mM)p2l;wLjpRKTk
z!}Fa79|3~bpD$Xs1FG8-$Mgs)5|n@P9isO`Hu)|^p@(Xg$_hbILi98iFT(`_mNSpC
zNUgzz^JU&E?R#(l^eVM&^L*Y!Yaxh?YXS!0rrFy#;k#wndYtYHrz_N^V<d*yE_Nx<
zraSi1%XHqK7ELdlJgIcls7y$@PpOjGB9|Pj6**(uKrTpur&$V4t+-Ckz)Q_^G0*U$
zG;5{(Mbfp+O0v!?I&s(d3CtHts2N<Lo7fSbVlF-GY!vcsAM7J0oEM-@uX0pvcxW;)
zAz`7@`a_MTwb7&Zeox7OiIpT(mSPJ&9S7t~0et$;T5M$dyLCn77fWT)QQ0^YZndTN
zp{lx~tEzON+A@FVdCtDA2!1Rf73O|$wQ6ZA!isByc%47|MMjIEAyom5Rq%MNMCD`y
zE_h*S>Md|IMeuEn5QT9bO~$Oi@1)b+>5tqE2y1ikCZ?W{^ul(;03NMX3;8mebzOe1
z3o^H`@(~#@^JGQuWZAdt?+syjR?rd^#@hbmG8eu$Ydav(l^G_?z*Cy)UUD;{NK2^b
zQ<zS_CtILnnt&&3P^wg+YUQJRb^DX$>DZ$(?P%+1MOQd!!@`|*%TN}`4Bx*)VZL{F
z<b&r=eWqh(gjg?T$7v3Hu3o(i5<#=^WUe)+a!kDiKC#4IP2{Mn6J$@?h?zfNt{>k`
zSnfV|)d#uPMoYnKZog_XyJkV~qx8j8HX=8O{8b`iR}$X2`8T#{Ibo~iIR8V~tg47t
z!<(El?c1%-y}`W22wCvzb4V>dhZ<ZQ+e;2|v~$KF1ZqS#dTNE`Nb@p(`(?Qbx36fY
zqKTK`6+6bpO3)U$&)v(x3|w2r%Ho<`k}FSW5bT|bfvRYxzD1O=EPSS`WFo(M_H_$?
zkj^8P4zZ)w;G|x0$S(e}Hn5>}E+a=dbY)5WrfG7g(nv>$TL)rj9yP+wN_>ZvZKvfE
z&8vYIe1%uM9<RATYgufL((N|G@fLKn_Z6+}wX*XSZuQfC*~{ToC=~}<yyUh*7+?1f
zK45vAd3PMhin!ReJluJi!bO?md0E62InfQG{#B9aGczK5Jph=7D%d&>*g0k|BNvQ)
z9Q<8A*jqUG#v#~l3hW&>%)iY(6kym!3AhIfcqs(<37}BEcUY+c788}wWC7vHBjIB>
zVV(owO8)~ps-e7_FaVXI&3uEQdjr>^TtyxlqyF%YNr;*~2DguTQuAS7?_sQeoy)b?
zguXc%yK{8l)U3&P@$K?i%RYMjad3wH<g$0=lDH`Y76x0EL<0&TlW0G0ntUsU1cT}2
z0saVsWptKQ9Po%fe1zGca3h6yo@Idq;9xL@Q9^byVE+gId=oKYKplmCs^z(Yx}V;<
zLHS3sZ3Sq31`C{*QfM%-m}h{|J;vy!(ShC6fzZQICiStbn9;|vF(XoP5><jOuX*24
z$oR=OD1g>dri6&heK6VRcUg?$xM(Js!P~LC-62=SBk}SH+U0rO+!sK`Yk!00Ece1{
zXh*p7x``}~t~?U3en=bw4U%v7`#bPZ$nb>ImW6c8e7jw{rwU>oEt5<~!^IWzYhB0W
zUB4$4$52Tqp#%OIH2xt8rjbN`;To>zKhJ$oq<XI^b5t_x?wyz{NuoTphHTUkxtpLf
zO!?#;^Gm@Pe(Pa38*x8QBC*PzGe^$v_M%VC>C4UK%h}PFJiSBN$HU#dztvh_JW==E
zXr4j>QjaA^(G<iYZC;Zb4!bK3^RTQ}rrmFk2C-;=ZB7`Du=z1!GJgRy21x_Ju;@is
zX~0H?Sif3uztE57jVM{25&=Z6u|#qZ5wGL!5;Gs%f-CtnAx<^nNCHwNY2jn%RQUw>
z8R!-ZQk_H5{qG?f=z?ddcw{UqYP?EfjWZxy5U%R8@%VRVn%0l|GUb^TqHg*WHD~Pq
zP&jKW_-TZU)s4Q%qX(hsLf3KRug0^+J0w2SuDHz9vbx6jvmQMcMYx#uJ-1C<Jz8Cv
zVW^U<e1Bw-M>O}X(UZl)TS)`0Np9ebi?76#0WOsmK3o`aeemmwdxRKe4Lhz8=2d(P
zeiC2#UR4x_$m>I^gh!r1l&r)VD5rlJB<YrUkT@?e1L;l9HhCMK%39XJcvZEMeuekX
z!Fiz~oeVxitWi!{Ge@X;3X9lmG1(%2@rZdZJ~{YVWfCWTb1KEUooV*F$}YBg&b5Nr
zWn*y|CLGO?U*Iyg82ptS{3-cc`!tT2<<2@u3%jdhR>uDv%Uf#%#%#0&?Rj4#-4#WZ
z#UJ;2ddP-g?TNRK+a->f*U)nt=haZRD!TGwE}G4QV&PWT*3Ra7gak*U;#&1f7H@#I
zYeP%A_{%e{#?5lgRW2n(m2QlMASKdZla_#o`GyOW1jlRqPHURT1od)79_Q-ug13u%
zKoAQyAp9Liws6-&$Pl>*xB@DU+L!svj+K)j=7mvo3MG~%q3#7e4&q+`*S8kEMrMYi
z&Q=mfC^x=?*Ib=0f`_e}3x$%?whE&0R_6NWs=gUOgMA|JL!IF<-Cl+ea;S30?1B%_
zdG5G;8iDMm=KM!G@{5}>U{xke2^&8NG&iw|zVDj1MEW|<Q7HtFY)FD^Z~V(ED*MCC
z*|ADZf!*Qq#$Ae<`T5O#kkG01>NTz3!ypM`bo<-x<{+B)7lhqcu=6z<<+1)N;R5HL
zp+)G+?q`O7w}q4a7rAuPLbGDzJkzN%?A@28kiz#=`(Su!uup7!1JOB;EANs$cfpPv
z0=ks7svlJ}vC8o2q<%rQ<q{QgA_Zzsl?-wlPFPUY>)&F3uBEe2i!Ul9Run|H?s(Tt
zci+50ry^+<x|0~$Wc9|=u0TwfBbgc+xm+WZ9TXILR2jl#i!@jZHD^HlBBcuHX(`WL
zt034xX8S5i`@m86YPV|=mDAcG4_^P%>%_3^#PSZ~-1q(j?y!SL;<a!0E8lT&;NhDg
z%TI0JOYQJ2-n!RbhK8vN{KBYAawU&#o$jyO8*EIR8?YTgPq{J-n3nyD*Fkj0+aG@!
zce-?&d;7qFa-*F4t~UPkl9J1}PMTv+!;d~D0aKE)mS{xiAHOFkxKuB>n0WT9bo~u}
zNl&4=#1vO01lvVXEN~038M5b(^XQZ)f8VAh8sdaOi>;_^*0^1MI(84TnsMdZFrZ`9
zQ^;9m9v~tlCPyeLEG<tlGBh<dS2<feK3~CuS3@KvrpCNul;mX971myh{{s%s_)l_p
z`+uUt!$QUXF=hU>i2pY@yo;Zbu1ceVraGp^oKDl)Lun0PLyVaTcEk!hoBpySCnKFi
zGt3#^hBnvnR&jcpFl+6pZQajS!sEzrydI<b@<I6P^+Jham-IJ2sziS$$HzmTZNGtw
za}M|U8Mc-AO0tuL&o3eno-$Q2)Au{p+ZKj#ohZvsrx5`;9{KeF9lZN31*CvK(8G;K
zdtEb^yk-Id>wO#nfXJR&X$ph|DtO>MAQAP_<irszg3Yrgm8M(%BG2h!Egjzn<)w#)
z%>u5wQg{yvI9kitAB^Pl0-P(z*KHkh_)Wiui4UoCBAez$r+g|?pnd2mVx&6C**tC`
z@zFryD?)zom3m|2BJI+Px1vq;l=yI4J&xp8Cz%E>BL&Y0SYCbY-n~)FyeMNT@4|d_
zA)VUo3Cbh^1XfR^%IN|xZeKe(0IluT--<U6Ya?U${$j;iOZ3@EPU3QGm0Ysty}j>{
zpC-|l_}qsJiX8dk>-nQ>`kbEYEi4@Hu`Y<jkm8LXgQj5=fl~;PPo$urkWr=tKaE9X
z$*zb|$O?Kf-s^&?mT~etCKJyDifk3fC<1Icx`C|9Txi`eB1tHmCdf3mp^4nW(22P1
z&Y+rBSVS~6ZUra^C&z&1XuHT4s8S<al$jAI!Yy;7+mCNbj_EJ9VmT5%b_$y#e(Aj;
z`HuKM$RTTgHdm|HTNPKNb1aex9~CpZ3o+>VeI<Y7L<ds{Lt5#y{o<p-?Cf|Qu5(&9
z<&JVfN>!GX0zKE!5dq)OTYJ={;gJ|^IMpAPtHpZQxgqUd$M0p*sC0Sc-&!8;g)+#a
zp9)C|GjB}WXB%BJ%(5*xkA>7$G3hz1Idnc=&P5(73ep1kjnetttd1KS+BeYsJssi3
zo3XM@W3D=(MhJA#Gd+U3F+g1;L<ri26DQe37T!gh$~692%+<J+lC@~pQX+#PmYv9_
z2B%ZoxnlAdFq9gk=sHuCk>JDkyDXt3<fWz-<$pkjq2hNh=Qbr%`llC|=ihDnG^QAy
zwq++eD<+l89AxB5cY4PfRoiW1Q*fe;`vJhN<TG>irmJ>88nUK8>vMccf7h)vY8ba|
z`R)DAFpPc)N*4^H2`$>l170!uukvIr0=)<y#}I|7i$iyE-Xe4ZgJj$Xe!<!*ow%Zh
zJ)bKwSLy2DqG9rO7)`E0qz_mwcYB;GOK8)bE6A-NJ4Ln?e!Bw|izWWb%P7_5+H5cU
zYnuNK+_x@$Y-aT#de##d_|A0gTQzBerE-Yy4nJB;HXcp1552(1wIb`d;0eQX=a}@?
ztyF?<`+i1}qqaYDP@5p&7;T<Odv(9FJ*vQ9C~OP%NcvEwkb*w$-U+%|o4XtXmjPAG
zWl+Ppc;$+tfFHWi7$R;!{1AFzOYIKZ*DaF$cmT=Ap$5<>pxn#>u6h7tJcOO-O)}K3
zeWOf#{%qsnBZql2M4`D*7S3r-9=(~NA#1*GcIiiBW=)YTo1Z_&C6qOKbCF)}k_IgY
z8PTjbU^%p&0XtjKn~3n(4_@qAClrkBO5l={f8^OQ@)oEjlgdg$p>LWJ&Z#9I$x6n$
zZJC-Bs46K*OG?^pnjX!mDY-~V&hYP<rj>jbCd4PIku?uhBz%Wt=%<OOTainRyQsX1
z4vE(zyg*xRvFoHB2XkabE%ez&#z0y%JAqfgBRz={I$rAPfcON8HdnSTR%Co@)w^lK
z*2#Do8mdP$3Dab5!Kf%dmI|H>lF~;mTT2E78$!q8F!56X!1rFW{Ed*^Qj!_G!r4Eq
zN)K;^lb*J6+>i$7dctJDOhcs79g-&tN4SEkc0}?R9sNll3Y8g)Ov>Ax554xeDqFr7
zHN1Rkdk9o5e!!9(yvum^R(PC3xa?TeK_$SAZE-Ih2{$ua|437UHm&aHczAu39G^*O
zH4o?z!Ze~|`jppV8*xfe#;@EK%Y7yjzH0BX<2Xs~Xs&Y3v~cNCm)>vFk?jkAuQIEw
z?d@A_l`cqZKw356nOW#rK2k_9DGuLxHMlGeHBp4%NKdGPAmN`Xk8=~xXqvwgX8Sx|
z%2G^C75a!a#f*7JC*U*i47v!8E@d)kt`Vyp;Nd9h7{#^Oi?vc{vw$YD@D`m-Y+3BS
z2NKTbvZX_s?-;&gFDe;8dZ(9IQvhI3$`?;p2Z#;p@|fCI#BV%zS6iDQy_Ebm8%OD?
z#&n0wY~fkT%*3|4DtPhKlcg%7W}-4E{JCpMmo`FW<E+fk;jvq~i&@k{kvH~IZ;Qcx
z-8Ynz*;ODJX84X4ehZ?Q16`}$Z7M=OdI^PvF7es<ck7s*uJC;xbkLk1yk5k;lKBA}
z2K^nf!ZnRJwR?!WZa;Gy>kI1LdJcOsu*iDmzkFzJjz7<v`^Ne3Dj6a<RM8Rdy~fnV
ze2CQEd&XaTJ(zeQlv^UTamhJJCr2FB^BWcB=UfM`dp8Dul3g8T;G3|$MH0i*Zd*4j
zzFHaAwT-GRmt)B2cnNT<`EAJW2?KDJgDU$QG~w;bisGT`S2>m!Mr3b91S5C%Y|K7H
zZls-=Sqgz^1L!6cf%PgRM%`+<BTVl?Wgq{;t+P^xy|NQoQe)WIVd4PpP2h1A6ZtZl
z1-Spu3W)Wp(*n~Ezw$xakkc~q+{Q2CugvH002^~ljs;i8>s4wQoH?~hqjf!e#(M(l
zmk{-Xc_Qvbi~mcl^h>bxE>ox>RU2W%jraYO<~0>*RiJ#OT&CN6a5-_GSSzg-o;Qr5
z^xD7~mH29>=UVeFC?s4PJ=(wLb|`3&Hm$DE_Ll&jmtQ@nyd0|oA6#mq;4AsA(|W_`
zscZdO>EdXQLkgy7V>@a=zFBYvYB-93a)Q6xzAhkz+pPCuI%6R$wIZy?L)s%mCt^g8
z0p{TR;i<>^*NGA8Hh5gii+LIF9+x?pr4jNB0hPiE?uMlo;hKrBb!ww9%tNPVopF~K
z%0Q<kf$e6qlK+R1Sn%=RwukR=Y^_t@o}s}*XgT_qv|Z2M0sT|1JsrnXU*}$u$wP)5
z4F|o~uYJDaIkTR&eZpv12<g4we@z^y1HJwn5&;0f6aROK14gF*F>w&}FL3~O)FRj^
z8ebb1=^VilUM>;j?;PPQ&DrV1pwAMtz{w>}tQ53Bz^d;Ymk9UDxA%L%yY^2yU3Y~;
znlhKDl$s>3kqcli^7A=Xd}VqCTK`W<d^&Gm|6u?4mFH-_vB{;ev43~;MgQ9t{np2n
z88Y$%PjiFZ{d>zZa7v;^z^Ee1DJ$&|Q<d|oqKG|t!QD^-PE0#yEPQtPsGh&mb${ij
za$LOd9b(3K*^OCL;wLFkY0^|Ly`N6(-Eo>3&17p{b-<?E<oHv5l1qfx;kEFS&fwtw
zJs(qIxSy)R*8CbVL1QOMbG?JW{2)>BFGDbDs@e=of3ug!a4%Jb#r*+DSpSkx62z@!
z%7@8{O#a(`Jqbs0d6yd<qNldA%t^pkR_WyYejbpmDj+vBO^N_gbAzQlz@t<T*}KHz
z1}imQbAhMF`y)O<M^a~UfR>%EzQr8CH=qQ0_6s#aZj=~<NcV;-IZJ~pK%=ydFFj?p
zjY+J;0x{S){>F>YM=9p7S0QL@w3i%Re4o_}9v_|>Yue+Ybs3FHiyb!ku{VR{ur80}
z9nLm-ps*iHrvm=yd+()P5c4Xkt8_DkpNMG~({4sw*(6u8!Wh0b$dn51?(+0kU_{T^
zU{pjbt2IOJsiE9-t&iIb_mPV^Z*UE|t>mBp4K<*J3#;gn$aKbmhj68F#CFw)kVAwO
zu}v#gbzuvC*sG3#nwc?MZg|ChT~M=nXX5TV`>iUZe;HPEJh5ruiGF^Ze|j<Q(NzQu
zllvlXYlc*0!<I5D_-TPfSJ}vRKIK<c)Qt_DhvIeDw`+yFsEqgg>*a0kG45{64e$pS
z{55QS?)u{f5?GjHV2m2++Ly$@U(^h0MG)nnCcJT>jW4%H^Obh*X@!EvXrg4?f%znx
zAk^7p2|!`>3|)~1!K)cO>)qR6J7*czC_i1?lMuj93kTOX*5ECdVAsCqlzdCh8WPRR
z;0fPdvzV4zirL(NI$F4An=0tjKMVLtCxn9CzyG$B<Onr>fb2k6BgCZ85>{BTRh^PN
ztL0~BP^{7Vp;tE5bE;mpH-~saO^IL!N4V1rwg~pPB%ey>$18u**S?(CB7=LM<BIhH
z>Frt9RRtqL)f$VKk=vLANkc{DGs~i{a@&0z=j~qqxSmV*zD(GL`sBc%l)J*gV#Mt_
zwo)0RMgKx6dRVo~$w$_}Lv^#feMxR=864R;Krsq`lzG&>iwHz8+&;j8SFlq}fS{X)
zpOG~zOO_qh+1qBU_9L6r?M!-)%X!1G8hatTe`l|!4L6-DFzNbP-w@JsH~Y!70v|D&
zVx`h|0bbPrU~D_5CYNb!AqEJVY%hop&iLi!+)5E`0gwL?PMv~3DN-S-4%|Tba$|OA
z%E7}u_UM>_RFv@U@pQ=I(jjmWo4UZkWiEPr(eBI$&w7K%iPzfk)1DC;y#VmOu|2P*
zlK1Nl(j&7c>foM0y!Md26^qTDRS~^x<yM4U)1!g>n9qs`Pv^6*ro5836|P<o2wV}}
z?@i0}NjDY;22_=cd)n!Vqd6bMWrl?9`r{ui0r^1jTJ(MZeoUF;ZlH_QU`-$*FX&g`
zXY8-ZjvZTWp8nTb#5ag{#3Ny*e_wO1bPOnsJP0qkNe&H-XDuYW4&1#th!2AOOm<i%
zZ2Ib{7PsZJU#K9;d)>XR!0vN&rhNYAdBXJBvZZ&}%p-5kNAQ>`@z&E~yv8HcVp0i3
z&q+(%U>+Tzl^#|nw|0=NSW%fJgE7}Vf@0n7h8enoiD%QC`~+PC$&xw^&K5q*Cmo9K
zI>aHlB5#^CM|!2Qmgvu#C(ghxUlfhVMg|*apf*N<;!%iF(0=*!tDDh@m^XhM8drrQ
zrDIpzFx6}?Lun4ayI074!uY#xPq((ml@CET@N|y`=?xx$)o{IwT!~DSdN)9>$L2_p
zg^t!E=Sgq6WkT<EVG5RGU7hrzq;6r`_JtyXgA+_;pyR`Ks+DZe&U0L&Zg}u(n<Q@6
zb*r{wpq|^j-imvBDH<p?_QMFQ44K6V!=sW-Pnx?jHj7dPwhhL{epD7vEpp4rdsTVr
z&o*)*p$=EBasK_c9Jhgrk4|-}1I@q7d<D!8ll748-YJCqX}m)QOqS_@`7pyvQI*UM
zi5t;=KjYP2g)ELV1BUQ<a*R}8Egwiu?9LN4zAM?!m^>#^@p%w!u@eRP5vc4Cw<l7A
z;Y8}8cuDfGiL(xbN~PI<se+*n$u|v(6?!pa8nJG%Z3Pv}wm%~qxQ<CvCPa<l!kVwb
z?VTJj-Id6`HGQp1Xa}@3OZ=nk&kFWS3s$K*^q2C<xsF9-0OnKt><VB{RW&G844J=^
zEW@p(S(+3w%Z2w<xLb_6%ZXnS9N2}GVM}+EHyUWF)N$y_YJs21I}H!ICkymt?wW)4
zBEdbl<OP<0g25_U7uYw~2MH$KtgCl<c!ZOjCSox2Gr3>H1o}lQR*2CiA(g@<vEyKk
z`z*+ka8YG|^OucHG;smNTBCc)NWx8J`3yPALwZvSMpt8hjf!IJqYy{47mRSV;gEef
zGa}Qh<FWNUsOV!yX-wf_ca_4Zy$-&93uw)KUHdI7j^e+3*0N{1aTczNv@<dGBg*M*
zTCMXwer#q73_X|B%_b*TUN;)t62i<N_k_Qhp5b;X)mH9t#TQ@C7id1b05aI^GaqW*
zXTi)X&X``G-}ES_dg34J^RhVtg9*jsJr3p%<j8^RWlw(IC0L^71B7Sp*I|)kt{jG;
z`R@}N1!12Q!I}LvuYph!LR4y7x+1)rl}89ylpW!R8Sa`DE{4_N(!LwAe73EY5N)4N
z&fmY|sbyAw_VR3E8%GdhY_HNAu6-AK?@N<UJ*~;qyR*x;yy?+}mIq~hf?5!Ak!n0L
zE5Fy|I+eyGL)KD)K`rxftd~J<`RR)^H<bHyMPi*&RnA>EFijDrA4vXm?oT25{0ry;
zAA2!-WpHK`327%C-d_UzDN-|j9Y*}F(@>)H)!zH0l?x7MU-BE{aOe@D?I8|zODF9J
z`E;_b2i%Qo$MLe5tlp=VaNe%P2fnjbn}tl_h6hIeX6IhNQL8h#WgzF{XtW}SN$jDR
zTKY#0y(-oc@tGEcT)^kn%sttWc<9Xiek1FO(2d8r)ZmwP_Ud>x47Asvg-BL1=K2~e
zfwf5BJ`gPqe{5~FnWjCkn>FaKy_Vb(VMu)-%A>KD&(%dGCp`E!(X!XusqrC;duaSa
zdneEZV{2LFp?HGgZtl6rhktbm8U@YMh<2$#W8Y)_{o{Uqy&53&+f_LQ&GS<ES0ke!
z+wKOM2a@ALfEyBsYdlbnc)M7Aq5cZ5H^0f<vyYXjQhRv%sG>@&zf_^{w)`KXa#r$;
z23`x_0^M0Lx_2)@x;x8f!t>yZ$9^yHvX^V_tI<OJ#r|jC_JHABi;f-vx!NVD5~b?~
z<&uwB<5BMjn$M0Dg~JKGIAs51PlocFyDHhQ`UHxvp5(&?PRHj@(z!)C0aQDXHVEvh
z>yC>C$lgdpNh_?ut3pd0yt`gt!?W?j%I71~D;oI#xjp`$Jc6d^{qmiDDFKH6McFw9
zi4tvDx@_C_E!(zz%eL)XwvAi1ZQHhO+nRcBBKl3gneOPxjFXXna>Y5B8TsSOwb$05
zOf@15oCB{>H)+Y-y*Glt*`P0=<y-(o$OD6KC4?gFhBRga*$_LITX~%$1mI4~B^A=A
z9@BS!(8mcynCp~R5bjBTr4Ku&FAAdH0`=8$&k4<KE^!c!QA~~hoL=UA`xMe=<n7Wp
z{NfDFu6WulbBP<pL@W#DTfBT^vF+=o7uKK!QAZAu8v6LaK`zw7OKQM27eXLS$0Qp>
zHO9lGn#R4P!Q7R?Inl)H1dq|khaZoQh7tk6FcB3eAfg=WH+Btpx&RVFnDycn$aATk
zZ|^1aonapBfw@wHV2~#xzN2v=Jg_zq$K)P@L-1k+DF_d1Xp62R3soG5GPZ(+Kl*8$
z6rIrcOcEN#lvRAG7Wzx;raClCp#fxR3n0HGV6pd>3W>paBeyqBe|UD*4+hbZfuMS6
z1qUA?9Gm?FS<V8#7Y!Na5J(syKn-)R0)nUj(7tW#_VFR?n#9-D_%=VyJ1(>*4f`GM
zeZcr|U_K~EqHrcEXk=8CkKu5KrOHm;eJ3G&##B+_<(*-GijOi(=-S{TV+@&L<Bfc5
z2WT&rMd(H<ge18sv@+GLmWMtm;2b*Sz`SaJ_pqlM2C_q4;>?(mrd=X@U?-blRHWU0
zPjM$keb)1d_n-^1Ze>t7NZ<Ctxgv*0T#QsDhD5E3NUeZ-vJus-Aw`WpmAN1>3shVg
zU-nRM!N)N1Di6sLEnQY8?#r5BbCIw=ny~+wRYjNzw<dcR5B6zYuE~l1rfV{k>=kn?
zAuM^Mre-vfaFo$vT>2LFyDv3KApTW|^jwm1{+*F20c1`kD~%^3X$pdpIE+rwujhzq
zlCFNtu>N9=;2Bz7Cnc71r~<6?V#7T&&DF)y%EVLCB|@O-*!Zb>J#t%-W9QXM=^7`{
zc1T=P_P{H8)OhN^`>g?mc>}=W0#=(|Qr99tab0K$$3ck1@e(~(G-XCRiC<0iDp=r(
z0n#ae0X~>zf+2OfWn_%^adI7N%57!3vu)CFV$3n{nCEtUfNhE`ZtOn%mP{R}vvX4W
zfXWSOyi8r(*%XG;bfS9=*g4tH>LTETaFmS-lA8X8FQ3|l&+aD>xm<DN*S=u(p!m^l
zAH5rdw`Wx@-iT1ESx6UqLOTQn>Q5F7N_~o`2-dp}%d87s#!Sgd3(cH9gT)ft_A<d6
zu>D9%A<~bD26@}=&#7X6`$sh!DP>w=-yG@uAp;(&!Wc27D1Y{KXuNd)0KP9HZV0pf
zo}%d-QTK#+=TjiKaI~L22LdA9aq%)(=#?_<jY5>OQMe3Kv<x8)-A$?6q2>#&qHI%Y
zLHOgZZE86xyFf^(R<g)}FV>0@USH5sv}3FyRVLKTrap(HUrC1JT2X$Bm7qM}et10y
zx1D3U1@zz4D{^XD<%SORhQ`QwXH0U9xI#OLPR=wWizKYx0BCZ(N{6dDo1Q5|{P9!}
z)Cj;uzWT;=g-XMp7V(5E(6MKv;<;GFFftmBr)ru&VT$CRlx2Iz=P6!L5~mN9Z47Yj
z$5F4YJM&X066&X(WZGP3nv4C|WIpGp*Ci=pNbVDfPY+#JnCi3byG9NWsj~$psgTmm
z_(OhokoUmI#Fi}2371S*OIA$SVpJugzH=6(_Z^3d(U8-h`owlOV#=3rAaj9Hr3@H0
zXDYJuf=ROkx%<$IBkmehAgQCm@JeyEL+j$XXVzs!rrz6;<I4}3@WNNycOxr%C)+Is
z>wAi)=loz|0NATPp>$7n08CyII9IxuC~gp@%D<$31%$*k3KJ2|PI%WQRX#n_+?ELH
z95pe91TVB;n0_~jB&mvvrBjvBP?po+V=7V1%epM9o^5AkZC-_2v29sal3A1|L6!<P
zX^x)+aXPoqJC^{ix5KR~)^TC&f26;1q9<`l{o-;0;|$Ks(~QduU<8DytLlH6@=`8-
zGCuZl*)TB14wtq)tQjB4`2)7vG`X=Mw4|Pp>0<X=`WT~zU$-nc2}WlhIB7NIE7X3&
zbI*A|+22REqIUzdRi<5lbgMVqgv)8W(1&ZX#4cX8|L|Lc0y1v*ax4h-<aRKZ2bTjb
z+<Y+tIMv5TOI*qSFqo;qYGWQnlmliX@sII^r{P<A568ABr;<ZM%FrAM+h%a6?CRN=
zWaUo!j8Lu`|6en&2r4O!63JE+zR0K)tkU9-xWS3Bd9uq!4}eVIKaM{EE9l8q2y&f*
z9c3xZU8{de)3GY(g{{di2d^{pc=?YJWbi95GHj~Wey1iau4d^?GUqUHrm~vRZJR66
zj@8atP8MxXPsQsotufo;tnMLi{sERTqMBxmO1Y;w!j-Y?DeHatv%ebRqd-NdGX;zB
zV-OSVG?o5VZDh(Z!UCtMex06$uL`$vtQbiY^(XzcJ%|bt1;mC^?r*HGU6wCNCes@t
z2P$@%(CpJbbsKNRQM>*mhw;0a=69=cRObED2>YjwdX*2A5^r<~nhG|HX+`dRwWHuu
z66nfq6G1epbvbaw?{5M#&EVV7bkSI3%a2A7c;sS>1o=gcBi|$K!>K=q5WHI;-byL+
zI1!^|e(Fled+4le2jcubC3=O^a;Ka)QAev4!Xe>p6f9@AZrB>CTq8%!3;NW4K8#@v
zK{8doZ@FdNKp&%}VL%|z*A0Vn>`bV{S!hJwp>iAguMt~yvYNaLdn3#Us?l9wEcSfS
zzbYs=raEJ89Y9bg>!4uv8K)s*KX<i&99P&pOPI?>V7Ltz13AXM`%12KzZ4VF>kreK
z@X{}xtB4^hme0$WP6R`JTU2Sy`1}f|yiM}|D6XfV1866ekwD*CJ5J@8%H>8*O82`t
zRKCPd-t-S1gx^w(5cKyONhDbgyj}Py(bbw;n&f!CLiM6KNC3`s4urf}jvqbpuNVbW
z;hZPid$Ts(kDJ3T&a-U%^1V4x6Xa*Iq`zsasuoH$E<H1@%edl0k-E=G`mxQ)96(J8
zu(g#t<6?D{)mn&j0PSchsA#R4YHt7@(il+A+)ORvm#8F-FV6EXc(8^qqIA;ub}0(&
z<GJpDq9V3b6@uj8*3XVjo_wM@oqhhDyMLr<eRNBBoZdP&JMp+Aesj}Ln{bYQar06#
z1U{@2fH>`<rzD_H@BO2NM{|CwP5lBJ#K&^!+@|?}tG!Vgh@gVHmLB{$oQy-Q{&1#0
z&t)STz@3ls#s%NPAvudK-}u;T`+j)x7X*1v<kgn^@p9lL*Y(<EVbXQWGI;>UN{X)9
zuHB{`@(HW{(xSl@98}ob9#2HEA(}tFGNrlV`!X-nB`i0<=8~t%zrA+z)8!lMBLlpW
z%5@L(S=)h4GZGvhI2QA01m;m6u0lN*$bp?r4{P<c+}BG#!kkdlk*(8fqQ;XcsN1cK
zXT-Iz+xxL6)!~7ZxeT9Cr>>?lgq!<}I*(iJw6QuE+QtGZ+O<g)qMDX)IOZkpUSe}!
z=_wTqc_R7%-+d_)@>C+wayd>LYwxAx4Y8izgWrw5bpe;IvQ~tOzHXy)JVYy&4@ZfS
zGi^2lPfce(QS%|NvNI^_1KkxyV-<f$SbqV&D%fPi1Iey2{?;OZ(ekKz^86~mLSz(3
zp2d_stX$MOqQ5-HsudRT=>GE7tA3{S?v^4Xsh&CE4^Kabdcyv7DknR|$E=q^XeaK`
z8cmt=+R@wcwpGB>*T7HqUrOrB#o=Dj%qQ<BgE&X?Z;QMgD=#M(n?I-af5wc*M^7?B
zU?;^|t3{njsoWNQK9<3FjL3Zkbv&KJIwW;_TXF@i!tCTKE!jfO?+MU}BTy5<RG2DZ
zpv%f*g`HL;OoX>Y7e+NEAVEqR5$P8CtiD)Ij5shev&$Y?c<edmiSUWOS->O429FM*
z|Ijq>qk<nN)%nn5tNGU+t0?@bEWNB6AGhu~V^w!*9yxBxI%&#wa(?1(pKa^*Z}%P-
zdM9@RFKt8M;UGTIRei^1WizBph4Nm&Q_`TOIjn3Y!}GQm!m7|AnX$#KvldIW<uJAF
zjQvEP>M*@t%MXxQX@uWEMqDe^U)N4wd4~``AQJ;%wx1GyuydtWQhNB@Jgx&=*`lNF
zpRZGrnL>2*193V%m)bO~3ydCGk*9<v5B6rjsk`*oG42Jr3`aRNAtTd~<~(C8S-zuo
zOf%gW_C_`!TW_I-i$!x{s$M=b73rU@r^TDY79A-qG0&Q3V#L0{eXYc^y0E(m1<-*E
z^S`$H+C!$C?HEo_ksvl^VPvSUX{g&pdcPmCUS3?EU%!y5YzwZEY%yTYl9AL9Rb^Ek
z;pLRj5+Cap*6Uu#c9cZg0EvmDaKn#8&nhWqzm3ajmgci{{YG%i(_A56iYx`vTE3Qe
zn3ejeZ~8L=Z1;R0$W27M<&XFhbO{1jtuy?VQMdzI^GkU4&7xKcERK{h6$x6yTYQi_
zfJXDIf>4QVAC=};1KaAu*h`@hX%Af=vW~y*d1H5B)l{Al2<zR+k(W%I-kZ8vsq0N+
z_*wV#%S&TJ!YgSXq=V#Mt7M_gd4TzIC)}!)EgXI<|64z*%f!nw6Zq}?2M%Sfi<wx_
zJJ|;Ie)D8UP+jsu7v8a}Eb11<d~TrUxL^m)N5WAzYn}Kddsjxg2T{vLOLO^PUJv<?
zm(T89%Vzdi1hLke^L#fb2S<joH^-p^zUm;yI|ZoQZG;3Qg09*F;cD)o=&i1ATxro5
zY$eO}<u|#M_H)j6!InaHl~6wDs+`ehRZYu*T(%b9hG?g2r8}akL&|r$uG567Ysam<
zfJSX4zR!cyHelhS5q=VAmJ)oUSGYEQR8ynlsw44nDWJ!=+ogbLNLi_X$+N;Gp{lNB
z7U0uN=olc}!8<zssllRiFo)1K8N4Ivz<G)6@qu*A&0>tl!5u5U3~`XhPbP9-{|8fk
zo&gNAp+Uq{l!d{s+qQkhRomWuM$`N}hximRCgi(yY~}<g5+E5XC=@K+Via{$#p1*-
zV3s&ad(~;#@~Fkx2{Up1E?$MC{F(Q%lAbqH)#v!{S9~5~>`lJ6<QzV6;Pf-Tw+*-z
z+D><-&DjR`2>JA|SKC^kQ#+~H;4cHs_|=WP%y{C>c%i}YsYt`ml|`u#lZlKlgY*2a
zI!`+Lp}ONlt?RnwyokW7FUFCc3>P@bYFT`B*csRXkhz>gfR59XoHvMRTfmyB@>aWe
zE!^>u@a6^V2`|>l^Now&hZ2aLsNKQhTZm2Sev~T(ef*7+S=f6W3T)W%c>*{_kZ#v&
zE_SeZv{v;1R_s(9et#p&&D&%n%Q4qAnOSSs;f9D1Qb5SK++<JZyhVs|Ya2WD-!7i_
zm^BQ`=i+0!LSDIp<KPx2-?H8hY&ot6!aat~d7Cp@$Jkk9<R!V1gzFjb(X9=o_G8xN
z@JKeGY^rTg>cNlrO#^@!aQRp%l7N_*@Q%?o#gtc^To8RA2|2|Pv++Um4SZ3iCC0T&
z%gu?X&q~4;Ll)b~uFkF;s!W^CPf{kGdlnlsgYoq~yNd4RTSIQPi*e<hishuh-ub#|
zlNN1a^eF>S-&&Ch6Wf8)HU|UhM4%rw2eWf8WWrZl#dHse2qScTl1d_hlxl>pJ#FMJ
z>>O9{KdahOpOA$(mS~=`5G3L;meta?YNr^CspMP8g6efD5Gm=sAlf6tcDyXpZYb}C
z>}3@Te18Kz{puGRx-FonEpmo>o`|U!mY8)wKUdC$$^Oa*8RphD;SFvv^nBEX^!zm&
z%sbBN_W3sjU?f=Y`?m+NsU=mP%|p#arqY+x#P5NXxwLR@Ww~1ad&AJtb(y!L4}pz9
zrWxp)qrZPd-Br<p&?ohe3^+6EF0`x>QbxyH;c0}Z)*-`W+g|C4P7oer{t~heS{mX+
zFgX03|MDN%(-$`{W>?C5d<H!a;R+T|*~j<WiBWBMm=0PkEZXEFx7}@dX$trrASZme
zTh`!+z0+5g{&RrikAzB`4Pp+UNU6TuJ+M%*f>jrPtIJ1%P1!N^2=E-`u*FfvyeGj1
zw!F7~%k&<diKS5Bw=f~1dbB>lSFi(Ersl4+^H=*Zinse#Qpqkd38r>0W5yksYc*@o
zo@Q<p<IaLBDCzSnHmaMCczbV-P1Dkq%PY#$Nwj+!j5*+H&#`nuM|<+l4E$6H<r<A{
z{K8h+o9mg{BVx6EPbD)ra%SiaY^PkYr^xa1Zw`9*rRODXBXBm)GrOYHto1LU5>(kk
zi=F$kAz0U>vl$X$v74I{*eUU@C)(H8<Yv_l<~)!z%G~3M1zV%PvW-#G_VCi5(nsss
z@7iqRT5;Efs3}gc^Q16d1I005PESCcdbBFh4@Rq0xSQyW3Kb^t5p%&e(@xI3rLtNk
zio~bW;+71IQ&_U1oanWsgSw_q=3qGA2kl?x)UK4D+j7(2+MG>Q_B-j&G16ZjQ}*NI
zwu=R27Gx1DzY#W5I<J&Op%oo}%d2ptw0nJ4%gLQ0sb#fm^+_L%ea)h*ssHi-aZSaG
zDqiSPnrMdQ<<}Ru|M^?GxP329Q`G+Gkuf3{+z~m1j7uunIv1#guTbQoUqG3Uh_Ssc
z<Tz~j1t;9mgAJ8jiuRdUF!?*3H_ST&y^M|CvK%=IlefNmUl&}_eA9_7%19RV$nRlz
zQQ<jcgtK=at`_&VFEqkujDM}saZVR?X!n6iL;p>NkkIcdGlu6*jczwrGI9Z9SUyiJ
ztX?Z2Fq^=r8wr}Zbz{<mr!~=sK)VT&62ANDl_Cs<*A@7R9k2)LVc9DZOQM@ITRhtG
zP9RhxM#YajUo4Ai3Xn9Q&kl;Wm_-2*XvWMX2L&P^=NY?z3I1x@F%&i2Mr6WzQW`#k
zClM>Beuk^7qpd`*N-JH@wMk*_>E2GM=pm$hN5IdFCdGrPfj|m;thL}U*T)bqipgy3
zqKt#isV2C4^Hu!sRF;BDh)=A9lIus8McD@*{8fH7x}>R<ISO*+Yx--(q7xi+Zzl})
z6wHQV$P;cd9IiPt0WVWO`-H=eCo$KFw8Z2KUZXYH#f;%oRNGIY(Mm|$S<4&>zr}LQ
z_8p-OzM0`Bml_EdfK9X+U{;PlC!nr<zEh2w*MBN{A47FahCjmzI!QDaPhK@0fg5gE
zo6SpJw^vT1RYqT%ythF%%Y)e-O#<!sYsyW_`}((_N)rhIzpHR%=H`})*Wuo)xA06V
zcD$RCMaEys*VrkBK<#2QOxu^vBsiaV0qG)E0o!B`qP?oFXIn0KJC$3D<B;Ib7u<P)
z1qB!`s%^8~Es)@h-(9_y+d;Y+Ua1q;a<5x~cbc8m@nml?#ihK&KQh$V=8qlIY7ZPB
zOuC5wLX?$7cts)&0JVnER#kPQgDZAAdRLbw6vUKz)_jHFz&l=ZE+u-Y%mggh#|5Oz
zIF-IAV%n<m(*2rH-!FG&(#oI3{SbDys|-}BjaNdYVV7M;yp43|OY6xyGkY242RGz@
z%^J#gf5pK30+vB|U_+Iy!Dj9K(zU<r4i5KN+`UFbjgcFDAGy3QA|F~U>0-`sD&|Tq
zEi>hDriR#GwvM4GAQ6Lsx;Q1cJ^D3`Jfz5>Y#+D>HNWX!AqTx>rVW#|W7)z>ut%Gi
zJ=7_6R$V6CnI&utq&ay`)!mNhxQK{Prt?9)9#=U~%8nDdqx)5?*c4<w9-<A3gTyJk
zj2{;#=6(7_yYjAcd5en=10Dt)il6Eg{u$IUSzv_=ekA&bD8}>AQzO;FxGooUfo;#>
zGgkOiqDhp!@wVcM^Zvw~2(&cwrXKHN{>XesDUn~dPUEt4>8>4eVU04nnEuuDxYCEf
z!H?Z^cdR(Mu>q5uc};0x0aZw)PlPUGeg4%YkGUOzw(=+mJzox<M1=MGli*o(T$k75
zEiEIfJbo*Zu7c_G1M(07_YojkJjoF?Gs2~v@Nui$W2onBoA8lDS!H4&<fq7Irg#n9
zDLK+mPjCo7(nKz7ya5yCtZgwN701GQiC%ku2j;YmJe`Q9@XX32f1+jjCYSbQS65MM
z8iILG3QXIq-tg<ntlo6tu`8yNlB}n_%E%RS8#TL1QUx2qtG@<vt%7Tk<Y*exnYdTA
zzAoEQEo1+lnY#mZ_k!nWfD700Gi}2ADU9P9xmky=F^qt%M4#kQ#_0RxCoci7kO*%R
z62}iLY|pW(PG(CoGYNhA#VW&{IO28Z*h_of7JkItn)$^VX&Ma+M0E;uX&b`E6XJ>u
z!e9z?dJ96^17edEf+q`lHyjGt4Jv^dO6dc&2o2Ret4}CAfcX9!;6JB={Dgu0#|HDS
z4hv4kj!ty{5e7074Q1f$1`PlR;^+kc@Xy1)R7C1!l>bBG=LGHFRP2l$OmzRH2lxbO
z@L%Ym{9FwI@DIJSTVKk11ONbTW&i-9|5DG;%}v)@-`s}Q(9Z6kbNz?*KgPe!wUN`(
zb#J6LdtX-}gog_e4|d2c9{we6gkass4YZeg>Ix^C8Y^E-Je=gCCGGXPxvUK|9$_dU
z)6QjB(Y3R@t*lK`ECgIk%%__ns)?hIoc%+BuR!F$<s&lfMwNkkVW&lPyQk6rhQr|+
z4bm*iBVQ+|E3?JV){`D>st>+n=L&Pn_jJ3p3nA`&+xor+$W}z00mQM!%I9c})2W?i
z=FM=vu8f6rbs#$oB0k7hSXe692GkpARTjwlUVFP_`JCLx`~wtk(+DuK92rkv+Cmk!
zDgYeuRce<UA#A`UE}xjl17L{|%u5o@2F9LV4)0RDphC>xXh`B<t1icvv5yK31P{D?
z1d-d}{LSS7<{ltuz7RoRz$ZXOP&v7GBC{P%QyiQGo{(yfEG$(30~G!W20uP1vu5PJ
z=iXne0fQZIO;`gWE;U~KuVll%h5#pPB+@vf2~cu5yGknLdb1gLhGG^mk#}rM^i1I$
z9uhH@dec`00kVS=_qujCMWceD=1;^IgCrG18K-8h-8Zm$0r0ADeUExv`Q?J4*hwS+
zIkDOr27lG%Aa;3ubEt)?pK^Ty)<e*E3CP~MlmMfBU~Wsg0xM4^J4%W$X{dqGGfXoz
z@(|1zp6`t*J0S(PyuWcQM675p!T^RVK7v&=@~hrNup$mrhymoS7F1nm-bl(V$}r~Y
zFdHs(MepKE0s|vpc1V8ju<W{3{~>yzz+jDC9*}5v)VB}d{k@&=egLAAN59Rm6*A!f
zKIW(WaD&sygXX40`+WD(t^;H6mmbWfY&DZ;*}h*i_aq8a09e4Uym=<EN^BekTCUBh
z7ih=Mv&i>>TPSrbdS=mmS<5*VQTmL?VBm3(_|DB*4ek7Sru72sF<-CV53{FXy-keG
zsyQ$Tgzu#sK0Ignw%!qcDda;Y+V-LYU(O~j;(C@PQo=_;i(F&*hAOzF87t?L-Vduh
zs-cqz*@CzV<1a^les)Ofd{eD-G=<rx6_ClTzmXGoVO%XhmJa4oT>GOdf#<zBlLp9`
z<2ZjV8l=xr+JF_0pvaO-iSuiFKjL7ppo?!`9SodTtZ)~+nE%2IX9{#nD%*f%&(Kp;
z`mI>A-sVhu<eP)#(+Q`*^x@6y&PRpq6Ejk#Ps%6P&iGf_qs2#ZVMH;l32t{>xl~Ph
zj~A>0BEBuuPEfs71l(!=(nY+N19Ql#`8ps<l;JfYQZ|hdJcf#V8is?c_6>sx_Fq)c
z?`O5zq(Cp2{hCe+<&gS_k^)u<j;ZSQZHh7%^n7`S`TpWLLQ-mn#w+83+T!z93xs|_
zAo)et<tp&Le36x<>u1pl&l-8*vnsXjn(65YseyBA3HVB$a@9b{&dtgGGWdvV8<h4v
z0ZX3_>FFMa>9}Wf1U85`-AMzZP&)-TIDM<&FVWOA5=|?V0>(<51mFAl2SH8~FnL-8
zL$#?`)GSm_o!9+z_4anb8_G6Y7w9J6*znoQ(1Sb~e(<$cjRV?f8_m)4khF8g8g!h7
zL9v9PYz^8AUFn4u0UG#1XJSYT6q>$HH$ESn)&)n3x*LmUWi~TEpuUEfec(7`yGs@R
z%Mm~grzDwjZL$dI+R4*o_@;z~8Z#=R#)vszYt%}$dLB5#RKHe`gD5({OtSE*d8>x$
z5;MCvafKcdR&>5=mZ=+wV=i8=DC=hadF1KZIdt<InK=(k{}l%`=Jxbx5whdrd?Sh;
zAz*k9!QVJIPXx{MZ%Fo$o;A#Qu{jl3%xi%f_uyQb!JbdOp7Xi>IrFnWy$N<~mytU^
zK?sj;07D}>+<dF{qz~6>Nw-Fw^4a2|erf;b+aHPKUMqn|1Z#_J$euW^3xOI1!BD%T
zo(Wkif8Ezw&tpR|{?J;4dPnvuCQ?!(>J0XG+P;lnPuw=l<Ixkf92s|JFvmAtE>4Q$
zvg8JsoU4EffoM2q{60&P!bC&H1JxxVr(!Fyv%>sMk}^xZ1oK;V6Z75hi}TuCFkiU1
z@iN300SK7%Y1S}&g$O`Vy5OB#5A%8p*5^0D!O+TaW0~ST>LQ3N?^F)GnWz+sIEnHF
zyAI(eOPUuzwc|?6wTGGs9cZJ>-Qo=&zv5+6K;z{k%537-hFI7UlT0pGpI1nMO{sht
z9s~U7^z=h=drUB*J~37a51dN~X^R4wtb}U+kZmwMjDu<ch|s>_)B~Ayxq&1ZA2{_Q
zEn1vuIuJdL8&$#$lYzZ!2{T9BmbD%~Dm`BuEc|(I8awa#^!U0`qls0oKh>LuGBuSa
z{LB%IxsbvFirT&p-b<s(sTz6ko9vgrpc}#}x~a_|U|mu1WMn`7Yh>pQ=Uf70{Cg?C
z5n+mlj-d`%HP;o-M(WVR5W^J?YmiFgjD65hT6SSrmv9JdqrWmMwk}7Hv5-PsvFi&J
z){5M(oU-7o^zWp+tyPKb30vKR&u)V-E{|~r3$;D_l%tsyyVq}@ppf<moPacH52JZQ
z+)_QNSJy-{eN;T9=w_g2gjv?&eQxJh+i2hrh(Qr-N3_dR)v!9~>!mu+vPjCr+Nqo@
z7ExXUX?zi?6|8XD>HIykn>|7IJhPO<%iHo5n@X3p$=PttmMNgXsP7z0c4@<;{9iYc
ztI=$Ay=xWQ?wz>)qzib<g+U?bvNi^#L^n@y?6wY|U+mxt3IeW~IPtCi94y$2&Zlio
z7woe{yYVLafu-SKQ%2Yh0-~j7(gG>12SXUA^2^X+#+iuJgz%JjR`8lO4WT`sr7?pN
z6A(m7rV4or=-`6}<ww!oT{Tws(Y;<HgnEd^(E-%u*7N8!Y~}&7P*yJ4cj^LlM5Wi}
zX`Xc{gv&D!(fUq?wW?Z|hl-R`bwV+&F9G98=aVImip7@pJ3M+lvl}jv#YlQ-y^E~y
z6i7B<09=AJu$*TrfnfULbCYCwjZEkA{Thk$YPum7qt`M+V|2ihN*9Df+S|Ms7NF0)
z1)sa+JFz=DtxpkOP@4ABkmrp+zFcr+Osw*wg>&_Hrx@~_X7f>jcu$f+Ho^>v%#Unk
zuNBECzu~Z9%5oVP+qCPU)m_I!b91bz*ij8%$JBEm(m{b=+d4(1XmWRIcZ)<&f7zX$
z{((3+WdZ8G*smF(SGxc;y+%%9QN)73;Z#l{V=Wnksg2^8+_N%HB;u~ZihazQCE0?;
zEDh9E<?&v%h@eMN$wH(G8~uY{2;b`Z^Tl?Hv`6PE_68JkDf)xq^+I1$WRe{{T~sNt
zUeecW%T;8{*<ZGXvk~+w(cp0Z3t*Ix-AXAh^U%UX$pi_$idX{#J~eG=q#@KhR~1+Q
z-KGV7F1ytcBx#K~eW4j^7B?Gse)Sdi8u`=~mL^&=M|`CNyzF@B)+fE<FK#x&Hl+=r
zSw?biH72T$-eJeW?U@}<1~Vc_imqK50T3WQLsHb&phMhRkM{EwR>J6CC-BI8N4~#I
zr#{NG=U~y7qrotaQ5xHJ5PvmVZ4cus#;l$0aG;(#4Hg=+XN9#H<oJ2BuArNch-e})
ze>LC&8X}T^3{YK?6!g`J4}0|$9^T>lEn5-EV=6Q$A>Nb86a3WCC51mdjWD;7mNfKD
z9dy0j$p2QIVRNGOMbEWz918Vn3kij@B+}fYG{6rEXbcXOF)uTtju56{La0yk^vnDZ
zP#}%UCNQ^L`Rq`ddjN$dA!{ZdecXc&?+Q5aDU~v3PP&WR`dpnWR{rL?RiP5+nAM%q
zcGv$alT?D_jVRZ*iw5$Jt-%oVJdaP-f-+9vp}J5<S4}jCjaCGLX2QtD*uol&h*sIE
zim8zN<y?e*6Ry}_U7NK(35>bcJ=Fb<s*UF{=gTz@MN-DXOITKQTz}9+mQ-=ta`6qt
zh=rvb8D14%2lpBo>GLg#`6;IvI`_=O7G9%9Qv|lu?7X4pCq3Xa>WGDrUbF<2d{=-V
zC1S)kT*@6(6Gxy{`s<+v4UQEmk&sz2aLAIr1)BuMi{ND<_{Nx(oH9KDU(ho<uX9^;
zzpNRWK^n0ie{b2WV96|Tuk^B|Lq&n>F8<SLl{S$!#tvl``3wXVvT=9_f713+m?<hi
zIMo}D$Z~fop}Q*^E})0&SKu3H7(;q6d*LkLlcu{-dM=YIPt25ST&l?lwjB>>PF#Ja
zRx`$#MQ0D_5%fEyHa(?Z8p3WOFXs%!)}xiybM3s1{eq)z1?$U?9b~_b#<l_%Oqo`b
z<}l3`;TB8=7f`8qI@{MtPoEFMc>rpShb7+^*T};Z=-FwFY8s7#z2V(rt%fS`ki&qQ
za8r5r9*j63p0|@!)9m?8F_X*&t{|~Sps2XAnCo}{J&{1RqnU8AsF-p_6NT2Yt+^=U
znu)7{3}lQ=L-9VHkP;q)dO{Xl>*VFR3~xi``@&vTci7fu6FK?3ec>H_0sc_nN}?et
z!EuPd#CCc?-UyCI97ie@WRaWmyKjVAevV|ZJzX?eEUh>!@Yn!dY)(R`lZW|sgt=LJ
zT=J@SSH9!MN4xZ+*{Ma=?AyTzw2k$&r_M0mDJ}dZy8%)gx0sN}!=H(!0EL1KpKaTZ
zbPn9L;{#mq@B`tNLZ25fiOO~);5dC{tmKh17Ypsi6QGvW0%(JHx8puJ*v@$+&&)JA
zEVRtcS{3^wy@W>YSXcVh@daq{mtUk^zPs-!7ZpXcQRyuUc2bI^b@z<F8z)Vu<8i<e
z-e(^jD6h1($;FC8N~zzbK<hb#I_gR}CG5uLUuA`+@sVwC>8s$ucVV^FlS4n})KA}-
z1eyp-1f0=*4;H%8c}M%3*Oo{Dk&~ZW&A!33J@A5i^OI3u3siZCF7o#|zb&9D2cnHe
zwp3i{rRzWRJ>H1a6SKDJ+PAa^BoK7gYGZkg=uA7;tl(53i;4wGc#ji&Af<VhTC_8H
z*AQFd9@5rZnnwgdq=C5D@Xzsa)k$V0T}Bjx#pQQrm;Ro5(Uum!qydY*l0uM!BeltC
zKf1s90guG)SmI%#qw+GU?_zmtc$7fYPSt%Fkxvo5ZJb+hgxiwVlcY*|W9jzo*#-3z
z4|Qu2yuQTuwC08{gwsU&HH9%b=k(?)PW<ig8I~2u>^%7M)o$x%4^W4n<)`dVdwkL_
zx;_l+yC6H{JBO3~_0j%)Yz1}n<ZnwzsZ>DNNiNbUFZ*P~Fmn8R&-~?<*oPtvFJ8n}
zY%)N4)>CA1zw0R`sp7ZsMifmgqcPpl)k0F@BvkS<c@S9Pts@l%+b2aV6nL^=;S%`O
z@q9IxL`efvW2c?|e3C+xXOq*5DhX>g_tII~7^x-JpM?UIH;l!|kNDoEPkFg{W{tPP
zbLi;LNIC4NP1!=jqY9-(E-q)fUvtXe?z{D^XI`U+<b0K;tGX>Y4qs)utIjU!pv>+8
zTXj69hojKDbrFK1)1a#;{imC?;l*CUt8y)Yq_MI|X)?+@Je+$Wj$hBXvL$D&<<p90
zX^pG(nV{P4Ve~FMiOj?-0wcEZB{s&qB7#0+{^R%ry9NFpnqGPYh+}Q8*i4=w%+fr-
zgAoUO*0|HAAj(1M*^=WfkiCrLfL`w=+__lI+g&o)%EYbsdihB&B_LcOsZWj7LX-5o
z8cJiMc8N${sDrmeNVh~cCX}$u)4R29y5TetB3YxLW>AG~uTyy)gqsa6zni3f`=!e|
zy(>YzF0LNcC&o`JxZpSxNC&g}G&k-$5l<In8Q&$SK0kl3VcL=~W!7Q)Ff8L=f86bP
zUQG<7{ANv`aBai`YGpwhrMg?jKl{V?@^6Jv)AEsSN<aVru*d)aB>yE&5t7ljG?q4Z
zbaJG1a&!6*_!Ij0e*u-j<!ReBdKB;*E}uc<^<11jiv$oxb8xm63T#MfzJkq)Sday4
z5kwTo(zS11?76tQu_-bk+7U*`YvSWhFA;LMPA<A=49pnJPti>hGFPQBae5PmsJ(PJ
zes!zli_#U|TW4k|!4%Qh%jXM*KWfkQbqDJt8NxGz{j(6jXLqo!NAEXkyf?<NFB93G
zR(Mkz5D43l3BDrC4<pK25(b=UL3rP@9I)4>xpF`$cXS?^vbfL5M`}xT!A+2A8cPeh
zF3dGD*kE&Y(O-2CgwQcPiP?33{Q7{0g`4#xpbe!=cYR+T8hYmv4$;)n6dSR+a*XY5
z;-0rfXjWTAwi3}B50249@^$7EGc+%rsK>iKew+5YJ+obBzeZ)3VlyecF82;tJPX^4
zcas@ubhnbr(|HrP-#RuMlh@A>9Q8k6nlyv;uQ-^ssax|oN2#=)``3bjh*I$~?o@*r
zk|yg8h`|~E{iJZ9M_W82?#}t%?GWu=L6<)SW8O)1h<-%_|0XUTOCZA$o3eMZE6XtN
z6KL8qU*+VdgIo{}q-llF)DTu-4pWGYpWA29A7s#{DY2MR8E$Cll2~0|eUupko36H1
zY;v>zlTgV>qj_TQmC@lE-YgJ_saPQ4&K!4|*m_Tb#8{h!v-F)w1*=ztWMbjJcwY!O
z5!VX_bY$kgm{2sD-+-#1g$E=CeW`N9Tyv`xw-Ve(mM0c-sq!{rcbc8wKNdm-rVL-5
zCB(RyCz9!bRfpz$7B`}~P#ThFreONZd7QOakokwjeZVVM-(&yhO1_D2lr7sI8aVMY
zu>S3Z{hz<4_fGS6(h`%DG|{e)j!t*>Q85m1H(~NO@QVDXE|3n+53>h~@^()4VeoLy
z4!1B4&TzNz;R_T}GPI*~;dGJ{Qlrz02M&*pw@&jj2YYwIY#bzw%pAnsYQ3}5B7P`R
zwQCx&8i{DS@fuqGM#TRISp9b-`tM6{F*bCvb<lOtw=uG{{@<AOe}qLNbol=e{9sW4
zCIA4kf4eRJS@Zt~jjoB;WiNN<MITE?+o43-yYQ`qU5^p0ThZ4*+_5`4ve%hK4tdbW
z_dMC$ZQH6ivxy6?Oi9z4k|npDFRJ|Pi=5mmT-+bWN!E>*guK1Ia&Lq*M9urAG9oq7
z`YIv$9)`fn;pj18K3vm1W~_gsupTxhVu;y%<8F==a0Z%VZlEqsmSO_MKTcfILy*Cx
z1SJWx{Psnawpnu5t^H=PSEH56e~k{!DwD)cf*KJ)Vz!}*sqcAUHe9mtl+T*se0RRO
zwmjE!&{s*g1u|4|Ik!aqCJGZoG>#3Oc#O*@NAdvB5rTS2ocu(Yb4%WA51Xk7F*qw$
z-`lSF2OMQY1<4v3A3)}I*cY?8gQ&*{Vk$(i@AKI=7FF(ZJDc{3VKD-V4*{hem}X=M
z5<#l|pyV}jWHXF2wMQ6uE@8MaSO{A{AYvem%cPi%J|jI<W00h#%YuSPDb=AzcCnR*
zXD_4{6V7A5=g}V<1Q(AqJ6IK+kCz^qh1TLj30qQd{0AIW3P%G;;ndEv`-ZO*2d)b*
zs%<7wYF{%5F^j|?M~2XLBG`tVi&|RM5N7EH=&al4d<dK_0YPfbB}iN8m*1GAD9_U2
zzLUyBBB!kL48%@``~zkjBOt7lfpCCFA%I~DRG>HmIy?M{>OX0hcM|FTTN1sGSXYoc
zJA;~#F1&!R&|LOuR%IBl*oWcG2-dpixVPrJcD`xd?n|UnZ`;An0KY;9`}-T{>9{v`
z=w0YU3%(7vT_zC0$LvuQcby@3-qLyaQucZ-@ctIU;}g+|YdI595%*E%z}#{I2kU_@
zbgGfZN_#iddF#|gR5$fp#B_l;8hvEW-;V{yS!2J7C9v0x{e+7(_Tn;n{!Am&vR%ef
z2s4&$1^;pjBI8&2x=OhK(m?m(byP5JVilj$&W7k~#eEeG#}3wdX6`0dT70ZWu5qr(
z4;_V^>aqEuqhD70iWR%)3F5@+!(Y!Bes)M}OO4LvT*8BHqU0q{OKxVm2`!({c0<Qg
zB}`Z`RxKCL>(s1q_7}Uuvg0nYx$DJ)T0JYZGDggGseJJQ#=FeC*)f@L<&^=y@Zp97
z6pFXY5tGWl$dzFvEeT!HRW`0~+Z0$nchU2tp!A_rZ%)UCZV5{h7fmQ9*-LttDBvZ=
zF5$&m7X_!gE?j6Yb;gTUd4KSz{RP(AKkz7(<_{i4bHKZQ8x^KV_nL4o8AS`40#&<=
z!9~&mM8<RiEzaKvc3x>yB%9g#x-Jywko<rz1{;IH|1^WMM(+=-eKQRA`A%~PFWnw0
zUyBZWu4YG#;P48qH;&zU)%z)U%0EWW;rtp4%6)IgZi~C#Y$e1n@2e&~$j)eU7O=Bx
zX?~8tcke|a{^sHvG9%l#p=LWOTwRD6C-(DE!pbws#FxaM?}rJn`jdqZi_QysAj&)7
z>T1tvKA6gT95J~1w19w$7_yjf?3a!wvk@{lxvvDEfW+!L%|_l#q?L4R3`s2Z>_rVE
zI1viQ(=u9V>d)qi%-(anXsc`K`Mn9u;UBk(Y>q{a40YSB4bPcid43<r%52m1Wj9w}
zby-~uAzJ`pf)py=O>X04DtPuSHWP{!c*78OJwHELjt>61oR*yfxc7dC@Z*J!cgHhT
z49rH+(`G*I7mnyPM5Lk4)ElGF6OEXF2k8jOSIV*KfU%{&*4NQICoE(RaJQv;LNLdo
zvqj*|0KEko>_wcD{{<(+Ux)W~*qew{J4|hpT)(|#gVF@!j(fJqM##Kt^NANvYp<(t
z#D8^F34qf&Xca{YDoCA-DZM#C`eK~;){J;0D<~b5x<`an%t5HMTlnf)OVMHAyhA?!
zF#<DQ0vS_O64(6LzwhDAiM-o44!<Kg!eS5mVA>ffTrf_s|63~rmsG87Mp(LSj_O?4
z+oZ$bcY)9E#(C{V_HQ_N@nT3-m{6FOOSbUr*m=L+>d*7@(c-U~b=F-}*pw2YB+WR#
zX6c_M0ZCE4*~t{~$I3sv(;{5cJ7943??K@R*`T#Cif&xPmbkc1g0eF@s+y%85!IsP
zTYp|O$YqUYPWGg*VEqYI@OPK}S+}R>S+}>gA^JmimyctCm!pTnp1v{Y^;R!$T<{+c
zBbGS?j1Qf}I8zH>P%K96S|gajGJ}d<kKqwWgMdO^f=>ezaj@%cAz%ys+u-HdztGpw
zo$0Lb!D9e1vUBs#7(>~90yaRVb_KT>2|~-Wzr|}MVQ#pI3aBYkH@>0b(Y9a0zb;H_
zZ7B-Yen6#yt<66`<^2z+#OS*PV0*_(X2(J0U}nQ%ZHRWA*;|PxU!q3h+Cq4*`U(d)
zKlN`=VsNxyj`NF_F7PMZjUiz|V`*8Ywgpk09Bo>`cw5qn3C}p_2DQ2HJg~El6mrT_
zH<8@+QXS2vcyf?bHE{!v>i8ScWhO?UI~p$k6I4T$<vTT%7&R_AXBDF}(8Ty)IMJ5<
zzJ(JQ@trg44qQNWbJY)R%(X_Tc|Sc~q<ws7z}#)4`OGz(0Bje?Y4(PqMqf3OKthVm
z+duoprVrtRvqhn+P{vM>KgdKyXK`NPcGYTbLef{vLVY97o9pLVcf+24xGY_yH#XvF
z3@c++lH$Bkc`CdIu}Z1d3b@p1hVB<K0CAs{iX=>XnlHRY{4|!PJBfSBk@VH*;SyYy
zr@o`XSuC`%B6NSzT&d8v6)4Hs*M6Zk7D;OElZxUQh$2B#CB4@!I{|OgvQv@Wg9uZN
zqYAN1&WMocTq}fXdjozf#h0q+D(E~l$F7#^Gq>>swuGc-Frda5G1_Yr3b6kB($m7w
ziaVN~<TL?U*z!0p(r>jshuN_ckjlH-A=m>;zHATEKx>s3T<Gx1k-iPg8xaS|OSS4)
z#K*6yr7HLl4a6)0^U(Bx$$lEs6H_5V4$Dl5j|QmXO7bzmfWrK5wQ{Rgd5Oe|^-L+)
z(#)C5CGEi^4Nq{!lW;F3{x38f((sy93VCYRB{L0VC_H%720A5BTAEKBAa#$Z9=d7!
z)MJc^Y*5qlAFvt!1n!1e7S4>l;1IhylyP9+<gbW{=L$PA7d-1kvWB@p^>UapOsBa>
z(v}y_BnVn-EZG~<7s8F+FQ&Uu?1q!2U>r!x#lri*=XJt`+%8sGD`C0OWN~x39(`Iq
zl~WYW)Eq%7SsQsH9B_bu(?mIY>dxUz$rzS&9fsBmELz0EXq~595-T{<+U<tM`1h@z
zN1eQc-McAHSZwc1S;gfm_ay*J1YszZo(_CJvF)mkql=Q-Z9}`&duMLe#^)C;0;zl8
zc&0slJCij759L9Iq?KCXBP?`Kjk*h|Y-P0j*t8Q9#&nLkYBd$4v4{}iabL`fmeB&g
zto~uGG?7__QjAkv0y3wN`X~+C)M?#rGB(UZb98ubf*p|-FBBWp{!6!%)BU~@>k)`t
zJhLq8t4i74gP6grk{Dfrw6Ns*uhWu&Y+rb(GMaL!Up>0`M6hHDu5-BbS)(Co{s~{d
zjYDiMTKy`v89d5EA;I-Z)Lt~eIM&o&be~!fI?_?{tKLJY&cfBf?rtAiFEs@Ug4$=)
zTe5tATGaC0#=9UXVs}apd-v!a-bYE=Ir#Id2&>B(Pn4_qq4=q*P<c0mG%Z&07p6YS
zKB>aNNf&}T3LV3+SB$PX296X@BQWU87)f!9T;$)-dm`6D$|NNn#+Il+8L-w9xYT!3
zloi|}lUT#HWxGn2>DC<dINcJoW_^mxx*~igSe8B%N%GFM@o9R<JWhvI3;G=i`*66R
z261pG_)+bn-x6@sp4Au>;3|3Wed_z?_K-Z6lpN~n2#3ohOGDyB8rc}wH`a>Rz@%cn
z3x&^h%T6Ncs9U_Sut0aX6NtSpKltSTQED19@5#m@MQY@9g|s|><!-H%AT7sBL3Nf8
z9ryiXxvea)8fYLq)cu_k`qfM$Z2oS^Cqb`1NsdO=+_<ghGBH4MzyVw_$<P}nv`RCi
z9M=+4np}LqiUeYr{l`NM8ay3TnUI-9@SYSyOBWf87s2Z)@rya#aPsISWM<2vp?Tdb
z<I#nXmU(Y4<b@?&1A9`Edyy^9RldwwarU5ub9r6`JDSKtw6T#W7YqL-|Fu$*`Zv3H
z;OH^C{m~co`|$cGL3DsC>2E$_hN1*eSxl#}TaBhmM<)|+1o;^JFwEpuKsFYDsE+kf
z=ZM_WC+H0Q4m<pZ;8~C&L29yxuwa2No1@RR5YrSiPagE?GUGc36-L_gyRp?=e&af0
ziuW)3J~16<SbkITFTEmQM^{qiYWzs9GGV}9;(zABTo;~FiUA$qep=p@s{|o+iA5qj
zFra3$VQ`>)KKymk-$>K9R<ib)hQ>a&SPQ-aRr_hU`1UeL!0CKO>aarOs@;7WYSegn
zwUUN_xA`q6steY10m`{=i41k=pHl9%<Ke2Y@7-{_wb@2atmLVwj`3hB3{5@8fE;^^
zZhv<E#TrIrc%ps<p}H%5dS?=pzCutuH?P_pK^03j6AoCoM=maJD<&6mm6=Md#mC?P
z{>J76F7K6+i^rn<i&5iw&;Mlz)_=J1dUnm&HHjw}PN!hRw~K6zl|Ed#=6XHqkK<?4
zab!pSy_9Gm_FIT8;$m01JOZU?kbYQ&4aKs0MAf*Q><MQk$yV!aW1g$VnYtlbK(NrJ
z{1Vj_5_Mf4zT=*w{ka&Txo&f2+LkQcQq&xD3Q{mg(TuwEmq{&p+oFiJEB`L)Cdu!M
zj$*97^J^Txt~>yi5*x?Z3{I$dwxAc)?Y1NRzPrD;mCFU~CjlZ}wg)1-Rm*UY?>8mA
z-ED&9Geo7gZ+YwZCq14yn$q!uRcI_BUR`-4=cg<@`>b+Sx2D|C;k<I(l@y)Fa-TEz
z#sq7KAq425ItU>xOD~rC2O{ly`BIT+ukYoW&e{8SK;@32l;+GnvdX)HFrb2R$8;<b
zP>uDfT85|B$PyIVG%dXbS962nnfE1lU5IJpl{p^7=rTqbxzi4jpLl2{kspbDO_wt>
z?<g#v$_ZJxyr%Oej?D_CX@A+uJWTU>$HP@EzPO)PH;{Ra@Ak8k#j;|wYQDcjy33vn
zRUjH(XBHfQZ81mI7s}4*Md{dAK{ih(<L-*{#9HB7f=FW}a?@0lxp=q_LY_aau`}d%
z9e-abnYDJhUwSyUtsq7$z{}5NEPxPpqY5g%$_373G49=k2(Xvt=%nCdh}#ilx3W>z
zKbr-uG0NK*ep{Ct|3#J;vGFd8Tt@{dj|927On>wpZ+U&Po)g|R64WbHSt$W(_bsuE
zO36LKz^|f2HDX@?(G|95mJ{ZT2`DY{JL6zSvi((STt~sk0W6fe;G#`(;$f7qPN$Vk
z+rb(%@?;8eXIV2@Op2PFc){*wK?a<1jpdTT9wCk8PR3{M>O<!}b0f*fMA>$mV%0f2
zHI3GVK2`gsV}Sb#^&8dmJRM5NfxqS2^BeqMSmqy0V|@`jA@K)4cmo0eQ2e+2;r{_?
z{tI(f<zy{X06oIcEsvZ%d!v-Z0(z(fh2M}kQtmoo(@*E#0u=mi%<{tY^-Z6bKP2qh
zr#o>{VP{ps*lx~BBbH$TuXaQL*QVcp(Y4x68DdVKo16vRPnJ=KZBl9fL{ctS3e1~X
zWuW4zQEh1R7)2^V!KfvN*9`Swgg9kEzHWW7HL2Wp{>9Hl^K4`nq-nN*JB)b){MV{M
zepa1rgyZe^v+Adx@$cp~BV!YD8*?XfTbuummqOb)J-Il!Mm;+|I5#@~6G<H%?j0(E
z5rH-n<mk2d#5N0hD0rI#swJjK0n=9G@0_CJ?49iAm&#9$7XpCLW(o8{H9;Adj*`BL
z+=_&`Q@*w?Ay5tzxW*>t`uX|!6Dm)vZZD%#9AWR2>X+yh=v6?XR2RnMil(}x_Dq8R
z6HWcgU1z*kM63!A0FXij0D$nX$EYYGAS@$7Yi;!3dFd)OzFpTuk-oKmin0EBHfjR9
zWHh*XA3w{2;W+m80ACa=ZxKf{^ehSHz4>1ry>)M!n*0{*OSSxa)R?R`IW;l$jCuNN
z_l;@<Y54W**Q{>28knD1=|IFI)uO@)yFtfHn3}}3>{OCksT<nhxUiG$fV77>%DFBn
zV7O-{EdW}v2ADzNvO-yZYiurEJcU}hu=s8{y~31YQLQ(^S;~affR9@Na)oTY@@rp2
z@~@2nB6n%UMih0y)GBaXz&V4`_&|<0$jar+TS5JZ>VZy>Yz1iw6Z-~~0RCZ44y0%3
zOB&&fAjnw@IGYnJ?j@00CaIq7_LD1GNu0fvjc`{gIF;B?emO%-%btR`*e$_wXF^C!
zkMPp5QaGnKaS}AB4KYX5GKlyj2A6^{sd@|yJF89&Kapf~CLxr<<5GY*(=ckIi|ui>
zFcRQ>_C-zKMRin3wOax5d4jtuUvo-KeH8z86ohj2JAwj=Ar4a$k$4>y0Qnmvs$+gX
zP7<p?L?*xfwv&Rul*dD4Z60J!<5t00b;b4=SjxG8z#}~(DKk$hV6*^W2T}JU94Gn@
z9h2NAw?bO2_;p6`P}SGC(Sb<*SCWZFV0UAIF~wmTHTe!5jUhSQ08t#FE_tCmOicrj
zT73^gU88w|rWxLf**t>JVdvRkJJvqnCHf@J1_xRr^FujPLz4%uI6*_B<F(%s+Uzz#
ze^ZTfQ?d~Qy@)JG(YeD3;=Kub5@8);0C4#tMlm67!oXEAyc}>07<>UO#A(|?x<&sN
zVec56N!+dv#>ONQ+qP}nwr$(CZB1<3wlm=qO>ATH*4f%qXV1TOyQ{jo`or&2*Ht$z
z+~Oj+FN)%r-h*FnGkrwYawB`dsE^8-X?<Hg_Jtt0z-OmEG^l7WePG9RsBvf;y4my{
z{4^V<Y4d<Yi=F1bStiuvb73~iLsStiRu9(((G^~Cj>ZHrSHC4PSoM(NZoM|!RS51h
z$_t)SF)9m)@~w;e)ilKwpdA?*7LfrKsNf493yzg|>Tyb|E<U{3e>6fViR%y4BH^{b
z7^5Rh-$Dzb`uqL%9*XWD_9dOXLsA)#rHxNDI0J94!MBVOXoZ_7guyVM^tw9igqjgT
zLFf~rj4vq}^#Z<!Y&b_CBnaYr4Xr>nh026dX+%S$UN5wnalsrk415!&RDt}5g&=^(
zmvP`(Oc}yIOQTD9Nk#v}<MVSB**@h&UROFfhJ2zgDj`STD-$AkfqP>EJH-^<<D+>y
zJzC@=NS|bhAsST*V7S0C5XQ|M4eRJ-PVtM>sQsQAgAU0YT7A)fOyYm9dsXg8$-~Va
z`R(j!3Iu~y(&pShPuXu#low@y|3$xdzD(20md?)o%Jr)JdJvvYMw)|zj~@-`%vhFo
zURu&k9z~^+dVZGj-Fw_;PXjXKOEmc{C$E3PUVc=i$<BY{9t_-BXXN4Rqtnx%?o9b*
z$1v@ZQ$jOlyCW~Zd-K?J{ne_;9<8xC3M7|jKw&3GLrs3v*FoZ~2s4J|Y!SI1M_5|P
z%Ckv^IlLRQXhEqhyOP6%xrW2_fXbp`E`CXn_rhmBL%hRq=;J1u=p*tfg9BG579Moq
z!ue)NwTWC3EI@=h&Y*IeIPa?JKDdj%9`Lx~;HEr0OY}ejJE`e}RU<1<e5uWo+u$>f
z0RI#mKBOc=L1RlzbrB0Ibm2SzN%$lR`QDC2@Ffu9kv5Ia?5V|5D;CZFi;gdQLPx#s
z`AjOs2jEV1@$V9?9I>n2Z+%f0!9@wEhsoVvBKTeME3-R4EkF-lz&>yP^O@oa*2BG>
zZr_1?UW=@hD8@Smqm*Z}a2<`x1WK88YRU%!De=VA!sHhc&ryaGmDq|!mlTXUg#c)+
zRC&CopiOZ&ydTbER6!sF*@Nuoamu9W7)ms4Ewv&~lpjxeA#Dxr2`>jD>|~lRM4S~x
z=HUvW(7dEBT%%<HZ-@knw}He_u9V+tx9j>gDOgsVDK|mLDajL7djWdR8@My1M&jRg
z_8T021i?4#K<uU2{M;T@%Z@=_j^QR|#x-l|3m8XSCu(ac!%8U4>T0arKn+h&*6UX!
zDc|Icy(-LSsG}TV+u!(ZRpM01RrU?O6EHYPs8fxKmP&afHtQ48_w#O$*mr-&#-c--
zz+~xV78~JbYt)|Sl=EJ!cqNRd1pe%A4T?*%gfYx8v03JU*B?9^=!;0cy`EaGLA+A4
zoTp%>OT5#J%hvTJsPL(OUIZvLp&lh_^85&>!-eYmWr)HQZzzb{BrES1l!Wt{Xl?E>
zmqLW(|ID=UdP=YgL>=p9AdFm<r0QzxFR7)Vrrh8EoqG};LSez<5fd5#6faOi%VGVl
zN{n1tA6|?gPVrJ`DF3aRCK`$)ZGukEf@CeWFEiJ1!iS8WiQw}i_{e3DT!>Mso)EWq
zf^d~fD*6;vP3xc1K!-g`GCuobAu^A6s}YsiNk6eZiyf1@+Osk#z^%hOuwQ1z7Qh-*
zKsfkde)fbRRUmm1tldLA4c<!ol|{y-d6B7!4)0l!H3^c>5Qg;JNMb~pwd?2YG$;Z>
zJH$dhMpWE7FET?JIe^y^N0bQC#QUNaEfa`tjyc9q&L9=@SE`Av!FaU{PsxLA4lypr
z=VYzOllD4=)OIY0g((U(%N~rfxgW_(i!-!GL+=WmiUnIj6dX~mNGUC00OK|#nT9Yt
zquKjPw2hb1;--L(%|-<SN<|A!?6){?Kz7I=5P8OY@v;E)+;S^gOqM5?5zeFmvwHQ3
z%#iy;#{InZ-a*4blMpu*N62_E0s3&$P2BWi#6g`naRt{|y^oM$7Vzb~Y!V+t1a_Eu
z#)^z2bC%$|)3}c@LD0^cmfEm32TrJO<2(_=@!%EWXs%y;=%o-16na3TT`HhJ&Pa-*
zah^Ww%RcYm&E0wavtJnMHrAt0f#$oJ0g-?56vUK}A>nFcX94LbkAm{)){LOz^tlTK
zTg!^9iGcU_=MG&~@h8il{8!|x^z^QX)-c<)cTC7nBBSEZ;k=xi=!n>#y~NJe$sb2#
z62!?VB$lH659dERkKzEq@-^$W+O0M22tuVuv*W2zRda$`icbU=iQA1B^bR+%s`m~P
zd$CKkE?$c#Nd5}~ujE5K54U6L7NO)OrV<Yf={~;nJ%jasvEs(=KFpiN0w^GuqAKHT
z8`1+v*On0cfV<pAthF}L7@o!pf8S=}5FhxeheoA^pkPjBW^}PbkuO*dUB1{Yv<147
z2eZSV17JjcwtK0)#O!ekVfMatrtqB-J4c1VDD85oz4_ki4$BUsC;>fT1vJQ>Ex9T{
z)E0$=sa}4<5qtK*``axc^QQPmFP_8YF$y;!?R#x70EkHdS<yoJI+e*WiSjo4Pq+Hs
zLL~aU1+HNBj9pbR(?sr=PzO+%7)2qvNiS`-YWu1qN)p5{R*K{^*(!TF)VgT>_UwHb
z_v93zX<4^~r(#ajZT-^a!y7Tjvg>>IZG=&AVsuYKL|Ua{it20HaX8`$J-;g3SL;SH
z`P3+GRUzYwA+e74&TzMX6fDiJrIPcVhb;BvXuG~w1VO+@$=$=|WrzJ%&4j7{y2!B2
zuA75n7tjvS6XDE6{*YqZ)_GE}JjO{4H%@Nf%f9GWv-_5f+z#UQKmjipefpKGJC7x@
zMH?^Aw}n>5Yum1$OO6~O!q%l+e}(j)TT1)Q<@}cAyHgH4ONEcakHclH@xH6BClYaH
zj8=MX{8@;rm$Q$NDfz8+e{VvmY=WquswU|V)-4);dj9=ad;BWyr~cxQhi<BuQcUfu
zU6%K+_jvjB&Wlca!bPobmF452r@S4twViN9TG;EsQ@-jNBToIIh{ouL-kLC@=CI1T
zw5=}B3gL*@tK`s!eX^F>DfyCS!#;kpe~n8vxjz|2Cy7o_ev@-!!FG5NfnPB~XP$lJ
zc|65?hWUDWe4Zcshlj7>DVTYpGIk2S5_|PAX3u5d>8A;?y&uET>b7m7WgD2sXaiH*
zvm^7kUkafk2TcLI&z<n&lm{zdqE{p-(yCA)AwK(Y87zj>A-zZ&Zj=bhtf)n>%5K@$
zdyB=kjy9KpEht3imk<q>ZuBviyU&9$TgA7nA8i7g_<zp@pTC*6$tw_()xIJ4^Mzjx
zc|_LFA9gUUxv>eE2yS{Rz#Xz9^XNov(Fkv8)I&vP6r;6jc`w?xY4s`zJ_Wnnc`KY0
zLNQ|M6p&k=j6AKp<@4q3?CQShkwsq5qjv+X*N+p-CXIhzWPhr8@Afu6wPHAgOV9*=
zy+7StZ)LwO*!FR|_3^XKz5I)lE0OY6&+S4iQYyA{e6>kc7kWv)w^0J1%v$C`Vw06R
z!~FTA@iMw!m*Z*$wgH*kztG0kR*1DcT#8y48+#=eSvi=Nfj7<*-{h^}oK{%teq;U3
z2ea7tf)a7YKn^oQ;XcC}n%U8Mnw(7v{!nAj!WOWSNd5&_+c|Pq{g~ZpNG>#o_@jbg
zKR0&96Muf9@1RgSNAASU$*9cto|&v)Z?wVTBsD~}^`KNNryM6|vD2kZiI@5>bvzZ}
z<S?9?PebveCuoc$hNjvlf|6Mq7B4z5doEuxGd&m~HQ)IxVA32o=&T%(bMDE<jA%Xe
z*D8^E%PW`Bvkyv@I1AYZclHmb&y#@Ls5B4+5p`GUis2$%Si@UcoKd>P{Yz3YYs97A
zHWTF<fz60nJ}N3h+yo*{438zY%42dgo~oV)-w`J-NrDSP-CoBzIT981Ua_`4q1Rxl
z@0XU*?Q{a8s(y{?A*57Q{#~VmQIAVw5Li^B*z(Mlet2I-1H?BR=y8F;_ZZ!vrTy~P
z+yIfR`h;dN<CtKhCGH2yYTt{0a<&&|Y^s&SZvJ{Yis+|}zqU&FY`p(#Lly7c1H4vG
z&RTM)T44UN>vD#ae=QbTr5mHw=i|z)Wz8xaNoCh2%eV@!<{TpXJLPj`q&aWYNo@ax
z4A#09cgs6M?&9>K&<hc)r37qXC|{2eSB)neO}(;$k74>KNbIx`xhAFjTyuCCN-srn
zH+3t$_ywjXpEmAQ67@(_pIR~JpqhoyZ}%aen=x+A6|&ehgZ-kF+Q+{D0APu|ZU;m8
zj4(7-X1V=Oyuk$$QMl!;ktv_yy^0LGnT*|-<45T(O{si+fib%eN}ox@=8<MLBM9Dm
zUZgfIorv_HJz{~a&UdDOoYv~e!rP6+$4`2%Rp3X4nV?ho$iUne?zVcNm>2Dc!WWI<
z02W&V3Z&#T|CGb*e`)gmt3UtGzyaS$YJCFqhxq~p1cdV6{kgEcgQt_FxrNLBA3du@
zP2PTs4W;i|ndgClBlx(T(rW{OmUe-SUDHXD$}%oSWX#5fG1&t0^~pCr4T)W}0hbFj
zkTUW5`I<MQqx++Mj|Om;J|+EfN$&eAde861Fn0UOn<Hlb(&NsF?lFEYw`&&+Lszzz
z3|%4PNB`eiVB2H)xw^|gRM)@dy{5I*@$}`5aMb2abv95ZnAz$`7RV!SsA5sOJmR6C
z))IS3U_%48b$Re_xvh}dH6Z3&uYSVh?&@>J+r!Baw1KUVtFmI$3eMTTUbm~sHeeP4
zkkHVIOH1H&3aoAj@H+kE;>n!Nt0=YA!RK;E4+XIb@wNZwas8}o3&`eP%eul`#Ty|N
zN9v8<^}~lUJ;82sbCsb04ha`$IS{Ic=W+Ym!_o<fg;u=Vv~T-@{vEt&Og0u$PeHVC
zGe&TE`I6d+F-`Cj%^AAg%a0k?e~jSVUsLD|w)nPZm5noFj}*f&Yq@otN@h~sHhO8}
zK6!fPO(@}kHYo|EW&1>N<v;IaV-Qnu`<SO?D~H=PZ07Oz!ob`iAZO!={?C{l(pg7f
za+A9;MRjzkO9?Btbk;#g;otN&MlY`lOFHNgciu(bA>HK==HN}<_0|D+X+R*18=nS8
zSP*dp^A&=JO)T~<0^pV6F}}4-bC641cy$4#Wz6&Jo%zy>5T(MY%s%5V;5?P4PIQzx
zV+R3YhanW(J^&T-Ya8UdJL#b}g&?g;=O!kgUawIIwifx9XqI{=#WA!DHN5B_LUidu
zB-M0ir#s~%P0SSLK~1Mjx*PcHD4o--ajxH;1f!TrOd5=TM754&1}l@QlpF~zGZidn
zhm*_?;aLgjZ>;q!6kyX%g0VvgzM5&8Q7URvV9IbF8!Ttz;Z7NUCzW$?g1{r1z$Ob?
zdV*MuC=0@VWfr57+5Zj_(-`4b^?+h0G?r#NiBb^zPJ$lIQ%j<kwBrO-l}$zKT*Nsx
z%@o}LD{k*bqg3}7(o4$3REZ*&DA7C=$AE)vbL6c_iD-a!p)+k+ETW-<GF99$V5mql
zbVVbki$29JraYqES0ZQth5k#!(VLE9850XXK_SDiazak|SLuwoP2t9q?zmfm^D+(0
zg&3u;KM#7D9p6jzkR2|w>NH;~WHWB630l@jTyQ$TbS-EYF&r8~Trkqm#whHck;Q=J
zCjX@^zCS77a8;mPnDv?+0rLwpBiF~$-t!or9wWfpzx`z(^f~?d5&-e_WY~9!j}z0&
zg4q0pSUQOdCviV=A#;8P*%Yj}J2Iv|!vA`P_eJ;u^Pf2+%+J*E=aQ0B`LCD%dcyuU
zEI2zE{}+W!{zs*&@PAh7{x`OW2Rf-4g8>22LjwU}{?9`MO-yZEo%M}u?2WDIEdIad
znJsFHKLGQ~?}uX2+`k7Fby;HF;EGs9v%rR~=_E>N`D8?ajN6nbs$P_1+UMuq-0dM5
zeOdV1AmZS*_x-ACXkq9_yY*r?s*^v`9<+4*K!7&j3vh(hY=ysoaNxt>&AoqkYEW~x
z2K|g)7&!$SoTkt<B_(0fSMOYQkG}z}Ka*2cTCME##uPqnBrS({fDutcrE(^K;yDe6
z{(WFF&nR6bv}&-598=By)Lc%jY~BH!pBs8*!QyrQbU@2P(FAdRo`COJ0?HWh=O>|i
zb9_>OR<?}6h|XFoV5SgQC$q(>V1fERVdd@@S6Zl*OpP6_qCng{TT&c*XN|L^yPaz4
zN__pI#Oy}$e2ee->aR&LbgNRQssvCdL~R)nOk&veRj+awoeWnqnxj-Y>Cb>D!CJ-S
z9-&i{#1hY4MQ(f^WAo5|7Dt^4^_JPfgJ>LGqPX+Rs&N8TwkmYFzIUWSNTZJHl^&ze
z#K)#(Y>j*tF1JZg5Io370$|FtS|rc>4jbt6QYxq2rAp@EQSc2ISh1`&Og03msWZuE
zty&>oIsJr9?4VGkjkPW%lWa*G8wkRk@?C0PZ{vUHp+(o=!@NVZr=YzdI;;~^10f_Y
z1L4><CDx;ZXd`%Q-8^hU!~EF*j?}E$nacEq`9)+^f1)dW`B`U>o=rx<BP^11x)?!q
z=nqb#-lxNFWzz?!)eH7f+Y96SunqFj7%#;cZ(fP^rpXB&;<p+0WjOkU=_P#e<Zv;{
zp+giwfb;Lc6qCmXGA{N!4<Qyp9FA$8%-R8Qp8d(#*sg=g2}E)XC9tsUa_#95c5u-w
zdLlu<j?W!8An9|N@*RYbF|Zd=q0kYT*kHPBP=dET6f#C}7eyNV8HD`qIQ70@(+ekz
z_sHgm%f1R)6>v(hIKN<z9kuG^;glT#*x?08YW4AyctXT4SATPv1SvlK7r;!P7c*ue
z?O1>l<3tCOSqvFsiFOysFa{2&uNZG(!H`Iq163FxK}l<4;~6N>vK)Ekz}p%fr+MO*
zL<fs+LKMsvSYd)~bRV8-h7~RD#Vm_n!W<-jX#+#nn!`OCCoNANyG=r=%uC0~C$%f)
z;F!V^W<&T)3dJX~5*1j}twXQI5cgTCQ^WXO8XYbl%aaP(y&oxtbG81MOzpj?=Zw4m
zppCZRO|5Np*iJR|K;agDYh#1*fx0*A{EWlT2<-(kF7oS2I`A4Xw#Nv<-OK$h7WSHb
zd;AiMuElcdSWocV*-`%ddyi_FE|}vz$F@=G=y?O;P1cq_pVR-O>is5s&t<)-G#O&F
zboRPX(SNbJS-DQlU!aTD;bUMUbGyWF1rwpJmBmV%ZxfTMjib_`@{%4QN3p{OOZVBU
zZUx33fJ&2&!74H0gd?(Z<kYJ3qzB;Bd(vknJRUe}n&4<h=^N_8?`wU(=U#T=kRjst
zLd1mk!ph^2arCOR+QMr8<nG#my}pmmPaslKuiDZ7pDP$9rP!N`AH?d%{vQPP|3KgW
zjanWyuKLdQHg2YL77h;j@=B88{||r#{6y&fzZ?NZG;EzWC6K>n>rU^|bO+4_=v&@_
zxi?Y;TV0VNQbTadYo$m_1}tJ(a`YV5RleR`=Oljeh8^COPMnMwm+oDjmujx?xW;1T
zPS&_(FRjt|25xsBf;GU}0OIiLKef(ASku!#vDz{8DiWV8(}JA*ynHspQ&YnD9!`$w
z{1Knod^HC!tq+vZ7*fNJ2d(g#6HZ*IK>2~E1A+%F0}Nh;usE}=88^cX4g?L5jTphv
zBngRUj~vpxd_nzp$BMkXJiQN>uixDv8*sxLXt_TDI<4Db+Px-{I1L=ZA*Ol}SiWiV
zpiuZq{pB`jWeIndPY0ycDz*&-GEF2oP{P2rAv~red3QXwnHrfP4e8YelMC%>EJ5T4
z^mEKYksiO~g!LJgK|;d8xsc5;VGR;*OfmL^+3uMP?^5PYKEN?S^NGom2zf{nG*)S4
zxUKCq$s;JI?>zenCYKfsfiGkeApcSki4!o+3FWtx+&hC2$5d`|tT#flzB$v!Xec?k
zd~N<x(fA?Wf$73Kv0UNTi$W+Upg8cCD|nj@b78>6WkZYLktv+cEWw`>X@zLH7Cc-O
z!3(2B6_X%)BN1ndgcWvVs|xb^-cZs*hmuoPY7dC4hj0eBIvY3!V8<+i(nffU3M2(l
zMsVWMDcVF~KblmRDRmm~9U<qzQcfUG7HJ$SXQ|n^U%6o0+>d%H(8Aw%nq)qE>7Nfh
z8t)GTS^-9ZD~9;KyumI3<3+AZAifMtE;aH39y?0makU$?^WnV4f7im>Xxs6)8CY-`
z9s;ijDvete%GL6!aX|0G93Zk*x`t36wb)%w6fJrdatSTF1yiYFRHhcZjfGnbSX#x(
zYJfL()-Ll3&p>PBdkf(!(3`z&PXm0*vBdV_g%ZB<I9+IPYnW-VYgwD+d)Qe10Q+8?
zr>#0`Ay>Qz*by>YWG#Srmpr<7&GT8EMp^N;LSY%&UbZp9?2|pL1bS6%gcSLN|1Rla
zZ*2z7wB8Be?QO-~#^lEOn`Ne-A<OU+RCLZe(+f64Vs2+(V@<1aSRuqeNTAssJGW-6
zjo$q4^v6Y2JkAawJH*MHkATslCaU~B$jF)EL(EF%JkcTY7g8V^&tJ=SJEYPewibg?
zF$ixt)ueG&+VTThxE5{UzLhZEST|V^uX)>=NXDgw-Yp`vk`F=A8RLEaP$=8v_*6LC
z$cP|6P^)h}asaGh(11$)Batmwc+XG5hiU6~T9b-Oq`ruC!K}ki?#HRO23g9HKgh?s
zHI<gkdnA1}H`Y#{$0Qo_OMjD39$$FD2OiJTJ)Zcb!@t0z&nr<qoVPhWFsZDFc<u1-
z<5gV*u(4b*K)6FxjT205wDjn@8~=fSnPXjtdvW49n_s`I%^3GH62a36XKP#)3#`yi
zUQZqU%#frnJoQ<1s}sQqxVn|pR#Wh#UNh7=Z0OCRw1QKEhcWftM@YGSUe<KS_s6l^
z<cV}Es6$l8Kr(K&irAdn<ttB=n`XykJ*=(0-`?CDkE=HiWh;dMN`BBMH)^JPeSHV0
za|PgCmGiv*Z~nd^q$4B`0y~>AB6N9dm<2a1;+7?2p|2$i6B_ODI-s_mx{T82Y&ZPk
z$d@?g1S5JhDIB<fBoRR6bPvV1-B#~u<`7dTGdO35^)(Qc$`P+)Bkz}`f|i6i%K<z`
z?hG+TdB0=^m~#IFxd>RUhpp?}j?zxIPM7*q%08EwU4tgmt92caC;FVK=H7*!IHmMD
zKInA18Fv<Q$%^tm?X$3`JF$YT0IYqmPFUZ$P5atnOR6_alvfQ?-zHnNuX;p3F%;B6
zA`UOHW7-ojKOZ$6AOuS02rDSp#N0hCq(4iEkw7ld?Gc>X15DDuV39G;k!>g^5T)ZS
zZxkSi3x+kS9LIpN8DnlyS^sP95i_?~>Xr#m0E)`oT-kv)pnyZ}D-#YKCkBN9XwM8n
zj<#|9^cl>GV8Qs8@u5iKB!!eeJ<#vVKwG@aRSBc7R=Ut}Vr$6}B>^*X5YnfhSzsdi
zR%Izo(J*(iyO}11Bn(!UbO55Wcysl@noU~Dbxb3d0HsbSB&I3jiH&OkWmVy^u|Ywu
zOmy9(600ONQd<Qh@Z0atplcxvp|NQb+#R@r<D_w?@%&+=GW#!iA_EVm_=6OcT8RPf
zX7*g9Fl5QI;#3y3YCy44QcvWb5uVwWAd&;EW4mieJRN4kt{@jtJpR7%5rL`x<0va_
z*#%KiJ2InT12=p!i}Nm1cjISTpOgOleQlmxF3bklZ#l;6Dg|}d*CDG4tQ10Wa&Q+z
za8qK-KW3(oXORj^LSH&7M~KvSsI(+XN^F_@<^KJH()GVgT^0&q*T8l?(+UIr`i8q7
zWm^M+KmTQm82jos;Vgx_pLgoNkf4w3@YN>h%!CG!3~niQ-P-*&S3c?=lmZGT{CEMB
z*|Y9v@fv!vjFPj}<iymgOjzeU+%s6Ha*q?XR$bBwShq;|Wqfh-6||&*Sw=SEK}<qa
zY?M*ev8-up7t}pf!A#DWwQLxIsdP`gspRyK+^XI6q=HI`w@Z^kFGLV=%D8kbo7A$I
z;kFs{n0iomlVaIqt!#TEx{M3{Yx+9EONi*;KYX>5fIHYx@XASrs6A)MF)&5BwHR!W
zpz&%t&79=SryA)NOeb0M#Ic;2s&R^?^f;zN>J6j37a@v5e<;!5LfUwf1<ys;yn#5*
zAJ|-v%sBZ5Iv%l}Ms|V^6tudsa7QIV-%m2XN_r(F`m$pRFj-ZZB8I`KR==4+<`)Hu
zc83!wtqrd3&<(Cumr6MJ^vTZRI@XNz{DQgn*{c5>pwkP~y?|^bv&}tMC{NuxqlUy5
zHw6st(l@&NjbI|g>aGYb@+hxDxdu9bFDm>s_3(SjV*b!EfvWscITHEcmoTlmrC%FZ
zHpe!C*h8o)Jz_VVic}+wiblfHv~(lN=B1mWD7)#^J9;pEQL*Y3XaeO}YWy}`C&Mtt
z{F;xH<Ng`iBq9}RssT*$joea2$u$>}b=CRwre12tLQu_7G<(|lf|cIY{`Hy^WPuxH
z5`Z^{4VLWm93d^DPL{Ih_nd!Pje&T<6AWtMxc2RwKdYYU@R!K+YOhT=ycL9B=Wg^k
zS1PHaV%~&0p`j(8IQ_yq4}u3{4LPSTZP$ymNfbS_!!Jd&_saKgMLJm&{m?$L?I~si
zOFl>bZR65@NGT&P&sAP+R=6yS$@s+Q>A#`qWTxhotNTVwJc0SyMGi1*q^e4gx(6ZC
z-&lHHe-#&pvuLc2QnPB6@67(v)Q%p>N~TG6>Mt?X;GsjVt~u&Rn}39cq=1U+Tnz)`
zaJ0c*0q=N584vE(!8hMomp6Tm$P~K(`u@9;{11hRl2#cv>!+tSR{9^xvj46m|7ZR9
zAJWpxum9zKb*X8q3=l*9^7)9OQ_3C}>Aom)!e6JQ8$>J6-f|+rOjD^;8N@RN*92IQ
zXwXgg_gyVOO^w?BT1O{RSCq)gyZX6LGSl4J*xcOxxfo-^{_UaK@Gc;_CU%1J7ta;R
z^gkkW?`&j`ue`pnLDPp*TG&7BT&xt}mJr4VL-DL)kMbO(x82ZY+?rxAr-j@e`C`+>
zGi8wkAojx__+gyR+pG#&dzYQBx}}(Jx6dI<gu^MN#gw?@j#(l<C|P7|*&5s1Ux(xG
zen7Dsa)EKGmwU1lcLA>Y8T-s6d5j!kprwO<(LQMip%bhT0M#uTQV84#di^G;X1J{P
zqgW*APKX0}gUU1@q4P+4$nbGO8WnVc1&y2i*YTSt@!K;kDGlj5Jh+~mxCFE^oRN-1
zMtL>daj<TPPp@Q%Ae9c$1LYPw2IGNalqCL_TvC=sXPu6B4>KSaF2<>9>>W-llLCzf
z6%ri-5=SYMn3Pd|2yf|rM7$!#C1qyx6ElC_h#qDTNjeInr{fw5iw3;Z0W5uUZob3(
zhE%=)PBH(PNy=5h#0EWiz>y(PF#sF|A~8cm*DSg@4PBx7A{^JENkNV@kpqMAPErk{
zliQO@Se~7?QhIUlci^$zzR+6;YjE#RC5aD-kqYU>a6lQ%L!l9*0oZ4af_E_J#F#22
z8Lbv?3Aq=dY7D8Qm_3(_NV?vMJPNYL_cRYP2GMiJd0)25fal;*r(S2#!C40@-tO;n
zX5e?h@v`GKXyKBbvPmGyxyG=aW75T~cI(-&)wndqMd-q7wnfZRo4Qk|GC#LiqA^P=
z3-lH7(kfHtA0QtsTxsrhwtO7F+cdd_lEs>5#F?vf&kh64tzBx+{XPC1cC?xuw!(zn
z%=Q3$8RTiz%IhE>W2RgKp_=g7x&4F#+tY-Ljv)Im$6=Gz0j^^_<TTw`eiF3|PYX*N
zT+8a}z-_i&1bZJGDb1MUoU2l-wf4~wEyMu@Uu=q#O=r2FHVihTcg<xM{kJ8){}Qh=
z@5q(+cbsh(;Wim-?Y|r?*Ck(A*=#gtFx|D~g#>en_X>#M&>;`sbyr$UHdys5j_o+}
zjY}*`&W1S#hSQqBCTyl*H|<(%VPo!-l5`Lv=7OP($jCWdm_KmYg+u@&uyZ}lq#$c<
zJ<FDPw)pJThK<^67OUhU<|$U|3})C*ZnX{~fH{QL)#Rgc)O_1Vqe@}tG=+w^0gD{1
zlOA;P&wsI|WJ+wT!LLY3QTcfi109L{owzJ8?SM5ZYyk%Kd-L(y_v1S`0j0@#qRtu?
z>bg&-{`S|-JxlbkD%7U^Cv~TuaV54M<Q`ZbcrgKjxB37SOXB!e=7hY=_DG<CwYxDO
z+YwnO4rI?UeqR^kxd_g4Z`<3?btKdut1&xw-@``%Yx3XrbrbMi^E&1%<~xRI@7@Bd
zHcOkptT#xpqXd@aNXLaAa5s_o9nIBIc^E?vsSlhn*r}iZ&H$l+L<|y5wr;|4ax8pg
zi!qk^SQ0-Q8<5-e!w{o1_NiRPp+GG}Jd(x;Z;H6}upFnn#FOZ>?E1B41_7M@-{apU
zu#<cNN-yUe5)4C(wPoZVA-gZ_%m-SEuv@>(i(yURO~8>2g?`}|u<D>l%~>Qi^5MT|
z`k>xpmvH^D!L}^Qr_S^Ux+2>j!vvpDkl}XNjs2)*BSAn#`L={F*46@}Y-nn36##`n
z={?i~QZFy-V%=HV1S~k!P$a}2gj3^%L`tY0UN_qZ`@n6Q4$}u!i1F=iWT`@HC6J8I
z6Tu^w=u7eEG4l_eZ-N+~o+%l>D&-C8<<0#opq)9!0xnjVt`x~Fh1y55I-t2~Dn#&Z
zMx>;lg3+q+et+z~m}}z1tr*K9ohy~?pdR870!l`=3<MbwTRYuX^K3iAz9+yDfZo|k
zpgyG3pAwCNZ&i}A%Scs9KGRoDv2t$-x27}B6%~MQ$jn<%OrdJ(_v(L2pk~1{Rm74@
z;s>8q4yY$oUEtVx-#n11mD%prp_P~ovY~<fZuFS@315mhPP4YZH#LS#Cv9j=-~DDC
z@(}k}-H((8D}}ft_v|Byl>U1X|F6ahV;HYAwzCKRH52%BIw2Xr@XIuU?6MtCfUQ@k
zb9r-p`eF`2>0YR(%}V*0KzEias<Sme%KrGDH_nm-rGCh_aa78h`H{`x6qjrY{}v)2
zn!<pLhp)FUA9^);SpxbAf{CU~C5Vzu&QUg;m~1OW0*h&}V@T{Bw@poGfIgNA2&8F5
z&#_^jj(ZmJAXgS5e8|KUl7b|SU>}Y)**^^;*2oVSLbz+6NWM8bqSn;01_7o!M(6|T
z7FuoGsk(b4s{!+@?j~*8?`gLzc--F7@^<6z(6N2syxNAqA-frO-l6kOCqA|tN3MA`
z=|HfW?(-{zA=XLcf5Ga$lO-^u-ID_JMP+tUM{iV1<cT+95mCb#Bg&Q4>Kk>pWpu3P
z$saOzK-xzhLu!<@ukcg@q<%y7J(!1rf+9tsFPl9|8abVz|FZIlCMR%FD)+vWu37kL
zhD9&zYPl^NnzWw@r3^86v5aSyNPFTt5E>RRoHN5?O|b<q=j+{Bvvt?XYqy_gxsO)|
zX&EU;R?LHw_U-_JngAv`btmhK^2VD=TUP2W2lqd_%C<}jjsEkR#N~vDUE-M}19arq
zAdtX$?0aV82Tpet=jY&xA)0e@#EJ;9Mt61$(G7nP=@f(5$`B0Sa)FTGFz~)_OSoWa
z>qV!NGzD2O_Gb?>eUd4?e5Ut;2>%+NWHX4_GYDURiP;P%Z{b#&j=$gZKJEB@@3{Fk
z$<o(-c(oZW@6GX}!{uw_X2l42aho;cI-zXrl9TVCvh&8Z&+_$74f)l#w2*L)<d```
z@33zWtVGwi?Kb@wi)r#Z{IM0Mr9rlNgu5pOQKL{szq|&3T$f2#YjXCH8lRB@L%h&|
zY!h)qIs{-ZwOJUC36`9dKZMi@(;7OR$KL`SKZ7LF!I0YE66~xT8&dfAug&=)ev_?x
z0pU_;0MoXCPTBxVB9cMrzTVO3C>qS}62tTRm~B#^&g)OfFMTCMKkPRPHmwrFmwqEv
zH}Kh3&tY5t9vjL42rf79xvLy93gb10nTLL-4w7rk!j!5{`Yqgicp!(>1&5XwNt4_^
zT`%0}`2P0D$4r?hhJ|N~o|;*i2n<gu4_fmfRtizsdSBdV9#_q8XpqNWZ|RCSzk`WF
zmsakk9?S1B)jrMhJ0V$C;k>%qG)8OVil6H|Jn$D=<v+))bPyq}+|LkeIvbtBs<QjA
z=2qZUX0IL8VckXK+olBi7U^*tL42t4x~Lqhr7$#&|CCVBr~G);J{t?XYI2#+Pvoo$
zdnHveTA`q~PSMwD?JI%UsNqwev#Q2Ath;1+h~!g8B*H6MSvw<t!ATOo+rYN4Ec2S<
zVpV!vP{r3}91HGK<wt&3hw=aFeY3284ZXkS@4ocg5Yckob?&-O&wZe;gs$sV`Z+M`
zrtXsBQ6?NHQb={~^Tt^hVK={Qq;@>ePt{ttWfc{_+NK6S{FFMB-=F-GV%S$RNAq!l
zJ^{Y!%R|!tV=?Jd^kKvU>W%+@R=bdEk*ZU;KtNq7KtP25$8C?9;eV_M{&&%P`~JU%
zrhj$4owqoWzTZD688)KCqyB~GWL9xgPu9{fHrSa=P)|&loK>ncLrFK2DoHE3@ie_&
zt!)EA-H=Yq8Z(_p86^Q>#flZbhl?e1`ZPFuyu>qiZL~r<jOh6k;unM-O8I5c<<}9p
zx%XQ^ig)T!Yw(5axS%yn-Y(oKratDZ!}^%diuo|z2YWL38gxxRmFLZQp1v;m;13z}
z4vHbc)^5z->drN2v~3xs?u_FhR6!;+N$(yJMw{o1@aQO9s_l&xGDm7|?Oe0Q$HnRW
z)b7k(&j*;rt!S-7Xz7qcpigY=fWp2#ziA;nZoCJMeL_73EaBljsyt7m=%DkL9q5iT
zuYO(nDB<fU4AXvMZBd*m@d2tF2QR0iSGkw|T2O;oWEn8RPXskaB~7qe_e)s`AvDlC
z8)(qmgN!a4ObGWpSoGWJ$jGB}13ttnK_eUF0GW`G0wl$Q+enidw}kyTFyf6YFgo*S
z)e;DqkX-5nP?U*GVIsd@-oNc42j&7X78$x8x8daH0VY=-uy|CMxF?u_2=IjzVg?mg
zFd6SK-4W0vNF4(vp~{yPnA{-~Pz4Mou#hO@&c}&qTr+4&tdIp_Pj>;2?c%ZxQP(sa
zcOqC27iZ-pUfr1mdPJ!NF$G<aZlXMavq0CtfL>T|oE1<G4KPM?A&P>a0>BQgN>^A=
zGgDS23hgVHEA*ykg$bcmBK-qp6x@!uc`hOL({9WTJ0x51d9>iSZn<sS#y?2TAoCeQ
z6dvOlJ?t+(gQq%lP@f(A`q@{}HsiL$U(NU|-o<ge%^KxvXL_yNJ#A>*Jva?|{==QQ
z_p?wHac^i3mQ`tD%&Y#vF0+?{=Wux}@;~;fr=X8-Wz1)W@%9B%WL*{rV!5lPZJY+^
z>A}%o^Je4TUCcJF*}2YLvBscy1^Q-vP2R+8Jl1YqPAmc-@Ai-0#e$IS=ZIk!%Mf2#
z<+|DrK*l!i5N_5c&_Z_*;owQYtDR`rdh0a^dh30g3@OKZ!J#FA7xP~yq$)u|t9E(p
zyPLu#N*e^fe|euf8RQdpeX`qlcyi&milq~0_gp@24YMU-ZU(#Ortwxc+2KRphv_2N
z!g67;{_!UO9SkyR=j*|7ld!?Xcr|eFWITKDRxNQ_^+yZ>w#%OHlqI@)w)jhs^|c4O
zC>l5qr*ZL_2|ou(p@gihEM*3TY!f@3Me+B`z$7N^@uF>eR=aDhv7tFWWXC<s4fVJh
z^rI)$IW)J=UT7|z#V?0wPgVyD%W5H}aTa^krth5KzL6;jSQW#qWHSLy+uR8zrS;o+
zgt!sepL{JKZ$I~BPGbw0S+V0i9k%ZqDKVNe1Hyd;IsBPla5$a$N%~ja@j}fQ75f#f
zp8bN$={Bd$-d_&bv1hWj*&x-T1Uu%~zWQ^ufW49Z+1cH0YlqY|8=f%n?Wz42_-PA&
z2EML#jCl7i2+_S5X{o{n{>-|5+innMPVS5zwmgxBbMOvv=WD7@n}&y*K)*Ygg7Ah@
zPOc2zsdU;LNemQpTJixSM+R-W=q%o0gBQ_4#W!gOZ)_2O+OInsVMP}%_o7XXERK5{
z&a`gCT+;PLMy@i~OWusN_#;%kxN;rG-XZ>=wc7#V5u4jz5YLYf$&w86{QHmJ<ELmA
zaP5)M@k9)-d9W+<HA%tD+HV?^SjOmP%Kj|^&my6xAy?)*CZjkIj~E`9kbg&)Pwaq6
zO>D8H6zWotAA+3W^lpuLMgPHcQ~erp`qz_Lk!FQZvc@)ccXu2OnIcvKnTQ4Hx@|bn
zlW!R;BE6~LFKRoe*%`TkxPORwkPamv-ut@p!S=?xjg_rG6Ffo7@`}qSKQ7m`SEt_y
z^pIS}w<(#%QhluG9AalU{B>V0ax_cNRga7Yd*~Ho{ij!W^&E#~A`|47b6KJwpy<Aq
zAIrDBUbFP+O!d-qg~Ix=tMib&$z<NYPTH@w>|ZI&_Y@7zW=|{K+jS)#oXixmnn$TJ
zsVsId3N=uJ8AqyvV#_dY4D|I={SLM8bJfK)jru;xv&F83p<B<5&qAA#@S5@a-gjl^
zljps9KN+#w)&}9Pb{C+(lb?(D+}w=%G$#QZ`oLnbL{Hl9xntL~WLGy{5A}yFZch`A
zXOd&_qAhFOdHmse?pGl7Kx=#ZLG?rySB<+nnxcHr>~PIwP~5>`R~e<9L%J#nn=f%M
z%vgX<veT%uHm%MAw>>$_o^&M;PE-YuZ}!q{LKJkin#i)T*D~pAx(N0b?@asf14N;}
z!G9f5(BMJRed6SZ0J;ks7+Al0s1_4zh+iPZ>)6PkwHIdb1sEYfPQ7l~FMkg&=j8n5
zyhp_c7?;tXpH?=!jR2)xXwdAqs_6JZdJ|jyP_+5)pf8n2g^rk>A8Vj#Ux=XaNl@=0
zUV>|)+-ufT0`{x<aboGYdh)jM^0!Wm>*+OuBOmwF{QiC4N&9oOdP8-L)l9iHS=|u*
z1x!FQ-APRygr=sr<U+0=yS%zq=eMZUI-`l)hMowc3m;yw&S=%t-~oPU{)n(vgAB)|
zAGxk{eEGcZ#2Lo%Pucg$zX>{U>t3TGhezl~_YmL0u+P~5m<p69g7qP$?RNvS!T1IR
zd4v~4rC&*{pM+Ih3J{`I3LZ$MV?zE&lJi~+%P6DBe9NZRWYmj8HZv1caD@eQ)|1*G
zXq~;}d51Z~OVSc=&J|yhJTw>$$LTSeC^YR2!?6oMsOzEPjNk2Wf9`=~T!UB6C=`P|
z-DALCmVgQaEVE<C<xsGdzdMz<IVxA1X8MI=z-JoG-a{|_P7LdNyNIpG$njz>hT~~L
z1m=kiLKyoYu2!9aELv`ev(zpB{4V%KskF@0EcB{v0j;~{Y7gLirp<tVgZD4Ljj=-t
z&;SF>qeF$=NU_3mvY?U_ssY9q*;z2yHFRe>RAxe%XP`#!uL~$JpH$e<zRuH{pi<RG
z$AHWS^S$}<na%0;%CH7u9N&E|G$)Q?+lLiB-jMTx-c?+0mH0@}$8HO|I~9#%a=2CX
zb$2494b&Id?M?B;ES)sv@3on!Pv1od+O-%tOhaGj+43Ok{S@6+SA?gF-{dBt+92JU
zv`xRi-0u$CRz;uJD%p_z=Q~rDK$sQfS1E;ZJN3c}+@;jj7~euXhnq}lPk^VViYpQV
zw<fl5q&JdrZCMXVPq_ye7}Z$T>@OEQmN~}+gqhG7t=s8EXhXR>!I;jF+k8C~*KGMf
ztfMWYM%3Gh_W7i?L*Ecw`CZLZ1lfxaG4eYRUJvE;uyqfPkvFCI(h)0LyK70=*E<x+
z>_i!%SvuX*FgG1%qT*w{Sy^o4(dn*a{!t<Hn?n<15(;%`S27<l+6dw3EV$V3EGt{7
zBOq1UxTmYG8h|OQ-_vzwq5Y-lmlSNH^pxn3t%%Of1O7&b2yu8QY_Fb5BFxYWI8peu
zfJ)0;&uq&)?N2M*h0HUQ46a_{$S+FPAmsjee}DV_Rj}3SmKv9I1UaFiA<E0e(nd}n
zGXwKpn0U%oHAyNOJJ7?5bwS}d%5ZQ#ww7uxW(`v<52`~HSOyw#h$V3Tu^;~Zn6G-i
z@kD%+jzDmCZY_6}l}6Z!Ec?=L@gn&#xRA$XczVmg?4+9L|8Nj><DKs&1yp-rxcAa_
z(J}V)yrNb%Dff!PcDF74I{dDimu|9ubw4f@sOkZ9aljm1U38+xBwGm?5lFpK^4F#o
zrV5%OyysuL?G}2?*GM=#&k$=KBqhtKQ*X(7B1i-V92aNdBZ+6V6?Z4Ap`a;jCnlJt
z2^GK?h=3#T+VNAxg_#Tq5(VG%Ha&2taU3uvvETa&>LuXZHV&=`h9b~Hfl<6iQwT4M
zLd->|&ygpuO~=AT)fr4dcl!Xp$8!4^TdYzKqrG4SQMsmvF@kN$46+?rCGHj3L{E%x
z9+!ZA|2l@D+bce%wTzS~ogh{$Q;DgUy09>R6-8XG)oL-&60jc+W-By`Qn)!4Qli9E
z)}Nn`*9m20#6N#F_JG%MA^t$qZ}4YTV2*k3?>8e_A=sFI0<ZGRW#E{QBpegBQxr7h
zA4)QX7RM;qu(HR}GD^FQU=&81KbE8pj@uE@C&>`qeoV>{N|Xjcl(&JBxLe6PgyrYZ
z)E3bsDDASaL_=;9cht?45Mfp&3@XH-g;<nuD-wnkVUdMcKi@DgDuMqqaFPZoz=8;{
z$^fcNgiwfu3$Q8yN+GHSHW3CL4}(a62PaSs2BTzUlK7L@S-7c>N85nho-!tx6wIPV
z<+cF6C(Kz1n}iwti&ezuUkCw>qaH17UKo7kM8dnv-RB26y2?uSZ0(H+j&E8_p4l0@
z@!#dK^<j94y6fN@G<htb?`>{8Q3Ayt(|83$L1+x!g*F`J?_AzfHhQHJ?V`{OKm@`H
zqkLe{1)bgLZ5;`$Hdc7y9*X7>F@NUbyVz1@JOLw&=~%RBD6evQ#1Cu2lw@g84a3MZ
zMr;3wIVQs@U-0DD%@!nnecrgV?BNjv5mqKX9#xLZ%qO%VqL{NLp|Z<8mG7o=Q(HNT
z0t7?<VG(ud`J`;i?BF5i=GY-;i{iW4LzLJ>{^hy0q#B#Rh&)!0(53v<6V~y*mXbEj
zZ&6agGmR31IqQa~q+(5F#@Nn?F28=%XUI*%!Xil?*)x*TN~m|bM8QHvHGan$l+!=>
z=Al#KASiGi#x_>2q3Wo<L<MB<!i<1YKxnGWLkQjTVMG=9V?0eHZIu_hkz0In`aeB<
z;%Z`bmovrbTBPK{Dc&EG=)V*Unfqe-b%%e@LvmMPh<|4nP4TdkO^eIxd9He!?eCI&
zS=0<!9GBQtR}A;H7IihqE4vLMzn4x%TIFA;>o;k!igH+!As~7SPRnNiIyabHfR<1_
zi1?3lL=nGC&>(vMavQOCddn~<m$7XGr@C6ASds*|6&TU{`D{<qSIdWsCigQC6)vX}
zsEFS&YDox)0vgXk?RNY;Msd?|UgCP!FqM5+!0_klgne+vo|g)PWNB!5%St3Iu&m+9
zC&(-jo6wwnE5><nazQD^&sEMbKmoam(EAgf{xx`;OX;p3d<-+8@Y2{Q%?{~eEWv<|
zQ-KjnW9zV_)Vvr}7ZnVAOZ<kk#5lHs4GEykizDA^=#e@1n%sx#LpA$c%_rpi2S~X%
zv<;-3o|0dsP2WqjRN^O9&rHof!vLc~uv-0R4{>I1h{~r}PH;M>adlh*7@bjIn|V|Y
zOV)~W(!W0pOnYjwTrkSQ$34K@`w|P+vple<_6RVG(RGXtG88ieS$^m+A*RJqtwx|k
z5ZG?$aYj{*Qgc#5>_ID(QWY9wu<+{H{mC411I_5-97RFzp|#v9PnROF(q0@=xjeaw
z<QWnn%af-CI6QPnzmuXqq~~Z&Fhq-3`sYmJ;4Axp?0c8p?@4juBHgB@I!a~TdyX@*
zYSRhxG;GMm*;Hqdiifx+E8=Q<z;?CU^_l(wD;Ck{7mnum#koc056Nb&JUPqe#Xpkk
zZ>mmfj!d?|_sP&$Lvk;kS>>Z|X2GSNp^KO~!Hy9iXHfA1^fc7DD}umsEq|_8ttCtv
zYZr=5f&G|%s=EQzp(mAIfi$YwwQTC@tEAn0ngrNkrH1iMRE)2V{};z39dgS62B`0w
zJEicYoEe#PH_bq>g-{8G@jwI4X78|D^dQp<<s$`!3NA%meZ0v98ol;-31|rXgM^A&
z2Q^MoRt4F~&P<GF|6Brf`jCCWvUffNGSrHB%<H9`H0DWGF@&K$n-0TQL$j<6dOt<@
z#UA!dI<FUcw_5e~yBxKd^6<cbpo&rw9FA`idD?=p$y^~<Ion^j47r>17NG~O>Ufh8
zVNDeLBJM6Pm*E_GBbo%3m|J`o29n5q@*N|mHgsVWd0r|HqBpEkTTC8$L*8@XSn<}q
zH=827FHLg(XSAtQZgik;s++*59B$=l+)8(<k`QE^(R^4?`+(7=;8C4qI69f7#Uih9
zPhuYY{H$*tp47-a`VMw*lXg@_vGvuE`zQ8Je+dM8j6;743LvP2yc8~NXs4@jfN}ZF
zNMvn&#bKfxB^A!(qf-@Kr4FBZM~ioHsoIiQaM~b)S-xmR#pZ+RbfQ*wFda8gzu$>a
zS_Sl-s;iqb68R60miff*dX#E*Ny8XODcl|V<S-k@pU3fPYNmvXo-#<5s8I&3)CyIj
zG>GhcCP|Kf;ZEAgcp`tTCO*b@r*U1aZNr?>z1W8NLkQ+X8!y5PEk!91bS*Mh$`w$g
z)l@V-9a!q=?bvZWKh>Fml7G&qNVsvNSA<UQf@D_E(XF&px^vRds%k*yO3^pdi#Sas
zgOfGy(ix3ykQDBPJsVBAAcnig^#vM`Pm)5+toHPr9Gf8}wZ6qX$ad#K@+g6`OA`MO
zDR)Pa%52D@CP{Xd2;|Si^yAt+p*w3{;Z(S#6slhh|KcOOT~+{o*CW|Nxw-VtfcHcX
zN$VZ^rP0OZ?i8GLKHHa)b|ROVH~VC+DRopDf0n`lrEUqC9rexXM+FUu#^Ih=41=r<
z*km>?!xbMe5XCyjI!Tfm*zogx$Ju31&36dEoExH0#m^1q<M6NjkYJT0e2po1{_V43
z+_U0la6vuT;5z!+kZ|$Gsf=koT`lIZDc8#qvN1I1bECi!R?^0LPxX`a{gxgCn-y*w
zt-Ut4njVg|uZr|zyW=Qj<HfAt-a9B)d%d-$puDK`n{~&~m~?-hOPZ8U=17t=FXJTE
z=ggLtN1a{IDEX7rRI)kovf)QE)jJzrd#1*9j}b4V(z`rbcDBN8p`r-A<4tvI85^Yx
zAbBtZO9cc#J7(I`2YYrrrrq^$0XTb2%vsP>996N(`S@AZWx392v4uqW9EuGZk-%;K
z$=Ept*K3(2nJ}Dljk13!`OMvbioYZ&2~51-$&M`_6EpoAhmlN<SmY#6VHEh?5HoVp
zLDBLq?&FTE-fynS>80)WO3-K+n|{>*$vb{XBVMX=^y3Eej2a#9YC@L110#9Fkc^we
zVC~3X=(o^2pNfOY;%LDK4vET}f>+ZHa4lS2G^iR#N=+5z`m$uIJIFt7l0jCN>}Flj
z4;wCi(@ytSrA}-P1a7SJPLtrvr^w8bVHt|gRpiV}+jKqW>zzEzqR|QknGEf)E^U;L
zb?<_nTWo@f<V_5Z6?}f|h~4FBYGA2b@US<^mMwJZnd}-zF}<WeE%iBx>y4$5W#&_>
zi!I>|+5g$;E@i-czD;0{1%3EWG(gF}>i9&;mugI@R}ZJhTyY9enj`Ej`X;dc#T7Qn
zWWODmlB&#bxT<+s?5Fh}p&~-^)9<kHfT3UycC>%0ugrYTn+;)YoOV5U-?44UIuV2H
z%<x*PO6<mL&9BRsgHEB<E8pQT6^m;f<d2v6&8`<9zpXUt>}cnn2u~x0HkLm|9#bcY
zxH~m5E`u=#t2165Fq2ZfXoFU6jp9pIAS1*@qxF9=_Kw||w%fLLDz<Ig#vR+XRk2gC
zDz@#4ZQHhO+pHuz&s=ZYbG>V?jSts9xZ2sq=;P?U_gtm-3AuC&q_=Xd*d<xoKD}Z{
zuuUI^WT3zCXd3#4JwB#r>E<*x;n&tR>8NL@Ek0SD$wP4dG%v#?G0{|<PJlMN(>qqH
zg}}q7s3`q|5DB8MWm0c&b$0_*42Ly#{uJAa=4ZfG4-D(QefOBZfga!1E0}amsGoer
zA>|qiCAeV<)FVa>A#oVT#iKb?Q6a+GG93=>;NA3ERFMS>M<c#7yO~y>Jz;K(pwtl~
z6O!1pC0=CK;Dw{fSGjIY()|Kk%#k2!Bn8uLPofUEuqop0PN6M$RKfq$FR(vNx!_1w
z?DXw`1{of_slN3d=6`iFw~4gV<wK%&ALX6^vyHmXlx1h#Zh9~|j>tZ%Na_#X$R;)a
zu!+%nI7cOVzR3t3j~(87_ee-Xsl%u~WF2*iElUbqrn^-wu0QHAT5YBucqboSb}C#-
z>2OeVqYStv4*j(X=db<O4$ijq2wiwy@nZ5gktCoRYsU4Gl9i5cAq<IbxwOtypg&v#
z>_;zKL*Z9K&+RI8-WL_HCDQ^Bxr%@fVX2g2n6btpeN0o5N?wY-s)kih#w%6q^(){t
z41E9gd<y{LlUVzj05>GZm1uHdl{Z?T&w^Hgctxp_^qOdV``bHSCHZwJKP+e5Ku)sf
zFVYG#g)mzF)C}Wammg)L#>c?O@@LL?@l^dx+o*%6MycY2sg=_Lz7nD>-vt3%bgwWb
zeb#<}Vfg@n6#_niVQ*Ip+PV}u@MlS7?Ai}+aVQG0HYn(J($#?(IceYUFP6KEgs=}_
zJX^?f%x&;>Zc~%})dZ=(hi<lLU;3`gb8BL-f!7~sLo@LjR87-^K{M!DlnpZiF=SCG
zoV{UD1hNdD*NZ1?EFP5&a=08^WEpr-E~HUnbH#S((yj%CnMHZa2j_`Zc#ymzi9Wk0
z?-;#RKRs8<I%|2o41W|!mfD<K;;~|YBtv58j{dR8Yt7ky#;6rGC0UW;xDu^7bP`|s
za?SctQ;Gok$_0uVLM1cY;c17co+soF!~xZN8wDEole-}(N5Tz<Ffu;QCXJgfGY2jl
zh4o6=2Hn+sQ>#OE!Ds2s$MBF&uU=V4I|u{p70VSqi?YUPC&#~(Fl>(<qQ8@~gL>oq
z$o^PG<{E{Vi)Ppm$a#a*6^Z!VUB1nG!sah;AZc{HjBaST*Hl7TZWK(G4O?HmFo`;W
z#2}nS#-FWCa=D{B#_2Pu4&0D-k*U)$9QZT6EImL=1VasJ=vJfhK`qyWi8SZ>2k?ro
z^G7+0Sr3xl;aS(+>MD!IBw0n358}WT8S~Ey41pgj^KKgA?A<MPOMJO0`meFFPW9P_
zE|(dNov(%l%_;Y-i-z(|8)lQ2gEvVe_0A(|<3<Eqklj#MQ86gfrzF-4E;*UJYiTw{
z_G>q^;7n5j0lXSFq%knI{h+QrAUGP0>fO)jRvxkY>A?p{sq7>uQ;YGRCB-qlZwWqM
z$*_Q_DqLO+YEbT<$UayihL@v?Gt7FTSVU|b+89U8eTP0pYM!~+78oO4Dxh8y`&iPW
zB{2jB$})VHp~Y-{NbTKjA@Vit-x@5X)yqr?E8S1I6?)If4<k?BdJNL3ouE^pxK+9)
zAih}i3?X#R1jE2K>?9HMJd_`d!$ozvNZn5^UTqjW0zLZtT$rBTKq=V^z=i!eu+Hhg
zg`?DQi$gNeYgtK*%MhpV7Ax^S1Sn);=XD$xt&5@n?1MCoixH%0(Q&v5J!KJ<YA$M=
zl*X}(+7`b^T4P2AOc$<{<*`AFRC<~>#CR`8hsCU4wSeomoCgW%OFg)d+C(<$lnOn%
ztc@=G7%>uQUf^@cj4|*fu{T+)1T3S~$DeBzYGxl>5W{$$jV;<!8L}*3XBvbk3(Qg+
zM}A>uYWuIKt=I9l_y?w5i|0&Ymr!+fFflebU2Ao>WjRn}CuorvB8>4Ey;qAcO#&#W
zI%Ff7WjBthYk_fMZ27^cfvxhf5rO_!jL^{)h+9UO&Mi8LS`bhAzvuB=FyCp4t`FQx
zeZ4-P<{SE}V{+)Hy1jx##Lm-}yym)r(75wsnO(mwqFCCo`FG1}u87>R3j&t`&HyBb
z6OeER92T=vI;EFx+CduNdzURb!ze~<xD%XyiD)^Mr%p{>!HH}|iU{6I%gS!`daL)_
zf@3mRa+`8Y2*N_-J&!`l^AZcg!L}q+JuX9=5((dC>UeCo(KTjKePUzDo8L{`E(VQW
z(o*biR9<dcaCABTrt2{lbWBH-&~RoAL|@8Fp;Ie0k<I#cI)Xw2$ZD8Sdl|^U=_Qj;
zh!Dv*nRPhN$thM~8EpB1Pu94hM;5D?k%?zRTfc#@KSRns*0v{){#aajTh~|)THK3&
z*q-5BQD&9B;?p5_DgMk{OQ#$c{8S1CD|6PDsNUolg}r!4I*}_&<}4b)T_&%YOX)FL
zF=``DLvgD6>87FiS{yfM!9rpC@c6*~L!Fl%3H*cCJ6EP)lr#%R{D%7Ul3nixJkDEZ
zOVNm=MEZWbwT5WY!Z;*Q)*feqtvgEK4%wUsRt5RzzCZUyvLoixOL}6~<oOUOy~*9h
zMRp2SItI4GzEmUh<N<4mbO46?>Pr?g=@wi_tb}H<311HTeWi|2s_z%bzpupq_>KKy
z4&4U7J%KCVT;zX>s{c0=`Q5T<>}coo|7HrDuI6+;Av7(^DmoblcTOT(J0h2+ry`pi
zhZW7UsZ36ltPA-2zNzR~*+RDzLNAa<;{Lqpx{Wsy$-pqQ|Lk=1CX)-6!hZr$3wedZ
zZ(HT^4h~P^#@ojI>i)J{O3%KIUU6Q2PJ`3eK<AuvMX0vgG{@8F?w|8pH6u@{jJ|9#
zg{xrelB(oKCwQ8gdmJ|+D87c_L_vc%Z+*d-D%_=-VENgcn`fKlIjdE#S+&sf+1c6T
z`g!w>MuRqEE&QOO2y;A1>S;h(xsoc~LYXYgL~3a|EF&AMpISQ|w)sPww~W;<89Eg`
zRvX<7oIF2V!);1OyN9l+#MM@YvIZajMlnY@aiQg-@@Kj~iQEiJqCZg`fp&L)z)-EJ
z9o{IM3&-Wp+RiU2=$&uM@#h)ES}YVOLk7UcTl!v>cH(E%vh+PPFlW(FK2O#ffMjmv
z!@DiGej5Wf(bF8;_FN&wF#8)+eTJY|ezrGIs(LS+yh#(M+7ph&K_;hP$8CJ|6k6rR
zQ7*4$Yh~f{un+w-2UPr#aqtUwUd~kE*d$&s{4qSX6-lTP1VxrYO^4>dj1ufD-!A5%
zWx|>gn0F37&)eI%`|Up7U@M^>1`*x=4J)-teIn9}G=Rkbf6_D*aNN&{TX-aB$|{Yi
zJ`=mhDyqsMFUzunKivw7CA+V!&M4qXm4|c1LO|~74aT4o2Eot+=l!=6<jH}`oFBOd
zW89A=$B$93#c(3c*)K#d_63m1#VBb6nU4wFwZoJ*6c@m?%H)U$KAUKdF5~93;Xnb{
zxy>5oK6H@4Do&jXDx@*GBKu8akQQo6iiPN!Bh6s{>i?>O<Ji;DW2=D~kl8LcqaJ{m
zxE;}_VQ+!~1%(p)cSEwL4OSz68tmSv7~~8?1)Vxz0T|*S-aQlcDbA3ps>SKsJVW*#
zn~Q?)e@(xEl@Mt35kgMco&woK*fxu5!W_pGlaSg=8}22XVL*z)v0;420ZB~#6FSTU
zo;+MPfxu9K79i#sFJWu4uhEJ)%6z0~jxq*l6E%#jjF|0;<Aj#oq?9GSf=mHr!n5CT
znX=c9Ef8aGRu{|j*8@C|I*=eClm*330`nRF89rep&ef(*i{jlMv0Hi$kKb-f<zjkN
zj)>JZgC}2L!UN+2TkhT!>2f8<#049DuVupaxbFfRw)m=1k7_0J;gAREgyj%z1mhpH
z>f`>Ku>b6BoSix=MsQ&VaPvJ8<F($E-@J02EC#OVzLz)g6)&NMrwV<zZjdP_eoss`
zU~AOO2K(A6et$veJ$%{QE7qyJZ4HvG%vMWlY=C2diRwO?Zg;J=c|T|@f7~xyEQj-<
zGYkMj-!fT8qmwr6XHeKZOk^vUxu&1}F?(ScP4D3vj=rxfa2#2P|KVU)NI;{ioh_Sr
zb6@8w4muVrxr^3i-*5B2hjZ&}_p{tmpYQmhhwJM54%Q}&ga`At3%920um9ZgYUXa{
z3Sd~6FBm^vWEvlOC4@)d(F-D}z7Jd?N167rYg2fbg<t8ce*2}|Cno|4-jPHPgkEIO
zGnsc%4UW&cylz#ai^ZV;h2+y{R2{jQZY>u~?;n+~MO!3d@QfY#x1Ii9n14TvbCPl@
z?e{M+#4tcWHR?b>X#X8P^A9)kFQ4Ii6tvMl-+%ELUTWDmt+Rh~;-6?drv*tmZ)B$r
zd@X4@7GX{9aiU2D@kR4k@N|OcR^bXzO3~GqzTLV&4JEFtjrV&>ELaHxMy|E(Zuqom
z0h?I?0R+>u^%kveVC@JG!ny^vgVPuFoEVI&AsFu=%B|o8+Xb_Si~(!o{V5^8%tJH>
z5*WdA9)qD`UJv2C;M5$k$RZ0B9b3)&_Z{RCKyQAy8P3HBfoN5NFRXPPx<7hfYI2;`
zqt+1xL>7`zZSF`W2Y14zFX^oV0D!+&?<w2;zY^gDr`XK#Cr_?C-|fdJXl2D{M+r?e
zG5-wWOP>NCV1w?cvPXhK@{LsWC!!VUF2#r>i($+u3J?%sL=J#W&*LY^)8~=O*nM{*
zatU+wD!-;2V_9I``mlz2Fbjd_dSLDg<<S~@V-|ZMKi(4K1gAN>_w1+Y8xQ0TGm%pZ
zaY|Ymt;V@r4t{33GBd7K;$O319_DG(sNm`u;Mz-=MJJL1B0MG(B4QM=PAM~F-<<gV
z4C>*EktCxtd9<GVn-iaH6~7TBQwT1Z_T(z$re${V8{Oed?V}t34)4>D$)~Ru)f$JP
zRD0UwYtSSuj+a1=#(X8Ef!)mFOZrosfxk#*v0EzO#9>e5-Ip%7%~ewn0}?p~!i#wu
z`5PKKnQ+OCRj~F4`~<pjYvMraV@a~To``6&5*k@qb|B^JRn98D+f>-slrvq=dGvWl
zV}=?^^!7O#fQ1*=4g6<&*w<FTqtkHVaWu@6d$FmutWw~;ZvEwYvYFqeZ9|)EySHVJ
z!*WQ|zVJ9-v-iRo5BOR`cv_*wPG)Sj)3{CMF3SCi?dqqe#pA%!y2&l5Z2An7?zXM7
zb`eZg)w%-!X5_i(l1;0~+m_A3<^*I7?7VXEsh5XEo30aEMeqqnZr#=9VakD*vuTF^
zzQvRZre&z;QVVWdA^hP#K=DS{8*a7!BA9bCm=vS7YdEDSOWyNhdgxt3)=8)Pg*ypp
z8(|s7i>NBAtc3O{D7Q`H>E@3ryWY}$*249Iq56$xm;O5+zhvPEuHRK=Smq-fh2AOw
zy?urqd{-V#uo+P_uA8>Q%~>v44Vhfm|B&Kg^%=|qa{rLx`z_a!3}7NZd;DC@(D_`c
z3Ye{nq9a3)tY1tep{w@a3KxaexouX9)!GebON7I>R<l)yGgnWxOQ+DVe9iI>t91Aa
zA-$DT3ZdCd#CrLD)W0r~A2%|V_A1?2>#{QkN3mr2=dJmUrNvU-5=g=gz}n@TKu#hW
z=CQwa#`yZ8#v45`ycTr%-+YdP;UMh7P2Xwgh$_5S`id@V%RJ^uLfXD)b3!MSxS~bp
zk}J9MaJ>F5ZRbS1z`wZgVw3A1SA+zdGId16>t&K4ba?bvSG7QHiCuX3a^iQ>!%=x4
zynQdvbWb7DLwp17gl+&snj_>VP{>M}V17^#83=iGO?rD*!4GrXIDS+HGEbGBCIvt&
z1@Et;&^jEUWlBLeapOo^A<zZTKTV5Zr(SLKByk=x`)>;O!&C4*y_G(krkW_5VM?MP
z9yh3lnzY{zWD;9tT9Q^ABp%c5W5sYnABTK$35*7Bpvs$Nhg2hP(w6jWNF^V<oi3>}
zQL;<H_!#<Fr&wi)Kqx_L|0R1xO5S48F>o)$gHhGK>Nv{6I$qMWE+yti&`sHV1SjaZ
zKdHYAX5oI#;UI&+gnv~8&%)99Cvv*0>Hqlw2Cbin(es#g?h*x~<q6QMMgzN3baWjI
zphQcH{#*IP8yoY-1?xV7u_|G@x#>t%h)zcNz%?$2DxRZ|K)#e<N7Orr$@y0$Q)6OC
zP4OKUPDA7B2C)HZxO-AbJt`5vPd01No1Jwh_KE1wR9Eo)*L9~x@`owA8OSgF`h(U6
zDp%9Q0Z89FVj6|ql@m6P7VWLdp($oypc#J{9LE5_p;f0uZ7;jjC|tdwrPhabxYDKV
zll{1<bv<MW3Hv+?_lS}yx(33Ej$_nNK42=(;?Atc9URf6fEs)FJ-3NF0Y|x+R-Gok
zo*3u6ubX~r9HfIaZ_M!nqS5-|>yEV)uk5}12=iJ*sa_nk5Mlvk(MEC)IpQx<yQ*x$
zN`8al^OHapr=J{dIBv)vN?}%u;YXmlTeLaT%Baej*}sI1d<(7T<YrKFR7<l9jn4{R
z^)lNZsbW%K#BT)i1s%LJ$N2(F7G)o+?f12Q&_Bn{J=gDB4S1OXIylv{c8gShU^Q*t
z@j~XK>!M1e*UoYdvA?6S9|`p^$Ws4aHVw_XDbcTLPe<?L)`I_r#?O%yq$>pZgXrd+
zE8^0{d;$=IU0X$Rjxm_lRUK$!BfVt$52WnI@1yZpUmzQI>eD-%rltd2qt`95Z`gPT
z@!lB#@CY~7(U$~I9>0$>e3ldLYd_@c1TQtIVijnv+t&N-v+6|NcHDEAONF7PofyMQ
zPBWBR`KF^RNKZl;Vu1dE#*bgCM_Gg|*^6G&j()g|-v)0g=`8*W8Xv6T!Y;`rB%T%W
zUlXFLklP${rjtiHG{Hli`m^(wJZU}Zj7N1n*S~L?0D5>f(CiT0OjjxKCNRlz_d0iv
zT7*?#bJgnB0gtsxbg<E{1qp_uH`h@s$kOm;x5rNU;+?X_Rlh_Vs72FSJ3YuWE+^s<
zb?^YGwSP`AyA<P`sk>--(E^n`#T~b3o{miP-I$E#L&4H+S7G=)MXdPoe$3ct#w<Zj
z?IP-4G<A+sEM`b!&smb8nL-g^xMgB`s_ov7T>+%tqOna+pjrUr%X@fD*Ij7kr!*~+
z&Nf{VTa}ef!v^|rMBPo1@=(XcSby**??Mv@-8%$YL>_UDFl7Si%Hc!*7~#MZOjQUi
z6-A7m|6?ELP(}F@ty(H&5rNj72`c$6nG_{qWSt#osC|!!Sk(J>6Aj^=vmPScP>ZoU
zJwHqsJ^@RM0pu$zIF<1O7v&ge<Vt8U$GggSuAb$Sm0c!>9WF!7+5;J(xpT%(ywAT*
zgEwiLrQ?t$9L8enf`7(mk+^QlT2386e?9FcLBF4GZnBM19X0gfJai3$x5PcFX+K!k
zr;BYN@OngqX=%`|9APa%Y&^ut=z2K^!gOTO$64(Eb;45Shhyq#Mmj-Xb%(2VFa~G0
zxgd@F^^ur8^GiiKZR5@OLOei^vQG6+;N~)<?4v0s%=T8-)*Jd~C$Dg#A(-VDym>ts
z>1G-y?B#eqZWheMtEbrsp~r!;bE)5_)|Vp@reoY@7Q6Y9OTnMV?Eto>;;2h^W2?Ou
z9H)&i?xy4DaKO<>z|u|0O}F9;?6_wBgV^dccJ{S=-;HU_jf``ciO-8?Lx;*X>eey1
z>D@^l_;mQVSw;egE15i8wdFUi?%e&p@E^FkgTR+|sSA#Su%6&-@Z?PuuI~ef2F)gm
zZB}3#{cr$?*+l&P)JHvi>q}1Dqr68jHSTPfWn1!US=(*hP#MnG9K1@*Lex2<`s8z#
zyeoDOzf!gCEyzb1e*0N1jnvAD@ixi=2ej{7@|#cYJ0;!&g~?Qzp-*_C2HV&<_F-}I
z<#egwQ`z+5J$5<xt27Uscfs^xKx&BQW8>QozK{|LJ`WJONtJ6&GqEzhwzGViqn7*T
zGf$&0v0eFXb$(cOeuvMGkmgPK42kk9PmAY|hJ;T|w%tYbGxsP}l+QxELi|%iLdEZD
z&1;`3<(m%&t&4En6ZOWWZ({wncj#OA4DC{UnRlIg7TPEtOjFJI3%Xi!7PI^?EKj$Z
zBdQ-6lKY>Ph=1If;ho+EU*E~(^jttdIRD+i{qKyA|5Hf$BF=~M{?Oy`OSK!BlRB13
zk4}OMV=SgN#2MClk~MuwQ$Eric0>Z1di<`r=a=X9I)a6%G2w1{s~dSpL;JPy_H&o&
zQ<IgaCx5o~W!2#hinZ?_f<0nq9G^?5h-9pdD<LP>Zk=UG^k)k<-tk_}75<fK;qB>u
z(kBwkS_5<nMMrOh>fZ3`{?uC5$m(T_7Rd(ET-bQ379RkVH;P9mJmyE-VcVnb=qhJ+
z4eA|MKxUy+S6jk>`xyk6bEQ~!XLtA4QG3Ak4*i5#kD=^$^4D!uJB-;Vo%B9egp-8k
zRfq(W0TnOMwlMfh;&dNuok{xk>vxYU9y?S$0Ir%d-w)8oY}^2lPPXWI8BxW2KjoD{
zF_}V@A*K4tpmpkFmM7n3g>4Cx5qPNSi3)U|BCnB1Shx2_c%7K$8lNW(kLO9m1ce$C
zk%0WoNuEp~wUpjYv*FMy(d2K^XV5jV5X@!t1%2qJtmG6(DtE_dP_*I|I06|W$DUnr
z6Nnlxf^bZ$%FL}{1`1^<q!_uQMj>r-_0<!hK!`C*3YA=7sc&J8kQBFL0_{WqNBNLn
zk;uJ_Zn(&i>+<vy<Bj$pw}JHOIMQtoJ@_IyU+3WgIaU`rnRGICgIC8Pd*)~CGpGij
z7fS5tH||72=5Ivkbiy?^w}|l~PDM7c&BQt|n2}^edQuYU(QqR}dCj6*KJI2+dk8!6
z>-A``7l1Q(ip%m@-zh|EKxI<|iuTNv>uooJ!3V3exz~=LH`B$cS_&dj$NW`{^*CGa
zm8-{o)h0j7t~0>@(*TtBy$_#gX|_isJ=uSu$KWRUMn^;L7*~9)*ku~udq-t^EuT-(
zD}r>L(VB;(o#m<#4>LMzx2Mt1?Rw3&c)5w8g8mZDU7*cCSL*|*<@i!h{t8?X@nb5N
z-_iQOcBjSOlF0XRKAVhk2fw|^_?K9b0I9yYHYJwHcV8M$12;Rb2ES%YQqz4e=|bpI
z<0t!&C@0kBlj!?|BUHp~pp3#rR;{rvVtYXIPPF`H94~eZEhi3aTc(ZBzSdOXX6*+0
z19(GPGouR~3RKiuCSRVQ;Xl20(YhHClS5fNQ*NAf5FgxzTm&8By@bs+fme=52yb57
zl<B|kf8WFlw1CUF`P%Nb2ooO~SxJw!Q1(tq=u7tDagx|H&oobYJf$sOYq0VVid@?)
zm*r1cA6(0vg@<<AksLB@^Or)pqr{{KrR(GybO*US&ygP;8VLmy?X1mNx4`loD}jxz
zeKnb2#US(FEC{6SGDn)tJTl2(Hh-n>Y!k3#8@W^`tiJ^ZJ};9RM__eG-<c+Q!}hkM
zc@-R+`L*p<B1HS{Pk(U2^1V4R)+KgV0r~DOR6_e-c4}R&+lQArLT85vch;V_25c1`
zW+8-RtG}b0F=Fro!g3uD>6k2V4P!Ger{o&qXmbKb*A!6oRELiuYM5)tq#)#HCSA<5
z&z+q3B@#l4(FK`vuBXr=LVB*8BHzjruH$0}5+=?`PlHS6N2a&jmSuM7OpJ2$+%SaK
zJ+C{gcmf={Jr&Ap<x^>mWN5j5ZmJ#f!pDcY4J&+=f(f)*adr36_M)hfjzfVPiK3zI
zd&j!Bl!>a52tY;0C`Y$s1ogst34x}9dPSZsGi3n$NM*0Gh5V(dC8*omo{J3A596^0
zgm!8qn6vFIP%<MR3_&kL4DD@`5aCVfPN~S+S)tiUU2n%6k@wyl>9uM*h@+g<XoJyg
zLXm%o6$%Hx@@bn&2Y8{%shFv*nK0rtDDI7u7>kln(T?G@<UfT1KSFNd{(XJ#UU2)i
z8y@K!gB|Fbt<6p4a=bA%^qAx0v3;p5|IF-tcRb?pKH5M-A$yQ(?b0j1tuxs*ZY866
z`Lc)44QSM0M)-<K0*~n9QnS!;2&>UR4Q*Pqv*gNPAg)M{u9+HRerff@s^dW!$Pi|r
zXj~_)*dZ>(Cf(_x`k~iPEWfR?1uyesO8?WuG00$nd~!KXHPVEziJNH)ZmScgC3~@0
z<m%VZrVHNZ`!?MC@l%Z+2;!%YTg#0yf4IhhA)aN4AVk6s9CAg>4T8gGn4xp--u2zx
zz)d5xv)PwjqW1w{JtPmEM2exV)#?mF$)`1p;!So;jR(V8DIUl$S7!1xRQjQ3<1SZ{
zitE`bxW?gREivU6XC42U1+%};+UTa%c6NTSda$#AcMW>{J0WtZc(B&Tg=t5<j5m!R
zmOP@*!|C=x?!bsGi2PvzEM6Vk&@pe7_GZPOL7d`UOq;S+IaUbT(~@+NBnz1}88rMa
zC#I6l<6Rty?ti^BtC3g=K%~s9xZ57{3l)$OW9XQ%wfLN8P64|<F^29k^W}Y3rMkQr
z+nJLI4|>G&`dZk~rm>*DDpw|+>$F84pS)_HyzG;c(CH|IxiHxVVqVW^IdN2<xcRXh
z4e#FN=einzVO1|P-s{C2$4>p}F6?t!ick0W!+u6FY}?k1fGX@Gp0#yP12XqPG4R6s
z?pXeFl<XoQpTJ0X1f=8pR9*cNYq3wksgc8-qQYb9t8u})$k_yzR?y}1(X4pRLIDTA
z0_XZn;{h>x_YPGB^=Gc}&#k|oIpt(fIk^h}j8pL+1(NYrn#p?Z+{3Dv!j#c6AE{GW
zMqHzEc@SISh^3Jou}f8i!v$$p<)^Cp;8?a~%FL3Cg?PgCqSxt8@&K;d_HC`KUTYFF
z97nCaHZF6j1^}A7bFytIvyilXFSD%T=q&H_8L+>SJ9E}g+GE7LNNUsgL!WdrfHHj_
z*uEjG3e#^<1?f>oAN|rWw;aFCAHcL2QlmL{3wCI8$JKq<3e!~gBo!+Ld&hh)%Hel3
zpr)K^>_QayTdc85hKZUTdXTL^grTJLK*Z>w#0FA#ulY*5zY=v`<A8*KZpY4*EVK*c
zM?;VUzDD<t$gL6emoF3$iC&GDq%?c_wAE+|C9okWifFN4jX7^A6B<~@@7#X>3_ph4
zR3G5Kdt<RWh`Irarcm&ctm_D$k;wSzGef=2q)gsR=fQ+WBBR>Qco2c01D2{0$L*_0
zPj2~FnXx^28oLhAE6}T)n(AhY>+^vfsjs`gApN!=l3{qDc{4)dt`P-5J;Zxr;3n?}
zw95?|OHZ}5<`{>CqG0*15l;RE+Kf7e$unBe#{RLue#iYgbXZA|Kfy)i_h<}xL(L4+
zUY`MDK8Nv?+pPkn?&NMpD#<1cOKvIfAUqgcX1f2MBKhdXdqv%VJ;6Lyd}<y0w2&u@
z#3Aw&yP_41VmHut?yPu^e9c(WT0j8tuNTZgMrdGlOpVi;LN9C(s3pad6pK2Y5fG&4
zgm!cv@rPNF=LV9zgXCcSq<(uL9SnOO9y*O)Wq_TTn~p@$SZXQ7;jQve6Za~wH9Z;w
zkKSXQ@#c86Gy~64$Aw#t(7WA{!g)3+7G(v%&i2XAQcz5@-J%EmW0jezKTU^4!46Hc
z(;YHlru%4_yZ|{sd!{lcn2+0q+>&YkkZltKanfTHWP=C6K4Q;MdhlX`R@Tfe;q+p(
zF&Ca20s2M&@<y~pl<@Bv*s6-ZPGfQuBPWf)Pb~jLU?uxP)3Py_u{}SW%lRv4o?!#?
z;H{C2Uzdm?wRsg)B7Oxwp{vub49hdu^PJ55C>E^RYLN<Iy9amU=q5~&B5uRNc#!!6
zy2&p>2z&@FHWh|u*KLRkl1;JYa5x~ebd=pe#~FInX7~GMDwAB9smGE4f#b(`yn*xF
zis?i|bRO&{E7h@V>5p$Tc)<l!XL-b~CQ(Pwll-_SimmYb41!_UvOtQwn(Ou@x&<0g
zvQc!yG5meyh}cnMl5OzC7wO-97O*d=txNE3NviURoHsFU<C*htxLO*VOlpK@?amu)
zXM-K^mE<%o;*WnE0@{1iacwDCIB>LF647pC^95~Cw$uo3F*$fVpvh{yciqwl6`!bc
zNi&gO<B(hZl=^XFz(KTrM*zl5*VE%&%XsII74T;e%S3968(kuTlr}}DQKOw>)yX9A
zTwE4vtNrMG1|hq*L1{A|w{(;12m9eV(!oy{W?M@V_Tyqm&R6fkvm<jDWE=m8)dRqr
zJ$b99fWi0)@Rc>55ZR=o97*1oyG#Kocuqj86WTEBXU$B1lBIp<_Rlf504V(%Un3ns
z1VzEDq{^BLau)uo$mJi?j#-*Y?Bh16fUgYEX%rH(iFZ#{T2D)Ek5QBS#}Za`tBT@0
z&M$8tpYxNTRXdh*`SjmPlYzBC;=j^~;tM6e76=l?JQSZxR8$^3epKfn)qlxL=>}n0
z)8<Lj?7^Xf3b*8ycRS6`Wu=Z}D{We1rYbA1R7vwFvC2BoIc&L1+<^|_&C*^`opl>Z
z()p0BQ^AzZH%efw@xtSV*<?!mx>D)~>3mMH3$>I$omsWtxOo*vfqara=?;A3*se$i
z`Uc|m%JF5?)P2%}>-6Wap4L7TS3Ap9(@<%m%F5U=^L+d~7K(gRJ|{1=GzQi8wg;iJ
z<<}6%5*}ge^i5LVgy)$*F~STWq<wko?Uk|^gwE1hBb5QVg_L<RWP`Q_f5Lx>_Bw<3
zx=C={45|5!7kq`QRki9pm*m7glEBF2Xfe9``y<{K<;T4w@rIinEKalCUW0qZaDyf(
za5(d6Fr+Mk<(t!lkt#nmB%+(bJ%t!ImVuTR6xZp#+at#>kA81WyyE7!Bpohe{_7Nu
zW4-%|S=nnJ2-!TCJb2?O?<vyY7#Lgczvs`>Z`!OgEO{f$?tyQ74+^ofsUe(1k4J4s
z)l2ps3v&CAu08(VxtZ``3UUbXV>1yTcC_5@b>-{IsC-mu(!m(wuv38-Locdy)W7oF
z%3%!NmpDz;srs6${S_RWS6SEl6==5T9piL+Uua?|KIWnQ2(Q<pv`F0&`oYM-TFs`9
z;Y#-?^?RDX;`k3RHidIK!}Ox_V8kg(C3V-7*<!z_A*Fs8-j3W5*4GV@#!XBQk=#i;
z5&zNlGzNSny?F7sS6V!NV;XE7WvlXbbLP_;{oe&FSbo4h3>ewu<d1{HPyHd}xSu}m
ztaIU223)rcEj3HBzt|W7rcKjAHObi0<7;k8Y;5eMSiDkge-kivgXO)Gh<xhpZ+TYC
zdJosw53&5?znms-IF>KRS!vkcJ!dW>Sl?&Z8^disf7zK_0%%%3X}`j)K--jKTR{^1
zJG3-f@fl*k1{eFgT+mTNlq`A9K>6%A7tA@DW1dOa@gvK&l~iIRW`N#8^E+m>1EzlF
zVHsIRL8j9uoXEjYO4+4V(_rWTUaCM)@l<w}Evwae%5ZwzXuw|{>B7-=AGRjIF#&SP
z&SUk5cB@(1X5qzpmc@Q2#jzwkiXc{TQ0;{n2fsS^`>q?Lm373WlZjl*utv)aBwl;a
zroSL~8h~~5*}~>RXZ-oDFDreHbd=}+v!?J5-N2_q9>elYH%xw~spI~4nu40CqtkbR
z+yA`fg+4+V{qy~oTVA7@tlc^%V&}U$tdfBtgx0X^thC3<7_yC%da{m^W4dy#M8l*Q
zx~?}TB>MZdYj8Z0-I~$!44T1rzS(uBI}4%rFRqrhw-$q{Y0&7MI||-VQG0&34IMNa
zxM8LaJbAq*_oEw~)61&gyN?GR%>Ilv4OH{MMoE`a%Bhzue}OAD&Xh`}Qr7Lb3aGT8
z%X+N^icG7NA^dv+3^7@##P{_ym5$2%e-`H|E^b{t$*ihaEcs3Qz-|63TK&<}ZEh0Y
zx<c3iH7@cH^XRCg%&~e5oO-bU8;eDC7RVZ&ZKq`Q6x*`iB706Mt0ZXb*QUx_FErQ!
zq)nx{r_CC*vdfWRip3)=PQYHKTwv+NdIQ{_3)w0T?s|AGzngDO(RscE7e0yW3>RXO
z-lpOpiVFHZFk0~EOu`fqY@I||>uF&pUbm82)TyZ{xq6M=x$<}Hv9|z$eQ7oB@5G|n
zZ@S?C<~u0VX^q*p5DKfFc+pce3()qd28o=V=7{WHdPEogPSD^C)_{IUZdJN)T56=O
z0UHp3cA;!dn1%irasE&2adr>YceXlYQq!M?LYe1q*6-NkR)+ee@7UuK2B<+5w(o59
zfW<)GfHk-h=3y|=%iqvXMT#?N|B5}1X|V}_`LZ6mS1UuH&e!YXl$BLe#7NTRUwlk^
za_c1<F-PBS^Zya8PORmW^UBzH&eCE}Mz7<C^Y+pX^5jlt&WGHSQvScv4Lppp|3Nn#
z{EKeLyg+qF2cM0!PnL0m$#f|Ghi)*<y5%JO4p(ohaTJ~CB((>tK&}lZ1(~~YIt8QG
zXU=gHh8uygp6tUs=!5g;`%YK)VSqO7Rn#RVmBBi5D*kbf$ta!!b2KOivEZwqbpk5|
zgBwe8<bYi>{hfI{m?b;|NwZoE%CSrQay6I5B1zfrdkbpwjNF?{%8~wCril5-0huLL
zJkHJ(CDO!bl9!xc08x>dMS|2RmePfezb{v_C34?_xV16L_(+JfJXL%*Q~`aK4m-e7
zH}a`+@Sn(ID`E%n7L(9QKagga;Cp}C#-`Rz7G%7Kz56T^ThhIHYa)|-ziG`ACaoyQ
zlVoZ3zI2BLj%zE?gJybW3U*&=B+K()GrY5vaNwNZ=ha+c*BmIYP5uYo>lz51qWb>I
z&AyhZHu7QH7mETM{aPtJH_8C=;NfbnF8-yba4fq?hlc=|Yggs+e)vyDS?z@w>|p&n
zaqO=Uh0>UBxIwy2UOJ1n$P;rZ>B9@{Z$kCeJc0jsdGAit){bhcAdF`0i01`pSe8S#
zMkTnNJ-*%EHJzbG8XBD*CdQ_zZw$Ka!;*T2M+XlsJvfNx5S|jCy&caN9_Wm`yY&wX
z3f|TJQdu5}Ip-VW3yk4y!#qxpbGPst$G>TUf5c630tK79?^=gX`2Qt({r|l#^HNP$
zexDQ7`?|UXxInUSGcW1MVry<;CX`)7k{jk8xiw6>g51G`M*!n?`<a`dkj`0P&3)%b
zX+yNP_Z8RjF*mHvbQ&G`fFpBq#U}IUd7|!3CKm@sfA5a7J@gZzS9--M-n+6Y?JiBW
z0Pz^ww|8JsCy|i)KA+KJM<&b(%{BKnh=+uUSkp3pij84~GNAM$U|`n<Q~WA(V1Boj
zu6@`0gb;e87AL6I=~A~PB_cPfc`Dm$y|s=(@?zEL4!8M1OtaVk5D2Ax8~=L>(<HJ;
z2AED+Auky!0PRfGAT2FXI@z3vOIbL7*jk;LsXta^DRBh_Indsb**d%bT=e^*=RPBy
z+VaC8@4SbMh}r4r35{9{^v7+U+l7aVy_HaQ$a}1r{N{-}&`pHR@$kT26GFVX<}+!e
zi1<hqtXS#g`#{D3&jsSToTgs+ibb6v*CJ(k8GEsyhIzIx<Ss-4^yXciCq)y@arsI?
z%rAzX@V}Ze0MAIiwD&7S47o{ySaG`3D&%^D+^xO3#rg@+I@|E(EUDJHcm}IU?)dd2
zG`20y%t~ZM)N1lH+E4CG72<ARFc0}c?o7{#bB=)KnElK$U(!lOIPBcDfg-k;DqD<T
z2rzf5m*43oIn#2I@wz3OW7nKJ!b$QO$tv%S4CcgxyBkHFFnY)&WuAt+xop>Zo>tV?
zscJRI$YoDkZ$*U1(vpWmXKmQ%;VG^kgJ4=flTNoYK)Ijc$D5N)%rKMAWQlv@nZFb^
zF!3;2fd3{6^$UwNVig0Y-PEnB%&@VLVa@I#^xR!S7zUbz&i#-GZe_QhE|oNXq4>#9
zsM=BBfxrH6LwE)VB2yAJP-J(W@MvY%rvs+r@J6#ob1JSdGA(25YDN|L*##zTUJ08o
z#azjuupkM3kv%Gl0c)vDD{2cJ>>k0r+#xh}saSNwk(wa%6HC5MOygCyxsWYghI*k4
zlV&0;m(@~)Mv*;Sc9)ESletH%xo!Sh>!Wyo+E%81S`u^b&@4+}{~`UjluL@_gTlpE
z@$jOS{|cpk7Y(&bR_EGrCDnq!h84RPWH~MFckblVmX#flY<2&LD{qX<k%<p10t~cV
z*4%yRdA|xJ93O*hEwmaWZ3P!u$MDv8Bjjix;&$tkoo~{qRK>E8_g6Nv8e8S|PK=og
z<k4v-t<R2!BIfEWF(A3n2DPwMjAzF^=?$pCSA0D|65uraqpPI?{9J$Sz;ej0>k;Vf
z`E*s8!(*%IFD+^HNiYGU=!<Fiv~~Ewa|SWt(*>S#>N<fPZpRU_?PveX-H_Qs@Z059
zs#gzAX-SIy*2~3~#8(Oj_uv284YN^h7BT|{1e5^#znNzAZQPwLZ2lF4{y!7Y|J!NC
z=AR0OPo0l&;c#%5+%=0fAI&A3@PUC1lhH-#IUo>Nu{<00y42G_3x$L3>*#nK3f(5}
zlSt6KXxC}pXJY(eh$Xkb=Yd@K5%ypZ+ovHKpwAQ2qo%V<HCVkFv%3M=<#t!pjXG?M
zoZJ9zTp>d2LTN<-;(FCmn9hy>Z-YanBqg;n9iMZOB~fWHwiB>{yoscm-e=wK!$ZXW
zZi!iPa%)Adrlh$^Bl}tveTI|?oZH2(9bA0;E^pTdcw5zaU}LKUJk5f9H&8PVl5$77
zad7HY$RK<c%~@a>Shk%q%~EX3PIFsPvgRt1wDPvng(M>A5u`P(c#q0;>I5;zLMg?~
zULg{$c9K6d_X{?{lvY{gL1Qw()&g!Vy#gxpBe=HIor+xa=}G3Whe7nv-Vs;<GRAUk
zuz%tN<0oTy8#(eRE@X^6w9=-?D%L%4YJQ-rr$TI;(TEck+NzLW(!T)rLK-jIr19?t
z;@1n6G*&cmala))a&JhEB|`?MH%nak?#!Xh6nwXOOBbTAhev(aIB?Ktz*rNKg})J<
z7ik5y;q<WAHIqOVFc%dlg*TGQ74^qn1uPU~>oK263(cxVU0v;r+4p4&USXT0?FSb;
z34mK|N}R<1Yo1{*Y3hj@o@`l{dW@PVNtuyTOi*1AHC>kf)!EORc7wTh!`f<34BnD0
zy36&P3PF+L4eBWuiQ~Bg`fY;&e&>vkz!&Q&X31fR@tfgu^bf3G0mpCgIlJAN2u@)A
zO(@fItej0~iM)1_U_<9RK?oqrq>9*plFCH6x<8n6<2{rVz?Yvb1Yx0&YRPz$1FdIG
z4`Kq@ySiO@#N#u?9}LEwVW@FJCq<OU-M-EjguJ^B7DRS1!4PB0WIQ;|e5ttiWAXqP
z*&4YDe82<+r3qSg!QDo-W};t^^ebeZ%#oW1My-aRCfTC^%+4}vQx(9!;!$MUGsLW=
zoconS=My-0CDR!>VT7k=$Wv2Ak2g$jnO=y%oS-cxteq1%hxq#p>g;irDJ&*r*Eq%S
zMNesW4H-!jCEb392{yrNd6Ewr8te@%1kRG}DhbJeS+}GzCW<F2C9oGy%S2*1C+Nyb
z*<zCM%nJ2PdHD<hr_9<)2w(ty3Rhr>`<QuGj=Tm1WGkcaCqcIU8qb1nlokD*<G-Kf
zM7&M&J=q9Nyf-m%Ia7E;HEn+WNowRG^I^*WP2S&1t-b>VAP3Ljck=qw%0Ob#I-9&n
z`~93zbvOy_v-~~TEJK6m+*xUTLCkB|fQsxTXhbNPE*rrGv@uu9M|R(zZ0SM54<$b;
z(b=oe8}Nz8<qX}Qn)+`~dNF5A9xq96^cnu0pvO+poZVY_DYbPh6fe(l6*<Rwl&D$O
zg*n1A;nlj-Oy+{L1I54j$l8rCJ#6cwCZ#oHsV2)he9XmIj4Db0^Ee26LI#I_FwCGA
ziEvY3eM3Bp10)9i6J@L4dFU9U0UtJopy24XEr68ib9cq692vYJsO%ZNFw1*NZ3S|3
zVM-*f5ljvgP|UwxqsE%9NPkmBm>dj0iK#jV$<jYi$F6m#Q2kK($M3;jg2)66BB&)k
zs1xqcfFxYaWp;F$(^+c3A~(VgR#RKm8LPLRKjBx@u^ZXg`EVPV&C-2EXS}xrZ_^5`
zY!NpRJY6QfKy;U7?!EDSl?TCti@f0!m4wG0D-)3`uvea619uh@v4K`QrOQBI(A^YQ
zQXf^g)SL{##q-I#_5%kym78IB@ii_2^*#45zPCSC$+nzXQw)70&oX2@^xNE5179aC
z5k}oHdsxE&x1n1OzoF*N?c!IYOwFOw2dvC3(4p(EA`i<SAeKwdektDs8cgP{X+7r7
zGkN(~aHl#O_^aguNU4(H&8HEuZxX_#UNm1<mF)J_N#rNxvvoO7beqqGlaR$n8@Y`q
z&Sn!9ca)DTHhGcfo9)%`ez86~KDt|iBFs6%zemk~c3#P&QdFGpo%hf8&imir(d~`x
zY;6ATEAM~m`7wY<zx+n}-)jC@c@xNz6623X6-c>%T7^}K@IVHCJa5i2?-kNCg-i(;
zqz}J$U3c-srs=?uCm={4g~;qcSNY8R!}RkIbSt$BLwv8iSn@g3U_ZYW&O$1Kb{`)+
zxcysd)>sGOnN@9Z>RAxvZ%}HE1UaM{+uUE0h0`~G$8$5{#EL4P_61Nv8(^Bre0Nr;
zCvzlO_S&LpEG}I+8(^=a7Y4<C;J(kFK3uk+yWW&sqU%(NyC=rQ9Acs$m8=!1MFpv?
z3XvF>YH9hE{{hiit-Q)*!FktcIQu603whShJSk8WNN~ADhk2aLr4L=MeknJ|*Dz5|
z@q{r}zOzF}Q#O`9h^0&sAt2&EX@oYZsn*y{Dyp~CtoLz`;?%FFi95qe1!QO9_K}7Z
zTrhMtaO`88WioYE%&9=13A@s-{J?lV0SSJaLXt49pigq8_6acvbdX$EVPGXPZl!Uq
zT&ovf-i8+JgHfIms#!Sm+xvu|D+cF|pjO5&SsZLNMzId=HGui`8>ApY_xYmj9Q}_T
zx_#BfC8klKE;XJ-xK<oFhau&&`?97yzf`)k5R*-av%LK^>+VFZ3rJZhW3D+sLC~hc
zKY@zVpL72$beJ9U<(*M4TB%u`Y!dm%0=q7`sDx`$d0E$dI$6hG=4iE&0dt2NZ4?ec
z6SBU&%U``~poivWAMxwT&sz%Yk^=aJI*Jnp3i3XPz${Y|!3|f$ePllfq8<>yIZC)k
zlTBoq>^3qwm4;yvI{{@jC{i<k=Q~7_y~(x2HEm>+Nm7VV%D{|&5XV3`DVi<;Uch_6
z9O~6&M6?);9gDF77r_!M%^&_|iRk|lKsp5~{wpk&(YRzfNAzOAk1bfIhVWia-~)jg
zCQHyF4uaYAM={v@Kn<$?hC66fO}zKScgz>jgZihxq!89;1ckY0EKCz|>nN@XUjo+j
zU1Tq@q!7iwcz%Gv9j^!!8cT={GeQ{i_ALo)dXS;cwBu-&4K57^u{=xm0Ev($d9yie
z*&`E=Gde|WIZmbI0N!pqQ56XO20hjlOx?oj(espqGvf%oe0*!z2z^;lDjji`fkO{v
zI^qmnigh6Geu>@ebNGmzx5<?5#{%(!i<X{D$uT#y7rc*KzoeIMs)0Q!>GklCJ0|Tr
zdS>y*zTmH`<d;QWxCiEqlb<k#zn2GYUK;zZ5wbjuh7gW8-=+edGfo$LV7hTUSAOZU
z!t$%@n|}}}74o4IhEI#?vbOzIT421;dcGIEL-1*v{zBA|1rJ#E2#`MnU$WW=cWjjl
zFlp3cn0M~P?-+vY8vMe=ZPB*Y-?`l2fANI{7tg2Z&}gKS)kXLrb`250Pmz!!9*1$w
z)`|5O?EnAXgt8@tQ+`jSwcoJ(fA1i2F?9U)5B-0%{Qp*AQ*>GrL-c{~Hlj#7UBN=r
zF}qXZXBFb!(IP_1G8vYSjD>e%np4c`A<FuEzQR|E3`=+-G7a8!ZhpUP-ll8E?zn;j
zzb2n})QqHY`v~CsR@lBnkArmV;4a>7q`&rNr{*)fE3eexGIjNI^fHB0*`(B0v60iN
zsXLckJzt<Seic(wS*dP%;|ZTUCTGH)kcC!Is~ia+y4j<X%Y@$hjMG*^YYNxL&y2J+
zEM-@vbC2WPtWN*&ba1#mx;)f&Q<#LVs227)h<g$x81kSvFH2MfX|!ezLUPia2eyU>
zw_mJC{E?qBDXcb5?@SA0nyy7h``s*7!xldgwYAjRzyqUd`iP&5J<0`v+}70Xv5qKJ
z3e%|4sygyrUkFE@moA20Q~D@})?%)vX-viN=ut_az%;^U>8JpiMH_GJV^jJu$8TsB
zWMT1LEv8^An^FTdg<b-J-^d|Om}L81Ehc<t^{uh(*Qh%5eOHT}%OurZeg7rt|5S?=
zlK7XRYyVR%#-)>+R5J6LT*ZBEYwefv=e8!8xgS_*bq!EvYZsvqgL1;`IUk}xeJ(|=
zswTB(LIZosccpcDN>toNimHnP+Z+;f_#L6X!8TIX10s3&kAp~pGt{3fl&#9eylEhy
zc+gEp>L-a)8QFufiV2&l;;#}4<LDL&6nX)X{DYw=tQ`+@@#PIOK3KbTSiLr21U>(6
zjja>x$q;?s2Nfh|3V6y3Sm<j74rMA31n}U$aJ;+n+b~@KlML~ON*<9d3^#I=dzyqJ
zR4kCiw3ee6&vgVOdt<GHBs&n*A&^Knwbh}olhxihweXe}88)<iItZi1Ys_m5j>|yD
zV3}4%KxTu`yj~D8{94oy*~tWB5I7k2wYA?5kJuoZFD5O86C(HN_neSvtk#ZSDpSn7
zzqdhZIL<cr_nYJ2DL)H|(Cb=!l?o-q^^PH{;KC5Kns_2cf_SPx3Xntr->1Bzv++lw
z?K;9oQAZR>oPbp7#f435Vdv}1)o_bEH>7S!`j*)oGN+L7gN_54!)z5WP0sV0?Z~2q
zGB~7A2Acz={a0}8cYgNS^OH+fTHBUK3V?MUti%sQ?Hy2RL#}e}7^8bc%8>xK?fPf!
zXE_{j*j|VGZ?|A_HNMWH5jFSUl?dT^=J$y2ye(&rG!KCW6cV~=v#SZ)&FKlMUtTxQ
zt<c|Q;K8wCRjD=t^Y^nmG`-jNY`YFcr+#K_W%(NKd{jkkRO}#ZS}z~z^{x)@WiNg8
zs+Q=2J3KMb)PGltX+oJ5HN{X&@w+*@GJsY?bZ*f!4k)$;zT!6ft4vgHYD`enuX=5H
z20?I!=kT6CTBEF+tYogcf2m)K%I|i7;&Q1|lo|oAG&)+qx)7=wTo=;Yz1vj(DjVsU
zxW5$A>vR*G^ww62X;`0`B)RyO!)lM?HkGHfz7Hj#bPtAwcW5Sl;C{T!{Y9?oqkE)P
zdcNB@aM`!?_3}<u9`-}S)ox~s_~Kww7*3gV@k~xCxoSCG1G+m40`lBv$b1^kawEIi
za?Z|s3yK@lDP`=F`2r$v>}xAj7F0?T%J&T60OM#g@f#6L*_efTD*G9P#e6g-FH2J{
zf{Lz@I%f6aB&UK%Z*QGh4GzwT9Q80rUeQ;+VDAWzKBL+$jvVbW7}^%khQBg)NNlhm
znSOTPl19U#l~#^p3>D8|w#fNo5ewh5vt~Ses;ee<iyemB%d>&~+jj34(Ug1R#m9ef
zZ$i?U>$`r>dc5ELX#dCihVlRH_5BY;0Pq#A4G#OQ2-t=jX}tgW4+CcvB^TV1VJsQ<
zPm+i-JzP-XulFlTEC*%O^$<Bf!|)EztJY(9fGj;k!st3#y)OD5G=2B{cOlwy)bNza
z){;GL|NZU5?9}X`aG~up9Bg%w`aIH$WWICU0ph5${)x^uU(a+;xVEZ<X6fG3Ii}Dt
z9oJ&6D`7mbau`_lanDRlDq_CFG%Y=|reJ-_%*dHR1)eUeYCQW+omm%emYjY^hX>Si
z*=oRT<46o(uNJdkh`>}8*JM_JEJMU_Kt-(qC_xym#qy~vSnE3dy&%4L=Ff!6ri!Ii
zD6nH-Q?iNPd6QJ(>S`HrDZW8*T;^ijOw#M}w<G|ORhlIgC4^20NK6g2#7+~`Jk1}o
zpS?&JQrJ2LEI*fE7GSfTq6$$2kY=d!HXiR&TtqVRR;rjG!`paEtpHJIFZ_sk8$*)#
zgOemxF3l&-*vE;WZ6eQUIKV2uAgD$WRn<lA|6^K&3#nJ79)0u!L8lEEJB&H2N#*Q7
zr4|ZZc;65#1QbVt?0+!!PT`@o&6;j(+qP}nwr$%^W^CKGZQGpjjP1;D=Ue|?tNUNO
zcXuDWN29JW#!*$hcU3**`B~msfmV=9?l5^dg5gsUO`U-<A&5l2WGM0CxF#V_Px(Yz
za9TO)0AJ6VU2h)W1*U1@K~TXPKOo4C#HCmd+Ay|)IOFDVYs#G4rldQW>;?IW!m25%
ztK#yhvS$9fh!mY5$kWC47mPy>TrjMA26R&vUof=x-T>%&Z`99T$D1|6D{#WwmCeIx
zQi4Z#TmAzXjeg&;DBWv%n)DIGS3wXw{W}Q7qW;13%RipSU<26>YBVmX?Z$KMV@24=
zuCv5>M6-;=u-4qs?a1D45EmRe;6HmE-8&q3vg*>MJO0`0XfyNyF}(QP{Zrz|f0f%4
zClq%Rq%atb&*Od2KnHYo@f^<{KM#0Amx4|aw8{lFn!%BSe$F+da`P}oWEq5drV}IP
z0a?@AfF^@5eWlOLzm&siL|uSACOF6l_dpScK@;4=+5{oiXy1oJt{Z@+$lx3f(!`)>
zl=TS_Y`Dc(YtnEa#vYp<V$c)kxfKs-gsD};FtILbvnGM_N&0cVA?!cSHyujDp~s{h
zKk;XRvrAnpKS<8SPVxZE&?S}j)n@+=^Z{3_3=mM)c|c5qIran1w}#@iB__c*>0c<I
z39dy(G;nUfjXit(<;VBd5P0mei3yu;r0p$V-DqiMX&=O3{`g+D%Jtx^Jyu2@zscKg
zTU)W|S2cX`T?~)DGp$tbS6y~ny<JKSzv=6rgij}wiwuDbKS@}r{E?2czrJ?*0{P^I
zr&AsuBrR#c!09is&w7Q<v$8iawKHk4DJMZJerrl1ht*1fNS3a4@p0@hcjl;wHmXZS
zrge1<Rc7iK96;oA{fP8!oKR_F?YlRwR1C9AmD38(hvmU{aU_eq<Gqd#roVnFI<T{R
zs-zbYxIcWn%C<?J-oi{&Lf2=XSKU4YEr8!?I;^+Esr;EWNbbPn+Qehp1hx;ISlz<g
zgTZZv*u;`Xus^`RCz1dKZPa>T007zu|ND#U|H+rB+bVB~A$(oyHwcsAaw|p${*lIA
zgn9>P8FeDXoRl%gAk4WVO`TndqFkErziA?egtjP!vCWY5X>046yKcJZdAQD+y}phs
z8^nW#r}lcl{~SQ?dLPZhol?zMDwX&C98j|_UUSdr)I?j}#=nI3Vu6J&S#l5!j83i4
zJImsJixu%IQlex|+2I+veX2Am%6<&`V2Dw*STJEKyk<e@-Mv^#m|4;=Q=uV6Ws;75
zmM9ZN69bJI>8jwxfPv$?^v~B;rI}dQvKd2r=-n+t?n%(h9B<B-K`Q_<B4O5xpCBZ!
zjx3p^T#Gtjn>GQyn$S2BEv=Q!55cIICapT@oF=j)S)+n&;?}YNF;^8lo%T6zG@y@&
zT@exuBaGV1U6l|)4UM+UIg5#Gphz_|6w*6gk=hMnjAY@czz9mXBZ<1Xn16nYD`XyC
zHWcMbO-}Yqs&~ZE3kJtoNiim`pi?2Kq56xO-4MrSgT)^S8NNWJ5;2Vx`<w>`)Q?6f
zOCZ5Yhxq#&L0VNnSh2b&Q5u&GbxV|y1&&!th$S9M{cozPGVSxGT>ivmzPxfpG-Xw>
zArU9pk|BgUHS6*N*+H)fJ=YYVyZ9Oz*&~e68p#p{c;Xf?B1vbwN<t8tNL&@{G8%`+
zdi0gr<Qmg~UQo^f*;ISfVrAZaH>$V8`Rkvqv4PMl$U(2;j+0r9=(E$tS%a}>$9mys
zmuUYq62BZz8h2i&Su<qu=nce6UT-Xp!M5>?Sh9x(X5NNV3%vPdSc`*fPQY%kT2Pq<
zjn?ULUNe64LF^nMBYaL|@^+T;F*yd)VPk<!mZqM5%o*}l@um)TXJ0{__w_q*<SkBQ
z<5^fnfVAO`bg(~pn@N&6usRH1<2hit!KXTNWyFE6mqiif2=RyOcf%C*RN_xzKU%R6
zwnhp3$i%<U57YxyY;G2f)*LRP^p6z=31hC9-$h<8OWxtL1D+RtBb(#Yddqx$jKgOe
z;6ZRXZZ|+?ZNCn3yNeCtFAg7>#9CfMLkk4j-tL2$>|<OMb=+WV;+R}}K4|W>FX4G}
zy3z~46t)=hvY~V-C$X11_DDZZh5R@+7e^|BmvklJEM4Zq-~q+?RTC#&dJ9u&Wk)7Q
zxnUQQ*JV?2^jLbY@{HhDxpOVX*HG9$9TR!dA?uZ<Rl>B&icYZ;czN77J~h*J^H9CY
zZ87@}E?Q~%XV3al8CjHf!5vtyW*q8giKB$0BJK~~(R29D&LfZZkEJg^8*9mPrk)c0
zRz*7|`zX%+V*762FiU$kL;i&34Ux#GK9b6mXPKM5kH7Nwc4mPOWNpixq(~L1MofGo
zCfRN1`&mie6REuwP-s?x2j!gC_C+26rMd0sU-R%v4^k{0mp@c44x#$6@NX0emKlrf
za}9^r>BIWF!DzP}kPYAV=oxAmp@d=A7)?uqGz|KrXqGm~iSI|QD)1Kf7?Q7&HdFRi
zl71SN^w&kGd?{*lYnVG3)7GK7L4N1`))n<~EiuwFeM74<+_LIxs6>m$VMz=YyYEft
z#wYqZu%k@?-1qCx7n93I@@K3In#$;xp>OQkCpJ_u!-S)15L|2P{wrnOvM_@BF2WWD
zoKgwIL$bY-hfDM)v@Nnh(ve++v&@*)y1n5RqJG>&X3OM^Pdf?*ap+fXuG6y+U!{wc
zN-*$(FAfE=mcc}q9g+9Yc{Nlu=TI$|@l?%5PgI+ZcRx+Jwlp7Z>-~+bEm-xMNf_^i
zPKoK_cB10hbJ*_ira#(hS8H=<=eN*uuz#r6t<dtzH`LQ-l)^4=#j!Y6vsHVjl}Z+z
zFX8XQpw|7JFI}tO@ASi7I-@5BJ=GpJxhOZB8gmqwU@9oJg-)SujI=6Y<}X^iMnn%$
z&uWLb{?0?((Wkr8AKgQzY;`+K9kt1O%xzTSCOfAd*}^&gjd#CC!}rEIdSz#%GYIdp
z0y=s6r_=3YINwZ;v0y9sSn=`s7xhr9Fl}aDc04-VjZk9zTKI~+l@A)U6x)sf`eX~{
zi-v~In-({ORAQMh{V@GT7Swxn_Var$_yWBp?!e@uMBT?EZ+>x*v3@^#;rf3YQ1sf#
zpL*$^ymn@+&v<dqW!iq)df<MiUTdU(`8$ub)b*1$;a&C&%EPyu62#SYb;aGB&FcSq
z$kKBgmo)idA4sqO00jT5{vv%7OJ^4+OCwj8|BI^JmfcU>@?BGhLCTMZ(Q?Yh>M2f}
z|1-InN`|U;`6`(|p3=fNq3W4njq>?2OGBxh@TVPA2{25(i`#rQ8*}FJw45EQCy!yt
zjIVa@l-d{J$JPH$uNcpSS{3$S=JD(_uUHYLv`=Gwl$V#22iqHMQ4!4+q)0R^U~+v2
z*ae`rGbI$EjN0<W51hnesuZ9l2#-=31>=YX^<_5^WWaEnE+j%FU6uxHp>X!yQWDi2
zm4s#EcAH5`N@_DNGk2iBAhpmAz8ojQ0uydmuvSFtps=D4#g%?c4^KqPH!cTIe^OFY
zs1WtVPcu5)M6akmSDI!0XScdaP_23;C31oLabx%txCRA@c{7Ph#dlRHS+Y)v6CrX<
zJRk%-HH^q=i-e(SWs8iXBK@J3vR*lj@=p#<0>x^HDnuMZa*oe!Wgo_U+01}jBT@o%
zU%ClW9eBuj9w4rJ3{kAmA``LzmPd$TXwyZzh%0x>IAN3#<y5qA#)s(APC6O(Q<P)-
zkD?rzf^>3aae>NMR&)#lCKSB%xG@a@ruj<JIhS@wCvHDkW1Fx;=yIt`Nw~9Mwo54C
zc9||Mudie|9i(UqYNvNV$MHV^1T~y!1X%C~fH<i_TZj%I4P&KQcenNj&qX<QC0C|M
zl&8+iDJ7(+h>B{<tG0~rX5Rt;+2iPC@d4||``$!uO@}>X(FLiS1%TJ}yV!no0X{pP
zFZG@P_hoZsZ-9h6_nw7igMvA%IT2-bp@U_M6Sn^pfBOCq7KY^p@@<SdO~G_C?&~n^
zX70s$&f?<jSkxKgb^dXTrjt$2^c$}kXY@@M`&x#^Kyc3jPc^=mHdD442mA!;GO~jh
z7<S2~!wMnzPCW_Z6L-tS@8=ZuJMI|Lg2yPD@ihw-gI@M6s8_%&KE^<h$r!O5;A4XM
z@#8Q-V(S6E;kQV5LAH9C=rjb$U(i2kxZ0m4>B5T`!tmMP_+N_SdxH-)vRMW|$NG*@
zpf~+@6zPm2fXwrX7FOR7!AARxwR1%Q)*BpR*Y67~e{#7Ak|W$>1_`v0Yiwy7PR`pE
zvF7>+b&y2N`vWc@hkWx$RvI&Mm;k9PLbuo@b>`sP3PIC!IX;3q(2A7f0%|?`!P0*c
zak@^Oga>P6UU4ozDMTmhG;LI?(`X?4U`u^RqFr4w44TjYche%)W-?tUww12}#FT5K
zzViivq<twg>3U-u<j*I3$}fNYGeqWY)r$dU;2U<;h!rG1b=M?SccizxMQ*Kc=p}(#
z<J&`dM?7?<jwt6-^^&hn<Bt^amt#Q(mUBxpG*>?x*0|5=tG4wwslVhc#^HvjX^yE8
zFx)b&XeQ=t>xPqd%`Q~yL*j%EO*wP&#yb%wsCF-Na<gD#yZ+v8AKUQe=Isr28dDck
zqqE#|^{PgyGDQyRqd?e(N+}LLJ}{z5a}6g(@+Gp0s>`y*Hui0zTjItPE1!5mh4oEC
za6oo!o{CTYVo_H4pdO3H@P#@^gK#46vzm(^6%H0E;CM0`+u%l%_-21x;p3h=0~M>V
zMlKtN1h>(_1vdNPMxXK=&>E|)3X2=;m|4ZM$j5QUShqPyu8UaTd<QyB-6W!p{Jh*+
zZ1V)?Kn0eyK_1muA3RGFyJA3oDQ`}`6sq2|=<G2&12$oPWoJ{Q@2^{eLuSdAE^So5
zV8z`rzK3E%D3NFe^Y`c7r{K`}pFKTZ7@!_jm3d2iuUyom$UNO3`_8?+x>W3!Q~MWz
z=lO36Qw5mEDlBj87uCMy@{=x~$m2&Hl~6-GfP&G_zaw#CbYDDu;l;SIisal8lA`zg
z_X~$SYN*Z24?SuBA=m$F?=5U^XJ%<GVruq(!LN7ivm_AwUi2BIimj0x<uWVjuPW4G
zti9_nbkGuyDT(S^+Xif6@ni3Icc+0Oq>Z<EA89o8+}wKq9&Z_ro|qRsJj^+pb<qr?
zW`7pK8zKG<jLVtmt}tK^YdefebB^`%pjz=#9-25BIU1pSm8|&}KT$r_smt4AHyF`E
zRZ6YY_{I@F?ItXPdV~^DGNEedf573mBPJU@Yd1zi&!8#TktjFqU@gPdT{cZz-D}+S
zeLpxj*nXdSxh+43#n6xX7$?SyVw`@IOC3=|V@+<9LlKiPm4s&CR0*i^DxxZXtn`zS
z+V}-$T3Xqu;vPmpAZ|e=IYzymT*1QaUMVq2u3<@H-a_JH>F279JgH`GRiacB4+;Sf
zpB`RmoiQL>;Z8Lq+9PQt>{;@l^N#?Q)pD^aL=H@1HNVU9PAvEjK*9Y7ptQ=aklO?#
zaW4bPZqNJx6zd;=BKr?OS^ohjz;YOjGsrC|rgaNPb0Q3TxfHyJGOX6||L9-!2oNil
zE``-{o!MXF&<htegxCgw7AJOlDQ^EpE4U_~H-EN+=~Wp`iA9-ELn2rH0Vt+F00o|M
z<p-cN4m!v?m~$A;5V*rOj?WWR@Wc<Ots!YC)`K*RuE53B%-<R_UZ*KN5h(u)Uz4gT
zF03l6UOC1c>jXfQF0|k>^*=Ge)V5FQr2lro#MuCX6*qXN^Ro}|)edXM59vpjj$=*>
znCEZ)3}-e3e8Hu6>)>xPKoZ{rNA&O+AQp)Mf;Mj4ah`(>qTHv^IGuJJ%XNqoXD2&P
z7UvVqHj=<jb;EEZf4)RWb!>+L`Dv(d+V^17XGn7rhQmN#M|~hhaNc_8v_S|u;10wO
z#n}KY2!Is!dmc8n1({wrB6KFI0zJp0pj82@@I(tIb>^U5XAi4b-;WXfX%byu!+<Y9
z)bTc)OD9N9@?QWkbw7xw4Yy+eMU)pAF5)m^fCgHdC&L&Rq`qdjL+lPn%n+hU4-F*R
z8WzVufu3p49S*|Y;4s4ryJI>C^p~P|*ux4HY-RK65<BQ;_bg%&^bl?*3GV=eu04Ty
z5l&nlH*=qaP??W-mQQRK#JDnr=F9T*8TI*<z)FyBO}9?D^V3YxbY1(O1V#5B$L)=3
zm4W>ug0<CiAkxb%!=M2b<Zf!r;&Qx=`ndAdl8|zS<e&K;jvE!*0oewbysMA-<5MRC
zk@-h*?JO|xC9U?)5LoYN=R}n^DEV%a_fIp0dVw2c$i$0D77A65e5->}%CY0#N0hkx
z_piN69~Le(YMd16<ap19_7U!!`;4j51GiqC*w}@Tq1S+?jla)qzWovMyXI;5&-D=%
zs0L_t9MQ9Lojat;Oa57fq5aP}Cs#1L1{b5^mkBMaoUFai0I^Uu$yYc&#ii=D0xRq3
zO$V~PVRV9#?aev#9)F9BgTL<E$87xl_uMYFq6+NWUbqCTaSCM)G{;k4m0${<VZd+o
z<X{BPW`@+w1J-Zw0xqV7tH<H=ryf1u0krJ#2MzTR*UiHm=C;81yu9Jr133SDU50U6
z6#k8b%Pi$ng`3@2$%4Xj_1sOv5~Wz|9^mH_zsg(H<|<h|oLO*w?C^aeGWY+0&-@s9
zLrxs0{=4+$@la7DZj%|wq4J~fAZ-1`u}S<r*~R(>{_pAVw*yY=;ZHg|gY^GLa7;|i
zEbUDH4{Cx}>bv%vKfd&&4uf?OQVHCmvR6k%H>M}PhnekZlkg8Hrw8O#P)?Jqm*VpG
zr`f98Vd_VI=kt+Dak%c>H2dzf&kkwNkXqf#b#eyVgCpoK{?mVO^!QlxkyqA`EV`cS
z`-`8Nmv2@@l`7!X;g@3{u$@XdOT;R|_z0Ec+Sv;22N+F<QbclwRIQtHxJyq-KF%U(
zI7Ni2Nx-4Tyc;l?NSQVxbdrXdLNy5r)0TxjwQMAf7K%X=@!I9fd)+QhU!Z)YMqn%}
zMJ&-^?dc%J55Z|nkOa)2AqvGrXDR|c#d7LbZBXL;bJqBZV%jKoHT4g|q5CHruAd?8
zI5}g}miYXmM5^cpJ%uuXNgBbjw0qV{kSvQ;RibqYhxyZV9}`+$7|*C<{sVCw6{`z{
zl=Vt4T;CwM!J<&SmE0hLSrTdd>dJf0{f6Y&OAA{hj3KjZ_0X#Wi=;1sGb<+$B@)rB
z2xA&wS%VP8m~D~#haj2hRueYItFIUC=n!SrEu>^Yq+@>i)W{tu!OOK#%A#mvxGKq4
zhYX7?rVWq_0#ur3Z@OyBM9XJ@&L{QU2U4VdB}yaNk~l6x33tB8yIxo}5$GaGWgewp
zqtUUFFT*&=3z9KnkxT$%+AInQZJ;C*Sm|u%Zy~|zM>SBEd}z^0NMn>qm|#{=P(CG}
zz+Mkfq7!r*GO+sow5h%BV76tz25YJgKr83(gQnNU_%j=vAm`<J^WEMJ?@yBvM8C+g
z@5x~F>rO%1UdO^<gaEed0l?uu04M^_^=DVd+JpqMlVmeK)F}HH!L<(sXUuZ_36#eC
zmA)7faR&Yy3U}$3<f%N*KtTJJjz;Xn*mUV;Jn%87+vsnA;fga3RaOYWzqE6(KCzcP
z`uzcf{LXvzOu(xa&Uu=Fia@H^RM6bP%Q(QpA(}r;YT1UArTol4vVx%A_=U(=18if*
z;gCX>{7c9-U8rw1GA=!Y;SK~qcp-qn2`3wwYy%L-d5%#L$PPSIW)KAiU}R7-IrxV4
zniiu^1SmRfF~&!|_;Ntk9k@cAPo?WWRNAPyM*Fg()6OR5WDX(?tB~BF|1o*rIZvx{
z%S<f?ab1ww!b{1Sm)}AKnhu-OXILjHVTCxK61_T@`A1k#WhOFFUUnMi{LNBiyheu&
z#p*Ny2tUX&&yh%<6B$NI@K%bg^Vg~+YmnAYMUZK&Y#9H|DnDyqhLpOVn1^hW-GA)$
zlWt92=7p-~jK^vJGvoN)3)H`4#4X2PW&R7nzxWBSKxkWJPaMBcHo1Ic%mVm|XKBkm
z$p3al_nUy@vPBErDnk7T>DbxlPl%CS6CtIkA6H%*+<cJx-H;fJEZPOF9v1y1w0|u5
zhLWzUI{kd>O8II(qi9dV1_6%mz@vgoET`q!4$hTNKi&3ac{o9P&*+2GTE!PnaNyxg
z6b0qvd;d@{JyqSWI)-}WVWrn;7cJU=ObcDEUbP1UHp6<IGDSf+Q_Ym^``Z=sldix+
zNPCbayHgLd+vvl)o)es1&Bq<sd|<M4Z@Q(vCOpQtjwov<F0a9hpuc#J_>G6$)?gpe
zEpsuN;G0deTSd>F=4*2};eRvE@?kfpPMO9=fc1WlG(ZDoVWFRTE_l9|MD7H)AI?L*
z4reHSae?5%CrkhfAGqjSu2~Lsh|kslcc@8I03Wo<I$!f}o^ovK)gJk0G+%{!Bweze
zFFvhR`;S(KvO3N_RYUVgS|q;?!TJjh=tj*NehLY@Ev{2+`h@u;*wwDx<8ydQk+-Y~
z!|rNRy?6NSHaPsEVz5}w%Tu4;UTB)t;&A^Q+je_gnrRN|+<>%I=}?r1mU<r|Ox~q`
zYO8#<qR%i?!~Jb7&rRN3hrATrqoPiXbB;A>(4&UB)1%tc-Dc)pk=&1c8so8IsbI(M
z5Qp`*IZn-k&btRX@wsS{PQG4ibES6Ctvjvt5WnE++~yrG;>H)}Yw`74?GXI6uTHD=
z{Kg;f-{S_!qNArHH~>KYPu#%&cZ?!rW9Y2zWa!{v>ZEUM@8J1=>?2XPb>5Uf`kJjf
zb*^mfFBzfNeh)?1og~=mG#Hi|46Cdu99>+Op<$^eaqyY=dhzxOiLTF)cG?&+#h8(C
z=l^t(e>pYib9A`f3N?Pg#V6kU&f=RNIq$t~FwUrU(rP;^_if)^Tbde^*`9&6!o$bI
zZ?&L+Dp5{QpeXXJMD~4=;7>@}sZg1eDRHN_1>w?cP>_2|1xgr|(qO@OEa!yDA+Ts+
zA0M@(VWv7xgvy|uzRs14k`V!Y%E|lnyuZIs--q`t1z(w-l+dCPOFDX$FMHxe+vGyH
z6vU(n0UDJs?IAGwE1QApn5s-?7Y&{$DaBHMl!~6o)i?l&VUa4Wn|G~>CeiFztc1wB
zSR2+s4N}PbSiKHvwQ;_oQ#HYGoT$8v6h~2%&{)gNtHuZ>vV#KVk9H2p8(_3z@qpw6
zLP#{3rVHDA?B?7&rV(2`5w5gW_5Gw_k;d-;a2i{pF)1b8atW=H2gu}x*v<_Wzc5I&
zB9ZdYX{y**eW1VrEJ{>_cC0#p>+gUPnEV2Y)rCl5+RAWT0t~DuOj-~mi3pP2M!Uih
ztqVAn+|R|*0u{03wqhef%%lm1{_R<;^S^`#-6phLQ-;?Gb}(drVCt<CEu%pv&HzE6
zbtR}I1)+$>R<O408tSv6pHwE(m=1J;vJXh6IHDGrehL6#yxk7KP~A<po6op|9)G;m
z?RL+W&Rh-$a&Zj|<1P*Hzm=WHi1SW(^L|e)^t--QL)`cB!swFMkK;ar9rkkbw4J)(
zEY3q)?&)<BHizYcX33FiA`{<4Kk0D!-2gE^S8zKFRWx`VhY7cOfF-fT*zmh}9|m46
zSzN|-_Y;opxCig_yV2+Hy@SEjOV6e-!%()@g9pd3D-1k)?=U>-=0AJ{$l>la$%D&T
z0`fiU?w*CJRaiXq+XZ3@U~8a6XXj1<n;-O}ZsloJV_5;8yfCsECcHhD_+Eolm;6PQ
z6Y#db<W7TG<1RAr!3weCfWzf_>Fy1ju>u<FbMltEO$Ec_b{0GAZ!n-}j`1xA)YKS#
zb-`&5V?)n<|MEcT+^HYYqU*Ls0B&Y0eh)LUxA*{K&E+@kkqM6o5M4uuJN7MIo;R~k
zhwL|?uf8#H;^nXQlomem*~{e~${ni0qwaJAE(=ZX=y&gpK*jEBHT1OkI6(l^=Bzd?
zHzks~#@zU%P8+aiYr-lP+Ou06by)9O56Pc=-c@H}S3SrpWpyxbS31jn12Qe__+lQt
zvG1^CyyEV$^DWr_ls<9dEPLtHApP4@c>L=%cWjpctGtCk-v<FYq4HFZraZ&^_%7pi
z_jhL%^uU*3(Vf_Kq3X`!SwCE@uQ!X+hvpo%tT}qoLiHV(w8f~tMyLZ8X_bbXJaU4*
zxlu$W(;*P=VdhdUeH!@|@6FR^&+Kkd)g(#YjA_t}XGfVK)PYj|{2I$b8CXBwJU)8{
z(4eKVCcf5VESXuqv{^<SDv2nIcm>TopTa8ntI!!um368hYa2+&ljT_RC&{;X0}5t)
zo}S*q!kjN%^Vlopz8jai6kjr_3d#9yVdax{$3)u{Vu$F)#<3A?3>p)KvmJ7V#Es-1
zm|><I>4ITqqfj%$V!L?|#fBRt$E1Anb8=WNc3rT<D=|X!DG=SND8954n7Kly@S~(r
zt*Z6`#zHbK_++CYd6tH9pUnHE=9SlFg2@g-G3M}tW8s-eX7o31+?2UhhX&}oBsp{1
zMAWxiJzAd}IPJ4}y+hH18$tn2c6%glpOzOb`@WUyNB;)yPrNQqL~LiAY`eSm<kF0x
z>(R^Tlj<}zx3*HQ984>7?E><>Isu;%<lxOy0kEE9wG`EH_;hA&S{{)>9Uf>jbjp3M
zdYyr%%UK;ay_IF3cry0C#{(N`#~B^W>4LPR+I3A~No(2lhuO0nwKuOcY-RGyyGbNI
z5T#qdP2MVc?B6EgwD=1rbIr`oAGjSs&NBe7KG+ah);WSkkGOXk>_x`FU{dXPGo~(a
z4z#HNZbe9{Jog*Xjwdn?_iB+@S5Rs4)6IlMb`_kKQ*rIdsIuK?pNF`UOV4)?C$Q~h
zyy9Knv0AimCeP{7D?XI6H@CEkIWAwTG-uhJ+v+}L$49DF!k@HUwZtWd?dVxULEH{3
zbqT|fr5?wExRi5CW9ARyHJ$0ANilnWpo3WHrGJWzed*?JhG1{$JsBSu6D1wZ?5;au
zQ_D7(4Skgc0U##VRH9L+?(I~EHP;iea^xxZ8GA(WhYo+A($mx(i;hLxv5y!}W;N+a
zwnyavJ=8kv%oW{*N9{7zT=y<gjK8^CuaVEETg7;VTP%lB+nqI|mAgsDJqYj=DcPP>
zO)@;PNzKkPu#7oUt-AwOs0@$pOLR^z8K*(0#M&}()D1ZbkW=$ID0ga=61qPX`N+R>
z<eNTR>GXG>jd|pHM-TsiduCtWuIJ+#S#l|_Adm)o*4~s!`g$4-OY^^~t<>1JxIN~o
ztQc4IS8fbqen9)juzPrmdJaK)eS-bP{~wY3pE*Z9qwjXWpJE7F1^@ub|2~rIJ3E*f
z|5rE%e1<go=lr+9>nq)Vg>#>eNIH96C?&3~iB&(s5M4|YZF87v5}T$r^<<#n1uzmh
zq}ZIAkCzKf$muT9Ihb}EQ}zZuv$r$PQhhNcd8bD{cbCVlj#4#N;JCe>e0_?j$gNxH
ztAu@$fG*)z2ak{S+JhK;pA$C(p|8Wcu|uHctNA+}ZwRzAI34@bZN7f)`QO@Oq{HsN
zw^U)4u;nbu0J{0oTeqBTK&@J!{#>M*WrhxEG^K74^MwEd5#EVcyN);u?_P%~tbD1e
z$Hm3@e;pmt-_AgS_rFm!<6kXsvB2+7cM<n;6WKxVLE3^Nb`6(-_m3g~;DrK{2lQY3
z+O^4(DS%yc4w`rGWe^2)4UrW12@+Yax`VYojyhZZ0lmK_DHD)#=lr~q;-xS>dCP8G
zFomJ=JunUhvKdHtG2VA_mWF~I41UQR^|Ir5?Zz{ndW}mCBe)qQN@zr@zB{xR;}Vmp
zRb4zmM3W7;^vl$Lf_nCA-%TqL)}nLi7K#Mp7cx*8<E>uNo`r;O7hFY$^B<iaRuVyQ
zh)=2@;#k=SO-jy_W(tTY&Rxizs%$M`at}`2-j>1>W5bR&{2Cy>uxTw{{tGB0{`^3=
z95K|nNLI^Bq(W|HSblw|D#puurqore#KSMp4*ojmB9tY#%}ZbhZ;xPwS3WQf4JlHb
z4_O$)?Y>?e$Bq``xRV^jc&4O1=m*Ejl&6(|y`hXSeP)+)L6#n)e4)k4(tlXG(7sru
zg(|ms2LY#oY>yM5Rd;a1X2C8StY?prug_-Psa6tH-&e3otILc!f03e9Rk=2Y!eObY
zV6UODMDGe+q6G`e*kU=?VK>iF;zY+<<P@vEjNDVIZ5!rQsqGr+5gAX#qB^ulU6W}g
z&}7PjT?(f1Qfa4VRq0oudbX|rJ`8##Ri$l^Th*e)gM}h^M;+5?dRneK#IP?S{JETz
ziAK1GQPo+XN<)f-k~eQi$Xu=^3)obl>f)8ZZNY)EVnMCK63N=KtGy0kFQnR|GRKl6
zHNigsxu|D}xk;+p<_KkWG2HA@WoqfLYN3*`sS;g*sqQ7p%r96Y2<{9;tE`MLu7t@K
zDcE?+hL_hYle18II1XF1()=jaBT$mfUYmfitTwWvD&|-;I~udh63vz(4Qa@n-~ZGR
zwgxLjStJ{i!I&@*$-0}ExW!Q2u^^<&U3F%z)l<081xt0R#ohumn-Tk#GvX{dP^T(l
z*KoH)DYRWU#0jms9v$QdW%VRgHaQkkfx!Z*95)l@sKFUmW?*&ICoj=oI9x}=IzR1j
z)DB#}i9vSn{(Z4Ow+obN1ZUsVHTa|KW=~IW2&m(+Z-U|DO7PPRO3f=bzv6Oj!*JPm
znQ+CmUH1%eA2=tM#sw|6y#zY&UZitPUKUr;2v5$s(#^JPrp(NhBG$BBAhykE&&J)6
zcgtt?$5vJ$dJ9*MAuyS)yH3An4=9No6ATx|&iCZmK|#-Qp~54b8T{}rQ=2NRJn(2s
z4nu_2iN+|_b{d3Sn7jS?iZP7-)%&`W4-5Vdh*cEp=Ca^{7wQC~h*4v(EpQ1}fF&7V
z4kBv74FwlpJINd7T#$~00#4W;GD#Gnf95C!Xu&WGkIO~Vpi6(BnU@~z%#jnFcmZaG
zuwbd6ko!63N?`<m_^%0w=<9)}2b}w}gHXLczB6<nexB2-zt@#8PBTS{q8d|5!(8_$
zt$V9dV8N%r$4PnNA2Yjw`PAgU-Et#HsL@E1BSgx!nxl(2K6>oTQ%q*b^D9(`1o=}z
zbiY02;vfTfuvlwZ>JPcw6$!YkmzvxH6Yhb(r41XYU3eQ^RcAS`<GFTWdV@88!*WNN
zWzjRJ0?y}Du<NtX(P15jnk~0vZY-R$<hfFvXdM+IlT&}fr<DG*K3}3?tJC+j)~!^#
zQqf`oLNO<15Pg0O{JxD8tu(5DS;y-{-t^lTaBu}DeKiMw`Yie=^Ue=}H$Hg0XIBpu
zmXhmb=vmCw6*MxIonVNlO&46EyztiL+ypZz9crB@kWvQ4lYNy;Aw8959UWfE%RM@#
zKR$+A=+8(Y$5M*@eMqz!8axTetZX*LYc~CN-PfV`rhw12G?)D^6UoiKUPhnq?f_50
zv>hMKZ=Zbj4UY6jgQ&-^`KBS*!7}zXsPA4;4}|Aak^<qRcco%0PvF(JQtgB;$%G9C
zHo!XjPP|v~Yy1Uz3B>u;8jMPt2?5(6TI@<K(#BYx<z=?oM}|Z(@OGE(WxAPCtpaKu
z>A1}*^-8^9ppOn5+7|CcR!T3-o0*Yoq+GG72&216!d)ro(h{CRIc(JlTt4YkvwOT1
z3Tg^#!y~pUXGyW#Z-g2Zsii1d^fl*a+Ow3vC!KjC$i5!n4|piqb!wed#v<j0NA?(q
z={QrwXP6a6c)!i+Yz(}-A~kPG+P5U$<J~<aGKbzIxE`RUB6;Ri_F57&G$b3`fz5B+
zDsI)HGjCsTb>Oy<0}mt^7$<4vZ!5poIhK1WMCor{3ZF>PkpiPq(%PG5LQK$hj!w>E
z!%f(Sv8L5@i2EkA5{+-UHMqe=8IcUWJ<S~Hr&5J<OPH)QDpH-Dy-qTI;J~qZU{{{^
z?tozRsW_?XD;Hxe8Q(XiQt{*EJo{y{n9VKhl}h$?ia8L!utT5^D13*%Q70GLZI&0$
zN*B*Q7aUVPLlnNw>rKMgOZ45sIH0Z>-1c*ie;Z5}dmMRA9IZD~=?2$Ev>!}|w<z+i
zX@AoV_I+4ThtTa0s6j;4@vbr@HY#+rDPUjHE`QxI30*xd-V=}P1l=e@T`}PB(_={+
zsd)ILiac7!txLO@Hh9}NyuTY?K0~?@eXWxlvNY4)s80U1EY1skOS#78YDMRYoP$hB
z%RoLz<E1Afr8#@JM?ZCfNXbPUzWq=`5*k)Zg?~<k?>xH~wArp$8mP`2w~4<jc~LQ%
z@w+86jCm9`y=ZZ!hcNy&(T|26bb!&4X@Mq4+K9I(CVe_`Y(tZP^0ZF)Q{P6TisyTg
zP<-2lcWw#fJh77(>8gvDt#Ww>P{Q0>Eb+T`3X~+22e38^C34sGZ+!7B`LHW{UmWs9
zCl5!(`XQi{xsPN*yKWlv&kKQc*eOx^F762>_vOPc?EGwrR$V<Elp4l>lV@KOi5$D=
z(Bo0=LE7z<DE!urgcApMn{;2s78Z=2)(%oS)M-0(bT}ob!-^*7$)muFf|fKrJwE&*
zpmI=w%4p%`bu!Tm%||R7@0t#p+g@8)?`zq$a!ZSS3_I`P)FdC_o*1>zqFCNgqf#X2
zN>9jU7vn>6p>G0|vhqn;b6*_-v9kHO%azz32KM{iyoFiLLZPBdfTDF%I<H9m%t!1r
z8@99~w(T2#U#*1NIsXjRY)^&ugj}DMRC~}-=T1eQAejcR>+!vuI}PAhbr=ZWiMlJ9
zI_pKy7&P1(`EHL`r9JzkZKLe<gij}??3t2!Xli+K)pXAgb*rbTQc*TaRr(N-CXsy7
z)L%c$t=bDEH@l?BQs$@fK}n8ieNmA>(F~YNRwyKL$UIsqp=cz=B{?;aG^AewA5m>4
zu}UO<WFS+aMrCW9*)VcqwDCI&NggN!@RNfdzL@LLNYX&vo!H*Mfxa`7t5BhFHY{!!
zIWgGzABQ9k7XbLn!HwR`b!#MQpd8F??W{vQo6D7}&^Q^DG>!Z*`295vNg5#x_?3+l
zy_@Ix^U+ruf4$Er5_A7|ld4KLE%h`Zd@=P3u@GH8v#Ahm@iv0)kXd?US-gx0;Q)f}
zVnqR}Y#y$pu^?1|j<{XzG4d}+9WouO3zRP$x__*UbaX#}J5)G4T_T-a_vMfOvDp8A
zEyDlHqN(#gE#R;IvFOnK*E=5n%fh((9}B1UH<!5`=9j-C-{pfz*q;afHHQ4$pGLPf
zRe3faHdVXY)#s7h)ITegww&mIh3yNiYLCLOBRd$9m#k{#Za}Y}w&X$P*xpUEK6hju
zXWia=!uD{x`?vkxA$OLfH{AMcy7XJO={4cTpWl0GZEkt*W}`O_@@9O>vV5{eM{~W`
zKVO)bWLrP!x4zO!GC(ZJw!UAe8fDmBQw@>7vq_qMJN|kHGVd_GG9MtXwR$;)oQ1er
z6Z4yUGV5%tQCYt;FYPg)_jgJR?%^5Kb?U|QX3wr0+krjV>dl|Tds&^U@E(wx_?tAM
z)dfZOdmX3P+1MGw3(97HAQbz@6dIn6vOW|X-R^SRfsU`;#`l|wv)#eiIes=~#_;ri
zJmP6D?nlGZX>V{J>UiC2d`ijsvo{zsBgn<h_N$=mzaHK0B?4)CIP8!9{D4u=lyjt9
zQJ#ZK^DAqB)oe50KUvKGtY-z=Cacm#0K@k1GwU&e{r>@_f+nUmuFm=%Hm?6oCmZV%
z(&(S_-)>eT8rI5N<4B*^`U@jy$uO}qMQ;2U<F)mmr(&($i7<q&RVs}vqgpgEb$Dbu
zDqrtza}up44uietN+jdVyk%YTZJpk~Ic;3H`hHtk={Ma%!hILu4->WH@>}&EdqPdI
zWjDvMJMs2vknSJS03SWRKDI*&(?fe+&I}lS(HuK}wFd#uAB-`W(Lf%KrE%Ht&7CPg
z`9QUzgBPp;4V?xuxv*^6wL(vgI`$)to53)piU@U%9n#!=z`SjC6?pmh_&gt;#ogkV
zF(a63yTr;xZ@FRHy(W@64j;fErFs%tJ!%TU6Zl8~<~3@j3r&`7G^N!mwTuKY%p^Jx
z!GJa+-X|w`Og;>o8<`@F>NN)asAy>|Lga?`@ytPx9td*4`VJ^SBjBN(N~D|81c(l%
z83w>_OizVODD&k#n47@(#AZu`-Np+TX|^$375A9t5R@`Zod5<?$V>kMt!Ed+bEpc(
z2^{8u_FYY!okNUfsI)pXm?B#~o$FyRlAKsLlNMGm3{74{aA6%^X!jpL!xRuy?ElOb
zx=KO3Fks-YBSY{^7bswtXRnU3K(ty3Tx@D$gVCgjO_aD4jkZC;3_G?{1ATfNDC;Ic
z$t^Co14TAOK8D$x4IBZqV~~PxCOE(ZmV_!LIQD24X`r-QPHM=MIt%)nEbT#8Od?GY
zWt1UrsnxLEv0__4V|}96!qR_|V7hbWTLZ5S9}4bW8H4Se5BL6h1K1o#9JMM7{Wvf_
z-@*sD?<tMT)oIoyfd3rrsE@zXyk~XUKkw2%58fGE9=jowqvhG?1T$?th-smAgQmVr
zy*-};Uht&l9#(vZrCQ0LL@Rz11G^Hmu#T0{3TEQ1-{u`w3E#~3H;gS`Z~nTu0QkAa
z3L}&qLh#M|c)r1<dA8Z6eQ}=eX>z_8?6ILvTWiizGXDU$BXm07QVjYsVRh+D@V&f%
zy7FnB$RebrMSqMUBx_zB{5-}CIr1J?F8+CEeG$y0))V&mb<)kn{L;d~IMdgVZD2jq
zwd{rE9S0^UyCbZjrbXdrL-Qv@u*p6fpMH$3?tE#{Nh&KIXD6o((qxTi+;DyiRqi!(
z<V?XWb_HV%_#ml}2#A)0f7O1cXfo91au6mq<|U`9B+*)Pc4QmFvK`E)81^&ECM)Er
zURw*<sEqi#U8F|By*DarT<A9nQL`+c8dEbV5!4%N`6qWyG<^spnDW4CR5K#Zvt1NI
z^2V3-tdb(BA6iWy*N`s8T>gz=hC=E$^z99Og$3i4c(2X1g~#_krS|k5@Z7!U8%of<
z_N~aAJ%`mVX?U6&cKZ8+`JWvp3X38>zqvl(+pe8{DsL=U{2|IVDasDII!vRj?}*>b
zG2AmfxG_3ycffW=+&dj{01f<e4X!%Hnh5vLm%hH1cyi~~8j9vEDZHHY?Mlj<xmT*s
zg`yhz6d`GPL5Wc#)Y=Ir<UGDl%O<m*W$NxqeEN;J0m{>`xtHt3OkR!Fb0><;Q<JJ;
zx)$CK!2Vtb6<ddr4WfXBuPB$hmE+yPp)<JY!nnJ2lbXMdzF^?F!@2hy+Z!;wB{*zZ
zM7A_N*5#rgucV6-8Y~#c@Z1A+8D;mCzv)coZm<n`#xz(`d0+rYBXHCcvcPZ8YC~t3
zgN0#Ck^J12Zr#<YhduuodEYM;H^xspj6!<wWiWHdWaP17>-S!u8-N#w>3XbOsr}~C
z?^2PX?eU!bZPQ|KztRcfg|@A(wS8qLGAn&V3_Vp~&0Wddx~6c+{2(grPO4rf0BRFq
z{Hy=mt?kcRYl;VAlt&{~zaD!{n0g97IXv`nA`UBo=gAY1kT5k9FcfV1Ff9n@%<S!t
zE8r|M5Wpk6JAhSthKe5^%r_J|v<c$`q;$ICjRXX9MX<n-=Nwe9V9qV57!=}JGk1xl
z8hMBghEtiIuRQhw5q8XeWW*)oz#=q=J~V@pqG=p?dVsVhS~Ms&z86mzrxf*J0tbHC
zX^!^0$fxqrOA$NCZ7ta+AfiNxLjIC54NOEmt1G1~80O3Kx7MZ-g+c6=iiCEM96Gv_
zW|Nk3oz~1IK&%xCiEd24XXBbjSXQ`eY*Lgf71=Sbz$!_O)I~=PAp6h>y%0hb8l5!5
z`~#hTkUZuxmOp`9W=D`K(tm4$H$qvVlMp1`%$|c7h9r4jl)|D`eORQF*b}j5glD!T
zi0DA;*zOt-M~8XW8tfv1$KO9TDLC1C9%HQ~vmq+tNNO}_<c>vVdE9H}VfxPMf7F|Q
z(wHlk1GNEyEXR0LrGW1G_tUBzE16JS9Mr`S)Rfq=!ps!>JVIef=u2n$=!N<om6k+F
zi7kV_q;F_Yx*oyQWuX9i4P@6dwIJYk&v4iMQ_9`I*Q0D<LvNjC?Ag#!=QTRtglNMH
znz}^ov5+9r{#E(5M_WWwMWeYPX}~AKPS4h34Vg}ZI8EH>>v(BO5n?KpXH1gcHF%8`
z_{Nx9%QmP*joQS^()Xx$^J*dit>WsCzy<*8mda7ev6nUU<A|TCV8=!^8+UX-B)eu_
zWK$Z+j#O`(lfW5-dj$z0mLkco2)ne*>5<XuA++i?82ivRkzm=TPVbvQI8F-RMSg!^
z5~E(+dlz;RFh_8e4!5bL>7BhZM>VYux>1LaBSnxB$X`TVr%#3Em1jPcD8k^|$vP*7
z#jJB}R&2-n5nUp$Sfw&(5fnR%MMh^5#h2`;E?gEv)am}9*2d&UxnI!f=Jbrx<E$WJ
zl^sPVs^K~z(zzYd$7$iOU6R0wn##0s6!mR-18dSBD1bD2EC@%PaE-@qu#I|@f{|&D
zu2$#i<fO-E(9=t{LpyM8&p?-#wg%RVs~vEzT9CE9jctx9ZuB3YL>FT%<*0>IQAQM0
z9-UHmL<BnonJ^7%{EgA2vUuPXPQUq5DG245mfcg1-7o4Rh_4MqcD0`F`!9q_=%%bf
zRXJz6Nu&$5?a)hHlrMVyxnGGkwT_ekGMqI2u3r^G3r7R`u9cy*)!G&K)G4V!mNG!n
zv&Bfg)gm{vcFtB`sb*l)u50mmn|9#U9RJ1s_|&olUS<|`>i%_THUQ##GJtfqO)2Vf
z@K?SO{}N(3OGuRB-s)p%H%9%3<Rdh-&~F(AX9nh7?}(V>OeVHd%>Ai~uV=|CN;~z%
z1MkMzNXqWb(*2-i8es?Jh@psTt9<`fq?1M2{nbaZJ;e-X$>+$w{WC%WE@kB9xhkv0
z3WH@m8JF-f{5uq#%+$Pcb>E1GCnzto&;g2#R8<Ll`%lPp9xOfYHHD>-ELzLGo~%2S
zC$Ama%i(<|$rOohqh*E~d=&5nH)m}L^Oua!WG=Ct#{qy`&K9UUJU!nC<NnPWnAYEx
zrHwDQQpL`@|EXC^sz+AE#sVwx>_;PJ6b%3X@841Vf98_<W`@Qt_D=r=>9@e4jQ%<Q
zEtPE1xUt_7ga5kj3mT6XkW=NBt*4jUlx;{6vA3N{`cq5^1`+8JYoFkf>&NjF`E^6@
zNxso|SUXS;O6$}~jGqWkiI;NiShe-}G|B>28cfacmFD*|ywLk#EJ8!)tl_q&dtySo
zh90FlihlxXQAS=yZi@j9if)MzJT~Y_WpvjbM9i=xp39Va_jp$Vt3FIhc|>5g2WB}8
zj2kw@XJI_&vh7xOZ<8rT6Kph_Z=gw3@=iqCNI+v?(2I*rPEKylpZ5hb*PR}`ydoLL
zQi|IKyk<1f$YN*-h)E3;izb}90AvEgxmTI~faAnSof{mzQi_Xq*FF9k?1C~cPT?$e
z&_U4@Kam5T3$_7e29&duf=rauC#s1cMMT7RSYRRn9`XwmY%nTFw0?XzQM{evSddUR
zH-ZCgZX6>7h*J@!AW_6fw9e^D*L;jyQszjFf(T49V+~MxZx7J3zlh2iBr!7RmyG(r
z*v|%7*(S^8Lu4(O!vJ!cDo!rnGYBl3cqQ(j0x?pq7yQ>kBnrw%5e=ovU@l`_nXvvL
zm_z{RaB#<7LtV2dg)G43gdA6c>2?*;1Qv;Ztv1}glsZ2nEdG&iNI0^v1BG8Cuf}}T
z1&}7@F;Kxf6(oWJi$tLjtaj`bX~4v@K{swnz6XV_NL7eaPB2vwt*9*Hv46eZ)}U*D
zPH{KqAlvggSZ`bH$LT-vMI8v-KNtYSI0XFa1AkZ=F7Vv~v}VE7It~a>*kv5eHSOfm
zIQ(+psvlkB(vjoE*usOUNjM^`G{3M|s%FKuGSEky9d~(SZ#UM_5}xWxQ>&w~mqDwW
zF9t*&x~u+jvEX3H;6mPF4fMg+u=BUjAa)jLD1f&>pVoH14D>dJ`K8JNA^80MyzWf%
zbJx^qXIbDsbh4m=#yISEn(i&5&OZ+v6f&D{DS*2kzSM4J;LpH_-2Z*?Bjr&0cMB!-
z76EK@yq!%~Xu+=^a&ae*>p1-P&s0#3UT5x+EH84ctvA6o8OEB6T}|&<?$CUxL9M}g
zCKuK{j3vHdJPpt2)6sGZi7lGgHOEqf`Nknz!S8i<2^cTy{AU3rn>f?o5;0f5k?9bL
znDd9WV<O(+6satksmydt>Tg&{BXqXzuoec_yYaNvj@#`QD`W-SQ>|MW&C%Z6b&n#W
zcQGwIsSe9f3hb>m$`y3YP^zgJz}nC_^&ydAQiH5jO^G=#cU36Mt3KNjj~b;vi0Z&P
zG3`9LehCKH3Tb~~?%(J;dycr^jWmAdK;QTinMZN@pon6g$m2Bg7m{oB39TGW0c7vR
z5kM;8@qt2Gc#`3}Cx0JRb>Tt8cGaxP`-G_<!T8{}g(<Invt+-qCq>+}`3?GZN4($`
zXkm?#{%EIqB04T)_^<Co{vCS8dtUgvIvbdY<YP*5GYyYrJ`rSZuQE7AAUrW*G^dCZ
zk}>{b#XC&ov+2z=R2_B69Ui4XGVxMf1Jy0;2G1W^MxOBQo1iK#Lf@c`=wbXjv-g+n
z1pbCG^lofe?bxJ4>?GbntjHw0-#%==c};3J3mTwa*ox0n%L<i7WB6TIXFoUX-2TH}
zYLhwcauR7CU$X}m@lZ|49^!CG9c2aat54M-u0}uOG1;O1NA~wfWlpn<Pq*nH&k{9;
z#%&3OOE=Zjuk-=O*}?AZx3?hxKzgQ5_o`d39x<Pji*>6CQ-ri>dNt_Mo%k04YtIO(
zI`5vCaZg*H0|WI3-MQP+Yph6L!-DP%U(rpx@^D&5uXv4~o!F1fHY|F>h;cR4b-%UN
z+sykD6vGi6wL(ym8=o%p`OApu05NAGM`%S!Vg{Z$&+<`NnQ>wh!Oj7yX8=l?X(GKF
z4kJTHfmj{zI43wkY>>&N3;~QuS3)QkRj+U_U@@=9RsK0p4FO)r9;-TXN|doc+>1j%
zavTsDN2_T;Y15Wh!@vET;VhXNuV^F@)s(V)8$}8J=G;Spe#<C)_EN?U@?DD#$?+(W
zB^e&2FWHf(XZESI1;qv7-`5(LqA(fVViD2~qC@XVX*R3LS{h9p5JWn`5Gkgd)wVYI
z#1;jJrtZesI+8*3lPpq}uzhq`0Jg6skZZwYA(JUnP!#9_x|K3#%7I`KIJtoyiIBoG
zOp?w_9Ynx43%fpY7+Qtp@@kWs9dXh%WZp>wqSH~^#S$F4R2Smyj}sAVl!=i_{DY>#
z36*t!_gSjKj;M;-lNin#_zyMpUf*%-ac-j2bELg??9-In1la~|F;{(&&yBRd>NBWz
z3Xwb?N(XCy=R1)w&oo{Rx{=ys6a>(<9>HVZU&WvzRd9NT=iT=iAeyX4K)o3hz?Xsh
zoM{FEoj>yWJ?QDe@ptCUY42KQzS_p4F<<o$s3X8}cKbq~J3Y3r=`eke{MuLXeWREj
zlCW>R5dMhXw(V$cTVaEL*j)nNTtW?}^QMSvhE?bird74Bi*pmu&t`{R{&jUc6NH2L
z`h>1T4%0}ZQIRGhx;7))UED~-QYfms--GA+7!{*E##J2`HUQOE9cH6u^XmmrVnX=L
zJ@`Rgfav&wP#!#n4b;BgQ37nsfrdK#Ja%>YYFMVK*7yzOw&y)!gKziDOhfSIgVf00
zuyUG8M6=hvvW8vb^P!J@{;Ck(o8cRBbyR+s=M$b`&PwK^%`iQ7ZJ5Fm7H*YWqvO7;
zu&dHA-qsx3WM&x4q(?be<*AQ9-gerZ^*?ey-7!7*|H%DP48osPd(_qMaT9g9^p7~A
zCy`1DK(uFxsV(LaEt9RubC65M?~qDT>stKRBW$v3#gN~+#QUOy@VZZB*3<8a#v^gK
za^zMt*zCXJz?bS83)qeoDVh&Qjq839MklbnStqE;e)UYg3KmTu$Q&WfF4v4kwbtg;
zY`ZdEURS!D*Ejt?guPRcC}Fo{TdrNUZQHhO+qP}n)-Kz&ZQHhe_usd><8;S8aUb$E
zA2Ko`zp--7F@0Lhv|<mhAJu~2tLLF!k410Fum1U3rb#S^tksxIc^u_im4hg47H=Gi
z>vF9e=<=e>5Eo#%IY=Zxy9AWGvG>O0Ato2TRz6lNeJ)+y`0O>C4}bs50qQ@ZJ-;&)
zf%JdA0w;w3E<W^M!k_>D(gLTff6{^)z52sgro<SM(ehH8Y&K}KC{zg0cpSe6d}r37
zzH<Mgj{n%Nb^?N*5nGwcNim8#x6Sf=T-UjtVKuvVN_iJ$P7aW;y-WX-ABv6RJs$7!
z7eUi?i&JwAP3Jkj_fZ!7JbF8710Kwe7C|N6d!(NbCcMepL#eysonfCnyz*rVB}?Ss
zK*7K1gKDtAHrL+-YYO9i?2>IYWSuGD4r4r!f8b782_2i@{v$=dJ}=M5%j@gp=?EF;
zfD!Pt{7=9#qEq{?9Jv3H`d9;kgDwc2D3rStJe~vDU(N&>O+LKyfnm%8XXALWjr`G_
zFyfzq#iM_`3;vP&$k7DROyCE^4QSjVGI;D*kAV(?1ZDA!7PeRr6Q6sEKB0~J9oe*9
zeMrfhyeL08`BpeFTud2SFd&mWWKM$c{=r7%+Qls<2f3sWC6Xe{S$7FSYEM6qb5B);
z187_rBTQRqob2BLYPxRSIR;4-ItgFaL)Xf=K>`GrRk%DtzhaRi@e{AD3`jDfgfLsF
zJgCEvhdQ)x8hZf%iySu5u(+cNwSX0=jLB;;gdnb%D#KV{A|mOE{%@yd%EDq={70g^
zu&#a^S-QCF8q=5#z-&od|33wb0Hq|XB(k-@)&0LxAGfyqE{v>d<tcaZ?qFXA77baQ
z<Z@riNHDivJC8jMw4df1#(!hDOKlBOrv0yy34OU&dn34~f{5RL5h9HCrkgf>7}1tt
zX&^yAHM|ehN9MZFP#)Im{bI0FBfQX9xE7W=Z{cSg7^8-b#(l6E(0%B1t0xB$zE<nW
z-UJ0YYCmxVI{Lq`MBC3aM%I_K(IYow_x}>0ix1FRtzc7sx8i|EKwXDJdEI@sTPpt(
zBf^@QbE7dnZNtrGIx5ZElosj3mYFmOt)<AnfGQ4|z-Q3{wi|+u!d*iPEkC=75uN*U
zSwCyUJRn2=9N;_7Eojl34>4gIt;34nF$3y;=rr5<RX@A8;2<rLrO$n$s{!^n)8|T_
z0fp`*J;>ifdq@Nw8M682&HF-4krk5BdE<VhHB%=<?sNK|C=sV;mZG5<`J<=>_G_rU
z1iS_yOwA|ss!pQvM2Xsjds+TI8;yka=rh*(K)lYz3JDfwv?~r!M+^5#f2PLRZ9@eL
zXzvQcgZhaaiJ<L8{d_@Y6}dWEewG?)LTxkzm{xydMN0xE=63~%ORHb*qo8a=+=F?3
z(mv%3Aw4iQ()IAI(${BsyqNT>E;T0?Y?q!$zZt?8>4b+O_t4xAr%(Q=-~PpL6u{P=
zRXmsmHZKT8Q<S!^j?>SKn41p)`&lzFQxGX%Z00ey(j%&v9`3KeAv#bxs7E~Uzed9(
zYWDYYr)+u;mnLP(^zCB!wz8SiWd=L&B%rj-($UhKqC7uto{#giMJ4SuW$F74Nc#s_
zMC_C`l%o1xTBFb)dTK{@PR>B<Tv_{*1L<NBU1Vk%U~IeBjLagyqXP$E0%Z1e0~kQG
zQw!Cm-6FC11fZ&?HUBXpLG>W{*X;0_JRrCj!^secPA@6h^F<nw?Y^Ssi#~FZ2t(E7
zdVX$GEq-M~t;Y{Jb~gvzWMK)zZ8F0^UaB$VIID&=(whaW!=AnBbel!O4eHsBmJ7@#
zD!{@TczR8SJZVG(-X%n9y7I(Zk=hkF2UJogZ?~P|#x^V;b(*Vks=Mopm<!Ryb=^u5
zxgQOGw#<vfFSW{M_<Q9ZuW+x;5i1D@a1|>n8uuTCEafd6E%LSNm+Fc}*IUGkn{5-K
zF5^J@UHv<tZo7maS*Ya-v`2iexnyaxNs(tAg+4Z<#qG5s=ow__l<lJ@U_d|nJ|p6~
z2>U;)X(QD{A}^Rab)?xfNzPJA`auaUR^iOuB!)Kc(-_dUwK%J+EbbzeIP6-DGzWa|
zCDn!-<<TaXcRiF|-EEShw&kuKJrb0AB_AtRtD;h<={@h>2b1E-zAO~UIx3jKg~XWr
zW|KA*u^XY^u0dGGb3^3B1Q;c&e?3|nG@mgtTc~<x1iT{V0tQ#PuG3)e05=%te2Jt>
zf$>&zU|ZMwH#^|isxSYbguU6egWOhZy=1k!q|*4fuZ<NZ1bW}IhFCaXJhoP%g5^;e
z5CcI1XH6`@O2xsL7#HMH5#_9;B)D!Sm;bwgmZH*hRC~2%GX?JRZ0CkKo+?cXLGFaJ
z8F;5pobOuI&YI|_2ny2s9U_v&Q}lR)cLL!Z+t20m3b^Oxf7$M{Y>`pUW%mfa#sL7Z
zO!;qgWB>QS;OrB^@ITl8H89xH@p9T^PyGG-qM%=o6pK6$%g(6eqME3oW~jF{mY^CR
zH@>J)ZW5PjB2ko5bY*UQzggV|_;W|G?je1mEg_A_Uo>y-{5xmPI7;^t8~5vAz`A(?
zU$YiP_XOM&uiY=V=!$w7zl~SFF&|N}`k<E8morVI%E80IQ{Iq^(%xf6v$mEo!{fI<
z%W9pMu`~6IO=jP%(Gr)?t8P>j|ITJ@?9pO{QMGAPFKK5TE4ob7zn)^o1sHV#8<nju
z(X7>j2D-v*X!BUN%FV&y@&0%|d(|Iv61{=B2CJow6BE0p^}7SnReUHyZBIBEf?F!<
zj}|=w&)61uVml`IOX^t%B<9NFY|R!8^qPro(nq8f2CEA9?LzNzHr{-x(I2|~)|cI%
zaR>ZyT}$-0;mPK8BquQ#8tiBt66`=U!KhJXZ?}_GTiA(;FxBpBc)$-JqP`rCaUU^I
zRCqjM2E?kl2-%Goy?<q?6{kfz%&|{+tpkjMKOvoi_~1Q(%LSVE4HRAo)3Y@<=K#Vp
zo0i(`97IvHR6{ghNQOKS0llId?4$>X&KpQVxP?#WP+7}yB-Vh@n;d#=0SMHwTBPi+
zY-5P>GvHW4H@6|rXmN@9aAPX$gD@u8RYfVWXIDm{E+GovpMp-9PSRX{Gk>={j$9Z}
z*a~p_x+kJAhXQ}dz}U`L`D-x9#EG&>#Wu&1GO4*45fUi*DDE0LgR*<xp0nt+vR~7$
z9u8&<ZMe{Hx15%B(^I^mKe;So@^{fJUN&!^0U5opp>JJ$#yOJ$twt>g@J)EEUWc(9
zjOwMU7rM<{-K}6;y_k)<ep4MelQZaLv7ca1789wOOe=mt&a~48mq5A9vs~LVZ@|wV
zB}_L4ad!EWq*%;hhq9Lyo7fHg%l3148PFbfZlcw;jZPLV4%U6ZPm@z_rgl@JXw$Z8
z(O}~Gztz5W+*bf@-}~V?S$%qsT~-gc`q9@jbJj61vf^8Nb^MHdnydOn0qYlgA@7wC
zLKd)m=;D}Tu~UA!0wm<d*C!^A)f|G9DKw0L^{q9bCnOD<euJWFr$r8C-Yl%^o4&m=
z)<hWz9Nw!I8AY6zFAnr}Ys+KI`9%&%AK;Am)a0R;kCh5xLn{FZaA9ge4yC)5geg%!
zUhvTNo53qKhz`AChhXzhVR-Shkin*X`nPn_?!3YYiEEjHj70JJR#mIQ`~NDpY?`Xf
zdahk}GP_eFihYQmdYBk1>CJHVZmZL&uD<@&7WWk1A0h+VeJL)=2bm_j?9`cl>VRjU
zr6fR?4U`crg&MDQz$@W5f9F||5mVi}Il`P_?6mJ>H`CA~rF{CW-+kf{w5Jzk`03Hu
zyZ;`B%~;O(-WNR+b~$Mruk;LF;$+5dc}2lgYgt)%+&s-_Hb|n+*;L%4xo#uEcd_qm
zer9<A*F1#EklvMfv1E1yU|hqIp#}9DH@vcu1DR>dL&kKU8^YKgqNI<%&wn+)5Jy|D
z&T?zEt&W>brbNLlC7EIKNW0JO&wpvOSX;;d^YxmuJf}?-y<4WNS|bJQpN43j)BSAc
z;K^$G?)}AjD0~b-Ss~qD()>GFf8?WI-Ippm$B@$OW}wT5s^-p-!IAjLb4uin1IMjA
zl$zD&S4Ng6{Vnnkq4XP<Y#T7*pOwyO@P~A_xd5|6#nIkV3XUoS=}OS<qB`v?w+udK
zZg4ASCSy1s7nsf{U^Cq#Hb)3TV>1MCiRv#%_a1hT+LyYVd<R%9<WQZqyWL17Nha|5
z!il=>mUp{=MX)7&goFGl&IzA;IjeY6KFo94Drq`d*4a0_Y%Y;61fa8VmLA>Bz;04?
z{rmGk-i|=hF2W<oRTtFH2g#!VpT)&sx4XokB`(|O8S2OtpI@ZPjpJNEN}V?0Dw4L;
zGf#tVTE4^zw0}Aa6bok1Oy`gLmw|qR<n?mp#$<)+%7vTCxSZ#B-LG!Sm$uA;6!K4+
zE<2-_jmp!m3JZFADoWLzWT|8(D<Fj`fZ?<Q<$j^%9Tz&%4vv1eTIP+~`mRRFfX2yu
z!HVFm=ecK>-FRrlC~W_)ipurmNv*%kNL5R#7{0v;U>nM3G2hDzp;@~oz=1a?It%o=
z-L+fIqdvWF*y`c*M0xX~oGg+Yr|wW?_l{FH=u?N=Z4hW1AlxZ9imX%K_sh)KqePoQ
zK8wH_2D7sqoeIuPQQ#8k>rmbb`YMZnnsV>+1Xwe$o8)D8JmMHd7~)$m#x-mKd#gnZ
z8_zVWPW!8GQ}y<wH5YO(-X8AJj)1{DzWun_*%0H-X^u=j;Cv+^&OB$ZpZ$}g5n?0C
z%{L%25x##7n%^RCfZX)@dUvxr7n1kXk_nCuiz*(p!MN<(0Zox1*J~YHVT+mBjF_3^
zXEKCZ`;w23nV^)}IXISpNH5@ze&xZAI4h`r+gaR5l0fMy(`J&?qa)A@s1<z=?$rd{
zx1R5L9H}WB!Rud_Wm{Di-8L_7E+J7}3XLxMgT$KV02|rW_K2m%m5mnKFM7;2TxSNs
z8{NgK<&6ghS>5k9_EJ)4BZaYD5wpAZs|>t;?9QfL?d%-D@oo2M)o79#KL#+rIkqiK
zH;P$*$@aT%6zaida97+f0N`h6eKd-vw5Dq~h2=m-a!v59C~=;Xk0|lLm7tOm`c!=-
zwCap9akxd6(o1~*z>YEsTL|^C4_d!OhgfMEg8kWo53(P6v!O^mM$>{`=O&Vx7_hQF
zTJGrVxJrM{*M4O-_3Bu}<@8oEb$>n>c*yjYb7RYp1lH$Ts^+33OP+0L?xEmCYD?Gj
z%^NqeyU9+j0#n0-{xR9^F?;|J9w5<l0BidzPcVS$G+psWN@^EqWI>5YO)yb>UniP^
z%Z>}1277K`(;(l$T@B_^Ef9RLe)cEOY=W*t8DQ{C$3*!`2g9;|%y3;>ixw+CUCbf{
zG4gy<K#uz&&2sW{Ib%RTSsNY)I1|hVH)Gge1say+_{VDKIx50yD6RDiQEb0L${q4X
zX=PaIK3O|E2yS?}8r#Txd-CJqAyp5kGqJ~)>SIpwaMCkzH&a(&`;v#M_GrX$KqQ)h
zim1=8{$(J{B!-ZshAjbU<rT4|orgJVoAUFu_mHf&8Ejjxa>DgXU{YlYRa%}$w<p~H
z!qO#>QxZi}?2Hn%Ac@qe@y?(FS0v<WM|TAoV`1uw!ibR800W-$&`5;pX9ZhsBu6Tm
zZ^&prDPmJZS+}i73ZID1fh`=(W%-1tt_9jm**gXb<z{e5C;!G?g7~J1@htQe@GxmL
zfT<g8RWq&aG`J;jc3E@<b+!2ojB9n`jfRdiAQWzeQiQ7lW4_##E-du=d|(8IN=JmZ
zjWL!^N!WZ*%EeR`#0v=ujdS~w?KyY@g(!@2bJr{d@htz+a>Yq4DKP7ko#IRe6b`};
z(#3&}+4(2Lfe_oLkM6S27z7nVo(nnHS!5D=N=_^8XE!{&wr}aq_*{IUZJJO@qoDKW
z`1r`jZ_NhlQ&DW3z~7j%iVzRyvNIKJ12^=0F5D$cWjL{LWbYXh#ubsz2>s7XVb%mw
zHOug(880n@-aKHwBe1$_{rkROx7o61$2a;`87Tkv$p`_R>?Ax-G@<ujmaiedee>CB
zeES@H7DtWw_cKwH8(6+;ls(<?!MTT<HK#Nj+zA}nlpHRmwOzN`A*5F~hv-Dn{#hZS
z0E2zNx~N&`hR7Nn36^qP0_Ga!L&xrR>Z%cSoR+Gj77JL-@BT0v?m-q@B#C%)u9-+d
zNklfo=(DTnm88A;imS7kV2%`=vl4%k-12Byz_dM(p3!F|h3RwvLV54RP!mjUDd0pr
zAqa3ZtS5sH(uI9t1T%o;F7z1Tb`U{i1?VS`nFU9ljfjHz1OYq{HwFN6fKmn!^K4>6
z^|eS<Ci!lMAo>l-ECkdz1b~Go27UwwbvKZ)^i%I>c!)OV4G|oKc65K{$iJBfDwsGS
zZ#6ha%HyasZHV+=2<owu=|F1W<>D%WBgk-1i9)CKGFRZ5-|1VNXy13a9HP`qm}efa
z*<O62+ynX^So2IG$E>nLDZ)gJWF_f)3E74Nnp&moX6BN5mXQak9OCeUsgbJDgp;D#
ze0j`!5987RGUfgZOGDtCF4l6MVcDrjso`i6;!|13!jad3$EEJc{48Ry?@+?n6&3Vy
zH9iY>>O=vfm=N46;(PU?KyfV2+$(c;>OzA?Fl#}}63>S8D|3D7Lf}R*#OPLk`_zd5
zM~DqTMX?~GS&`9g#OW!qhRP}v1a)GDV3vO##-dR8YpG8Vv56hjdOBwT85hoB#7(J%
zK@d5qr~nM^i5v`gP(Tu7L}SImE@%B31g^K&zcAr;=YJyrY$|-22HFIIWvug7#)9y+
z_6@-F$H6Cy@yTdW=82Ys{DHx;Uui~`{LElGrv(C?qgwZzuov2SN(AMxcSq6ze^87K
zyo?!;vx%v`ugP>gcg;B)1t>-5AI#e;>dYPx5kOy8qKz{*A&c6g6{xzrLj^RB{m#mO
zeZBVNCL+3&g>`KS3gv(9>xZ=2V%bQr2hC}zj8|;+NZ^uf;b8v)MWREb(>PB$>$F#|
zXu$J{X<_k|vO2=W;;M4#>W5vZ#-qT<-ye$B%6}eq28H_iqOG1x3M)n^@S#fldCsgY
ze0x$;ldh&UY{Ro3{tgIDuQbPQK;o2Gr{7Zhlbm1`eJrO;1rqZxs(JW;pbu_zf&QbZ
zcc>zQ!#O4~Xg+If(k?)Pl3y?h%y3{S`;8>Dw^XsQeztvhRNSFPhGKH`Z=LvIeR+V_
z*#jVoCkzWhT4}3{D4Y5@drY;QUU8qUW6H6}4g(%VIrlji<Bbj00n@}?E^nzCrT9&X
zYD4RD$z+tKUac&<?B#yvm8DVzDR|NJ;H~XcYzCvznoB1XR=)*I?noqda3F>)2fT;u
zrC=@Q0@rEnZ+XnClZcL`2qZ*4PMNvX1$~7{+A`Vn!9AY({9HMV{Z&z?HXSHC5rASt
zU~A28^nk3TtD+fRWmP?|<)Iu{e1NYhla|E2KWU399fk&UrsVNE$oLQoWNg%gT-4m;
zyhWU+vjjt!13(**Hwm7uhty=FY3w&9bDC7BU_pvc2S*{6Okf7TkcgErc~DkzVFI#u
zN*>Q0-VR(|ENIQnSl-kf0PoHQ&R@+{B-pUeYW(ZgALwxiJTen9TPJA)Ro_C}dJsA1
zqz{T7$?7lRQG9t{ROOOhin87yl{ev>z<fTV_RFN$EH;^S<W)HgSwoIUpXnrU&9&JU
zk*JK|rpcwg?`p`yg`s)%`)FCL&LdRN!KMN9vht!?QAPF!bzFDsfDR+COU|mJ>Z3MX
zPa46LhTvG|xu=d^uAi7K7=6z(kVf;RmcKT+dJ+L+HWF}+{dt>ahDkBf+<6!q@0U(l
zFH#Qx0``_egHuSw?+%=;+*5=P?Y9{;UsmVN?oaB<BNP_2r~yIiyM`DC=d-@vUq(yN
z41`r!aTiN{T5H2DpEN=z^uq%{xSB(Na!_d$f^`~M3P5cupBy(|RG*F<N%Rpf?_u>8
zL*pU~+9sb1gIgH`PoCm3JtF|lKtjXdb$F`ZBaZnVewwe|%a)YoE|c5*^JTrlw+o`-
z&x&or&GfS8igH!p8L>(dA?Xz!R0=tGrzs<0b0ksl+i9wC(5W~5ij|QZ0st>Zck%Op
zzmn?d&1O;L1eq9RU?_LwATM5q<s=01O|aaO3VW=w=WW*qS&&ohZh<hNNT!<dsl9FZ
zij_5N&b6mj+&jvU2y+?S8Ls|EqZ}>vT#VjNyrfVtF4*A)_0gZl-k287>J3cfJ1E|V
zI0F5){Gz`TYNJS{C`}ah?rSX76b_)#YLSRjjq^^P@;ONNKr$sjx5EU8&Crz}8}l<S
z9-vpT4fX%t67KaVb~a)jv0X?`LbnA2i|kZFI~xdc5;;Q?nPr&j()6p+D*Z<O53XH*
zWFk``va*<V@p2@Cr`iVEvGj4K?kWbVD5Ya!Fbh%|UNUNKkr@=+%D?Fh3ni%2NGsfv
zYkPx(tLFv8SFtatz<gY$85EMOe%5A=cHgT_eH-JmtBeEgFUWYneI#tHtke$N_-_ov
zR+V;&!b*_F;DiU-m5-HbFd5-9c-Yv=DGB-hjpD|o3zmf0-Z<<lIhw=eGNGn}DmW9V
zfIn2973?rHNj#VzSpeXzqQ05p5rE>^uQoYJc8-P*L+x~|Ne|&9aIE+G%o@oR2}UW7
znaNosDZTl{t;QpXJO@;8B|bY1YbvelW)yBk=D%Npe@?Y>3rbLvl>>-2Bda7`E(<9&
z6pT;$7P@e>aWtPG8A>k9Jfl^_oju?$hoMx0A?#a}%F7jBAJsQ0Qj^$6cTFn)n4*xv
z%9t~5j=V683ilM9iYA{D&3e<=0q>E;{)7i-3=X;zkvb8=!ZwM=vCB(vACU3h6S@3B
z=9BzuZ60G1D^*gmbus}I3n`K;C-$`X8O@Y%tbHD0+e;3E>myWL3h?KlTjrF)ap{vD
z<GD7Jrct;)+9zePUF28gR8R7oiA+__?6Xn2%z2m0MbbRD^6#n45F!>IN-(NZ7w>Ei
zXhh1}*HXF#RU(smuCCUB3*tF<C!P0f|Eke28kzn`<D2A)SZx99ex4M#Qp}<PFOmNb
z2-%A|TML%tXC!;|lqDZ(C6CICG8ooMWQ(t>65X+et9%_Fmdp))gbqwsm0p9wFQL2Q
z{-O?o&AG9U0rZCs&Hn8S4cXKPn^4g%67F_?%XP2>3C(lu%LEQpc+!dnA%r2R?DqW=
zkJS+pUD`fI_sdMq869oZVEmQ8N)s=vO0KI)vm(a4yC|VkZ3}CP9i(7Uq%=2Qyo53d
zrEJV$dN`_0toO)pF&TJ}N4t~S0So^%M-NgN%Zajsish&PAM=_GV-PKlmI$vsctIn=
zhqZ~!t^H}8ZZV=QJr?%>8Zwgi?7f%t+e5M(9ZEPF6H;fQd?^v-kc^-tOpf9Upv(~E
zfgVy(@+028ikvoJp2_jq@y~Lo*^1@vpFZ3r{6it!jGh#pqj}xhDZX0-4F}6O;$$JY
z?C`_d_ivDkPJs5BBjKV5p~rvz)ANES^WmJ-VST8gI!q~1P1NzevY9UE=!;oJ2m{c7
zHDNyr#JG!E>a<E#d<z)hzq_(D@!qWGj0_p(p?F+HhKw-nIBGuLDdWo;%#NVR5q_(X
zCVA+$wn(`pW=Du#gm79#_s1TIyWCO@^kRx$;6`aO1<u_Io#D=A$8={{Kr1{x6AJ03
z-c`D0^E|;PT}%{f>8jr!<5;8FZV(`&+_uLYUxNXRI$B*H!+c#&djQD|r~tIrF=Ym~
z7Kl<l?EbyNBvBBjJNIxzTlH#H14$Qf#gn0>{*FrMuP*?V7aULHRhl$LIwbRWTPl?r
zw#sc$<8E`9_gGe8>mTD!g7XJ12Qum<$6iujk7LPB*FN7vG$wMVrxB;?eO*INUmo5M
z9ugJr0-~ax4<4#}+NK=Vq{b=6Onh-fx0PTbh>G_M*sfBLPV3)56qg_Ry($|WJEwa1
zHatmIHCku4#v$J%E30~zE<P(8o<kEG4mvhkDxJ0Ed^me&1?7g(@uniYaa17pT!mc2
zxXSL?btQqk^swH5iPPU9*C2B2HsT7jn?k0l0D;R(kaJHyqiPw9TH+UA;3{1~-WqMY
z<XZwGAP#AO09fVN1Sw*qkAE?k77!Kocxfnyp3hG<7d#Z1qoD)D+)8IXxr;J*#D91h
zF%&mE@G`RJ4{VI@n{FCnz7CkOx1>)ZC@8+RVzhti+%jISbQ#lDlsw-25;lu<*LE#M
zmw)a#?`W_Fd&_T;zamD3iWzzugo%_N0$tJ}wk%IMHm%KDZ1%@z(0G<9QU+81=CPZ9
z+r()uRbm7j9*|+H1t8te0?MAM_UU$^E)vfORET2hvc0XA&}Iq+74Pot-PR1@eWGaU
z-Mxt36hQa<?OQcjeZ9T&GiY-{Zbi?8C336JKf>_-_2(TFE3o*{QHVBQS52w*##9}n
z{PV{)pXM74GIex?;CmERKB@qWz6R)EP(~$EGJBw+CC6S(V%YOtB}4^i=V><5d-il(
zju|~p@AU)Yt|)ps&zk-vvVhn~4@qX^`+~!;-CnG)VkwR65$@{Hx^bzL!sSaF#0e7U
zB(5(N17iZ+B{KA+)k$6kmFqO#U9r?eyyVZQw-RzvlmTvlzAG>AHvz)F=w*_}`4L?_
zL?h@!HZROWGA=joK%kEURZEgI`&WV%K|AnAETU|abJFkSji%;ic)(qE?*ND<;^gp4
zdmH?QAXEq{=2`vUdqgt!`un2u;ook|Zd1|Pl$D4>(o*BbqWRdr^Wq;*Fz8%>tOVUo
z{u#h80KA={J|H19o1DRBRp^Who-f7$y)fBYHmFi=e~YtA3crsolWTDP@CYYQ?4Nz2
z_1BnstyOf_^LQHomPnM_Tw3BVqXDP>snr=TuqbTL+kHi2kTD@zlVrOQsXKNOTlsa%
z0jw*B19|5FK@Ovk9_{k7gI6mQ3<O|<=)aEvNigMX3ds|9$HI?JOt8t|<ju~5i9}+)
zQL;gGGvC(il3DUy`S3M3rqOLw($)$=1AWJEgUunYYrM@1EXR*HVEr8Ie(R&$x;(Kz
zRhGU*BIKYNH2`qlB6dR{y!4Rk@R_pt;t3{>ZIsptuk@Zts>qLl%CTV?XcQt+!xJBd
zvB)ae*(Q}ed7z)YknF+^>lFUEn81R)(9O~1Zi}L;BM#qbRuXRFm@<}P-~0wz^K<^L
zWXkA6&^^BBd01a(QlFNps_}&%x*<`ts6yi>TU&Hj7Ypodvs>ZKPt$vkmvL&$HDJ8U
zYVLkF&~Ht9Y+p8zYuPfJzK*$1AsTTWQ=P2A(?#ippiPcLnms47rgNRo=Gn-wF|^;f
zqXuJ`;Sb_bzax%=vK<6*>jTD8Z&vGl&1~(+JFE`X&PtylLYi4_04y(!697;4{Y{1D
zo>{`?L8AoWG<`_I5H`3TSD0he6~Sm{VbemBY#TWCEm8H#$Fx8j>rn>ro;t*kil~mm
z(^rx<z80@y89?albq|xP>xAs0B)58-D|=!vm0hFtn*KKQ;%P)92D=+@E>OQg)dIj1
zkCGwa${F|m$Ci?|%<~eU=|)N#ZQ*)eT)dl6IQV-5dDzhqeEw2$mH`X<a$uY?0Sm?{
zW0ppwV%Ia0>UTj`(ahEoy>T8mMK0@DFIyLcxG)dW)UHS2r-jF0rUMj&-K$3_F_R@G
zFY4O-qNxn&wa}f}ldZ=G%+iM_K7SyD(%UX(I@ELH#^px-7Q5Dl4yu1(rF^K?rpnss
z#fcRq6ypZC1j|GLTM>PiM2|xsUU@Rvs8;q%+y)V)bZc(WoKBZy0F_eLL0e)JV?B-!
zG4<SY$8EWdyTd(*^jtinbG?FObcKv=!RXm!_$<!`Cw@bYKoO#kN9n&_fNJGKK-M50
zQLDIfFxwDH6=gbzLJFRfjfn^fxS@lJss6EJfacVWm97T<tnIUa(~kZ|S&V#O-r(c)
z`?T2DUmcZ0JJstERQ&raZN<ye4uHbRmB9Eqz8AyPiOIKLS$9Lgf%i9fmD`yc!Ql)z
zvKx!Z^PEQUt(SV33g|InhsGd=9`pGeYf$_~Uiqb4Lq}jLSAi^w=hCveSFO?N^ZxHC
z2{frqB|11h57L2WG5KYgg~4z~3bHPTflZmXUn^xIru+B?qlg}%k;Gj<3#Y4ov$vEa
z>j#CmyCw`xUZBZloCOWT2{|N;Srfsp(n|QuT3vLjo}IRU;1HrJI>bR1B2Z@8Gz2_&
zDpqy_)@y2-6=)VqQSgg3cKC_KI(l^S#mG(o0On6v#rMYU^htrmjgNJm<*>!0*thKk
z)(v@1`8zHRVvmAp_C_Z8q=2qUC}@SV-dLxPAtKS*In{iQGL3_D0!NLEelcCZc-^qG
z2qW2v@$_9?!-E`A)S{{E*4gE`4N#4zHX-zf*9U)wc#;GsTkM|7!lq5v9t`1UTUXJL
zsC?Q<nv;Q0=Hdt}MAjZ_x|J_hz!AxuD|#96)Cj0c8_hBO)jbOZSJrBbg!b6c`Z^CC
z6Ehw2!AOcFO6ItQd>R<tL&H6niFg+lEWvY`EQ$}W&52ffF#Ye(e_5IWkd#&4VSB*D
zhXnwzV)^g3&i|R-Z1ijlod5UMxm+xy;eW3G>nHLtrj^p6=!4T63XY=GcuOBYtscD;
zp*79fO076!r?pOs<Qk)DJc(GM!Fb58?=};W1u<W$^;-AVuu7*m)Avp8O>RrpbB^g_
zsg%y;87Z&8cL=X|)R@hiITD>Zsl6Y77<d?{HkT&%$j>!3=<(a#TOF7W+jG$zOyA2$
zBRyo{rq~)VPuH{1Y}EIiYf2ajsFa{2erDitDAKM<!KO{nLaWPU1<s#w(fy$)f*g-{
z&--kF)*||tZ3jpkpWa#=TwLGZ!F#y7y;3IqHp+d3k+VKd|ERN_sKIu$5_qrjOQO+w
zv_)Wg9K^m-=M%Dc;l-!^nC|H2bD1yVm~Sjn^8DyJX>K67LKE(nwTT$Kj(Z|$B4pWP
zL1BhZEE=Uk#yHZSB|Ijme_LY)0g-PO7c%+?Vy{0ScncX>j0vR*@WOEB4CrF!NVWvR
zhRIz|!r`vY@(HmRqTwvDq_|UQ5+(FRS3CJQ_EPS#;lT<QaXcwhc=!y31dT9cC>imG
z?DpU7XlAUOx+owRlA_}v0xD!u$Tv`912|*S%n>6}j?GyfRS`4c_DrGeQGiFC0*dN6
z9#Lfzkj9xlegHnRW@R9V9Zqq^h6tetsFhPsPmCpP#FPrz_?=>H28;$%`Bw<;`yg!G
zkZ{TRxW%~kMf!gXqd#B&unxyK(oYm5Q+F{8BObgX8#9O~j2%))5U*cL4FXx+jrf*k
zaPB?MVQXXHbOWER3I^#+55(xqec*h#!F+rcNL&IVMeo#Eo#7A$zm=@C!fY${pS5-t
z#m@K2?|T~y`RNO-o?);mHiJ_>EHOz#z<}9>%gV8BrnMF3VCf9@m}>8$yXLX?2&7^{
zvn;Z16xIBz<1>Z@PlYA+8m-&VnLazmS%5L&@5$FY_ra=?s@_D|z=t^4#eK3_<Ua>1
z0X^lMD9v$mnE`aULND2AQIQqziq|y9K(4L~WLeq-<2k!^Q5IpURUwQqrujZa0NN*Y
zZpw8n&=MAT50;s`x=tv672oQ|suMj;wORYOJP_5NKR86nm};wwVY6*1;Ko1E6_8L|
zIX1R}?nfLnGGOD)i>Cp`logPfbz*Lg733RJrVYDOU?8svQ_nRu6vVrTCBsBt8$pW^
z?7<)6md06=Wvpn*Dx*Fk2-RYPkr>TIZzG{~c8R8QD0tiIvVj9%;1*iEI%ftp;YQ#s
zGPP?l<}vg{hE`zxr4T8f;(;8^mhVynji?KNgaHjY32!iHz1D+FJ68C8TAWr#eNRLM
zql{7WWe<jfwixXAdkOOUlU#@BWRJDI%8K0OCmPY3-oHt%12&!mH$j)g<>?DnalG59
z-_hIV#P&4mc7vTvY+8$QghsoqAtY~ibLD+1SFbGF?_gif)sS6a`{J2-tqmI%+xUoc
zW5BZ06mz!Eu5P%`J}k_^m7XI(CBb=Llv3Q+OHn(G=4)Y))(QuEnvFf>s`h$v!ye0O
z%~O)T4QCn^()G^T(HVtUiZg6TwHl4wP#eZcK7o*(I{?RG4&e7CR;}8HamrK5#+>bT
zqBV^j{gIP{b4#=m3V$gcDbn&RGu(N`B)w!rCqaMyfdo=CFd`Wpje#hCFf=bDB?^<~
zL<w)5G|@LWg*V#=8Vo%3NK1ONIhR#cz#JQBrXbiBlN=9)fpNJosv5BXv%*3w`dR1;
z1Wr{zbY6Yd)QjQsBfcUINh0Y<zXB!<_pc}}+_ul)Yh^Efev-<#%Q~cMJNCp$Q0(H-
z!^$j7<t8KwC&JwER|mU*1z{lApY?@te(M*8ip7PlEz|Q+#6M@4;)PHG=(g7TRsi(J
zQHIX!k29XZ(w8XujL;Rx{2B~49*2*z_)5>j{L5bVgu@F!BdrbS&yf)f2@%m<A0LNC
zTRj$t?w&q8<$7TR#SE5c0G}_n3?3Tpr7HSzQc{FlTy=`jBpKO`nBCL{b{K_U33kQz
zh=NQ=Yf!5lc<SP^=P3>h@|8&)I1$E|Gys4fWTao@GO5#4b6{ufKF^Ougb1B@*F_Iw
zL@HZ=8j;JLG%hZ-!x>rVbMUX~_2;G;CVM*fY@gmv)hs<F81``1*w{7T3--t7)Y`zW
zF`su0#chi3HU7&Me>p>^4_SsMO`ZS12h;ZWmjM62?=6)rx}i|JbbbByZkWj%d}mbf
zZeO8$#?>NM^NTeF!YX?Jg<mQ}^LZCT?rd5?8*u-$Bj@vh%Bt^~@y*j90Fujznx$PF
zc8J|=e;Ac7>qR;u_5^)nFqRV;Q}FHt-h0pD!RGtJG?Aqmzf7GU`Oa7o4aNs+xNU<!
zW#3=&%EVG;B$?8Pw2I{8A*X<eMatuQA{9>#)nZIX;($it+<?=6vu8#AyTI@0ffb1Q
zJP5Mt3r7!zA>{IgUz~A#b(;`bLP0v`&HDQK;h9+dH;>S#HWkkpMK*jpg>Bkl+@Qi}
zOV3`#MzF^t)|0qu@7Vz@tP_JR$u*^M@F-?pM|#)R$P`>7?ZzP)MDk`83}NoB)Ic%x
z*e+S(N28g;>!YI`nAERyq5HLs*hU&Q{^Res_)M=ya$jWUqcp|@Y9EA<MZvR<%v<Me
zu`VUoZVFDl5+^WzakU-v*$x`y?@-<?-(wlqz?|S5S5VjY%^Ju^dZv?)BFu1VC4pie
z!M(C|t<Y!&-PtmIj}2jAet1&Egq@bf_3=mz(o+m<R25my9CTSnsHJ4hE|k4P?DPUt
zfFaS6`-=SjbxHOZQQ4L;;N%51_^~M41mg)o{_ac##t#um0_bunYsu+T$U6tvu8Jbz
zLlps`GxfcyGx71L^S0c7jU5TflY+>c56tP8>BZ0>d{g1fS%grrMJDMJT*ZGW?Bs2=
zf!koA;{w$w6qn|PqB@M$GkF>q`wgeel}yk&qqy9Ul~PbxYQRo+s%ObKCzYe2E8h=Q
z6nPul?rQDTa=a*U9Q_KF;Vr?F<&!mAXbw%i94n9&6+_g%R>NrS<Q_$L?3g2ifQl!=
zD~Q&X;*yd<-GIM7EUD{R_rW^TxvDVX3i1K61JBUQCIMDV=Auz0WWLa6xo;WY!YEl8
zlizzad9v}*&LQ28sV5JHccvHMNH2{$1p?i&h6{uGgt<~?bFAx8vJl*LcpG9Y&HDM|
zsv37hB_x4hXh(XegNKgP2^HV14|EykUEvt1j$Z|hJF~;Es#F&Cl{t@0imLD3oMZ?$
zZXVRE7*^0#?Wv$z>7Z7VoeYaI{a2zILb8e1@4<?oGThscN&YHeb2>~I6F1ZmO5I;u
zb$EXLbpBED&hcU?_nE=j%Jo1#b4MGQ8aZ91KCHKB&+1?v{s|%d<i;5wl=R-$j)><|
z3Ems}6P|$Wd6PIsYnKhDHhf^E**?lyD_@%D*I=#tM6cOOg}6#7P>vG+N3s$$quuM2
z18Oxcr4Y?FnG@Z3piBvi*h$N)2rax~PO3VxXhK23D&<OnR<KJk^+kk+a<#&<eYXOi
z$L4OVwKhbEl6q}9yilb?L+(x%R|dsFp}4<EsHlaKX=e<}eeM>e>t<#P{ep$$rEbUL
zp74cUe4Ci3Ix*lQBXRxIzYywsV-K{sgfT#wb)bDo`X&Fl7RQR7akHa?G|2?M#kGGP
ztULG7R^OHDLf7H8EL|6N*b&4Qx{D71sY|IQRB%1{YUG|X&yrQO#xAh~m6p<PYDYVG
zYJ<wO1YN^Sn^bkU>X?aqydAUOBaPTiK?HzJbs$aeRGUwQc$b0iLF!<|-ftq0kqmXa
z6lAQ&WW@GNRy^gdcK>ZP^!<n}q2pAsRt&F;ezLa9&5&wONh8Ty?YiJ$Oe?95H>H|9
z^ljJ7xT^WFUeO%&idQ=YCh7yFBng_|v$oBy$m29FBZTc~WtOQ3-P)S@C{6AskJTh1
ztL{WpiFYzyPKylh;jEY&q+d2@*5W~8%oA~(+EX9BlNAA2RANiSb-5cc?7{fh!Ypi>
zFl%~xx2|jNOWU@HmxceA^6}A3cD6R9_wlMZy{V$OL|cbR{J4&eo`c5n^(%p8eAvcr
zo1l+nkAQnzGiNfugzMiJd6i36&dfk3sGH{^k0bl8Yo}BXll@vj%;@|1<66o{{ctze
zm`F)E=)e<|<a_`Q!N|n*Lt}BJcfi|u5#VUJq$Dw-XX5Qi<55ZQqMiU1FYiXV_gDi-
zA!SYrNzqTV$GW;ZyDbgfObFFXmEgvKOv{vzEz1f&qdh1_P*J}(IQl~@+C1+&kcyo{
zpkfxu9i>kB_HX;jMtQCHoXIK*(#3<fX0B4jdO!fCWPk~%lEy{9GX}_~vkB1SLZBCG
zt!$62ZvabZU<Nl$9>=V_Whp1h6gJC!SBOxC)P(}v_#fZ1(jKh%hpSVUFvs05w)85r
zkWd)mbGvTtt<Vx?y29PEBg_<glmMR=59Zj{S3HxyBdBvpE@|zjzLMNSwKPMog70RF
zYd%sWZ<BEYPPIK>^xR@rD|~*qu+OHlr%<s&mww*Fv{Em<j3|C9cb`mPA}Llz&ybCb
zIFyVP&}u#LwRq;<%|MMky+aRvO~r$MXDz?UFXA(KmNd20t6C<LsY!A_&*w7-hD!nk
z;Ju!xoI_?QK4<DGn_W~WqYd#@Yr>zmL<Y)&bL1A4c>}SYm%d(28fsNpXhmcwR99d~
zVIMuU2fwE^xQRG7IZwzL-+vOksW$j5!@E=~N9<O><^-%*=|YQq(!S|)*lO~cu7Bf9
zdgFB{B=y`!9(Q|pB^QYkQJqLR{><N$>l@|p0do%Z$uU%4S9n#5Wx?!Da2(0al(+fh
zW=>zg@jp)g{+Dvm|A<N1`~dp#{&A<-Kkmf(|4cjohdUYmH+23tKGI{%Tc-`x2d8f}
z>+J|Jf9q(kZ$s=>M)DR~^fD0H>~@S8=z%g+#FSv1*Nfk8*Ilo~++cj$iz81pQ$(rT
z>)Y+tPP+n)T?<yfj=AO<+XJK}y|bXE@U74|R+n!T=vVMLPWGvN&ix052isE!a<MS6
zFqSi}2sE%*I3hPjI6=NHpJ1N3AT2uk?J+3ZRS)%oUc$fV0~qSE^v~ERp53tI-wC!F
z&A<fzgm)bX#7=04Y?}0EvgpJKOcME(x3A5EgM+tz>>q%*UB<A`Y9!nP=y>Yj_P9Hp
z3U&5DAcSlV+(+yVM4kX8LeOu?Q{CtX_Nm<L30V!S+vR9v32uWRpvefT^-}*F9g(E8
zTJ85hWS+qq;REH`;q-=ngDQf`sQXJ<9!RDHDDm9X3J7!(TNKnqcRN`JLX2*Rqz}|j
z-*<pCU`g;c12n<n(TQ2uQ1hDLB<JY{!Rkr&7XyYUrI1VmGcX%~t-+_^;_#$9Ln`eL
zyof}YjGOwJi4YvJ-lJM=3YJAhE&}ld#>vX?$}Sy(`#t{DTLDwTi}nqKYFy=`nP<`P
zY((np==`~dqwUKXt>G0_{1xl}o~|2Ds3d+sqrC(vssXue&xEub9a5xJA)+WlgI6#X
zDbfh^1a2Ufw8LQW9X|xB!2u8(WGMbfn_HYd(-t{c5w_(0LXJE&L9Unpssb`7ckY3D
zqK~tIx<1TK^o~Ud>>D>TxSFWi?ZA5ToW5G4y%AcIFWRq8(2uYA!bcy-q2n6U6D@+E
zx6)-C^na++&GWEko=<Jxnmh1EAB5*{0i9rZo?j%_Gm@g9e-CE9eQA0Iw8q>_bQWEQ
zsm3l^;eTPLld<y%&vfwq8a6C7j`&NBfs1FRL%Ev-TQcB#pl|W3n7)pAckUdR1pMzz
zJ|81YvaP<ReMyn`hKAfJw)|*~!9`BO1VjXyA{0$f;j?mGsOM-t_;+_~h51Rd<lls<
z;$Lo2{H@>`*Ycc8R0RcI10-fIGwX{q;+s7f^+P5r<LD70oEh*STBNKo^$rgcXXi?o
zZa|7hu#wan!lHzcHzEvXRNKSH^)<%yb?Bun=F!0fhO^c1iQzpQOt9i*_|8db?lY$D
zd1m0p%(Fy+bZ}*Nw}QhC2~rc&#b6WaCVewvp+pDp6Y&Mqj}MPo_SH|E99MARvmAqS
zmZyw>ha4z9ghw|_M_i`waS?JXzhpvX6I{?k81rqapkTB<VKAY7M&UJjELYlKs0H(1
zkK++)sjo3fV3klRx^$t{e&&L$U(VrPzTv7N?5)t(W*E@hJcBFR(>qpaRbTJZfQQMa
z*xbATOOIFB^clLD0f?^goJIhW*flGN_Yf(!4fv%jF0Ne<Ch8QXIveea7#gp#tTdWW
zL-wZYoLhTvD~D&&LNFx15RpTWq@yo=U&`vC@g=C$RPWo8wib2IkPw|6&b4eiZ~9%G
zT`l$`@~yh(bbV94bh@;Mlg+yu+URRp^oVL{Iz=;Qo+SYVO?yWmzNLJ?uY0^^O<1#R
zosBf1L0_|;<*EL*-R*S;K0}>9b)m%S`kTAS+)+OR#5@j%=twneBJ`A&Rb6B0fPllU
z$h=J^OZv_E2YsyNAly^k<Jj2z?0wj``U^cUTNa?j5@&o-hyyl%gSE%T)RTBypptFt
zN(dM>(3+9h)d6uN>_kexr_Z9q8bq_H6y}2JS@FI9NU{q%1H&Gw1qg}K)x_T~pgg#e
zX;c5fDW^ld&cRV_PJ?wND(wGu^Yx}A42A&2xiT6EdBsw-xX`v|aX^#8>x@LY5;{QN
z(et<og8Vwp)Rjdz;~gq{kD<Q`8+#dyINZc_{3wgB@<}PW?)OSLyaF`U-gxLfAH|du
z72ON)^X_sc9DUW<9l=*#5J6hZ;)3?EdvH(Wrqx*~r>__tReHtUq|8c<i`$O732tU*
zRr*opQ2vZj{a@I*y+}LTfl0nLs{bp(=w1#0umg>J3qmDxk!}U*rZ?#IwTK#3gV%ZN
zV}e;@>)k4Pv6sQkZT>&8bLD?v=UN``|AC#OIe;%%AD>JA2X;E*=>5Og*@39eZ*ZM)
z{r3kSzxk+%g$=qsLz`r6>E?Ej(mg!eWXev@pege8JZHnR1v!c;yDyoqGF{Vo2bm7F
zl7Gu@&y*#reZIqr&soXMGaxR4^O>r-g+^<C)9Y?OGB1X+1SE@biu+__O9E!Uxlydg
zuJzru#rrXQ<5*tl3g?0C!CWh}=Xo%TIp2|<Vq)TmVmi1{<BF8hgyTND=%Go{qpMhw
zPOL&%NE4A=>VU%iB{7Hy6l8XNmcsfPz$-(4gO&~r4OlvX@^d#8I&fL_jF|9A8*iP+
z+Oocq2;DcAfWs0^cW~%_TuZqXs(v(|yeRXgcB!nNuqWoth-<U)ZY0zLz18qV`L3Ta
zLX&mmMzubXDB3EuO#-O6g*GTWY*q2@&tSr8gt6<CM;8v>F4s>ap3@lK=B7i-F&KIG
zFM=YJ8-i$DVC<J7abgKwp?xBhj#^_*?qm4tcrKUF>7=tP;Ggq}oIMRZ2$9|bxK=%f
zq#S)N(^8!Pou8J<K*Fi$_8t}B1QW@!Cb>V@EIv{R3?r8mDAaOU;eY-N2oo-Bx^i+^
zFi0J9hYWU2NR%QCO4tTuDn_+}c_#xhEg}1_jWO#UGqY<!l+KThop|^wet-dK%ugpt
zEBq--W0I8QlcNYGaEXv9f7b@)o$z0ENjC4Au=s=Hl+A)e;lY4Y31Q56BGF7PTtg%m
zlo4w&!GAZHEZ#`but%&78quXBp7{WFJObHANzV;wNFt{oghY4V!m=Q0M1?{<5Y4LO
zTHo0gq=u`ap>Swvf3oB0o!KZk)K-_xr#n2%6b1DQ>AD<Jxj^t*A_-C8$`2t@UcAX@
z+d)<;NkF3FKJ4YQ26jtqb<{0N#78b)7G1^}INe1qt8UNMS6MrXXoX~37u7ykaS#6o
zvX3G>HlPDqUk7a3EMaLW>h9l&D#)+QkVq)wxAJ)q!ZCq1AZ@0BTK8zDirY_<WD^Fl
zYm*uk2ZVGZ!u!TJs(L-T@A4tRCYcNB$HOq^nN?B|(cGTl#e{&ER17g;!3^m&F`~sQ
zUW1|&jc{|Ba818D5SDC#fDW^IV0SuFxM};imXd)InyL*YWHT+qYJ#I)L6(2H(3*fu
z!nLXYOpp|p)&s)gC`>k+5hH@SYE04lGqVP__m_46Sr5%t#xjoy-0g%GlyfJ9q49p5
zWzyYR@rD@o-}t4VoL4Ta4%$eLU5)T)8kvBd;a{<OSZ*U>LnYSdpi0kMrs_@o4As)P
zSsruNDNppuWyDakth^;Cao~cbtm*z%`^&;TA<1nBRtPLu2K~hn*!UKu-4l=kif6fr
zgE9xD<#ixWq)52h#6VA($grjg-HR5<-%=Rd_m^gS@d(gPOogTi=1Yd1@xcs2+6w06
z7K<fS(-ABWV7QO&z}4+`B!TV{VcHcgHce4luyQ0aG80C5J{84JY<cGbJ*=+$6=l-+
z2~l>m%yHbNpJp4F5mPZWDn<=RhJ_i9jlG8jUp9I#9T&P@w`6I$Fhd3)Hn5$%aEKj>
zG@$}>N!LU792piYt5r4$9VoOEK2tkdLCb3vCZ%X)jI;<9Myq>hNyi#7`xTOL9cA3U
znC83VRgO_9<Z-vDxUa-EmaV*o(xnKGR|>!eyYzaj4kX3luYb;-6a&`xnBtrExyyNQ
zx~T`M+nhB>cjXo0-4w4f>IX{1mC^>3Vff$A=x7xVJgQ*RnVUhC`MNSaTh4KSzpt5}
zteI~2>6-3BcHi7gk^Lj0LcZ@uzZOcUZ4g$r%*Tz;?@cZb1aZ2NLhx72Z`q_-!OBVD
zr~ANzYd8oD`pH8&#%kMC_T;jvxvs8j)D7!fUoewUGqcC67fQfSwTygzCr@9R?_9IG
zj}n!d<`c`20+eAs0pk|BooI1Y5;JyQDq#St{$Y2_HZHVaD`U8r-#t6cbS|hXENh!Z
zKN*7%vzI;}DFNFUZY(Q$YIb_)gP6ZB#5fs+n8>S-^s=eC{^(YXi?f+6KPV?fSz!2d
ztSl+gPbwp&vzd8_3nW;E_xI<r?^?N$;glh|BI4f|?+eW{mKWOk*)ST}8trXj+s+vg
zTh^-lj830eA%FXPAuyif(C2YKpHuz3qm}c>?l|=eb|jptC;kJSBCE$p7YF|XI{&pA
z{!i#U7_dJ6{2$Oc@E_=m?fnOxkV5_1xv8_)X5`IExsWBXnH@I^B~v8NWnso3ba#le
z_Yxj2iycDkc0X9sE02PMV1-Yuy4bctN||W$cFK$~kZqBDyxZKEqo1E~jEY83XAa9I
zH|_tj!uM8C_ucX@>&&jZiV!~!MR!w`bbQdWbD7Vxd0|4`8T0RfME4(fcoCC{-?h@i
zc`RQ)(E<wR8|pm+RWe}@(UgNIbVtj;F}14t6`xYnztuE2r2kK6R|6DP6@{<-2%3NC
zny5=4HY%yhh%t<lnG7(r4vNAGX2o;aeG5-n7MGP)3u9+M4P>anztl;Y{23KXvy?_<
zEOXRJ%5h9INgFAppb`|wEa}{R`}5B3g?-yHkJ%ZR?>qN9=iGDe?tAx?Tx(0oUVrsr
z?X_E9<(z(FpFX;yIc@3a^2+(aB`=$Q9n(5^S4Q{m+O)RTgPO2&bL*Bo-S$Cc*`h%&
z?$~$W?V$Ju&9U2CFE%V~svi+ozU08TRHdP-e%<38$E@=#4XZA_pWFHG7T9x|;*zot
zZElG-2Da{w+i~w~N5k2*o4y_2l=ee+@A*%;3m+@?#>{Sc^yh8UUSXuVa#oG9EU!m%
z<S0BL9iH>k{%zOb<BhJ58rPZ5DLW_M(=^XXYcxCx*?r?K?JqkZ;Mu^zgudvm)BeWs
zD};nO-i;t<66jm4{m9ms#hPFe$mo3`f+^r1LkT@^BI3)So|ZsDG;nCwFbCKG_-m<+
zqB+1))rrXqGLr3>8@jxnyzS4x;mE*zXpHN?<gHp`VLmU*P&(?oY32V!fZZ`_dN77K
zYSGZoy+K6|PHz^9d9%uXOonecC`;&?EL$1KF$TK#h9ef$STEBP=WAE+snCnPNM*5F
z<S0%l>YC>aj01`jp!jG+F$kW5cBtbIG&?eeBH^ndUC=rsSS?%jnn9mktqve$Hgr;p
zK-OOMgiH_*3)b1&8>{kELV+AfXb{#^k=o@DZo|N#nB>$%54)52LcT!H7w80N_-P-C
zoT#KEfbV)eg~WO1ITwlEq!Xp-GtAwolXXycw;iN849B%RgQWQy116cQs|`XvpT+0&
zZ>$^p^!lmGqadzN!nw?25H^{Dj1@o(D`#A-0?XxszsD^T=1zi-tR~Zst(+4G&H18f
z2pn#hFbh^LHkRX8s&WN`T!NeJA2!SbJL}*ILj<82YyyAKZ?xaO)vF}ria^LHq|KhU
z5V}+M{>>KChek+3S8mw^h!J|>%)Gx10q3j|^7R}jUerId+n-#>;fIltgs9=diY$Ys
zMvkPX!RM5GhChmA1@t_*6Gg~y$QF!#<qH=2j9B03ZdpJL*K3H&o3!2x{LzJO;fpLj
zGKW1+IWvb4ikRww2%n!CI5)PBf<~v;-#SX8AB=zr>jgrhP;~6<6I*A66w(R>aw`Q5
zmhTpBv}Qo|4;@9DQc3Gk+aFjJ_ZS$nx{P_|Qm^8c2|REKu5pNIX9s5T2cPW?C%)(n
zt`p-I^Yr9S&a5ran~btcNM-iil1T6fnMuebWdE^#@%{A*_5RK8$JcBEs<lu_rXa4F
zfdia*W{)R47KU;@VvWYYF1>QC4cNNja>g+b!$cY#gxTyZss)Q+5^JIluhWt6clJ%p
z98SpA=czB;@pZ=bw;MY>IU#9&vdXBp&qFdSjxf)=ei0TQ<3b5hNKi{{+Z8U06QL!l
zS;)<^xRy12+ABs8y$275?Rw$zdNj<1Tx52XSH`V(o-5N7n>kYlB`^j`;8<j8HwJX9
zJ96?(x)rKCxifNXde!}QfIb6V4{-k0g(G_%@Tdm@mzJ(hk;6ni89hBCd^-rGOZUv*
z?#T=$`fZUL--k~ren`{1i@$-T<4Fko2}r1)V;T68<8)-x&|ojE{>6F@{Ba$I;+!VL
zU?04QMPt<J%qDwNc367%89)jMnox2@y+CvF!C%!;u<SmP<yn0vW-{=_FVz70ah2Cy
zoYGLD3RRpg+0zTTq?+Yk@Q9{w(lVf>y)Jxj8>lvOUY}Gw6SQfBv{E7$w60_jWb)=B
zm<n7&@SzSJLQ2F!V<#l;6ZpCjXT!>3#PI)SvgSj%>n{frQZvMJ0LRxLct<uES6c)l
zFLwY`BK6$^it!*(ElA{Cbc#M`E@d$k>P$wXKLi`%Hdjo6AsmGm!tt3}&LSw*njtz1
z3+1FS9YE;xJnl^xz)LV`U>{$oVBkA_?A(0%@G)f|wI`-#!)D?&D3(~F&D9JBPL#+G
zg6!f8YCT9a5}Ik^J@hMESOk)zCjAg9ZFG5l4+vEcj=(Gfcd}R#?Hk4<-r$!zdJC1u
zTVO1W(B2!1l~v1Pu~%T&Gs-RyxPQ320GHaT_ag#!H*w#S9!+c9+EhyN>L>k@NE)5`
zo}#?F{79MVPa!5&y|d>Cqu-BoqV+!hT}l#ko=GApMs^OyLGV%znkD#zR4GUDWfq4d
zh-IdV_o;MJmiQ(Xi}X-?a0ugkI_WsPA6k$ytm$Gg;71sM!^awmh8Mm;Mat0`7~otE
f(?yxX>5|)3`iiPxn4k!Who6m5yA2~@3q<|{E?c;d

literal 0
HcmV?d00001

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index bd9366a9c444..2c1fe4dcefc2 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -50,6 +50,7 @@
 #include <Adelus_defines.h>
 #include <Adelus_xlu_solve.hpp>
 #include <Adelus_x_factor.hpp>
+#include <Adelus_x_solve.hpp>
 #include <Adelus_distribute.hpp>
 #include <mpi.h>
 
@@ -139,21 +140,21 @@ namespace Adelus {
   /// Factors the dense matrix for later solve
 
   /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
+  /// \param permute (In)     -- Kokkos View that has the global pivot vector
   /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
   /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
   /// \param matrix_size (In) -- order of the dense matrix
   /// \param num_procsr (In)  -- number of processors for a row
-  /// \param permute (In)     -- Kokkos View that has the global pivot vector
   /// \param secs (Out)       -- factor and solve time in seconds
 
   template<class ZDView, class IDView>
   inline
   void Factor( ZDView AA,
+               IDView permute,
                int my_rows_,
                int my_cols_,
                int* matrix_size,
                int* num_procsr,
-               IDView permute,
                double* secs ) {
     int rank;
 
@@ -164,13 +165,49 @@ namespace Adelus {
 #endif
 
     lu_(AA,
+        permute,
         matrix_size,
         num_procsr,
-        permute,
         secs);
 
   }
 
+  /// Adelus Solve
+  /// Solves the previously factored dense matrix for provided RHS 
+
+  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
+  /// \param permute (In)     -- Kokkos View that has the global pivot vector
+  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
+  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
+  /// \param matrix_size (In) -- order of the dense matrix
+  /// \param num_procsr (In)  -- number of processors for a row
+  /// \param secs (Out)       -- factor and solve time in seconds
+
+  template<class ZDView, class IDView>
+  inline
+  void Solve( ZDView AA,
+              IDView permute,
+              int my_rows_,
+              int my_cols_,
+              int* matrix_size,
+              int* num_procsr,
+              int* num_rhs,
+              double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+
+#ifdef PRINT_STATUS
+    printf("Solve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    solve_(AA,
+           permute,
+           num_rhs,
+           secs);
+
+  }
+
 #ifdef ZCPLX
   /// Adelus FactorSolve_devPtr
   /// Matrix and rhs are packed and passed as device pointer
diff --git a/packages/adelus/src/Adelus_forward.hpp b/packages/adelus/src/Adelus_forward.hpp
new file mode 100644
index 000000000000..f09e9f0fa618
--- /dev/null
+++ b/packages/adelus/src/Adelus_forward.hpp
@@ -0,0 +1,134 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#ifndef __ADELUS_FORWARD_HPP__
+#define __ADELUS_FORWARD_HPP__
+
+#include <math.h>
+#include <stdio.h>
+#include <stdlib.h>
+#include <mpi.h>
+#include "Adelus_defines.h"
+#include "Adelus_macros.h"
+#include "Adelus_pcomm.hpp"
+#include "Adelus_mytime.hpp"
+#include "Kokkos_Core.hpp"
+
+namespace Adelus {
+
+template<class ZView, class RHSView>
+inline
+void forward(ZView& Z, RHSView& RHS)
+{
+  //NOTE: Currently assume that Z and RHS reside in host memory, and 
+  //                            there is only a single RHS vector
+  using value_type = typename ZView::value_type ;
+#ifdef PRINT_STATUS
+  using execution_space = typename ZView::device_type::execution_space ;
+  using memory_space    = typename ZView::device_type::memory_space ;
+#endif
+  using ViewVectorType  =  Kokkos::View<value_type*, Kokkos::LayoutLeft, Kokkos::HostSpace>;
+
+  int rhs_col;     // torus-wrap column containing the rhs
+  int k_row;       // torus-wrap row corresponding to kth global row
+  int k_col;       // torus-wrap column corresponding to kth global col
+  int istart;      // Starting row index for pivot column
+  int count_row;   // dummy index
+
+  value_type ck;   // rhs corresponding to current column of the backsubstitution
+  ViewVectorType piv_col( "piv_col", my_rows ); // portion of pivot column I am sending
+
+  MPI_Status msgstatus;
+
+#ifdef PRINT_STATUS
+  printf("Rank %i -- forward() Begin forward solve with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+#endif
+
+#ifdef GET_TIMING
+  double t1, fwdsolvetime;
+  t1 = MPI_Wtime();
+#endif
+
+  // Perform the Forward Substitution:
+  rhs_col = 0;
+  for (int k=0; k<= nrows_matrix-2; k++) {
+    k_row=k%nprocs_col;
+    k_col=k%nprocs_row;
+    istart = (k+1-myrow)/nprocs_col;
+    if (istart * nprocs_col < k+1-myrow) istart++;
+    count_row = 0;
+    for (int i=istart;i<=my_rows-1;i++) {
+      piv_col(count_row)=Z(i,k/nprocs_row);
+      count_row++;
+    }
+    if (mycol == rhs_col && myrow == k_row) ck = RHS(k/nprocs_col,0);
+    if (mycol == k_col) {
+      MPI_Send((char *)piv_col.data(),count_row*sizeof(ADELUS_DATA_TYPE),MPI_CHAR,rhs_col,0,row_comm);
+    }
+    if (mycol == rhs_col) {
+      MPI_Recv((char *)piv_col.data(),count_row*sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_col,0,row_comm,&msgstatus);
+    }
+    if (mycol == rhs_col) {
+      MPI_Bcast((char *)(&ck),sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_row,col_comm);
+      count_row=0;
+
+      for (int i=istart;i<=my_rows-1;i++) {
+        RHS(i,0) = RHS(i,0) - piv_col(count_row) * ck;
+        count_row++;
+      }
+    }
+    MPI_Barrier(MPI_COMM_WORLD);
+  }// end of for (k=0; k<= nrows_matrix-2; k++)
+
+#ifdef GET_TIMING
+  fwdsolvetime = MPI_Wtime() - t1;
+  showtime("Total time in forward solve",&fwdsolvetime);
+#endif
+}
+
+}//namespace Adelus
+
+#endif
diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
index 449f6fe7f20d..4cd8848e3760 100644
--- a/packages/adelus/src/Adelus_perm_mat.hpp
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -56,56 +56,52 @@
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
 
-extern int me;	               // processor id information
-extern int nprocs_row;         // num of procs to which a row is assigned
-extern int nprocs_col;         // num of procs to which a col is assigned
-extern int nrows_matrix;       // number of rows in the matrix
-extern int ncols_matrix;       // number of cols in the matrix
-extern int my_rows;            // num of rows I own
-extern int my_cols;            // num of cols I own
-extern int myrow;
-extern int mycol;
-extern MPI_Comm col_comm;
+//extern int me;	               // processor id information
+//extern int nprocs_row;         // num of procs to which a row is assigned
+//extern int nprocs_col;         // num of procs to which a col is assigned
+//extern int nrows_matrix;       // number of rows in the matrix
+//extern int ncols_matrix;       // number of cols in the matrix
+//extern int my_rows;            // num of rows I own
+//extern int my_cols;            // num of cols I own
+//extern int myrow;
+//extern int mycol;
+//extern MPI_Comm col_comm;
 
 namespace Adelus {
 
-  template<class IDView>
+  template<class PViewType>
   inline 
-  void exchange_pivots(IDView& lpiv_view, IDView& permute) {
-    int j,k; // loop counter
+  void exchange_pivots(PViewType& lpiv_view, PViewType& permute) {
   
     MPI_Status msgstatus;
-  
-    int i,rank_row,k_row,pivot_col;
+    int rank_row,k_row,pivot_col;
 
     //  First gather the permutation vector to processor 0 in row_comm
     if (myrow == 0 || mycol == 0) {
-      for (k=0;k<=nrows_matrix-1;k++) {
+      for (int k=0;k<=nrows_matrix-1;k++) {
         pivot_col = k%nprocs_row;
         k_row = k%nprocs_col;
         rank_row = k_row*nprocs_row;
         if (me == pivot_col) {
-          j=k/nprocs_row;
+          int j=k/nprocs_row;
           MPI_Send(lpiv_view.data()+j,1,MPI_INT,rank_row,0,MPI_COMM_WORLD);
         }
         if (me == rank_row) {
-          i=k/nprocs_col;
+          int i=k/nprocs_col;
           MPI_Recv(permute.data()+i,1,MPI_INT,pivot_col,0,MPI_COMM_WORLD,&msgstatus);
         }
       }
     }
     MPI_Barrier(MPI_COMM_WORLD);
     // Broadcast to the rest of the processors  in row_comm
-    MPI_Bcast(permute,my_rows,MPI_INT,0,row_comm);
+    MPI_Bcast(permute.data(),my_rows,MPI_INT,0,row_comm);
   }// End of function exchange_pivots
   
-  template<class ZDView, class IDView>
+  template<class ZViewType, class PViewType>
   inline
-  void permute_mat(ZDView& ZV, IDView& lpiv_view, IDView& permute) {
-    //NOTE: Currently assuming ZV residing in host memory
-    using value_type  = typename ZDView::value_type;
-    int j, k;  // loop counter
-    int J;     // global column index
+  void permute_mat(ZViewType& ZV, PViewType& lpiv_view, PViewType& permute) {
+    //NOTE: Currently assume that ZV resides in host memory
+    using value_type  = typename ZViewType::value_type;
 
     MPI_Status msgstatus;
   
@@ -126,9 +122,9 @@ namespace Adelus {
     t1 = MPI_Wtime();
 #endif
   
-    for (j=0;j<=my_cols-1;j++) {
-      J=j*nprocs_row+mycol;
-      for (k=J+1;k<=nrows_matrix-1;k++) {
+    for (int j=0;j<=my_cols-1;j++) {
+      int J=j*nprocs_row+mycol; // global column index
+      for (int k=J+1;k<=nrows_matrix-1;k++) {
         k_row=k%nprocs_col;
         if (myrow==k_row)
           pivot_row=permute(k/nprocs_col);
@@ -160,7 +156,7 @@ namespace Adelus {
     showtime("Time to exchange pivot information",&exchpivtime);
     showtime("Time to permute matrix",&permutemattime);    
 #endif
-  }// End of function permute_mat. */
+  }// End of function permute_mat
 
 }//namespace Adelus
 
diff --git a/packages/adelus/src/Adelus_perm_rhs.hpp b/packages/adelus/src/Adelus_perm_rhs.hpp
new file mode 100644
index 000000000000..0eaed240ad72
--- /dev/null
+++ b/packages/adelus/src/Adelus_perm_rhs.hpp
@@ -0,0 +1,127 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#ifndef __ADELUS_PERMRHS_HPP__
+#define __ADELUS_PERMRHS_HPP__
+
+#include <math.h>
+#include <stdio.h>
+#include <stdlib.h>
+#include <mpi.h>
+#include "Adelus_defines.h"
+#include "Adelus_macros.h"
+#include "Adelus_mytime.hpp"
+#include "Kokkos_Core.hpp"
+
+//extern int me;	               // processor id information
+//extern int nprocs_row;         // num of procs to which a row is assigned
+//extern int nprocs_col;         // num of procs to which a col is assigned
+//extern int nrows_matrix;       // number of rows in the matrix
+//extern int ncols_matrix;       // number of cols in the matrix
+//extern int my_rows;            // num of rows I own
+//extern int my_cols;            // num of cols I own
+//extern int my_rhs;             // num of right hand side I own
+//extern int myrow;
+//extern int mycol;
+//extern MPI_Comm col_comm;
+
+namespace Adelus {
+  
+  template<class ZViewType, class PViewType>
+  inline
+  void permute_rhs(ZViewType& RHS, PViewType& permute) {
+    //NOTE: Currently assume that a single RHS resides in host memory
+    using value_type  = typename ZViewType::value_type;
+
+    MPI_Status msgstatus;
+  
+    int pivot_row, k_row, rhs_col;
+    value_type tmpr, tmps;
+
+#ifdef GET_TIMING
+   double permuterhstime,t1;
+
+   t1 = MPI_Wtime();
+#endif
+
+    rhs_col = 0;
+    for (int k=0;k<=nrows_matrix-2;k++) {
+      k_row=k%nprocs_col;
+      if (mycol == rhs_col) {
+        if (myrow==k_row)
+          pivot_row=permute(k/nprocs_col);
+        MPI_Bcast(&pivot_row,1,MPI_INT,k_row,col_comm);
+        if (k != pivot_row) {
+          if (myrow == k_row) {
+            tmps = RHS(k/nprocs_col,0);
+            MPI_Send((char *)(&tmps),sizeof(value_type),MPI_CHAR,pivot_row%nprocs_col,2,col_comm);
+          }
+          if (myrow == pivot_row%nprocs_col) {
+            tmps = RHS(pivot_row/nprocs_col,0);
+            MPI_Send((char *)(&tmps),sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
+          }
+          if (myrow == k_row) {
+            MPI_Recv((char *)(&tmpr),sizeof(value_type),MPI_CHAR,pivot_row%nprocs_col,3,col_comm,&msgstatus);
+            RHS(k/nprocs_col,0) = tmpr;
+          }
+          if (myrow == pivot_row%nprocs_col) {
+            MPI_Recv((char *)(&tmpr),sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
+            RHS(pivot_row/nprocs_col,0)  = tmpr;
+          }
+        }// End of if (k != pivot_row)
+      }
+    }// End of for (k=0;k<=nrows_matrix-2;k++)
+
+#ifdef GET_TIMING
+    permuterhstime = MPI_Wtime()-t1;
+
+    showtime("Time to permute rhs",&permuterhstime);    
+#endif
+  }// End of function permute_rhs
+
+}//namespace Adelus
+
+#endif
diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
index 868cd905dd05..1967ea2a430b 100644
--- a/packages/adelus/src/Adelus_x_factor.hpp
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -67,19 +67,19 @@
 
 namespace Adelus {
 
-template<class ZDView, class IDView>
+template<class ZViewType, class PViewType>
 inline
-void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double *secs)
+void lu_(ZViewType& Z, PViewType& permute, int *matrix_size, int *num_procsr, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
 #endif
 
-  using value_type      = typename ZDView::value_type;
+  using value_type      = typename ZViewType::value_type;
 #ifdef PRINT_STATUS
-  using execution_space = typename ZDView::device_type::execution_space;
+  using execution_space = typename ZViewType::device_type::execution_space;
 #endif
-  using memory_space    = typename ZDView::device_type::memory_space;
+  using memory_space    = typename ZViewType::device_type::memory_space;
 
   double run_secs;              // time (in secs) during which the prog ran
   double tsecs;                 // intermediate storage of timing info
@@ -93,7 +93,7 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double
   ncols_matrix = *matrix_size;
   nprocs_row   = *num_procsr;
 
-  totmem=0;                      // Initialize the total memory used
+  totmem=0;  // Initialize the total memory used
   nprocs_col = nprocs_cube/nprocs_row;
   max_procs = (nprocs_row < nprocs_col) ? nprocs_col : nprocs_row;
 
@@ -120,12 +120,12 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double
   blksz = DEFBLKSZ;
 
 #ifdef PRINT_STATUS
-  printf("Rank %i -- factor_() Begin LU with blksz %d, value_type %s, execution_space %s, memory_space %s\n", me, blksz, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- factor_() Begin LU with blksz %d, myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, blksz, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 
-  // Allocate arrays for factor/solve
-  typedef Kokkos::View<value_type*,  Kokkos::LayoutLeft, memory_space> ViewType1D;
-  typedef Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space> ViewType2D;
+  // Allocate arrays for factor
+  using ViewType1D = Kokkos::View<value_type*,  Kokkos::LayoutLeft, memory_space>;
+  using ViewType2D = Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space>;
 
   totmem += (blksz) * (my_rows) * sizeof(ADELUS_DATA_TYPE);             //col1_view
   totmem += blksz * (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);//row1_view
@@ -137,7 +137,7 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double
   ViewType2D  row1_view ( "row1_view", blksz, my_cols + blksz + nrhs );
   ViewType1D  row2_view ( "row2_view", my_cols + blksz + nrhs );
   ViewType1D  row3_view ( "row3_view", my_cols + blksz + nrhs );
-  IDView      lpiv_view ( "lpiv_view", my_cols );
+  PViewType   lpiv_view ( "lpiv_view", my_cols );
 
   {
   // Factor the system
@@ -153,7 +153,7 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double
   {
     TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: factor"));
 #endif
-    factor(ZV,
+    factor(Z,
            col1_view,
            row1_view,
            row2_view, 
@@ -165,20 +165,20 @@ void lu_(ZDView& ZV, int *matrix_size, int *num_procsr, IDView& permute, double
 
   // Permute the lower triangular matrix
   //NOTE: Currently doing matrix permutation in host memory
-  typename ZDView::HostMirror h_ZV = Kokkos::create_mirror_view( ZV );
-  Kokkos::deep_copy (h_ZV, ZV);
-
 #ifdef ADELUS_HAVE_TIME_MONITOR
   {
     TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: matrix permutation"));
 #endif
-    permute_mat(h_ZV, lpiv_view, permute);
+    typename ZViewType::HostMirror h_Z = Kokkos::create_mirror_view( Z );
+    Kokkos::deep_copy (h_Z, Z);
+  
+    permute_mat(h_Z, lpiv_view, permute);
+
+    Kokkos::deep_copy (Z, h_Z);
 #ifdef ADELUS_HAVE_TIME_MONITOR
   }
 #endif
 
-  Kokkos::deep_copy (ZV, h_ZV);
-
   tsecs = get_seconds(tsecs);
 
   run_secs = (double) tsecs;
diff --git a/packages/adelus/src/Adelus_x_solve.hpp b/packages/adelus/src/Adelus_x_solve.hpp
new file mode 100644
index 000000000000..f87da88a60b3
--- /dev/null
+++ b/packages/adelus/src/Adelus_x_solve.hpp
@@ -0,0 +1,167 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#ifndef __ADELUS_XSOLVE_HPP__
+#define __ADELUS_XSOLVE_HPP__
+
+#include <stdio.h>
+#include <stdlib.h>
+#include <math.h>
+#include "Adelus_defines.h"
+#include "mpi.h"
+#include "Adelus_vars.hpp"
+#include "Adelus_macros.h"
+#include "Adelus_block.h"
+#include "Adelus_perm_rhs.hpp"
+#include "Adelus_forward.hpp"
+#include "Adelus_solve.hpp"
+#include "Adelus_perm1.hpp"
+#include "Adelus_pcomm.hpp"
+#include "Adelus_mytime.hpp"
+#include "Kokkos_Core.hpp"
+
+#ifdef ADELUS_HAVE_TIME_MONITOR
+#include "Teuchos_TimeMonitor.hpp"
+#endif
+
+namespace Adelus {
+
+template<class ZViewType, class PViewType>
+inline
+void solve_(ZViewType& ZRHS, PViewType& permute, int *num_rhs, double *secs)
+{
+#ifdef ADELUS_HAVE_TIME_MONITOR
+  using Teuchos::TimeMonitor;
+#endif
+
+  using value_type      = typename ZViewType::value_type;
+#ifdef PRINT_STATUS
+  using execution_space = typename ZViewType::device_type::execution_space;
+  using memory_space    = typename ZViewType::device_type::memory_space;
+#endif
+
+
+  double run_secs; // time (in secs) during which the prog ran
+  double tsecs;    // intermediate storage of timing info
+
+  // Distribution for the rhs on me
+  nrhs = *num_rhs;
+  my_rhs = nrhs / nprocs_row;
+  if (my_first_col < nrhs % nprocs_row) ++my_rhs;
+
+#ifdef PRINT_STATUS
+  printf("Rank %i -- solve_() Begin FwdSolve+BwdSolve+Perm with blksz %d, myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, blksz, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+#endif
+
+  {
+    tsecs = get_seconds(0.0);
+    
+    //NOTE: Currently doing RHS permute and forward solve in host memory and for a single RHS
+    //TODO: do these in device memory
+    typename ZViewType::HostMirror h_Z = Kokkos::create_mirror_view( ZRHS );
+    Kokkos::deep_copy (h_Z, ZRHS);
+    auto h_RHS = subview(h_Z, Kokkos::ALL(), Kokkos::make_pair(my_cols, my_cols + my_rhs + 6));
+
+#ifdef ADELUS_HAVE_TIME_MONITOR
+    {
+      TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: rhs permutation"));
+#endif
+      // Permute the RHS  
+      permute_rhs(h_RHS, permute);
+#ifdef ADELUS_HAVE_TIME_MONITOR
+    }
+#endif
+
+#ifdef ADELUS_HAVE_TIME_MONITOR
+    {
+      TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: forward solve"));
+#endif
+      //Forward Solve
+      forward(h_Z, h_RHS);
+#ifdef ADELUS_HAVE_TIME_MONITOR
+    }
+#endif
+
+    Kokkos::deep_copy (ZRHS, h_Z);//bring back to device memory
+
+    MPI_Barrier(MPI_COMM_WORLD);
+
+#ifdef ADELUS_HAVE_TIME_MONITOR
+    {
+      TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: backsolve"));
+#endif
+      //TODO: Need to separate Z and RHS in the input argument of back_solve6()
+      back_solve6(ZRHS);
+#ifdef ADELUS_HAVE_TIME_MONITOR
+    }
+#endif
+
+    MPI_Barrier(MPI_COMM_WORLD);
+
+#ifdef ADELUS_HAVE_TIME_MONITOR
+    {
+      TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: permutation"));
+#endif
+      auto RHS = subview(ZRHS, Kokkos::ALL(), Kokkos::make_pair(my_cols, my_cols + my_rhs + 6));
+      perm1_(RHS, &my_rhs);
+#ifdef ADELUS_HAVE_TIME_MONITOR
+    }
+#endif
+
+    MPI_Barrier(MPI_COMM_WORLD);
+
+    tsecs = get_seconds(tsecs);
+
+    run_secs = (double) tsecs;
+  
+    *secs = run_secs;
+    showtime("Total time in Solve",&run_secs);
+  }
+}
+
+}//namespace Adelus
+
+#endif
diff --git a/packages/adelus/src/CMakeLists.txt b/packages/adelus/src/CMakeLists.txt
index c58cc6c1d307..4138fb03a0a0 100644
--- a/packages/adelus/src/CMakeLists.txt
+++ b/packages/adelus/src/CMakeLists.txt
@@ -58,13 +58,16 @@ IF (TPL_ENABLE_MPI)
     Adelus_block.h
     Adelus_distribute.hpp
     Adelus_factor.hpp
+    Adelus_forward.hpp
     Adelus_pcomm.hpp
     Adelus_perm1.hpp
-    Adelus_solve.hpp
     Adelus_perm_mat.hpp
+    Adelus_perm_rhs.hpp
+    Adelus_solve.hpp
     Adelus_vars.hpp
     Adelus_xlu_solve.hpp
     Adelus_x_factor.hpp
+    Adelus_x_solve.hpp
     Adelus.hpp
     BlasWrapper_copy_spec.hpp
     BlasWrapper_copy.hpp

From 075bb2f96bb994c876affe556184609b6c67d990 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Tue, 22 Feb 2022 22:49:36 -0800
Subject: [PATCH 008/130] Remove unused zip file

---
 packages/adelus.zip | Bin 141064 -> 0 bytes
 1 file changed, 0 insertions(+), 0 deletions(-)
 delete mode 100644 packages/adelus.zip

diff --git a/packages/adelus.zip b/packages/adelus.zip
deleted file mode 100644
index 9fe3e8b2aa413bc758fc535a6c8b611289a0396d..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 141064
zcmb5UV~}V;+O1i(ZR?b6>y&NVwr$(CZQHhO+g0bD?r&mxy6>HincR^X`_Enx8L`)s
zk?*_YB!NMo0RAyV8l{!~`SO1)-~c!P`bNf9&W?1-N{|4+fG>~+hkvKD8#DkQh@%$(
zz&{tczXB+KKY;)M`740m5Au2l3;>`60RRB^F99iWArToxk$>uhJwqD&WB!Luvr50s
zAuB@nD;1b0MV8>D8}d~#kCS<L%lbq@YEi<peEeA&wz?GQguqV^Q&Uu%I`zijil2VO
zp!@A~rvKUGq%74860L7XSCFpH9C$s%4Hv#jrpehpeK7pu`epkXPq)*H{;9qLOJ{~Q
zzlz7@MgyRAh4v-Z>m3juur0oorIhJrs4Yj5C78rTzqLTJwe=*#0&|FXNxK62qP+V2
zN(pc;)1GuIe5v8;M@<zs$(Q$tN#pwSXl3l3)i<1=jj(%?ywoyE%8g!!i>(HH_I<I)
z$b?gqpPUeU+XL68&~3|4`_)vqM-?7%bhXrGCRRw^$%prHl8~)lO@gX=+x=zQFKKJf
z-Stm7B0Xmm(t;gWZR3HNZtKY#&=$DI!a}drU|lvh!S&7!8*9|AXn^2;WC!(I`7y;)
zxR#ON-DF;rPG{-EoO#PKoDTOVv_znUdvbI965A!v>%yvuWv~|^-v&y6)YmhDkdYi@
zu}f}FBwTAtgedwM^UaTFG9%&Hs~snD*V-P`fFRS7tRTJeXTO6VaGKE-@JI_)SZ0#r
za>LX$n9zQ>7t)ut6zM+~9%pFzIp}s3R~}I5^@PbWO~*TNCG?pTug+|0vhb+V%=v9K
zzdO*|;4{FmIBxrzSioSS!710cZ1>Ed;OJ%wdG_jQz<xMJP79a#(j!bDAE{y0e=9EG
zotEFuHeDvm<vj%V7$*SNurc-`Ldxp-u&La|{DSEMP9c5k2L3T7Hs?zvSjkkn3-Y7a
zZIFVlAwp2kLJJ>DL7akyRj(mLwaiCUK1FnRP&`q`I)WZhcf_o<3!N6BeA3p_hR8-d
z1p0+(m9|7gt3al&I3``g9`_<##%^pdja&iCLO^$iontOXl~Q8J0wM5apJV<@PMa2W
zisQoYF$o{DZbVoN@A3?SnO9Ez3`RndSPmNxTH}rmM^gWRmdGqf`ODEilpX?7vyoIa
zi18g=cJ8Gu&P&?i5wy&prfDwtq;BewWQ+`B_&7SO{R4I(D?*(=-z`Wu1Jox-ppic6
z(mh|ePFn9+0S%kx;VM8*<(&pA&;rwhy#Ih3+PRRWy^C0jk;I80U=wxJTRa79bL}ij
z5Zut)Ct+&3n70y*u}5k+!IYuYOoqQz@E-aqo!@)1URBs<GOiusSus*>)83smU;d0D
z47Bb@H16%5zJHH`f+0rwj$S94hF$vewEt<J=H9bS=}e}*{u(X;Nf$YBP?zP$=VI`f
z+1oBO@>VO^w{3^}dQbK=w8XcG{#}D_;e)S;(vw0UMR(GBedD5jYq02c;4t$D-|IZq
zm-GkhAE@|0vj+ZOs4#ZZx3;q~{uguRVxaz$75`$+KcHns9sGs=7eRF5000F4yU_nI
zOxMW4+{M^|*3i!G|EAeLi1r^8n$~o8+#IX_qnm4>qUi#NM53^>_KfG;#ZN-QP$Cu*
z8k=gBPoO6@00amIU`~bY`|30c2*V#&VAO7r>;^e?f0=Xh_W^DW?AExhWlLFa0J{^0
z(>a5$L$DdlJ)hT0k6UKo;HWvh&X_+Sd?{^AGPAv~z2H3OEXNO);TK)X4wgrd#vijZ
z2v+1PVtyGs=Zw}zp{`dHEP%x1%s=G<J9o+uzKp5bm*YdriWZ6;A<33cSa6%sU@N4L
z#$_X=xh%6>xqRN;>2a6r`8bcN>j8Ti#5+9PXK0U6VTL<pmJ*jz90iY{jlTD<V;}*^
zSxC=~BgrVz%}$e80KRw^$NF@Qk_X~WFcz$LN1`!IZAjqab2<QL4EN&*WI`OiV$&!I
zV~pkYJ?NAY1Os$y@biB&m*8m#D@?xa7vgkO7<nLp3OJ(@i)uq03zCH3WFX041+gR_
zCA~@01JSfOl4sN<bLfLvYX|1wPoBdG2$H|(T-pnS2Y_KvYRFeTfTZZ~Kb$qEHhwb6
zMkFYM5McxodQR!vlHCiYiVGi$+#;>mh{vk*XCx|%8s7p0e#j;mFP>=%F1r9Y8uQ^I
z)4ph|StD^eL2)-g1G_pYmU?<SD9|R7Kq2S9@!w*|=`-<r4V#+_go-!;#F;8gLZU^X
z7pSxM1)V07lV=uPPD%iEo=?fkjTJ>JL=E1`Nf6%mc3Q+s(7&~Kn#WNC$@vW233ZvY
zh@YG_0Qo#YpnM5mx9;zq9r{?p*K@b!-)Q}o*|Z=;c*0NHmfys}D%!So8L4)8-5^Lk
zL_B{HEn4icjs<XDV)82?^`zVuyM?m1sTOzylbD)xDdqW?D${BHtzF~>N+P|$243jm
zxWxco#E19fDHKU?Tm4eE&am040zC@G4WMn{UDrX(*u}tw%Yfy_|1quO%4`Pg+T9<g
zrO}t`zFyA`ieXsEQ<p&;2po=%gC+*1c8OuM)|z4MRmZDNkK%Z@&Tr<2tKo|;L|jHf
z^SIL05)xLxLxhar>BwDY6TiKKiWx%}TKHnd-7w}{yJ}!XJT-^qWyV&$|Lgq8j$YM>
zy9tJXnGw_54^Ur#g<Cf!)S9e?HOh+~<MsEoj_U8E%$?r|Fm{%Lw`j=rwUZ;T1?RB5
z#I#UB=6wYCw$v2(d1C2nQiSP*Vs#t}ngw>Af$@wQ3(YlL*Orx=O?54y{P>$flHl3R
z{=Js@R3tz1AQOhHK1zspBlxJ$ENP<RpAl)*@YY5;%%T|d!TOqMu!;JQqGkLVpS!8d
z`Z@=H)Xe(E?)u?Pi;n#==T!bY?7h}PLNkmmnibnZxcNpRb)?0=%6Gsdc;=evc6oa3
z<X_I|av1G-*`LUqb-vDInTb#7NM`G@J52`d<+Y5K@NmMt@o^G=OsCTUO%O+h?vTds
z<9Nv<fl@h@FxdCK2JIySK`hHiC4`a`JAxeMQx_T8F_BPR1gH+40mqk$FrWx|ib8x@
zT=^QpaoVcimCZp9f;5Gl^aH0a#EtAlxl;i2vcUE~LSo!)EZLhLwd{)Co-L5Pelujx
zrG?NQYlsPh5sC>Cwq2Pp>rzjyLFvwE`IkUGeM~Z(vri&~IlS}FYl>mxoO~E&PzRz+
z?%3Nojc27hVG_HAM{}1MT}gnw`aBD<sR`QgJ`y9qJD;FStQ&QY$;vCpSEYdRlE8;+
z9FUct{yt9V>!m`~Cn`bnud)0EGIyA+!KwSEmY38OdvjYjWFs1fHH{V-`Ak`}c`-5B
zC%&_$$f=ur@!H;2@8lbM^&XcuO{h5!!OL;K#1h8kcmV9B^L^-AaQj{VTP<Em7iAN}
z?++kWv+cAjYlo&?bhrODi*5C;Y(9s9J~mfgzE^Da-3~$cA6t(OaFI#5G{_a_;V52m
z+l$h)RO(Y#Jurm*!!t`kX7nZ=c;xOax*(X)0VytWTUqgX{K~O}AQZ3UBk0ihHGnKc
zo?p&0U>SNzzwwNA-BM7r<~(%kKBD9<0;$$k+Jq^BP!ycNZdpK&E3z-E9#=7q6+y7;
zj_|qRnS++-q~vS#?BX^Nn(9!OcI4GyG15Tu@w&|1!Kq1?q|=b(g0JU7QHL#SJigS=
zOEXo-?m{8uFNO#-&Zr6WLT0R&=;qffZ(mk^*07y40K$ez`Tf!slG-NON1pwi*n3I`
z^7EDY^zB);GL-tK?Yb;8Hbgd;BWnGqs+IYs?}RVHPZC*v=j%H~$^V`=0*dhxC1fMh
zEo299g^JGlbz$dEL$>h~tuVPDwZz~K8i__$tBU7OjXd7<fMWS(+GZQa82b*gz;vw5
zX@50XCK+%5yJj$PPau>tJD+J-*Ka=U;EVz%O2m8bZKKP}VaN-R0|y^2V|NkABa?@^
zmdvGVwnf7~xC`6hyR;oDdOF8qDXB-Bi+q>kZ{^_z5gqPBSrM!^#!Gkz!hTx-*bBwY
zdQ@Zen*E&$)^@ikhHK&g>TT@9B>Dv#^@a>f>fr-Nb<U``sRekL+E^Lqfwa3PQi1XN
z^Z|(a)SgY=UF50Meq76pv~c0_hrTu}DPp)}f{Of(*^u8>(;R*ZwzrF>F1-p1xbP7r
zXFgQbj@tWAqxudSF-d2_7?=;69k=4z_pC2#OF_S&d0MO$@M1S;qaPUk%NamyM_gX;
zIjHRtzy0_SyZR*d+~xR|zZqUOdz=a@!T6jj5$Gcqc}P*qM=;JGqu*{>2}r#VwKMys
zdk^P>d68`wUX%8_H<WND`&oz82YQN!<6ed0Xh($CYE=r9)9RIM^o$;09Og#FdOHa(
zF%_bTq#N^6sTC&4UW#JE&%Pm`Bp=hVEDi-SdAFVtN91iU0}!@#abdlh)1_M=(tBDn
zDtMor7GwLg-mgk|bwSkBDDETU!BdYljtj}=pI?CCq!Uz96wl5Fqv8?PD-(J75sZ=%
zX(D1HC4zG~T)Ps&BJ(+0gtp8Cjh4TN=LupbkBOg@-d{B^uU|qaj(+E{55}?%5OQx&
zB%Z|306y8@xM26w0u!`%rwbq`ZfUJJAR5V*QKrR%>FPWE{sL5q{L0tMNw$+xTVGV%
zqpwAEL|8dwj*0$GNRKNdPWPUK9L58^eZYjAJe8su21*LM;!qSofkDL@%^!$-^@?Ef
zOj<}Xphy!Dcob|G^zG`-ui(!QEO<vX;Bpha1IT&ldHwOWHPh7Is%p+WOc@vSaDJBV
ztc@IJ*QN$^#4IU=0G}S`M7qJC<^eyJQSFh;T*GS!UR5_`F4AS#_A6oXy*HbjdnBJr
zvbABxYBOUwmH<nHKheB<#o#W>o-t5+Be9Y%Oc~?@uU4md#n9e-RpYSOM}>DPjbNJ9
zdM6DQK}PlR<0eSq^#5aPKjXBGFI1_~Z;l?0(f;M)wCym4Ni)$<Eu6gPD4;d6Q$b*m
zQ+dxrfK_vqjQj{euEQ@@#~p%RaQ$lY>Eh~T8EXTUvW|5VsTPJ=WcEGj?z(k;b{Syw
zo6P_`4+QwW8&J|Hi4Z-%&jS(~t&>UtchkDfXxJ>Jy_w>GF2hcQiEx93Fbx@EOqQVp
z)`f(EUS%N^)R-8F@|GQbp7DB4T;h%R#?GlQiPcCa_*5s(Tp^tb-}_k~lYn(Q=42+7
zf>jKz(2+Av!EZK3YfI6DKW?s0+AzH}pz!!g0<)FBGg|_W@9pUlb2p2VJ+6rWdgwuO
z<Osqei+5v{V7Lb#gR1j+`V33`Svsj`F!*qRMa8Ph1Bfq^!4VCV3?td#P$((ACw-12
zEbGag@lZRLv;k>3HBK!&^Ax&j{nl%Pi2nUR)J^U&da>Ir2ZT+JN3tmP{uznUCu+A8
zQoF4uo8tccPS7AlkB;b+WyU8YZ<XCAp-ALu%zU42Gl$k;*(~fXt^xfcx`TSR8F`4j
z_;t~gf99M!0v{yjqk(vB0x|_B5=NWc&fqZ#Jh6F9?MnS5+d2<Dtse+9+Z3M2%pm;M
zoD}9eEgR%ay*r{+<=0yBamQZg5LwY?iRjC{DWBxW<M2?v76nd%YaGUs1@%>f5(Kch
z9Op92*uXt^m-8c>Y%Ds1cKu@lg}9eb6cedcYM`4Ww{Z}<3)%#&7{?6{m(9%D6fAUm
z+mV&diB*F1C@*CuH2DZlu~Q4xfEQ@7tTWL0+)ru8+SYEv0JZ$Yto`KgZVrL;P-eo-
zP--Kv$KWbI{~|#)uafN#dl&>JY-NyiD^_{T03Oq2ti{5k78N0NTJ#}Dg;3n|DS;#2
zoQKg#`d>yxY~A~1d{}EHz14}Uwd-hWj|$4(t%PfhB3OK!F&fkG<3xS#NYZNg{a^v5
z1!ingc99Sz1V)8@Tzt~MY40~s>VPrZfYDCNXUYcD0TpxQw(o#Hb_DiGvjge-S}32Q
zVQh#sPK8|?8>B<fYzn4~MADbGF`aMkO^WHeQ@i!+UD|=dsRd|me+)|Lw*hHYov{U>
zDR6K`yR$!PN&-~{d`GqGt%lnh`9$vRPGk|v@J0I7$I*4_Xp}qwm9Y}yZ=$maY8XoU
z_fj4?G~jlWelbkbpr?enf#6DWp8~E39bjOs29RiyG-Ru}h~*{nSu{)e01R7P7zjzk
z7$1NG;xP^SHOV>?8?MK})*V?Lj;(@OLzK$U5;Sn^rm51&5BXcN`@aSJ5=Qky)_X{k
zZ_0yU_JS8w8<^}F*yr8v$3MYnKg<MkwLfyJA(l$dZL3S>N-<|JeuVGxvM}t&>~yrZ
z0~F#BT?M}K2Y|N=rN}V47qjx)P6G~HT6G=la~Cf-i}cs@p+ROlOAN?&OQN;v!l|f-
zG}d#xiWT`f%HYx-8Y?jrpG0ZhSH`8{x*}>YZ6sN@dVzKE6d<k*fb_2`5`IWL<mBMj
zgSBPGDW&4drzQOTl_B&3r>MWFbJF<7kDJE>9LMM=RZNy}cE{QHqmQ~cCom8trf<vM
zLkW}Tb&GHKrqLVQo;EFaec7Vq71S1a@-TG)$3LkL5(sMzIf@+$U2!88XxCe<uy#3`
z7NZ8j1NZR-2`D-Q-Q6DwW6JWNk!i5m8u%-*tMn0+eQ;OiLJujlk9D%n`9uLu=Hes8
z`3ViBg<u0Hp_WFHV1o?eaC-A1V&G+7wCSPFq0J#$N9~uG^}(MnV(D!GUe0-EhkjWT
z29aN^e%#GVdF+X-d)de8M`&}6)W|F0HG2(B?zk&u1MI#EmqI9|PZzt5g&os5v9k5l
zwi=H<SdvT5=b*=*v7SP`M-)F+GI!@aw;Zp6?y@UKNJ`dt{3r?w(a6P*HSQr<sxozH
z9B$yZZ8}wLg>kEg@c=4ySf=5r&Z({r$pEo!RR}+-8`10MdqDC%23UG@IDBBQWY=0I
zD3}B_p(y-OjYUBDW~0NvrG>~nF-dO`G>65rqQG?C7N6VRfzfMmhxF{;z@d?+f~j%j
zsgGIQFh{3lr>Eo|<HuA?B?K7-MkKLO-;(8UF2lkjXzrWv@O}3wSX1mbmW1O2icMVP
z`CmU9j6<>R!V*<F$XXyi9WK&xIAM?s`!vEaxukAu`hBt3@f`7b_u+IpaLrd0<_P}R
z^?&+6R)R~p))Z!C=^CGV*Bdww^P`3DFM&Lt+HLQ(tl4{v-8JKTZ|QDxeYOOCp)dSl
zt~oE4IiGiAeB!laTYS%=s8TUfO8Qhe1ldMjWf~Lmz0&%1JFc?sL!`P^z!ZCwj8TU}
zC$I<f{R^VIXStgu@NOX6Zbvh)W_f&1^gG7;vqy2DGa{v~E7$?(S$3e~Ds51LzRHbJ
z!?6o-R+|^ve$LV+2&7a!eB6}f6VbKK9tt&J2CgN2cXirEZ$<X_F};iRm*f!aPHsD2
z^RRe*_AjBErh3a|hG|#rg0)<{)E6#jNPAHFS8rM2DR|M<)Mrl#<~3>$D?%*Z6l<fF
z#~-21k1zu?+~eS4sum$Gqg_DrbUL~#B<$fy@n9<H15PCOXtp<Kw9N7fV{bQgSk*ck
zp}O-@g34wdXvFgdiqKDV3904Eo0h#WC?S>KQ{Y|3UB-z&$Kaw`mDcu2$_{-9pQflo
zv-4kzqE&4Hskm<?kTl4F7w;NkZZ27$>$DK&oc^6KYhZMG5e~zdn{V3~x_V!BNKKXo
zjjRSN!G$t?F%%83%c?p;qR_C3T;7I6qneoSZ4UnRea>z<s>YEQx#rQaLBKw63JtLl
zbWq_cJJo2Dl2W^Kb4Lc?tNdmWZ6D()RLh>lBeaou+?uan7!=^KMc0c29f_Y%6Wd>W
zcaKzhmj}XiN;;MGvw@5u?%f$}lw_}lh2wrbx2V3Pxg4sdV@fMNGN+KznAKM6%C&3j
zD&~6>L-Xe%?ijLKHIsx{DnfgZDM0-o4c7iMFF6sa!m%=N!Lf^yN)@ZKElC|xRx84t
zE<!1~fz6+|jpmr3;x72w)+#4#2`jD~jy`Xln*;UQ=FcQz4Nfh0Jf*%d`1#q+>#wH9
zOk^|K0Z{W^xHyDd&yV({30ZT6f7B(N-*u`lG=6&9JT>o<gVfx5RuO!Fv<~javF{>6
zk0RX`#_3Mi&!{fvD|?{0Z$vqAM;YGqlp@`pPiK_6RwS35n|J7TXt&b0Ey$?UC&NsZ
zpfX2yE2jiOIxjoHw-5+|z_~o0dJ)RpvPCBvF@)4!^Pm$B{xrDL^!1&9?!@S=zep}u
zLuq&I%Q%Tj-%vi(vNnnV{6L0HLCQ8VWSx&<w+LVX3=@<6v6FcJ5>5&UZiBLuhniQ7
z^Befp-c2&~t%TArLWCmAfP_7yE^S>bJejcsLaI&YgF!T7%_sv?UIOf(Q2R(Tt^hf3
z|HmY+3`@z~=L6+obKu?hxY7Xe6~-<1<8#Ls@ZSrM5FV=jL4TVa=+FQFxc__MQAk?f
z(pbve(aDk4$<67%RUM;MtZg&t5q@%X?F~QUB)sRFyenG7nb~Qer5Opd$)p97(nhfL
zOr}~aCVY3(NkAxMu*)MZI#1g@XHvO(L*}bF2<c5AgVUht2T-Lah}0loGNFJ6xMkH)
zBu1Fp=+qkw)`5fI2`8Z-^}#N<q>ws*bnAkQyD)^!-x9%oO{!^>_~-RXkeyk${nnbz
zk>1~a-%RY^W1)u9Fbrsy9C>*_QG;=i&ZjQ(3y{!zKp_cbk#-1EcL{Tdf#LNy&`;wZ
zaQ*e8FAk(nA~|)AcvCJ|Lq9G=GU>8En;~K;HYrFXIint;K!SnqAYl0Nx+pSmLq~~<
z?wMvEaY1@A5<!_>AkmnYAGUG|9Q!s{5yOSszx8ChH{Bc41&haHzo|6bCR*)j3jw`{
z37R2Jh7WG&X_0?wW}uU(e|?xh2fazE5==Iq5xA9EVJSGx5Q<Mx-?7p*1=c$Bh!T3w
zgZ<bbKdB19rX&Y(FFURwkJ(Vv26A`=0A#j$XQ+seXXP~W>1hk-5~?vLW4pJOvn$F<
zqtRxl+g@UcTpL{-+syCD>41hNAHca*a-80_>#-*tiFPxajW_(cSV-@Epnb_S?+Lxi
z*zK2B3#46{a$=#+rLwo3wzdN`zwd6af)t%HsmI)zy$N^zWVu)ndf7KCG^!<rXo3|`
z^DF`sP;aQ?>4B;F2|e_L)SXn4>4C4_8=I0q?Y%k_nI-cv*0F*H+fO)hIJmb3TXUN(
zA3dy@wI`QkQDNV#kO!d%g(&N|<pOj{J#a|kRYqph-2*q+wanLX<DW=Yu&aCcT_hRv
z3_-+IZe0mFavxIWDg(RTm;M+cb^DXAyEkL<BTB=~E?Gwl*eSbDeZn!luw^EB8Ce?Z
z(pFO%;F-oOt@zlSmwDl{e6Yz1(1SA3)geO(V$*3RU6}hOCjg%|<K+P9==zc#<>mZd
z{!qysVZpNUZ3hLqYvbm%AeM3PqYSbMpHuS1#_Kp$AIlbuSnL7$%q&6e=5bciPy0ac
z4KsDJ2qo%Azof6BqPOp;XYtvF*u9_5lD@TmWT`h}&CDjswlK8>fOoO7FkkP>Smq;w
zm9t{R%h}@kE0GkF#_Mr{aBw9NQR7ecZ}%7gYSlRCD@sEA(4KQ0<lgI2S~D4~Kbe#g
zd+#SpjM~sUJ-_c(e7S%xNS7ctI**>Qug-${<No}IwX3#x!C3xUyY+7$6ZK!#{{L?2
zZWU?UO?HItPgR&Kyn;MsS{{_{c_iG*X5nfvx`b|oDq(U#BY6Z;0)hEIJwo0^A(=+5
z*m~ZGAvis+CLvk(2KFuNzy|_lug2B+or`m2Upm_sTk2ud8X^IcNg%r8s66DsH6E8V
zA&OM+Z8v$gC&>6#g^v!pCwdt*%+1aSrt^4M+c(mla?UX@8!l){l>)05n#GYKO}xIZ
z-Ue}y;pgz;$PF6`znpS+F`-Ey``?YOpkarOh$+w+2?BKLsS9x0#?J7$8iJEdEK`O_
zAj?i^01PJDk$XX2v4zqw^h_vd>Wua{f`_w-`-*{&l)B2;BMOfu^g&71<kT2if=O|S
zf@`>wo~wI7goUhYiHp^fAZWwZ?$P(GN;`H07gL;Fp(F%5w(Z*qec>|7qSTQfQwWn<
z^TfkAUPm^TOlnr-lFEZR03w^esl-}W^RDdZpt@DPm)ku^rTU;dMv2qJm4IsB?tL#)
z<*Uy5K7(iA4Y3YVg*r$iNi=IoqZRER6>@%er|ol82cK`3nlm7xJp#3JFem%?dF!6i
z%2!Z!{`PfG8huZXqfeqnMSLjG!(4Dqno|vzzxn#E{c-~d4BRa~MW*4)Z*>#-1OAb(
z6~^G3T9e$Qq3pIgMaSXh*@O)1n{vZ^!nPP~4Iof+N6U*@>b)0Df;}RFMG6UPh()~e
zbz-j`bBV-elqDMDY03iPolnaq4~1>WB{tbH;`+Byy~qp1YR11Rul%rC;F1-RR01ez
zivU66ZUjfvlkw?k$mdJjWMgEL5%1AVij(zx(uBhzBaB7;Zp6FG<;&R7j^@Tr5|Mwb
zeB7$iT-<Uy+Ww5Er0wS;cOwpSI4yqIsf=OFp04KNXtVhx{7x@#0*>?R6mG&Emuub<
zsq{u0=UtjRk@_P})jMBbm*_c;$?}8MH)HkZzOQ7p-vwPk+$8`K2TQA_kVep>w<8KW
zEnwg%6@0n*IPi(?Yttdt5@Xu9>ZbWtS4u_4T-k6N>UvjN(pcMt4;QYYLh9zU@twjt
zQvLJITrDF2@*Y3bUbzf<8EtOQ+e#zR@-pXu=?}Nj1+C`@P}VWV(C+_xgAn##9yGN6
zd#wKdXb&brHZ8>h0RV7=0|4Ovr;NZq0}i@|wl*f_rnF|X<~INBoX$>`kImpm7~TCw
zNqp0DFrR&TUSPhrlMSa3uIqj=j-<!K)=RCEy#0E~7MZP#c-a6aq@J=hHTm<Wo{p7q
z7&dBTN;7!t9v%KBNY>L^0|jYz#d8oF<5nje)=C+8ww_rJr3zcV$d4|$0yfEB1|PM|
zcHd;}lKjP8HY=uwaRv|A7xVtzYy?j$HW+uSP1LL@PWFxj8yg<K-$-z<kpgNC(>id$
zM_q`}$c7HRHIrJ!r7}@FhRGL=EKuvXeSu>I2^yB-(AnRdt+9LRYkdmd)T&)?#~g9=
zO|U8vCb0|qr2Ta!iK7uMzK8IR-<)}X+pcr)e0X{K5G7L7m$@wZhU{wgZ<*dn37n9(
zJ4X!dPeCxuej_Uj?iBi1+!)JRV$a+=y+%jmxM%nWt0x~bcgi8lO|Rapu+P>670;E$
zj_gcu)54J#K!uMdo?6qm0TY49Vzu<Dzi=|DvDzyDK{zy0K0Uq_L46U?cOpK8ot>Xq
zCrn3q)vZ`%bd&Ok12iLT`2y>5_c(_v<%0h=ZfS4f^9O}uJx6(74U~=o8Rfchl$@dR
z5M+v&_c}8pgP^$OSja|WOUdw4*C3bh<WCBr{zifeT%Z!mi^_5ugtd7KENBnToju{y
zOVs-yWY;LP7#GJ6Fs6<`j<Gu~i%vuQ>(13r!ZK<SVlnEl`B;z$x5H`e$tUrQ3{t81
z;r<e=UPY5XznJ*KuX?3tG}fY)8u3PaL`A+Rw>?@ktEp2fpEMqFuBi=i57$&86>j<E
z7|+{iL9<+$^UAn;21EZt@Lf8V>7kPOC1ye{YK%B{;)gp5jo?zhZEgh8aXE2)ig?N4
zW?q+5W`*xy?Dxr?9Ta+;oNx61>8JlIdXpFpkZ<ufhyw@sfB4UZjqQwWjErpz&5a#t
z|LLIrmc@Z~ft|m*cZz^_fQ5O6ac~ZIwTBIZw{v=NadL%Kxtp1tnV}0&*eMrrFXtG}
z(CU}t`2i%%`SFS2rSKqFAgt*pT$>h77_HDHBxz>mAjTiZLNOEs@(MuB^1=zUX9p&U
zorE-VP<sLd_?P4VkskVg#*d)?WmO|v!~gO7KVn1wH4g9(5!DLAldHdeuLc7EK>K$Q
zVOuwM6LTwLRbzwyw*6}5Nt;c2gsw{}v~f~VWJm#7ScJTg>Jppp0OHo^alN8s=^!HI
zgoZ20-fl?=2RxZMJV6Xrep=JN<6IG=Vw?9AXrJ*5!v~5kaPQHK6N4_4fm?SKAq3G|
zK^a9tbi12?-Fp-@ORxbW`uE~G&D3Y$?RO?d$bGCEcjjp1W@R5JHEh7P-J@8xq!=^0
z7A0~rwYQ!n^Zd3|yIM1be2GFGlmcnBN<a-U;Ih?i%?fsojb1G!EQ$&$1x=%tcpi#n
zQd#;iH3-HrErf+~I1Gp{f2iB7pG0*F_aKag4O?D3Ch0m4;v~Ikave&uzGlr62ZWL4
z@3n>{POQG0<rRIWiqJR;3Z;?9Za%&c`YwuK!<-08Ax?w}8!Cljav!NghcgYwNV^hd
zrJ}u1%huTmBxBL{CU{G^jim0mNognMlQQ{|HF^)Sgb9Cfkxwj*b8J+M;p>+oe6<!b
zjMcJ7VDmz#BD@Lb$v8bn(lUe%i;k=(+n%VA`|J372%F<RsUT8~X~B&)8=|wtt9GB?
z*qRXV&aBES$9mBR9IGQp>O|^FBfl<NS)eMyG7e=Osv|~_!3%R+pxOiS9=C6yqF4Rn
zqi*I1(y2YMch--eL2$pqiSe@eM_5W!&Uw~VESX97IfuP48e?Q7Nv_^G>9lHFaJsPp
zT#NM{#1l1KvjS_1VqGgO7lyIG8pla;$nNb}vc5YU4{A%k#kat6emP8NGIXQGb~PV|
zXs)Sg>WIi|ujUh0@&zdf`!ed-Rk|;o6opJ=)eZ{fa{sw7>j;)eCm2-R-e&J%tzH6{
z^_QyYUT`86`j98R*2bmey{us&2<cI{Y7RAj!KV`kcS>6*wMqvJ7mF3R4Ia=QlI`*(
zJMVpTC;zQw()MWJ-n{!b4|@{1-s%?jro-#`a2jA~6QIYOO^3{`;lms))1Rn``Z+g_
z97Q&iMJd+P69pHL>4ru3A>L&H{`KseI!Z{#1I%{RuluhX?LWNJ9ZF?E1Ofoi3HkR{
z`|sW{|BDYdU2AvRzi#|*=80C3wEdgo>%qSBO}jDg9OGQW@zf*`sXrqIZLp>TL`!0C
zSrfyd5m%S-_3kA!)^z9+fw!lQ$Qpgc_;}fNeOkgi^=vf!z|p$w8rqCa*(ChohhN^+
zDt(3Tua~ttN9G+|S&|YTo9l*llkUwx+49FL-e&6VHpNfp)UM?4>D8%Ll||gla&zDX
zou?4Eic4LoOo-GXITV)=<RJUo%J2OWkZ%OpkRa$B6As(W)Z0kWywFUnD~`ne*t+vd
zh3wK%$E-*x|NTyDq3<v4xnrn3)M_yYb+?dp=u%>nbsFsw+;==C5Gjik^5z3mGHS4U
znpnock|Bz~A`xb*NY6`z)lqnUjlcmwdRXlfok7K+wAk5Aa_VXnn)k<vE{-4XHFn%=
zf|V`>i&dDfpzZl0DcV8_z@m_qVE-9$A?pKUt44h3%+M)?7{Fj}Ctp!=8G0rcVV+>K
zADwgF|7qO0?<81*Va-b8Fu59xVs+tJh_czjirY2N)mi;L*BUj;^@@Xn!ru^AOLqxm
z2|IBNdO9N{0t=YXpg9phz@UDZOD}30;+Dhbdc^ad%ZYy1rzi8{pb2$qMlsYD*5
zL)et*rMoB{DCryT4L36vDeom;n$o!rL|rI%4FX{oh8Nnj<s3FTx-xU?(0SSlZ6*S;
z0n@|7kK-lg_q2Le@~bqN5R)fqngo1eD^WBpi#sfsW<op*gSyS%d`UOsYa=(GWD#Hd
zbqH2CB;_Q7?ZdB0&$RQlmZ}zZ*9`1eChPN>-{)y>dL2E}#mzLza(<hRDq4Hp8O|eX
z3R!#0arhljq`*NNeM<D96=t>pOcq|YoXYOukVc5o1qQvx2vFo$x_^8QoP3qPB>i&t
zfTZTgoELF8yxKqO*4wYybbQ)AV^dvEQ=x}EI1OGp%X9nt?P2`AZKdl(s_oEBaiC;t
z*+pE_75113$8^CR8<OT$K<m`uru}-xH(r^|Th&wt%EFWHp+t^Dad6XoC9v#_=-;l4
zpN4B54U6HPsVP{SWujJw!BCR!>vU)&SM@<W-92$|(F-rfw#><Xia|?9j-f{?UUf@b
z2ZsAO*;c5O99&NAg<BW}Wg#rSY|NzD&24>D8dcY`T^ekMEV?kfSgMd@zq4!51QxpV
zkt}s7dKeq%MxE~=09KAz;m0DbhkVRk(_kB(Ef~?$CFGvU5RS{;{7Dfe;eH{LR7^aH
z4#DhjVG^1Auz)=g&7x#`JB@>dc3o@C5G#|BZkcchr?-hDPKJBueAGE6+EbMp7FsxR
zpu6+(PuYO0dM#GC>b_mhJNAkna2(N^&_2}0D+2b*FkK(A+A}~7DTxj#spt%yh1fmJ
z!bPDE4L&tA!75xWN;(;r#9$^{wlct=EFH8>S;@TLsPO#({deTV>FSyDlK}u=lmDIn
zjvQ-!CkJykT}DP-V|!XtbCdsuo#8cQIc%6kIy<OfG%D^UvH281`;CJgG>YN;;cXUn
z6jxZZt!+{gc7KvKFjrU|tw_yr_uSh|4kptc4p-BYtE=IgshzJ|7oXi@qo5$^k$Urb
zo;u!c?;;h)CZ|Vw`+5ZTLL<YIgR_s^=je#y;^=fxH1ZYSi`~gN-%uEs6+5sIB<R5L
zK0SKbI{P1dRya}Y7@se83UC`#P7DFPD0P7o*7lWTxz0dV@)-uUPi5J&@LR|d;$88S
zL{6K$HBe*n1U8);GWhxGoLUEb&IcRa%6p}w8LUm~J3M>-svOo&N>#e-ErRb+nHvUw
zfque#{e8r~v9hx?H90LWK?4N`2@4GmQ4<vx85<oR0eyLUadUNd5z;m&pz50P>PlNP
zs{oePKE$z=mY0~Bnwy-Ro*%%ay}7%wv$eOOqot>*tF5nr10)Z3V`pn`!^hW^mzkTL
zpZ@*%`|<PK#>dFX%FE2n&d<=^SPW_$AdU5mubH@0y7gyp3#blavE6ag$rZF0QN{a>
z0&oikk#Bq3q5`wyiwJq~DvRWgvW|rOrdX4}b%*C-Vs*iqPctR&b+w&T1R&1$kcV)h
zbrP4r{*Z`r#$}>+ocECl%sQ9u>jynzx0;PMt_Yd@a*O;OkBSAoGROuH#|@k*c|U<v
z#GKR5Nuj!n<rjV&L66~+jAxrYNw~rNla1-0H&>|k2pVTiq4O@k<o%S7?0T<qGY?X?
z!5x&FM2A5{x5Iv|=ykaoq=Iv^^7UsuV-P?tb!(*SeBS`KlcooW!{Qf;hGQ?&E-^yc
zc2pmCdR=%k-+R)#52I?X41r=;ch4R!P?ho(YqEh0PlHspkT0rkXM3MI&Xpa!x<K`i
zx++lK;yRy0Z{t{FVPQ9%HZ1ySDHcS*3iEC}(c^=9G?~ku&Km&}jvmoBo6kt`H{*$E
zHxkRm8__4wn`sZ2UFu50xC$=<3=%owBxJVU9!ab}@dGEW1B-x{)50R)D+XHi5(*{;
z=Kk$czNmQ4C&J#YUjf3!b}g^{784blZz|kXqW6A1PuH~`J62rlk^%#p963AYQ*ANf
zhsHrO#nYATAb(@&p#0)gm0K8q?GL4Z@<pBmp3;>Lt?Z&~nFCfHZO-yPMx2|AMS9B<
zM=0q|n^}xkV3`eAubP<;VCebYI1pWYMR^%K$X^`L8$mTrgkuI37sQ3XBKrJZo!GlX
zA$WlT^oUB0^Y_Fk!QlC|bE_xwhMaw>vCYDXEx5F5VFrjDXCb*OylkOetSE<psPR+<
z6)miq+Iqmglbp+>-3e7z>WPWRlIvF-;6-vABCDH`&*`c`4Dqb%D?fF&8ea`wJ<?s`
z1LKw<Z-KjZp0ZkK+MN>1DO7-Ee^*ra?t?0Me^jZGd!iA<|2ATssR7f-$0gEa*I
z^uaLa;HAb+ZP_pf*tMiwW|nM8{R1VZ_3V_%rhj^%!LBvNnyIs}4c_{PTdom<tu7%r
z*}r^vf?O(6BNAQbE}+(~nL=EDnEG`CPu?>2d=*>ir~1qP-Xjn%2V)W<;6(Y++kN&q
zER4-Gvy#eKE(txf`ggJGH}Ne+lhsl^@pb2ICz#yb<q24?&+g>N9kBH%sazADkV@6M
zLHT4I{Pnj_9lwtK@7|^HTxd?D?~LkF=PdG7D11g+VioQj9@@T8xb7T<8lWiAhyh$H
z(@Qvl9#areE1y)gxx>QIn-1YBSL0k;OP#X(L>*w!PlWwRf>m!*gRJuG7zKm4j{wOX
zPA<Ghu*?Wb8H(*gOeyMG17<%OdrW*?&4jNDAp`;7ZPsp=MNHiKW3uVBacPR6q_-i)
zXRDOE%w~uXlq*4Te({lGGU+S>e3>grXYTbS(Fgh;W&g1tlt)}OL799#pr?}T^Ix<s
zw);^5xO2Rlc7H@egEGX);pg_$h_$<ZF!*8#y}y;esWKn%8Rm_iO$8ozakBWlRV>y>
zP-V|e**}gX-Q=GN3e-&k!>B*<1#Nlgi(fa_#hYq4ke838V{x`*8e!xASj~6Hxj!JE
z6;Gl?qGE%u5~OP*DvHk=a^~ujNqP|$q>U5^-njI`kYqj6IxiG_YX<<`84eEJw^4_V
zwhjpciGNR}p}Euelkf{mMaZ?9=0dZOL|9fYjT0h`LvYT9!_1(YP~a9lV*N>R#^`U1
zQP{`fn9a<ELs7rOC|r|h;N+%G%o@anPX#%3kV^(nMASp^3#|cF>c&(EkRRZGkNDaa
zwq&@O3KxD!BT}))iYMk+zZg?}lKMi802k*ISQB5cg@FmG0$VOJ-HrgUUrxTyEOjV1
zwc`8JppuQ0V`9;n_enBC+nCHC4SP(b)UYO}`SZIlfTvwy(BPp|1|=eXCc1ww;oFhC
zxg?qmzeWdRoo%hg;gHC;#Ctqu<a9W<$NQHPYqef}@KpP1{gEEuk9J|ZZxa`0KZ~Y8
zmZ;DYPsCP+Q++S{WDYWIS6rdrMU%{lqp5$0wPK^A3BXisB8yo2<>VwYd({$xbKO8+
z$Y6m;4TFoCWUily_jr6A8X??9($aPsI%SnxuTeyQsQF3r2Czl7(+TLw1lM<7+bT#T
z4=r(@K#gh5vJh!#OF+Lgn64PgnChK@Xg7+_rleh|(yv*!rCpS|3siNCj>85bvM|{D
zANttY7j=oOXP?`-Vuk+5w6i4p&+snbuKaZ4Yj!ZxJw!ZOKA-GXo`TC)`A&6BG4b1X
zpc9XKnc7$t#WH8#lO%1*N*ko)y<BPyXoB?+@)lNf`-AM@bfe5N=`8{fel%aLr*`sp
z-NLmP)sx?u!TPk09ZNwo47aoyX-~9UNv(XOjZeOMa&z^HvpkWtyjuGxOLi`LySg{>
zC_2@VKy5m-){Ps^E$2qek?rlGO0Su|WhukL8DmQgAjLN~;iI4#?bs(>Pjy~gPYf&j
znU}9W*U<?Zn%Lw0Z0=N{+A(~|zYklYIrru56mHs<SjITY5gGi14s9MnJ1oo5I&w$-
z9ke`2`RH%I^UIU0-#wpocg22O@NhUjP|`ZJ5w>CQe2}fvp?p{Q#j|SB=})*i?qmF=
zdtvz`P<XzdTJd;k7MN{R<yXB~>JRXi7bS(Lt_8i4x$T}l8EobYCGsGIw&)DP)QIXb
zyT93qE`TnDDhVa`X>dNt#9I~#_hTA6cTB#09xd0>a_ubWN(p_P64W2m&*Ic`v8S!j
zOOxm1iVEbSGWe0I(PrOL(F1?XH5%<;GBAB2(bzU(cgb>h|CXLPy(Xtp_ue-xt3ZyF
z<dW(tQM@;iNqW@32u;Pt5yuh@^ilmHRVavq9yuC+>b<`(JNcD9<mncaEm|0ME;?r<
z`VKos&b|wUdEdH%x-FZPUv}pArF)8EJ{jT{6X?S2AWd3!QR}^0KF7G<0Xr60L{j^#
zf^~F!DxSK>^7ds4l9dQ!{+3HvEw*ND$0gPkUG&A~&oaLHW(W4Ho|gM#+FlV;SEUag
zc&1N^-}LS%spK~{pd^l!xa&Xi_Y`+x=PjEJ>&~`&)}OOi^M>$858F|5{U(}!im<hC
zcY~;>0^^a$OkV;=F-Mno6^ZFj@^v})aH(w%$Y}PC%5T@T{7eFM5#0$|;$FU8)2XZd
zZsc-)a1YGY@(!HxOm68M9|$CW@{E@WpsaZ-umuvf{ir5#L6rK{zxw3_c7<Z~;xYML
zDgb7%sZ43UPuV)S1qod>2>lia2yDWf48zjo@`j|t2;^WNx98Q#o;LaSUa`?{P6gb#
zW|nWiK1z9%7m9uBLc9?d@<A^mlRPh`E4ig#M>GGBmRrMq;RcOBwE$pYk4eybf*I5p
zH#LiAl@Z~&69u>r?kEPUy1b{u3tM#r*A@qZ1FcIh0w-7dw__u=?`pw&NCV80A|~B*
zI18?(j!c$_wodg&r;1`o#l}}T8zts3wCDZCqr2``oVP%>Joc%fz^q(gY+T@7o<%|0
zl+}h^6rv#~jZxs!V_KwsZL2S8$C?JxUzsQFWT1IO4D&b3<mKn0mzdhJ!3$GlHa=lK
z9_+;}q_D)4&<C_U_>35(n#0l5$Bicg;iQShM6*Njo<+38OpT*lb(?XNw{q-3%z9p;
zbC@`YE*2=r*k_^tX;HTWhoGban;IW!v+`G3Hmfu~#FAXMe5;-ys#3b!YRNqJt~vPL
zE*#U*v@C5%zMp#nMlMk#TJ;I#jWjw)mK^v!{HeY%womevcpu~YJA!qIoM@Vs_nJvM
z<odi-_c5j9`MIS&jYG3|^;b?ezG?1cGAlsFAn9J01mUXwQhu(?RGY)6VYFmo?N%as
z4H4C+RXR3~sf41vx|WrV;`R&oQgClg`yV94pT1+t`IL+2BUPf!flS&8Bk|g?Yhlnh
z%ZJ6=8>E1a`hkbtJ6Pndt;DJxBv$t2DGq@}#x5f3DqXC&!2&d6WlwddV_ov#<WFXW
z^-73NH}m#b9%F^=cw<>f@!lCbGpBi^7xOi7K$P}hNs;}E0qF}!U6TvgiA*eN%*sOk
z{?s+sZwvy!I^;@Hrh@aa-s=kNDhB)Gam?~HxT%N&;SpeZ<*C|iJ)TcAcdP0jXNz5Y
zWjGu;0Jp208fj3q+L>8Ata?uB1NG6K{(3u_6S}4j{+qWw6{RQA`TXv;hsF`aki9=%
zFA^qsq@U^5IxCj5PnOG{Fo~4sOZj+kp(X|sG~)LCQ6T+aH#Go6K!Na|pt$k3!KZ_t
zLDpy12RVl%_H1aFR-D$YB;z(F_hYAXW})_fC?i^5B#l_~>uAvEU@EKZlnLfkH|S1+
zeGhbDKrfTN?5WJVsD1Jynevs})R6VfGL5Hf^e1v?%QPr+)h~2(H=;ESV5oNrrd<6$
zJCr5Pw%#v9Ff~n(GzTYH$tJ(7CsTZn^^#MAZy$kg0pzd1z&-f`J0Cb3phUAFHn+Ph
zsp5ZpDWMsNl7~Bzi+7TbuaaLr#a+XbQFKh$i}pAX?E-1r#<91uAVUWG$3*NlaoY?L
zqeLQ>3pJNdwOQiSSs-e$bgHnrE3tYjBRYN=4vbtpg)AA1Y8@%g(g~{E5LhnF!D`#F
zu^4S)cVt3t@787@m9sPWTMhI_5|Nl)Tu|L!WKLbUXrJ{PJRfSapuw)hi<NV_JZE#i
zWn~{NbcUFfpA7RH`FDg!HN7OuqRt4M!@p2=kwWyG$!2_JurWJF&9fYNINw5AQiM`A
zNA|~&%W(>_fX#E_&3|xRXrSeK<P(~)b|I-LP10!a>M9PBZxBoaqK;LhPFtLfR~?Qf
zdGj~0%^|T)>9hDOS}t(|`2LZ#%jF!-r}%yGLH0h<-pQ%FMMjfLW+`6>S1>Qrv;wd<
z-Y;)0u4c?zw4bqjRK5zKX7RvN=7J*4a^N>^$2`+x{_tR)BHH(bFx~mt^Q(cSYh=15
zXjxexPFIo+2{kWuhaL~a`C4zXGY}1j`t4hrrLBdKtfL~T@B}rQp=#G(TWS6{XG1FA
zovg>Wzoi5LCh#}$4v_@{^BjepHyw^nzx<<Kq?g0o)^iqkW_1Szv^<QBx}jAL2(!cj
zL2-k|=F{G1@{)J*nAt#!PB3c&buT@Kn4aq7fx;y-f6!yki(9#<a#J=$;VLicb{kaL
zE}q2?b~H(>O=mZM%NU!EF`-F8zuWrtECQ~W-DEO^!(9z7750xreIxS*Y-oyqVo5kf
z$sx+t{dno2OYb3eo@HV;^6~a~j`pnhrogoM^%XE{_pO%@$O-bL!9z7!(<NHvMatZ5
z*t7YXn#F;zt97Gm8H33qo=d{WQW*fkqOFEnd^Hg~?yR{7iFZE!6=$)b#}Uf3Y~oWE
zJ3>^19O{P4*I*8b{2JGH4HG{TY}>P}QYUZ+U2dJMep$8!h7M%e;MwyNkVPOWxK4fA
z{*$+I(`93&MT1IEDWU~e9-;_9Sc>f>EFj}DTyY}o__QdgVF;mlQ?<J?uEK}4+TeHc
z-VfwvOY^4yy>({zEr5>!w)7x?a5wS0{vLP(onmdVots#)S)CyUXoa93UWX?t_$O*7
zhlpnd64)=e51|n7(bsbFVbLGLtI5OJuY$z&tz}5nD>^d4ZxrGgegdCO*g}-h#rZ+9
zpzrD+>Cm%zg@SmR;GA=ex2jtR=8{G(WXup8rFhxaF}#9h>>zx&{a6@e>eeG%7`k~W
zCq5YPkv^d~!yXSgT)Wk!>_MhtC4*u}&5fGmGJS^wNU~3cm%{s`E1!wAaPy}%nH6Dx
zj)?s*PWnpLXTJ?&vo6J=U5zRoM$?2#vjkzti70`nJASgKkP?oHi{XM$jP|%{m&Aif
z=PX}DB#uQ;NhZd)^H{SBz+m-^HN^gSN|E4ng1)KKHB6g%bF`x<s_nEKTb^uug>Xx;
zvgVy8<B6_@)uXb<$lW4I879EhFS<^S*!U6rI1aj+^zYBTw84xZ{cDQP^WCO9@gc#N
z-4rb`<kvwjzR|Ya1GfZ)w2|G6CbjISwG*sQFxz|5@4@!NiPsOX$L4BDTa*&46n#M6
z^IsCzTv<Z}gOb2Q&DYgtz40D{`Q?<rPeI67#&uuLAUwMp%fed@3GGKly<MWK?F2my
z&VD|f++2X_8n)W{@*3~bp*y-~=l)eV1~4kya4M|fs((adZojpAJ~}&)x;bIgz4@z4
z9B5*F)khrEtPeFFt+Y!D(sjeH$(XfnH*^Qx>vf>jxcD@R-Ly<2bZk{MH2JK|qP4Ln
zbv+O3q^7#>=WR&m@=i#*fkO97&gVtBjkLoJpE*4YnSF)yoWh}-+JSd)4mDEm(v#E(
zKLr1Ds(iIFm&uIy8fR5j_Sv2+-`mEZYx2eDTRde#s$XAGMUtjQcKl3#{DCCuMWk=|
z^(E)K-|C&-Xq^e&%*DD@XPI2OYj3V;&$MMuvU7!{-bz%Vj6tfPv0mT43#o<4oUjHe
z6w=}45_;fT_?2m(;zE8*ENjHeGd$OF+Uk-SsH0`yM?;#CSePjR`>6{r+ofpZ2%N4&
zWrS5ry^1_zL3IUN(`@{46UrCU5EiZ6Y@HfGr*8(|AOI|G>e)6ps4?;QL{$cN?D5p^
z|0SW@IyjSXTOe^c?-yi?e9Z~(-N|&#%$-_B)1l3U%~0#wrPqd%(fw`;`g87Y_-60f
zQ0)OOyi~PHMZ;T`zO8!7=H|0y^HdivjD8Dx9X8Et$IClT$en%iGYHFD!E;s2Z9YNC
z<!#%B{otw+`q@O#`VM`q&viOc{=g6BjsK=^diW_2y`wQOVgB<lfSoM;QEylRZ<;pm
z_|VnpJcL;~|EoDZR(&dlLKKJwjZM6|?&62uNp!7NXlZfSn}g2YT_(sQgKb2ar-XjN
zHpnJ-PfJWgIAbq%Co*^UWM&sv7X>C(XYG310iM%4Ei*W$)JT^qMq55iS7|N=`sk}2
z0Ct7obU<|;mjYZeWHzW0m<g#`<cIEM&N(}j2?y+ZT+}eerFGwWa9333TgHX_$(Cqj
z4>K?RAn|<SV!fpLe-U;LLBc3ebe@@iY}>YN+qP}nwr$(CZQHiZyezUvs*)_a7hQMV
z)qT!)&rP7MpwWm>cuA)r7^{IDN(JwnRh9SieW9=R5n!{OKD$4M^;iWH&Ghk&7h%ht
z-3`W)?)~potiVASm173J4tydle)@tuw%f0{mJ!#c<TD#X&Ur=;Wh=R)3GD{uG2WZf
zClmx1gFc@aJ!lksa-`eeT>U<*ysZcSFzvMHr;vWutc^qE0UV%V445&gXsyP7vlyPk
zKK347rehZO#|G*57k@*z9X*Llt43C@R=c`-W*2yFkL72aiV1_$gnN&l<x@yX<7`@E
zzEMeg{kBIweRx|yg$?>$U<r?bMF4M-WG)6RE=eR+()e~diO@6-g9`UjFYiSDNr(JO
z0f;f|@4rA9L&E?wc)^+>$GO?b)v2p2ehdPwy4E@lr~DT+xUZ1Ic<{k6G7^V+e&XPi
zLi2J9?X=ay6O{(0iu5smAaz{&yK>z}{(b5kCE7~*SG9zI!6o_!+8=*z4Evc_W1>es
zEFlmUgIi8B8TXM#E=^O5Vfpl=huq78_lp)XqX+u!$A93+a{mVt!X*ffk(@B&#|oCn
z9{mdjSr^+%_$!CZifJ{}ysMXI3wu)0-1gJc_hE-Js$YMv{s$GZ7MR;drw2ufxUK_5
zkYb<%=kuaRZmrS#t4EIgaEg#7-G;yH8FXv|`r%AWmi#=HCdWsM0l~|1)B7XZw91V{
zG@YA_F4ft$g{Ft#DT^s4RYHUzG1u9jOpJzWp8FlF-bf^})o4f+;@5~TJeeQmKv{FY
z!e@F>si#24r1A;|-gsP}5t&pGR^w;9QG0D5<;AF~KJw5ZMQUuYv7uhZiSSKNm2A2C
zG4MoHU-eCvb*N(j+UBb0fgp^q$GLZb%&z@QgV3Aw#mn2&D5x!5%uQQpw?J4X;CtXU
zSZAZb1dV=32T>k+Bm&k{s<~@3GSq(3YE?{jGD$@hdo*AX&PwU}{i^TU6`DWjjJ1g|
z`c)L{m_|}-cqXw%Ic{2isQ}gZSoC8?pp%(kY%zmszx6Y>75R#l5G43H&wIB++2(Uc
zv?&`2ZM%#1!wP#c2@Hm+Gj#XT*{OF)kkh3G##IBKT57oRW726D3$w+DQUZSF%pkjL
zigU104}TbMb8HRok@?Qf>CIfvmeI2C+j1S?^bPmLbD{i7P0+4nr`%>BEGU@Jc4p4-
zgg-P#GwPyRZ{FS@#~9(zH8E>l(Qx%L`%gCm#9SkPtHC<MB_nfqzc8;S{OS0qYw;RN
zdIWtWs<KlpFO83xr$pIWdL@|V3EGPY7kDk$=Ug9#RMa=n3MkO`mTJ_}f6K;-Ch$r?
zFLA%;XaDo4>q9dbaUua~I^M0NO>Wxa2}){fYTMNFq-Mchps03lf|qx#{E$N^0Y|;R
z@m#nFzYDyRmgdZ!u0Pzk52aps+ZEfm<ozvjJB8Po*KR4_=74Cf@*Ps=zka%Yyut0k
zDmh}5L;RwN=`^2|MS2?K0ycVvxBq+@7m~!`vl^@2!mSMUfQxcE6Sz-0vJ~OstqQ#@
z<<ph+Qv8e{C3-4NG&wVTbf$k0-~}FBq%_IGI3pK?UU|^3WtR^~yfDBWwb^|G(DX-k
z%fYGHR|iqEJ~(c!kEg#mPG!;?UuYtQbv_2nh0w>p^@W$Ec4PEh>AO<(<;X=-R-#Rm
zKOqefFzSfe5@PG$CdW2`F@FCxq`X&9zZdWn1WuoO7<&kl4Pb56^djHJoAVhbXKxP}
zq|H)JZuE9Yix_F8C1Ld@exLtqs$ej~pOZ{^JR<@Tb)2pLosWNua9J?lXC_fvp!k!_
zhji@TSp-k<GP&GMqCFph=DD)q>1+8|#pKQ~`?MxzD+@E$SJ%xiwk2M(i8Od&i$A-O
z9hu23yaZDSm62+NY@YGGWX%Jy!(<(<iC|N!Gz^P@Q5!Mq;=TK|I7~BpJWAKUjQYM0
z6qlGBcnD_mUL0;XS!8xQQs_hrQ6@TJ3=BfTzl$nl8%Al|J0U}2qKni>p*(H@B~v;;
zBf&GGLasS3+posIc&UVhi}$kJ_YE3O)yfFH%h}wq2RWNLkm?{$*e1NhtKfrp6Jt9z
zU3};04%Y**90WDXZ~Zo*%(&y_^(dr3^Uwf!^r`y6*QOMd%sqKZ)ET2YDJmaT7G+Lg
zxSP<)SPBkBd$K5Th`P0|xy5inKc<1{2=Tu87E499<I<(f^Eg?n^rTtLNNFus;E<AW
zxyRq3$PK*p)5UGl@tGm*;<49QmiONIQFU2iqcEZ)IdVR2R(SnaegS@3>7Wrel^Z1j
zb>cI>@AxbCPZ>!DjLi1K+n$*We{&0o*T~6IQ_%Cr8{F(GEavXnA#8nZL{?M;f6@>o
z3q#M<_E6|l7}9=P70^fVF#B;M`}!j`e<3zH2hXf$K+aI`Ac{9G9gCAwucv2R?2}43
z^r{+(H<6r8drI7ZDdr(4P5`hR!eV@6I9$?(<CFMUD2BB?iQuvau@u@~^=!F?{}q-t
zwo8_V^oovc%3PV$S%UnZVI9wObcI3Pmq=6I@T|qhy)?(tQ4g>r&Z|7hjyswf$G!zm
zS{?yvEHAc0#9x7VYbX1fTJ8RIFDAJd!WjxIee;yRvWB(W&%}T;QM-epcd2KaxaGH!
zdiNyq*~V4eX5gGO()&^jZ&XsqRu<PNwoX<GzlU#T_>TliUfZgrH;xo=Pr8gTn@Wz?
z&YNuW>>%8GNmxwc%1t>q_V74~1Vo&ILS3(SiqQlN7Tk>ed$1o2Jj$cP#XJ4>yV?sp
zKfvk@j<@kN{bPz!$^w*(@h{R4gEbYd;D$`+#Ev(G*S(7bT9xo%%s+vZm&s?aVxsK2
zd%OlDj_E?VvQt!3v{B2fH=~ZLpO4jso}Nv>nR7!VH{Ys&=DA&(c*Nt2KdS;=wm4Ic
z?i#?%;e!7Bcwi<^^KevatoIF-Tz1bB#$mMo?t*Ms47E{usH=smUQel{$Jz7C;0M(u
z+t<AJB~E{p@Wz36P`OJ~=bpEvBih8502Pv(64L_V>L*w2&^JbZz9{oxmzLZKiwt{G
zP1+XJZ5Q_*uMwuT!(HQM@8`=-^^-!ArI*N7SSZ3vuL+${YD6-Zp=~3WgU(b%zFZ)c
zcr43qB%i{L>4mvhHVx%&#A3X;#j*IUK%=%I-ng?5;+n2Km0Qv#T)IgW&9|1(TT_I%
zG!}=NFjXb47W2KTiI>QtobfN8jZvXaB!@TaOJyq0;jh~N5H-uogi@<z8}nfEF!;rb
z6c6whc#OFe_d~rEhC~!1*5dic{IEk(8CQUZ5y;bTSp-87H-6d^|DWlNxl<s7hL3Bf
z)!7JFe<G!wBc{1p_`jV!RTZ9V32)n_G{HnwK`dO_C%%8y4$!pY5c<b>xEaq?A339*
zeZ7{ch2($h+f@`xc*l~ItGK2Nqt=d$SDc|_gZehC%i}D8S3pEi7v0CH8woAN%j(2`
z;?qF=?cVRS=V7FNa3;`=&GEZeKh!2S;x-c%4_XQ;<o5j|?~xk&iGqt@Y4;!@ykJp8
zthrW$Cg^NQ+XQh)iH!D;qz2L>WV~3f%sbhRtHuBM2lyJEC~*Bc=#f<<`6-u~^icV9
zs3WwnO}=yk?H6n$N6Fq60dP$SrS{QVEz+aKm~<gn-kzY;OUx%*scBGuv0VDKWaSHQ
zI|S~mfs_Lp-dxG6l<kDe(~xYQEqcu7q>vln%k!;!4Uxr^snbp`@bHb3y$#FD&vpF~
z(+jRM|1@V_*<oC?P}IR5Aw+T5%JsAMl^c9H&4Gf!C1_<g>f3>4um)MX0(@jfUD;w|
zM_6&#5V4d`W2z6Bn)s*SxsuC%8cHfWnaJ-qUA{T4t~5+`ukNlQ6u$e2U@M~Yp8cN1
zQP3?Ew=<E3w<03DBU>m~c4(uX1`j^S7?X9V3>Z<89gwJ*!7wr7C6|6fR0wJY@AeH*
z9ujCS0z#trX+u?JPYkh~6*1>0Gs%MkI0&Tz<c5OUKobw8Vgv*onsrlW7Z(WY#Shjf
zdb)hGQEr2>Wa)CL;vq;sq^Lx?h$R$*>HZb5VTNGjX8ifmnxR%~X_TJjVG0eMdZs34
z7L~$fNx{&@Szp9dIKYvE%e=NpbYx0lXFz(NR>b3!reU3y+9Uzzx;=Scbrjy#vWnGe
zl+yYf`Arro6HcuaoF-WurJRdoY(Mg<s59)4?l{mQd0uJVluYjwLdT;#mMuRTdZ8dE
zhyZy<z^jH8C<|&B%4=@;=x+RD<x|w(7=qF$*UC&-<DgjESmNYp(&c!<;E1B(I1kBA
z*~)HN>%dCzRhr@D8SIz`!h;tjvSLdt#W_u4NQ(NtgsOj+Z7uT*mE&2?^DU}Xn5<NY
z!MXh2Wj}`by^h9H%mS977}-VS|Jn2#Bi&~^p(~5A4h8;e;-HcHot_Q}w8e70u&Z|O
z?9*1<v8#KUJB#^)91RW~H*xp%a!@lrtSq`oz)eY@&BvnTDH9U7A(&P|$HQKfd4MY+
zd%M!n5&z&5cJocl=#==^D=kRSEi<C$!ZC>zR1`J%o|h%3iL6&#Y}6Wvw-nUU9aQFv
z!sCSslJ~%7&A|Ri+PauU>+}?b)y3Y*rmVFk?zVYv*5SZgd7Pw{o&b(#&#U`V8XeY8
z=(aRYjB`)MvlrC!ov=3wN`#zy^t#Kq^GBx<+-*^qk}{zp75w%DUUz2u+Gt`{YQl$B
zIG%J9WG7PHw?Q$f5plk*Gf5h%L}Ixuy3~g%Jpya}2wXKT0$D(LHZ&lfkhc6-K&hy3
zF7wp*q4+CaJJ}WPM?FPEM``rQ@7G$?=joF+DSnSCE99=010XVSQsC6e5bzH-z$@OX
zz&Y8wHjQ7kFN)5kR5#V*TO%{8nlcz3h3gK+&?=zVRxSTNQ4eCP2Fbq}Sin938QF_j
zoBYd~O%GyE`mZ!pkuC)qfF`fTecL5QNQLfR8MShZ>bWP(aP7HqjT!MiaeM_;7Ht7;
z#80uDV>_-}*B@R#6;WJ)H4ogFHuI{@0Wr;WNRRfUOC*yCiPKJ=7{ycV@q%6GzP>}G
zK+qppAty6)^w<-K%m5ZkkbiqzCb2>=a@(dz#Th9`7wK*ZId+ZZG1vtxMMiTl^yq|Q
zL_xt4ti&n<L)B}YllLVKIW?A?!VO0QLO64&N7gY2cT1b;#VyM`liT~rGqnfO)QSqQ
zDlkbG?Ut%T`hKbs5=YE?$32fw0be_~2f-|XVtPz(BeF5NCLd7*7y5o&bDX^pdVI@>
zQS^img^}-)5Ll711d}Pl;@fhgku<Mm^%_Mcy!TER<K?`^GS1p&LO%P*y-o7niihg1
zO?RtRZp)osYxXzstQKfyz-Nn($;Pbk2F>$EjrWF4<HjxgHLT=y?8}vU6V|#Rw(Jwf
zy%%S$i3>a)NBBGz4GyQcImg&Ar|y}H!keq2k*gvhr}<p=Gi;WvStr_1NBUFe&ZkSg
zscSt!C;OcCHmo+Td57C@$NO^!sCP$jV~23uw!zxco0@vz|Af-Eu5)`O$pHYW|6Az)
z7bxxjN2JyKPa@5~jnuvzuta{0LfIa&xp_p=f<m{r1SC)^U>_N-7J=A3kSiGYEq?!2
zK6@W_Aj<0X_bw-ABV%Wb#|d|q%_+ApEU&vTyFC42A0`#c*4QprkLjnG&CQj`l^MxQ
zt%2F4+3mA#yw=p#*1}SBRPI&pDQ_<S4;zBGaThp|10y1tpD<zEZu|SMolOE@`?*EF
z&CoaJ+!Qa@co^pIKjU~9dBb{@>mH7MYqkUJ#`7i-a|s9eJ%f<538%|?cnS0=I|b4u
zk_=MYtCa`yRBAf~BoTC#iu?2W-pNayZso9IXGt?JU<WEO&yQbUo*o@2BqTUAWQd5c
zsL;sp2!8xMc)0jDdAa#Hdb;{LTU!|yGf7WgU0GXEQ&m?%LnWqW;K1tY5(_gcQ%iGe
zlZ&&f)64Vg6AbhZ7A7t_Hbzbwv9#38^z0N3H7!+5b#0X`JWFeftIO-_4;D5qR!(+q
zmX5ZrR>GL=u8};sm<>dc_jKiodcr(_+r1*WT0V0FbrRp2Wk*AD@-kfi4|A|kJ#`0V
z=m)82O(k_H2$}IlR+W10Mhek|P}VJ_2y~GbY?r4{9PGCwKB}IO$?`DN)K3oHtzRX7
z#qKXrZ9cAAd9m;t;ptFYdnlBO&KrK<!6v}HDzbrNAzGS>AI+}KB5bDaHnY^3cn9au
z>5D_rKxIfHgljXm;)(C;m~%$IPkBz>&hS2Pz_DX1F44Cdh}k?E>Ldz>YYZ3KCBy=(
zRSYRO;AnUFw{<O*_PX5sQhZ`<q7as2^G<7X#Om>n1)UFNmY^}4!@0r?g3X#N7YV}V
zL|j($dgEMCJBcTlv}M)9lr&JOs$lZU+oYfb6X8I|$yb{2OU&%JsjGhka$T)K{H@v(
zoW7Ie9%Nj$WfoH0fyBCc#{AF#FA?ZM31My^e=8emHwxRCR8=A6&gC19X|wD*4pIbq
zKyZwV8h`fo#f*LdtqdbTY14U1en7>%G=aF_$&FcwQbZPbk4$6;-9qi$4&Cj??TGx-
z(-U?aN^FGM?m~HV#hrok+3}F8i%Ira?uB+qes~D@$sUV6#kX0K358N7Xw8Rl|A9~H
z)R`$M=4IYrxS<7_3NubxI2{l!Y|hMLTeLQwi;{Q3Xw~Oms+l8L#BA(n&v1INrBP#z
zDT+H{B82b~kQ}rvYzXD$_}c1)DkG%j>GU2Yz7L6QdUBqd0UOotqwmq&T}@|}hO$+Q
zg*GE4eTuHbx282z2#8jRG5qhqyOs4y)oSIdc6s#!k_rKc1J;bY@XWR4p`phxOse;o
zYuBuqYg#s56QkXW`|T-QpS}Zl0j(+}jo*-zeSexM`DUsLjvZ?d*K`sH7bZJHi4Nb@
z2dfS{n~(<A$0*5lCG4yaJE$bLaE75tV)Nt@J$5(OPYUp9<Y=8Ww-~E8T^%H*GH0&o
zi=|b~m7=5BhWayGw~WRW94;gUDe{c%4a@DmwN9Dx8EYHnEr;zH?B(pEy0qM0>8DbW
zxPwphi=k*Cnjc7Lb~AqHCpr+|iD|k+qT(Fb^dcC^`&Vu;XI3Ek$AMJC#JU{QE!JA}
zZdnGceOG15j510=?*k!VL=4)aXW>&V4!76Ty8Hwik<$+7UE4aAH}4?~kG`vs*KlVw
zpvmRUlrED{57Tze42IVA;nDEsY6(j~NDe*}Zr7qZ=BQH}hQVbbE8FSBRcup#an)-?
z)J4)$|F8&_CJwFbC=sW1O219mo`+I}&($oDir@P)@6~VREw2Rq9g=hZE=%u@3Wd6n
z^~u^Zd(N?mLiqeU?(_ToMt&vvZQd`B{hr#9&Of*3Ahe*iTT`Yb%kRWTb1KlnnvB(Y
zO%fZKx8>be-oUMJLk|nLV40>+8F9KpV_5A%eZ+<+ql@H2?X^?_lqk}UH7h;!xxt_i
z4>O|RSWVoWqZXW2)4shSf=>k;m{p2=gW!&*1(%B83zLSO_`>10rauUlI++-+P)ffF
z+p@{0O9-$<joN~{IF)x*awyDA66Bq`!K$_4%SXvmCk=&mD7(uXqT4tJrXUB8zO(h*
zGuP8Rk)Y)}2gsW?x8?TdF3%O(IZCG&OuRH=XkZ83@VJ#kJ{m_JcZ1&p!Q+ThHG{?P
z#z)E<`6Q!5fyYipN$>8eJruY9B9lTt+e_K^1=z)TZbW=IFEH;p&|F=5gndfoF`@N2
zrOT8jl1lGzfurzB`&{Re4ipK0U=}#0jnAi&kUGBB29D^XazJbF>zI*q+|y@j0#z3;
zaRv8boq`7!CQ&7aB7%ps7kHa1wchM6KL{?FU{1M&Er^pY$mIk;iej&ECs6nV{ouyF
z1u0?-onz_!d818T-pmum6nYV4c=LrUs;M8!0m>8Wn09$y^<LD@;dATSN{dafUGIHw
z6+=`e4Y12{6{P?CPe?XEl!Ti7B!ujExBi*(b1kLkpOGJA`xqRakPXj7tU5c^76)r>
zY5yMZmCP*pF03%xq&Y>sX7RX1riE8gg7r<sc9H~O_$3f1HxKsl-Q==PXz8M)HF<c^
zSXsgXtDSd~15e1KDJSGcCX=2G-7IXz6iKSIOEPJ$*<1FEIjWRYjJo>us!XG6b_ASl
zT5~t2C$$w_SgDn}3b1*cmBx-;;tTu!BW%L$d4;fLG+E0YB)yH4U!m_;c#QA29u|tN
z$&06XAiJ3TtKy`n)IdHa8$(Zk%3V#GdkiXjL}lfDVB<-^a^6c(FHUr`t6-;u2x7t9
zS<|tqe54KW=wlv@HPE8X`US4vwZb{pJ{NELIdbW9ZRJo~PQ1(9^}i}S$1pDZI=ES+
zZ`rk5SJ=g6vDdgqn*=_*3gdB<b3JluO-)OVZwol}UZBO{<b?{nfRW2e8WNz4R5fh-
zL$@yF+<+Hl;*F<#xn(Z<lm9heh`V84WsXwtXs_MRU<kIZ9<PwzlXrYYU!~?ifB)W&
zWWD!3f00tM<rpo=dw*I$bT<hInJk@M{y=Z-YaFk!TiQSL?oMc}1TJhe8T4jYsPO!b
zXtJMD1LyNN`7HpV=zvk_N0M#8t88UzwFzq~HAO&PN6if9V^FHD$`d9Ig>+lTfi-*G
zCrn)Zl(UuAp3Z$$Tg!XC`P9~)PS_b^RV=>+k#CCMk?&_+db<lCp+&<L*4OG#eiQQ5
zh0Q`!Ws7*e8{(l$TR#)d(yRK7lI_$!l|{0-8@Lubq*DtfwDdet`XiCmsf}D@b9F<&
zMxv!%<4wAaTGJ}UHD=VS*~{Yk=MIT|DyeO=eTs-DSb;n8c!5SPWN)<cLu+1BB|~(4
zVJ=lDrLee?x*Rb!?A~W3$<aG6jmy{5`c&5VX?cd01*|XeQv4hE(kF??ho|YR_<d)I
zR;jAxrgYit)9pIP-`L9AJ>BzSMv1ZUHidGaGv>NuVOyEB`9U`#tD$%GRD`wd3A`dJ
zssNfLVx^nY7+4#@(Dbz&NHFt?05&8mCYFfmvJ_D4v}`nF<eF?;B^7jbxmYHY(Ne{G
z7rKCO(5ZA0D)+Y<*?shJiuy^g1}0$<)}=Xd#_6DIRPqKFcfHZ-Cd=#62CjPtH)k_7
z^_9phCc!&a&be5db@dx@M7g-sKf^XZllHj0lRFj2Jr{JneD{?(M<h8Hw%wae&S&Yy
zM(U4u*RJPZ`X{46*XYughJ;U>{D(N~26E^PyWpSST~~RNm;38M1<85z{CSK@j*3UV
zYw=gjls`9f$LlkXnKl)lIwsljhXeA3ww){HJWzlWfS5c0p*`^Mtc&h>Mrdr`EpAW7
zvkr$L58}`t!A|K21_97t27h0WnwQ@-iZxjVs&41VpC82y><{w_<S#x>MvD}XCo&M7
zEN63+V?o`I`7B59kSh-|#>XEc6{T-rzR%i2CP*L;2MHA(rjrGxLKI}|FYrhVpf1X6
z9*bMraOiac`EdH^rsqa$Xg}`y76A|pY5_7)2Ue1=A3`{9s31=ia<ykE#|!!fsXSiS
z8b1o5KBZ~CB&=Q_sLqA&4S*;rhoHZL%1VCu?Z&g6M#u~fH4_EaB{aCfDKs@U^tL*9
zx@wSzGI+K#=ox=7>|RG>+xOuz&aC!+UlBz`tQ^gYSf|g^gL{67n<02d!E)dTcgzp^
z)J1T*6X%^63fVRt0bLQRh!Am@Wq*gdqJJ6bse&{P8hM%@r|O3{!+<dZ6N4)0zh?lA
zG9SB98i!ExVCZl0U#OqAp)-O}w2nhm{9<g*aiq$+eM&>L3aXPL@x$;Vqoug)=r5v^
zs!{ZhK*@s=m#h(yWEJRj1aL2T#8Or?3wzX5O)LUd3*j37x<wZthEa3HvX|}UdQiOE
zHoPAxPYpj`$t}R%Ks=y%aal={5|B)4l!$OGL|&)B6Iy=e!=3r;yE=n=eMwzg>&_mz
z&U@&sZ>d5!dK^FwgfbIB8Uqjnq!fFRO~OwO%vbVdasOpyvV`q5nB=hLXn_F)bV<Kf
zM_-iDIngX)4?CheACaYHVW4GVAX%b!9E{)sDFwdLprm1dgQBb;V=HM#8e}S56P7sr
z_f(Q%b-Lr3TV#caBMT?UN(y5UjznAhGmybPmFcqxlSp`Sm6){n#-i*xhm_A$dTYM9
ztGlVgeqw8CyeVe#A!mlGOv<cpYU50<s0clpE{maf^Hqn<L0<x`OX@2C($bvy=-ZUL
zWctg%*6}lIKFxT51$WUkGm<Kd;ra7F#Zlv;czE;~BwgU_2dGbpKyMGq3LMpH04;yh
zz02pXOWdDks`EDU(v}YD?}EhN2CLd_CpR}bSx|ekH9Q{eSHPY(x4^4F5bY!?qbDKH
zVw2N7H#w9{MnOktV<e)NhydHeSwU5ZrX;|0nB<cUqKI29*=>VIRgVx&z&i-?K6trZ
zcRi|Iuz>DL3lEPa)N{3Y?xbOJ$VurBck_63&!pkl3mljNH!(INg+beN;<$2W!ps|F
zBjqRZGMt0?^HC89-XT#^!$%%^bU;DhADur28gousaI#B8gOjwvq^uhOE&uxRUMxuy
zh=*7>+wLpg$f);QU3M)U_8WzF-<`c(9yjTMGA`or-5&FoVt!tBy(B<S4@~cY{bD#6
zRt0ii`Nyp>f!XkT^r%1)Hv3V`<{l=I7yuQZ<n1C^sxGDLu#oE!v`+dI%NjB5eZq^!
zs5efjCsxICWGUEfDSp&>G(;2URD{7za}vX0q@6`oL2%t|rCKcAN%-V|mpV+k2GCG$
zXQ+zm*dKZY&suqcDQ()RW6A|3UfD>xctg=3xyjh@kVnLnfAfkAx8RoEB-&($P`%bl
z&E3IOl7GOZ?=ZbU<0_rxWPEfAd(<n#UCDWaeqn+BSt$1`@~4^!+h692h7}fY!)k4p
zXuM#?3P2^Xp)bngimIXxD!=P<dr4u^@Pv3&%kM6Qfz<g34=WQACau$}p~KM@pVQSW
z*1Hlatt{kgNV#qY5d%l;WcJi$?FydW8_8lJF19L(aI6q}iZN{$<*7b#R>xJgqg}1O
zUn{p7U+lfA7La}pfp>Y17~iO@!Z_@OT55-?Z}DY@o=l~|ZLMO5YIsgPyPi7c-Z@0A
zwmy`R<yx$M3V)i_xN?g%X|5G~+tE8|<8*U2?fqvu62i6*1Fq><93z-Ncd81uB6xm7
zd5nLAS+>`LEQ)%p^5kqNnk)e=SWib;>Aaqe<ZQU~Y-v)=d<(Xx)csC!Y!9SH-^7-Q
z6qy3t8q<^d3GwC)UFHK`zmO6hif@`)?pZVt8`fqUhr^|~Z;t;;QX?Z&<K3^8;yQY8
zYx<D1NXmLj+BEUemm3tfaP+m>6`y*%1RlD5Q4MZp4s9lIK_0Mfp0!kH+g&wBVAJTA
zW2BlXq(X&kVCowEbj6ElrK+UuazoYJ@frpeK#wes@OoD+a<>&Cukthb?XumbsZfRu
z7y#2g_UL?+#6ff_CJWfAwVs5hstZ7R(g~?fOXn~>_&TB_R9SS6MxJ>}1}9Tmq<PBR
z4g&UooVxo7)+GyNHyG74w8&QJn<M_P&J%=BV4Y?F_+H~|;hsYBmPCNLTENznWnhbg
zl?u^Lb%(c>rv7S}){$N_JC9>z_C9&4#m%K|Rrj=Qe#+)=olUhT!rCV+*!}A^N%n-w
z%8q|kPZD+g&Q<?V{aQ9OtKjuy3=t2t<V><1k3ULQ?4|@|uk%HH<5+tur8oi$Ytt-A
zotH;j3^)a8`7DA1WO=K#Y${L0#`f?pFF~*8V>&B`E+*5ehfEC+?$jI9PcCnE3D~$%
zg?YXsjJMzluYo;1RHVgNh^%m52`T`C_O`d?J!<G!K|c}`>e@0(YDGKLN2NW&{KD2U
zz2Y)Tqfhq7eBnp0&AoBd$5KefK3+!642*7>VQ^iJVwsLq)sC9I*@M=QfKMPiwSN4J
zknXD@qR3Jk?ZypX$Pjju9w?F`T#_c3k}A}aE~<m2B?LKPFgpGb(1rL{5Ft;)N7jOq
zR4bVzDw%BUDBh7ZDV5s0D77#ty-+B1P%6zNF4cT4-Bc^7Z1FXyDfKWd{irPkRWIQr
zG7)_;8C4tWF!6broBpQ+nbw)Y*O`ryn5Dg#F;Fn!QJI}ynYNjlHtEjQHqQP$<?52H
z{1DsD<(5w8EKTD~PwOm6<DmR<Q)G9U(DN;^iAiSkLFFw}MUgUP`rTU_;Ctt8>L1`;
zb-!$U7kz@DZd!C+g<Rc(EWABcgGOb~nQkbdz3I_?=A*UO{%1&|x%1JqywLc@>qyu8
zAa?bPD>gefIYfAvT|8YcYpqap@BwRVig>(FN8T)c?U#hyjL6NUu2`teUY7dl%26!N
z!mZHs1<_q$aVuoxsG(`a)@3b}>HuukTrbyTuE|~8!b|T1|63s;+g#xTTB@w%V~H}g
zF*Wn4RiiUc^#K9T_YB0ksWe#N<TUZ=wv~B*os9VX>^>F+@P>V`IPm$y=5}ESVeVp(
zY<fsFI;y%H)t($BVsDu9;_3D)+F#P%WNA<|Q3*4{IcPdC<DY)X7#m<~(z8p2w61Nm
zZ7H{{1fesCRCTDNLgmVWsaz^~x$=W)Rc=W7b<INk$r?{yY40t$@HB+?z7qShB)Z9-
zy7nBns&UNQaDIPWy_PkwM22yeI`X{m{aKa%F%^BEjF`Jk?w^!iXdS+;UA{)`xZ6d)
zX?6JPexydwY+ll6GiwymZqu@*Q+!L?Qeoch*{PqIWYyB@!z*f>ZSCTj`Ai;(A8+l-
ztL`gWZ*Jr4I-|DN_x!nY82;=6G%Ou3DjRmI19P2mbN%r7^O4<Z-P^DvzQCI-p(*Lz
zWxU@|@O8cSx7kDI&8zYQuH<w763JunQR_I!8*Tz2%@aauJ*sp1lXP_rUV&ANid`dS
z%M%&-imcH6m5(PpmW(1pp_Wegz|{-BYe1{}+_+oy<D|^hXuxGR4a&3S-uhdLhsSU>
zbWE2I_0=*-$)xSN-m^cYa<OD~GtF&<N#69NWQS7Cn#dtKN5x@*CH=LXrPf1?A>sks
zW(=OBae~XXDA6@upToMtQ^2tGvCFjE*m-|=Q@;CrMyXREnp-o?U50JY0TB{3#Y7lu
z%|`Eyh)lml-X6WqZKNfJu{}=JDpd?sXOz?_LHW%}@528?#M+>(6K@qO;2M)#qD2FB
zq;OvBbL1_Gmni*?&FUqsQfW3t*tt$hf9Jye-CFd109-d@atN|Nn(`~Ef4a6c`g~K;
z!MrMu|3eBH)Abpdds3awjM5z)QIzWgI;ct9yoO5sHTcB}@sX(h3mU|$#`%w7`}Zfj
zke(@YURXneM>4|Q(4-;+l-=`RQHOWne?^2E3IFY=tPKkcC~%0FidZ)_nnGF3j*tJH
z)<I5*j*X6Z-Tw(3WVCyhon1Q6_$3+ztOV!z2>mDWa*LA2%0;%F{RR#4p>ofLj;fto
z?bhy45cwQwXH|r7yIZ7yQOsI<`9>LY>~z#^q0dk2JGPAq%W0-5u#z=4MIRY~_gJ(|
zM>SUW5-WVhkFAf1n(W~L!{?-dIsKY?V7y#~fM>oG^_s<SJa(S{j)Nw@VYyh@#~Ma!
z3I>M6sj)x?3}syHs6-u^z)EHAdawAkQ0+*0*m%XmncDlZ!M%6ha)0bD*K}0oT^sVP
z9eDi^s$dLHts9O_g<K6lPB{zv_F$;UD>X1!lb%}Gm*^V&kbH^BRYuyTuAsAy?3Kw4
zx_H$x$hYZ@SgqQ&j%RJw_n{K6uBNI`!~Ursw6iMM(!4jq_6cRv;pM2-)PZ2k!kU@z
zN|D^);#|}8RMS=W)w1*UXhdO~n*(Iy?V<i0H1+hbp2=mnbB)~Lc0XkFF&ce)&nM+%
zUAX0Ztl=p<nYNku3*fEw?JBY-Pd#VI15gLwLs3gT)pxh|AXBfuew_3)k@+#|3=5$L
z3hM41Xt0{8)yTsodEvctY5JnV!#nuC(gTnah>bY-MS%7M&U-^zCCZbW0v*Z#ozAQW
z`Y|{Tqntj-i(R%nRXbpWPo+O~mOhr3z~)Val5H%@J3MhcYn_@9-vt>m36<=~BlF(R
zR$Jpb&3npze;Bx`3L7$0zVsMLuu{e=Vxu2tNh(i@mtX2G!!=zAV<qD$T^JgoE=3SS
z1Bq=@=c*#;ieyOc9aEpUp3;bm-@4^NHY<vpsU`Pe&4^ghfBcc#I>Ve$yz4VI_<N7m
zSgEzH&(3<a;ap$D8L8Q-2u7h<v;no$0tVJ6IfZ>&GD4=-Znw2~j|6Nvr^zT}nRs{1
zNG+gEwX8_Xyrv{w+#*bmk%DBwu;FX1X8cHR$~|st6>Pkbmo!cmHYE@0u1dU0q4AnE
z*6CalL8~0U_2i2StaYdCv)w@a<ZDw_#R6QmO{LxA#xip+yV<7PrAOW^+F*Tb=DP;?
z@qBJgJpQ1^L-{b5GPj*B-r<*c;FZTV*RZzb-*Mos(C+f4`kax?Fc2Q?dkAW(>u$JW
zJ#s$mMltv|;JT&vHX}jJC-+A*_h(oPp9XoVJG_V=R})0;S%~J0%fDV9m?B8{5&c{%
zyb0*pD<%Y|g^YK;zW&4c9>JYn{&wt3s(OFas~f*P8OZP6UpWX*-8@+cZXmTS$UyLR
zVWitW@ac?huJh|oR`vFg6^7B)yXM(_>EOnG<LThmrLr~W-q|5Z=-rhjE84GZ_iaBD
z%fOcSZEt#ztqkF_QU9!AO(^Z+^vc6qF5N>oi0wOTM;rI0OFpa;d?FgW!<RjY?n*S7
zac<|K7^si-@&n4mfbiN+8HLtt>y|I|^NODfo5SPJ*URJE4D0oHJ48rKCYyP1#e3cU
z7(r6rMZ<mhi5EkmJFh(A>vP?P>v4DwED$RAu{rcbzlU$!`(pXUxh*gU+pB)44*aH%
zntqzVT*5Fk8*6IoBWkCmKtVXdS!}LC01r7~16}~56f_aM-%P7BXXL7QKGscW_;QGJ
zcB#;;2wO?vKEU-^zaTWehBIX~B9j9Lr7HImO58dAgipy&H;0U~Jl;3GRDAcr7>-}b
zm;tF!ShiP=s>-?Z9?Hh}S%}U4i-k5$eEnc6>#+{S^p$*|v<Vg87g)5e%Ycj`>5wQ)
zQuDB*h1(ThK$!nd2WqCy_FJV>cZBcaz<CV?SB#oqHNi<KIIhOBCd1I?@oh&K9YG?m
zIi=u5)cP(KX=i`zg8%DMOVC1P{7U*a=LcRkC++4i>^vg8?U^z$yGgQXvtgG_f$g%r
zHQAD6PnN(&<aSk*?VYub(=prD@%*_xX}x2)2Oj33^5$+rfEyHFh`>BTu8BfiT1orN
z3ll#`Gqh4uy8MImqq)i79JFrcJVXKMnL$*{e_r=EF^zEU^=l;aO(uNd5FopkIc%S-
zn5kl&pk2};0BL7Uqoa*_vQqkvCB^^g(n066T?)~03+#REpaJNIr^HZw$5rF>0i%Wd
zbt7f~X(AVyXd+KaUK$~I-{t+u$tz@J^%z>vKB+$uX!d%DEV5W!+8<~`wY8RoWFv$f
z@xf&7!epu9WI|SXD3uSQSw=?9S?-TBYR5n!%Wzn!dtqi}B8I}rC|W&?8H~2!s1QfJ
zUs*}T44gerpxNCfEZ>3+lqYxZ={d9F0Cf<U&jP_;d8!o5x)dsl$51->aI6dWm1(lW
z*4V>n92C`tKlkH>8MapILPq5^%F~(Dyu7|jhWWkUn|m?Akbp`HJTF(>PajX+)u1jB
zZlvu^3WKCYkU)9AaN-y|>D2w<;m3ep(j3gDe{b418&-)-eO(sW3`J;NXvVEpp2obD
zCN^bw^epP>e&J9E$`=Tvv23Jxbf0&dOu@VKh4YNDA#LeJh)t%QU$q1+zPd2y^A$Cc
z>~tX}X<7ncxIQY+X&58ovijYP+eE5Q$+LXy$Y!SOq2c{>=YOFh^7`7W>wjfPEuToF
zGMR|$zmR%vydbKR<8q1gOK?d^$)}_RgJ>qkA2N3JL6Hh`2QyN%F$m=?aG0~Tc6gF!
zxvRG}$@JUJj)tXHGJ%p{+>DwXnO#;h>RNuyPRall<6AWv)3nNQz@uk7P-V4N+qzTw
zn@2wF%^_Fu>Q_*IdqViHhul8VfQkAZCffvUOCjc`fo8tpJMnmw&T7os4CmjW1`&-*
zP%e^RUpK#FJbf=81mql8Z@f=$99Hl==ig}j+pHhn^f#d9=481~#u*8&wJx7OHXm8E
zas-;nmd3<<6wB217+k0vCs%TPGa$#-HQ06TREf`C>p9&DLEmD-!oXU4V~<+$iketf
ztXS4|UCW~?FtJpJYp8awHnb@#Sl-wT;I5vf??tOh@z)D6@<5NZDGSi6IJ!ZQ9>1_S
zDNmPk*u(Sgz`_CU$PgYE-i>vE7riJ9@haBuGuj??UI4EH44fo^YL8KPEgGl;SmsTt
z1M!ZEBkR+uuEKxfD!7re+lzI3!LaSJ|C-UkvXb7WdH-OEM<((R_>g1;5Jg~_7v|t*
ziN30Sb7J2#o4g9Px}NxRS|;C{@s+GU0Bwi2gca$7&Fq=D-OXDloTko?<X>_D^9<GB
zaA)WG2oG_5!p%6>UBvsY`I`*hpH82lV5-=LqakU{0WT0k2Z@<4?$sD8V7q(eg2R>#
z75jc`wn9qCKogO^YPPRtY;kc`?-S0vXEa|^Ia5{ns~pFUKy5$31^`a+hHU4=VR@Tn
zF5XM$?ZM<7oH|nh15&RF9bkCwedXOl#KGJwzXcN3#98xOrM87y4kzAvrZ8xRrABNG
zMtKfs4j&9_jN1t?sM8L_ywSZ!O+SmkUBW2JeE^X<SiTJ}AjqiDgakmHH-eR(XH+DT
z6${K9O88%n{&?CY{+x^4k4pF%7+o{?av{<q6`Sxd&ZGmT^`<Q<2^fr17|Jf_TFz&s
zMd&4MU|DWuOLBj&qq=pZdiA7JjUP;ch`?chd|hmRr!^dwe)*Y$Ir6YskS-Y|+%!=c
z&I5rt$DCpyqcbHgdHCl5k_i=PE1{r&k$RhkemdA9%`+RY3)T1NTU|5s^ReMG33!Dn
z$d5Ruk9La7ZDtFr8u;B_oQ%;vYVa`*bG6}gC<Q@e$(7b0rL@n0s=r{K=i?MIkS<{C
z?1U?Zb_!mh6QW_X2Nmj*ESIV5rY<vq=`iytHQVWuMl^f{k*FrMswkH#EOJ#me3dd%
z6*oqeC+b%YgRBnqZJKK~DLHIBe3=qb85@R~Jt~>h37jXIjWEfStU(VL|97NIXNQ1O
zau~pP`?Hy_>o^5FvG|{0<($ffdtr{Z{-whmVRoEd7bb_*NZ1h=LX7Y1PZ5Faxw#fp
z%-Uu&euG_qwjDst`EW3><`nQCgo=G2Q*RO}=qV&H@D$ZLH9!WRbLj6>eLx4G02yb8
zEv1E{#3!=77`_MSI5U>TtU~39o>2$EktzU--^UeLtPmI>+#z-xat;7UE~$wn3D^(B
zddQ%xiQ=td=`}!16#53_D)%?C&uS%6ca@K%IDGrKxnkx?oP{xe7Q(W;FwOY(c}mA<
za`+op8bE;iy@9Oc9!*Op%S_AGK8(g?UtRamEpYl&K!?IZFc+s=)!?U`&b#pTxxK{J
zCUOVlrvHn6&WrwBnS5INaqU7f3X@U~m%&Wo{bTp^8y?V;fxrD|H5+v2oWE||FjL}e
ze+8zvrH$Vi?b5V+QO-nsmWO>U-hA6_ujsxs0SKR6XR?qnCS>wU48%9$zRleoS>-XA
z^nExkj5i2mQ7P0SZrBt#zamDFG+`6Rs!-QCpuJ?dD)$kTbo--4=5m%al>$<~rZ_dT
zG9SXo&^eMXHjoOqkH3UnfanIo;IRaHIW@ip?)y#xMHwdMq0}^LFVt0u<aic8g;v4g
z>Jt!W%21~ae!G5Cm&R<jJ>%~49n!wJ?veB4`EA6vXUTb}<Z}$fv$MB3r_wnvv#wZ0
zKM4a9O3=dS35eU-KKkIG`=eI|<BLBBk!nYbTT{f;sbl+cvr7!WO%&g7bisRI!pl7!
z?ZI8mW6mtWKLQC0j(#O#eT*mv*C41#LZJN4L;a}^n9b{_xrOv_Y~e*GH@1Im#Fuu?
z#&b}R7%X{_1Q#BJKuttPU5MF~j(1Pw8U2Jb$WN#{l3%~33a6>22Zgyd$riOK43Vil
zyb-@q!tA_prS+_n0%Z?L^Cpa>C$@$tjGZWsxhQOQBa{bJ?D{BpT2#Gn%H@*Ezl$}?
z&(*-hDwq3IFQt?)w3IRFRnpuUyCf+I63Puflu9+BKuML3dqmo!RqT2MGeS|i7pfe(
z-jP|<6c>Wt_DjzLWufxO7l{m80f$axeW%@ul=!1`scB|*<Pwtg0(KZ`(aDxIDUHM{
z^*YCebLIWhEE-AJdo9`%u~zQyk#)iPP&$Z0MI#<KBw^d`o8SN86~O^~d`!gL*BOhg
z9Z5|mi9#1Kh$8+=SOQ#fzOC6LbA*twNB}q=w-xcp9_hP!a#Kt2ZIY9b1NdcvHOdmg
z>!IpCAZV`zt+2Vo3B7A6r=5wb&Wc;W^K?;TdxVEiYL{{L8gKd>H!Bv*-6TU17k8tW
zv7VQGHJ^L>6w>nJ^&GQso7A63n60jD-vY)z0^&rIL}sGc!x(`OgD1@-poLvn#YMf@
zk0+V!U13L1=%r7`Vn3l&j(D=>yr-~(8iNUkGS8~V&OPUA)H5iXz1%IcKRoiU7lGMu
zGiROXbxwEZO3<4uP$wIj0T9f_hm#zT!uKX}lO}0O{Jti|Qohvom@tx0{0+oKjFR$5
zoHx9~qyd|%aL}>F5eBPM!HgwC&N@>Lp6SD*x3*Hga&l<aQh_L(r{5J2P$XCb`_OjO
zK6Ny4%eo|K+V617waQl`(mRUoyO;w2F&wbyx1dDmoq!V`7?2{0M)anJM*iwct9!Dm
zH9!i4rpe(d5KPA1Xzv}ZFN)nT2Pt~<8t98V*PJ^_#9LQ$hzw;&snnUFt5lefNoDfW
zF({T~f2!Lb2zcvBQ@0A{Rz@5y5$7{fkmy5+HXpYJ&8{e&q*ez`NF#jj1PSh|3R&U*
zdWbK**)T<^hBj?kK6A(N8@+4BS%oLYip6=B^WT^EJJr>$PsXxZOWL52;Br6>jWh3!
zOsXOLsubqabG<8*w<ytkwaqxN)vUFBTtw<9`O$;~tB34J!bH-k_=<<Sm(oxwuz0<r
z(SMy;zB62eH64XT{e*2#nNTn?hW~*6_rSc3>%HASYyf~o3jhG5|D8?zU-`EGub{je
z9;^Q*+$QXOP}#d)s!E!3c5PHuIgL~l3X30x5@IAi9vve8OB6yt0H;UikNf_-T7w3K
zThy-W?ychVsi#3qzqq|{du!J7>^Xk0z!9DN>U|PA8&kb1VcQDcEQ(W=q+7BtXil?9
zE>lSjd7$}DbcZ@Q(X8nnNoorOu~oUQNm_>L*2(-9qG?){QZL66(JjSgqEk16?Ar$R
zJj&_je$fvyLA<grQB)`P*K5^6847xs^a4L%QRnN9L3&RGP;CEX9p4{ey9fN6?o8X&
zy5kLZJo!oawe-r7J+r&-2kA!);at*9ub{C;9oB`n2;^G7QSJ`3ae`S-PW#%)ec3&*
z69)kR1egn?e|@G^A2jn!I$nT8+ZDM7{H5}e=a2I{l>pt#>%P~`2GY>u*@FXct}sji
zMF47owR>V7A0&QF#Q81Bb7SK0e=vSd^5e~d>ssqg18H*)4G1F!7WEKcOmP#0&R^kk
zLZM4ZtG+PGm(MMgh$Rjy@i$1PFO!xbz_S<34!I&TWIia6ty0-+e)qWQLI3a110Rk0
zUYu4;&<!^XcQEG+bLKCN3Gi=B(<2DWE>rl8(nmq)^z?H&51w<JFtqAGNBh4)h3f-S
zD?a53(+<5l<;_OICKl-W|E|A=9ph=)4tVB6?>kC{1n*TR7{x@>jwB5t>~AiNtGEH;
zP{m#)lg5|iFxAm2qVYSL_0w@QyOY%X&cAmJ**i00>`b3@{ebSGN%3Y9FutE<X<&Nf
z6j1<$-yj>HQ8^<XrE?AqK=^xf;%&OaV8ky4jHB0YAE7Ch^!`0ucQ%7w%POl>v4)rU
z4DbTWAAl+}7NZy-?5>cfhXJ@#Kq;<w1zm|*=6FPrhu@v|kkn&b#;c?c29R7N?FfLY
z6Gaf{mkBltxVd{Q^*qBZK)3eH1Zl}D0j!g1+w%7b*Gp%RgEU}^Kv3}(8>CjW3vH&^
z3&|VcsdFulqcBi$YXiHoUhR_>b2I_a%REAt$H0d#U;CTD=;I7nl&lKin!xsNJ_(o$
z^;md8bf*XU-?~C1uJ8gE=1?lf^l)npI-&7ve0Sx6D4-A9+<ogo`sMMKqtG~40BF8{
z6Gj_-?w9GK4NF$BQZt75Erum&Tlw<H0I+?pu^WiXKg9utf1@JTP|8l_hVak;_Krx0
zrhnm?CeezEy3x~%fwn?kye{OSUI!7wHisS&FcuC@2=cQ;Tb-f8Z#|HW*Iwez+1!js
zq+A7%1%2U12Z{(2<CPuo;4U);)^yhh$`n9w#ne%6)Mw7YgxL<FlvC2h5tTf=>r{^>
z{dV0>m$6KnEor!|@`)K=6k|JU(WGIL<ZxiK%uiSAmSHWLldYq>BPCl3!jvqbU%F$Q
zP$~8{J4XoS0O2>S82CdjW9}nhruGX2`T{aH$^pV4%mq5F+<iP{8Q3}V_Pr_`$X?;M
zOdUdnl?y}pw=``Z30`?iDl2!&+*>VoJJhROD~AK6<b)F45mOOkz>tND$AnRa4<Wt@
zV3KlF!?d38D#O)p06mMuM6jGoePhKpK~8D1y;97(456)f#;n2%51245UXufsn_`i_
zVF2a9buLx>odBaMHVOqC!WZ2}7n1$wEc=_d2ZT5x0Y&QP=fx5-^)<zH1rOK9lQ^EG
zEzQ6eN7$Mr_4*Mc=e&JeB$X#W*jtE~hRENe?laYdL=7*Qy(w(FXb;_|mr!%A1ox0r
zESi>Qq)VIhaxNU8G8;we{{U+?rcui!oGMA#zaw3PDf&a>$rr@x5}}a(uHVg`K0nV9
z0+cg{{Py+F3ES73<q#?Z7HFR_K#d6oh?t_8m*4}0&;O&`73vP%U+W!U()HJ|S;QAF
z=M0Pm!i(J`>|*JM#0}QBK&y}j^eZ}%9WaLfmtuZ+vtqq7@O3*zVa;>(3g&Ca`!WYn
zPbsm{2u}%XVgSPZg(v}aSBxLCKr!lQdOTU6Jq+O1|6Z`;BC&26SYt~`YYQ6m(azOX
z*q$$72cH}>HY=T#gdeX&IW{SY&QhOXeQ0g$Mi}eet^gQZ{p~E~4CaW)#56jN<y^c^
zqM1ExinT2PAS1Pi>wztptn4CR<<5dNNz^bVR@Nlp$K976U3&rIjl5bR%*pxhb10(!
zt{iOD06Ooke@0XRe+*In!d=PRI*b5@que>VidfaX{XLC)n%6NL8-Px~6`*_lM3mg0
z_KONSX&RI;v|EI)D4#Jh5eyUt=TH&4U`7D=f`$T<lK@`_MM;SBXyYx6$&c|G_7p!>
znsHzGUIS1g20a-W4NznPl+J6@AW-lTEswlAn&NiXHiE911p>#3e<VPCwHzZAbZ^)(
z$TJy4L?v`&fK=7%=n6HnGEQmKH4jQ$6?CxR_N3TrXIKnuCY<QG@M~zF6{d9;0((KF
zHAdVPbU@mNy(E2I{UQv01eQoD(oZ0S;>!dKVODxO8a~4O#9|toxGSHn1yq`f{d&n`
zX<_Dg8*GQwlP|@+Prw)`^$nQlky{6|1|OU*dmZf`+m-J+{~+Z#^TMY}<tpS5X^Ua<
zM$Uf9!lH_PC2pcr_^<su-lvnVk>z=y{ZcBe9QFSo?3|iJ0fIE!wr$(CZM$#Vwr$(C
zZQHhO-nO}Sc4s4Y9%knuBkC7aMP+_@PT~r3<k_YcozA*h2`LxY#?BF*dMg(Q>eTi-
z#Ps(2`Nt;ytW<tVhd2OeNxYHkyqL)yLzl}v@)aB+UGiViWSZONHo2r4WXY)wnk3ZC
z2^XyG!=ZjI;fD{NR@1Y-&m2v0II?iOKyug*<ERbpdzhL_ilT*np|c&z_!0cUJXy~+
z&2dpv8FwM6C8$_d@ZuGPivXPbKmHEj1Fc|SsbQe;#rl7#=i*~Zr%TIa@A){b07KzY
zwv-ct@IB*>nXKcBLp#_b*c9sJ;0IJ?5s5a#l5uDU>?Cv}LD8GQGV_+GRtYaIfM}EF
zs8--aw3i+i-p~=yWp0CzQ5uFrC^fwl6~m)r8hLtTT&2(tlr&MY#|2P8`V=BIVvcTr
z_R4Mc-jkTaIqJ^TecRSB<nRKDiku0zH2{jW_aAnW8hT^>gt*i}r(*Vd$!w@AD%USz
zg8S32X9efFL;LYmy;wc@|Hb0K*#%Od?+$xmlx3_jZLGb?$>ACt)(<6>0AiqGSP6SV
z=JK1@2CN1T%Wk^pJa2ZgHqP4#iXb7G=J!2J1BEIPDeY6`9P2R?9xtc@NGYD;1ujx%
zb1CW!q=`E@^)Hfz*4c#Nt*WQ7LcWD?_rHnB32xT^e32%FMc0BLtvJ|`DEhgd$bU2q
z7JbmT1h%8J4Jjd+g)oYM8<b*a6Dj?e<5)tX-Y?9j7gG(#j}s^aTKf@@l-BZhW8gya
z^S-Pxj4}^5B6#@ivzd7<%8~?qwJ*qoM3nfz`?KT9nzG69WR6xvDuKYxaQY%=<fug<
zTv;N}#}6V2HgADIr-VpPmikviUMNPSV%8<o>3czsQb~|@Rq9(P7fY#Y@K~(eQCG=6
zZJO;gy*K~v`6>s9MX5M2hGw(TjfZ$EM8zVPo@V0#T{?Kc?}oWE6mlun&xdQ?vw5P$
z>MdAmGEDN@_29$g|I~Z22?)FKUB!hiodzONE}0<J2^9+~)S*dCS8pLOm$?1&EE)KO
z^Oub`EM2(g5yZnTe4f~Njr69JpDp5lB;8Es&589a<n!m?0$hV&Tqf%{7QM-b7Ad<9
zC#eo5pn0Jer#C#LP$_Q%_{hc{kbA2wqtz$xo|&x*QbP-3di!yGlI~OI;KK6pd^Yv7
z=cn}h&3;@>of6T5kIDpv5yT*RLRBvvqbUm!L~9vQo>i#?{W>naV#fg!v)YsB3A>X~
z1r$)ov^^hpV9`KT9mNou7aITNMc=yDocsh<8d7XI1jj0)h+$%B!B<b|zLg98J}@aV
zS2JKct{%7v?x~^=!(|SkdqQibdJ5s~7eD=mmLuQQk3M{@tZ-ESR__)Sgiz(uDlWYQ
z8PJ%JT~n4?$3OxE94Uc#pcx=4Ne4F(nbTJV?jYKKnjSHC+{saOV$xiAOu*qlB~Kg{
z20hg~kzOfS;RH0{f|1z*qkG0~cDK1@H&5?)dc(d}9&nbmhrUefIW82i;o{Dn<g{zN
zGV~jlKX~QHWY{OOaK|1UW(+vSpHXiwD@ax-aQ>l(m}Lh!#Rj_{sjK_Lu@wBn@xHGo
zn)4KPlqKeJn7Yjg0zlLYhR3G*Q@@ycgt0=TPVl}NhX8IDM1Jwte$dV_OwYOkzOrfi
zuP%nL()B=G_pHl@R@v0r7P$qCM}XiG9RVY?KMk<NEJo=<N&A|iGxn1zM&0s}_vbPo
z4p04ad)g6F<6|Pm>&jxZ;@VBFP2@*H=C-OoO~e6QsW>C2xiV|$VDgY`53T7?z@z#U
z!3YhlDW>6V@cb|BBG?Gt+gn@C3}r9e8xdntb`K-j8+B=5Lk_5l8gk(cId8104yOir
z^^mbUq(+#S(fa1y%rJjnhRo+J7O#lX6<AML%pelTie}RE(tDw|fGBpFng&iV>AFW-
zbR6P(P-Nkpr59hFPirNBM_tVWzk<7`1RmTJ5HWC7h6+<vS)kRVqoCXZFhr;UCh9o?
zN@w?9(B!|GC^4)!$(%WCnw81LiHjr?QktMyQIs61lXuZZsvx;>TP9)jhVGXRC{K#w
zLg8VpK^1h(BE~watsJTyFSHO-MXwdA=<e_DHstTqYaVKMVy~Xli4HE|f`6`~<todY
zmDr0sVHkpILHJ=I(~xVDRc!b&ND|$r%0z&{`O<p0>*|6y0F>Ri+ZYjk8YS@>i<5Xw
zKjnI3?-yY7^}hHE?k(@Qhy=wRI=$Y%!0~MxD64&EW8R||50;{47r5_ML^iQJraNXb
zwdr8N0LK^xQVW=Va#Sr1yz{mx&nT=*o90(jX1N}ru+6>2TlX<Ucq>ih?)N5qAhyW4
zQS-7L@64%u{EpFokG~UK3xI!>wY5-Y(z1~))pX%bubn!fGu9|Z$9VK*!fyn_x*ZIh
zmp~<&D~Tm)LX8i~m!Ut2(jK`-ks0Gt=B_z+x`}sW*!M^#C?3Ldcg~t?5RR&DGWf6Z
z+`u1y>d*YlF9i#C9l#j?BVr>q8QZw6?dUH3<TB>tY@l>H2_oU%g%Ut@lNGX!vIg7b
zz<$S#h)_C+7B{Oa6br#Pt2P|r8sOTNoJ1D41%PKsBGdEYz?9$I<>EM5xc1A?F*{6<
zPPWoNHEryTkr+a?Jkdik+=!sTPF)uGEf9iI->+VCX5ssOw=AkwK;Q{~@Pk_`v@#Oo
zCcrb<Y%lRm<AUvQNibL{UEbDHXB!J;Y(6s>^;1JBVjd_}(Uu|=iW)3>{_4SrBhQB;
z{}%eiTh`8+nn&KX+RK~>fgmw8%9utrc(=n~hG3NR^tI^g&D4SyI`^j1Y(?YzeJ+`S
zfy=i|jpK98#v~65(3|Pd^w8^bU*M6y@|UD-STox?nF1?W9i@{t5Jz?k3JStX;(~0l
z+`PWcvc~pNx8z|;Azh-7>*1(LjZ&XT7($gAcjCQcM#F7Ka@v&vR4yf%3#M^PP%8p=
zUGI<04?~gWfM6kSrx0QsjZtT(fN++DgY@xZ#PZq2rxff9g*dwsoU6h<2kq>cmp8))
z|9P6UlN&|DNY3mM5Ty%3HHX_ouk!OOQZdcSot~i^oEf30vi5%$(YRMl9h=@$Ox(sS
z8$&ITvQo(*f(5l5ih~OlLIJl(qxd$|V}Q>GfOoO&I-wf7LlSH8wWg*Q1d&S5F%pWa
zjW>XtxBxfq6qv?$kK&0`QDbvU1T*(<obXR$nNQ)zVCSNsR#rk{CWz?l6eg<ea|#b&
zvo#I$>69$Calk-phigcq3|K<yh;enVxPpsbto5c3*(R_Rb;&Kk*^)Ht*vQRP>aLWU
z+Fgtk)ud1+k?{PcT-kc*BwmT;6U%l-wI&6DYG<_zBT((|Hchdq`5TN&{ug7r-xcYR
z+W8<jY2W=7VV-j6@?25qjML^Ip*3CW!I##E$Dbc7`;xfk9^l8_nqjQlvWT<vA025-
zCd$q-{@xldu5p}n`Hx&7>9$(S!ZXGc$7i_RxXpR>#-j)%90fyz@kB{WEK_hgml;Gu
z9n5pc?gJ^|Lrq5y6h6@cIc<5vQE)B0VQ9R!!!FC<Zaq@E>cqZR=1v2D#vETPd@H~;
zkag6M+D;<m(R!{h9aJtBbDLfFzPLgGKVLBQN@^?D*C$)JNGB<`eO;y57`-ZM7qHWY
z!(mI5$gcHb4lv-)cF&Wv$pmjez|(onyK{U;;E9f6uJd8A6x0~1yAxpLdi$w5L)JG<
zS*#m{hl`1*JdP!1q)RoAF6CT>R|=nCJcMbAXR+34E~Kj@E&D+1?0uR?sJkNZpTP;`
zp`s3#iNL{~L^p>A0860p$i90U0f39WXoS^lsWm{%SGrSm`>!NHzqhlVS@5OlyDDvz
zFunU$p?E1+APFNn@FAeCl}&DgKBF=}|2?^k>^IH~ZN<XSd_{~si`(Mumy<WsvgH)$
zV8K-(=<|(HlO0bBlD$6$@y1EB!j7I0y}{VoXci9w`i%B~g2C*C<5@KbC8b><uI$R;
znqKH$Eb7>6#=2A&Q$WBdQQ`BYWg<XOV%=ae90g)Ev9qEzg(E*`y@IV9!EG9hA7*g6
zdN09aT92wy`)nZLfvC(gnr^PXF1(kle_E~8Z7XWmhrK_V`=^k%j78m~WvP_@J)5YH
zN)?$$t=ibS(%sx83^_TcjHvkmTdJ94=RovnoaMY>s6akuj?gGP`;tY5b-FOc*w|bL
zLGJ4)rl5PHP`-Exagsb{H5!6Zb~o^{rs#dC?7`Z9*~d&qP69_-<URw)m-j-oREE8>
z`|k99Eod21IVjPDZ6Y^GrgAB+LUcJ+1RYwEn?%hGP(%<QNn@q@+3K799h;*<ro5HG
zsb^NjJJjKnOuAs9Svb_g<{ay+NRQuCajG65)vy;4_vW%Fg_;H=5CvmmHvF$r3JU;n
ziwje3G(vrBqn6)I$S%Ik7lmEPG5cGJr3y*8Y2C1jJE_N;r)T7F%o>5~<;qJPrN)G)
z4@T52sP|tXMGq>(s>a9}B?3{;*f{`&Av5D!P*gKURCoaoD4cHpl%odS=d^mx9@UoC
z1J~{2pjAF6kgXMT5C_pR96u}2b95qGIN~cMXm4hp543`JhM1oQ9{*99IkyZ+AV^dZ
zY?GK(@al1h%~fu~t5|PaM+m)sq_%jyy19!Y)&Z_^MPaCI69*hp7pK<mdSYMd2N+Pq
zS|6yaZqo-ucM8}4I%wv{Vq=A^9D}JNDi9~PgzlzHs-fwU1vQa_AyEol;Vg%%hN!x2
z?wQ<vAEF%6xW4UQe;;Z)c!2NIH8~MBGBCOAnNQazh9<BW(@8BeO~>#ky|Z$FOxKd<
za3{6FRi$tByzOv!h>5092BhmpOqz}FTPDURjNje=EIa<~&vZ1|eYWFkC(Wrl^2^0{
z^2fL;fm~;c33zk@Qot$LmdB9)x;J*dkuUo`IGI~fg=z`N5On^T1l8`87KqvBZR&2P
zr*G3af$Fg+I}{lCqgO7V8kbw!b(Vw(vD2;%@eK%%<qps$Owl&LB-+rHMgyH5zD1?3
zF?pVpL8G@Ozy?(`*-f2dm>e|nW3?UodZwtG&2gapz<4rl(W*X-ry{^^X<V5r{`P!Y
zbg)mXR2-&03&E`vZ31--$&8&UAjL9Y=g<lqWk4fV6b*&?x6NRp)6gQnU<N+*VCGY}
zk6bwlqV~r5#ydbkfvpnEDX5O?xhv_B+R5&=yh<T-uem04{5@;RZ@FBA76BTS6uwMU
z7>L#1&>qK~KF2F@c*EVH0!St)fX>Fz_@r;M@Z_H=IC7F!!kKdiPBr`HXqwpgzE~@_
zTtnTw;&UvZF>(4s<EHF!n>&fWsw9>vWl`0l^OCK!$hOVuvf_wGr=qNOdr-}RaWfGt
zRfmd4Gqk;ZhW>ribU4!6Ji{!GQvwZ7jmt4USt$9TidnL>SVWk6x0ZzyJkM)|`2wvm
zwQZ`z`1=|sx>!Y@mJBmIJyW|mzhW1`I2~di>1=Co<W=raq;px`W@hz$^N+qeb(%pU
zZES<Khh1NptVJtU991(3HMe8WLRg%>|JhR2!c0DU-cJXA?p*DM@*MtWdP*<eD?Ej-
zc-kFYF<WM7J}RzE;@VEu5Z%HAC$o6$dVYF>#;H4QBZhd>!c$5WFntepLK&2{<l#Hu
z*~i3jlEBU3(Y@L$4T~B2*a=6o?~i`f@kqA^@Qw3KoM2fNSwefq(OGbz30<%*n)+m1
zyomcW2lmU#1AN50SMQGY^cm%I-Q!c*;V3@6isZ(Fj!?35V9lMU0VR%W<3pmxv{FIc
zP_(0cNplv>ZJ=2fDmaG6zJ3}Rv;_0N->XX3y1T8q0Z7j2WF)ePEj+MPTBAe1q={--
zlmA*ts0etw=WGN@1^>Z-Xsop&aE=Vl3BvNUdHqtD3YLfWR!)B!_Om?^dGbZS89{mf
zKJ4xr_nE_8$!$G($9hv?#5vg<QMBGs(cb929x0~FA8*()e3uByI9->$_s3oHQ#i8;
z%QR3Erc!7OdC$fp+9+ufp4x~&29H^|=uVlSom0Lqb!?CWwBMK{wfevZdTuSq-FD#F
zvX#yzzr6eWeD4U)8yQgzxjzz62~I1az6E~-ll^g|S<*+SV%DZ6OCoq@eX2|%luV*0
zm(ernojEUJ>mX#(Qe(u<1cZ^3hS;jq!7&yAkd++`^u(d&2}-}J!j1ipQaBxejUCL$
zB3hinfCqe~mu8jqRWd(BKpKaVF*bx*Fk!)Vnh?#Y876<d%#Fwd>ZfbWx3M*do=W9$
z23um3W9C{-P<M+NbXnFCGTr53@R*zk1VtIuSHTsOE_>v%N+oItA8fSIvvjTSi!H8B
z@EG|bOL@k_B&n<w5mrptW4WZ7olhG$md$&rYwK{=ItP{bqp*73H^%DZ5#8+NLKsk+
z*DJRewU*OwVOE%u+Kq#IO9TVNm|@SUF9-TAgNOkDPsiv{sD=|f7yf1|dnpgN4x_8;
zb_T<IVD6AP3uE<{kG7UG0T8iOf!_eCfQ4yS4c6)7g#%q$QjEpmBFV7yQ2MsMDJOEb
z0<gBbWwZbI8y^#=_uam}44)V>w+$Gz&$PK>90<1;9#X=!ZH2^9QK0}MZd1nI>jTUN
zVy9}Cn+T!D5b7RHu(EL_{F>(vH)85mfRGc;9F=rv$UwIcRwJ|_`HV-SCgzN4y;ZXi
z^MKNV+h<pV5un;RX9=_mn=n>u0Y0P)#W$$gYo*hLv_Q!8VwO^VtCZm~j=c8$9*mg+
z>AinXRh{M@lR;S_^xwHAee;Ll9&)1i%7NdP`^Va!@T5oD4QcqK*vB$k{M;c8svn{X
z>+1B>;U*VQ5<zH05M6yR5Lw(K?}%R}A^98<jfx)S{;6)L-~}w_jO6UQM*jsD<BWG0
zLUWfXL`woH+>WhPUgZ{?J&u!$np&J9AtjD(0&R^v1so*OX)5PIpPb+HENf%V1=&Ud
zc3#;!vEiQDnjg6}Wil6-8?|_HIc$f0%A>^)jk{U4ITy4>RiH{56+8O9=m$QHW-Oo1
zF9ZzAqS^AO60q@bM&m+dX_114YQN_LjYFRDrQ9|tXE?Ljul;pHJ}FO0tD##sH7caU
ztJBNE9HucaSgm!9#X^BASm({!%zh|f_}I9kQ9}rdnp3hc5w<LVgakH5Mly5vm=iRN
zvLWaqiEaXB@CpfMFyd{Qerll!ci)fhvgchUFQ?ph!?Jg{!SH|;Cr@^VVD!lP{3(lT
zxu9?O=0>85DsfUEbPE5ie9IiUYmW{cMT-$&3JmOY$34eo`i1|m!coCzvtYu1*3ti{
z|3~xvAHq>X7Yl1+y?-aC|KBu~n2_Gk!j|69z{wm6%J`pN)Xc<|;Qx+c|7k{{{_E^k
z54`4yfB*nM@?ZToTp7mykt?J2tc@HyBqCseKuHORSOJ*07%n9Vxk$N4ySTHnLolNs
zePi2-ScJ)1Yy_Mz+mm<ud$;Svzs)<hGxtxq{ZMFVYHtl@El=Z{D&A=~t7e;P+D9{z
zp=vYZ$JzB`ma$S(Z9PNV0HE=E;5SkK8*y(9bINa+tAF&>hm4(+1`%8^A@z`%YJ|Pk
zbu&)HhRW<(GzDKkJ0?=}tAa*<^lD39hc^)pNgNg_U!>B`G&VH{aoDFat*SFDv))o0
zSQjo~B;JN?d$?SQu1M=f5>emt7#kK`QB?Jb2eTm!rzpycT~}T`+1gO@ZRM>c$4Kg<
zeS2=L&kf>WFDx)d`ZLl$OHNi+3Eb)JE-f)fTVQQ|i=Cyt1F6l~No)upQHjC%HgXcs
zIjXMsIvmZTR5=>^bN|k|gKTvUo~YivXh|jq2no8MJMnxZu0+O%>7snrKRmd(OL+_#
zdcAYotN(|HYogpu6!>8H>CpG>YeaY<c^gbe@r#uB9s>+A&&xYtvEi6~k~47u$YkEx
z-yjS>K>yvnHU8UCy;*<6xVQNBFAiQ4?AOJZ1Tc-MX6(3Oig9fnpO64-b{$iplHM7l
z>Ak9vo<LfIf+#Ddk=>qTI_}{zwezTktL`Rd%kOcW@s}rR%i>M56Ldrm0D6kqVN>ta
zl1JE*nRA=%McGi@Lbi&l_K?D4*fpHt%L?2h*{`CBuphY_mE#YvlJ3&}Q{1YDPc2%^
zvsC3tVhatU2Us`FpR+%UXWA67NGH0PH|j)>)sx7gaRU>Ki^YRP2FywCGEji*gVb5d
z{i8cZVvu<&F)B=K%619d<I79T2>{4?dr?~(0y3q`owqT5R)PqprL6q!?B2;6I@T*m
zRM)e90fga7F_R4TMWLA^O!8h6<Fs-5w{CB(mfE?hHv_t8aA#F%d&D*Vigm((kZf7^
zDs7!skTAF@d%_}aoEkp-J5-HidS$nbWKi^17p2+Sk!W6bl6~ID#_^4F={)+?637eN
zw?9Km6vJfHQp?BrG@sI_hTP99=(FsSuRj~34Z2_-+#dgEcU>N23x!c&0aJg~IQf1#
zUXFn3Avbj9A{%KRvadI*k-sZAr6qduJOFfvV4rlw$4H&DROgNSIIEd_L4CBp*YNKv
zN392Ed%1!pXF>jWy_HPErpFuMZhqdH_BFyZ^;;ycc4V9Ar9DD40L{<{{LQ+q)^}}@
zUhfEV@l3Pfj?MbxRyQ?(89d(q0myCar6jYW_}#Gy$OYU<r)$gC;bn%-EHW;8<%B3S
z{K7Jo)!ABE7E%QlER6^%L!i@9aWVSIIJ@@Bv)Gnv%rR77YYdWYW$0Ji(75BFmjBpl
zWh~NM`^b?E2pRo-sJ`$>OEd{Y=K@X@GTBvFsjoI4IddG>QpMwhRRq`ER1a1ZSPvv*
z64306tlGvoGm07;dW)h*N0|2y71lW|mrSpQ6IcGK-sd&ylw4x&sMC%=D&Y~mNklF}
z<P?XyMs|}bsil5H?xK?r?5fnA^2<P}qHZfv_b^8;BdrkA^>Upfo0TZCSom2xtF!hf
z#E^J}kf<>G5@8lpSBo5QyW$St0WR=qZwMpvv~C5mz5FP|e4t#mJJD$r#-aJOv+Fxq
zReAF6`0>KeZU_CY?Uk-V;=A%j_5yQj07LT1#UtsVHGbh`*QQYIE8F%Qvd9}(f<WC6
z^228*Qa*vCQU0kGNz<QcSc}R-k1FPS`0AZ?v1)`7+$M=(u9Lk%LqxUPeR?k5^!>S^
zk2zO*6alJQLFsE<@n+cE0-izeH*+Eko;%ha+WC6YAUB-m=r6Zy*3yW7Ck&h;1;^zj
zS^(Ro-|tJi67s{so!fXzKlHQ}p4lFE>da!vL7AHOf=6Iho89K|af)0w$))f077Q%g
z^RLUnLFpW@9-szm;$M~q*(s+xQV_4V!@sla%7xZq{0<{kn#^Aw36=e`IERTsHa~_n
z7<vv0s}ncML!&|xSv=CgQYt{>cXCbL@Zz19;&0bTn6q9J8>TJAFP3bz{f^-arKV(6
zdW;Djy7xzBq(^4kb{)ia!}3>GODN%OLAkIo=!5)FbN-XE*(iD7o1Le%g_C=)NHRas
z4l`R|D&exC@|~(3r$snaB=I21x(aK7HMQhQ<O|BaVYMNz<xrR~fIQ*ze_xG|yJ$3F
zc%r9j!q*!fkdY6X^8%<#(;G{bV(Cq}W@l@H0d*<}ggKH>j?_Lv!OM&Bn3L2_)WGaP
zsIrh|O$B!*LoEF(XBnG3!fa6!&GS784z}%tUMJ^xRIwr$ol5@P2%wHt+Jyu^rs!=~
zHCt9TTN#}Sy56jaom1`T4u*7MxW$9YxBRF~3n_!x(#`BK0apfq3iS+O6`FtIKS)L4
z2D`BO5v%~&;PvRvSU(V|4D`M-I_yNM#`cA(9@wl22i2kLN-6j@<#T(I^XePnhKXs4
z$e#@gU1#bt<=>;EBPthH%XU@sXrOSE#J7STfY~(f>^v}?`gfMJK-v6KPUwSjH+L}V
z%xr%_2vXlwl^_edOry6nc5)ozEfoD7zQMBUc8l0qkZwFU%<9_2&EIPFzF%Hqlk)5I
z@9c;vTlEU@rB$KidAoLD*wC`Q&M58F1nOM%qaR(i_iI>*gS}HXF#?1x+7WHXHj%ka
zi+-iNa_L-fSO+aAE{a$q7;?}lhPgj|)Tk?9?|xpmbjV6x(H#OP`_NE6tVv_2LnO5K
z>2}&i8%kI!KX&jjB)Df|PIz56+YLP)ZvPuNXN!PZ1_lWUHc1}2t3Ycn>}j(N*T0Kx
z>bxDlA>I8+x9YVW*v9AuWh`k=4%6abIW3BG8!^~TzSAGWX*REOPkc++cQh&#J()XP
zeW!w8hg=#?<NN!V&$pdXQ;{BVETHItiC3nqGl=JxZ+Of6iF<9@&+c%?x@tyuqBJg`
z_N-8~X|_95IV)#$r~rT36o2brU{mU8>}*`GK{o?i3#j0Ds6X?f{JH{(RW!Xaf@q``
z14~`?5);R#V5gg~Xh}H+f9e)K{5%!vEH0jfng=$l-NptrW)#NV(4zWYHA>lxytY62
z#&WBOY&6rbtai3(G5V?7c!Mmf4p|KO*5jMsX9J--hE>pHk2~tlf1R`d<#6DF7SSx1
ze)G-bW4IK*{86ENd^s$QWy_G26y*###FpX7o&5Qh_M3l9g1vz#LTJF>&;Tu^w9Y{p
z=J7?@Iu793cgCwQWsfH9+V@*dmg~cM-*jAQCCsVl9qO?2*X!zXmOOgLxg8}k=)(5-
zx<+GbpE|B{ciSW{A@yTpZ0dBhh4-p|_TwF-Em8vHW6a!aEv0#B-V;3xeCe4dX43_J
z^w+(A!sl_WSbgStsG{tG_hE1tPpa=np1RSXJ#?6}|Idf@?Bxr5M}>ULLsgVNZyzma
zG%1hzhsH&*a9iP+nS(r%n!1D2Jf{Pjp%na)-Se7@L8l(=L=T;lCH{%v?nKUWzt~Ir
zPe+!goqd)ZzkG6NeJ)Qn1lr(fLKu2=M4Z)i54*M(U>HaX{5bPP-%D|iAG$mcLpkq~
zIE~q~kyU{ipjW?3)!t~z-nSt^Z{c5~(iM;5=aRs&+%i>Q-F?fdBa`A4O_93}ar<vw
z1#@Zpvn>R*uRIxPHkwGn>=Z&)yP)=0;kR1cmZiR+ykMxU;6_SIBVOjiJE)XR_!Pf7
zA69FkA`G&z1Cl7aNPZ+LezegVbpOG{E!S_|vswl^oZaT4UlYn{dzx&Kh3Y<CyRAgH
zZ{fV7EP&_0`*!>EdyU{Dm-Pj8pV2kMR6F;eZ6dTOBCYix+%cjoI%2pzA8=^wKEAVM
z=u*LH{)@HI7oEsxyC&#qB3NA}DAbti`sKFavDgkaS&XRE(YRf+*qfGRoe>SO-^j?-
zrKncD$l6{w$|oY)Lk8P~I7&1VjWp$P*(eU$D8QJJ-i^48kw{!bwu`$+I=iK|is+j^
zks&4<ua^m{2YwV2P*=uAwieJMHW5mAQQ8(xp4?*pB%pnQq}Ugt*d8`e)zR8DG88*8
zTcc9x(or*VszBgZc+I4LS~dzrB@fmn1$aZ~^N>NC3R8=a@;t*7pU8Xf!iT>lG$nHh
z43b1*?f2=Vmj6b1BIZozr+3H3i6`Yui|mh-B*@g<a(C?O-()zB{3Hoa9N2Wh4h=X}
zhD)5)$*n?3^1I?TF#E*QRvbd$SB;}<8Z^Z6=g7Mz(TZmm+bLBvZId$8STw&?@TTof
zqFU^^Eb+c9IyWvo+bX%Ee2Xya^j(FG$98HUv`;j3S=e(a{pqL_G1J&J*1+e$7Fx^^
zRa(y7bZRn_!Zj`@V){my1#Hc5ZJo7p$8@&gui0Fp*~l^6Y&s+ufc(IllE%FJ7%=m?
zpj?>6&b0so(ZnX!wfMLZcjp9mzsPj|fi%=i+2A}`*nq*zxIxv02-!Y;!NJX6qj!}j
zeAzBu-PX>$W&@hj1-hm4$+N#ApeylbxXnWpxYg|DiDaB?I43wEo#d3*57h8Aa^Am_
zolMpcI2ClqB@u=}3a&zdQHO$Rk!`V|6hJgi0eXyY4iQIqb&zR=mM)p2l;wLjpRKTk
z!}Fa79|3~bpD$Xs1FG8-$Mgs)5|n@P9isO`Hu)|^p@(Xg$_hbILi98iFT(`_mNSpC
zNUgzz^JU&E?R#(l^eVM&^L*Y!Yaxh?YXS!0rrFy#;k#wndYtYHrz_N^V<d*yE_Nx<
zraSi1%XHqK7ELdlJgIcls7y$@PpOjGB9|Pj6**(uKrTpur&$V4t+-Ckz)Q_^G0*U$
zG;5{(Mbfp+O0v!?I&s(d3CtHts2N<Lo7fSbVlF-GY!vcsAM7J0oEM-@uX0pvcxW;)
zAz`7@`a_MTwb7&Zeox7OiIpT(mSPJ&9S7t~0et$;T5M$dyLCn77fWT)QQ0^YZndTN
zp{lx~tEzON+A@FVdCtDA2!1Rf73O|$wQ6ZA!isByc%47|MMjIEAyom5Rq%MNMCD`y
zE_h*S>Md|IMeuEn5QT9bO~$Oi@1)b+>5tqE2y1ikCZ?W{^ul(;03NMX3;8mebzOe1
z3o^H`@(~#@^JGQuWZAdt?+syjR?rd^#@hbmG8eu$Ydav(l^G_?z*Cy)UUD;{NK2^b
zQ<zS_CtILnnt&&3P^wg+YUQJRb^DX$>DZ$(?P%+1MOQd!!@`|*%TN}`4Bx*)VZL{F
z<b&r=eWqh(gjg?T$7v3Hu3o(i5<#=^WUe)+a!kDiKC#4IP2{Mn6J$@?h?zfNt{>k`
zSnfV|)d#uPMoYnKZog_XyJkV~qx8j8HX=8O{8b`iR}$X2`8T#{Ibo~iIR8V~tg47t
z!<(El?c1%-y}`W22wCvzb4V>dhZ<ZQ+e;2|v~$KF1ZqS#dTNE`Nb@p(`(?Qbx36fY
zqKTK`6+6bpO3)U$&)v(x3|w2r%Ho<`k}FSW5bT|bfvRYxzD1O=EPSS`WFo(M_H_$?
zkj^8P4zZ)w;G|x0$S(e}Hn5>}E+a=dbY)5WrfG7g(nv>$TL)rj9yP+wN_>ZvZKvfE
z&8vYIe1%uM9<RATYgufL((N|G@fLKn_Z6+}wX*XSZuQfC*~{ToC=~}<yyUh*7+?1f
zK45vAd3PMhin!ReJluJi!bO?md0E62InfQG{#B9aGczK5Jph=7D%d&>*g0k|BNvQ)
z9Q<8A*jqUG#v#~l3hW&>%)iY(6kym!3AhIfcqs(<37}BEcUY+c788}wWC7vHBjIB>
zVV(owO8)~ps-e7_FaVXI&3uEQdjr>^TtyxlqyF%YNr;*~2DguTQuAS7?_sQeoy)b?
zguXc%yK{8l)U3&P@$K?i%RYMjad3wH<g$0=lDH`Y76x0EL<0&TlW0G0ntUsU1cT}2
z0saVsWptKQ9Po%fe1zGca3h6yo@Idq;9xL@Q9^byVE+gId=oKYKplmCs^z(Yx}V;<
zLHS3sZ3Sq31`C{*QfM%-m}h{|J;vy!(ShC6fzZQICiStbn9;|vF(XoP5><jOuX*24
z$oR=OD1g>dri6&heK6VRcUg?$xM(Js!P~LC-62=SBk}SH+U0rO+!sK`Yk!00Ece1{
zXh*p7x``}~t~?U3en=bw4U%v7`#bPZ$nb>ImW6c8e7jw{rwU>oEt5<~!^IWzYhB0W
zUB4$4$52Tqp#%OIH2xt8rjbN`;To>zKhJ$oq<XI^b5t_x?wyz{NuoTphHTUkxtpLf
zO!?#;^Gm@Pe(Pa38*x8QBC*PzGe^$v_M%VC>C4UK%h}PFJiSBN$HU#dztvh_JW==E
zXr4j>QjaA^(G<iYZC;Zb4!bK3^RTQ}rrmFk2C-;=ZB7`Du=z1!GJgRy21x_Ju;@is
zX~0H?Sif3uztE57jVM{25&=Z6u|#qZ5wGL!5;Gs%f-CtnAx<^nNCHwNY2jn%RQUw>
z8R!-ZQk_H5{qG?f=z?ddcw{UqYP?EfjWZxy5U%R8@%VRVn%0l|GUb^TqHg*WHD~Pq
zP&jKW_-TZU)s4Q%qX(hsLf3KRug0^+J0w2SuDHz9vbx6jvmQMcMYx#uJ-1C<Jz8Cv
zVW^U<e1Bw-M>O}X(UZl)TS)`0Np9ebi?76#0WOsmK3o`aeemmwdxRKe4Lhz8=2d(P
zeiC2#UR4x_$m>I^gh!r1l&r)VD5rlJB<YrUkT@?e1L;l9HhCMK%39XJcvZEMeuekX
z!Fiz~oeVxitWi!{Ge@X;3X9lmG1(%2@rZdZJ~{YVWfCWTb1KEUooV*F$}YBg&b5Nr
zWn*y|CLGO?U*Iyg82ptS{3-cc`!tT2<<2@u3%jdhR>uDv%Uf#%#%#0&?Rj4#-4#WZ
z#UJ;2ddP-g?TNRK+a->f*U)nt=haZRD!TGwE}G4QV&PWT*3Ra7gak*U;#&1f7H@#I
zYeP%A_{%e{#?5lgRW2n(m2QlMASKdZla_#o`GyOW1jlRqPHURT1od)79_Q-ug13u%
zKoAQyAp9Liws6-&$Pl>*xB@DU+L!svj+K)j=7mvo3MG~%q3#7e4&q+`*S8kEMrMYi
z&Q=mfC^x=?*Ib=0f`_e}3x$%?whE&0R_6NWs=gUOgMA|JL!IF<-Cl+ea;S30?1B%_
zdG5G;8iDMm=KM!G@{5}>U{xke2^&8NG&iw|zVDj1MEW|<Q7HtFY)FD^Z~V(ED*MCC
z*|ADZf!*Qq#$Ae<`T5O#kkG01>NTz3!ypM`bo<-x<{+B)7lhqcu=6z<<+1)N;R5HL
zp+)G+?q`O7w}q4a7rAuPLbGDzJkzN%?A@28kiz#=`(Su!uup7!1JOB;EANs$cfpPv
z0=ks7svlJ}vC8o2q<%rQ<q{QgA_Zzsl?-wlPFPUY>)&F3uBEe2i!Ul9Run|H?s(Tt
zci+50ry^+<x|0~$Wc9|=u0TwfBbgc+xm+WZ9TXILR2jl#i!@jZHD^HlBBcuHX(`WL
zt034xX8S5i`@m86YPV|=mDAcG4_^P%>%_3^#PSZ~-1q(j?y!SL;<a!0E8lT&;NhDg
z%TI0JOYQJ2-n!RbhK8vN{KBYAawU&#o$jyO8*EIR8?YTgPq{J-n3nyD*Fkj0+aG@!
zce-?&d;7qFa-*F4t~UPkl9J1}PMTv+!;d~D0aKE)mS{xiAHOFkxKuB>n0WT9bo~u}
zNl&4=#1vO01lvVXEN~038M5b(^XQZ)f8VAh8sdaOi>;_^*0^1MI(84TnsMdZFrZ`9
zQ^;9m9v~tlCPyeLEG<tlGBh<dS2<feK3~CuS3@KvrpCNul;mX971myh{{s%s_)l_p
z`+uUt!$QUXF=hU>i2pY@yo;Zbu1ceVraGp^oKDl)Lun0PLyVaTcEk!hoBpySCnKFi
zGt3#^hBnvnR&jcpFl+6pZQajS!sEzrydI<b@<I6P^+Jham-IJ2sziS$$HzmTZNGtw
za}M|U8Mc-AO0tuL&o3eno-$Q2)Au{p+ZKj#ohZvsrx5`;9{KeF9lZN31*CvK(8G;K
zdtEb^yk-Id>wO#nfXJR&X$ph|DtO>MAQAP_<irszg3Yrgm8M(%BG2h!Egjzn<)w#)
z%>u5wQg{yvI9kitAB^Pl0-P(z*KHkh_)Wiui4UoCBAez$r+g|?pnd2mVx&6C**tC`
z@zFryD?)zom3m|2BJI+Px1vq;l=yI4J&xp8Cz%E>BL&Y0SYCbY-n~)FyeMNT@4|d_
zA)VUo3Cbh^1XfR^%IN|xZeKe(0IluT--<U6Ya?U${$j;iOZ3@EPU3QGm0Ysty}j>{
zpC-|l_}qsJiX8dk>-nQ>`kbEYEi4@Hu`Y<jkm8LXgQj5=fl~;PPo$urkWr=tKaE9X
z$*zb|$O?Kf-s^&?mT~etCKJyDifk3fC<1Icx`C|9Txi`eB1tHmCdf3mp^4nW(22P1
z&Y+rBSVS~6ZUra^C&z&1XuHT4s8S<al$jAI!Yy;7+mCNbj_EJ9VmT5%b_$y#e(Aj;
z`HuKM$RTTgHdm|HTNPKNb1aex9~CpZ3o+>VeI<Y7L<ds{Lt5#y{o<p-?Cf|Qu5(&9
z<&JVfN>!GX0zKE!5dq)OTYJ={;gJ|^IMpAPtHpZQxgqUd$M0p*sC0Sc-&!8;g)+#a
zp9)C|GjB}WXB%BJ%(5*xkA>7$G3hz1Idnc=&P5(73ep1kjnetttd1KS+BeYsJssi3
zo3XM@W3D=(MhJA#Gd+U3F+g1;L<ri26DQe37T!gh$~692%+<J+lC@~pQX+#PmYv9_
z2B%ZoxnlAdFq9gk=sHuCk>JDkyDXt3<fWz-<$pkjq2hNh=Qbr%`llC|=ihDnG^QAy
zwq++eD<+l89AxB5cY4PfRoiW1Q*fe;`vJhN<TG>irmJ>88nUK8>vMccf7h)vY8ba|
z`R)DAFpPc)N*4^H2`$>l170!uukvIr0=)<y#}I|7i$iyE-Xe4ZgJj$Xe!<!*ow%Zh
zJ)bKwSLy2DqG9rO7)`E0qz_mwcYB;GOK8)bE6A-NJ4Ln?e!Bw|izWWb%P7_5+H5cU
zYnuNK+_x@$Y-aT#de##d_|A0gTQzBerE-Yy4nJB;HXcp1552(1wIb`d;0eQX=a}@?
ztyF?<`+i1}qqaYDP@5p&7;T<Odv(9FJ*vQ9C~OP%NcvEwkb*w$-U+%|o4XtXmjPAG
zWl+Ppc;$+tfFHWi7$R;!{1AFzOYIKZ*DaF$cmT=Ap$5<>pxn#>u6h7tJcOO-O)}K3
zeWOf#{%qsnBZql2M4`D*7S3r-9=(~NA#1*GcIiiBW=)YTo1Z_&C6qOKbCF)}k_IgY
z8PTjbU^%p&0XtjKn~3n(4_@qAClrkBO5l={f8^OQ@)oEjlgdg$p>LWJ&Z#9I$x6n$
zZJC-Bs46K*OG?^pnjX!mDY-~V&hYP<rj>jbCd4PIku?uhBz%Wt=%<OOTainRyQsX1
z4vE(zyg*xRvFoHB2XkabE%ez&#z0y%JAqfgBRz={I$rAPfcON8HdnSTR%Co@)w^lK
z*2#Do8mdP$3Dab5!Kf%dmI|H>lF~;mTT2E78$!q8F!56X!1rFW{Ed*^Qj!_G!r4Eq
zN)K;^lb*J6+>i$7dctJDOhcs79g-&tN4SEkc0}?R9sNll3Y8g)Ov>Ax554xeDqFr7
zHN1Rkdk9o5e!!9(yvum^R(PC3xa?TeK_$SAZE-Ih2{$ua|437UHm&aHczAu39G^*O
zH4o?z!Ze~|`jppV8*xfe#;@EK%Y7yjzH0BX<2Xs~Xs&Y3v~cNCm)>vFk?jkAuQIEw
z?d@A_l`cqZKw356nOW#rK2k_9DGuLxHMlGeHBp4%NKdGPAmN`Xk8=~xXqvwgX8Sx|
z%2G^C75a!a#f*7JC*U*i47v!8E@d)kt`Vyp;Nd9h7{#^Oi?vc{vw$YD@D`m-Y+3BS
z2NKTbvZX_s?-;&gFDe;8dZ(9IQvhI3$`?;p2Z#;p@|fCI#BV%zS6iDQy_Ebm8%OD?
z#&n0wY~fkT%*3|4DtPhKlcg%7W}-4E{JCpMmo`FW<E+fk;jvq~i&@k{kvH~IZ;Qcx
z-8Ynz*;ODJX84X4ehZ?Q16`}$Z7M=OdI^PvF7es<ck7s*uJC;xbkLk1yk5k;lKBA}
z2K^nf!ZnRJwR?!WZa;Gy>kI1LdJcOsu*iDmzkFzJjz7<v`^Ne3Dj6a<RM8Rdy~fnV
ze2CQEd&XaTJ(zeQlv^UTamhJJCr2FB^BWcB=UfM`dp8Dul3g8T;G3|$MH0i*Zd*4j
zzFHaAwT-GRmt)B2cnNT<`EAJW2?KDJgDU$QG~w;bisGT`S2>m!Mr3b91S5C%Y|K7H
zZls-=Sqgz^1L!6cf%PgRM%`+<BTVl?Wgq{;t+P^xy|NQoQe)WIVd4PpP2h1A6ZtZl
z1-Spu3W)Wp(*n~Ezw$xakkc~q+{Q2CugvH002^~ljs;i8>s4wQoH?~hqjf!e#(M(l
zmk{-Xc_Qvbi~mcl^h>bxE>ox>RU2W%jraYO<~0>*RiJ#OT&CN6a5-_GSSzg-o;Qr5
z^xD7~mH29>=UVeFC?s4PJ=(wLb|`3&Hm$DE_Ll&jmtQ@nyd0|oA6#mq;4AsA(|W_`
zscZdO>EdXQLkgy7V>@a=zFBYvYB-93a)Q6xzAhkz+pPCuI%6R$wIZy?L)s%mCt^g8
z0p{TR;i<>^*NGA8Hh5gii+LIF9+x?pr4jNB0hPiE?uMlo;hKrBb!ww9%tNPVopF~K
z%0Q<kf$e6qlK+R1Sn%=RwukR=Y^_t@o}s}*XgT_qv|Z2M0sT|1JsrnXU*}$u$wP)5
z4F|o~uYJDaIkTR&eZpv12<g4we@z^y1HJwn5&;0f6aROK14gF*F>w&}FL3~O)FRj^
z8ebb1=^VilUM>;j?;PPQ&DrV1pwAMtz{w>}tQ53Bz^d;Ymk9UDxA%L%yY^2yU3Y~;
znlhKDl$s>3kqcli^7A=Xd}VqCTK`W<d^&Gm|6u?4mFH-_vB{;ev43~;MgQ9t{np2n
z88Y$%PjiFZ{d>zZa7v;^z^Ee1DJ$&|Q<d|oqKG|t!QD^-PE0#yEPQtPsGh&mb${ij
za$LOd9b(3K*^OCL;wLFkY0^|Ly`N6(-Eo>3&17p{b-<?E<oHv5l1qfx;kEFS&fwtw
zJs(qIxSy)R*8CbVL1QOMbG?JW{2)>BFGDbDs@e=of3ug!a4%Jb#r*+DSpSkx62z@!
z%7@8{O#a(`Jqbs0d6yd<qNldA%t^pkR_WyYejbpmDj+vBO^N_gbAzQlz@t<T*}KHz
z1}imQbAhMF`y)O<M^a~UfR>%EzQr8CH=qQ0_6s#aZj=~<NcV;-IZJ~pK%=ydFFj?p
zjY+J;0x{S){>F>YM=9p7S0QL@w3i%Re4o_}9v_|>Yue+Ybs3FHiyb!ku{VR{ur80}
z9nLm-ps*iHrvm=yd+()P5c4Xkt8_DkpNMG~({4sw*(6u8!Wh0b$dn51?(+0kU_{T^
zU{pjbt2IOJsiE9-t&iIb_mPV^Z*UE|t>mBp4K<*J3#;gn$aKbmhj68F#CFw)kVAwO
zu}v#gbzuvC*sG3#nwc?MZg|ChT~M=nXX5TV`>iUZe;HPEJh5ruiGF^Ze|j<Q(NzQu
zllvlXYlc*0!<I5D_-TPfSJ}vRKIK<c)Qt_DhvIeDw`+yFsEqgg>*a0kG45{64e$pS
z{55QS?)u{f5?GjHV2m2++Ly$@U(^h0MG)nnCcJT>jW4%H^Obh*X@!EvXrg4?f%znx
zAk^7p2|!`>3|)~1!K)cO>)qR6J7*czC_i1?lMuj93kTOX*5ECdVAsCqlzdCh8WPRR
z;0fPdvzV4zirL(NI$F4An=0tjKMVLtCxn9CzyG$B<Onr>fb2k6BgCZ85>{BTRh^PN
ztL0~BP^{7Vp;tE5bE;mpH-~saO^IL!N4V1rwg~pPB%ey>$18u**S?(CB7=LM<BIhH
z>Frt9RRtqL)f$VKk=vLANkc{DGs~i{a@&0z=j~qqxSmV*zD(GL`sBc%l)J*gV#Mt_
zwo)0RMgKx6dRVo~$w$_}Lv^#feMxR=864R;Krsq`lzG&>iwHz8+&;j8SFlq}fS{X)
zpOG~zOO_qh+1qBU_9L6r?M!-)%X!1G8hatTe`l|!4L6-DFzNbP-w@JsH~Y!70v|D&
zVx`h|0bbPrU~D_5CYNb!AqEJVY%hop&iLi!+)5E`0gwL?PMv~3DN-S-4%|Tba$|OA
z%E7}u_UM>_RFv@U@pQ=I(jjmWo4UZkWiEPr(eBI$&w7K%iPzfk)1DC;y#VmOu|2P*
zlK1Nl(j&7c>foM0y!Md26^qTDRS~^x<yM4U)1!g>n9qs`Pv^6*ro5836|P<o2wV}}
z?@i0}NjDY;22_=cd)n!Vqd6bMWrl?9`r{ui0r^1jTJ(MZeoUF;ZlH_QU`-$*FX&g`
zXY8-ZjvZTWp8nTb#5ag{#3Ny*e_wO1bPOnsJP0qkNe&H-XDuYW4&1#th!2AOOm<i%
zZ2Ib{7PsZJU#K9;d)>XR!0vN&rhNYAdBXJBvZZ&}%p-5kNAQ>`@z&E~yv8HcVp0i3
z&q+(%U>+Tzl^#|nw|0=NSW%fJgE7}Vf@0n7h8enoiD%QC`~+PC$&xw^&K5q*Cmo9K
zI>aHlB5#^CM|!2Qmgvu#C(ghxUlfhVMg|*apf*N<;!%iF(0=*!tDDh@m^XhM8drrQ
zrDIpzFx6}?Lun4ayI074!uY#xPq((ml@CET@N|y`=?xx$)o{IwT!~DSdN)9>$L2_p
zg^t!E=Sgq6WkT<EVG5RGU7hrzq;6r`_JtyXgA+_;pyR`Ks+DZe&U0L&Zg}u(n<Q@6
zb*r{wpq|^j-imvBDH<p?_QMFQ44K6V!=sW-Pnx?jHj7dPwhhL{epD7vEpp4rdsTVr
z&o*)*p$=EBasK_c9Jhgrk4|-}1I@q7d<D!8ll748-YJCqX}m)QOqS_@`7pyvQI*UM
zi5t;=KjYP2g)ELV1BUQ<a*R}8Egwiu?9LN4zAM?!m^>#^@p%w!u@eRP5vc4Cw<l7A
z;Y8}8cuDfGiL(xbN~PI<se+*n$u|v(6?!pa8nJG%Z3Pv}wm%~qxQ<CvCPa<l!kVwb
z?VTJj-Id6`HGQp1Xa}@3OZ=nk&kFWS3s$K*^q2C<xsF9-0OnKt><VB{RW&G844J=^
zEW@p(S(+3w%Z2w<xLb_6%ZXnS9N2}GVM}+EHyUWF)N$y_YJs21I}H!ICkymt?wW)4
zBEdbl<OP<0g25_U7uYw~2MH$KtgCl<c!ZOjCSox2Gr3>H1o}lQR*2CiA(g@<vEyKk
z`z*+ka8YG|^OucHG;smNTBCc)NWx8J`3yPALwZvSMpt8hjf!IJqYy{47mRSV;gEef
zGa}Qh<FWNUsOV!yX-wf_ca_4Zy$-&93uw)KUHdI7j^e+3*0N{1aTczNv@<dGBg*M*
zTCMXwer#q73_X|B%_b*TUN;)t62i<N_k_Qhp5b;X)mH9t#TQ@C7id1b05aI^GaqW*
zXTi)X&X``G-}ES_dg34J^RhVtg9*jsJr3p%<j8^RWlw(IC0L^71B7Sp*I|)kt{jG;
z`R@}N1!12Q!I}LvuYph!LR4y7x+1)rl}89ylpW!R8Sa`DE{4_N(!LwAe73EY5N)4N
z&fmY|sbyAw_VR3E8%GdhY_HNAu6-AK?@N<UJ*~;qyR*x;yy?+}mIq~hf?5!Ak!n0L
zE5Fy|I+eyGL)KD)K`rxftd~J<`RR)^H<bHyMPi*&RnA>EFijDrA4vXm?oT25{0ry;
zAA2!-WpHK`327%C-d_UzDN-|j9Y*}F(@>)H)!zH0l?x7MU-BE{aOe@D?I8|zODF9J
z`E;_b2i%Qo$MLe5tlp=VaNe%P2fnjbn}tl_h6hIeX6IhNQL8h#WgzF{XtW}SN$jDR
zTKY#0y(-oc@tGEcT)^kn%sttWc<9Xiek1FO(2d8r)ZmwP_Ud>x47Asvg-BL1=K2~e
zfwf5BJ`gPqe{5~FnWjCkn>FaKy_Vb(VMu)-%A>KD&(%dGCp`E!(X!XusqrC;duaSa
zdneEZV{2LFp?HGgZtl6rhktbm8U@YMh<2$#W8Y)_{o{Uqy&53&+f_LQ&GS<ES0ke!
z+wKOM2a@ALfEyBsYdlbnc)M7Aq5cZ5H^0f<vyYXjQhRv%sG>@&zf_^{w)`KXa#r$;
z23`x_0^M0Lx_2)@x;x8f!t>yZ$9^yHvX^V_tI<OJ#r|jC_JHABi;f-vx!NVD5~b?~
z<&uwB<5BMjn$M0Dg~JKGIAs51PlocFyDHhQ`UHxvp5(&?PRHj@(z!)C0aQDXHVEvh
z>yC>C$lgdpNh_?ut3pd0yt`gt!?W?j%I71~D;oI#xjp`$Jc6d^{qmiDDFKH6McFw9
zi4tvDx@_C_E!(zz%eL)XwvAi1ZQHhO+nRcBBKl3gneOPxjFXXna>Y5B8TsSOwb$05
zOf@15oCB{>H)+Y-y*Glt*`P0=<y-(o$OD6KC4?gFhBRga*$_LITX~%$1mI4~B^A=A
z9@BS!(8mcynCp~R5bjBTr4Ku&FAAdH0`=8$&k4<KE^!c!QA~~hoL=UA`xMe=<n7Wp
z{NfDFu6WulbBP<pL@W#DTfBT^vF+=o7uKK!QAZAu8v6LaK`zw7OKQM27eXLS$0Qp>
zHO9lGn#R4P!Q7R?Inl)H1dq|khaZoQh7tk6FcB3eAfg=WH+Btpx&RVFnDycn$aATk
zZ|^1aonapBfw@wHV2~#xzN2v=Jg_zq$K)P@L-1k+DF_d1Xp62R3soG5GPZ(+Kl*8$
z6rIrcOcEN#lvRAG7Wzx;raClCp#fxR3n0HGV6pd>3W>paBeyqBe|UD*4+hbZfuMS6
z1qUA?9Gm?FS<V8#7Y!Na5J(syKn-)R0)nUj(7tW#_VFR?n#9-D_%=VyJ1(>*4f`GM
zeZcr|U_K~EqHrcEXk=8CkKu5KrOHm;eJ3G&##B+_<(*-GijOi(=-S{TV+@&L<Bfc5
z2WT&rMd(H<ge18sv@+GLmWMtm;2b*Sz`SaJ_pqlM2C_q4;>?(mrd=X@U?-blRHWU0
zPjM$keb)1d_n-^1Ze>t7NZ<Ctxgv*0T#QsDhD5E3NUeZ-vJus-Aw`WpmAN1>3shVg
zU-nRM!N)N1Di6sLEnQY8?#r5BbCIw=ny~+wRYjNzw<dcR5B6zYuE~l1rfV{k>=kn?
zAuM^Mre-vfaFo$vT>2LFyDv3KApTW|^jwm1{+*F20c1`kD~%^3X$pdpIE+rwujhzq
zlCFNtu>N9=;2Bz7Cnc71r~<6?V#7T&&DF)y%EVLCB|@O-*!Zb>J#t%-W9QXM=^7`{
zc1T=P_P{H8)OhN^`>g?mc>}=W0#=(|Qr99tab0K$$3ck1@e(~(G-XCRiC<0iDp=r(
z0n#ae0X~>zf+2OfWn_%^adI7N%57!3vu)CFV$3n{nCEtUfNhE`ZtOn%mP{R}vvX4W
zfXWSOyi8r(*%XG;bfS9=*g4tH>LTETaFmS-lA8X8FQ3|l&+aD>xm<DN*S=u(p!m^l
zAH5rdw`Wx@-iT1ESx6UqLOTQn>Q5F7N_~o`2-dp}%d87s#!Sgd3(cH9gT)ft_A<d6
zu>D9%A<~bD26@}=&#7X6`$sh!DP>w=-yG@uAp;(&!Wc27D1Y{KXuNd)0KP9HZV0pf
zo}%d-QTK#+=TjiKaI~L22LdA9aq%)(=#?_<jY5>OQMe3Kv<x8)-A$?6q2>#&qHI%Y
zLHOgZZE86xyFf^(R<g)}FV>0@USH5sv}3FyRVLKTrap(HUrC1JT2X$Bm7qM}et10y
zx1D3U1@zz4D{^XD<%SORhQ`QwXH0U9xI#OLPR=wWizKYx0BCZ(N{6dDo1Q5|{P9!}
z)Cj;uzWT;=g-XMp7V(5E(6MKv;<;GFFftmBr)ru&VT$CRlx2Iz=P6!L5~mN9Z47Yj
z$5F4YJM&X066&X(WZGP3nv4C|WIpGp*Ci=pNbVDfPY+#JnCi3byG9NWsj~$psgTmm
z_(OhokoUmI#Fi}2371S*OIA$SVpJugzH=6(_Z^3d(U8-h`owlOV#=3rAaj9Hr3@H0
zXDYJuf=ROkx%<$IBkmehAgQCm@JeyEL+j$XXVzs!rrz6;<I4}3@WNNycOxr%C)+Is
z>wAi)=loz|0NATPp>$7n08CyII9IxuC~gp@%D<$31%$*k3KJ2|PI%WQRX#n_+?ELH
z95pe91TVB;n0_~jB&mvvrBjvBP?po+V=7V1%epM9o^5AkZC-_2v29sal3A1|L6!<P
zX^x)+aXPoqJC^{ix5KR~)^TC&f26;1q9<`l{o-;0;|$Ks(~QduU<8DytLlH6@=`8-
zGCuZl*)TB14wtq)tQjB4`2)7vG`X=Mw4|Pp>0<X=`WT~zU$-nc2}WlhIB7NIE7X3&
zbI*A|+22REqIUzdRi<5lbgMVqgv)8W(1&ZX#4cX8|L|Lc0y1v*ax4h-<aRKZ2bTjb
z+<Y+tIMv5TOI*qSFqo;qYGWQnlmliX@sII^r{P<A568ABr;<ZM%FrAM+h%a6?CRN=
zWaUo!j8Lu`|6en&2r4O!63JE+zR0K)tkU9-xWS3Bd9uq!4}eVIKaM{EE9l8q2y&f*
z9c3xZU8{de)3GY(g{{di2d^{pc=?YJWbi95GHj~Wey1iau4d^?GUqUHrm~vRZJR66
zj@8atP8MxXPsQsotufo;tnMLi{sERTqMBxmO1Y;w!j-Y?DeHatv%ebRqd-NdGX;zB
zV-OSVG?o5VZDh(Z!UCtMex06$uL`$vtQbiY^(XzcJ%|bt1;mC^?r*HGU6wCNCes@t
z2P$@%(CpJbbsKNRQM>*mhw;0a=69=cRObED2>YjwdX*2A5^r<~nhG|HX+`dRwWHuu
z66nfq6G1epbvbaw?{5M#&EVV7bkSI3%a2A7c;sS>1o=gcBi|$K!>K=q5WHI;-byL+
zI1!^|e(Fled+4le2jcubC3=O^a;Ka)QAev4!Xe>p6f9@AZrB>CTq8%!3;NW4K8#@v
zK{8doZ@FdNKp&%}VL%|z*A0Vn>`bV{S!hJwp>iAguMt~yvYNaLdn3#Us?l9wEcSfS
zzbYs=raEJ89Y9bg>!4uv8K)s*KX<i&99P&pOPI?>V7Ltz13AXM`%12KzZ4VF>kreK
z@X{}xtB4^hme0$WP6R`JTU2Sy`1}f|yiM}|D6XfV1866ekwD*CJ5J@8%H>8*O82`t
zRKCPd-t-S1gx^w(5cKyONhDbgyj}Py(bbw;n&f!CLiM6KNC3`s4urf}jvqbpuNVbW
z;hZPid$Ts(kDJ3T&a-U%^1V4x6Xa*Iq`zsasuoH$E<H1@%edl0k-E=G`mxQ)96(J8
zu(g#t<6?D{)mn&j0PSchsA#R4YHt7@(il+A+)ORvm#8F-FV6EXc(8^qqIA;ub}0(&
z<GJpDq9V3b6@uj8*3XVjo_wM@oqhhDyMLr<eRNBBoZdP&JMp+Aesj}Ln{bYQar06#
z1U{@2fH>`<rzD_H@BO2NM{|CwP5lBJ#K&^!+@|?}tG!Vgh@gVHmLB{$oQy-Q{&1#0
z&t)STz@3ls#s%NPAvudK-}u;T`+j)x7X*1v<kgn^@p9lL*Y(<EVbXQWGI;>UN{X)9
zuHB{`@(HW{(xSl@98}ob9#2HEA(}tFGNrlV`!X-nB`i0<=8~t%zrA+z)8!lMBLlpW
z%5@L(S=)h4GZGvhI2QA01m;m6u0lN*$bp?r4{P<c+}BG#!kkdlk*(8fqQ;XcsN1cK
zXT-Iz+xxL6)!~7ZxeT9Cr>>?lgq!<}I*(iJw6QuE+QtGZ+O<g)qMDX)IOZkpUSe}!
z=_wTqc_R7%-+d_)@>C+wayd>LYwxAx4Y8izgWrw5bpe;IvQ~tOzHXy)JVYy&4@ZfS
zGi^2lPfce(QS%|NvNI^_1KkxyV-<f$SbqV&D%fPi1Iey2{?;OZ(ekKz^86~mLSz(3
zp2d_stX$MOqQ5-HsudRT=>GE7tA3{S?v^4Xsh&CE4^Kabdcyv7DknR|$E=q^XeaK`
z8cmt=+R@wcwpGB>*T7HqUrOrB#o=Dj%qQ<BgE&X?Z;QMgD=#M(n?I-af5wc*M^7?B
zU?;^|t3{njsoWNQK9<3FjL3Zkbv&KJIwW;_TXF@i!tCTKE!jfO?+MU}BTy5<RG2DZ
zpv%f*g`HL;OoX>Y7e+NEAVEqR5$P8CtiD)Ij5shev&$Y?c<edmiSUWOS->O429FM*
z|Ijq>qk<nN)%nn5tNGU+t0?@bEWNB6AGhu~V^w!*9yxBxI%&#wa(?1(pKa^*Z}%P-
zdM9@RFKt8M;UGTIRei^1WizBph4Nm&Q_`TOIjn3Y!}GQm!m7|AnX$#KvldIW<uJAF
zjQvEP>M*@t%MXxQX@uWEMqDe^U)N4wd4~``AQJ;%wx1GyuydtWQhNB@Jgx&=*`lNF
zpRZGrnL>2*193V%m)bO~3ydCGk*9<v5B6rjsk`*oG42Jr3`aRNAtTd~<~(C8S-zuo
zOf%gW_C_`!TW_I-i$!x{s$M=b73rU@r^TDY79A-qG0&Q3V#L0{eXYc^y0E(m1<-*E
z^S`$H+C!$C?HEo_ksvl^VPvSUX{g&pdcPmCUS3?EU%!y5YzwZEY%yTYl9AL9Rb^Ek
z;pLRj5+Cap*6Uu#c9cZg0EvmDaKn#8&nhWqzm3ajmgci{{YG%i(_A56iYx`vTE3Qe
zn3ejeZ~8L=Z1;R0$W27M<&XFhbO{1jtuy?VQMdzI^GkU4&7xKcERK{h6$x6yTYQi_
zfJXDIf>4QVAC=};1KaAu*h`@hX%Af=vW~y*d1H5B)l{Al2<zR+k(W%I-kZ8vsq0N+
z_*wV#%S&TJ!YgSXq=V#Mt7M_gd4TzIC)}!)EgXI<|64z*%f!nw6Zq}?2M%Sfi<wx_
zJJ|;Ie)D8UP+jsu7v8a}Eb11<d~TrUxL^m)N5WAzYn}Kddsjxg2T{vLOLO^PUJv<?
zm(T89%Vzdi1hLke^L#fb2S<joH^-p^zUm;yI|ZoQZG;3Qg09*F;cD)o=&i1ATxro5
zY$eO}<u|#M_H)j6!InaHl~6wDs+`ehRZYu*T(%b9hG?g2r8}akL&|r$uG567Ysam<
zfJSX4zR!cyHelhS5q=VAmJ)oUSGYEQR8ynlsw44nDWJ!=+ogbLNLi_X$+N;Gp{lNB
z7U0uN=olc}!8<zssllRiFo)1K8N4Ivz<G)6@qu*A&0>tl!5u5U3~`XhPbP9-{|8fk
zo&gNAp+Uq{l!d{s+qQkhRomWuM$`N}hximRCgi(yY~}<g5+E5XC=@K+Via{$#p1*-
zV3s&ad(~;#@~Fkx2{Up1E?$MC{F(Q%lAbqH)#v!{S9~5~>`lJ6<QzV6;Pf-Tw+*-z
z+D><-&DjR`2>JA|SKC^kQ#+~H;4cHs_|=WP%y{C>c%i}YsYt`ml|`u#lZlKlgY*2a
zI!`+Lp}ONlt?RnwyokW7FUFCc3>P@bYFT`B*csRXkhz>gfR59XoHvMRTfmyB@>aWe
zE!^>u@a6^V2`|>l^Now&hZ2aLsNKQhTZm2Sev~T(ef*7+S=f6W3T)W%c>*{_kZ#v&
zE_SeZv{v;1R_s(9et#p&&D&%n%Q4qAnOSSs;f9D1Qb5SK++<JZyhVs|Ya2WD-!7i_
zm^BQ`=i+0!LSDIp<KPx2-?H8hY&ot6!aat~d7Cp@$Jkk9<R!V1gzFjb(X9=o_G8xN
z@JKeGY^rTg>cNlrO#^@!aQRp%l7N_*@Q%?o#gtc^To8RA2|2|Pv++Um4SZ3iCC0T&
z%gu?X&q~4;Ll)b~uFkF;s!W^CPf{kGdlnlsgYoq~yNd4RTSIQPi*e<hishuh-ub#|
zlNN1a^eF>S-&&Ch6Wf8)HU|UhM4%rw2eWf8WWrZl#dHse2qScTl1d_hlxl>pJ#FMJ
z>>O9{KdahOpOA$(mS~=`5G3L;meta?YNr^CspMP8g6efD5Gm=sAlf6tcDyXpZYb}C
z>}3@Te18Kz{puGRx-FonEpmo>o`|U!mY8)wKUdC$$^Oa*8RphD;SFvv^nBEX^!zm&
z%sbBN_W3sjU?f=Y`?m+NsU=mP%|p#arqY+x#P5NXxwLR@Ww~1ad&AJtb(y!L4}pz9
zrWxp)qrZPd-Br<p&?ohe3^+6EF0`x>QbxyH;c0}Z)*-`W+g|C4P7oer{t~heS{mX+
zFgX03|MDN%(-$`{W>?C5d<H!a;R+T|*~j<WiBWBMm=0PkEZXEFx7}@dX$trrASZme
zTh`!+z0+5g{&RrikAzB`4Pp+UNU6TuJ+M%*f>jrPtIJ1%P1!N^2=E-`u*FfvyeGj1
zw!F7~%k&<diKS5Bw=f~1dbB>lSFi(Ersl4+^H=*Zinse#Qpqkd38r>0W5yksYc*@o
zo@Q<p<IaLBDCzSnHmaMCczbV-P1Dkq%PY#$Nwj+!j5*+H&#`nuM|<+l4E$6H<r<A{
z{K8h+o9mg{BVx6EPbD)ra%SiaY^PkYr^xa1Zw`9*rRODXBXBm)GrOYHto1LU5>(kk
zi=F$kAz0U>vl$X$v74I{*eUU@C)(H8<Yv_l<~)!z%G~3M1zV%PvW-#G_VCi5(nsss
z@7iqRT5;Efs3}gc^Q16d1I005PESCcdbBFh4@Rq0xSQyW3Kb^t5p%&e(@xI3rLtNk
zio~bW;+71IQ&_U1oanWsgSw_q=3qGA2kl?x)UK4D+j7(2+MG>Q_B-j&G16ZjQ}*NI
zwu=R27Gx1DzY#W5I<J&Op%oo}%d2ptw0nJ4%gLQ0sb#fm^+_L%ea)h*ssHi-aZSaG
zDqiSPnrMdQ<<}Ru|M^?GxP329Q`G+Gkuf3{+z~m1j7uunIv1#guTbQoUqG3Uh_Ssc
z<Tz~j1t;9mgAJ8jiuRdUF!?*3H_ST&y^M|CvK%=IlefNmUl&}_eA9_7%19RV$nRlz
zQQ<jcgtK=at`_&VFEqkujDM}saZVR?X!n6iL;p>NkkIcdGlu6*jczwrGI9Z9SUyiJ
ztX?Z2Fq^=r8wr}Zbz{<mr!~=sK)VT&62ANDl_Cs<*A@7R9k2)LVc9DZOQM@ITRhtG
zP9RhxM#YajUo4Ai3Xn9Q&kl;Wm_-2*XvWMX2L&P^=NY?z3I1x@F%&i2Mr6WzQW`#k
zClM>Beuk^7qpd`*N-JH@wMk*_>E2GM=pm$hN5IdFCdGrPfj|m;thL}U*T)bqipgy3
zqKt#isV2C4^Hu!sRF;BDh)=A9lIus8McD@*{8fH7x}>R<ISO*+Yx--(q7xi+Zzl})
z6wHQV$P;cd9IiPt0WVWO`-H=eCo$KFw8Z2KUZXYH#f;%oRNGIY(Mm|$S<4&>zr}LQ
z_8p-OzM0`Bml_EdfK9X+U{;PlC!nr<zEh2w*MBN{A47FahCjmzI!QDaPhK@0fg5gE
zo6SpJw^vT1RYqT%ythF%%Y)e-O#<!sYsyW_`}((_N)rhIzpHR%=H`})*Wuo)xA06V
zcD$RCMaEys*VrkBK<#2QOxu^vBsiaV0qG)E0o!B`qP?oFXIn0KJC$3D<B;Ib7u<P)
z1qB!`s%^8~Es)@h-(9_y+d;Y+Ua1q;a<5x~cbc8m@nml?#ihK&KQh$V=8qlIY7ZPB
zOuC5wLX?$7cts)&0JVnER#kPQgDZAAdRLbw6vUKz)_jHFz&l=ZE+u-Y%mggh#|5Oz
zIF-IAV%n<m(*2rH-!FG&(#oI3{SbDys|-}BjaNdYVV7M;yp43|OY6xyGkY242RGz@
z%^J#gf5pK30+vB|U_+Iy!Dj9K(zU<r4i5KN+`UFbjgcFDAGy3QA|F~U>0-`sD&|Tq
zEi>hDriR#GwvM4GAQ6Lsx;Q1cJ^D3`Jfz5>Y#+D>HNWX!AqTx>rVW#|W7)z>ut%Gi
zJ=7_6R$V6CnI&utq&ay`)!mNhxQK{Prt?9)9#=U~%8nDdqx)5?*c4<w9-<A3gTyJk
zj2{;#=6(7_yYjAcd5en=10Dt)il6Eg{u$IUSzv_=ekA&bD8}>AQzO;FxGooUfo;#>
zGgkOiqDhp!@wVcM^Zvw~2(&cwrXKHN{>XesDUn~dPUEt4>8>4eVU04nnEuuDxYCEf
z!H?Z^cdR(Mu>q5uc};0x0aZw)PlPUGeg4%YkGUOzw(=+mJzox<M1=MGli*o(T$k75
zEiEIfJbo*Zu7c_G1M(07_YojkJjoF?Gs2~v@Nui$W2onBoA8lDS!H4&<fq7Irg#n9
zDLK+mPjCo7(nKz7ya5yCtZgwN701GQiC%ku2j;YmJe`Q9@XX32f1+jjCYSbQS65MM
z8iILG3QXIq-tg<ntlo6tu`8yNlB}n_%E%RS8#TL1QUx2qtG@<vt%7Tk<Y*exnYdTA
zzAoEQEo1+lnY#mZ_k!nWfD700Gi}2ADU9P9xmky=F^qt%M4#kQ#_0RxCoci7kO*%R
z62}iLY|pW(PG(CoGYNhA#VW&{IO28Z*h_of7JkItn)$^VX&Ma+M0E;uX&b`E6XJ>u
z!e9z?dJ96^17edEf+q`lHyjGt4Jv^dO6dc&2o2Ret4}CAfcX9!;6JB={Dgu0#|HDS
z4hv4kj!ty{5e7074Q1f$1`PlR;^+kc@Xy1)R7C1!l>bBG=LGHFRP2l$OmzRH2lxbO
z@L%Ym{9FwI@DIJSTVKk11ONbTW&i-9|5DG;%}v)@-`s}Q(9Z6kbNz?*KgPe!wUN`(
zb#J6LdtX-}gog_e4|d2c9{we6gkass4YZeg>Ix^C8Y^E-Je=gCCGGXPxvUK|9$_dU
z)6QjB(Y3R@t*lK`ECgIk%%__ns)?hIoc%+BuR!F$<s&lfMwNkkVW&lPyQk6rhQr|+
z4bm*iBVQ+|E3?JV){`D>st>+n=L&Pn_jJ3p3nA`&+xor+$W}z00mQM!%I9c})2W?i
z=FM=vu8f6rbs#$oB0k7hSXe692GkpARTjwlUVFP_`JCLx`~wtk(+DuK92rkv+Cmk!
zDgYeuRce<UA#A`UE}xjl17L{|%u5o@2F9LV4)0RDphC>xXh`B<t1icvv5yK31P{D?
z1d-d}{LSS7<{ltuz7RoRz$ZXOP&v7GBC{P%QyiQGo{(yfEG$(30~G!W20uP1vu5PJ
z=iXne0fQZIO;`gWE;U~KuVll%h5#pPB+@vf2~cu5yGknLdb1gLhGG^mk#}rM^i1I$
z9uhH@dec`00kVS=_qujCMWceD=1;^IgCrG18K-8h-8Zm$0r0ADeUExv`Q?J4*hwS+
zIkDOr27lG%Aa;3ubEt)?pK^Ty)<e*E3CP~MlmMfBU~Wsg0xM4^J4%W$X{dqGGfXoz
z@(|1zp6`t*J0S(PyuWcQM675p!T^RVK7v&=@~hrNup$mrhymoS7F1nm-bl(V$}r~Y
zFdHs(MepKE0s|vpc1V8ju<W{3{~>yzz+jDC9*}5v)VB}d{k@&=egLAAN59Rm6*A!f
zKIW(WaD&sygXX40`+WD(t^;H6mmbWfY&DZ;*}h*i_aq8a09e4Uym=<EN^BekTCUBh
z7ih=Mv&i>>TPSrbdS=mmS<5*VQTmL?VBm3(_|DB*4ek7Sru72sF<-CV53{FXy-keG
zsyQ$Tgzu#sK0Ignw%!qcDda;Y+V-LYU(O~j;(C@PQo=_;i(F&*hAOzF87t?L-Vduh
zs-cqz*@CzV<1a^les)Ofd{eD-G=<rx6_ClTzmXGoVO%XhmJa4oT>GOdf#<zBlLp9`
z<2ZjV8l=xr+JF_0pvaO-iSuiFKjL7ppo?!`9SodTtZ)~+nE%2IX9{#nD%*f%&(Kp;
z`mI>A-sVhu<eP)#(+Q`*^x@6y&PRpq6Ejk#Ps%6P&iGf_qs2#ZVMH;l32t{>xl~Ph
zj~A>0BEBuuPEfs71l(!=(nY+N19Ql#`8ps<l;JfYQZ|hdJcf#V8is?c_6>sx_Fq)c
z?`O5zq(Cp2{hCe+<&gS_k^)u<j;ZSQZHh7%^n7`S`TpWLLQ-mn#w+83+T!z93xs|_
zAo)et<tp&Le36x<>u1pl&l-8*vnsXjn(65YseyBA3HVB$a@9b{&dtgGGWdvV8<h4v
z0ZX3_>FFMa>9}Wf1U85`-AMzZP&)-TIDM<&FVWOA5=|?V0>(<51mFAl2SH8~FnL-8
zL$#?`)GSm_o!9+z_4anb8_G6Y7w9J6*znoQ(1Sb~e(<$cjRV?f8_m)4khF8g8g!h7
zL9v9PYz^8AUFn4u0UG#1XJSYT6q>$HH$ESn)&)n3x*LmUWi~TEpuUEfec(7`yGs@R
z%Mm~grzDwjZL$dI+R4*o_@;z~8Z#=R#)vszYt%}$dLB5#RKHe`gD5({OtSE*d8>x$
z5;MCvafKcdR&>5=mZ=+wV=i8=DC=hadF1KZIdt<InK=(k{}l%`=Jxbx5whdrd?Sh;
zAz*k9!QVJIPXx{MZ%Fo$o;A#Qu{jl3%xi%f_uyQb!JbdOp7Xi>IrFnWy$N<~mytU^
zK?sj;07D}>+<dF{qz~6>Nw-Fw^4a2|erf;b+aHPKUMqn|1Z#_J$euW^3xOI1!BD%T
zo(Wkif8Ezw&tpR|{?J;4dPnvuCQ?!(>J0XG+P;lnPuw=l<Ixkf92s|JFvmAtE>4Q$
zvg8JsoU4EffoM2q{60&P!bC&H1JxxVr(!Fyv%>sMk}^xZ1oK;V6Z75hi}TuCFkiU1
z@iN300SK7%Y1S}&g$O`Vy5OB#5A%8p*5^0D!O+TaW0~ST>LQ3N?^F)GnWz+sIEnHF
zyAI(eOPUuzwc|?6wTGGs9cZJ>-Qo=&zv5+6K;z{k%537-hFI7UlT0pGpI1nMO{sht
z9s~U7^z=h=drUB*J~37a51dN~X^R4wtb}U+kZmwMjDu<ch|s>_)B~Ayxq&1ZA2{_Q
zEn1vuIuJdL8&$#$lYzZ!2{T9BmbD%~Dm`BuEc|(I8awa#^!U0`qls0oKh>LuGBuSa
z{LB%IxsbvFirT&p-b<s(sTz6ko9vgrpc}#}x~a_|U|mu1WMn`7Yh>pQ=Uf70{Cg?C
z5n+mlj-d`%HP;o-M(WVR5W^J?YmiFgjD65hT6SSrmv9JdqrWmMwk}7Hv5-PsvFi&J
z){5M(oU-7o^zWp+tyPKb30vKR&u)V-E{|~r3$;D_l%tsyyVq}@ppf<moPacH52JZQ
z+)_QNSJy-{eN;T9=w_g2gjv?&eQxJh+i2hrh(Qr-N3_dR)v!9~>!mu+vPjCr+Nqo@
z7ExXUX?zi?6|8XD>HIykn>|7IJhPO<%iHo5n@X3p$=PttmMNgXsP7z0c4@<;{9iYc
ztI=$Ay=xWQ?wz>)qzib<g+U?bvNi^#L^n@y?6wY|U+mxt3IeW~IPtCi94y$2&Zlio
z7woe{yYVLafu-SKQ%2Yh0-~j7(gG>12SXUA^2^X+#+iuJgz%JjR`8lO4WT`sr7?pN
z6A(m7rV4or=-`6}<ww!oT{Tws(Y;<HgnEd^(E-%u*7N8!Y~}&7P*yJ4cj^LlM5Wi}
zX`Xc{gv&D!(fUq?wW?Z|hl-R`bwV+&F9G98=aVImip7@pJ3M+lvl}jv#YlQ-y^E~y
z6i7B<09=AJu$*TrfnfULbCYCwjZEkA{Thk$YPum7qt`M+V|2ihN*9Df+S|Ms7NF0)
z1)sa+JFz=DtxpkOP@4ABkmrp+zFcr+Osw*wg>&_Hrx@~_X7f>jcu$f+Ho^>v%#Unk
zuNBECzu~Z9%5oVP+qCPU)m_I!b91bz*ij8%$JBEm(m{b=+d4(1XmWRIcZ)<&f7zX$
z{((3+WdZ8G*smF(SGxc;y+%%9QN)73;Z#l{V=Wnksg2^8+_N%HB;u~ZihazQCE0?;
zEDh9E<?&v%h@eMN$wH(G8~uY{2;b`Z^Tl?Hv`6PE_68JkDf)xq^+I1$WRe{{T~sNt
zUeecW%T;8{*<ZGXvk~+w(cp0Z3t*Ix-AXAh^U%UX$pi_$idX{#J~eG=q#@KhR~1+Q
z-KGV7F1ytcBx#K~eW4j^7B?Gse)Sdi8u`=~mL^&=M|`CNyzF@B)+fE<FK#x&Hl+=r
zSw?biH72T$-eJeW?U@}<1~Vc_imqK50T3WQLsHb&phMhRkM{EwR>J6CC-BI8N4~#I
zr#{NG=U~y7qrotaQ5xHJ5PvmVZ4cus#;l$0aG;(#4Hg=+XN9#H<oJ2BuArNch-e})
ze>LC&8X}T^3{YK?6!g`J4}0|$9^T>lEn5-EV=6Q$A>Nb86a3WCC51mdjWD;7mNfKD
z9dy0j$p2QIVRNGOMbEWz918Vn3kij@B+}fYG{6rEXbcXOF)uTtju56{La0yk^vnDZ
zP#}%UCNQ^L`Rq`ddjN$dA!{ZdecXc&?+Q5aDU~v3PP&WR`dpnWR{rL?RiP5+nAM%q
zcGv$alT?D_jVRZ*iw5$Jt-%oVJdaP-f-+9vp}J5<S4}jCjaCGLX2QtD*uol&h*sIE
zim8zN<y?e*6Ry}_U7NK(35>bcJ=Fb<s*UF{=gTz@MN-DXOITKQTz}9+mQ-=ta`6qt
zh=rvb8D14%2lpBo>GLg#`6;IvI`_=O7G9%9Qv|lu?7X4pCq3Xa>WGDrUbF<2d{=-V
zC1S)kT*@6(6Gxy{`s<+v4UQEmk&sz2aLAIr1)BuMi{ND<_{Nx(oH9KDU(ho<uX9^;
zzpNRWK^n0ie{b2WV96|Tuk^B|Lq&n>F8<SLl{S$!#tvl``3wXVvT=9_f713+m?<hi
zIMo}D$Z~fop}Q*^E})0&SKu3H7(;q6d*LkLlcu{-dM=YIPt25ST&l?lwjB>>PF#Ja
zRx`$#MQ0D_5%fEyHa(?Z8p3WOFXs%!)}xiybM3s1{eq)z1?$U?9b~_b#<l_%Oqo`b
z<}l3`;TB8=7f`8qI@{MtPoEFMc>rpShb7+^*T};Z=-FwFY8s7#z2V(rt%fS`ki&qQ
za8r5r9*j63p0|@!)9m?8F_X*&t{|~Sps2XAnCo}{J&{1RqnU8AsF-p_6NT2Yt+^=U
znu)7{3}lQ=L-9VHkP;q)dO{Xl>*VFR3~xi``@&vTci7fu6FK?3ec>H_0sc_nN}?et
z!EuPd#CCc?-UyCI97ie@WRaWmyKjVAevV|ZJzX?eEUh>!@Yn!dY)(R`lZW|sgt=LJ
zT=J@SSH9!MN4xZ+*{Ma=?AyTzw2k$&r_M0mDJ}dZy8%)gx0sN}!=H(!0EL1KpKaTZ
zbPn9L;{#mq@B`tNLZ25fiOO~);5dC{tmKh17Ypsi6QGvW0%(JHx8puJ*v@$+&&)JA
zEVRtcS{3^wy@W>YSXcVh@daq{mtUk^zPs-!7ZpXcQRyuUc2bI^b@z<F8z)Vu<8i<e
z-e(^jD6h1($;FC8N~zzbK<hb#I_gR}CG5uLUuA`+@sVwC>8s$ucVV^FlS4n})KA}-
z1eyp-1f0=*4;H%8c}M%3*Oo{Dk&~ZW&A!33J@A5i^OI3u3siZCF7o#|zb&9D2cnHe
zwp3i{rRzWRJ>H1a6SKDJ+PAa^BoK7gYGZkg=uA7;tl(53i;4wGc#ji&Af<VhTC_8H
z*AQFd9@5rZnnwgdq=C5D@Xzsa)k$V0T}Bjx#pQQrm;Ro5(Uum!qydY*l0uM!BeltC
zKf1s90guG)SmI%#qw+GU?_zmtc$7fYPSt%Fkxvo5ZJb+hgxiwVlcY*|W9jzo*#-3z
z4|Qu2yuQTuwC08{gwsU&HH9%b=k(?)PW<ig8I~2u>^%7M)o$x%4^W4n<)`dVdwkL_
zx;_l+yC6H{JBO3~_0j%)Yz1}n<ZnwzsZ>DNNiNbUFZ*P~Fmn8R&-~?<*oPtvFJ8n}
zY%)N4)>CA1zw0R`sp7ZsMifmgqcPpl)k0F@BvkS<c@S9Pts@l%+b2aV6nL^=;S%`O
z@q9IxL`efvW2c?|e3C+xXOq*5DhX>g_tII~7^x-JpM?UIH;l!|kNDoEPkFg{W{tPP
zbLi;LNIC4NP1!=jqY9-(E-q)fUvtXe?z{D^XI`U+<b0K;tGX>Y4qs)utIjU!pv>+8
zTXj69hojKDbrFK1)1a#;{imC?;l*CUt8y)Yq_MI|X)?+@Je+$Wj$hBXvL$D&<<p90
zX^pG(nV{P4Ve~FMiOj?-0wcEZB{s&qB7#0+{^R%ry9NFpnqGPYh+}Q8*i4=w%+fr-
zgAoUO*0|HAAj(1M*^=WfkiCrLfL`w=+__lI+g&o)%EYbsdihB&B_LcOsZWj7LX-5o
z8cJiMc8N${sDrmeNVh~cCX}$u)4R29y5TetB3YxLW>AG~uTyy)gqsa6zni3f`=!e|
zy(>YzF0LNcC&o`JxZpSxNC&g}G&k-$5l<In8Q&$SK0kl3VcL=~W!7Q)Ff8L=f86bP
zUQG<7{ANv`aBai`YGpwhrMg?jKl{V?@^6Jv)AEsSN<aVru*d)aB>yE&5t7ljG?q4Z
zbaJG1a&!6*_!Ij0e*u-j<!ReBdKB;*E}uc<^<11jiv$oxb8xm63T#MfzJkq)Sday4
z5kwTo(zS11?76tQu_-bk+7U*`YvSWhFA;LMPA<A=49pnJPti>hGFPQBae5PmsJ(PJ
zes!zli_#U|TW4k|!4%Qh%jXM*KWfkQbqDJt8NxGz{j(6jXLqo!NAEXkyf?<NFB93G
zR(Mkz5D43l3BDrC4<pK25(b=UL3rP@9I)4>xpF`$cXS?^vbfL5M`}xT!A+2A8cPeh
zF3dGD*kE&Y(O-2CgwQcPiP?33{Q7{0g`4#xpbe!=cYR+T8hYmv4$;)n6dSR+a*XY5
z;-0rfXjWTAwi3}B50249@^$7EGc+%rsK>iKew+5YJ+obBzeZ)3VlyecF82;tJPX^4
zcas@ubhnbr(|HrP-#RuMlh@A>9Q8k6nlyv;uQ-^ssax|oN2#=)``3bjh*I$~?o@*r
zk|yg8h`|~E{iJZ9M_W82?#}t%?GWu=L6<)SW8O)1h<-%_|0XUTOCZA$o3eMZE6XtN
z6KL8qU*+VdgIo{}q-llF)DTu-4pWGYpWA29A7s#{DY2MR8E$Cll2~0|eUupko36H1
zY;v>zlTgV>qj_TQmC@lE-YgJ_saPQ4&K!4|*m_Tb#8{h!v-F)w1*=ztWMbjJcwY!O
z5!VX_bY$kgm{2sD-+-#1g$E=CeW`N9Tyv`xw-Ve(mM0c-sq!{rcbc8wKNdm-rVL-5
zCB(RyCz9!bRfpz$7B`}~P#ThFreONZd7QOakokwjeZVVM-(&yhO1_D2lr7sI8aVMY
zu>S3Z{hz<4_fGS6(h`%DG|{e)j!t*>Q85m1H(~NO@QVDXE|3n+53>h~@^()4VeoLy
z4!1B4&TzNz;R_T}GPI*~;dGJ{Qlrz02M&*pw@&jj2YYwIY#bzw%pAnsYQ3}5B7P`R
zwQCx&8i{DS@fuqGM#TRISp9b-`tM6{F*bCvb<lOtw=uG{{@<AOe}qLNbol=e{9sW4
zCIA4kf4eRJS@Zt~jjoB;WiNN<MITE?+o43-yYQ`qU5^p0ThZ4*+_5`4ve%hK4tdbW
z_dMC$ZQH6ivxy6?Oi9z4k|npDFRJ|Pi=5mmT-+bWN!E>*guK1Ia&Lq*M9urAG9oq7
z`YIv$9)`fn;pj18K3vm1W~_gsupTxhVu;y%<8F==a0Z%VZlEqsmSO_MKTcfILy*Cx
z1SJWx{Psnawpnu5t^H=PSEH56e~k{!DwD)cf*KJ)Vz!}*sqcAUHe9mtl+T*se0RRO
zwmjE!&{s*g1u|4|Ik!aqCJGZoG>#3Oc#O*@NAdvB5rTS2ocu(Yb4%WA51Xk7F*qw$
z-`lSF2OMQY1<4v3A3)}I*cY?8gQ&*{Vk$(i@AKI=7FF(ZJDc{3VKD-V4*{hem}X=M
z5<#l|pyV}jWHXF2wMQ6uE@8MaSO{A{AYvem%cPi%J|jI<W00h#%YuSPDb=AzcCnR*
zXD_4{6V7A5=g}V<1Q(AqJ6IK+kCz^qh1TLj30qQd{0AIW3P%G;;ndEv`-ZO*2d)b*
zs%<7wYF{%5F^j|?M~2XLBG`tVi&|RM5N7EH=&al4d<dK_0YPfbB}iN8m*1GAD9_U2
zzLUyBBB!kL48%@``~zkjBOt7lfpCCFA%I~DRG>HmIy?M{>OX0hcM|FTTN1sGSXYoc
zJA;~#F1&!R&|LOuR%IBl*oWcG2-dpixVPrJcD`xd?n|UnZ`;An0KY;9`}-T{>9{v`
z=w0YU3%(7vT_zC0$LvuQcby@3-qLyaQucZ-@ctIU;}g+|YdI595%*E%z}#{I2kU_@
zbgGfZN_#iddF#|gR5$fp#B_l;8hvEW-;V{yS!2J7C9v0x{e+7(_Tn;n{!Am&vR%ef
z2s4&$1^;pjBI8&2x=OhK(m?m(byP5JVilj$&W7k~#eEeG#}3wdX6`0dT70ZWu5qr(
z4;_V^>aqEuqhD70iWR%)3F5@+!(Y!Bes)M}OO4LvT*8BHqU0q{OKxVm2`!({c0<Qg
zB}`Z`RxKCL>(s1q_7}Uuvg0nYx$DJ)T0JYZGDggGseJJQ#=FeC*)f@L<&^=y@Zp97
z6pFXY5tGWl$dzFvEeT!HRW`0~+Z0$nchU2tp!A_rZ%)UCZV5{h7fmQ9*-LttDBvZ=
zF5$&m7X_!gE?j6Yb;gTUd4KSz{RP(AKkz7(<_{i4bHKZQ8x^KV_nL4o8AS`40#&<=
z!9~&mM8<RiEzaKvc3x>yB%9g#x-Jywko<rz1{;IH|1^WMM(+=-eKQRA`A%~PFWnw0
zUyBZWu4YG#;P48qH;&zU)%z)U%0EWW;rtp4%6)IgZi~C#Y$e1n@2e&~$j)eU7O=Bx
zX?~8tcke|a{^sHvG9%l#p=LWOTwRD6C-(DE!pbws#FxaM?}rJn`jdqZi_QysAj&)7
z>T1tvKA6gT95J~1w19w$7_yjf?3a!wvk@{lxvvDEfW+!L%|_l#q?L4R3`s2Z>_rVE
zI1viQ(=u9V>d)qi%-(anXsc`K`Mn9u;UBk(Y>q{a40YSB4bPcid43<r%52m1Wj9w}
zby-~uAzJ`pf)py=O>X04DtPuSHWP{!c*78OJwHELjt>61oR*yfxc7dC@Z*J!cgHhT
z49rH+(`G*I7mnyPM5Lk4)ElGF6OEXF2k8jOSIV*KfU%{&*4NQICoE(RaJQv;LNLdo
zvqj*|0KEko>_wcD{{<(+Ux)W~*qew{J4|hpT)(|#gVF@!j(fJqM##Kt^NANvYp<(t
z#D8^F34qf&Xca{YDoCA-DZM#C`eK~;){J;0D<~b5x<`an%t5HMTlnf)OVMHAyhA?!
zF#<DQ0vS_O64(6LzwhDAiM-o44!<Kg!eS5mVA>ffTrf_s|63~rmsG87Mp(LSj_O?4
z+oZ$bcY)9E#(C{V_HQ_N@nT3-m{6FOOSbUr*m=L+>d*7@(c-U~b=F-}*pw2YB+WR#
zX6c_M0ZCE4*~t{~$I3sv(;{5cJ7943??K@R*`T#Cif&xPmbkc1g0eF@s+y%85!IsP
zTYp|O$YqUYPWGg*VEqYI@OPK}S+}R>S+}>gA^JmimyctCm!pTnp1v{Y^;R!$T<{+c
zBbGS?j1Qf}I8zH>P%K96S|gajGJ}d<kKqwWgMdO^f=>ezaj@%cAz%ys+u-HdztGpw
zo$0Lb!D9e1vUBs#7(>~90yaRVb_KT>2|~-Wzr|}MVQ#pI3aBYkH@>0b(Y9a0zb;H_
zZ7B-Yen6#yt<66`<^2z+#OS*PV0*_(X2(J0U}nQ%ZHRWA*;|PxU!q3h+Cq4*`U(d)
zKlN`=VsNxyj`NF_F7PMZjUiz|V`*8Ywgpk09Bo>`cw5qn3C}p_2DQ2HJg~El6mrT_
zH<8@+QXS2vcyf?bHE{!v>i8ScWhO?UI~p$k6I4T$<vTT%7&R_AXBDF}(8Ty)IMJ5<
zzJ(JQ@trg44qQNWbJY)R%(X_Tc|Sc~q<ws7z}#)4`OGz(0Bje?Y4(PqMqf3OKthVm
z+duoprVrtRvqhn+P{vM>KgdKyXK`NPcGYTbLef{vLVY97o9pLVcf+24xGY_yH#XvF
z3@c++lH$Bkc`CdIu}Z1d3b@p1hVB<K0CAs{iX=>XnlHRY{4|!PJBfSBk@VH*;SyYy
zr@o`XSuC`%B6NSzT&d8v6)4Hs*M6Zk7D;OElZxUQh$2B#CB4@!I{|OgvQv@Wg9uZN
zqYAN1&WMocTq}fXdjozf#h0q+D(E~l$F7#^Gq>>swuGc-Frda5G1_Yr3b6kB($m7w
ziaVN~<TL?U*z!0p(r>jshuN_ckjlH-A=m>;zHATEKx>s3T<Gx1k-iPg8xaS|OSS4)
z#K*6yr7HLl4a6)0^U(Bx$$lEs6H_5V4$Dl5j|QmXO7bzmfWrK5wQ{Rgd5Oe|^-L+)
z(#)C5CGEi^4Nq{!lW;F3{x38f((sy93VCYRB{L0VC_H%720A5BTAEKBAa#$Z9=d7!
z)MJc^Y*5qlAFvt!1n!1e7S4>l;1IhylyP9+<gbW{=L$PA7d-1kvWB@p^>UapOsBa>
z(v}y_BnVn-EZG~<7s8F+FQ&Uu?1q!2U>r!x#lri*=XJt`+%8sGD`C0OWN~x39(`Iq
zl~WYW)Eq%7SsQsH9B_bu(?mIY>dxUz$rzS&9fsBmELz0EXq~595-T{<+U<tM`1h@z
zN1eQc-McAHSZwc1S;gfm_ay*J1YszZo(_CJvF)mkql=Q-Z9}`&duMLe#^)C;0;zl8
zc&0slJCij759L9Iq?KCXBP?`Kjk*h|Y-P0j*t8Q9#&nLkYBd$4v4{}iabL`fmeB&g
zto~uGG?7__QjAkv0y3wN`X~+C)M?#rGB(UZb98ubf*p|-FBBWp{!6!%)BU~@>k)`t
zJhLq8t4i74gP6grk{Dfrw6Ns*uhWu&Y+rb(GMaL!Up>0`M6hHDu5-BbS)(Co{s~{d
zjYDiMTKy`v89d5EA;I-Z)Lt~eIM&o&be~!fI?_?{tKLJY&cfBf?rtAiFEs@Ug4$=)
zTe5tATGaC0#=9UXVs}apd-v!a-bYE=Ir#Id2&>B(Pn4_qq4=q*P<c0mG%Z&07p6YS
zKB>aNNf&}T3LV3+SB$PX296X@BQWU87)f!9T;$)-dm`6D$|NNn#+Il+8L-w9xYT!3
zloi|}lUT#HWxGn2>DC<dINcJoW_^mxx*~igSe8B%N%GFM@o9R<JWhvI3;G=i`*66R
z261pG_)+bn-x6@sp4Au>;3|3Wed_z?_K-Z6lpN~n2#3ohOGDyB8rc}wH`a>Rz@%cn
z3x&^h%T6Ncs9U_Sut0aX6NtSpKltSTQED19@5#m@MQY@9g|s|><!-H%AT7sBL3Nf8
z9ryiXxvea)8fYLq)cu_k`qfM$Z2oS^Cqb`1NsdO=+_<ghGBH4MzyVw_$<P}nv`RCi
z9M=+4np}LqiUeYr{l`NM8ay3TnUI-9@SYSyOBWf87s2Z)@rya#aPsISWM<2vp?Tdb
z<I#nXmU(Y4<b@?&1A9`Edyy^9RldwwarU5ub9r6`JDSKtw6T#W7YqL-|Fu$*`Zv3H
z;OH^C{m~co`|$cGL3DsC>2E$_hN1*eSxl#}TaBhmM<)|+1o;^JFwEpuKsFYDsE+kf
z=ZM_WC+H0Q4m<pZ;8~C&L29yxuwa2No1@RR5YrSiPagE?GUGc36-L_gyRp?=e&af0
ziuW)3J~16<SbkITFTEmQM^{qiYWzs9GGV}9;(zABTo;~FiUA$qep=p@s{|o+iA5qj
zFra3$VQ`>)KKymk-$>K9R<ib)hQ>a&SPQ-aRr_hU`1UeL!0CKO>aarOs@;7WYSegn
zwUUN_xA`q6steY10m`{=i41k=pHl9%<Ke2Y@7-{_wb@2atmLVwj`3hB3{5@8fE;^^
zZhv<E#TrIrc%ps<p}H%5dS?=pzCutuH?P_pK^03j6AoCoM=maJD<&6mm6=Md#mC?P
z{>J76F7K6+i^rn<i&5iw&;Mlz)_=J1dUnm&HHjw}PN!hRw~K6zl|Ed#=6XHqkK<?4
zab!pSy_9Gm_FIT8;$m01JOZU?kbYQ&4aKs0MAf*Q><MQk$yV!aW1g$VnYtlbK(NrJ
z{1Vj_5_Mf4zT=*w{ka&Txo&f2+LkQcQq&xD3Q{mg(TuwEmq{&p+oFiJEB`L)Cdu!M
zj$*97^J^Txt~>yi5*x?Z3{I$dwxAc)?Y1NRzPrD;mCFU~CjlZ}wg)1-Rm*UY?>8mA
z-ED&9Geo7gZ+YwZCq14yn$q!uRcI_BUR`-4=cg<@`>b+Sx2D|C;k<I(l@y)Fa-TEz
z#sq7KAq425ItU>xOD~rC2O{ly`BIT+ukYoW&e{8SK;@32l;+GnvdX)HFrb2R$8;<b
zP>uDfT85|B$PyIVG%dXbS962nnfE1lU5IJpl{p^7=rTqbxzi4jpLl2{kspbDO_wt>
z?<g#v$_ZJxyr%Oej?D_CX@A+uJWTU>$HP@EzPO)PH;{Ra@Ak8k#j;|wYQDcjy33vn
zRUjH(XBHfQZ81mI7s}4*Md{dAK{ih(<L-*{#9HB7f=FW}a?@0lxp=q_LY_aau`}d%
z9e-abnYDJhUwSyUtsq7$z{}5NEPxPpqY5g%$_373G49=k2(Xvt=%nCdh}#ilx3W>z
zKbr-uG0NK*ep{Ct|3#J;vGFd8Tt@{dj|927On>wpZ+U&Po)g|R64WbHSt$W(_bsuE
zO36LKz^|f2HDX@?(G|95mJ{ZT2`DY{JL6zSvi((STt~sk0W6fe;G#`(;$f7qPN$Vk
z+rb(%@?;8eXIV2@Op2PFc){*wK?a<1jpdTT9wCk8PR3{M>O<!}b0f*fMA>$mV%0f2
zHI3GVK2`gsV}Sb#^&8dmJRM5NfxqS2^BeqMSmqy0V|@`jA@K)4cmo0eQ2e+2;r{_?
z{tI(f<zy{X06oIcEsvZ%d!v-Z0(z(fh2M}kQtmoo(@*E#0u=mi%<{tY^-Z6bKP2qh
zr#o>{VP{ps*lx~BBbH$TuXaQL*QVcp(Y4x68DdVKo16vRPnJ=KZBl9fL{ctS3e1~X
zWuW4zQEh1R7)2^V!KfvN*9`Swgg9kEzHWW7HL2Wp{>9Hl^K4`nq-nN*JB)b){MV{M
zepa1rgyZe^v+Adx@$cp~BV!YD8*?XfTbuummqOb)J-Il!Mm;+|I5#@~6G<H%?j0(E
z5rH-n<mk2d#5N0hD0rI#swJjK0n=9G@0_CJ?49iAm&#9$7XpCLW(o8{H9;Adj*`BL
z+=_&`Q@*w?Ay5tzxW*>t`uX|!6Dm)vZZD%#9AWR2>X+yh=v6?XR2RnMil(}x_Dq8R
z6HWcgU1z*kM63!A0FXij0D$nX$EYYGAS@$7Yi;!3dFd)OzFpTuk-oKmin0EBHfjR9
zWHh*XA3w{2;W+m80ACa=ZxKf{^ehSHz4>1ry>)M!n*0{*OSSxa)R?R`IW;l$jCuNN
z_l;@<Y54W**Q{>28knD1=|IFI)uO@)yFtfHn3}}3>{OCksT<nhxUiG$fV77>%DFBn
zV7O-{EdW}v2ADzNvO-yZYiurEJcU}hu=s8{y~31YQLQ(^S;~affR9@Na)oTY@@rp2
z@~@2nB6n%UMih0y)GBaXz&V4`_&|<0$jar+TS5JZ>VZy>Yz1iw6Z-~~0RCZ44y0%3
zOB&&fAjnw@IGYnJ?j@00CaIq7_LD1GNu0fvjc`{gIF;B?emO%-%btR`*e$_wXF^C!
zkMPp5QaGnKaS}AB4KYX5GKlyj2A6^{sd@|yJF89&Kapf~CLxr<<5GY*(=ckIi|ui>
zFcRQ>_C-zKMRin3wOax5d4jtuUvo-KeH8z86ohj2JAwj=Ar4a$k$4>y0Qnmvs$+gX
zP7<p?L?*xfwv&Rul*dD4Z60J!<5t00b;b4=SjxG8z#}~(DKk$hV6*^W2T}JU94Gn@
z9h2NAw?bO2_;p6`P}SGC(Sb<*SCWZFV0UAIF~wmTHTe!5jUhSQ08t#FE_tCmOicrj
zT73^gU88w|rWxLf**t>JVdvRkJJvqnCHf@J1_xRr^FujPLz4%uI6*_B<F(%s+Uzz#
ze^ZTfQ?d~Qy@)JG(YeD3;=Kub5@8);0C4#tMlm67!oXEAyc}>07<>UO#A(|?x<&sN
zVec56N!+dv#>ONQ+qP}nwr$(CZB1<3wlm=qO>ATH*4f%qXV1TOyQ{jo`or&2*Ht$z
z+~Oj+FN)%r-h*FnGkrwYawB`dsE^8-X?<Hg_Jtt0z-OmEG^l7WePG9RsBvf;y4my{
z{4^V<Y4d<Yi=F1bStiuvb73~iLsStiRu9(((G^~Cj>ZHrSHC4PSoM(NZoM|!RS51h
z$_t)SF)9m)@~w;e)ilKwpdA?*7LfrKsNf493yzg|>Tyb|E<U{3e>6fViR%y4BH^{b
z7^5Rh-$Dzb`uqL%9*XWD_9dOXLsA)#rHxNDI0J94!MBVOXoZ_7guyVM^tw9igqjgT
zLFf~rj4vq}^#Z<!Y&b_CBnaYr4Xr>nh026dX+%S$UN5wnalsrk415!&RDt}5g&=^(
zmvP`(Oc}yIOQTD9Nk#v}<MVSB**@h&UROFfhJ2zgDj`STD-$AkfqP>EJH-^<<D+>y
zJzC@=NS|bhAsST*V7S0C5XQ|M4eRJ-PVtM>sQsQAgAU0YT7A)fOyYm9dsXg8$-~Va
z`R(j!3Iu~y(&pShPuXu#low@y|3$xdzD(20md?)o%Jr)JdJvvYMw)|zj~@-`%vhFo
zURu&k9z~^+dVZGj-Fw_;PXjXKOEmc{C$E3PUVc=i$<BY{9t_-BXXN4Rqtnx%?o9b*
z$1v@ZQ$jOlyCW~Zd-K?J{ne_;9<8xC3M7|jKw&3GLrs3v*FoZ~2s4J|Y!SI1M_5|P
z%Ckv^IlLRQXhEqhyOP6%xrW2_fXbp`E`CXn_rhmBL%hRq=;J1u=p*tfg9BG579Moq
z!ue)NwTWC3EI@=h&Y*IeIPa?JKDdj%9`Lx~;HEr0OY}ejJE`e}RU<1<e5uWo+u$>f
z0RI#mKBOc=L1RlzbrB0Ibm2SzN%$lR`QDC2@Ffu9kv5Ia?5V|5D;CZFi;gdQLPx#s
z`AjOs2jEV1@$V9?9I>n2Z+%f0!9@wEhsoVvBKTeME3-R4EkF-lz&>yP^O@oa*2BG>
zZr_1?UW=@hD8@Smqm*Z}a2<`x1WK88YRU%!De=VA!sHhc&ryaGmDq|!mlTXUg#c)+
zRC&CopiOZ&ydTbER6!sF*@Nuoamu9W7)ms4Ewv&~lpjxeA#Dxr2`>jD>|~lRM4S~x
z=HUvW(7dEBT%%<HZ-@knw}He_u9V+tx9j>gDOgsVDK|mLDajL7djWdR8@My1M&jRg
z_8T021i?4#K<uU2{M;T@%Z@=_j^QR|#x-l|3m8XSCu(ac!%8U4>T0arKn+h&*6UX!
zDc|Icy(-LSsG}TV+u!(ZRpM01RrU?O6EHYPs8fxKmP&afHtQ48_w#O$*mr-&#-c--
zz+~xV78~JbYt)|Sl=EJ!cqNRd1pe%A4T?*%gfYx8v03JU*B?9^=!;0cy`EaGLA+A4
zoTp%>OT5#J%hvTJsPL(OUIZvLp&lh_^85&>!-eYmWr)HQZzzb{BrES1l!Wt{Xl?E>
zmqLW(|ID=UdP=YgL>=p9AdFm<r0QzxFR7)Vrrh8EoqG};LSez<5fd5#6faOi%VGVl
zN{n1tA6|?gPVrJ`DF3aRCK`$)ZGukEf@CeWFEiJ1!iS8WiQw}i_{e3DT!>Mso)EWq
zf^d~fD*6;vP3xc1K!-g`GCuobAu^A6s}YsiNk6eZiyf1@+Osk#z^%hOuwQ1z7Qh-*
zKsfkde)fbRRUmm1tldLA4c<!ol|{y-d6B7!4)0l!H3^c>5Qg;JNMb~pwd?2YG$;Z>
zJH$dhMpWE7FET?JIe^y^N0bQC#QUNaEfa`tjyc9q&L9=@SE`Av!FaU{PsxLA4lypr
z=VYzOllD4=)OIY0g((U(%N~rfxgW_(i!-!GL+=WmiUnIj6dX~mNGUC00OK|#nT9Yt
zquKjPw2hb1;--L(%|-<SN<|A!?6){?Kz7I=5P8OY@v;E)+;S^gOqM5?5zeFmvwHQ3
z%#iy;#{InZ-a*4blMpu*N62_E0s3&$P2BWi#6g`naRt{|y^oM$7Vzb~Y!V+t1a_Eu
z#)^z2bC%$|)3}c@LD0^cmfEm32TrJO<2(_=@!%EWXs%y;=%o-16na3TT`HhJ&Pa-*
zah^Ww%RcYm&E0wavtJnMHrAt0f#$oJ0g-?56vUK}A>nFcX94LbkAm{)){LOz^tlTK
zTg!^9iGcU_=MG&~@h8il{8!|x^z^QX)-c<)cTC7nBBSEZ;k=xi=!n>#y~NJe$sb2#
z62!?VB$lH659dERkKzEq@-^$W+O0M22tuVuv*W2zRda$`icbU=iQA1B^bR+%s`m~P
zd$CKkE?$c#Nd5}~ujE5K54U6L7NO)OrV<Yf={~;nJ%jasvEs(=KFpiN0w^GuqAKHT
z8`1+v*On0cfV<pAthF}L7@o!pf8S=}5FhxeheoA^pkPjBW^}PbkuO*dUB1{Yv<147
z2eZSV17JjcwtK0)#O!ekVfMatrtqB-J4c1VDD85oz4_ki4$BUsC;>fT1vJQ>Ex9T{
z)E0$=sa}4<5qtK*``axc^QQPmFP_8YF$y;!?R#x70EkHdS<yoJI+e*WiSjo4Pq+Hs
zLL~aU1+HNBj9pbR(?sr=PzO+%7)2qvNiS`-YWu1qN)p5{R*K{^*(!TF)VgT>_UwHb
z_v93zX<4^~r(#ajZT-^a!y7Tjvg>>IZG=&AVsuYKL|Ua{it20HaX8`$J-;g3SL;SH
z`P3+GRUzYwA+e74&TzMX6fDiJrIPcVhb;BvXuG~w1VO+@$=$=|WrzJ%&4j7{y2!B2
zuA75n7tjvS6XDE6{*YqZ)_GE}JjO{4H%@Nf%f9GWv-_5f+z#UQKmjipefpKGJC7x@
zMH?^Aw}n>5Yum1$OO6~O!q%l+e}(j)TT1)Q<@}cAyHgH4ONEcakHclH@xH6BClYaH
zj8=MX{8@;rm$Q$NDfz8+e{VvmY=WquswU|V)-4);dj9=ad;BWyr~cxQhi<BuQcUfu
zU6%K+_jvjB&Wlca!bPobmF452r@S4twViN9TG;EsQ@-jNBToIIh{ouL-kLC@=CI1T
zw5=}B3gL*@tK`s!eX^F>DfyCS!#;kpe~n8vxjz|2Cy7o_ev@-!!FG5NfnPB~XP$lJ
zc|65?hWUDWe4Zcshlj7>DVTYpGIk2S5_|PAX3u5d>8A;?y&uET>b7m7WgD2sXaiH*
zvm^7kUkafk2TcLI&z<n&lm{zdqE{p-(yCA)AwK(Y87zj>A-zZ&Zj=bhtf)n>%5K@$
zdyB=kjy9KpEht3imk<q>ZuBviyU&9$TgA7nA8i7g_<zp@pTC*6$tw_()xIJ4^Mzjx
zc|_LFA9gUUxv>eE2yS{Rz#Xz9^XNov(Fkv8)I&vP6r;6jc`w?xY4s`zJ_Wnnc`KY0
zLNQ|M6p&k=j6AKp<@4q3?CQShkwsq5qjv+X*N+p-CXIhzWPhr8@Afu6wPHAgOV9*=
zy+7StZ)LwO*!FR|_3^XKz5I)lE0OY6&+S4iQYyA{e6>kc7kWv)w^0J1%v$C`Vw06R
z!~FTA@iMw!m*Z*$wgH*kztG0kR*1DcT#8y48+#=eSvi=Nfj7<*-{h^}oK{%teq;U3
z2ea7tf)a7YKn^oQ;XcC}n%U8Mnw(7v{!nAj!WOWSNd5&_+c|Pq{g~ZpNG>#o_@jbg
zKR0&96Muf9@1RgSNAASU$*9cto|&v)Z?wVTBsD~}^`KNNryM6|vD2kZiI@5>bvzZ}
z<S?9?PebveCuoc$hNjvlf|6Mq7B4z5doEuxGd&m~HQ)IxVA32o=&T%(bMDE<jA%Xe
z*D8^E%PW`Bvkyv@I1AYZclHmb&y#@Ls5B4+5p`GUis2$%Si@UcoKd>P{Yz3YYs97A
zHWTF<fz60nJ}N3h+yo*{438zY%42dgo~oV)-w`J-NrDSP-CoBzIT981Ua_`4q1Rxl
z@0XU*?Q{a8s(y{?A*57Q{#~VmQIAVw5Li^B*z(Mlet2I-1H?BR=y8F;_ZZ!vrTy~P
z+yIfR`h;dN<CtKhCGH2yYTt{0a<&&|Y^s&SZvJ{Yis+|}zqU&FY`p(#Lly7c1H4vG
z&RTM)T44UN>vD#ae=QbTr5mHw=i|z)Wz8xaNoCh2%eV@!<{TpXJLPj`q&aWYNo@ax
z4A#09cgs6M?&9>K&<hc)r37qXC|{2eSB)neO}(;$k74>KNbIx`xhAFjTyuCCN-srn
zH+3t$_ywjXpEmAQ67@(_pIR~JpqhoyZ}%aen=x+A6|&ehgZ-kF+Q+{D0APu|ZU;m8
zj4(7-X1V=Oyuk$$QMl!;ktv_yy^0LGnT*|-<45T(O{si+fib%eN}ox@=8<MLBM9Dm
zUZgfIorv_HJz{~a&UdDOoYv~e!rP6+$4`2%Rp3X4nV?ho$iUne?zVcNm>2Dc!WWI<
z02W&V3Z&#T|CGb*e`)gmt3UtGzyaS$YJCFqhxq~p1cdV6{kgEcgQt_FxrNLBA3du@
zP2PTs4W;i|ndgClBlx(T(rW{OmUe-SUDHXD$}%oSWX#5fG1&t0^~pCr4T)W}0hbFj
zkTUW5`I<MQqx++Mj|Om;J|+EfN$&eAde861Fn0UOn<Hlb(&NsF?lFEYw`&&+Lszzz
z3|%4PNB`eiVB2H)xw^|gRM)@dy{5I*@$}`5aMb2abv95ZnAz$`7RV!SsA5sOJmR6C
z))IS3U_%48b$Re_xvh}dH6Z3&uYSVh?&@>J+r!Baw1KUVtFmI$3eMTTUbm~sHeeP4
zkkHVIOH1H&3aoAj@H+kE;>n!Nt0=YA!RK;E4+XIb@wNZwas8}o3&`eP%eul`#Ty|N
zN9v8<^}~lUJ;82sbCsb04ha`$IS{Ic=W+Ym!_o<fg;u=Vv~T-@{vEt&Og0u$PeHVC
zGe&TE`I6d+F-`Cj%^AAg%a0k?e~jSVUsLD|w)nPZm5noFj}*f&Yq@otN@h~sHhO8}
zK6!fPO(@}kHYo|EW&1>N<v;IaV-Qnu`<SO?D~H=PZ07Oz!ob`iAZO!={?C{l(pg7f
za+A9;MRjzkO9?Btbk;#g;otN&MlY`lOFHNgciu(bA>HK==HN}<_0|D+X+R*18=nS8
zSP*dp^A&=JO)T~<0^pV6F}}4-bC641cy$4#Wz6&Jo%zy>5T(MY%s%5V;5?P4PIQzx
zV+R3YhanW(J^&T-Ya8UdJL#b}g&?g;=O!kgUawIIwifx9XqI{=#WA!DHN5B_LUidu
zB-M0ir#s~%P0SSLK~1Mjx*PcHD4o--ajxH;1f!TrOd5=TM754&1}l@QlpF~zGZidn
zhm*_?;aLgjZ>;q!6kyX%g0VvgzM5&8Q7URvV9IbF8!Ttz;Z7NUCzW$?g1{r1z$Ob?
zdV*MuC=0@VWfr57+5Zj_(-`4b^?+h0G?r#NiBb^zPJ$lIQ%j<kwBrO-l}$zKT*Nsx
z%@o}LD{k*bqg3}7(o4$3REZ*&DA7C=$AE)vbL6c_iD-a!p)+k+ETW-<GF99$V5mql
zbVVbki$29JraYqES0ZQth5k#!(VLE9850XXK_SDiazak|SLuwoP2t9q?zmfm^D+(0
zg&3u;KM#7D9p6jzkR2|w>NH;~WHWB630l@jTyQ$TbS-EYF&r8~Trkqm#whHck;Q=J
zCjX@^zCS77a8;mPnDv?+0rLwpBiF~$-t!or9wWfpzx`z(^f~?d5&-e_WY~9!j}z0&
zg4q0pSUQOdCviV=A#;8P*%Yj}J2Iv|!vA`P_eJ;u^Pf2+%+J*E=aQ0B`LCD%dcyuU
zEI2zE{}+W!{zs*&@PAh7{x`OW2Rf-4g8>22LjwU}{?9`MO-yZEo%M}u?2WDIEdIad
znJsFHKLGQ~?}uX2+`k7Fby;HF;EGs9v%rR~=_E>N`D8?ajN6nbs$P_1+UMuq-0dM5
zeOdV1AmZS*_x-ACXkq9_yY*r?s*^v`9<+4*K!7&j3vh(hY=ysoaNxt>&AoqkYEW~x
z2K|g)7&!$SoTkt<B_(0fSMOYQkG}z}Ka*2cTCME##uPqnBrS({fDutcrE(^K;yDe6
z{(WFF&nR6bv}&-598=By)Lc%jY~BH!pBs8*!QyrQbU@2P(FAdRo`COJ0?HWh=O>|i
zb9_>OR<?}6h|XFoV5SgQC$q(>V1fERVdd@@S6Zl*OpP6_qCng{TT&c*XN|L^yPaz4
zN__pI#Oy}$e2ee->aR&LbgNRQssvCdL~R)nOk&veRj+awoeWnqnxj-Y>Cb>D!CJ-S
z9-&i{#1hY4MQ(f^WAo5|7Dt^4^_JPfgJ>LGqPX+Rs&N8TwkmYFzIUWSNTZJHl^&ze
z#K)#(Y>j*tF1JZg5Io370$|FtS|rc>4jbt6QYxq2rAp@EQSc2ISh1`&Og03msWZuE
zty&>oIsJr9?4VGkjkPW%lWa*G8wkRk@?C0PZ{vUHp+(o=!@NVZr=YzdI;;~^10f_Y
z1L4><CDx;ZXd`%Q-8^hU!~EF*j?}E$nacEq`9)+^f1)dW`B`U>o=rx<BP^11x)?!q
z=nqb#-lxNFWzz?!)eH7f+Y96SunqFj7%#;cZ(fP^rpXB&;<p+0WjOkU=_P#e<Zv;{
zp+giwfb;Lc6qCmXGA{N!4<Qyp9FA$8%-R8Qp8d(#*sg=g2}E)XC9tsUa_#95c5u-w
zdLlu<j?W!8An9|N@*RYbF|Zd=q0kYT*kHPBP=dET6f#C}7eyNV8HD`qIQ70@(+ekz
z_sHgm%f1R)6>v(hIKN<z9kuG^;glT#*x?08YW4AyctXT4SATPv1SvlK7r;!P7c*ue
z?O1>l<3tCOSqvFsiFOysFa{2&uNZG(!H`Iq163FxK}l<4;~6N>vK)Ekz}p%fr+MO*
zL<fs+LKMsvSYd)~bRV8-h7~RD#Vm_n!W<-jX#+#nn!`OCCoNANyG=r=%uC0~C$%f)
z;F!V^W<&T)3dJX~5*1j}twXQI5cgTCQ^WXO8XYbl%aaP(y&oxtbG81MOzpj?=Zw4m
zppCZRO|5Np*iJR|K;agDYh#1*fx0*A{EWlT2<-(kF7oS2I`A4Xw#Nv<-OK$h7WSHb
zd;AiMuElcdSWocV*-`%ddyi_FE|}vz$F@=G=y?O;P1cq_pVR-O>is5s&t<)-G#O&F
zboRPX(SNbJS-DQlU!aTD;bUMUbGyWF1rwpJmBmV%ZxfTMjib_`@{%4QN3p{OOZVBU
zZUx33fJ&2&!74H0gd?(Z<kYJ3qzB;Bd(vknJRUe}n&4<h=^N_8?`wU(=U#T=kRjst
zLd1mk!ph^2arCOR+QMr8<nG#my}pmmPaslKuiDZ7pDP$9rP!N`AH?d%{vQPP|3KgW
zjanWyuKLdQHg2YL77h;j@=B88{||r#{6y&fzZ?NZG;EzWC6K>n>rU^|bO+4_=v&@_
zxi?Y;TV0VNQbTadYo$m_1}tJ(a`YV5RleR`=Oljeh8^COPMnMwm+oDjmujx?xW;1T
zPS&_(FRjt|25xsBf;GU}0OIiLKef(ASku!#vDz{8DiWV8(}JA*ynHspQ&YnD9!`$w
z{1Knod^HC!tq+vZ7*fNJ2d(g#6HZ*IK>2~E1A+%F0}Nh;usE}=88^cX4g?L5jTphv
zBngRUj~vpxd_nzp$BMkXJiQN>uixDv8*sxLXt_TDI<4Db+Px-{I1L=ZA*Ol}SiWiV
zpiuZq{pB`jWeIndPY0ycDz*&-GEF2oP{P2rAv~red3QXwnHrfP4e8YelMC%>EJ5T4
z^mEKYksiO~g!LJgK|;d8xsc5;VGR;*OfmL^+3uMP?^5PYKEN?S^NGom2zf{nG*)S4
zxUKCq$s;JI?>zenCYKfsfiGkeApcSki4!o+3FWtx+&hC2$5d`|tT#flzB$v!Xec?k
zd~N<x(fA?Wf$73Kv0UNTi$W+Upg8cCD|nj@b78>6WkZYLktv+cEWw`>X@zLH7Cc-O
z!3(2B6_X%)BN1ndgcWvVs|xb^-cZs*hmuoPY7dC4hj0eBIvY3!V8<+i(nffU3M2(l
zMsVWMDcVF~KblmRDRmm~9U<qzQcfUG7HJ$SXQ|n^U%6o0+>d%H(8Aw%nq)qE>7Nfh
z8t)GTS^-9ZD~9;KyumI3<3+AZAifMtE;aH39y?0makU$?^WnV4f7im>Xxs6)8CY-`
z9s;ijDvete%GL6!aX|0G93Zk*x`t36wb)%w6fJrdatSTF1yiYFRHhcZjfGnbSX#x(
zYJfL()-Ll3&p>PBdkf(!(3`z&PXm0*vBdV_g%ZB<I9+IPYnW-VYgwD+d)Qe10Q+8?
zr>#0`Ay>Qz*by>YWG#Srmpr<7&GT8EMp^N;LSY%&UbZp9?2|pL1bS6%gcSLN|1Rla
zZ*2z7wB8Be?QO-~#^lEOn`Ne-A<OU+RCLZe(+f64Vs2+(V@<1aSRuqeNTAssJGW-6
zjo$q4^v6Y2JkAawJH*MHkATslCaU~B$jF)EL(EF%JkcTY7g8V^&tJ=SJEYPewibg?
zF$ixt)ueG&+VTThxE5{UzLhZEST|V^uX)>=NXDgw-Yp`vk`F=A8RLEaP$=8v_*6LC
z$cP|6P^)h}asaGh(11$)Batmwc+XG5hiU6~T9b-Oq`ruC!K}ki?#HRO23g9HKgh?s
zHI<gkdnA1}H`Y#{$0Qo_OMjD39$$FD2OiJTJ)Zcb!@t0z&nr<qoVPhWFsZDFc<u1-
z<5gV*u(4b*K)6FxjT205wDjn@8~=fSnPXjtdvW49n_s`I%^3GH62a36XKP#)3#`yi
zUQZqU%#frnJoQ<1s}sQqxVn|pR#Wh#UNh7=Z0OCRw1QKEhcWftM@YGSUe<KS_s6l^
z<cV}Es6$l8Kr(K&irAdn<ttB=n`XykJ*=(0-`?CDkE=HiWh;dMN`BBMH)^JPeSHV0
za|PgCmGiv*Z~nd^q$4B`0y~>AB6N9dm<2a1;+7?2p|2$i6B_ODI-s_mx{T82Y&ZPk
z$d@?g1S5JhDIB<fBoRR6bPvV1-B#~u<`7dTGdO35^)(Qc$`P+)Bkz}`f|i6i%K<z`
z?hG+TdB0=^m~#IFxd>RUhpp?}j?zxIPM7*q%08EwU4tgmt92caC;FVK=H7*!IHmMD
zKInA18Fv<Q$%^tm?X$3`JF$YT0IYqmPFUZ$P5atnOR6_alvfQ?-zHnNuX;p3F%;B6
zA`UOHW7-ojKOZ$6AOuS02rDSp#N0hCq(4iEkw7ld?Gc>X15DDuV39G;k!>g^5T)ZS
zZxkSi3x+kS9LIpN8DnlyS^sP95i_?~>Xr#m0E)`oT-kv)pnyZ}D-#YKCkBN9XwM8n
zj<#|9^cl>GV8Qs8@u5iKB!!eeJ<#vVKwG@aRSBc7R=Ut}Vr$6}B>^*X5YnfhSzsdi
zR%Izo(J*(iyO}11Bn(!UbO55Wcysl@noU~Dbxb3d0HsbSB&I3jiH&OkWmVy^u|Ywu
zOmy9(600ONQd<Qh@Z0atplcxvp|NQb+#R@r<D_w?@%&+=GW#!iA_EVm_=6OcT8RPf
zX7*g9Fl5QI;#3y3YCy44QcvWb5uVwWAd&;EW4mieJRN4kt{@jtJpR7%5rL`x<0va_
z*#%KiJ2InT12=p!i}Nm1cjISTpOgOleQlmxF3bklZ#l;6Dg|}d*CDG4tQ10Wa&Q+z
za8qK-KW3(oXORj^LSH&7M~KvSsI(+XN^F_@<^KJH()GVgT^0&q*T8l?(+UIr`i8q7
zWm^M+KmTQm82jos;Vgx_pLgoNkf4w3@YN>h%!CG!3~niQ-P-*&S3c?=lmZGT{CEMB
z*|Y9v@fv!vjFPj}<iymgOjzeU+%s6Ha*q?XR$bBwShq;|Wqfh-6||&*Sw=SEK}<qa
zY?M*ev8-up7t}pf!A#DWwQLxIsdP`gspRyK+^XI6q=HI`w@Z^kFGLV=%D8kbo7A$I
z;kFs{n0iomlVaIqt!#TEx{M3{Yx+9EONi*;KYX>5fIHYx@XASrs6A)MF)&5BwHR!W
zpz&%t&79=SryA)NOeb0M#Ic;2s&R^?^f;zN>J6j37a@v5e<;!5LfUwf1<ys;yn#5*
zAJ|-v%sBZ5Iv%l}Ms|V^6tudsa7QIV-%m2XN_r(F`m$pRFj-ZZB8I`KR==4+<`)Hu
zc83!wtqrd3&<(Cumr6MJ^vTZRI@XNz{DQgn*{c5>pwkP~y?|^bv&}tMC{NuxqlUy5
zHw6st(l@&NjbI|g>aGYb@+hxDxdu9bFDm>s_3(SjV*b!EfvWscITHEcmoTlmrC%FZ
zHpe!C*h8o)Jz_VVic}+wiblfHv~(lN=B1mWD7)#^J9;pEQL*Y3XaeO}YWy}`C&Mtt
z{F;xH<Ng`iBq9}RssT*$joea2$u$>}b=CRwre12tLQu_7G<(|lf|cIY{`Hy^WPuxH
z5`Z^{4VLWm93d^DPL{Ih_nd!Pje&T<6AWtMxc2RwKdYYU@R!K+YOhT=ycL9B=Wg^k
zS1PHaV%~&0p`j(8IQ_yq4}u3{4LPSTZP$ymNfbS_!!Jd&_saKgMLJm&{m?$L?I~si
zOFl>bZR65@NGT&P&sAP+R=6yS$@s+Q>A#`qWTxhotNTVwJc0SyMGi1*q^e4gx(6ZC
z-&lHHe-#&pvuLc2QnPB6@67(v)Q%p>N~TG6>Mt?X;GsjVt~u&Rn}39cq=1U+Tnz)`
zaJ0c*0q=N584vE(!8hMomp6Tm$P~K(`u@9;{11hRl2#cv>!+tSR{9^xvj46m|7ZR9
zAJWpxum9zKb*X8q3=l*9^7)9OQ_3C}>Aom)!e6JQ8$>J6-f|+rOjD^;8N@RN*92IQ
zXwXgg_gyVOO^w?BT1O{RSCq)gyZX6LGSl4J*xcOxxfo-^{_UaK@Gc;_CU%1J7ta;R
z^gkkW?`&j`ue`pnLDPp*TG&7BT&xt}mJr4VL-DL)kMbO(x82ZY+?rxAr-j@e`C`+>
zGi8wkAojx__+gyR+pG#&dzYQBx}}(Jx6dI<gu^MN#gw?@j#(l<C|P7|*&5s1Ux(xG
zen7Dsa)EKGmwU1lcLA>Y8T-s6d5j!kprwO<(LQMip%bhT0M#uTQV84#di^G;X1J{P
zqgW*APKX0}gUU1@q4P+4$nbGO8WnVc1&y2i*YTSt@!K;kDGlj5Jh+~mxCFE^oRN-1
zMtL>daj<TPPp@Q%Ae9c$1LYPw2IGNalqCL_TvC=sXPu6B4>KSaF2<>9>>W-llLCzf
z6%ri-5=SYMn3Pd|2yf|rM7$!#C1qyx6ElC_h#qDTNjeInr{fw5iw3;Z0W5uUZob3(
zhE%=)PBH(PNy=5h#0EWiz>y(PF#sF|A~8cm*DSg@4PBx7A{^JENkNV@kpqMAPErk{
zliQO@Se~7?QhIUlci^$zzR+6;YjE#RC5aD-kqYU>a6lQ%L!l9*0oZ4af_E_J#F#22
z8Lbv?3Aq=dY7D8Qm_3(_NV?vMJPNYL_cRYP2GMiJd0)25fal;*r(S2#!C40@-tO;n
zX5e?h@v`GKXyKBbvPmGyxyG=aW75T~cI(-&)wndqMd-q7wnfZRo4Qk|GC#LiqA^P=
z3-lH7(kfHtA0QtsTxsrhwtO7F+cdd_lEs>5#F?vf&kh64tzBx+{XPC1cC?xuw!(zn
z%=Q3$8RTiz%IhE>W2RgKp_=g7x&4F#+tY-Ljv)Im$6=Gz0j^^_<TTw`eiF3|PYX*N
zT+8a}z-_i&1bZJGDb1MUoU2l-wf4~wEyMu@Uu=q#O=r2FHVihTcg<xM{kJ8){}Qh=
z@5q(+cbsh(;Wim-?Y|r?*Ck(A*=#gtFx|D~g#>en_X>#M&>;`sbyr$UHdys5j_o+}
zjY}*`&W1S#hSQqBCTyl*H|<(%VPo!-l5`Lv=7OP($jCWdm_KmYg+u@&uyZ}lq#$c<
zJ<FDPw)pJThK<^67OUhU<|$U|3})C*ZnX{~fH{QL)#Rgc)O_1Vqe@}tG=+w^0gD{1
zlOA;P&wsI|WJ+wT!LLY3QTcfi109L{owzJ8?SM5ZYyk%Kd-L(y_v1S`0j0@#qRtu?
z>bg&-{`S|-JxlbkD%7U^Cv~TuaV54M<Q`ZbcrgKjxB37SOXB!e=7hY=_DG<CwYxDO
z+YwnO4rI?UeqR^kxd_g4Z`<3?btKdut1&xw-@``%Yx3XrbrbMi^E&1%<~xRI@7@Bd
zHcOkptT#xpqXd@aNXLaAa5s_o9nIBIc^E?vsSlhn*r}iZ&H$l+L<|y5wr;|4ax8pg
zi!qk^SQ0-Q8<5-e!w{o1_NiRPp+GG}Jd(x;Z;H6}upFnn#FOZ>?E1B41_7M@-{apU
zu#<cNN-yUe5)4C(wPoZVA-gZ_%m-SEuv@>(i(yURO~8>2g?`}|u<D>l%~>Qi^5MT|
z`k>xpmvH^D!L}^Qr_S^Ux+2>j!vvpDkl}XNjs2)*BSAn#`L={F*46@}Y-nn36##`n
z={?i~QZFy-V%=HV1S~k!P$a}2gj3^%L`tY0UN_qZ`@n6Q4$}u!i1F=iWT`@HC6J8I
z6Tu^w=u7eEG4l_eZ-N+~o+%l>D&-C8<<0#opq)9!0xnjVt`x~Fh1y55I-t2~Dn#&Z
zMx>;lg3+q+et+z~m}}z1tr*K9ohy~?pdR870!l`=3<MbwTRYuX^K3iAz9+yDfZo|k
zpgyG3pAwCNZ&i}A%Scs9KGRoDv2t$-x27}B6%~MQ$jn<%OrdJ(_v(L2pk~1{Rm74@
z;s>8q4yY$oUEtVx-#n11mD%prp_P~ovY~<fZuFS@315mhPP4YZH#LS#Cv9j=-~DDC
z@(}k}-H((8D}}ft_v|Byl>U1X|F6ahV;HYAwzCKRH52%BIw2Xr@XIuU?6MtCfUQ@k
zb9r-p`eF`2>0YR(%}V*0KzEias<Sme%KrGDH_nm-rGCh_aa78h`H{`x6qjrY{}v)2
zn!<pLhp)FUA9^);SpxbAf{CU~C5Vzu&QUg;m~1OW0*h&}V@T{Bw@poGfIgNA2&8F5
z&#_^jj(ZmJAXgS5e8|KUl7b|SU>}Y)**^^;*2oVSLbz+6NWM8bqSn;01_7o!M(6|T
z7FuoGsk(b4s{!+@?j~*8?`gLzc--F7@^<6z(6N2syxNAqA-frO-l6kOCqA|tN3MA`
z=|HfW?(-{zA=XLcf5Ga$lO-^u-ID_JMP+tUM{iV1<cT+95mCb#Bg&Q4>Kk>pWpu3P
z$saOzK-xzhLu!<@ukcg@q<%y7J(!1rf+9tsFPl9|8abVz|FZIlCMR%FD)+vWu37kL
zhD9&zYPl^NnzWw@r3^86v5aSyNPFTt5E>RRoHN5?O|b<q=j+{Bvvt?XYqy_gxsO)|
zX&EU;R?LHw_U-_JngAv`btmhK^2VD=TUP2W2lqd_%C<}jjsEkR#N~vDUE-M}19arq
zAdtX$?0aV82Tpet=jY&xA)0e@#EJ;9Mt61$(G7nP=@f(5$`B0Sa)FTGFz~)_OSoWa
z>qV!NGzD2O_Gb?>eUd4?e5Ut;2>%+NWHX4_GYDURiP;P%Z{b#&j=$gZKJEB@@3{Fk
z$<o(-c(oZW@6GX}!{uw_X2l42aho;cI-zXrl9TVCvh&8Z&+_$74f)l#w2*L)<d```
z@33zWtVGwi?Kb@wi)r#Z{IM0Mr9rlNgu5pOQKL{szq|&3T$f2#YjXCH8lRB@L%h&|
zY!h)qIs{-ZwOJUC36`9dKZMi@(;7OR$KL`SKZ7LF!I0YE66~xT8&dfAug&=)ev_?x
z0pU_;0MoXCPTBxVB9cMrzTVO3C>qS}62tTRm~B#^&g)OfFMTCMKkPRPHmwrFmwqEv
zH}Kh3&tY5t9vjL42rf79xvLy93gb10nTLL-4w7rk!j!5{`Yqgicp!(>1&5XwNt4_^
zT`%0}`2P0D$4r?hhJ|N~o|;*i2n<gu4_fmfRtizsdSBdV9#_q8XpqNWZ|RCSzk`WF
zmsakk9?S1B)jrMhJ0V$C;k>%qG)8OVil6H|Jn$D=<v+))bPyq}+|LkeIvbtBs<QjA
z=2qZUX0IL8VckXK+olBi7U^*tL42t4x~Lqhr7$#&|CCVBr~G);J{t?XYI2#+Pvoo$
zdnHveTA`q~PSMwD?JI%UsNqwev#Q2Ath;1+h~!g8B*H6MSvw<t!ATOo+rYN4Ec2S<
zVpV!vP{r3}91HGK<wt&3hw=aFeY3284ZXkS@4ocg5Yckob?&-O&wZe;gs$sV`Z+M`
zrtXsBQ6?NHQb={~^Tt^hVK={Qq;@>ePt{ttWfc{_+NK6S{FFMB-=F-GV%S$RNAq!l
zJ^{Y!%R|!tV=?Jd^kKvU>W%+@R=bdEk*ZU;KtNq7KtP25$8C?9;eV_M{&&%P`~JU%
zrhj$4owqoWzTZD688)KCqyB~GWL9xgPu9{fHrSa=P)|&loK>ncLrFK2DoHE3@ie_&
zt!)EA-H=Yq8Z(_p86^Q>#flZbhl?e1`ZPFuyu>qiZL~r<jOh6k;unM-O8I5c<<}9p
zx%XQ^ig)T!Yw(5axS%yn-Y(oKratDZ!}^%diuo|z2YWL38gxxRmFLZQp1v;m;13z}
z4vHbc)^5z->drN2v~3xs?u_FhR6!;+N$(yJMw{o1@aQO9s_l&xGDm7|?Oe0Q$HnRW
z)b7k(&j*;rt!S-7Xz7qcpigY=fWp2#ziA;nZoCJMeL_73EaBljsyt7m=%DkL9q5iT
zuYO(nDB<fU4AXvMZBd*m@d2tF2QR0iSGkw|T2O;oWEn8RPXskaB~7qe_e)s`AvDlC
z8)(qmgN!a4ObGWpSoGWJ$jGB}13ttnK_eUF0GW`G0wl$Q+enidw}kyTFyf6YFgo*S
z)e;DqkX-5nP?U*GVIsd@-oNc42j&7X78$x8x8daH0VY=-uy|CMxF?u_2=IjzVg?mg
zFd6SK-4W0vNF4(vp~{yPnA{-~Pz4Mou#hO@&c}&qTr+4&tdIp_Pj>;2?c%ZxQP(sa
zcOqC27iZ-pUfr1mdPJ!NF$G<aZlXMavq0CtfL>T|oE1<G4KPM?A&P>a0>BQgN>^A=
zGgDS23hgVHEA*ykg$bcmBK-qp6x@!uc`hOL({9WTJ0x51d9>iSZn<sS#y?2TAoCeQ
z6dvOlJ?t+(gQq%lP@f(A`q@{}HsiL$U(NU|-o<ge%^KxvXL_yNJ#A>*Jva?|{==QQ
z_p?wHac^i3mQ`tD%&Y#vF0+?{=Wux}@;~;fr=X8-Wz1)W@%9B%WL*{rV!5lPZJY+^
z>A}%o^Je4TUCcJF*}2YLvBscy1^Q-vP2R+8Jl1YqPAmc-@Ai-0#e$IS=ZIk!%Mf2#
z<+|DrK*l!i5N_5c&_Z_*;owQYtDR`rdh0a^dh30g3@OKZ!J#FA7xP~yq$)u|t9E(p
zyPLu#N*e^fe|euf8RQdpeX`qlcyi&milq~0_gp@24YMU-ZU(#Ortwxc+2KRphv_2N
z!g67;{_!UO9SkyR=j*|7ld!?Xcr|eFWITKDRxNQ_^+yZ>w#%OHlqI@)w)jhs^|c4O
zC>l5qr*ZL_2|ou(p@gihEM*3TY!f@3Me+B`z$7N^@uF>eR=aDhv7tFWWXC<s4fVJh
z^rI)$IW)J=UT7|z#V?0wPgVyD%W5H}aTa^krth5KzL6;jSQW#qWHSLy+uR8zrS;o+
zgt!sepL{JKZ$I~BPGbw0S+V0i9k%ZqDKVNe1Hyd;IsBPla5$a$N%~ja@j}fQ75f#f
zp8bN$={Bd$-d_&bv1hWj*&x-T1Uu%~zWQ^ufW49Z+1cH0YlqY|8=f%n?Wz42_-PA&
z2EML#jCl7i2+_S5X{o{n{>-|5+innMPVS5zwmgxBbMOvv=WD7@n}&y*K)*Ygg7Ah@
zPOc2zsdU;LNemQpTJixSM+R-W=q%o0gBQ_4#W!gOZ)_2O+OInsVMP}%_o7XXERK5{
z&a`gCT+;PLMy@i~OWusN_#;%kxN;rG-XZ>=wc7#V5u4jz5YLYf$&w86{QHmJ<ELmA
zaP5)M@k9)-d9W+<HA%tD+HV?^SjOmP%Kj|^&my6xAy?)*CZjkIj~E`9kbg&)Pwaq6
zO>D8H6zWotAA+3W^lpuLMgPHcQ~erp`qz_Lk!FQZvc@)ccXu2OnIcvKnTQ4Hx@|bn
zlW!R;BE6~LFKRoe*%`TkxPORwkPamv-ut@p!S=?xjg_rG6Ffo7@`}qSKQ7m`SEt_y
z^pIS}w<(#%QhluG9AalU{B>V0ax_cNRga7Yd*~Ho{ij!W^&E#~A`|47b6KJwpy<Aq
zAIrDBUbFP+O!d-qg~Ix=tMib&$z<NYPTH@w>|ZI&_Y@7zW=|{K+jS)#oXixmnn$TJ
zsVsId3N=uJ8AqyvV#_dY4D|I={SLM8bJfK)jru;xv&F83p<B<5&qAA#@S5@a-gjl^
zljps9KN+#w)&}9Pb{C+(lb?(D+}w=%G$#QZ`oLnbL{Hl9xntL~WLGy{5A}yFZch`A
zXOd&_qAhFOdHmse?pGl7Kx=#ZLG?rySB<+nnxcHr>~PIwP~5>`R~e<9L%J#nn=f%M
z%vgX<veT%uHm%MAw>>$_o^&M;PE-YuZ}!q{LKJkin#i)T*D~pAx(N0b?@asf14N;}
z!G9f5(BMJRed6SZ0J;ks7+Al0s1_4zh+iPZ>)6PkwHIdb1sEYfPQ7l~FMkg&=j8n5
zyhp_c7?;tXpH?=!jR2)xXwdAqs_6JZdJ|jyP_+5)pf8n2g^rk>A8Vj#Ux=XaNl@=0
zUV>|)+-ufT0`{x<aboGYdh)jM^0!Wm>*+OuBOmwF{QiC4N&9oOdP8-L)l9iHS=|u*
z1x!FQ-APRygr=sr<U+0=yS%zq=eMZUI-`l)hMowc3m;yw&S=%t-~oPU{)n(vgAB)|
zAGxk{eEGcZ#2Lo%Pucg$zX>{U>t3TGhezl~_YmL0u+P~5m<p69g7qP$?RNvS!T1IR
zd4v~4rC&*{pM+Ih3J{`I3LZ$MV?zE&lJi~+%P6DBe9NZRWYmj8HZv1caD@eQ)|1*G
zXq~;}d51Z~OVSc=&J|yhJTw>$$LTSeC^YR2!?6oMsOzEPjNk2Wf9`=~T!UB6C=`P|
z-DALCmVgQaEVE<C<xsGdzdMz<IVxA1X8MI=z-JoG-a{|_P7LdNyNIpG$njz>hT~~L
z1m=kiLKyoYu2!9aELv`ev(zpB{4V%KskF@0EcB{v0j;~{Y7gLirp<tVgZD4Ljj=-t
z&;SF>qeF$=NU_3mvY?U_ssY9q*;z2yHFRe>RAxe%XP`#!uL~$JpH$e<zRuH{pi<RG
z$AHWS^S$}<na%0;%CH7u9N&E|G$)Q?+lLiB-jMTx-c?+0mH0@}$8HO|I~9#%a=2CX
zb$2494b&Id?M?B;ES)sv@3on!Pv1od+O-%tOhaGj+43Ok{S@6+SA?gF-{dBt+92JU
zv`xRi-0u$CRz;uJD%p_z=Q~rDK$sQfS1E;ZJN3c}+@;jj7~euXhnq}lPk^VViYpQV
zw<fl5q&JdrZCMXVPq_ye7}Z$T>@OEQmN~}+gqhG7t=s8EXhXR>!I;jF+k8C~*KGMf
ztfMWYM%3Gh_W7i?L*Ecw`CZLZ1lfxaG4eYRUJvE;uyqfPkvFCI(h)0LyK70=*E<x+
z>_i!%SvuX*FgG1%qT*w{Sy^o4(dn*a{!t<Hn?n<15(;%`S27<l+6dw3EV$V3EGt{7
zBOq1UxTmYG8h|OQ-_vzwq5Y-lmlSNH^pxn3t%%Of1O7&b2yu8QY_Fb5BFxYWI8peu
zfJ)0;&uq&)?N2M*h0HUQ46a_{$S+FPAmsjee}DV_Rj}3SmKv9I1UaFiA<E0e(nd}n
zGXwKpn0U%oHAyNOJJ7?5bwS}d%5ZQ#ww7uxW(`v<52`~HSOyw#h$V3Tu^;~Zn6G-i
z@kD%+jzDmCZY_6}l}6Z!Ec?=L@gn&#xRA$XczVmg?4+9L|8Nj><DKs&1yp-rxcAa_
z(J}V)yrNb%Dff!PcDF74I{dDimu|9ubw4f@sOkZ9aljm1U38+xBwGm?5lFpK^4F#o
zrV5%OyysuL?G}2?*GM=#&k$=KBqhtKQ*X(7B1i-V92aNdBZ+6V6?Z4Ap`a;jCnlJt
z2^GK?h=3#T+VNAxg_#Tq5(VG%Ha&2taU3uvvETa&>LuXZHV&=`h9b~Hfl<6iQwT4M
zLd->|&ygpuO~=AT)fr4dcl!Xp$8!4^TdYzKqrG4SQMsmvF@kN$46+?rCGHj3L{E%x
z9+!ZA|2l@D+bce%wTzS~ogh{$Q;DgUy09>R6-8XG)oL-&60jc+W-By`Qn)!4Qli9E
z)}Nn`*9m20#6N#F_JG%MA^t$qZ}4YTV2*k3?>8e_A=sFI0<ZGRW#E{QBpegBQxr7h
zA4)QX7RM;qu(HR}GD^FQU=&81KbE8pj@uE@C&>`qeoV>{N|Xjcl(&JBxLe6PgyrYZ
z)E3bsDDASaL_=;9cht?45Mfp&3@XH-g;<nuD-wnkVUdMcKi@DgDuMqqaFPZoz=8;{
z$^fcNgiwfu3$Q8yN+GHSHW3CL4}(a62PaSs2BTzUlK7L@S-7c>N85nho-!tx6wIPV
z<+cF6C(Kz1n}iwti&ezuUkCw>qaH17UKo7kM8dnv-RB26y2?uSZ0(H+j&E8_p4l0@
z@!#dK^<j94y6fN@G<htb?`>{8Q3Ayt(|83$L1+x!g*F`J?_AzfHhQHJ?V`{OKm@`H
zqkLe{1)bgLZ5;`$Hdc7y9*X7>F@NUbyVz1@JOLw&=~%RBD6evQ#1Cu2lw@g84a3MZ
zMr;3wIVQs@U-0DD%@!nnecrgV?BNjv5mqKX9#xLZ%qO%VqL{NLp|Z<8mG7o=Q(HNT
z0t7?<VG(ud`J`;i?BF5i=GY-;i{iW4LzLJ>{^hy0q#B#Rh&)!0(53v<6V~y*mXbEj
zZ&6agGmR31IqQa~q+(5F#@Nn?F28=%XUI*%!Xil?*)x*TN~m|bM8QHvHGan$l+!=>
z=Al#KASiGi#x_>2q3Wo<L<MB<!i<1YKxnGWLkQjTVMG=9V?0eHZIu_hkz0In`aeB<
z;%Z`bmovrbTBPK{Dc&EG=)V*Unfqe-b%%e@LvmMPh<|4nP4TdkO^eIxd9He!?eCI&
zS=0<!9GBQtR}A;H7IihqE4vLMzn4x%TIFA;>o;k!igH+!As~7SPRnNiIyabHfR<1_
zi1?3lL=nGC&>(vMavQOCddn~<m$7XGr@C6ASds*|6&TU{`D{<qSIdWsCigQC6)vX}
zsEFS&YDox)0vgXk?RNY;Msd?|UgCP!FqM5+!0_klgne+vo|g)PWNB!5%St3Iu&m+9
zC&(-jo6wwnE5><nazQD^&sEMbKmoam(EAgf{xx`;OX;p3d<-+8@Y2{Q%?{~eEWv<|
zQ-KjnW9zV_)Vvr}7ZnVAOZ<kk#5lHs4GEykizDA^=#e@1n%sx#LpA$c%_rpi2S~X%
zv<;-3o|0dsP2WqjRN^O9&rHof!vLc~uv-0R4{>I1h{~r}PH;M>adlh*7@bjIn|V|Y
zOV)~W(!W0pOnYjwTrkSQ$34K@`w|P+vple<_6RVG(RGXtG88ieS$^m+A*RJqtwx|k
z5ZG?$aYj{*Qgc#5>_ID(QWY9wu<+{H{mC411I_5-97RFzp|#v9PnROF(q0@=xjeaw
z<QWnn%af-CI6QPnzmuXqq~~Z&Fhq-3`sYmJ;4Axp?0c8p?@4juBHgB@I!a~TdyX@*
zYSRhxG;GMm*;Hqdiifx+E8=Q<z;?CU^_l(wD;Ck{7mnum#koc056Nb&JUPqe#Xpkk
zZ>mmfj!d?|_sP&$Lvk;kS>>Z|X2GSNp^KO~!Hy9iXHfA1^fc7DD}umsEq|_8ttCtv
zYZr=5f&G|%s=EQzp(mAIfi$YwwQTC@tEAn0ngrNkrH1iMRE)2V{};z39dgS62B`0w
zJEicYoEe#PH_bq>g-{8G@jwI4X78|D^dQp<<s$`!3NA%meZ0v98ol;-31|rXgM^A&
z2Q^MoRt4F~&P<GF|6Brf`jCCWvUffNGSrHB%<H9`H0DWGF@&K$n-0TQL$j<6dOt<@
z#UA!dI<FUcw_5e~yBxKd^6<cbpo&rw9FA`idD?=p$y^~<Ion^j47r>17NG~O>Ufh8
zVNDeLBJM6Pm*E_GBbo%3m|J`o29n5q@*N|mHgsVWd0r|HqBpEkTTC8$L*8@XSn<}q
zH=827FHLg(XSAtQZgik;s++*59B$=l+)8(<k`QE^(R^4?`+(7=;8C4qI69f7#Uih9
zPhuYY{H$*tp47-a`VMw*lXg@_vGvuE`zQ8Je+dM8j6;743LvP2yc8~NXs4@jfN}ZF
zNMvn&#bKfxB^A!(qf-@Kr4FBZM~ioHsoIiQaM~b)S-xmR#pZ+RbfQ*wFda8gzu$>a
zS_Sl-s;iqb68R60miff*dX#E*Ny8XODcl|V<S-k@pU3fPYNmvXo-#<5s8I&3)CyIj
zG>GhcCP|Kf;ZEAgcp`tTCO*b@r*U1aZNr?>z1W8NLkQ+X8!y5PEk!91bS*Mh$`w$g
z)l@V-9a!q=?bvZWKh>Fml7G&qNVsvNSA<UQf@D_E(XF&px^vRds%k*yO3^pdi#Sas
zgOfGy(ix3ykQDBPJsVBAAcnig^#vM`Pm)5+toHPr9Gf8}wZ6qX$ad#K@+g6`OA`MO
zDR)Pa%52D@CP{Xd2;|Si^yAt+p*w3{;Z(S#6slhh|KcOOT~+{o*CW|Nxw-VtfcHcX
zN$VZ^rP0OZ?i8GLKHHa)b|ROVH~VC+DRopDf0n`lrEUqC9rexXM+FUu#^Ih=41=r<
z*km>?!xbMe5XCyjI!Tfm*zogx$Ju31&36dEoExH0#m^1q<M6NjkYJT0e2po1{_V43
z+_U0la6vuT;5z!+kZ|$Gsf=koT`lIZDc8#qvN1I1bECi!R?^0LPxX`a{gxgCn-y*w
zt-Ut4njVg|uZr|zyW=Qj<HfAt-a9B)d%d-$puDK`n{~&~m~?-hOPZ8U=17t=FXJTE
z=ggLtN1a{IDEX7rRI)kovf)QE)jJzrd#1*9j}b4V(z`rbcDBN8p`r-A<4tvI85^Yx
zAbBtZO9cc#J7(I`2YYrrrrq^$0XTb2%vsP>996N(`S@AZWx392v4uqW9EuGZk-%;K
z$=Ept*K3(2nJ}Dljk13!`OMvbioYZ&2~51-$&M`_6EpoAhmlN<SmY#6VHEh?5HoVp
zLDBLq?&FTE-fynS>80)WO3-K+n|{>*$vb{XBVMX=^y3Eej2a#9YC@L110#9Fkc^we
zVC~3X=(o^2pNfOY;%LDK4vET}f>+ZHa4lS2G^iR#N=+5z`m$uIJIFt7l0jCN>}Flj
z4;wCi(@ytSrA}-P1a7SJPLtrvr^w8bVHt|gRpiV}+jKqW>zzEzqR|QknGEf)E^U;L
zb?<_nTWo@f<V_5Z6?}f|h~4FBYGA2b@US<^mMwJZnd}-zF}<WeE%iBx>y4$5W#&_>
zi!I>|+5g$;E@i-czD;0{1%3EWG(gF}>i9&;mugI@R}ZJhTyY9enj`Ej`X;dc#T7Qn
zWWODmlB&#bxT<+s?5Fh}p&~-^)9<kHfT3UycC>%0ugrYTn+;)YoOV5U-?44UIuV2H
z%<x*PO6<mL&9BRsgHEB<E8pQT6^m;f<d2v6&8`<9zpXUt>}cnn2u~x0HkLm|9#bcY
zxH~m5E`u=#t2165Fq2ZfXoFU6jp9pIAS1*@qxF9=_Kw||w%fLLDz<Ig#vR+XRk2gC
zDz@#4ZQHhO+pHuz&s=ZYbG>V?jSts9xZ2sq=;P?U_gtm-3AuC&q_=Xd*d<xoKD}Z{
zuuUI^WT3zCXd3#4JwB#r>E<*x;n&tR>8NL@Ek0SD$wP4dG%v#?G0{|<PJlMN(>qqH
zg}}q7s3`q|5DB8MWm0c&b$0_*42Ly#{uJAa=4ZfG4-D(QefOBZfga!1E0}amsGoer
zA>|qiCAeV<)FVa>A#oVT#iKb?Q6a+GG93=>;NA3ERFMS>M<c#7yO~y>Jz;K(pwtl~
z6O!1pC0=CK;Dw{fSGjIY()|Kk%#k2!Bn8uLPofUEuqop0PN6M$RKfq$FR(vNx!_1w
z?DXw`1{of_slN3d=6`iFw~4gV<wK%&ALX6^vyHmXlx1h#Zh9~|j>tZ%Na_#X$R;)a
zu!+%nI7cOVzR3t3j~(87_ee-Xsl%u~WF2*iElUbqrn^-wu0QHAT5YBucqboSb}C#-
z>2OeVqYStv4*j(X=db<O4$ijq2wiwy@nZ5gktCoRYsU4Gl9i5cAq<IbxwOtypg&v#
z>_;zKL*Z9K&+RI8-WL_HCDQ^Bxr%@fVX2g2n6btpeN0o5N?wY-s)kih#w%6q^(){t
z41E9gd<y{LlUVzj05>GZm1uHdl{Z?T&w^Hgctxp_^qOdV``bHSCHZwJKP+e5Ku)sf
zFVYG#g)mzF)C}Wammg)L#>c?O@@LL?@l^dx+o*%6MycY2sg=_Lz7nD>-vt3%bgwWb
zeb#<}Vfg@n6#_niVQ*Ip+PV}u@MlS7?Ai}+aVQG0HYn(J($#?(IceYUFP6KEgs=}_
zJX^?f%x&;>Zc~%})dZ=(hi<lLU;3`gb8BL-f!7~sLo@LjR87-^K{M!DlnpZiF=SCG
zoV{UD1hNdD*NZ1?EFP5&a=08^WEpr-E~HUnbH#S((yj%CnMHZa2j_`Zc#ymzi9Wk0
z?-;#RKRs8<I%|2o41W|!mfD<K;;~|YBtv58j{dR8Yt7ky#;6rGC0UW;xDu^7bP`|s
za?SctQ;Gok$_0uVLM1cY;c17co+soF!~xZN8wDEole-}(N5Tz<Ffu;QCXJgfGY2jl
zh4o6=2Hn+sQ>#OE!Ds2s$MBF&uU=V4I|u{p70VSqi?YUPC&#~(Fl>(<qQ8@~gL>oq
z$o^PG<{E{Vi)Ppm$a#a*6^Z!VUB1nG!sah;AZc{HjBaST*Hl7TZWK(G4O?HmFo`;W
z#2}nS#-FWCa=D{B#_2Pu4&0D-k*U)$9QZT6EImL=1VasJ=vJfhK`qyWi8SZ>2k?ro
z^G7+0Sr3xl;aS(+>MD!IBw0n358}WT8S~Ey41pgj^KKgA?A<MPOMJO0`meFFPW9P_
zE|(dNov(%l%_;Y-i-z(|8)lQ2gEvVe_0A(|<3<Eqklj#MQ86gfrzF-4E;*UJYiTw{
z_G>q^;7n5j0lXSFq%knI{h+QrAUGP0>fO)jRvxkY>A?p{sq7>uQ;YGRCB-qlZwWqM
z$*_Q_DqLO+YEbT<$UayihL@v?Gt7FTSVU|b+89U8eTP0pYM!~+78oO4Dxh8y`&iPW
zB{2jB$})VHp~Y-{NbTKjA@Vit-x@5X)yqr?E8S1I6?)If4<k?BdJNL3ouE^pxK+9)
zAih}i3?X#R1jE2K>?9HMJd_`d!$ozvNZn5^UTqjW0zLZtT$rBTKq=V^z=i!eu+Hhg
zg`?DQi$gNeYgtK*%MhpV7Ax^S1Sn);=XD$xt&5@n?1MCoixH%0(Q&v5J!KJ<YA$M=
zl*X}(+7`b^T4P2AOc$<{<*`AFRC<~>#CR`8hsCU4wSeomoCgW%OFg)d+C(<$lnOn%
ztc@=G7%>uQUf^@cj4|*fu{T+)1T3S~$DeBzYGxl>5W{$$jV;<!8L}*3XBvbk3(Qg+
zM}A>uYWuIKt=I9l_y?w5i|0&Ymr!+fFflebU2Ao>WjRn}CuorvB8>4Ey;qAcO#&#W
zI%Ff7WjBthYk_fMZ27^cfvxhf5rO_!jL^{)h+9UO&Mi8LS`bhAzvuB=FyCp4t`FQx
zeZ4-P<{SE}V{+)Hy1jx##Lm-}yym)r(75wsnO(mwqFCCo`FG1}u87>R3j&t`&HyBb
z6OeER92T=vI;EFx+CduNdzURb!ze~<xD%XyiD)^Mr%p{>!HH}|iU{6I%gS!`daL)_
zf@3mRa+`8Y2*N_-J&!`l^AZcg!L}q+JuX9=5((dC>UeCo(KTjKePUzDo8L{`E(VQW
z(o*biR9<dcaCABTrt2{lbWBH-&~RoAL|@8Fp;Ie0k<I#cI)Xw2$ZD8Sdl|^U=_Qj;
zh!Dv*nRPhN$thM~8EpB1Pu94hM;5D?k%?zRTfc#@KSRns*0v{){#aajTh~|)THK3&
z*q-5BQD&9B;?p5_DgMk{OQ#$c{8S1CD|6PDsNUolg}r!4I*}_&<}4b)T_&%YOX)FL
zF=``DLvgD6>87FiS{yfM!9rpC@c6*~L!Fl%3H*cCJ6EP)lr#%R{D%7Ul3nixJkDEZ
zOVNm=MEZWbwT5WY!Z;*Q)*feqtvgEK4%wUsRt5RzzCZUyvLoixOL}6~<oOUOy~*9h
zMRp2SItI4GzEmUh<N<4mbO46?>Pr?g=@wi_tb}H<311HTeWi|2s_z%bzpupq_>KKy
z4&4U7J%KCVT;zX>s{c0=`Q5T<>}coo|7HrDuI6+;Av7(^DmoblcTOT(J0h2+ry`pi
zhZW7UsZ36ltPA-2zNzR~*+RDzLNAa<;{Lqpx{Wsy$-pqQ|Lk=1CX)-6!hZr$3wedZ
zZ(HT^4h~P^#@ojI>i)J{O3%KIUU6Q2PJ`3eK<AuvMX0vgG{@8F?w|8pH6u@{jJ|9#
zg{xrelB(oKCwQ8gdmJ|+D87c_L_vc%Z+*d-D%_=-VENgcn`fKlIjdE#S+&sf+1c6T
z`g!w>MuRqEE&QOO2y;A1>S;h(xsoc~LYXYgL~3a|EF&AMpISQ|w)sPww~W;<89Eg`
zRvX<7oIF2V!);1OyN9l+#MM@YvIZajMlnY@aiQg-@@Kj~iQEiJqCZg`fp&L)z)-EJ
z9o{IM3&-Wp+RiU2=$&uM@#h)ES}YVOLk7UcTl!v>cH(E%vh+PPFlW(FK2O#ffMjmv
z!@DiGej5Wf(bF8;_FN&wF#8)+eTJY|ezrGIs(LS+yh#(M+7ph&K_;hP$8CJ|6k6rR
zQ7*4$Yh~f{un+w-2UPr#aqtUwUd~kE*d$&s{4qSX6-lTP1VxrYO^4>dj1ufD-!A5%
zWx|>gn0F37&)eI%`|Up7U@M^>1`*x=4J)-teIn9}G=Rkbf6_D*aNN&{TX-aB$|{Yi
zJ`=mhDyqsMFUzunKivw7CA+V!&M4qXm4|c1LO|~74aT4o2Eot+=l!=6<jH}`oFBOd
zW89A=$B$93#c(3c*)K#d_63m1#VBb6nU4wFwZoJ*6c@m?%H)U$KAUKdF5~93;Xnb{
zxy>5oK6H@4Do&jXDx@*GBKu8akQQo6iiPN!Bh6s{>i?>O<Ji;DW2=D~kl8LcqaJ{m
zxE;}_VQ+!~1%(p)cSEwL4OSz68tmSv7~~8?1)Vxz0T|*S-aQlcDbA3ps>SKsJVW*#
zn~Q?)e@(xEl@Mt35kgMco&woK*fxu5!W_pGlaSg=8}22XVL*z)v0;420ZB~#6FSTU
zo;+MPfxu9K79i#sFJWu4uhEJ)%6z0~jxq*l6E%#jjF|0;<Aj#oq?9GSf=mHr!n5CT
znX=c9Ef8aGRu{|j*8@C|I*=eClm*330`nRF89rep&ef(*i{jlMv0Hi$kKb-f<zjkN
zj)>JZgC}2L!UN+2TkhT!>2f8<#049DuVupaxbFfRw)m=1k7_0J;gAREgyj%z1mhpH
z>f`>Ku>b6BoSix=MsQ&VaPvJ8<F($E-@J02EC#OVzLz)g6)&NMrwV<zZjdP_eoss`
zU~AOO2K(A6et$veJ$%{QE7qyJZ4HvG%vMWlY=C2diRwO?Zg;J=c|T|@f7~xyEQj-<
zGYkMj-!fT8qmwr6XHeKZOk^vUxu&1}F?(ScP4D3vj=rxfa2#2P|KVU)NI;{ioh_Sr
zb6@8w4muVrxr^3i-*5B2hjZ&}_p{tmpYQmhhwJM54%Q}&ga`At3%920um9ZgYUXa{
z3Sd~6FBm^vWEvlOC4@)d(F-D}z7Jd?N167rYg2fbg<t8ce*2}|Cno|4-jPHPgkEIO
zGnsc%4UW&cylz#ai^ZV;h2+y{R2{jQZY>u~?;n+~MO!3d@QfY#x1Ii9n14TvbCPl@
z?e{M+#4tcWHR?b>X#X8P^A9)kFQ4Ii6tvMl-+%ELUTWDmt+Rh~;-6?drv*tmZ)B$r
zd@X4@7GX{9aiU2D@kR4k@N|OcR^bXzO3~GqzTLV&4JEFtjrV&>ELaHxMy|E(Zuqom
z0h?I?0R+>u^%kveVC@JG!ny^vgVPuFoEVI&AsFu=%B|o8+Xb_Si~(!o{V5^8%tJH>
z5*WdA9)qD`UJv2C;M5$k$RZ0B9b3)&_Z{RCKyQAy8P3HBfoN5NFRXPPx<7hfYI2;`
zqt+1xL>7`zZSF`W2Y14zFX^oV0D!+&?<w2;zY^gDr`XK#Cr_?C-|fdJXl2D{M+r?e
zG5-wWOP>NCV1w?cvPXhK@{LsWC!!VUF2#r>i($+u3J?%sL=J#W&*LY^)8~=O*nM{*
zatU+wD!-;2V_9I``mlz2Fbjd_dSLDg<<S~@V-|ZMKi(4K1gAN>_w1+Y8xQ0TGm%pZ
zaY|Ymt;V@r4t{33GBd7K;$O319_DG(sNm`u;Mz-=MJJL1B0MG(B4QM=PAM~F-<<gV
z4C>*EktCxtd9<GVn-iaH6~7TBQwT1Z_T(z$re${V8{Oed?V}t34)4>D$)~Ru)f$JP
zRD0UwYtSSuj+a1=#(X8Ef!)mFOZrosfxk#*v0EzO#9>e5-Ip%7%~ewn0}?p~!i#wu
z`5PKKnQ+OCRj~F4`~<pjYvMraV@a~To``6&5*k@qb|B^JRn98D+f>-slrvq=dGvWl
zV}=?^^!7O#fQ1*=4g6<&*w<FTqtkHVaWu@6d$FmutWw~;ZvEwYvYFqeZ9|)EySHVJ
z!*WQ|zVJ9-v-iRo5BOR`cv_*wPG)Sj)3{CMF3SCi?dqqe#pA%!y2&l5Z2An7?zXM7
zb`eZg)w%-!X5_i(l1;0~+m_A3<^*I7?7VXEsh5XEo30aEMeqqnZr#=9VakD*vuTF^
zzQvRZre&z;QVVWdA^hP#K=DS{8*a7!BA9bCm=vS7YdEDSOWyNhdgxt3)=8)Pg*ypp
z8(|s7i>NBAtc3O{D7Q`H>E@3ryWY}$*249Iq56$xm;O5+zhvPEuHRK=Smq-fh2AOw
zy?urqd{-V#uo+P_uA8>Q%~>v44Vhfm|B&Kg^%=|qa{rLx`z_a!3}7NZd;DC@(D_`c
z3Ye{nq9a3)tY1tep{w@a3KxaexouX9)!GebON7I>R<l)yGgnWxOQ+DVe9iI>t91Aa
zA-$DT3ZdCd#CrLD)W0r~A2%|V_A1?2>#{QkN3mr2=dJmUrNvU-5=g=gz}n@TKu#hW
z=CQwa#`yZ8#v45`ycTr%-+YdP;UMh7P2Xwgh$_5S`id@V%RJ^uLfXD)b3!MSxS~bp
zk}J9MaJ>F5ZRbS1z`wZgVw3A1SA+zdGId16>t&K4ba?bvSG7QHiCuX3a^iQ>!%=x4
zynQdvbWb7DLwp17gl+&snj_>VP{>M}V17^#83=iGO?rD*!4GrXIDS+HGEbGBCIvt&
z1@Et;&^jEUWlBLeapOo^A<zZTKTV5Zr(SLKByk=x`)>;O!&C4*y_G(krkW_5VM?MP
z9yh3lnzY{zWD;9tT9Q^ABp%c5W5sYnABTK$35*7Bpvs$Nhg2hP(w6jWNF^V<oi3>}
zQL;<H_!#<Fr&wi)Kqx_L|0R1xO5S48F>o)$gHhGK>Nv{6I$qMWE+yti&`sHV1SjaZ
zKdHYAX5oI#;UI&+gnv~8&%)99Cvv*0>Hqlw2Cbin(es#g?h*x~<q6QMMgzN3baWjI
zphQcH{#*IP8yoY-1?xV7u_|G@x#>t%h)zcNz%?$2DxRZ|K)#e<N7Orr$@y0$Q)6OC
zP4OKUPDA7B2C)HZxO-AbJt`5vPd01No1Jwh_KE1wR9Eo)*L9~x@`owA8OSgF`h(U6
zDp%9Q0Z89FVj6|ql@m6P7VWLdp($oypc#J{9LE5_p;f0uZ7;jjC|tdwrPhabxYDKV
zll{1<bv<MW3Hv+?_lS}yx(33Ej$_nNK42=(;?Atc9URf6fEs)FJ-3NF0Y|x+R-Gok
zo*3u6ubX~r9HfIaZ_M!nqS5-|>yEV)uk5}12=iJ*sa_nk5Mlvk(MEC)IpQx<yQ*x$
zN`8al^OHapr=J{dIBv)vN?}%u;YXmlTeLaT%Baej*}sI1d<(7T<YrKFR7<l9jn4{R
z^)lNZsbW%K#BT)i1s%LJ$N2(F7G)o+?f12Q&_Bn{J=gDB4S1OXIylv{c8gShU^Q*t
z@j~XK>!M1e*UoYdvA?6S9|`p^$Ws4aHVw_XDbcTLPe<?L)`I_r#?O%yq$>pZgXrd+
zE8^0{d;$=IU0X$Rjxm_lRUK$!BfVt$52WnI@1yZpUmzQI>eD-%rltd2qt`95Z`gPT
z@!lB#@CY~7(U$~I9>0$>e3ldLYd_@c1TQtIVijnv+t&N-v+6|NcHDEAONF7PofyMQ
zPBWBR`KF^RNKZl;Vu1dE#*bgCM_Gg|*^6G&j()g|-v)0g=`8*W8Xv6T!Y;`rB%T%W
zUlXFLklP${rjtiHG{Hli`m^(wJZU}Zj7N1n*S~L?0D5>f(CiT0OjjxKCNRlz_d0iv
zT7*?#bJgnB0gtsxbg<E{1qp_uH`h@s$kOm;x5rNU;+?X_Rlh_Vs72FSJ3YuWE+^s<
zb?^YGwSP`AyA<P`sk>--(E^n`#T~b3o{miP-I$E#L&4H+S7G=)MXdPoe$3ct#w<Zj
z?IP-4G<A+sEM`b!&smb8nL-g^xMgB`s_ov7T>+%tqOna+pjrUr%X@fD*Ij7kr!*~+
z&Nf{VTa}ef!v^|rMBPo1@=(XcSby**??Mv@-8%$YL>_UDFl7Si%Hc!*7~#MZOjQUi
z6-A7m|6?ELP(}F@ty(H&5rNj72`c$6nG_{qWSt#osC|!!Sk(J>6Aj^=vmPScP>ZoU
zJwHqsJ^@RM0pu$zIF<1O7v&ge<Vt8U$GggSuAb$Sm0c!>9WF!7+5;J(xpT%(ywAT*
zgEwiLrQ?t$9L8enf`7(mk+^QlT2386e?9FcLBF4GZnBM19X0gfJai3$x5PcFX+K!k
zr;BYN@OngqX=%`|9APa%Y&^ut=z2K^!gOTO$64(Eb;45Shhyq#Mmj-Xb%(2VFa~G0
zxgd@F^^ur8^GiiKZR5@OLOei^vQG6+;N~)<?4v0s%=T8-)*Jd~C$Dg#A(-VDym>ts
z>1G-y?B#eqZWheMtEbrsp~r!;bE)5_)|Vp@reoY@7Q6Y9OTnMV?Eto>;;2h^W2?Ou
z9H)&i?xy4DaKO<>z|u|0O}F9;?6_wBgV^dccJ{S=-;HU_jf``ciO-8?Lx;*X>eey1
z>D@^l_;mQVSw;egE15i8wdFUi?%e&p@E^FkgTR+|sSA#Su%6&-@Z?PuuI~ef2F)gm
zZB}3#{cr$?*+l&P)JHvi>q}1Dqr68jHSTPfWn1!US=(*hP#MnG9K1@*Lex2<`s8z#
zyeoDOzf!gCEyzb1e*0N1jnvAD@ixi=2ej{7@|#cYJ0;!&g~?Qzp-*_C2HV&<_F-}I
z<#egwQ`z+5J$5<xt27Uscfs^xKx&BQW8>QozK{|LJ`WJONtJ6&GqEzhwzGViqn7*T
zGf$&0v0eFXb$(cOeuvMGkmgPK42kk9PmAY|hJ;T|w%tYbGxsP}l+QxELi|%iLdEZD
z&1;`3<(m%&t&4En6ZOWWZ({wncj#OA4DC{UnRlIg7TPEtOjFJI3%Xi!7PI^?EKj$Z
zBdQ-6lKY>Ph=1If;ho+EU*E~(^jttdIRD+i{qKyA|5Hf$BF=~M{?Oy`OSK!BlRB13
zk4}OMV=SgN#2MClk~MuwQ$Eric0>Z1di<`r=a=X9I)a6%G2w1{s~dSpL;JPy_H&o&
zQ<IgaCx5o~W!2#hinZ?_f<0nq9G^?5h-9pdD<LP>Zk=UG^k)k<-tk_}75<fK;qB>u
z(kBwkS_5<nMMrOh>fZ3`{?uC5$m(T_7Rd(ET-bQ379RkVH;P9mJmyE-VcVnb=qhJ+
z4eA|MKxUy+S6jk>`xyk6bEQ~!XLtA4QG3Ak4*i5#kD=^$^4D!uJB-;Vo%B9egp-8k
zRfq(W0TnOMwlMfh;&dNuok{xk>vxYU9y?S$0Ir%d-w)8oY}^2lPPXWI8BxW2KjoD{
zF_}V@A*K4tpmpkFmM7n3g>4Cx5qPNSi3)U|BCnB1Shx2_c%7K$8lNW(kLO9m1ce$C
zk%0WoNuEp~wUpjYv*FMy(d2K^XV5jV5X@!t1%2qJtmG6(DtE_dP_*I|I06|W$DUnr
z6Nnlxf^bZ$%FL}{1`1^<q!_uQMj>r-_0<!hK!`C*3YA=7sc&J8kQBFL0_{WqNBNLn
zk;uJ_Zn(&i>+<vy<Bj$pw}JHOIMQtoJ@_IyU+3WgIaU`rnRGICgIC8Pd*)~CGpGij
z7fS5tH||72=5Ivkbiy?^w}|l~PDM7c&BQt|n2}^edQuYU(QqR}dCj6*KJI2+dk8!6
z>-A``7l1Q(ip%m@-zh|EKxI<|iuTNv>uooJ!3V3exz~=LH`B$cS_&dj$NW`{^*CGa
zm8-{o)h0j7t~0>@(*TtBy$_#gX|_isJ=uSu$KWRUMn^;L7*~9)*ku~udq-t^EuT-(
zD}r>L(VB;(o#m<#4>LMzx2Mt1?Rw3&c)5w8g8mZDU7*cCSL*|*<@i!h{t8?X@nb5N
z-_iQOcBjSOlF0XRKAVhk2fw|^_?K9b0I9yYHYJwHcV8M$12;Rb2ES%YQqz4e=|bpI
z<0t!&C@0kBlj!?|BUHp~pp3#rR;{rvVtYXIPPF`H94~eZEhi3aTc(ZBzSdOXX6*+0
z19(GPGouR~3RKiuCSRVQ;Xl20(YhHClS5fNQ*NAf5FgxzTm&8By@bs+fme=52yb57
zl<B|kf8WFlw1CUF`P%Nb2ooO~SxJw!Q1(tq=u7tDagx|H&oobYJf$sOYq0VVid@?)
zm*r1cA6(0vg@<<AksLB@^Or)pqr{{KrR(GybO*US&ygP;8VLmy?X1mNx4`loD}jxz
zeKnb2#US(FEC{6SGDn)tJTl2(Hh-n>Y!k3#8@W^`tiJ^ZJ};9RM__eG-<c+Q!}hkM
zc@-R+`L*p<B1HS{Pk(U2^1V4R)+KgV0r~DOR6_e-c4}R&+lQArLT85vch;V_25c1`
zW+8-RtG}b0F=Fro!g3uD>6k2V4P!Ger{o&qXmbKb*A!6oRELiuYM5)tq#)#HCSA<5
z&z+q3B@#l4(FK`vuBXr=LVB*8BHzjruH$0}5+=?`PlHS6N2a&jmSuM7OpJ2$+%SaK
zJ+C{gcmf={Jr&Ap<x^>mWN5j5ZmJ#f!pDcY4J&+=f(f)*adr36_M)hfjzfVPiK3zI
zd&j!Bl!>a52tY;0C`Y$s1ogst34x}9dPSZsGi3n$NM*0Gh5V(dC8*omo{J3A596^0
zgm!8qn6vFIP%<MR3_&kL4DD@`5aCVfPN~S+S)tiUU2n%6k@wyl>9uM*h@+g<XoJyg
zLXm%o6$%Hx@@bn&2Y8{%shFv*nK0rtDDI7u7>kln(T?G@<UfT1KSFNd{(XJ#UU2)i
z8y@K!gB|Fbt<6p4a=bA%^qAx0v3;p5|IF-tcRb?pKH5M-A$yQ(?b0j1tuxs*ZY866
z`Lc)44QSM0M)-<K0*~n9QnS!;2&>UR4Q*Pqv*gNPAg)M{u9+HRerff@s^dW!$Pi|r
zXj~_)*dZ>(Cf(_x`k~iPEWfR?1uyesO8?WuG00$nd~!KXHPVEziJNH)ZmScgC3~@0
z<m%VZrVHNZ`!?MC@l%Z+2;!%YTg#0yf4IhhA)aN4AVk6s9CAg>4T8gGn4xp--u2zx
zz)d5xv)PwjqW1w{JtPmEM2exV)#?mF$)`1p;!So;jR(V8DIUl$S7!1xRQjQ3<1SZ{
zitE`bxW?gREivU6XC42U1+%};+UTa%c6NTSda$#AcMW>{J0WtZc(B&Tg=t5<j5m!R
zmOP@*!|C=x?!bsGi2PvzEM6Vk&@pe7_GZPOL7d`UOq;S+IaUbT(~@+NBnz1}88rMa
zC#I6l<6Rty?ti^BtC3g=K%~s9xZ57{3l)$OW9XQ%wfLN8P64|<F^29k^W}Y3rMkQr
z+nJLI4|>G&`dZk~rm>*DDpw|+>$F84pS)_HyzG;c(CH|IxiHxVVqVW^IdN2<xcRXh
z4e#FN=einzVO1|P-s{C2$4>p}F6?t!ick0W!+u6FY}?k1fGX@Gp0#yP12XqPG4R6s
z?pXeFl<XoQpTJ0X1f=8pR9*cNYq3wksgc8-qQYb9t8u})$k_yzR?y}1(X4pRLIDTA
z0_XZn;{h>x_YPGB^=Gc}&#k|oIpt(fIk^h}j8pL+1(NYrn#p?Z+{3Dv!j#c6AE{GW
zMqHzEc@SISh^3Jou}f8i!v$$p<)^Cp;8?a~%FL3Cg?PgCqSxt8@&K;d_HC`KUTYFF
z97nCaHZF6j1^}A7bFytIvyilXFSD%T=q&H_8L+>SJ9E}g+GE7LNNUsgL!WdrfHHj_
z*uEjG3e#^<1?f>oAN|rWw;aFCAHcL2QlmL{3wCI8$JKq<3e!~gBo!+Ld&hh)%Hel3
zpr)K^>_QayTdc85hKZUTdXTL^grTJLK*Z>w#0FA#ulY*5zY=v`<A8*KZpY4*EVK*c
zM?;VUzDD<t$gL6emoF3$iC&GDq%?c_wAE+|C9okWifFN4jX7^A6B<~@@7#X>3_ph4
zR3G5Kdt<RWh`Irarcm&ctm_D$k;wSzGef=2q)gsR=fQ+WBBR>Qco2c01D2{0$L*_0
zPj2~FnXx^28oLhAE6}T)n(AhY>+^vfsjs`gApN!=l3{qDc{4)dt`P-5J;Zxr;3n?}
zw95?|OHZ}5<`{>CqG0*15l;RE+Kf7e$unBe#{RLue#iYgbXZA|Kfy)i_h<}xL(L4+
zUY`MDK8Nv?+pPkn?&NMpD#<1cOKvIfAUqgcX1f2MBKhdXdqv%VJ;6Lyd}<y0w2&u@
z#3Aw&yP_41VmHut?yPu^e9c(WT0j8tuNTZgMrdGlOpVi;LN9C(s3pad6pK2Y5fG&4
zgm!cv@rPNF=LV9zgXCcSq<(uL9SnOO9y*O)Wq_TTn~p@$SZXQ7;jQve6Za~wH9Z;w
zkKSXQ@#c86Gy~64$Aw#t(7WA{!g)3+7G(v%&i2XAQcz5@-J%EmW0jezKTU^4!46Hc
z(;YHlru%4_yZ|{sd!{lcn2+0q+>&YkkZltKanfTHWP=C6K4Q;MdhlX`R@Tfe;q+p(
zF&Ca20s2M&@<y~pl<@Bv*s6-ZPGfQuBPWf)Pb~jLU?uxP)3Py_u{}SW%lRv4o?!#?
z;H{C2Uzdm?wRsg)B7Oxwp{vub49hdu^PJ55C>E^RYLN<Iy9amU=q5~&B5uRNc#!!6
zy2&p>2z&@FHWh|u*KLRkl1;JYa5x~ebd=pe#~FInX7~GMDwAB9smGE4f#b(`yn*xF
zis?i|bRO&{E7h@V>5p$Tc)<l!XL-b~CQ(Pwll-_SimmYb41!_UvOtQwn(Ou@x&<0g
zvQc!yG5meyh}cnMl5OzC7wO-97O*d=txNE3NviURoHsFU<C*htxLO*VOlpK@?amu)
zXM-K^mE<%o;*WnE0@{1iacwDCIB>LF647pC^95~Cw$uo3F*$fVpvh{yciqwl6`!bc
zNi&gO<B(hZl=^XFz(KTrM*zl5*VE%&%XsII74T;e%S3968(kuTlr}}DQKOw>)yX9A
zTwE4vtNrMG1|hq*L1{A|w{(;12m9eV(!oy{W?M@V_Tyqm&R6fkvm<jDWE=m8)dRqr
zJ$b99fWi0)@Rc>55ZR=o97*1oyG#Kocuqj86WTEBXU$B1lBIp<_Rlf504V(%Un3ns
z1VzEDq{^BLau)uo$mJi?j#-*Y?Bh16fUgYEX%rH(iFZ#{T2D)Ek5QBS#}Za`tBT@0
z&M$8tpYxNTRXdh*`SjmPlYzBC;=j^~;tM6e76=l?JQSZxR8$^3epKfn)qlxL=>}n0
z)8<Lj?7^Xf3b*8ycRS6`Wu=Z}D{We1rYbA1R7vwFvC2BoIc&L1+<^|_&C*^`opl>Z
z()p0BQ^AzZH%efw@xtSV*<?!mx>D)~>3mMH3$>I$omsWtxOo*vfqara=?;A3*se$i
z`Uc|m%JF5?)P2%}>-6Wap4L7TS3Ap9(@<%m%F5U=^L+d~7K(gRJ|{1=GzQi8wg;iJ
z<<}6%5*}ge^i5LVgy)$*F~STWq<wko?Uk|^gwE1hBb5QVg_L<RWP`Q_f5Lx>_Bw<3
zx=C={45|5!7kq`QRki9pm*m7glEBF2Xfe9``y<{K<;T4w@rIinEKalCUW0qZaDyf(
za5(d6Fr+Mk<(t!lkt#nmB%+(bJ%t!ImVuTR6xZp#+at#>kA81WyyE7!Bpohe{_7Nu
zW4-%|S=nnJ2-!TCJb2?O?<vyY7#Lgczvs`>Z`!OgEO{f$?tyQ74+^ofsUe(1k4J4s
z)l2ps3v&CAu08(VxtZ``3UUbXV>1yTcC_5@b>-{IsC-mu(!m(wuv38-Locdy)W7oF
z%3%!NmpDz;srs6${S_RWS6SEl6==5T9piL+Uua?|KIWnQ2(Q<pv`F0&`oYM-TFs`9
z;Y#-?^?RDX;`k3RHidIK!}Ox_V8kg(C3V-7*<!z_A*Fs8-j3W5*4GV@#!XBQk=#i;
z5&zNlGzNSny?F7sS6V!NV;XE7WvlXbbLP_;{oe&FSbo4h3>ewu<d1{HPyHd}xSu}m
ztaIU223)rcEj3HBzt|W7rcKjAHObi0<7;k8Y;5eMSiDkge-kivgXO)Gh<xhpZ+TYC
zdJosw53&5?znms-IF>KRS!vkcJ!dW>Sl?&Z8^disf7zK_0%%%3X}`j)K--jKTR{^1
zJG3-f@fl*k1{eFgT+mTNlq`A9K>6%A7tA@DW1dOa@gvK&l~iIRW`N#8^E+m>1EzlF
zVHsIRL8j9uoXEjYO4+4V(_rWTUaCM)@l<w}Evwae%5ZwzXuw|{>B7-=AGRjIF#&SP
z&SUk5cB@(1X5qzpmc@Q2#jzwkiXc{TQ0;{n2fsS^`>q?Lm373WlZjl*utv)aBwl;a
zroSL~8h~~5*}~>RXZ-oDFDreHbd=}+v!?J5-N2_q9>elYH%xw~spI~4nu40CqtkbR
z+yA`fg+4+V{qy~oTVA7@tlc^%V&}U$tdfBtgx0X^thC3<7_yC%da{m^W4dy#M8l*Q
zx~?}TB>MZdYj8Z0-I~$!44T1rzS(uBI}4%rFRqrhw-$q{Y0&7MI||-VQG0&34IMNa
zxM8LaJbAq*_oEw~)61&gyN?GR%>Ilv4OH{MMoE`a%Bhzue}OAD&Xh`}Qr7Lb3aGT8
z%X+N^icG7NA^dv+3^7@##P{_ym5$2%e-`H|E^b{t$*ihaEcs3Qz-|63TK&<}ZEh0Y
zx<c3iH7@cH^XRCg%&~e5oO-bU8;eDC7RVZ&ZKq`Q6x*`iB706Mt0ZXb*QUx_FErQ!
zq)nx{r_CC*vdfWRip3)=PQYHKTwv+NdIQ{_3)w0T?s|AGzngDO(RscE7e0yW3>RXO
z-lpOpiVFHZFk0~EOu`fqY@I||>uF&pUbm82)TyZ{xq6M=x$<}Hv9|z$eQ7oB@5G|n
zZ@S?C<~u0VX^q*p5DKfFc+pce3()qd28o=V=7{WHdPEogPSD^C)_{IUZdJN)T56=O
z0UHp3cA;!dn1%irasE&2adr>YceXlYQq!M?LYe1q*6-NkR)+ee@7UuK2B<+5w(o59
zfW<)GfHk-h=3y|=%iqvXMT#?N|B5}1X|V}_`LZ6mS1UuH&e!YXl$BLe#7NTRUwlk^
za_c1<F-PBS^Zya8PORmW^UBzH&eCE}Mz7<C^Y+pX^5jlt&WGHSQvScv4Lppp|3Nn#
z{EKeLyg+qF2cM0!PnL0m$#f|Ghi)*<y5%JO4p(ohaTJ~CB((>tK&}lZ1(~~YIt8QG
zXU=gHh8uygp6tUs=!5g;`%YK)VSqO7Rn#RVmBBi5D*kbf$ta!!b2KOivEZwqbpk5|
zgBwe8<bYi>{hfI{m?b;|NwZoE%CSrQay6I5B1zfrdkbpwjNF?{%8~wCril5-0huLL
zJkHJ(CDO!bl9!xc08x>dMS|2RmePfezb{v_C34?_xV16L_(+JfJXL%*Q~`aK4m-e7
zH}a`+@Sn(ID`E%n7L(9QKagga;Cp}C#-`Rz7G%7Kz56T^ThhIHYa)|-ziG`ACaoyQ
zlVoZ3zI2BLj%zE?gJybW3U*&=B+K()GrY5vaNwNZ=ha+c*BmIYP5uYo>lz51qWb>I
z&AyhZHu7QH7mETM{aPtJH_8C=;NfbnF8-yba4fq?hlc=|Yggs+e)vyDS?z@w>|p&n
zaqO=Uh0>UBxIwy2UOJ1n$P;rZ>B9@{Z$kCeJc0jsdGAit){bhcAdF`0i01`pSe8S#
zMkTnNJ-*%EHJzbG8XBD*CdQ_zZw$Ka!;*T2M+XlsJvfNx5S|jCy&caN9_Wm`yY&wX
z3f|TJQdu5}Ip-VW3yk4y!#qxpbGPst$G>TUf5c630tK79?^=gX`2Qt({r|l#^HNP$
zexDQ7`?|UXxInUSGcW1MVry<;CX`)7k{jk8xiw6>g51G`M*!n?`<a`dkj`0P&3)%b
zX+yNP_Z8RjF*mHvbQ&G`fFpBq#U}IUd7|!3CKm@sfA5a7J@gZzS9--M-n+6Y?JiBW
z0Pz^ww|8JsCy|i)KA+KJM<&b(%{BKnh=+uUSkp3pij84~GNAM$U|`n<Q~WA(V1Boj
zu6@`0gb;e87AL6I=~A~PB_cPfc`Dm$y|s=(@?zEL4!8M1OtaVk5D2Ax8~=L>(<HJ;
z2AED+Auky!0PRfGAT2FXI@z3vOIbL7*jk;LsXta^DRBh_Indsb**d%bT=e^*=RPBy
z+VaC8@4SbMh}r4r35{9{^v7+U+l7aVy_HaQ$a}1r{N{-}&`pHR@$kT26GFVX<}+!e
zi1<hqtXS#g`#{D3&jsSToTgs+ibb6v*CJ(k8GEsyhIzIx<Ss-4^yXciCq)y@arsI?
z%rAzX@V}Ze0MAIiwD&7S47o{ySaG`3D&%^D+^xO3#rg@+I@|E(EUDJHcm}IU?)dd2
zG`20y%t~ZM)N1lH+E4CG72<ARFc0}c?o7{#bB=)KnElK$U(!lOIPBcDfg-k;DqD<T
z2rzf5m*43oIn#2I@wz3OW7nKJ!b$QO$tv%S4CcgxyBkHFFnY)&WuAt+xop>Zo>tV?
zscJRI$YoDkZ$*U1(vpWmXKmQ%;VG^kgJ4=flTNoYK)Ijc$D5N)%rKMAWQlv@nZFb^
zF!3;2fd3{6^$UwNVig0Y-PEnB%&@VLVa@I#^xR!S7zUbz&i#-GZe_QhE|oNXq4>#9
zsM=BBfxrH6LwE)VB2yAJP-J(W@MvY%rvs+r@J6#ob1JSdGA(25YDN|L*##zTUJ08o
z#azjuupkM3kv%Gl0c)vDD{2cJ>>k0r+#xh}saSNwk(wa%6HC5MOygCyxsWYghI*k4
zlV&0;m(@~)Mv*;Sc9)ESletH%xo!Sh>!Wyo+E%81S`u^b&@4+}{~`UjluL@_gTlpE
z@$jOS{|cpk7Y(&bR_EGrCDnq!h84RPWH~MFckblVmX#flY<2&LD{qX<k%<p10t~cV
z*4%yRdA|xJ93O*hEwmaWZ3P!u$MDv8Bjjix;&$tkoo~{qRK>E8_g6Nv8e8S|PK=og
z<k4v-t<R2!BIfEWF(A3n2DPwMjAzF^=?$pCSA0D|65uraqpPI?{9J$Sz;ej0>k;Vf
z`E*s8!(*%IFD+^HNiYGU=!<Fiv~~Ewa|SWt(*>S#>N<fPZpRU_?PveX-H_Qs@Z059
zs#gzAX-SIy*2~3~#8(Oj_uv284YN^h7BT|{1e5^#znNzAZQPwLZ2lF4{y!7Y|J!NC
z=AR0OPo0l&;c#%5+%=0fAI&A3@PUC1lhH-#IUo>Nu{<00y42G_3x$L3>*#nK3f(5}
zlSt6KXxC}pXJY(eh$Xkb=Yd@K5%ypZ+ovHKpwAQ2qo%V<HCVkFv%3M=<#t!pjXG?M
zoZJ9zTp>d2LTN<-;(FCmn9hy>Z-YanBqg;n9iMZOB~fWHwiB>{yoscm-e=wK!$ZXW
zZi!iPa%)Adrlh$^Bl}tveTI|?oZH2(9bA0;E^pTdcw5zaU}LKUJk5f9H&8PVl5$77
zad7HY$RK<c%~@a>Shk%q%~EX3PIFsPvgRt1wDPvng(M>A5u`P(c#q0;>I5;zLMg?~
zULg{$c9K6d_X{?{lvY{gL1Qw()&g!Vy#gxpBe=HIor+xa=}G3Whe7nv-Vs;<GRAUk
zuz%tN<0oTy8#(eRE@X^6w9=-?D%L%4YJQ-rr$TI;(TEck+NzLW(!T)rLK-jIr19?t
z;@1n6G*&cmala))a&JhEB|`?MH%nak?#!Xh6nwXOOBbTAhev(aIB?Ktz*rNKg})J<
z7ik5y;q<WAHIqOVFc%dlg*TGQ74^qn1uPU~>oK263(cxVU0v;r+4p4&USXT0?FSb;
z34mK|N}R<1Yo1{*Y3hj@o@`l{dW@PVNtuyTOi*1AHC>kf)!EORc7wTh!`f<34BnD0
zy36&P3PF+L4eBWuiQ~Bg`fY;&e&>vkz!&Q&X31fR@tfgu^bf3G0mpCgIlJAN2u@)A
zO(@fItej0~iM)1_U_<9RK?oqrq>9*plFCH6x<8n6<2{rVz?Yvb1Yx0&YRPz$1FdIG
z4`Kq@ySiO@#N#u?9}LEwVW@FJCq<OU-M-EjguJ^B7DRS1!4PB0WIQ;|e5ttiWAXqP
z*&4YDe82<+r3qSg!QDo-W};t^^ebeZ%#oW1My-aRCfTC^%+4}vQx(9!;!$MUGsLW=
zoconS=My-0CDR!>VT7k=$Wv2Ak2g$jnO=y%oS-cxteq1%hxq#p>g;irDJ&*r*Eq%S
zMNesW4H-!jCEb392{yrNd6Ewr8te@%1kRG}DhbJeS+}GzCW<F2C9oGy%S2*1C+Nyb
z*<zCM%nJ2PdHD<hr_9<)2w(ty3Rhr>`<QuGj=Tm1WGkcaCqcIU8qb1nlokD*<G-Kf
zM7&M&J=q9Nyf-m%Ia7E;HEn+WNowRG^I^*WP2S&1t-b>VAP3Ljck=qw%0Ob#I-9&n
z`~93zbvOy_v-~~TEJK6m+*xUTLCkB|fQsxTXhbNPE*rrGv@uu9M|R(zZ0SM54<$b;
z(b=oe8}Nz8<qX}Qn)+`~dNF5A9xq96^cnu0pvO+poZVY_DYbPh6fe(l6*<Rwl&D$O
zg*n1A;nlj-Oy+{L1I54j$l8rCJ#6cwCZ#oHsV2)he9XmIj4Db0^Ee26LI#I_FwCGA
ziEvY3eM3Bp10)9i6J@L4dFU9U0UtJopy24XEr68ib9cq692vYJsO%ZNFw1*NZ3S|3
zVM-*f5ljvgP|UwxqsE%9NPkmBm>dj0iK#jV$<jYi$F6m#Q2kK($M3;jg2)66BB&)k
zs1xqcfFxYaWp;F$(^+c3A~(VgR#RKm8LPLRKjBx@u^ZXg`EVPV&C-2EXS}xrZ_^5`
zY!NpRJY6QfKy;U7?!EDSl?TCti@f0!m4wG0D-)3`uvea619uh@v4K`QrOQBI(A^YQ
zQXf^g)SL{##q-I#_5%kym78IB@ii_2^*#45zPCSC$+nzXQw)70&oX2@^xNE5179aC
z5k}oHdsxE&x1n1OzoF*N?c!IYOwFOw2dvC3(4p(EA`i<SAeKwdektDs8cgP{X+7r7
zGkN(~aHl#O_^aguNU4(H&8HEuZxX_#UNm1<mF)J_N#rNxvvoO7beqqGlaR$n8@Y`q
z&Sn!9ca)DTHhGcfo9)%`ez86~KDt|iBFs6%zemk~c3#P&QdFGpo%hf8&imir(d~`x
zY;6ATEAM~m`7wY<zx+n}-)jC@c@xNz6623X6-c>%T7^}K@IVHCJa5i2?-kNCg-i(;
zqz}J$U3c-srs=?uCm={4g~;qcSNY8R!}RkIbSt$BLwv8iSn@g3U_ZYW&O$1Kb{`)+
zxcysd)>sGOnN@9Z>RAxvZ%}HE1UaM{+uUE0h0`~G$8$5{#EL4P_61Nv8(^Bre0Nr;
zCvzlO_S&LpEG}I+8(^=a7Y4<C;J(kFK3uk+yWW&sqU%(NyC=rQ9Acs$m8=!1MFpv?
z3XvF>YH9hE{{hiit-Q)*!FktcIQu603whShJSk8WNN~ADhk2aLr4L=MeknJ|*Dz5|
z@q{r}zOzF}Q#O`9h^0&sAt2&EX@oYZsn*y{Dyp~CtoLz`;?%FFi95qe1!QO9_K}7Z
zTrhMtaO`88WioYE%&9=13A@s-{J?lV0SSJaLXt49pigq8_6acvbdX$EVPGXPZl!Uq
zT&ovf-i8+JgHfIms#!Sm+xvu|D+cF|pjO5&SsZLNMzId=HGui`8>ApY_xYmj9Q}_T
zx_#BfC8klKE;XJ-xK<oFhau&&`?97yzf`)k5R*-av%LK^>+VFZ3rJZhW3D+sLC~hc
zKY@zVpL72$beJ9U<(*M4TB%u`Y!dm%0=q7`sDx`$d0E$dI$6hG=4iE&0dt2NZ4?ec
z6SBU&%U``~poivWAMxwT&sz%Yk^=aJI*Jnp3i3XPz${Y|!3|f$ePllfq8<>yIZC)k
zlTBoq>^3qwm4;yvI{{@jC{i<k=Q~7_y~(x2HEm>+Nm7VV%D{|&5XV3`DVi<;Uch_6
z9O~6&M6?);9gDF77r_!M%^&_|iRk|lKsp5~{wpk&(YRzfNAzOAk1bfIhVWia-~)jg
zCQHyF4uaYAM={v@Kn<$?hC66fO}zKScgz>jgZihxq!89;1ckY0EKCz|>nN@XUjo+j
zU1Tq@q!7iwcz%Gv9j^!!8cT={GeQ{i_ALo)dXS;cwBu-&4K57^u{=xm0Ev($d9yie
z*&`E=Gde|WIZmbI0N!pqQ56XO20hjlOx?oj(espqGvf%oe0*!z2z^;lDjji`fkO{v
zI^qmnigh6Geu>@ebNGmzx5<?5#{%(!i<X{D$uT#y7rc*KzoeIMs)0Q!>GklCJ0|Tr
zdS>y*zTmH`<d;QWxCiEqlb<k#zn2GYUK;zZ5wbjuh7gW8-=+edGfo$LV7hTUSAOZU
z!t$%@n|}}}74o4IhEI#?vbOzIT421;dcGIEL-1*v{zBA|1rJ#E2#`MnU$WW=cWjjl
zFlp3cn0M~P?-+vY8vMe=ZPB*Y-?`l2fANI{7tg2Z&}gKS)kXLrb`250Pmz!!9*1$w
z)`|5O?EnAXgt8@tQ+`jSwcoJ(fA1i2F?9U)5B-0%{Qp*AQ*>GrL-c{~Hlj#7UBN=r
zF}qXZXBFb!(IP_1G8vYSjD>e%np4c`A<FuEzQR|E3`=+-G7a8!ZhpUP-ll8E?zn;j
zzb2n})QqHY`v~CsR@lBnkArmV;4a>7q`&rNr{*)fE3eexGIjNI^fHB0*`(B0v60iN
zsXLckJzt<Seic(wS*dP%;|ZTUCTGH)kcC!Is~ia+y4j<X%Y@$hjMG*^YYNxL&y2J+
zEM-@vbC2WPtWN*&ba1#mx;)f&Q<#LVs227)h<g$x81kSvFH2MfX|!ezLUPia2eyU>
zw_mJC{E?qBDXcb5?@SA0nyy7h``s*7!xldgwYAjRzyqUd`iP&5J<0`v+}70Xv5qKJ
z3e%|4sygyrUkFE@moA20Q~D@})?%)vX-viN=ut_az%;^U>8JpiMH_GJV^jJu$8TsB
zWMT1LEv8^An^FTdg<b-J-^d|Om}L81Ehc<t^{uh(*Qh%5eOHT}%OurZeg7rt|5S?=
zlK7XRYyVR%#-)>+R5J6LT*ZBEYwefv=e8!8xgS_*bq!EvYZsvqgL1;`IUk}xeJ(|=
zswTB(LIZosccpcDN>toNimHnP+Z+;f_#L6X!8TIX10s3&kAp~pGt{3fl&#9eylEhy
zc+gEp>L-a)8QFufiV2&l;;#}4<LDL&6nX)X{DYw=tQ`+@@#PIOK3KbTSiLr21U>(6
zjja>x$q;?s2Nfh|3V6y3Sm<j74rMA31n}U$aJ;+n+b~@KlML~ON*<9d3^#I=dzyqJ
zR4kCiw3ee6&vgVOdt<GHBs&n*A&^Knwbh}olhxihweXe}88)<iItZi1Ys_m5j>|yD
zV3}4%KxTu`yj~D8{94oy*~tWB5I7k2wYA?5kJuoZFD5O86C(HN_neSvtk#ZSDpSn7
zzqdhZIL<cr_nYJ2DL)H|(Cb=!l?o-q^^PH{;KC5Kns_2cf_SPx3Xntr->1Bzv++lw
z?K;9oQAZR>oPbp7#f435Vdv}1)o_bEH>7S!`j*)oGN+L7gN_54!)z5WP0sV0?Z~2q
zGB~7A2Acz={a0}8cYgNS^OH+fTHBUK3V?MUti%sQ?Hy2RL#}e}7^8bc%8>xK?fPf!
zXE_{j*j|VGZ?|A_HNMWH5jFSUl?dT^=J$y2ye(&rG!KCW6cV~=v#SZ)&FKlMUtTxQ
zt<c|Q;K8wCRjD=t^Y^nmG`-jNY`YFcr+#K_W%(NKd{jkkRO}#ZS}z~z^{x)@WiNg8
zs+Q=2J3KMb)PGltX+oJ5HN{X&@w+*@GJsY?bZ*f!4k)$;zT!6ft4vgHYD`enuX=5H
z20?I!=kT6CTBEF+tYogcf2m)K%I|i7;&Q1|lo|oAG&)+qx)7=wTo=;Yz1vj(DjVsU
zxW5$A>vR*G^ww62X;`0`B)RyO!)lM?HkGHfz7Hj#bPtAwcW5Sl;C{T!{Y9?oqkE)P
zdcNB@aM`!?_3}<u9`-}S)ox~s_~Kww7*3gV@k~xCxoSCG1G+m40`lBv$b1^kawEIi
za?Z|s3yK@lDP`=F`2r$v>}xAj7F0?T%J&T60OM#g@f#6L*_efTD*G9P#e6g-FH2J{
zf{Lz@I%f6aB&UK%Z*QGh4GzwT9Q80rUeQ;+VDAWzKBL+$jvVbW7}^%khQBg)NNlhm
znSOTPl19U#l~#^p3>D8|w#fNo5ewh5vt~Ses;ee<iyemB%d>&~+jj34(Ug1R#m9ef
zZ$i?U>$`r>dc5ELX#dCihVlRH_5BY;0Pq#A4G#OQ2-t=jX}tgW4+CcvB^TV1VJsQ<
zPm+i-JzP-XulFlTEC*%O^$<Bf!|)EztJY(9fGj;k!st3#y)OD5G=2B{cOlwy)bNza
z){;GL|NZU5?9}X`aG~up9Bg%w`aIH$WWICU0ph5${)x^uU(a+;xVEZ<X6fG3Ii}Dt
z9oJ&6D`7mbau`_lanDRlDq_CFG%Y=|reJ-_%*dHR1)eUeYCQW+omm%emYjY^hX>Si
z*=oRT<46o(uNJdkh`>}8*JM_JEJMU_Kt-(qC_xym#qy~vSnE3dy&%4L=Ff!6ri!Ii
zD6nH-Q?iNPd6QJ(>S`HrDZW8*T;^ijOw#M}w<G|ORhlIgC4^20NK6g2#7+~`Jk1}o
zpS?&JQrJ2LEI*fE7GSfTq6$$2kY=d!HXiR&TtqVRR;rjG!`paEtpHJIFZ_sk8$*)#
zgOemxF3l&-*vE;WZ6eQUIKV2uAgD$WRn<lA|6^K&3#nJ79)0u!L8lEEJB&H2N#*Q7
zr4|ZZc;65#1QbVt?0+!!PT`@o&6;j(+qP}nwr$%^W^CKGZQGpjjP1;D=Ue|?tNUNO
zcXuDWN29JW#!*$hcU3**`B~msfmV=9?l5^dg5gsUO`U-<A&5l2WGM0CxF#V_Px(Yz
za9TO)0AJ6VU2h)W1*U1@K~TXPKOo4C#HCmd+Ay|)IOFDVYs#G4rldQW>;?IW!m25%
ztK#yhvS$9fh!mY5$kWC47mPy>TrjMA26R&vUof=x-T>%&Z`99T$D1|6D{#WwmCeIx
zQi4Z#TmAzXjeg&;DBWv%n)DIGS3wXw{W}Q7qW;13%RipSU<26>YBVmX?Z$KMV@24=
zuCv5>M6-;=u-4qs?a1D45EmRe;6HmE-8&q3vg*>MJO0`0XfyNyF}(QP{Zrz|f0f%4
zClq%Rq%atb&*Od2KnHYo@f^<{KM#0Amx4|aw8{lFn!%BSe$F+da`P}oWEq5drV}IP
z0a?@AfF^@5eWlOLzm&siL|uSACOF6l_dpScK@;4=+5{oiXy1oJt{Z@+$lx3f(!`)>
zl=TS_Y`Dc(YtnEa#vYp<V$c)kxfKs-gsD};FtILbvnGM_N&0cVA?!cSHyujDp~s{h
zKk;XRvrAnpKS<8SPVxZE&?S}j)n@+=^Z{3_3=mM)c|c5qIran1w}#@iB__c*>0c<I
z39dy(G;nUfjXit(<;VBd5P0mei3yu;r0p$V-DqiMX&=O3{`g+D%Jtx^Jyu2@zscKg
zTU)W|S2cX`T?~)DGp$tbS6y~ny<JKSzv=6rgij}wiwuDbKS@}r{E?2czrJ?*0{P^I
zr&AsuBrR#c!09is&w7Q<v$8iawKHk4DJMZJerrl1ht*1fNS3a4@p0@hcjl;wHmXZS
zrge1<Rc7iK96;oA{fP8!oKR_F?YlRwR1C9AmD38(hvmU{aU_eq<Gqd#roVnFI<T{R
zs-zbYxIcWn%C<?J-oi{&Lf2=XSKU4YEr8!?I;^+Esr;EWNbbPn+Qehp1hx;ISlz<g
zgTZZv*u;`Xus^`RCz1dKZPa>T007zu|ND#U|H+rB+bVB~A$(oyHwcsAaw|p${*lIA
zgn9>P8FeDXoRl%gAk4WVO`TndqFkErziA?egtjP!vCWY5X>046yKcJZdAQD+y}phs
z8^nW#r}lcl{~SQ?dLPZhol?zMDwX&C98j|_UUSdr)I?j}#=nI3Vu6J&S#l5!j83i4
zJImsJixu%IQlex|+2I+veX2Am%6<&`V2Dw*STJEKyk<e@-Mv^#m|4;=Q=uV6Ws;75
zmM9ZN69bJI>8jwxfPv$?^v~B;rI}dQvKd2r=-n+t?n%(h9B<B-K`Q_<B4O5xpCBZ!
zjx3p^T#Gtjn>GQyn$S2BEv=Q!55cIICapT@oF=j)S)+n&;?}YNF;^8lo%T6zG@y@&
zT@exuBaGV1U6l|)4UM+UIg5#Gphz_|6w*6gk=hMnjAY@czz9mXBZ<1Xn16nYD`XyC
zHWcMbO-}Yqs&~ZE3kJtoNiim`pi?2Kq56xO-4MrSgT)^S8NNWJ5;2Vx`<w>`)Q?6f
zOCZ5Yhxq#&L0VNnSh2b&Q5u&GbxV|y1&&!th$S9M{cozPGVSxGT>ivmzPxfpG-Xw>
zArU9pk|BgUHS6*N*+H)fJ=YYVyZ9Oz*&~e68p#p{c;Xf?B1vbwN<t8tNL&@{G8%`+
zdi0gr<Qmg~UQo^f*;ISfVrAZaH>$V8`Rkvqv4PMl$U(2;j+0r9=(E$tS%a}>$9mys
zmuUYq62BZz8h2i&Su<qu=nce6UT-Xp!M5>?Sh9x(X5NNV3%vPdSc`*fPQY%kT2Pq<
zjn?ULUNe64LF^nMBYaL|@^+T;F*yd)VPk<!mZqM5%o*}l@um)TXJ0{__w_q*<SkBQ
z<5^fnfVAO`bg(~pn@N&6usRH1<2hit!KXTNWyFE6mqiif2=RyOcf%C*RN_xzKU%R6
zwnhp3$i%<U57YxyY;G2f)*LRP^p6z=31hC9-$h<8OWxtL1D+RtBb(#Yddqx$jKgOe
z;6ZRXZZ|+?ZNCn3yNeCtFAg7>#9CfMLkk4j-tL2$>|<OMb=+WV;+R}}K4|W>FX4G}
zy3z~46t)=hvY~V-C$X11_DDZZh5R@+7e^|BmvklJEM4Zq-~q+?RTC#&dJ9u&Wk)7Q
zxnUQQ*JV?2^jLbY@{HhDxpOVX*HG9$9TR!dA?uZ<Rl>B&icYZ;czN77J~h*J^H9CY
zZ87@}E?Q~%XV3al8CjHf!5vtyW*q8giKB$0BJK~~(R29D&LfZZkEJg^8*9mPrk)c0
zRz*7|`zX%+V*762FiU$kL;i&34Ux#GK9b6mXPKM5kH7Nwc4mPOWNpixq(~L1MofGo
zCfRN1`&mie6REuwP-s?x2j!gC_C+26rMd0sU-R%v4^k{0mp@c44x#$6@NX0emKlrf
za}9^r>BIWF!DzP}kPYAV=oxAmp@d=A7)?uqGz|KrXqGm~iSI|QD)1Kf7?Q7&HdFRi
zl71SN^w&kGd?{*lYnVG3)7GK7L4N1`))n<~EiuwFeM74<+_LIxs6>m$VMz=YyYEft
z#wYqZu%k@?-1qCx7n93I@@K3In#$;xp>OQkCpJ_u!-S)15L|2P{wrnOvM_@BF2WWD
zoKgwIL$bY-hfDM)v@Nnh(ve++v&@*)y1n5RqJG>&X3OM^Pdf?*ap+fXuG6y+U!{wc
zN-*$(FAfE=mcc}q9g+9Yc{Nlu=TI$|@l?%5PgI+ZcRx+Jwlp7Z>-~+bEm-xMNf_^i
zPKoK_cB10hbJ*_ira#(hS8H=<=eN*uuz#r6t<dtzH`LQ-l)^4=#j!Y6vsHVjl}Z+z
zFX8XQpw|7JFI}tO@ASi7I-@5BJ=GpJxhOZB8gmqwU@9oJg-)SujI=6Y<}X^iMnn%$
z&uWLb{?0?((Wkr8AKgQzY;`+K9kt1O%xzTSCOfAd*}^&gjd#CC!}rEIdSz#%GYIdp
z0y=s6r_=3YINwZ;v0y9sSn=`s7xhr9Fl}aDc04-VjZk9zTKI~+l@A)U6x)sf`eX~{
zi-v~In-({ORAQMh{V@GT7Swxn_Var$_yWBp?!e@uMBT?EZ+>x*v3@^#;rf3YQ1sf#
zpL*$^ymn@+&v<dqW!iq)df<MiUTdU(`8$ub)b*1$;a&C&%EPyu62#SYb;aGB&FcSq
z$kKBgmo)idA4sqO00jT5{vv%7OJ^4+OCwj8|BI^JmfcU>@?BGhLCTMZ(Q?Yh>M2f}
z|1-InN`|U;`6`(|p3=fNq3W4njq>?2OGBxh@TVPA2{25(i`#rQ8*}FJw45EQCy!yt
zjIVa@l-d{J$JPH$uNcpSS{3$S=JD(_uUHYLv`=Gwl$V#22iqHMQ4!4+q)0R^U~+v2
z*ae`rGbI$EjN0<W51hnesuZ9l2#-=31>=YX^<_5^WWaEnE+j%FU6uxHp>X!yQWDi2
zm4s#EcAH5`N@_DNGk2iBAhpmAz8ojQ0uydmuvSFtps=D4#g%?c4^KqPH!cTIe^OFY
zs1WtVPcu5)M6akmSDI!0XScdaP_23;C31oLabx%txCRA@c{7Ph#dlRHS+Y)v6CrX<
zJRk%-HH^q=i-e(SWs8iXBK@J3vR*lj@=p#<0>x^HDnuMZa*oe!Wgo_U+01}jBT@o%
zU%ClW9eBuj9w4rJ3{kAmA``LzmPd$TXwyZzh%0x>IAN3#<y5qA#)s(APC6O(Q<P)-
zkD?rzf^>3aae>NMR&)#lCKSB%xG@a@ruj<JIhS@wCvHDkW1Fx;=yIt`Nw~9Mwo54C
zc9||Mudie|9i(UqYNvNV$MHV^1T~y!1X%C~fH<i_TZj%I4P&KQcenNj&qX<QC0C|M
zl&8+iDJ7(+h>B{<tG0~rX5Rt;+2iPC@d4||``$!uO@}>X(FLiS1%TJ}yV!no0X{pP
zFZG@P_hoZsZ-9h6_nw7igMvA%IT2-bp@U_M6Sn^pfBOCq7KY^p@@<SdO~G_C?&~n^
zX70s$&f?<jSkxKgb^dXTrjt$2^c$}kXY@@M`&x#^Kyc3jPc^=mHdD442mA!;GO~jh
z7<S2~!wMnzPCW_Z6L-tS@8=ZuJMI|Lg2yPD@ihw-gI@M6s8_%&KE^<h$r!O5;A4XM
z@#8Q-V(S6E;kQV5LAH9C=rjb$U(i2kxZ0m4>B5T`!tmMP_+N_SdxH-)vRMW|$NG*@
zpf~+@6zPm2fXwrX7FOR7!AARxwR1%Q)*BpR*Y67~e{#7Ak|W$>1_`v0Yiwy7PR`pE
zvF7>+b&y2N`vWc@hkWx$RvI&Mm;k9PLbuo@b>`sP3PIC!IX;3q(2A7f0%|?`!P0*c
zak@^Oga>P6UU4ozDMTmhG;LI?(`X?4U`u^RqFr4w44TjYche%)W-?tUww12}#FT5K
zzViivq<twg>3U-u<j*I3$}fNYGeqWY)r$dU;2U<;h!rG1b=M?SccizxMQ*Kc=p}(#
z<J&`dM?7?<jwt6-^^&hn<Bt^amt#Q(mUBxpG*>?x*0|5=tG4wwslVhc#^HvjX^yE8
zFx)b&XeQ=t>xPqd%`Q~yL*j%EO*wP&#yb%wsCF-Na<gD#yZ+v8AKUQe=Isr28dDck
zqqE#|^{PgyGDQyRqd?e(N+}LLJ}{z5a}6g(@+Gp0s>`y*Hui0zTjItPE1!5mh4oEC
za6oo!o{CTYVo_H4pdO3H@P#@^gK#46vzm(^6%H0E;CM0`+u%l%_-21x;p3h=0~M>V
zMlKtN1h>(_1vdNPMxXK=&>E|)3X2=;m|4ZM$j5QUShqPyu8UaTd<QyB-6W!p{Jh*+
zZ1V)?Kn0eyK_1muA3RGFyJA3oDQ`}`6sq2|=<G2&12$oPWoJ{Q@2^{eLuSdAE^So5
zV8z`rzK3E%D3NFe^Y`c7r{K`}pFKTZ7@!_jm3d2iuUyom$UNO3`_8?+x>W3!Q~MWz
z=lO36Qw5mEDlBj87uCMy@{=x~$m2&Hl~6-GfP&G_zaw#CbYDDu;l;SIisal8lA`zg
z_X~$SYN*Z24?SuBA=m$F?=5U^XJ%<GVruq(!LN7ivm_AwUi2BIimj0x<uWVjuPW4G
zti9_nbkGuyDT(S^+Xif6@ni3Icc+0Oq>Z<EA89o8+}wKq9&Z_ro|qRsJj^+pb<qr?
zW`7pK8zKG<jLVtmt}tK^YdefebB^`%pjz=#9-25BIU1pSm8|&}KT$r_smt4AHyF`E
zRZ6YY_{I@F?ItXPdV~^DGNEedf573mBPJU@Yd1zi&!8#TktjFqU@gPdT{cZz-D}+S
zeLpxj*nXdSxh+43#n6xX7$?SyVw`@IOC3=|V@+<9LlKiPm4s&CR0*i^DxxZXtn`zS
z+V}-$T3Xqu;vPmpAZ|e=IYzymT*1QaUMVq2u3<@H-a_JH>F279JgH`GRiacB4+;Sf
zpB`RmoiQL>;Z8Lq+9PQt>{;@l^N#?Q)pD^aL=H@1HNVU9PAvEjK*9Y7ptQ=aklO?#
zaW4bPZqNJx6zd;=BKr?OS^ohjz;YOjGsrC|rgaNPb0Q3TxfHyJGOX6||L9-!2oNil
zE``-{o!MXF&<htegxCgw7AJOlDQ^EpE4U_~H-EN+=~Wp`iA9-ELn2rH0Vt+F00o|M
z<p-cN4m!v?m~$A;5V*rOj?WWR@Wc<Ots!YC)`K*RuE53B%-<R_UZ*KN5h(u)Uz4gT
zF03l6UOC1c>jXfQF0|k>^*=Ge)V5FQr2lro#MuCX6*qXN^Ro}|)edXM59vpjj$=*>
znCEZ)3}-e3e8Hu6>)>xPKoZ{rNA&O+AQp)Mf;Mj4ah`(>qTHv^IGuJJ%XNqoXD2&P
z7UvVqHj=<jb;EEZf4)RWb!>+L`Dv(d+V^17XGn7rhQmN#M|~hhaNc_8v_S|u;10wO
z#n}KY2!Is!dmc8n1({wrB6KFI0zJp0pj82@@I(tIb>^U5XAi4b-;WXfX%byu!+<Y9
z)bTc)OD9N9@?QWkbw7xw4Yy+eMU)pAF5)m^fCgHdC&L&Rq`qdjL+lPn%n+hU4-F*R
z8WzVufu3p49S*|Y;4s4ryJI>C^p~P|*ux4HY-RK65<BQ;_bg%&^bl?*3GV=eu04Ty
z5l&nlH*=qaP??W-mQQRK#JDnr=F9T*8TI*<z)FyBO}9?D^V3YxbY1(O1V#5B$L)=3
zm4W>ug0<CiAkxb%!=M2b<Zf!r;&Qx=`ndAdl8|zS<e&K;jvE!*0oewbysMA-<5MRC
zk@-h*?JO|xC9U?)5LoYN=R}n^DEV%a_fIp0dVw2c$i$0D77A65e5->}%CY0#N0hkx
z_piN69~Le(YMd16<ap19_7U!!`;4j51GiqC*w}@Tq1S+?jla)qzWovMyXI;5&-D=%
zs0L_t9MQ9Lojat;Oa57fq5aP}Cs#1L1{b5^mkBMaoUFai0I^Uu$yYc&#ii=D0xRq3
zO$V~PVRV9#?aev#9)F9BgTL<E$87xl_uMYFq6+NWUbqCTaSCM)G{;k4m0${<VZd+o
z<X{BPW`@+w1J-Zw0xqV7tH<H=ryf1u0krJ#2MzTR*UiHm=C;81yu9Jr133SDU50U6
z6#k8b%Pi$ng`3@2$%4Xj_1sOv5~Wz|9^mH_zsg(H<|<h|oLO*w?C^aeGWY+0&-@s9
zLrxs0{=4+$@la7DZj%|wq4J~fAZ-1`u}S<r*~R(>{_pAVw*yY=;ZHg|gY^GLa7;|i
zEbUDH4{Cx}>bv%vKfd&&4uf?OQVHCmvR6k%H>M}PhnekZlkg8Hrw8O#P)?Jqm*VpG
zr`f98Vd_VI=kt+Dak%c>H2dzf&kkwNkXqf#b#eyVgCpoK{?mVO^!QlxkyqA`EV`cS
z`-`8Nmv2@@l`7!X;g@3{u$@XdOT;R|_z0Ec+Sv;22N+F<QbclwRIQtHxJyq-KF%U(
zI7Ni2Nx-4Tyc;l?NSQVxbdrXdLNy5r)0TxjwQMAf7K%X=@!I9fd)+QhU!Z)YMqn%}
zMJ&-^?dc%J55Z|nkOa)2AqvGrXDR|c#d7LbZBXL;bJqBZV%jKoHT4g|q5CHruAd?8
zI5}g}miYXmM5^cpJ%uuXNgBbjw0qV{kSvQ;RibqYhxyZV9}`+$7|*C<{sVCw6{`z{
zl=Vt4T;CwM!J<&SmE0hLSrTdd>dJf0{f6Y&OAA{hj3KjZ_0X#Wi=;1sGb<+$B@)rB
z2xA&wS%VP8m~D~#haj2hRueYItFIUC=n!SrEu>^Yq+@>i)W{tu!OOK#%A#mvxGKq4
zhYX7?rVWq_0#ur3Z@OyBM9XJ@&L{QU2U4VdB}yaNk~l6x33tB8yIxo}5$GaGWgewp
zqtUUFFT*&=3z9KnkxT$%+AInQZJ;C*Sm|u%Zy~|zM>SBEd}z^0NMn>qm|#{=P(CG}
zz+Mkfq7!r*GO+sow5h%BV76tz25YJgKr83(gQnNU_%j=vAm`<J^WEMJ?@yBvM8C+g
z@5x~F>rO%1UdO^<gaEed0l?uu04M^_^=DVd+JpqMlVmeK)F}HH!L<(sXUuZ_36#eC
zmA)7faR&Yy3U}$3<f%N*KtTJJjz;Xn*mUV;Jn%87+vsnA;fga3RaOYWzqE6(KCzcP
z`uzcf{LXvzOu(xa&Uu=Fia@H^RM6bP%Q(QpA(}r;YT1UArTol4vVx%A_=U(=18if*
z;gCX>{7c9-U8rw1GA=!Y;SK~qcp-qn2`3wwYy%L-d5%#L$PPSIW)KAiU}R7-IrxV4
zniiu^1SmRfF~&!|_;Ntk9k@cAPo?WWRNAPyM*Fg()6OR5WDX(?tB~BF|1o*rIZvx{
z%S<f?ab1ww!b{1Sm)}AKnhu-OXILjHVTCxK61_T@`A1k#WhOFFUUnMi{LNBiyheu&
z#p*Ny2tUX&&yh%<6B$NI@K%bg^Vg~+YmnAYMUZK&Y#9H|DnDyqhLpOVn1^hW-GA)$
zlWt92=7p-~jK^vJGvoN)3)H`4#4X2PW&R7nzxWBSKxkWJPaMBcHo1Ic%mVm|XKBkm
z$p3al_nUy@vPBErDnk7T>DbxlPl%CS6CtIkA6H%*+<cJx-H;fJEZPOF9v1y1w0|u5
zhLWzUI{kd>O8II(qi9dV1_6%mz@vgoET`q!4$hTNKi&3ac{o9P&*+2GTE!PnaNyxg
z6b0qvd;d@{JyqSWI)-}WVWrn;7cJU=ObcDEUbP1UHp6<IGDSf+Q_Ym^``Z=sldix+
zNPCbayHgLd+vvl)o)es1&Bq<sd|<M4Z@Q(vCOpQtjwov<F0a9hpuc#J_>G6$)?gpe
zEpsuN;G0deTSd>F=4*2};eRvE@?kfpPMO9=fc1WlG(ZDoVWFRTE_l9|MD7H)AI?L*
z4reHSae?5%CrkhfAGqjSu2~Lsh|kslcc@8I03Wo<I$!f}o^ovK)gJk0G+%{!Bweze
zFFvhR`;S(KvO3N_RYUVgS|q;?!TJjh=tj*NehLY@Ev{2+`h@u;*wwDx<8ydQk+-Y~
z!|rNRy?6NSHaPsEVz5}w%Tu4;UTB)t;&A^Q+je_gnrRN|+<>%I=}?r1mU<r|Ox~q`
zYO8#<qR%i?!~Jb7&rRN3hrATrqoPiXbB;A>(4&UB)1%tc-Dc)pk=&1c8so8IsbI(M
z5Qp`*IZn-k&btRX@wsS{PQG4ibES6Ctvjvt5WnE++~yrG;>H)}Yw`74?GXI6uTHD=
z{Kg;f-{S_!qNArHH~>KYPu#%&cZ?!rW9Y2zWa!{v>ZEUM@8J1=>?2XPb>5Uf`kJjf
zb*^mfFBzfNeh)?1og~=mG#Hi|46Cdu99>+Op<$^eaqyY=dhzxOiLTF)cG?&+#h8(C
z=l^t(e>pYib9A`f3N?Pg#V6kU&f=RNIq$t~FwUrU(rP;^_if)^Tbde^*`9&6!o$bI
zZ?&L+Dp5{QpeXXJMD~4=;7>@}sZg1eDRHN_1>w?cP>_2|1xgr|(qO@OEa!yDA+Ts+
zA0M@(VWv7xgvy|uzRs14k`V!Y%E|lnyuZIs--q`t1z(w-l+dCPOFDX$FMHxe+vGyH
z6vU(n0UDJs?IAGwE1QApn5s-?7Y&{$DaBHMl!~6o)i?l&VUa4Wn|G~>CeiFztc1wB
zSR2+s4N}PbSiKHvwQ;_oQ#HYGoT$8v6h~2%&{)gNtHuZ>vV#KVk9H2p8(_3z@qpw6
zLP#{3rVHDA?B?7&rV(2`5w5gW_5Gw_k;d-;a2i{pF)1b8atW=H2gu}x*v<_Wzc5I&
zB9ZdYX{y**eW1VrEJ{>_cC0#p>+gUPnEV2Y)rCl5+RAWT0t~DuOj-~mi3pP2M!Uih
ztqVAn+|R|*0u{03wqhef%%lm1{_R<;^S^`#-6phLQ-;?Gb}(drVCt<CEu%pv&HzE6
zbtR}I1)+$>R<O408tSv6pHwE(m=1J;vJXh6IHDGrehL6#yxk7KP~A<po6op|9)G;m
z?RL+W&Rh-$a&Zj|<1P*Hzm=WHi1SW(^L|e)^t--QL)`cB!swFMkK;ar9rkkbw4J)(
zEY3q)?&)<BHizYcX33FiA`{<4Kk0D!-2gE^S8zKFRWx`VhY7cOfF-fT*zmh}9|m46
zSzN|-_Y;opxCig_yV2+Hy@SEjOV6e-!%()@g9pd3D-1k)?=U>-=0AJ{$l>la$%D&T
z0`fiU?w*CJRaiXq+XZ3@U~8a6XXj1<n;-O}ZsloJV_5;8yfCsECcHhD_+Eolm;6PQ
z6Y#db<W7TG<1RAr!3weCfWzf_>Fy1ju>u<FbMltEO$Ec_b{0GAZ!n-}j`1xA)YKS#
zb-`&5V?)n<|MEcT+^HYYqU*Ls0B&Y0eh)LUxA*{K&E+@kkqM6o5M4uuJN7MIo;R~k
zhwL|?uf8#H;^nXQlomem*~{e~${ni0qwaJAE(=ZX=y&gpK*jEBHT1OkI6(l^=Bzd?
zHzks~#@zU%P8+aiYr-lP+Ou06by)9O56Pc=-c@H}S3SrpWpyxbS31jn12Qe__+lQt
zvG1^CyyEV$^DWr_ls<9dEPLtHApP4@c>L=%cWjpctGtCk-v<FYq4HFZraZ&^_%7pi
z_jhL%^uU*3(Vf_Kq3X`!SwCE@uQ!X+hvpo%tT}qoLiHV(w8f~tMyLZ8X_bbXJaU4*
zxlu$W(;*P=VdhdUeH!@|@6FR^&+Kkd)g(#YjA_t}XGfVK)PYj|{2I$b8CXBwJU)8{
z(4eKVCcf5VESXuqv{^<SDv2nIcm>TopTa8ntI!!um368hYa2+&ljT_RC&{;X0}5t)
zo}S*q!kjN%^Vlopz8jai6kjr_3d#9yVdax{$3)u{Vu$F)#<3A?3>p)KvmJ7V#Es-1
zm|><I>4ITqqfj%$V!L?|#fBRt$E1Anb8=WNc3rT<D=|X!DG=SND8954n7Kly@S~(r
zt*Z6`#zHbK_++CYd6tH9pUnHE=9SlFg2@g-G3M}tW8s-eX7o31+?2UhhX&}oBsp{1
zMAWxiJzAd}IPJ4}y+hH18$tn2c6%glpOzOb`@WUyNB;)yPrNQqL~LiAY`eSm<kF0x
z>(R^Tlj<}zx3*HQ984>7?E><>Isu;%<lxOy0kEE9wG`EH_;hA&S{{)>9Uf>jbjp3M
zdYyr%%UK;ay_IF3cry0C#{(N`#~B^W>4LPR+I3A~No(2lhuO0nwKuOcY-RGyyGbNI
z5T#qdP2MVc?B6EgwD=1rbIr`oAGjSs&NBe7KG+ah);WSkkGOXk>_x`FU{dXPGo~(a
z4z#HNZbe9{Jog*Xjwdn?_iB+@S5Rs4)6IlMb`_kKQ*rIdsIuK?pNF`UOV4)?C$Q~h
zyy9Knv0AimCeP{7D?XI6H@CEkIWAwTG-uhJ+v+}L$49DF!k@HUwZtWd?dVxULEH{3
zbqT|fr5?wExRi5CW9ARyHJ$0ANilnWpo3WHrGJWzed*?JhG1{$JsBSu6D1wZ?5;au
zQ_D7(4Skgc0U##VRH9L+?(I~EHP;iea^xxZ8GA(WhYo+A($mx(i;hLxv5y!}W;N+a
zwnyavJ=8kv%oW{*N9{7zT=y<gjK8^CuaVEETg7;VTP%lB+nqI|mAgsDJqYj=DcPP>
zO)@;PNzKkPu#7oUt-AwOs0@$pOLR^z8K*(0#M&}()D1ZbkW=$ID0ga=61qPX`N+R>
z<eNTR>GXG>jd|pHM-TsiduCtWuIJ+#S#l|_Adm)o*4~s!`g$4-OY^^~t<>1JxIN~o
ztQc4IS8fbqen9)juzPrmdJaK)eS-bP{~wY3pE*Z9qwjXWpJE7F1^@ub|2~rIJ3E*f
z|5rE%e1<go=lr+9>nq)Vg>#>eNIH96C?&3~iB&(s5M4|YZF87v5}T$r^<<#n1uzmh
zq}ZIAkCzKf$muT9Ihb}EQ}zZuv$r$PQhhNcd8bD{cbCVlj#4#N;JCe>e0_?j$gNxH
ztAu@$fG*)z2ak{S+JhK;pA$C(p|8Wcu|uHctNA+}ZwRzAI34@bZN7f)`QO@Oq{HsN
zw^U)4u;nbu0J{0oTeqBTK&@J!{#>M*WrhxEG^K74^MwEd5#EVcyN);u?_P%~tbD1e
z$Hm3@e;pmt-_AgS_rFm!<6kXsvB2+7cM<n;6WKxVLE3^Nb`6(-_m3g~;DrK{2lQY3
z+O^4(DS%yc4w`rGWe^2)4UrW12@+Yax`VYojyhZZ0lmK_DHD)#=lr~q;-xS>dCP8G
zFomJ=JunUhvKdHtG2VA_mWF~I41UQR^|Ir5?Zz{ndW}mCBe)qQN@zr@zB{xR;}Vmp
zRb4zmM3W7;^vl$Lf_nCA-%TqL)}nLi7K#Mp7cx*8<E>uNo`r;O7hFY$^B<iaRuVyQ
zh)=2@;#k=SO-jy_W(tTY&Rxizs%$M`at}`2-j>1>W5bR&{2Cy>uxTw{{tGB0{`^3=
z95K|nNLI^Bq(W|HSblw|D#puurqore#KSMp4*ojmB9tY#%}ZbhZ;xPwS3WQf4JlHb
z4_O$)?Y>?e$Bq``xRV^jc&4O1=m*Ejl&6(|y`hXSeP)+)L6#n)e4)k4(tlXG(7sru
zg(|ms2LY#oY>yM5Rd;a1X2C8StY?prug_-Psa6tH-&e3otILc!f03e9Rk=2Y!eObY
zV6UODMDGe+q6G`e*kU=?VK>iF;zY+<<P@vEjNDVIZ5!rQsqGr+5gAX#qB^ulU6W}g
z&}7PjT?(f1Qfa4VRq0oudbX|rJ`8##Ri$l^Th*e)gM}h^M;+5?dRneK#IP?S{JETz
ziAK1GQPo+XN<)f-k~eQi$Xu=^3)obl>f)8ZZNY)EVnMCK63N=KtGy0kFQnR|GRKl6
zHNigsxu|D}xk;+p<_KkWG2HA@WoqfLYN3*`sS;g*sqQ7p%r96Y2<{9;tE`MLu7t@K
zDcE?+hL_hYle18II1XF1()=jaBT$mfUYmfitTwWvD&|-;I~udh63vz(4Qa@n-~ZGR
zwgxLjStJ{i!I&@*$-0}ExW!Q2u^^<&U3F%z)l<081xt0R#ohumn-Tk#GvX{dP^T(l
z*KoH)DYRWU#0jms9v$QdW%VRgHaQkkfx!Z*95)l@sKFUmW?*&ICoj=oI9x}=IzR1j
z)DB#}i9vSn{(Z4Ow+obN1ZUsVHTa|KW=~IW2&m(+Z-U|DO7PPRO3f=bzv6Oj!*JPm
znQ+CmUH1%eA2=tM#sw|6y#zY&UZitPUKUr;2v5$s(#^JPrp(NhBG$BBAhykE&&J)6
zcgtt?$5vJ$dJ9*MAuyS)yH3An4=9No6ATx|&iCZmK|#-Qp~54b8T{}rQ=2NRJn(2s
z4nu_2iN+|_b{d3Sn7jS?iZP7-)%&`W4-5Vdh*cEp=Ca^{7wQC~h*4v(EpQ1}fF&7V
z4kBv74FwlpJINd7T#$~00#4W;GD#Gnf95C!Xu&WGkIO~Vpi6(BnU@~z%#jnFcmZaG
zuwbd6ko!63N?`<m_^%0w=<9)}2b}w}gHXLczB6<nexB2-zt@#8PBTS{q8d|5!(8_$
zt$V9dV8N%r$4PnNA2Yjw`PAgU-Et#HsL@E1BSgx!nxl(2K6>oTQ%q*b^D9(`1o=}z
zbiY02;vfTfuvlwZ>JPcw6$!YkmzvxH6Yhb(r41XYU3eQ^RcAS`<GFTWdV@88!*WNN
zWzjRJ0?y}Du<NtX(P15jnk~0vZY-R$<hfFvXdM+IlT&}fr<DG*K3}3?tJC+j)~!^#
zQqf`oLNO<15Pg0O{JxD8tu(5DS;y-{-t^lTaBu}DeKiMw`Yie=^Ue=}H$Hg0XIBpu
zmXhmb=vmCw6*MxIonVNlO&46EyztiL+ypZz9crB@kWvQ4lYNy;Aw8959UWfE%RM@#
zKR$+A=+8(Y$5M*@eMqz!8axTetZX*LYc~CN-PfV`rhw12G?)D^6UoiKUPhnq?f_50
zv>hMKZ=Zbj4UY6jgQ&-^`KBS*!7}zXsPA4;4}|Aak^<qRcco%0PvF(JQtgB;$%G9C
zHo!XjPP|v~Yy1Uz3B>u;8jMPt2?5(6TI@<K(#BYx<z=?oM}|Z(@OGE(WxAPCtpaKu
z>A1}*^-8^9ppOn5+7|CcR!T3-o0*Yoq+GG72&216!d)ro(h{CRIc(JlTt4YkvwOT1
z3Tg^#!y~pUXGyW#Z-g2Zsii1d^fl*a+Ow3vC!KjC$i5!n4|piqb!wed#v<j0NA?(q
z={QrwXP6a6c)!i+Yz(}-A~kPG+P5U$<J~<aGKbzIxE`RUB6;Ri_F57&G$b3`fz5B+
zDsI)HGjCsTb>Oy<0}mt^7$<4vZ!5poIhK1WMCor{3ZF>PkpiPq(%PG5LQK$hj!w>E
z!%f(Sv8L5@i2EkA5{+-UHMqe=8IcUWJ<S~Hr&5J<OPH)QDpH-Dy-qTI;J~qZU{{{^
z?tozRsW_?XD;Hxe8Q(XiQt{*EJo{y{n9VKhl}h$?ia8L!utT5^D13*%Q70GLZI&0$
zN*B*Q7aUVPLlnNw>rKMgOZ45sIH0Z>-1c*ie;Z5}dmMRA9IZD~=?2$Ev>!}|w<z+i
zX@AoV_I+4ThtTa0s6j;4@vbr@HY#+rDPUjHE`QxI30*xd-V=}P1l=e@T`}PB(_={+
zsd)ILiac7!txLO@Hh9}NyuTY?K0~?@eXWxlvNY4)s80U1EY1skOS#78YDMRYoP$hB
z%RoLz<E1Afr8#@JM?ZCfNXbPUzWq=`5*k)Zg?~<k?>xH~wArp$8mP`2w~4<jc~LQ%
z@w+86jCm9`y=ZZ!hcNy&(T|26bb!&4X@Mq4+K9I(CVe_`Y(tZP^0ZF)Q{P6TisyTg
zP<-2lcWw#fJh77(>8gvDt#Ww>P{Q0>Eb+T`3X~+22e38^C34sGZ+!7B`LHW{UmWs9
zCl5!(`XQi{xsPN*yKWlv&kKQc*eOx^F762>_vOPc?EGwrR$V<Elp4l>lV@KOi5$D=
z(Bo0=LE7z<DE!urgcApMn{;2s78Z=2)(%oS)M-0(bT}ob!-^*7$)muFf|fKrJwE&*
zpmI=w%4p%`bu!Tm%||R7@0t#p+g@8)?`zq$a!ZSS3_I`P)FdC_o*1>zqFCNgqf#X2
zN>9jU7vn>6p>G0|vhqn;b6*_-v9kHO%azz32KM{iyoFiLLZPBdfTDF%I<H9m%t!1r
z8@99~w(T2#U#*1NIsXjRY)^&ugj}DMRC~}-=T1eQAejcR>+!vuI}PAhbr=ZWiMlJ9
zI_pKy7&P1(`EHL`r9JzkZKLe<gij}??3t2!Xli+K)pXAgb*rbTQc*TaRr(N-CXsy7
z)L%c$t=bDEH@l?BQs$@fK}n8ieNmA>(F~YNRwyKL$UIsqp=cz=B{?;aG^AewA5m>4
zu}UO<WFS+aMrCW9*)VcqwDCI&NggN!@RNfdzL@LLNYX&vo!H*Mfxa`7t5BhFHY{!!
zIWgGzABQ9k7XbLn!HwR`b!#MQpd8F??W{vQo6D7}&^Q^DG>!Z*`295vNg5#x_?3+l
zy_@Ix^U+ruf4$Er5_A7|ld4KLE%h`Zd@=P3u@GH8v#Ahm@iv0)kXd?US-gx0;Q)f}
zVnqR}Y#y$pu^?1|j<{XzG4d}+9WouO3zRP$x__*UbaX#}J5)G4T_T-a_vMfOvDp8A
zEyDlHqN(#gE#R;IvFOnK*E=5n%fh((9}B1UH<!5`=9j-C-{pfz*q;afHHQ4$pGLPf
zRe3faHdVXY)#s7h)ITegww&mIh3yNiYLCLOBRd$9m#k{#Za}Y}w&X$P*xpUEK6hju
zXWia=!uD{x`?vkxA$OLfH{AMcy7XJO={4cTpWl0GZEkt*W}`O_@@9O>vV5{eM{~W`
zKVO)bWLrP!x4zO!GC(ZJw!UAe8fDmBQw@>7vq_qMJN|kHGVd_GG9MtXwR$;)oQ1er
z6Z4yUGV5%tQCYt;FYPg)_jgJR?%^5Kb?U|QX3wr0+krjV>dl|Tds&^U@E(wx_?tAM
z)dfZOdmX3P+1MGw3(97HAQbz@6dIn6vOW|X-R^SRfsU`;#`l|wv)#eiIes=~#_;ri
zJmP6D?nlGZX>V{J>UiC2d`ijsvo{zsBgn<h_N$=mzaHK0B?4)CIP8!9{D4u=lyjt9
zQJ#ZK^DAqB)oe50KUvKGtY-z=Cacm#0K@k1GwU&e{r>@_f+nUmuFm=%Hm?6oCmZV%
z(&(S_-)>eT8rI5N<4B*^`U@jy$uO}qMQ;2U<F)mmr(&($i7<q&RVs}vqgpgEb$Dbu
zDqrtza}up44uietN+jdVyk%YTZJpk~Ic;3H`hHtk={Ma%!hILu4->WH@>}&EdqPdI
zWjDvMJMs2vknSJS03SWRKDI*&(?fe+&I}lS(HuK}wFd#uAB-`W(Lf%KrE%Ht&7CPg
z`9QUzgBPp;4V?xuxv*^6wL(vgI`$)to53)piU@U%9n#!=z`SjC6?pmh_&gt;#ogkV
zF(a63yTr;xZ@FRHy(W@64j;fErFs%tJ!%TU6Zl8~<~3@j3r&`7G^N!mwTuKY%p^Jx
z!GJa+-X|w`Og;>o8<`@F>NN)asAy>|Lga?`@ytPx9td*4`VJ^SBjBN(N~D|81c(l%
z83w>_OizVODD&k#n47@(#AZu`-Np+TX|^$375A9t5R@`Zod5<?$V>kMt!Ed+bEpc(
z2^{8u_FYY!okNUfsI)pXm?B#~o$FyRlAKsLlNMGm3{74{aA6%^X!jpL!xRuy?ElOb
zx=KO3Fks-YBSY{^7bswtXRnU3K(ty3Tx@D$gVCgjO_aD4jkZC;3_G?{1ATfNDC;Ic
z$t^Co14TAOK8D$x4IBZqV~~PxCOE(ZmV_!LIQD24X`r-QPHM=MIt%)nEbT#8Od?GY
zWt1UrsnxLEv0__4V|}96!qR_|V7hbWTLZ5S9}4bW8H4Se5BL6h1K1o#9JMM7{Wvf_
z-@*sD?<tMT)oIoyfd3rrsE@zXyk~XUKkw2%58fGE9=jowqvhG?1T$?th-smAgQmVr
zy*-};Uht&l9#(vZrCQ0LL@Rz11G^Hmu#T0{3TEQ1-{u`w3E#~3H;gS`Z~nTu0QkAa
z3L}&qLh#M|c)r1<dA8Z6eQ}=eX>z_8?6ILvTWiizGXDU$BXm07QVjYsVRh+D@V&f%
zy7FnB$RebrMSqMUBx_zB{5-}CIr1J?F8+CEeG$y0))V&mb<)kn{L;d~IMdgVZD2jq
zwd{rE9S0^UyCbZjrbXdrL-Qv@u*p6fpMH$3?tE#{Nh&KIXD6o((qxTi+;DyiRqi!(
z<V?XWb_HV%_#ml}2#A)0f7O1cXfo91au6mq<|U`9B+*)Pc4QmFvK`E)81^&ECM)Er
zURw*<sEqi#U8F|By*DarT<A9nQL`+c8dEbV5!4%N`6qWyG<^spnDW4CR5K#Zvt1NI
z^2V3-tdb(BA6iWy*N`s8T>gz=hC=E$^z99Og$3i4c(2X1g~#_krS|k5@Z7!U8%of<
z_N~aAJ%`mVX?U6&cKZ8+`JWvp3X38>zqvl(+pe8{DsL=U{2|IVDasDII!vRj?}*>b
zG2AmfxG_3ycffW=+&dj{01f<e4X!%Hnh5vLm%hH1cyi~~8j9vEDZHHY?Mlj<xmT*s
zg`yhz6d`GPL5Wc#)Y=Ir<UGDl%O<m*W$NxqeEN;J0m{>`xtHt3OkR!Fb0><;Q<JJ;
zx)$CK!2Vtb6<ddr4WfXBuPB$hmE+yPp)<JY!nnJ2lbXMdzF^?F!@2hy+Z!;wB{*zZ
zM7A_N*5#rgucV6-8Y~#c@Z1A+8D;mCzv)coZm<n`#xz(`d0+rYBXHCcvcPZ8YC~t3
zgN0#Ck^J12Zr#<YhduuodEYM;H^xspj6!<wWiWHdWaP17>-S!u8-N#w>3XbOsr}~C
z?^2PX?eU!bZPQ|KztRcfg|@A(wS8qLGAn&V3_Vp~&0Wddx~6c+{2(grPO4rf0BRFq
z{Hy=mt?kcRYl;VAlt&{~zaD!{n0g97IXv`nA`UBo=gAY1kT5k9FcfV1Ff9n@%<S!t
zE8r|M5Wpk6JAhSthKe5^%r_J|v<c$`q;$ICjRXX9MX<n-=Nwe9V9qV57!=}JGk1xl
z8hMBghEtiIuRQhw5q8XeWW*)oz#=q=J~V@pqG=p?dVsVhS~Ms&z86mzrxf*J0tbHC
zX^!^0$fxqrOA$NCZ7ta+AfiNxLjIC54NOEmt1G1~80O3Kx7MZ-g+c6=iiCEM96Gv_
zW|Nk3oz~1IK&%xCiEd24XXBbjSXQ`eY*Lgf71=Sbz$!_O)I~=PAp6h>y%0hb8l5!5
z`~#hTkUZuxmOp`9W=D`K(tm4$H$qvVlMp1`%$|c7h9r4jl)|D`eORQF*b}j5glD!T
zi0DA;*zOt-M~8XW8tfv1$KO9TDLC1C9%HQ~vmq+tNNO}_<c>vVdE9H}VfxPMf7F|Q
z(wHlk1GNEyEXR0LrGW1G_tUBzE16JS9Mr`S)Rfq=!ps!>JVIef=u2n$=!N<om6k+F
zi7kV_q;F_Yx*oyQWuX9i4P@6dwIJYk&v4iMQ_9`I*Q0D<LvNjC?Ag#!=QTRtglNMH
znz}^ov5+9r{#E(5M_WWwMWeYPX}~AKPS4h34Vg}ZI8EH>>v(BO5n?KpXH1gcHF%8`
z_{Nx9%QmP*joQS^()Xx$^J*dit>WsCzy<*8mda7ev6nUU<A|TCV8=!^8+UX-B)eu_
zWK$Z+j#O`(lfW5-dj$z0mLkco2)ne*>5<XuA++i?82ivRkzm=TPVbvQI8F-RMSg!^
z5~E(+dlz;RFh_8e4!5bL>7BhZM>VYux>1LaBSnxB$X`TVr%#3Em1jPcD8k^|$vP*7
z#jJB}R&2-n5nUp$Sfw&(5fnR%MMh^5#h2`;E?gEv)am}9*2d&UxnI!f=Jbrx<E$WJ
zl^sPVs^K~z(zzYd$7$iOU6R0wn##0s6!mR-18dSBD1bD2EC@%PaE-@qu#I|@f{|&D
zu2$#i<fO-E(9=t{LpyM8&p?-#wg%RVs~vEzT9CE9jctx9ZuB3YL>FT%<*0>IQAQM0
z9-UHmL<BnonJ^7%{EgA2vUuPXPQUq5DG245mfcg1-7o4Rh_4MqcD0`F`!9q_=%%bf
zRXJz6Nu&$5?a)hHlrMVyxnGGkwT_ekGMqI2u3r^G3r7R`u9cy*)!G&K)G4V!mNG!n
zv&Bfg)gm{vcFtB`sb*l)u50mmn|9#U9RJ1s_|&olUS<|`>i%_THUQ##GJtfqO)2Vf
z@K?SO{}N(3OGuRB-s)p%H%9%3<Rdh-&~F(AX9nh7?}(V>OeVHd%>Ai~uV=|CN;~z%
z1MkMzNXqWb(*2-i8es?Jh@psTt9<`fq?1M2{nbaZJ;e-X$>+$w{WC%WE@kB9xhkv0
z3WH@m8JF-f{5uq#%+$Pcb>E1GCnzto&;g2#R8<Ll`%lPp9xOfYHHD>-ELzLGo~%2S
zC$Ama%i(<|$rOohqh*E~d=&5nH)m}L^Oua!WG=Ct#{qy`&K9UUJU!nC<NnPWnAYEx
zrHwDQQpL`@|EXC^sz+AE#sVwx>_;PJ6b%3X@841Vf98_<W`@Qt_D=r=>9@e4jQ%<Q
zEtPE1xUt_7ga5kj3mT6XkW=NBt*4jUlx;{6vA3N{`cq5^1`+8JYoFkf>&NjF`E^6@
zNxso|SUXS;O6$}~jGqWkiI;NiShe-}G|B>28cfacmFD*|ywLk#EJ8!)tl_q&dtySo
zh90FlihlxXQAS=yZi@j9if)MzJT~Y_WpvjbM9i=xp39Va_jp$Vt3FIhc|>5g2WB}8
zj2kw@XJI_&vh7xOZ<8rT6Kph_Z=gw3@=iqCNI+v?(2I*rPEKylpZ5hb*PR}`ydoLL
zQi|IKyk<1f$YN*-h)E3;izb}90AvEgxmTI~faAnSof{mzQi_Xq*FF9k?1C~cPT?$e
z&_U4@Kam5T3$_7e29&duf=rauC#s1cMMT7RSYRRn9`XwmY%nTFw0?XzQM{evSddUR
zH-ZCgZX6>7h*J@!AW_6fw9e^D*L;jyQszjFf(T49V+~MxZx7J3zlh2iBr!7RmyG(r
z*v|%7*(S^8Lu4(O!vJ!cDo!rnGYBl3cqQ(j0x?pq7yQ>kBnrw%5e=ovU@l`_nXvvL
zm_z{RaB#<7LtV2dg)G43gdA6c>2?*;1Qv;Ztv1}glsZ2nEdG&iNI0^v1BG8Cuf}}T
z1&}7@F;Kxf6(oWJi$tLjtaj`bX~4v@K{swnz6XV_NL7eaPB2vwt*9*Hv46eZ)}U*D
zPH{KqAlvggSZ`bH$LT-vMI8v-KNtYSI0XFa1AkZ=F7Vv~v}VE7It~a>*kv5eHSOfm
zIQ(+psvlkB(vjoE*usOUNjM^`G{3M|s%FKuGSEky9d~(SZ#UM_5}xWxQ>&w~mqDwW
zF9t*&x~u+jvEX3H;6mPF4fMg+u=BUjAa)jLD1f&>pVoH14D>dJ`K8JNA^80MyzWf%
zbJx^qXIbDsbh4m=#yISEn(i&5&OZ+v6f&D{DS*2kzSM4J;LpH_-2Z*?Bjr&0cMB!-
z76EK@yq!%~Xu+=^a&ae*>p1-P&s0#3UT5x+EH84ctvA6o8OEB6T}|&<?$CUxL9M}g
zCKuK{j3vHdJPpt2)6sGZi7lGgHOEqf`Nknz!S8i<2^cTy{AU3rn>f?o5;0f5k?9bL
znDd9WV<O(+6satksmydt>Tg&{BXqXzuoec_yYaNvj@#`QD`W-SQ>|MW&C%Z6b&n#W
zcQGwIsSe9f3hb>m$`y3YP^zgJz}nC_^&ydAQiH5jO^G=#cU36Mt3KNjj~b;vi0Z&P
zG3`9LehCKH3Tb~~?%(J;dycr^jWmAdK;QTinMZN@pon6g$m2Bg7m{oB39TGW0c7vR
z5kM;8@qt2Gc#`3}Cx0JRb>Tt8cGaxP`-G_<!T8{}g(<Invt+-qCq>+}`3?GZN4($`
zXkm?#{%EIqB04T)_^<Co{vCS8dtUgvIvbdY<YP*5GYyYrJ`rSZuQE7AAUrW*G^dCZ
zk}>{b#XC&ov+2z=R2_B69Ui4XGVxMf1Jy0;2G1W^MxOBQo1iK#Lf@c`=wbXjv-g+n
z1pbCG^lofe?bxJ4>?GbntjHw0-#%==c};3J3mTwa*ox0n%L<i7WB6TIXFoUX-2TH}
zYLhwcauR7CU$X}m@lZ|49^!CG9c2aat54M-u0}uOG1;O1NA~wfWlpn<Pq*nH&k{9;
z#%&3OOE=Zjuk-=O*}?AZx3?hxKzgQ5_o`d39x<Pji*>6CQ-ri>dNt_Mo%k04YtIO(
zI`5vCaZg*H0|WI3-MQP+Yph6L!-DP%U(rpx@^D&5uXv4~o!F1fHY|F>h;cR4b-%UN
z+sykD6vGi6wL(ym8=o%p`OApu05NAGM`%S!Vg{Z$&+<`NnQ>wh!Oj7yX8=l?X(GKF
z4kJTHfmj{zI43wkY>>&N3;~QuS3)QkRj+U_U@@=9RsK0p4FO)r9;-TXN|doc+>1j%
zavTsDN2_T;Y15Wh!@vET;VhXNuV^F@)s(V)8$}8J=G;Spe#<C)_EN?U@?DD#$?+(W
zB^e&2FWHf(XZESI1;qv7-`5(LqA(fVViD2~qC@XVX*R3LS{h9p5JWn`5Gkgd)wVYI
z#1;jJrtZesI+8*3lPpq}uzhq`0Jg6skZZwYA(JUnP!#9_x|K3#%7I`KIJtoyiIBoG
zOp?w_9Ynx43%fpY7+Qtp@@kWs9dXh%WZp>wqSH~^#S$F4R2Smyj}sAVl!=i_{DY>#
z36*t!_gSjKj;M;-lNin#_zyMpUf*%-ac-j2bELg??9-In1la~|F;{(&&yBRd>NBWz
z3Xwb?N(XCy=R1)w&oo{Rx{=ys6a>(<9>HVZU&WvzRd9NT=iT=iAeyX4K)o3hz?Xsh
zoM{FEoj>yWJ?QDe@ptCUY42KQzS_p4F<<o$s3X8}cKbq~J3Y3r=`eke{MuLXeWREj
zlCW>R5dMhXw(V$cTVaEL*j)nNTtW?}^QMSvhE?bird74Bi*pmu&t`{R{&jUc6NH2L
z`h>1T4%0}ZQIRGhx;7))UED~-QYfms--GA+7!{*E##J2`HUQOE9cH6u^XmmrVnX=L
zJ@`Rgfav&wP#!#n4b;BgQ37nsfrdK#Ja%>YYFMVK*7yzOw&y)!gKziDOhfSIgVf00
zuyUG8M6=hvvW8vb^P!J@{;Ck(o8cRBbyR+s=M$b`&PwK^%`iQ7ZJ5Fm7H*YWqvO7;
zu&dHA-qsx3WM&x4q(?be<*AQ9-gerZ^*?ey-7!7*|H%DP48osPd(_qMaT9g9^p7~A
zCy`1DK(uFxsV(LaEt9RubC65M?~qDT>stKRBW$v3#gN~+#QUOy@VZZB*3<8a#v^gK
za^zMt*zCXJz?bS83)qeoDVh&Qjq839MklbnStqE;e)UYg3KmTu$Q&WfF4v4kwbtg;
zY`ZdEURS!D*Ejt?guPRcC}Fo{TdrNUZQHhO+qP}n)-Kz&ZQHhe_usd><8;S8aUb$E
zA2Ko`zp--7F@0Lhv|<mhAJu~2tLLF!k410Fum1U3rb#S^tksxIc^u_im4hg47H=Gi
z>vF9e=<=e>5Eo#%IY=Zxy9AWGvG>O0Ato2TRz6lNeJ)+y`0O>C4}bs50qQ@ZJ-;&)
zf%JdA0w;w3E<W^M!k_>D(gLTff6{^)z52sgro<SM(ehH8Y&K}KC{zg0cpSe6d}r37
zzH<Mgj{n%Nb^?N*5nGwcNim8#x6Sf=T-UjtVKuvVN_iJ$P7aW;y-WX-ABv6RJs$7!
z7eUi?i&JwAP3Jkj_fZ!7JbF8710Kwe7C|N6d!(NbCcMepL#eysonfCnyz*rVB}?Ss
zK*7K1gKDtAHrL+-YYO9i?2>IYWSuGD4r4r!f8b782_2i@{v$=dJ}=M5%j@gp=?EF;
zfD!Pt{7=9#qEq{?9Jv3H`d9;kgDwc2D3rStJe~vDU(N&>O+LKyfnm%8XXALWjr`G_
zFyfzq#iM_`3;vP&$k7DROyCE^4QSjVGI;D*kAV(?1ZDA!7PeRr6Q6sEKB0~J9oe*9
zeMrfhyeL08`BpeFTud2SFd&mWWKM$c{=r7%+Qls<2f3sWC6Xe{S$7FSYEM6qb5B);
z187_rBTQRqob2BLYPxRSIR;4-ItgFaL)Xf=K>`GrRk%DtzhaRi@e{AD3`jDfgfLsF
zJgCEvhdQ)x8hZf%iySu5u(+cNwSX0=jLB;;gdnb%D#KV{A|mOE{%@yd%EDq={70g^
zu&#a^S-QCF8q=5#z-&od|33wb0Hq|XB(k-@)&0LxAGfyqE{v>d<tcaZ?qFXA77baQ
z<Z@riNHDivJC8jMw4df1#(!hDOKlBOrv0yy34OU&dn34~f{5RL5h9HCrkgf>7}1tt
zX&^yAHM|ehN9MZFP#)Im{bI0FBfQX9xE7W=Z{cSg7^8-b#(l6E(0%B1t0xB$zE<nW
z-UJ0YYCmxVI{Lq`MBC3aM%I_K(IYow_x}>0ix1FRtzc7sx8i|EKwXDJdEI@sTPpt(
zBf^@QbE7dnZNtrGIx5ZElosj3mYFmOt)<AnfGQ4|z-Q3{wi|+u!d*iPEkC=75uN*U
zSwCyUJRn2=9N;_7Eojl34>4gIt;34nF$3y;=rr5<RX@A8;2<rLrO$n$s{!^n)8|T_
z0fp`*J;>ifdq@Nw8M682&HF-4krk5BdE<VhHB%=<?sNK|C=sV;mZG5<`J<=>_G_rU
z1iS_yOwA|ss!pQvM2Xsjds+TI8;yka=rh*(K)lYz3JDfwv?~r!M+^5#f2PLRZ9@eL
zXzvQcgZhaaiJ<L8{d_@Y6}dWEewG?)LTxkzm{xydMN0xE=63~%ORHb*qo8a=+=F?3
z(mv%3Aw4iQ()IAI(${BsyqNT>E;T0?Y?q!$zZt?8>4b+O_t4xAr%(Q=-~PpL6u{P=
zRXmsmHZKT8Q<S!^j?>SKn41p)`&lzFQxGX%Z00ey(j%&v9`3KeAv#bxs7E~Uzed9(
zYWDYYr)+u;mnLP(^zCB!wz8SiWd=L&B%rj-($UhKqC7uto{#giMJ4SuW$F74Nc#s_
zMC_C`l%o1xTBFb)dTK{@PR>B<Tv_{*1L<NBU1Vk%U~IeBjLagyqXP$E0%Z1e0~kQG
zQw!Cm-6FC11fZ&?HUBXpLG>W{*X;0_JRrCj!^secPA@6h^F<nw?Y^Ssi#~FZ2t(E7
zdVX$GEq-M~t;Y{Jb~gvzWMK)zZ8F0^UaB$VIID&=(whaW!=AnBbel!O4eHsBmJ7@#
zD!{@TczR8SJZVG(-X%n9y7I(Zk=hkF2UJogZ?~P|#x^V;b(*Vks=Mopm<!Ryb=^u5
zxgQOGw#<vfFSW{M_<Q9ZuW+x;5i1D@a1|>n8uuTCEafd6E%LSNm+Fc}*IUGkn{5-K
zF5^J@UHv<tZo7maS*Ya-v`2iexnyaxNs(tAg+4Z<#qG5s=ow__l<lJ@U_d|nJ|p6~
z2>U;)X(QD{A}^Rab)?xfNzPJA`auaUR^iOuB!)Kc(-_dUwK%J+EbbzeIP6-DGzWa|
zCDn!-<<TaXcRiF|-EEShw&kuKJrb0AB_AtRtD;h<={@h>2b1E-zAO~UIx3jKg~XWr
zW|KA*u^XY^u0dGGb3^3B1Q;c&e?3|nG@mgtTc~<x1iT{V0tQ#PuG3)e05=%te2Jt>
zf$>&zU|ZMwH#^|isxSYbguU6egWOhZy=1k!q|*4fuZ<NZ1bW}IhFCaXJhoP%g5^;e
z5CcI1XH6`@O2xsL7#HMH5#_9;B)D!Sm;bwgmZH*hRC~2%GX?JRZ0CkKo+?cXLGFaJ
z8F;5pobOuI&YI|_2ny2s9U_v&Q}lR)cLL!Z+t20m3b^Oxf7$M{Y>`pUW%mfa#sL7Z
zO!;qgWB>QS;OrB^@ITl8H89xH@p9T^PyGG-qM%=o6pK6$%g(6eqME3oW~jF{mY^CR
zH@>J)ZW5PjB2ko5bY*UQzggV|_;W|G?je1mEg_A_Uo>y-{5xmPI7;^t8~5vAz`A(?
zU$YiP_XOM&uiY=V=!$w7zl~SFF&|N}`k<E8morVI%E80IQ{Iq^(%xf6v$mEo!{fI<
z%W9pMu`~6IO=jP%(Gr)?t8P>j|ITJ@?9pO{QMGAPFKK5TE4ob7zn)^o1sHV#8<nju
z(X7>j2D-v*X!BUN%FV&y@&0%|d(|Iv61{=B2CJow6BE0p^}7SnReUHyZBIBEf?F!<
zj}|=w&)61uVml`IOX^t%B<9NFY|R!8^qPro(nq8f2CEA9?LzNzHr{-x(I2|~)|cI%
zaR>ZyT}$-0;mPK8BquQ#8tiBt66`=U!KhJXZ?}_GTiA(;FxBpBc)$-JqP`rCaUU^I
zRCqjM2E?kl2-%Goy?<q?6{kfz%&|{+tpkjMKOvoi_~1Q(%LSVE4HRAo)3Y@<=K#Vp
zo0i(`97IvHR6{ghNQOKS0llId?4$>X&KpQVxP?#WP+7}yB-Vh@n;d#=0SMHwTBPi+
zY-5P>GvHW4H@6|rXmN@9aAPX$gD@u8RYfVWXIDm{E+GovpMp-9PSRX{Gk>={j$9Z}
z*a~p_x+kJAhXQ}dz}U`L`D-x9#EG&>#Wu&1GO4*45fUi*DDE0LgR*<xp0nt+vR~7$
z9u8&<ZMe{Hx15%B(^I^mKe;So@^{fJUN&!^0U5opp>JJ$#yOJ$twt>g@J)EEUWc(9
zjOwMU7rM<{-K}6;y_k)<ep4MelQZaLv7ca1789wOOe=mt&a~48mq5A9vs~LVZ@|wV
zB}_L4ad!EWq*%;hhq9Lyo7fHg%l3148PFbfZlcw;jZPLV4%U6ZPm@z_rgl@JXw$Z8
z(O}~Gztz5W+*bf@-}~V?S$%qsT~-gc`q9@jbJj61vf^8Nb^MHdnydOn0qYlgA@7wC
zLKd)m=;D}Tu~UA!0wm<d*C!^A)f|G9DKw0L^{q9bCnOD<euJWFr$r8C-Yl%^o4&m=
z)<hWz9Nw!I8AY6zFAnr}Ys+KI`9%&%AK;Am)a0R;kCh5xLn{FZaA9ge4yC)5geg%!
zUhvTNo53qKhz`AChhXzhVR-Shkin*X`nPn_?!3YYiEEjHj70JJR#mIQ`~NDpY?`Xf
zdahk}GP_eFihYQmdYBk1>CJHVZmZL&uD<@&7WWk1A0h+VeJL)=2bm_j?9`cl>VRjU
zr6fR?4U`crg&MDQz$@W5f9F||5mVi}Il`P_?6mJ>H`CA~rF{CW-+kf{w5Jzk`03Hu
zyZ;`B%~;O(-WNR+b~$Mruk;LF;$+5dc}2lgYgt)%+&s-_Hb|n+*;L%4xo#uEcd_qm
zer9<A*F1#EklvMfv1E1yU|hqIp#}9DH@vcu1DR>dL&kKU8^YKgqNI<%&wn+)5Jy|D
z&T?zEt&W>brbNLlC7EIKNW0JO&wpvOSX;;d^YxmuJf}?-y<4WNS|bJQpN43j)BSAc
z;K^$G?)}AjD0~b-Ss~qD()>GFf8?WI-Ippm$B@$OW}wT5s^-p-!IAjLb4uin1IMjA
zl$zD&S4Ng6{Vnnkq4XP<Y#T7*pOwyO@P~A_xd5|6#nIkV3XUoS=}OS<qB`v?w+udK
zZg4ASCSy1s7nsf{U^Cq#Hb)3TV>1MCiRv#%_a1hT+LyYVd<R%9<WQZqyWL17Nha|5
z!il=>mUp{=MX)7&goFGl&IzA;IjeY6KFo94Drq`d*4a0_Y%Y;61fa8VmLA>Bz;04?
z{rmGk-i|=hF2W<oRTtFH2g#!VpT)&sx4XokB`(|O8S2OtpI@ZPjpJNEN}V?0Dw4L;
zGf#tVTE4^zw0}Aa6bok1Oy`gLmw|qR<n?mp#$<)+%7vTCxSZ#B-LG!Sm$uA;6!K4+
zE<2-_jmp!m3JZFADoWLzWT|8(D<Fj`fZ?<Q<$j^%9Tz&%4vv1eTIP+~`mRRFfX2yu
z!HVFm=ecK>-FRrlC~W_)ipurmNv*%kNL5R#7{0v;U>nM3G2hDzp;@~oz=1a?It%o=
z-L+fIqdvWF*y`c*M0xX~oGg+Yr|wW?_l{FH=u?N=Z4hW1AlxZ9imX%K_sh)KqePoQ
zK8wH_2D7sqoeIuPQQ#8k>rmbb`YMZnnsV>+1Xwe$o8)D8JmMHd7~)$m#x-mKd#gnZ
z8_zVWPW!8GQ}y<wH5YO(-X8AJj)1{DzWun_*%0H-X^u=j;Cv+^&OB$ZpZ$}g5n?0C
z%{L%25x##7n%^RCfZX)@dUvxr7n1kXk_nCuiz*(p!MN<(0Zox1*J~YHVT+mBjF_3^
zXEKCZ`;w23nV^)}IXISpNH5@ze&xZAI4h`r+gaR5l0fMy(`J&?qa)A@s1<z=?$rd{
zx1R5L9H}WB!Rud_Wm{Di-8L_7E+J7}3XLxMgT$KV02|rW_K2m%m5mnKFM7;2TxSNs
z8{NgK<&6ghS>5k9_EJ)4BZaYD5wpAZs|>t;?9QfL?d%-D@oo2M)o79#KL#+rIkqiK
zH;P$*$@aT%6zaida97+f0N`h6eKd-vw5Dq~h2=m-a!v59C~=;Xk0|lLm7tOm`c!=-
zwCap9akxd6(o1~*z>YEsTL|^C4_d!OhgfMEg8kWo53(P6v!O^mM$>{`=O&Vx7_hQF
zTJGrVxJrM{*M4O-_3Bu}<@8oEb$>n>c*yjYb7RYp1lH$Ts^+33OP+0L?xEmCYD?Gj
z%^NqeyU9+j0#n0-{xR9^F?;|J9w5<l0BidzPcVS$G+psWN@^EqWI>5YO)yb>UniP^
z%Z>}1277K`(;(l$T@B_^Ef9RLe)cEOY=W*t8DQ{C$3*!`2g9;|%y3;>ixw+CUCbf{
zG4gy<K#uz&&2sW{Ib%RTSsNY)I1|hVH)Gge1say+_{VDKIx50yD6RDiQEb0L${q4X
zX=PaIK3O|E2yS?}8r#Txd-CJqAyp5kGqJ~)>SIpwaMCkzH&a(&`;v#M_GrX$KqQ)h
zim1=8{$(J{B!-ZshAjbU<rT4|orgJVoAUFu_mHf&8Ejjxa>DgXU{YlYRa%}$w<p~H
z!qO#>QxZi}?2Hn%Ac@qe@y?(FS0v<WM|TAoV`1uw!ibR800W-$&`5;pX9ZhsBu6Tm
zZ^&prDPmJZS+}i73ZID1fh`=(W%-1tt_9jm**gXb<z{e5C;!G?g7~J1@htQe@GxmL
zfT<g8RWq&aG`J;jc3E@<b+!2ojB9n`jfRdiAQWzeQiQ7lW4_##E-du=d|(8IN=JmZ
zjWL!^N!WZ*%EeR`#0v=ujdS~w?KyY@g(!@2bJr{d@htz+a>Yq4DKP7ko#IRe6b`};
z(#3&}+4(2Lfe_oLkM6S27z7nVo(nnHS!5D=N=_^8XE!{&wr}aq_*{IUZJJO@qoDKW
z`1r`jZ_NhlQ&DW3z~7j%iVzRyvNIKJ12^=0F5D$cWjL{LWbYXh#ubsz2>s7XVb%mw
zHOug(880n@-aKHwBe1$_{rkROx7o61$2a;`87Tkv$p`_R>?Ax-G@<ujmaiedee>CB
zeES@H7DtWw_cKwH8(6+;ls(<?!MTT<HK#Nj+zA}nlpHRmwOzN`A*5F~hv-Dn{#hZS
z0E2zNx~N&`hR7Nn36^qP0_Ga!L&xrR>Z%cSoR+Gj77JL-@BT0v?m-q@B#C%)u9-+d
zNklfo=(DTnm88A;imS7kV2%`=vl4%k-12Byz_dM(p3!F|h3RwvLV54RP!mjUDd0pr
zAqa3ZtS5sH(uI9t1T%o;F7z1Tb`U{i1?VS`nFU9ljfjHz1OYq{HwFN6fKmn!^K4>6
z^|eS<Ci!lMAo>l-ECkdz1b~Go27UwwbvKZ)^i%I>c!)OV4G|oKc65K{$iJBfDwsGS
zZ#6ha%HyasZHV+=2<owu=|F1W<>D%WBgk-1i9)CKGFRZ5-|1VNXy13a9HP`qm}efa
z*<O62+ynX^So2IG$E>nLDZ)gJWF_f)3E74Nnp&moX6BN5mXQak9OCeUsgbJDgp;D#
ze0j`!5987RGUfgZOGDtCF4l6MVcDrjso`i6;!|13!jad3$EEJc{48Ry?@+?n6&3Vy
zH9iY>>O=vfm=N46;(PU?KyfV2+$(c;>OzA?Fl#}}63>S8D|3D7Lf}R*#OPLk`_zd5
zM~DqTMX?~GS&`9g#OW!qhRP}v1a)GDV3vO##-dR8YpG8Vv56hjdOBwT85hoB#7(J%
zK@d5qr~nM^i5v`gP(Tu7L}SImE@%B31g^K&zcAr;=YJyrY$|-22HFIIWvug7#)9y+
z_6@-F$H6Cy@yTdW=82Ys{DHx;Uui~`{LElGrv(C?qgwZzuov2SN(AMxcSq6ze^87K
zyo?!;vx%v`ugP>gcg;B)1t>-5AI#e;>dYPx5kOy8qKz{*A&c6g6{xzrLj^RB{m#mO
zeZBVNCL+3&g>`KS3gv(9>xZ=2V%bQr2hC}zj8|;+NZ^uf;b8v)MWREb(>PB$>$F#|
zXu$J{X<_k|vO2=W;;M4#>W5vZ#-qT<-ye$B%6}eq28H_iqOG1x3M)n^@S#fldCsgY
ze0x$;ldh&UY{Ro3{tgIDuQbPQK;o2Gr{7Zhlbm1`eJrO;1rqZxs(JW;pbu_zf&QbZ
zcc>zQ!#O4~Xg+If(k?)Pl3y?h%y3{S`;8>Dw^XsQeztvhRNSFPhGKH`Z=LvIeR+V_
z*#jVoCkzWhT4}3{D4Y5@drY;QUU8qUW6H6}4g(%VIrlji<Bbj00n@}?E^nzCrT9&X
zYD4RD$z+tKUac&<?B#yvm8DVzDR|NJ;H~XcYzCvznoB1XR=)*I?noqda3F>)2fT;u
zrC=@Q0@rEnZ+XnClZcL`2qZ*4PMNvX1$~7{+A`Vn!9AY({9HMV{Z&z?HXSHC5rASt
zU~A28^nk3TtD+fRWmP?|<)Iu{e1NYhla|E2KWU399fk&UrsVNE$oLQoWNg%gT-4m;
zyhWU+vjjt!13(**Hwm7uhty=FY3w&9bDC7BU_pvc2S*{6Okf7TkcgErc~DkzVFI#u
zN*>Q0-VR(|ENIQnSl-kf0PoHQ&R@+{B-pUeYW(ZgALwxiJTen9TPJA)Ro_C}dJsA1
zqz{T7$?7lRQG9t{ROOOhin87yl{ev>z<fTV_RFN$EH;^S<W)HgSwoIUpXnrU&9&JU
zk*JK|rpcwg?`p`yg`s)%`)FCL&LdRN!KMN9vht!?QAPF!bzFDsfDR+COU|mJ>Z3MX
zPa46LhTvG|xu=d^uAi7K7=6z(kVf;RmcKT+dJ+L+HWF}+{dt>ahDkBf+<6!q@0U(l
zFH#Qx0``_egHuSw?+%=;+*5=P?Y9{;UsmVN?oaB<BNP_2r~yIiyM`DC=d-@vUq(yN
z41`r!aTiN{T5H2DpEN=z^uq%{xSB(Na!_d$f^`~M3P5cupBy(|RG*F<N%Rpf?_u>8
zL*pU~+9sb1gIgH`PoCm3JtF|lKtjXdb$F`ZBaZnVewwe|%a)YoE|c5*^JTrlw+o`-
z&x&or&GfS8igH!p8L>(dA?Xz!R0=tGrzs<0b0ksl+i9wC(5W~5ij|QZ0st>Zck%Op
zzmn?d&1O;L1eq9RU?_LwATM5q<s=01O|aaO3VW=w=WW*qS&&ohZh<hNNT!<dsl9FZ
zij_5N&b6mj+&jvU2y+?S8Ls|EqZ}>vT#VjNyrfVtF4*A)_0gZl-k287>J3cfJ1E|V
zI0F5){Gz`TYNJS{C`}ah?rSX76b_)#YLSRjjq^^P@;ONNKr$sjx5EU8&Crz}8}l<S
z9-vpT4fX%t67KaVb~a)jv0X?`LbnA2i|kZFI~xdc5;;Q?nPr&j()6p+D*Z<O53XH*
zWFk``va*<V@p2@Cr`iVEvGj4K?kWbVD5Ya!Fbh%|UNUNKkr@=+%D?Fh3ni%2NGsfv
zYkPx(tLFv8SFtatz<gY$85EMOe%5A=cHgT_eH-JmtBeEgFUWYneI#tHtke$N_-_ov
zR+V;&!b*_F;DiU-m5-HbFd5-9c-Yv=DGB-hjpD|o3zmf0-Z<<lIhw=eGNGn}DmW9V
zfIn2973?rHNj#VzSpeXzqQ05p5rE>^uQoYJc8-P*L+x~|Ne|&9aIE+G%o@oR2}UW7
znaNosDZTl{t;QpXJO@;8B|bY1YbvelW)yBk=D%Npe@?Y>3rbLvl>>-2Bda7`E(<9&
z6pT;$7P@e>aWtPG8A>k9Jfl^_oju?$hoMx0A?#a}%F7jBAJsQ0Qj^$6cTFn)n4*xv
z%9t~5j=V683ilM9iYA{D&3e<=0q>E;{)7i-3=X;zkvb8=!ZwM=vCB(vACU3h6S@3B
z=9BzuZ60G1D^*gmbus}I3n`K;C-$`X8O@Y%tbHD0+e;3E>myWL3h?KlTjrF)ap{vD
z<GD7Jrct;)+9zePUF28gR8R7oiA+__?6Xn2%z2m0MbbRD^6#n45F!>IN-(NZ7w>Ei
zXhh1}*HXF#RU(smuCCUB3*tF<C!P0f|Eke28kzn`<D2A)SZx99ex4M#Qp}<PFOmNb
z2-%A|TML%tXC!;|lqDZ(C6CICG8ooMWQ(t>65X+et9%_Fmdp))gbqwsm0p9wFQL2Q
z{-O?o&AG9U0rZCs&Hn8S4cXKPn^4g%67F_?%XP2>3C(lu%LEQpc+!dnA%r2R?DqW=
zkJS+pUD`fI_sdMq869oZVEmQ8N)s=vO0KI)vm(a4yC|VkZ3}CP9i(7Uq%=2Qyo53d
zrEJV$dN`_0toO)pF&TJ}N4t~S0So^%M-NgN%Zajsish&PAM=_GV-PKlmI$vsctIn=
zhqZ~!t^H}8ZZV=QJr?%>8Zwgi?7f%t+e5M(9ZEPF6H;fQd?^v-kc^-tOpf9Upv(~E
zfgVy(@+028ikvoJp2_jq@y~Lo*^1@vpFZ3r{6it!jGh#pqj}xhDZX0-4F}6O;$$JY
z?C`_d_ivDkPJs5BBjKV5p~rvz)ANES^WmJ-VST8gI!q~1P1NzevY9UE=!;oJ2m{c7
zHDNyr#JG!E>a<E#d<z)hzq_(D@!qWGj0_p(p?F+HhKw-nIBGuLDdWo;%#NVR5q_(X
zCVA+$wn(`pW=Du#gm79#_s1TIyWCO@^kRx$;6`aO1<u_Io#D=A$8={{Kr1{x6AJ03
z-c`D0^E|;PT}%{f>8jr!<5;8FZV(`&+_uLYUxNXRI$B*H!+c#&djQD|r~tIrF=Ym~
z7Kl<l?EbyNBvBBjJNIxzTlH#H14$Qf#gn0>{*FrMuP*?V7aULHRhl$LIwbRWTPl?r
zw#sc$<8E`9_gGe8>mTD!g7XJ12Qum<$6iujk7LPB*FN7vG$wMVrxB;?eO*INUmo5M
z9ugJr0-~ax4<4#}+NK=Vq{b=6Onh-fx0PTbh>G_M*sfBLPV3)56qg_Ry($|WJEwa1
zHatmIHCku4#v$J%E30~zE<P(8o<kEG4mvhkDxJ0Ed^me&1?7g(@uniYaa17pT!mc2
zxXSL?btQqk^swH5iPPU9*C2B2HsT7jn?k0l0D;R(kaJHyqiPw9TH+UA;3{1~-WqMY
z<XZwGAP#AO09fVN1Sw*qkAE?k77!Kocxfnyp3hG<7d#Z1qoD)D+)8IXxr;J*#D91h
zF%&mE@G`RJ4{VI@n{FCnz7CkOx1>)ZC@8+RVzhti+%jISbQ#lDlsw-25;lu<*LE#M
zmw)a#?`W_Fd&_T;zamD3iWzzugo%_N0$tJ}wk%IMHm%KDZ1%@z(0G<9QU+81=CPZ9
z+r()uRbm7j9*|+H1t8te0?MAM_UU$^E)vfORET2hvc0XA&}Iq+74Pot-PR1@eWGaU
z-Mxt36hQa<?OQcjeZ9T&GiY-{Zbi?8C336JKf>_-_2(TFE3o*{QHVBQS52w*##9}n
z{PV{)pXM74GIex?;CmERKB@qWz6R)EP(~$EGJBw+CC6S(V%YOtB}4^i=V><5d-il(
zju|~p@AU)Yt|)ps&zk-vvVhn~4@qX^`+~!;-CnG)VkwR65$@{Hx^bzL!sSaF#0e7U
zB(5(N17iZ+B{KA+)k$6kmFqO#U9r?eyyVZQw-RzvlmTvlzAG>AHvz)F=w*_}`4L?_
zL?h@!HZROWGA=joK%kEURZEgI`&WV%K|AnAETU|abJFkSji%;ic)(qE?*ND<;^gp4
zdmH?QAXEq{=2`vUdqgt!`un2u;ook|Zd1|Pl$D4>(o*BbqWRdr^Wq;*Fz8%>tOVUo
z{u#h80KA={J|H19o1DRBRp^Who-f7$y)fBYHmFi=e~YtA3crsolWTDP@CYYQ?4Nz2
z_1BnstyOf_^LQHomPnM_Tw3BVqXDP>snr=TuqbTL+kHi2kTD@zlVrOQsXKNOTlsa%
z0jw*B19|5FK@Ovk9_{k7gI6mQ3<O|<=)aEvNigMX3ds|9$HI?JOt8t|<ju~5i9}+)
zQL;gGGvC(il3DUy`S3M3rqOLw($)$=1AWJEgUunYYrM@1EXR*HVEr8Ie(R&$x;(Kz
zRhGU*BIKYNH2`qlB6dR{y!4Rk@R_pt;t3{>ZIsptuk@Zts>qLl%CTV?XcQt+!xJBd
zvB)ae*(Q}ed7z)YknF+^>lFUEn81R)(9O~1Zi}L;BM#qbRuXRFm@<}P-~0wz^K<^L
zWXkA6&^^BBd01a(QlFNps_}&%x*<`ts6yi>TU&Hj7Ypodvs>ZKPt$vkmvL&$HDJ8U
zYVLkF&~Ht9Y+p8zYuPfJzK*$1AsTTWQ=P2A(?#ippiPcLnms47rgNRo=Gn-wF|^;f
zqXuJ`;Sb_bzax%=vK<6*>jTD8Z&vGl&1~(+JFE`X&PtylLYi4_04y(!697;4{Y{1D
zo>{`?L8AoWG<`_I5H`3TSD0he6~Sm{VbemBY#TWCEm8H#$Fx8j>rn>ro;t*kil~mm
z(^rx<z80@y89?albq|xP>xAs0B)58-D|=!vm0hFtn*KKQ;%P)92D=+@E>OQg)dIj1
zkCGwa${F|m$Ci?|%<~eU=|)N#ZQ*)eT)dl6IQV-5dDzhqeEw2$mH`X<a$uY?0Sm?{
zW0ppwV%Ia0>UTj`(ahEoy>T8mMK0@DFIyLcxG)dW)UHS2r-jF0rUMj&-K$3_F_R@G
zFY4O-qNxn&wa}f}ldZ=G%+iM_K7SyD(%UX(I@ELH#^px-7Q5Dl4yu1(rF^K?rpnss
z#fcRq6ypZC1j|GLTM>PiM2|xsUU@Rvs8;q%+y)V)bZc(WoKBZy0F_eLL0e)JV?B-!
zG4<SY$8EWdyTd(*^jtinbG?FObcKv=!RXm!_$<!`Cw@bYKoO#kN9n&_fNJGKK-M50
zQLDIfFxwDH6=gbzLJFRfjfn^fxS@lJss6EJfacVWm97T<tnIUa(~kZ|S&V#O-r(c)
z`?T2DUmcZ0JJstERQ&raZN<ye4uHbRmB9Eqz8AyPiOIKLS$9Lgf%i9fmD`yc!Ql)z
zvKx!Z^PEQUt(SV33g|InhsGd=9`pGeYf$_~Uiqb4Lq}jLSAi^w=hCveSFO?N^ZxHC
z2{frqB|11h57L2WG5KYgg~4z~3bHPTflZmXUn^xIru+B?qlg}%k;Gj<3#Y4ov$vEa
z>j#CmyCw`xUZBZloCOWT2{|N;Srfsp(n|QuT3vLjo}IRU;1HrJI>bR1B2Z@8Gz2_&
zDpqy_)@y2-6=)VqQSgg3cKC_KI(l^S#mG(o0On6v#rMYU^htrmjgNJm<*>!0*thKk
z)(v@1`8zHRVvmAp_C_Z8q=2qUC}@SV-dLxPAtKS*In{iQGL3_D0!NLEelcCZc-^qG
z2qW2v@$_9?!-E`A)S{{E*4gE`4N#4zHX-zf*9U)wc#;GsTkM|7!lq5v9t`1UTUXJL
zsC?Q<nv;Q0=Hdt}MAjZ_x|J_hz!AxuD|#96)Cj0c8_hBO)jbOZSJrBbg!b6c`Z^CC
z6Ehw2!AOcFO6ItQd>R<tL&H6niFg+lEWvY`EQ$}W&52ffF#Ye(e_5IWkd#&4VSB*D
zhXnwzV)^g3&i|R-Z1ijlod5UMxm+xy;eW3G>nHLtrj^p6=!4T63XY=GcuOBYtscD;
zp*79fO076!r?pOs<Qk)DJc(GM!Fb58?=};W1u<W$^;-AVuu7*m)Avp8O>RrpbB^g_
zsg%y;87Z&8cL=X|)R@hiITD>Zsl6Y77<d?{HkT&%$j>!3=<(a#TOF7W+jG$zOyA2$
zBRyo{rq~)VPuH{1Y}EIiYf2ajsFa{2erDitDAKM<!KO{nLaWPU1<s#w(fy$)f*g-{
z&--kF)*||tZ3jpkpWa#=TwLGZ!F#y7y;3IqHp+d3k+VKd|ERN_sKIu$5_qrjOQO+w
zv_)Wg9K^m-=M%Dc;l-!^nC|H2bD1yVm~Sjn^8DyJX>K67LKE(nwTT$Kj(Z|$B4pWP
zL1BhZEE=Uk#yHZSB|Ijme_LY)0g-PO7c%+?Vy{0ScncX>j0vR*@WOEB4CrF!NVWvR
zhRIz|!r`vY@(HmRqTwvDq_|UQ5+(FRS3CJQ_EPS#;lT<QaXcwhc=!y31dT9cC>imG
z?DpU7XlAUOx+owRlA_}v0xD!u$Tv`912|*S%n>6}j?GyfRS`4c_DrGeQGiFC0*dN6
z9#Lfzkj9xlegHnRW@R9V9Zqq^h6tetsFhPsPmCpP#FPrz_?=>H28;$%`Bw<;`yg!G
zkZ{TRxW%~kMf!gXqd#B&unxyK(oYm5Q+F{8BObgX8#9O~j2%))5U*cL4FXx+jrf*k
zaPB?MVQXXHbOWER3I^#+55(xqec*h#!F+rcNL&IVMeo#Eo#7A$zm=@C!fY${pS5-t
z#m@K2?|T~y`RNO-o?);mHiJ_>EHOz#z<}9>%gV8BrnMF3VCf9@m}>8$yXLX?2&7^{
zvn;Z16xIBz<1>Z@PlYA+8m-&VnLazmS%5L&@5$FY_ra=?s@_D|z=t^4#eK3_<Ua>1
z0X^lMD9v$mnE`aULND2AQIQqziq|y9K(4L~WLeq-<2k!^Q5IpURUwQqrujZa0NN*Y
zZpw8n&=MAT50;s`x=tv672oQ|suMj;wORYOJP_5NKR86nm};wwVY6*1;Ko1E6_8L|
zIX1R}?nfLnGGOD)i>Cp`logPfbz*Lg733RJrVYDOU?8svQ_nRu6vVrTCBsBt8$pW^
z?7<)6md06=Wvpn*Dx*Fk2-RYPkr>TIZzG{~c8R8QD0tiIvVj9%;1*iEI%ftp;YQ#s
zGPP?l<}vg{hE`zxr4T8f;(;8^mhVynji?KNgaHjY32!iHz1D+FJ68C8TAWr#eNRLM
zql{7WWe<jfwixXAdkOOUlU#@BWRJDI%8K0OCmPY3-oHt%12&!mH$j)g<>?DnalG59
z-_hIV#P&4mc7vTvY+8$QghsoqAtY~ibLD+1SFbGF?_gif)sS6a`{J2-tqmI%+xUoc
zW5BZ06mz!Eu5P%`J}k_^m7XI(CBb=Llv3Q+OHn(G=4)Y))(QuEnvFf>s`h$v!ye0O
z%~O)T4QCn^()G^T(HVtUiZg6TwHl4wP#eZcK7o*(I{?RG4&e7CR;}8HamrK5#+>bT
zqBV^j{gIP{b4#=m3V$gcDbn&RGu(N`B)w!rCqaMyfdo=CFd`Wpje#hCFf=bDB?^<~
zL<w)5G|@LWg*V#=8Vo%3NK1ONIhR#cz#JQBrXbiBlN=9)fpNJosv5BXv%*3w`dR1;
z1Wr{zbY6Yd)QjQsBfcUINh0Y<zXB!<_pc}}+_ul)Yh^Efev-<#%Q~cMJNCp$Q0(H-
z!^$j7<t8KwC&JwER|mU*1z{lApY?@te(M*8ip7PlEz|Q+#6M@4;)PHG=(g7TRsi(J
zQHIX!k29XZ(w8XujL;Rx{2B~49*2*z_)5>j{L5bVgu@F!BdrbS&yf)f2@%m<A0LNC
zTRj$t?w&q8<$7TR#SE5c0G}_n3?3Tpr7HSzQc{FlTy=`jBpKO`nBCL{b{K_U33kQz
zh=NQ=Yf!5lc<SP^=P3>h@|8&)I1$E|Gys4fWTao@GO5#4b6{ufKF^Ougb1B@*F_Iw
zL@HZ=8j;JLG%hZ-!x>rVbMUX~_2;G;CVM*fY@gmv)hs<F81``1*w{7T3--t7)Y`zW
zF`su0#chi3HU7&Me>p>^4_SsMO`ZS12h;ZWmjM62?=6)rx}i|JbbbByZkWj%d}mbf
zZeO8$#?>NM^NTeF!YX?Jg<mQ}^LZCT?rd5?8*u-$Bj@vh%Bt^~@y*j90Fujznx$PF
zc8J|=e;Ac7>qR;u_5^)nFqRV;Q}FHt-h0pD!RGtJG?Aqmzf7GU`Oa7o4aNs+xNU<!
zW#3=&%EVG;B$?8Pw2I{8A*X<eMatuQA{9>#)nZIX;($it+<?=6vu8#AyTI@0ffb1Q
zJP5Mt3r7!zA>{IgUz~A#b(;`bLP0v`&HDQK;h9+dH;>S#HWkkpMK*jpg>Bkl+@Qi}
zOV3`#MzF^t)|0qu@7Vz@tP_JR$u*^M@F-?pM|#)R$P`>7?ZzP)MDk`83}NoB)Ic%x
z*e+S(N28g;>!YI`nAERyq5HLs*hU&Q{^Res_)M=ya$jWUqcp|@Y9EA<MZvR<%v<Me
zu`VUoZVFDl5+^WzakU-v*$x`y?@-<?-(wlqz?|S5S5VjY%^Ju^dZv?)BFu1VC4pie
z!M(C|t<Y!&-PtmIj}2jAet1&Egq@bf_3=mz(o+m<R25my9CTSnsHJ4hE|k4P?DPUt
zfFaS6`-=SjbxHOZQQ4L;;N%51_^~M41mg)o{_ac##t#um0_bunYsu+T$U6tvu8Jbz
zLlps`GxfcyGx71L^S0c7jU5TflY+>c56tP8>BZ0>d{g1fS%grrMJDMJT*ZGW?Bs2=
zf!koA;{w$w6qn|PqB@M$GkF>q`wgeel}yk&qqy9Ul~PbxYQRo+s%ObKCzYe2E8h=Q
z6nPul?rQDTa=a*U9Q_KF;Vr?F<&!mAXbw%i94n9&6+_g%R>NrS<Q_$L?3g2ifQl!=
zD~Q&X;*yd<-GIM7EUD{R_rW^TxvDVX3i1K61JBUQCIMDV=Auz0WWLa6xo;WY!YEl8
zlizzad9v}*&LQ28sV5JHccvHMNH2{$1p?i&h6{uGgt<~?bFAx8vJl*LcpG9Y&HDM|
zsv37hB_x4hXh(XegNKgP2^HV14|EykUEvt1j$Z|hJF~;Es#F&Cl{t@0imLD3oMZ?$
zZXVRE7*^0#?Wv$z>7Z7VoeYaI{a2zILb8e1@4<?oGThscN&YHeb2>~I6F1ZmO5I;u
zb$EXLbpBED&hcU?_nE=j%Jo1#b4MGQ8aZ91KCHKB&+1?v{s|%d<i;5wl=R-$j)><|
z3Ems}6P|$Wd6PIsYnKhDHhf^E**?lyD_@%D*I=#tM6cOOg}6#7P>vG+N3s$$quuM2
z18Oxcr4Y?FnG@Z3piBvi*h$N)2rax~PO3VxXhK23D&<OnR<KJk^+kk+a<#&<eYXOi
z$L4OVwKhbEl6q}9yilb?L+(x%R|dsFp}4<EsHlaKX=e<}eeM>e>t<#P{ep$$rEbUL
zp74cUe4Ci3Ix*lQBXRxIzYywsV-K{sgfT#wb)bDo`X&Fl7RQR7akHa?G|2?M#kGGP
ztULG7R^OHDLf7H8EL|6N*b&4Qx{D71sY|IQRB%1{YUG|X&yrQO#xAh~m6p<PYDYVG
zYJ<wO1YN^Sn^bkU>X?aqydAUOBaPTiK?HzJbs$aeRGUwQc$b0iLF!<|-ftq0kqmXa
z6lAQ&WW@GNRy^gdcK>ZP^!<n}q2pAsRt&F;ezLa9&5&wONh8Ty?YiJ$Oe?95H>H|9
z^ljJ7xT^WFUeO%&idQ=YCh7yFBng_|v$oBy$m29FBZTc~WtOQ3-P)S@C{6AskJTh1
ztL{WpiFYzyPKylh;jEY&q+d2@*5W~8%oA~(+EX9BlNAA2RANiSb-5cc?7{fh!Ypi>
zFl%~xx2|jNOWU@HmxceA^6}A3cD6R9_wlMZy{V$OL|cbR{J4&eo`c5n^(%p8eAvcr
zo1l+nkAQnzGiNfugzMiJd6i36&dfk3sGH{^k0bl8Yo}BXll@vj%;@|1<66o{{ctze
zm`F)E=)e<|<a_`Q!N|n*Lt}BJcfi|u5#VUJq$Dw-XX5Qi<55ZQqMiU1FYiXV_gDi-
zA!SYrNzqTV$GW;ZyDbgfObFFXmEgvKOv{vzEz1f&qdh1_P*J}(IQl~@+C1+&kcyo{
zpkfxu9i>kB_HX;jMtQCHoXIK*(#3<fX0B4jdO!fCWPk~%lEy{9GX}_~vkB1SLZBCG
zt!$62ZvabZU<Nl$9>=V_Whp1h6gJC!SBOxC)P(}v_#fZ1(jKh%hpSVUFvs05w)85r
zkWd)mbGvTtt<Vx?y29PEBg_<glmMR=59Zj{S3HxyBdBvpE@|zjzLMNSwKPMog70RF
zYd%sWZ<BEYPPIK>^xR@rD|~*qu+OHlr%<s&mww*Fv{Em<j3|C9cb`mPA}Llz&ybCb
zIFyVP&}u#LwRq;<%|MMky+aRvO~r$MXDz?UFXA(KmNd20t6C<LsY!A_&*w7-hD!nk
z;Ju!xoI_?QK4<DGn_W~WqYd#@Yr>zmL<Y)&bL1A4c>}SYm%d(28fsNpXhmcwR99d~
zVIMuU2fwE^xQRG7IZwzL-+vOksW$j5!@E=~N9<O><^-%*=|YQq(!S|)*lO~cu7Bf9
zdgFB{B=y`!9(Q|pB^QYkQJqLR{><N$>l@|p0do%Z$uU%4S9n#5Wx?!Da2(0al(+fh
zW=>zg@jp)g{+Dvm|A<N1`~dp#{&A<-Kkmf(|4cjohdUYmH+23tKGI{%Tc-`x2d8f}
z>+J|Jf9q(kZ$s=>M)DR~^fD0H>~@S8=z%g+#FSv1*Nfk8*Ilo~++cj$iz81pQ$(rT
z>)Y+tPP+n)T?<yfj=AO<+XJK}y|bXE@U74|R+n!T=vVMLPWGvN&ix052isE!a<MS6
zFqSi}2sE%*I3hPjI6=NHpJ1N3AT2uk?J+3ZRS)%oUc$fV0~qSE^v~ERp53tI-wC!F
z&A<fzgm)bX#7=04Y?}0EvgpJKOcME(x3A5EgM+tz>>q%*UB<A`Y9!nP=y>Yj_P9Hp
z3U&5DAcSlV+(+yVM4kX8LeOu?Q{CtX_Nm<L30V!S+vR9v32uWRpvefT^-}*F9g(E8
zTJ85hWS+qq;REH`;q-=ngDQf`sQXJ<9!RDHDDm9X3J7!(TNKnqcRN`JLX2*Rqz}|j
z-*<pCU`g;c12n<n(TQ2uQ1hDLB<JY{!Rkr&7XyYUrI1VmGcX%~t-+_^;_#$9Ln`eL
zyof}YjGOwJi4YvJ-lJM=3YJAhE&}ld#>vX?$}Sy(`#t{DTLDwTi}nqKYFy=`nP<`P
zY((np==`~dqwUKXt>G0_{1xl}o~|2Ds3d+sqrC(vssXue&xEub9a5xJA)+WlgI6#X
zDbfh^1a2Ufw8LQW9X|xB!2u8(WGMbfn_HYd(-t{c5w_(0LXJE&L9Unpssb`7ckY3D
zqK~tIx<1TK^o~Ud>>D>TxSFWi?ZA5ToW5G4y%AcIFWRq8(2uYA!bcy-q2n6U6D@+E
zx6)-C^na++&GWEko=<Jxnmh1EAB5*{0i9rZo?j%_Gm@g9e-CE9eQA0Iw8q>_bQWEQ
zsm3l^;eTPLld<y%&vfwq8a6C7j`&NBfs1FRL%Ev-TQcB#pl|W3n7)pAckUdR1pMzz
zJ|81YvaP<ReMyn`hKAfJw)|*~!9`BO1VjXyA{0$f;j?mGsOM-t_;+_~h51Rd<lls<
z;$Lo2{H@>`*Ycc8R0RcI10-fIGwX{q;+s7f^+P5r<LD70oEh*STBNKo^$rgcXXi?o
zZa|7hu#wan!lHzcHzEvXRNKSH^)<%yb?Bun=F!0fhO^c1iQzpQOt9i*_|8db?lY$D
zd1m0p%(Fy+bZ}*Nw}QhC2~rc&#b6WaCVewvp+pDp6Y&Mqj}MPo_SH|E99MARvmAqS
zmZyw>ha4z9ghw|_M_i`waS?JXzhpvX6I{?k81rqapkTB<VKAY7M&UJjELYlKs0H(1
zkK++)sjo3fV3klRx^$t{e&&L$U(VrPzTv7N?5)t(W*E@hJcBFR(>qpaRbTJZfQQMa
z*xbATOOIFB^clLD0f?^goJIhW*flGN_Yf(!4fv%jF0Ne<Ch8QXIveea7#gp#tTdWW
zL-wZYoLhTvD~D&&LNFx15RpTWq@yo=U&`vC@g=C$RPWo8wib2IkPw|6&b4eiZ~9%G
zT`l$`@~yh(bbV94bh@;Mlg+yu+URRp^oVL{Iz=;Qo+SYVO?yWmzNLJ?uY0^^O<1#R
zosBf1L0_|;<*EL*-R*S;K0}>9b)m%S`kTAS+)+OR#5@j%=twneBJ`A&Rb6B0fPllU
z$h=J^OZv_E2YsyNAly^k<Jj2z?0wj``U^cUTNa?j5@&o-hyyl%gSE%T)RTBypptFt
zN(dM>(3+9h)d6uN>_kexr_Z9q8bq_H6y}2JS@FI9NU{q%1H&Gw1qg}K)x_T~pgg#e
zX;c5fDW^ld&cRV_PJ?wND(wGu^Yx}A42A&2xiT6EdBsw-xX`v|aX^#8>x@LY5;{QN
z(et<og8Vwp)Rjdz;~gq{kD<Q`8+#dyINZc_{3wgB@<}PW?)OSLyaF`U-gxLfAH|du
z72ON)^X_sc9DUW<9l=*#5J6hZ;)3?EdvH(Wrqx*~r>__tReHtUq|8c<i`$O732tU*
zRr*opQ2vZj{a@I*y+}LTfl0nLs{bp(=w1#0umg>J3qmDxk!}U*rZ?#IwTK#3gV%ZN
zV}e;@>)k4Pv6sQkZT>&8bLD?v=UN``|AC#OIe;%%AD>JA2X;E*=>5Og*@39eZ*ZM)
z{r3kSzxk+%g$=qsLz`r6>E?Ej(mg!eWXev@pege8JZHnR1v!c;yDyoqGF{Vo2bm7F
zl7Gu@&y*#reZIqr&soXMGaxR4^O>r-g+^<C)9Y?OGB1X+1SE@biu+__O9E!Uxlydg
zuJzru#rrXQ<5*tl3g?0C!CWh}=Xo%TIp2|<Vq)TmVmi1{<BF8hgyTND=%Go{qpMhw
zPOL&%NE4A=>VU%iB{7Hy6l8XNmcsfPz$-(4gO&~r4OlvX@^d#8I&fL_jF|9A8*iP+
z+Oocq2;DcAfWs0^cW~%_TuZqXs(v(|yeRXgcB!nNuqWoth-<U)ZY0zLz18qV`L3Ta
zLX&mmMzubXDB3EuO#-O6g*GTWY*q2@&tSr8gt6<CM;8v>F4s>ap3@lK=B7i-F&KIG
zFM=YJ8-i$DVC<J7abgKwp?xBhj#^_*?qm4tcrKUF>7=tP;Ggq}oIMRZ2$9|bxK=%f
zq#S)N(^8!Pou8J<K*Fi$_8t}B1QW@!Cb>V@EIv{R3?r8mDAaOU;eY-N2oo-Bx^i+^
zFi0J9hYWU2NR%QCO4tTuDn_+}c_#xhEg}1_jWO#UGqY<!l+KThop|^wet-dK%ugpt
zEBq--W0I8QlcNYGaEXv9f7b@)o$z0ENjC4Au=s=Hl+A)e;lY4Y31Q56BGF7PTtg%m
zlo4w&!GAZHEZ#`but%&78quXBp7{WFJObHANzV;wNFt{oghY4V!m=Q0M1?{<5Y4LO
zTHo0gq=u`ap>Swvf3oB0o!KZk)K-_xr#n2%6b1DQ>AD<Jxj^t*A_-C8$`2t@UcAX@
z+d)<;NkF3FKJ4YQ26jtqb<{0N#78b)7G1^}INe1qt8UNMS6MrXXoX~37u7ykaS#6o
zvX3G>HlPDqUk7a3EMaLW>h9l&D#)+QkVq)wxAJ)q!ZCq1AZ@0BTK8zDirY_<WD^Fl
zYm*uk2ZVGZ!u!TJs(L-T@A4tRCYcNB$HOq^nN?B|(cGTl#e{&ER17g;!3^m&F`~sQ
zUW1|&jc{|Ba818D5SDC#fDW^IV0SuFxM};imXd)InyL*YWHT+qYJ#I)L6(2H(3*fu
z!nLXYOpp|p)&s)gC`>k+5hH@SYE04lGqVP__m_46Sr5%t#xjoy-0g%GlyfJ9q49p5
zWzyYR@rD@o-}t4VoL4Ta4%$eLU5)T)8kvBd;a{<OSZ*U>LnYSdpi0kMrs_@o4As)P
zSsruNDNppuWyDakth^;Cao~cbtm*z%`^&;TA<1nBRtPLu2K~hn*!UKu-4l=kif6fr
zgE9xD<#ixWq)52h#6VA($grjg-HR5<-%=Rd_m^gS@d(gPOogTi=1Yd1@xcs2+6w06
z7K<fS(-ABWV7QO&z}4+`B!TV{VcHcgHce4luyQ0aG80C5J{84JY<cGbJ*=+$6=l-+
z2~l>m%yHbNpJp4F5mPZWDn<=RhJ_i9jlG8jUp9I#9T&P@w`6I$Fhd3)Hn5$%aEKj>
zG@$}>N!LU792piYt5r4$9VoOEK2tkdLCb3vCZ%X)jI;<9Myq>hNyi#7`xTOL9cA3U
znC83VRgO_9<Z-vDxUa-EmaV*o(xnKGR|>!eyYzaj4kX3luYb;-6a&`xnBtrExyyNQ
zx~T`M+nhB>cjXo0-4w4f>IX{1mC^>3Vff$A=x7xVJgQ*RnVUhC`MNSaTh4KSzpt5}
zteI~2>6-3BcHi7gk^Lj0LcZ@uzZOcUZ4g$r%*Tz;?@cZb1aZ2NLhx72Z`q_-!OBVD
zr~ANzYd8oD`pH8&#%kMC_T;jvxvs8j)D7!fUoewUGqcC67fQfSwTygzCr@9R?_9IG
zj}n!d<`c`20+eAs0pk|BooI1Y5;JyQDq#St{$Y2_HZHVaD`U8r-#t6cbS|hXENh!Z
zKN*7%vzI;}DFNFUZY(Q$YIb_)gP6ZB#5fs+n8>S-^s=eC{^(YXi?f+6KPV?fSz!2d
ztSl+gPbwp&vzd8_3nW;E_xI<r?^?N$;glh|BI4f|?+eW{mKWOk*)ST}8trXj+s+vg
zTh^-lj830eA%FXPAuyif(C2YKpHuz3qm}c>?l|=eb|jptC;kJSBCE$p7YF|XI{&pA
z{!i#U7_dJ6{2$Oc@E_=m?fnOxkV5_1xv8_)X5`IExsWBXnH@I^B~v8NWnso3ba#le
z_Yxj2iycDkc0X9sE02PMV1-Yuy4bctN||W$cFK$~kZqBDyxZKEqo1E~jEY83XAa9I
zH|_tj!uM8C_ucX@>&&jZiV!~!MR!w`bbQdWbD7Vxd0|4`8T0RfME4(fcoCC{-?h@i
zc`RQ)(E<wR8|pm+RWe}@(UgNIbVtj;F}14t6`xYnztuE2r2kK6R|6DP6@{<-2%3NC
zny5=4HY%yhh%t<lnG7(r4vNAGX2o;aeG5-n7MGP)3u9+M4P>anztl;Y{23KXvy?_<
zEOXRJ%5h9INgFAppb`|wEa}{R`}5B3g?-yHkJ%ZR?>qN9=iGDe?tAx?Tx(0oUVrsr
z?X_E9<(z(FpFX;yIc@3a^2+(aB`=$Q9n(5^S4Q{m+O)RTgPO2&bL*Bo-S$Cc*`h%&
z?$~$W?V$Ju&9U2CFE%V~svi+ozU08TRHdP-e%<38$E@=#4XZA_pWFHG7T9x|;*zot
zZElG-2Da{w+i~w~N5k2*o4y_2l=ee+@A*%;3m+@?#>{Sc^yh8UUSXuVa#oG9EU!m%
z<S0BL9iH>k{%zOb<BhJ58rPZ5DLW_M(=^XXYcxCx*?r?K?JqkZ;Mu^zgudvm)BeWs
zD};nO-i;t<66jm4{m9ms#hPFe$mo3`f+^r1LkT@^BI3)So|ZsDG;nCwFbCKG_-m<+
zqB+1))rrXqGLr3>8@jxnyzS4x;mE*zXpHN?<gHp`VLmU*P&(?oY32V!fZZ`_dN77K
zYSGZoy+K6|PHz^9d9%uXOonecC`;&?EL$1KF$TK#h9ef$STEBP=WAE+snCnPNM*5F
z<S0%l>YC>aj01`jp!jG+F$kW5cBtbIG&?eeBH^ndUC=rsSS?%jnn9mktqve$Hgr;p
zK-OOMgiH_*3)b1&8>{kELV+AfXb{#^k=o@DZo|N#nB>$%54)52LcT!H7w80N_-P-C
zoT#KEfbV)eg~WO1ITwlEq!Xp-GtAwolXXycw;iN849B%RgQWQy116cQs|`XvpT+0&
zZ>$^p^!lmGqadzN!nw?25H^{Dj1@o(D`#A-0?XxszsD^T=1zi-tR~Zst(+4G&H18f
z2pn#hFbh^LHkRX8s&WN`T!NeJA2!SbJL}*ILj<82YyyAKZ?xaO)vF}ria^LHq|KhU
z5V}+M{>>KChek+3S8mw^h!J|>%)Gx10q3j|^7R}jUerId+n-#>;fIltgs9=diY$Ys
zMvkPX!RM5GhChmA1@t_*6Gg~y$QF!#<qH=2j9B03ZdpJL*K3H&o3!2x{LzJO;fpLj
zGKW1+IWvb4ikRww2%n!CI5)PBf<~v;-#SX8AB=zr>jgrhP;~6<6I*A66w(R>aw`Q5
zmhTpBv}Qo|4;@9DQc3Gk+aFjJ_ZS$nx{P_|Qm^8c2|REKu5pNIX9s5T2cPW?C%)(n
zt`p-I^Yr9S&a5ran~btcNM-iil1T6fnMuebWdE^#@%{A*_5RK8$JcBEs<lu_rXa4F
zfdia*W{)R47KU;@VvWYYF1>QC4cNNja>g+b!$cY#gxTyZss)Q+5^JIluhWt6clJ%p
z98SpA=czB;@pZ=bw;MY>IU#9&vdXBp&qFdSjxf)=ei0TQ<3b5hNKi{{+Z8U06QL!l
zS;)<^xRy12+ABs8y$275?Rw$zdNj<1Tx52XSH`V(o-5N7n>kYlB`^j`;8<j8HwJX9
zJ96?(x)rKCxifNXde!}QfIb6V4{-k0g(G_%@Tdm@mzJ(hk;6ni89hBCd^-rGOZUv*
z?#T=$`fZUL--k~ren`{1i@$-T<4Fko2}r1)V;T68<8)-x&|ojE{>6F@{Ba$I;+!VL
zU?04QMPt<J%qDwNc367%89)jMnox2@y+CvF!C%!;u<SmP<yn0vW-{=_FVz70ah2Cy
zoYGLD3RRpg+0zTTq?+Yk@Q9{w(lVf>y)Jxj8>lvOUY}Gw6SQfBv{E7$w60_jWb)=B
zm<n7&@SzSJLQ2F!V<#l;6ZpCjXT!>3#PI)SvgSj%>n{frQZvMJ0LRxLct<uES6c)l
zFLwY`BK6$^it!*(ElA{Cbc#M`E@d$k>P$wXKLi`%Hdjo6AsmGm!tt3}&LSw*njtz1
z3+1FS9YE;xJnl^xz)LV`U>{$oVBkA_?A(0%@G)f|wI`-#!)D?&D3(~F&D9JBPL#+G
zg6!f8YCT9a5}Ik^J@hMESOk)zCjAg9ZFG5l4+vEcj=(Gfcd}R#?Hk4<-r$!zdJC1u
zTVO1W(B2!1l~v1Pu~%T&Gs-RyxPQ320GHaT_ag#!H*w#S9!+c9+EhyN>L>k@NE)5`
zo}#?F{79MVPa!5&y|d>Cqu-BoqV+!hT}l#ko=GApMs^OyLGV%znkD#zR4GUDWfq4d
zh-IdV_o;MJmiQ(Xi}X-?a0ugkI_WsPA6k$ytm$Gg;71sM!^awmh8Mm;Mat0`7~otE
f(?yxX>5|)3`iiPxn4k!Who6m5yA2~@3q<|{E?c;d


From 7cdedfafdd45647c7713937c220fc8669830fe3b Mon Sep 17 00:00:00 2001
From: Vinh Dang <dang15@login3.summit.olcf.ornl.gov>
Date: Wed, 30 Mar 2022 01:24:52 -0400
Subject: [PATCH 009/130] Fix comm issue in forward solve

---
 packages/adelus/src/Adelus_forward.hpp | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/packages/adelus/src/Adelus_forward.hpp b/packages/adelus/src/Adelus_forward.hpp
index f09e9f0fa618..7a8fbc094b01 100644
--- a/packages/adelus/src/Adelus_forward.hpp
+++ b/packages/adelus/src/Adelus_forward.hpp
@@ -81,6 +81,7 @@ void forward(ZView& Z, RHSView& RHS)
   value_type ck;   // rhs corresponding to current column of the backsubstitution
   ViewVectorType piv_col( "piv_col", my_rows ); // portion of pivot column I am sending
 
+  MPI_Request msgrequest;
   MPI_Status msgstatus;
 
 #ifdef PRINT_STATUS
@@ -105,11 +106,14 @@ void forward(ZView& Z, RHSView& RHS)
       count_row++;
     }
     if (mycol == rhs_col && myrow == k_row) ck = RHS(k/nprocs_col,0);
+    if (mycol == rhs_col) {
+      MPI_Irecv(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, 0, row_comm, &msgrequest);
+    }
     if (mycol == k_col) {
-      MPI_Send((char *)piv_col.data(),count_row*sizeof(ADELUS_DATA_TYPE),MPI_CHAR,rhs_col,0,row_comm);
+      MPI_Send(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, rhs_col, 0, row_comm);
     }
     if (mycol == rhs_col) {
-      MPI_Recv((char *)piv_col.data(),count_row*sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_col,0,row_comm,&msgstatus);
+      MPI_Wait(&msgrequest,&msgstatus);
     }
     if (mycol == rhs_col) {
       MPI_Bcast((char *)(&ck),sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_row,col_comm);

From 97710d06de16df57ab544c87862511da8317adcd Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 4 Apr 2022 08:35:50 -0700
Subject: [PATCH 010/130] Make sure forward is updated

---
 packages/adelus/src/Adelus_forward.hpp | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/packages/adelus/src/Adelus_forward.hpp b/packages/adelus/src/Adelus_forward.hpp
index f09e9f0fa618..7a8fbc094b01 100644
--- a/packages/adelus/src/Adelus_forward.hpp
+++ b/packages/adelus/src/Adelus_forward.hpp
@@ -81,6 +81,7 @@ void forward(ZView& Z, RHSView& RHS)
   value_type ck;   // rhs corresponding to current column of the backsubstitution
   ViewVectorType piv_col( "piv_col", my_rows ); // portion of pivot column I am sending
 
+  MPI_Request msgrequest;
   MPI_Status msgstatus;
 
 #ifdef PRINT_STATUS
@@ -105,11 +106,14 @@ void forward(ZView& Z, RHSView& RHS)
       count_row++;
     }
     if (mycol == rhs_col && myrow == k_row) ck = RHS(k/nprocs_col,0);
+    if (mycol == rhs_col) {
+      MPI_Irecv(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, 0, row_comm, &msgrequest);
+    }
     if (mycol == k_col) {
-      MPI_Send((char *)piv_col.data(),count_row*sizeof(ADELUS_DATA_TYPE),MPI_CHAR,rhs_col,0,row_comm);
+      MPI_Send(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, rhs_col, 0, row_comm);
     }
     if (mycol == rhs_col) {
-      MPI_Recv((char *)piv_col.data(),count_row*sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_col,0,row_comm,&msgstatus);
+      MPI_Wait(&msgrequest,&msgstatus);
     }
     if (mycol == rhs_col) {
       MPI_Bcast((char *)(&ck),sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_row,col_comm);

From d9a6e384af5ff9c69ab3c5b591eb713f94676f87 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 18 Apr 2022 13:40:30 -0700
Subject: [PATCH 011/130] Add test for separate Factor and Solve

---
 packages/adelus/test/CMakeLists.txt           |   1 +
 packages/adelus/test/definition               |  12 +
 .../test/vector_random_fs/CMakeLists.txt      |  29 ++
 .../adelus/test/vector_random_fs/cxx_main.cpp | 457 ++++++++++++++++++
 4 files changed, 499 insertions(+)
 create mode 100644 packages/adelus/test/vector_random_fs/CMakeLists.txt
 create mode 100644 packages/adelus/test/vector_random_fs/cxx_main.cpp

diff --git a/packages/adelus/test/CMakeLists.txt b/packages/adelus/test/CMakeLists.txt
index bcdf73fde286..1f93b6e019b2 100644
--- a/packages/adelus/test/CMakeLists.txt
+++ b/packages/adelus/test/CMakeLists.txt
@@ -1,5 +1,6 @@
 IF(Adelus_ENABLE_ZCPLX OR Adelus_ENABLE_DREAL)
   ADD_SUBDIRECTORY(vector_random)
+  ADD_SUBDIRECTORY(vector_random_fs)
 ENDIF()
 
 IF(Adelus_ENABLE_Teuchos AND (Adelus_ENABLE_ZCPLX OR Adelus_ENABLE_DREAL))
diff --git a/packages/adelus/test/definition b/packages/adelus/test/definition
index 6e41b37ee2a7..fc78f641fdcc 100644
--- a/packages/adelus/test/definition
+++ b/packages/adelus/test/definition
@@ -16,3 +16,15 @@ PACKAGE_NAME=Adelus
     COMM = MPI(4);
 }
 
+(FRAMEWORK, INSTALL) {
+    DIRS = vector_random_fs;
+    ARGS = 1000 1;
+    COMM = MPI(1 2 3);
+}
+
+(FRAMEWORK, INSTALL) {
+    DIRS = vector_random_fs;
+    ARGS = 1000 2;
+    COMM = MPI(4);
+}
+
diff --git a/packages/adelus/test/vector_random_fs/CMakeLists.txt b/packages/adelus/test/vector_random_fs/CMakeLists.txt
new file mode 100644
index 000000000000..9686f7467f51
--- /dev/null
+++ b/packages/adelus/test/vector_random_fs/CMakeLists.txt
@@ -0,0 +1,29 @@
+
+TRIBITS_ADD_EXECUTABLE_AND_TEST(
+  vector_random_fs
+  SOURCES cxx_main.cpp
+  NUM_MPI_PROCS 1
+  ARGS "1000 1 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NUM_MPI_PROCS 2
+  ARGS "1000 1 2"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NUM_MPI_PROCS 3
+  ARGS "1000 1 3"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NUM_MPI_PROCS 4
+  ARGS "1000 2 4"
+  COMM mpi
+  )
diff --git a/packages/adelus/test/vector_random_fs/cxx_main.cpp b/packages/adelus/test/vector_random_fs/cxx_main.cpp
new file mode 100644
index 000000000000..6b00c5f0f728
--- /dev/null
+++ b/packages/adelus/test/vector_random_fs/cxx_main.cpp
@@ -0,0 +1,457 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#include <iostream>
+#include <cstdio>
+#include <cstdlib>
+#include <cstring>
+#include <sys/time.h>
+#include <mpi.h>
+
+#include <Kokkos_Core.hpp>
+#include <Kokkos_Random.hpp>
+#include <KokkosBlas1_axpby.hpp>
+#include <KokkosBlas1_nrm2.hpp>
+#include <KokkosBlas2_gemv.hpp>
+#include <Adelus.hpp>
+
+int main(int argc, char *argv[])
+{
+  char processor_name[MPI_MAX_PROCESSOR_NAME];
+  int name_len;
+  int rank, size;
+  
+  int  myrows;
+  int  mycols;
+  int  myfirstrow;
+  int  myfirstcol;
+  int  myrhs;
+  int  my_row;
+  int  my_col;
+  int  matrix_size;
+  int  nprocs_per_row;
+  int  nptile = 1; // number of processors per node
+
+  double mflops;
+
+  MPI_Comm rowcomm;
+
+  static int buf[4];
+  int numrhs;
+
+  int i, m, k;
+
+  int mlen;   // Message length for input data
+
+  unsigned int seed= 10;
+
+  double secs;
+
+  double eps;
+
+  double othird;
+
+  double four_thirds = 4./3.;
+
+  double tempc;
+
+  double rhs_nrm, m_nrm;
+
+  int result;
+
+  // Enroll into MPI
+
+  MPI_Init(&argc,&argv);                             /* starts MPI */
+  MPI_Comm_rank (MPI_COMM_WORLD, &rank);             /* get current process id */
+  MPI_Comm_size (MPI_COMM_WORLD, &size);             /* get number of processes */
+  MPI_Get_processor_name(processor_name, &name_len); /* get name of the processor */
+
+  // Initialize Input buffer
+
+  for(i=0;i<4;i++) buf[i]=-1;
+
+  std::cout << "proc " << rank << " (" << processor_name << ") is alive of " << size << " Processors" << std::endl;
+
+  if( rank == 0 ) {
+    // Check for commandline input
+
+    if (argc > 1) {
+      // argv[1] should be size of matrix
+      buf[0] = atoi(argv[1]);
+      if (argc > 2) {
+        // argv[2] should be #procs per row
+        buf[1] = atoi(argv[2]);
+        // argv[3] should be #procs per node
+        buf[2] = atoi(argv[3]);
+      }
+      else {
+        // default is 1, but sqrt(p) would be better
+        buf[1] = 1; buf[2] = 1;
+      }
+    }
+    else {
+      // Input Data about matrix and distribution
+
+      if (buf[0] < 0) {
+        std::cout << "Enter size of matrix " << std::endl;
+        std::cin >> buf[0];
+      }
+      if (buf[1] < 0) {
+        std::cout << "Enter number of processors to which each row is assigned "  << std::endl;
+        std::cin >> buf[1];
+      }
+      if (buf[2] < 0) {
+        std::cout << "Enter number of processors per node "  << std::endl;
+        std::cin >> buf[2];
+      }
+    }
+  }
+
+  /* Send the initilization data to each processor    */
+  mlen = 4*sizeof(int);
+
+  MPI_Bcast(reinterpret_cast<char *>(buf), mlen, MPI_CHAR, 0, MPI_COMM_WORLD);
+
+  // Set the values where needed
+
+  matrix_size = buf[0];
+
+  nprocs_per_row = buf[1];
+
+  nptile = buf[2];
+
+  if( rank == 0 ) {
+    std::cout << " Matrix Size " << matrix_size << std::endl;
+    std::cout << " Processors in a row  "  << nprocs_per_row << std::endl;
+    std::cout << " Processors in a node  " << nptile << std::endl;
+  }
+
+  // Example for 1 RHS
+
+  numrhs = 1;
+
+  if( rank == 0) {
+    std::cout << " ---- Building Adelus solver ----" << std::endl;
+  }
+
+  // Get Info to build the matrix on a processor
+
+  Adelus::GetDistribution( &nprocs_per_row,
+                           &matrix_size,
+                           &numrhs,
+                           &myrows,
+                           &mycols,
+                           &myfirstrow,
+                           &myfirstcol,
+                           &myrhs,
+                           &my_row,
+                           &my_col );
+
+  //   Define a new communicator
+
+  MPI_Comm_split(MPI_COMM_WORLD,my_row,my_col,&rowcomm);
+
+  std::cout << " ------ PARALLEL Distribution Info for : ---------" <<std::endl;
+
+  std::cout << "   Processor  " << rank << std::endl
+       << "    my rows  " << myrows << std::endl
+       << "    my cols  " << mycols << std::endl
+       << "    my rhs  " << myrhs << std::endl
+       << "    my first col  " << myfirstcol  << std::endl
+       << "    my first row  " << myfirstrow << std::endl
+       << "    my_row  " << my_row << std::endl
+       << "    num procs row   " << nprocs_per_row << std::endl
+       << "    my_col  " << my_col << std::endl;
+
+  // Adelus example using the Kokkos Views
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
+  int gpu_count;
+#ifdef KOKKOS_ENABLE_CUDA
+  cudaGetDeviceCount ( &gpu_count );
+#else
+  hipGetDeviceCount ( &gpu_count );
+#endif
+  if (nptile > gpu_count) {
+    if( rank == 0 ) {
+      std::cout << "Request more GPUs than the number of GPUs available "
+                << "to MPI processes (requested: " << nptile 
+                << " vs. available: " << gpu_count 
+                << "). Exit without test." << std::endl;
+    }
+    MPI_Finalize() ;
+    return 0;
+  }
+
+  Kokkos::InitArguments args;
+  args.num_threads = 0;
+  args.num_numa    = 0;
+  args.device_id   = rank%nptile;
+  std::cout << "   Processor  " << rank << " (" << processor_name << "), GPU: " 
+            << args.device_id << "/" << gpu_count << std::endl;
+  Kokkos::initialize( args );
+#else
+  Kokkos::initialize( argc, argv );
+#endif
+  {
+  //  Local size -- myrows  * (mycols + myrhs)
+  
+  using Layout = Kokkos::LayoutLeft;
+#if defined(KOKKOS_ENABLE_CUDA)
+  using TestSpace = Kokkos::CudaSpace;
+#elif defined(KOKKOS_ENABLE_HIP)
+  using TestSpace = Kokkos::Experimental::HIPSpace;
+#else
+  using TestSpace = Kokkos::HostSpace;
+#endif
+#ifdef DREAL
+  using ViewMatrixType      = Kokkos::View<double**, Layout, TestSpace>;
+  using ViewVectorType_Host = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
+#elif defined(SREAL)
+  using ViewMatrixType      = Kokkos::View<float**, Layout, TestSpace>;
+  using ViewVectorType_Host = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
+#elif defined(SCPLX)
+  using ViewMatrixType      = Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>;
+  using ViewVectorType_Host = Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>;
+#else
+  using ViewMatrixType      = Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>;
+  using ViewVectorType_Host = Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>;
+#endif
+
+  using ViewIntType_Host= Kokkos::View<int*, Layout, Kokkos::HostSpace>;
+
+  using execution_space = typename ViewMatrixType::device_type::execution_space;
+  using memory_space    = typename ViewMatrixType::device_type::memory_space;
+  using ScalarA         = typename ViewMatrixType::value_type;
+
+  printf("Rank %d, ViewMatrixType execution_space %s, memory_space %s, value_type %s\n",rank, typeid(execution_space).name(), typeid(memory_space).name(), typeid(ScalarA).name());
+
+  ViewMatrixType A( "A", myrows, mycols + myrhs + 6 );
+
+  ViewMatrixType::HostMirror h_A = Kokkos::create_mirror( A );
+
+  // Some temp arrays
+
+  ViewVectorType_Host temp  ( "temp", myrows );
+
+  ViewVectorType_Host temp2 ( "temp2", myrows );
+
+  ViewVectorType_Host rhs   ( "rhs", matrix_size );
+
+  ViewVectorType_Host temp3 ( "temp3", matrix_size );
+
+  ViewVectorType_Host temp4 ( "temp4", matrix_size );
+  
+  ViewVectorType_Host tempp ( "tempp", matrix_size );
+
+  ViewVectorType_Host temp22( "temp22", matrix_size );
+
+  ViewIntType_Host h_permute( "h_permute", matrix_size);// Permutation array for factor and solve done independently
+
+  // Set Random values
+
+  if( rank == 0 )
+    std::cout << " ****   Setting Random Matrix    ****" << std::endl;
+ 
+  Kokkos::Random_XorShift64_Pool<execution_space> rand_pool(seed+rank);
+  Kokkos::fill_random(A, rand_pool,Kokkos::rand<Kokkos::Random_XorShift64<execution_space>,ScalarA >::max());
+
+  Kokkos::deep_copy( h_A, A );
+
+  // Now Create the RHS
+
+  if( rank == 0 )
+    std::cout << " ****   Creating RHS   ****" << std::endl;
+
+  // Sum the portion of the row that I have
+
+  for (k= 0; k < myrows; k++) {
+    temp(k) = 0;
+    for (m=0; m < mycols; m++) {
+     temp(k) = temp(k) + h_A(k,m);
+    }
+  }
+
+  // Sum to Processor 0
+
+  MPI_Allreduce(temp.data(), temp2.data(), myrows, ADELUS_MPI_DATA_TYPE, MPI_SUM, rowcomm);
+
+  if( rank == 0 )
+    std::cout << " ****   Packing RHS in Matrix   ****" << std::endl;
+
+  // Now put the RHS in the appropriate position
+
+  if( myrhs > 0 ) {
+    Kokkos::deep_copy( subview(h_A,Kokkos::ALL(),mycols), temp2 );
+    Kokkos::deep_copy( subview(rhs,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), temp2 );
+  }
+
+  // Globally Sum the RHS needed for testing later
+
+  MPI_Allreduce(rhs.data(), temp4.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
+
+  // Pack back into RHS
+
+  Kokkos::deep_copy( rhs, temp4 );
+
+  rhs_nrm = KokkosBlas::nrm2(rhs);
+
+  Kokkos::deep_copy( subview(A,Kokkos::ALL(),mycols), subview(h_A,Kokkos::ALL(),mycols) );
+
+  // Now Factor the matrix
+
+  if( rank == 0 )
+    std::cout << " ****   Beginning Matrix Factor   ****" << std::endl;
+
+  Adelus::Factor (A, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &secs);
+
+  if( rank == 0) {
+    std::cout << " ----  Factor time  ----   " << secs << "  in secs. " << std::endl;
+
+    mflops = 2./3.*pow(matrix_size,3.)/secs/1000000.;
+
+    std::cout << " *****   MFLOPS   *****  " << mflops << std::endl;
+  }
+
+  // Call Solve (1st time)
+
+  if( rank == 0 )
+    std::cout << " ****   Beginning Matrix Solve (1st)   ****" << std::endl;
+
+  Adelus::Solve (A, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+
+  if( rank == 0)
+    std::cout << " ----  Solution time (1st)  ----   " << secs << "  in secs. " << std::endl;
+
+  // Restore the orig. RHS for testing Adelus::Solve() on a pre-computed LU factorization
+  Kokkos::deep_copy( subview(A,Kokkos::ALL(),mycols), subview(h_A,Kokkos::ALL(),mycols) );
+
+  // Call Solve (2nd time)
+  if( rank == 0 )
+    std::cout << " ****   Beginning Matrix Solve (2nd)   ****" << std::endl;
+
+  Adelus::Solve (A, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+
+  if( rank == 0)
+    std::cout << " ----  Solution time (2nd)  ----   " << secs << "  in secs. " << std::endl;
+
+  // Now Check the Solution
+
+  Kokkos::deep_copy( subview(h_A,Kokkos::ALL(),mycols), subview(A,Kokkos::ALL(),mycols) );
+
+  // Pack the Answer into the apropriate position
+
+  if ( myrhs > 0) {
+    Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), subview(h_A,Kokkos::ALL(),mycols) );
+  }
+
+  // All processors get the answer
+
+  MPI_Allreduce(tempp.data(), temp22.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
+  
+  // perform the Matrix vector product
+
+  ScalarA alpha = 1.0;
+  ScalarA beta  = 0.0;
+
+  KokkosBlas::gemv("N", alpha, subview(h_A,Kokkos::ALL(),Kokkos::make_pair(0, mycols)),
+                               subview(temp22,Kokkos::make_pair(myfirstcol - 1, myfirstcol - 1 + mycols)),
+                         beta, subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)));
+
+  MPI_Allreduce(tempp.data(), temp3.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
+
+  if( rank == 0) {
+    std::cout <<  "======================================" << std::endl;
+    std::cout << " ---- Error Calculation ----" << std::endl;
+
+    ScalarA alpha_ = -1.0;
+
+    KokkosBlas::axpy(alpha_,rhs,temp3);//temp3=temp3-rhs
+
+    m_nrm = KokkosBlas::nrm2(temp3);
+  }
+
+  // Machine epsilon Calculation
+
+  othird = four_thirds - 1.;
+
+  tempc = othird + othird + othird;
+
+  eps = fabs(tempc-1.0);
+
+  if ( rank == 0 ) {
+	std::cout << "   Machine eps  " << eps  << std::endl;
+  }
+
+  if ( rank == 0 ) {
+
+    std::cout << "   ||Ax - b||_2 = " << m_nrm << std::endl;
+
+    std::cout << "   ||b||_2 = " << rhs_nrm << std::endl;
+
+    std::cout << "   ||Ax - b||_2 / ||b||_2  = " << m_nrm/rhs_nrm  << std::endl;
+
+    std::cout << "   Threshold = " << eps*1e4  << std::endl;
+
+    if ( m_nrm/rhs_nrm  > (eps*1e4)) {
+      std::cout << " ****    Solution Fails   ****" <<  std::endl;
+      result = 1;
+    }
+    else {
+      std::cout << " ****   Solution Passes   ****" << std::endl;
+      result = 0;
+    }
+    std::cout <<  "======================================" << std::endl;
+  }
+
+  MPI_Bcast(&result, 1, MPI_INT, 0, MPI_COMM_WORLD);
+
+  }
+  Kokkos::finalize();
+
+  MPI_Finalize() ;
+
+  return (result);
+}

From 6f22769ae362a168bc12c547d7b1844c2b3e960f Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Tue, 19 Apr 2022 00:11:04 -0600
Subject: [PATCH 012/130] Separate Z and RHS in the input arguments of
 back_solve6

---
 packages/adelus/src/Adelus.hpp           |  7 ++-
 packages/adelus/src/Adelus_solve.hpp     | 55 ++++++++++++------------
 packages/adelus/src/Adelus_x_solve.hpp   | 20 +++++----
 packages/adelus/src/Adelus_xlu_solve.hpp | 20 +++++----
 4 files changed, 55 insertions(+), 47 deletions(-)

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index 2c1fe4dcefc2..66ac927db29a 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -175,7 +175,8 @@ namespace Adelus {
   /// Adelus Solve
   /// Solves the previously factored dense matrix for provided RHS 
 
-  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
+  /// \param AA (In)          -- Kokkos View that has the LU-factorized matrix
+  /// \param BB (InOut)       -- Kokkos View that has the rhs and solution (Note: rhs are overwritten)
   /// \param permute (In)     -- Kokkos View that has the global pivot vector
   /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
   /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
@@ -183,9 +184,10 @@ namespace Adelus {
   /// \param num_procsr (In)  -- number of processors for a row
   /// \param secs (Out)       -- factor and solve time in seconds
 
-  template<class ZDView, class IDView>
+  template<class ZDView, class BDView, class IDView>
   inline
   void Solve( ZDView AA,
+              BDView BB,
               IDView permute,
               int my_rows_,
               int my_cols_,
@@ -202,6 +204,7 @@ namespace Adelus {
 #endif
 
     solve_(AA,
+           BB,
            permute,
            num_rhs,
            secs);
diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index b23ccdcaec5d..df691db93812 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -89,10 +89,10 @@ extern MPI_Comm col_comm;
 namespace Adelus {
 
 //  Customized elimination on the rhs that I own	
-template<class ZDView, class RView>
-void elimination_rhs(int N, ZDView& ptr3, ZDView& ptr2, RView& ptr4, int act_col) {
+template<class ZView, class RHSView, class DView>
+void elimination_rhs(int N, ZView& ptr2, RHSView& ptr3, DView& ptr4, int act_col) {
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
-  Kokkos::parallel_for(Kokkos::RangePolicy<typename ZDView::device_type::execution_space>(0,N), KOKKOS_LAMBDA (const int i) {
+  Kokkos::parallel_for(Kokkos::RangePolicy<typename ZView::device_type::execution_space>(0,N), KOKKOS_LAMBDA (const int i) {
     ptr4(0,i) = ptr3(i)/ptr2(act_col);
     ptr3(i)   = ptr4(0,i);
   });
@@ -104,22 +104,22 @@ void elimination_rhs(int N, ZDView& ptr3, ZDView& ptr2, RView& ptr4, int act_col
 #endif
 }
 
-template<class ZDView>
+template<class ZViewType, class RHSViewType>
 inline
-void back_solve6(ZDView& ZV)
+void back_solve6(ZViewType& Z, RHSViewType& RHS)
 {
-  typedef typename ZDView::value_type value_type;
+  using value_type      = typename ZViewType::value_type;
 #ifdef PRINT_STATUS
-  typedef typename ZDView::device_type::execution_space execution_space;
+  using execution_space = typename ZViewType::device_type::execution_space;
 #endif
-  typedef typename ZDView::device_type::memory_space memory_space;
-  typedef Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space> ViewMatrixType;
+  using memory_space    = typename ZViewType::device_type::memory_space;
+  using View2DType      = Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space>;
 
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)
 #if defined(KOKKOS_ENABLE_CUDA)
-  typedef Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::CudaHostPinnedSpace> View2DHostPinnType;//CudaHostPinnedSpace
+  using View2DHostPinnType = Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::CudaHostPinnedSpace>;//CudaHostPinnedSpace
 #elif defined(KOKKOS_ENABLE_HIP)
-  typedef Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::Experimental::HIPHostPinnedSpace> View2DHostPinnType;//HIPHostPinnedSpace
+  using View2DHostPinnType = Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::Experimental::HIPHostPinnedSpace>;//HIPHostPinnedSpace
 #endif
 #endif
 
@@ -192,11 +192,11 @@ void back_solve6(ZDView& ZV)
   t1 = MPI_Wtime();
 #endif
 
-  ViewMatrixType row1( "row1", one, nrhs );   // row1: diagonal row (temp variables)
+  View2DType row1( "row1", one, nrhs );   // row1: diagonal row (temp variables)
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
   View2DHostPinnType h_row2( "h_row2", my_rows, max_bytes/sizeof(ADELUS_DATA_TYPE)/my_rows );
 #else
-  ViewMatrixType row2( "row2", my_rows, max_bytes/sizeof(ADELUS_DATA_TYPE)/my_rows );
+  View2DType row2( "row2", my_rows, max_bytes/sizeof(ADELUS_DATA_TYPE)/my_rows );
 #endif
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
   View2DHostPinnType h_row1( "h_row1", one, nrhs );
@@ -238,7 +238,7 @@ void back_solve6(ZDView& ZV)
                  
         // do an elimination step on the rhs that I own
 
-        //auto ptr2_view = subview(ZV, end_row-1, Kokkos::ALL());
+        //auto ptr2_view = subview(Z, end_row-1, Kokkos::ALL());
 
         root = row_owner(global_col);
 
@@ -246,9 +246,9 @@ void back_solve6(ZDView& ZV)
 #ifdef GET_TIMING
           t1 = MPI_Wtime();
 #endif
-          auto ptr2_view = subview(ZV, end_row-1, Kokkos::ALL());
-          auto ptr3_view = subview(ZV, end_row-1, Kokkos::make_pair(my_cols, my_cols+n_rhs_this));
-          elimination_rhs(n_rhs_this, ptr3_view, ptr2_view, row1, act_col);//note: row1 = ptr4
+          auto ptr2_view = subview(Z,   end_row-1, Kokkos::ALL());
+          auto ptr3_view = subview(RHS, end_row-1, Kokkos::make_pair(0, n_rhs_this));
+          elimination_rhs(n_rhs_this, ptr2_view, ptr3_view, row1, act_col);//note: row1 = ptr4
           end_row--;
 #ifdef GET_TIMING
           eliminaterhstime += (MPI_Wtime()-t1);
@@ -298,8 +298,8 @@ void back_solve6(ZDView& ZV)
         t1 = MPI_Wtime();
 #endif
 
-        auto A_view = subview(ZV, Kokkos::make_pair(0, end_row), Kokkos::make_pair(act_col, act_col+one));
-        auto C_view = subview(ZV, Kokkos::make_pair(0, end_row), Kokkos::make_pair(my_cols, my_cols+n_rhs_this));
+        auto A_view = subview(Z,    Kokkos::make_pair(0, end_row), Kokkos::make_pair(act_col, act_col+one));
+        auto C_view = subview(RHS,  Kokkos::make_pair(0, end_row), Kokkos::make_pair(0, n_rhs_this));
         auto B_view = subview(row1, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this));
 
         KokkosBlas::gemm("N","N",d_min_one,
@@ -332,7 +332,8 @@ void back_solve6(ZDView& ZV)
         n_rhs_this = bytes[0]/sizeof(ADELUS_DATA_TYPE)/my_rows;
 
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        Kokkos::deep_copy(subview(h_rhs, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)), subview(ZV, Kokkos::ALL(), Kokkos::make_pair(my_cols, my_cols+n_rhs_this)));
+        Kokkos::deep_copy(subview(h_rhs, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)), 
+                          subview(RHS,   Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)));
 #endif
 
         dest[1]  = dest_left;
@@ -342,7 +343,7 @@ void back_solve6(ZDView& ZV)
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
         MPI_Send(reinterpret_cast<char *>(h_rhs.data()), bytes[1], MPI_CHAR, dest[1], type[1], MPI_COMM_WORLD);
 #else //GPU-aware MPI
-        MPI_Send(reinterpret_cast<char *>(ZV.data()+my_rows*my_cols), bytes[1], MPI_CHAR, dest[1], type[1], MPI_COMM_WORLD);
+        MPI_Send(reinterpret_cast<char *>(RHS.data()), bytes[1], MPI_CHAR, dest[1], type[1], MPI_COMM_WORLD);
 #endif
 
         MPI_Wait(&msgrequest,&msgstatus);
@@ -351,18 +352,18 @@ void back_solve6(ZDView& ZV)
         int blas_length = n_rhs_this*my_rows;
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)) //Use memcpy for now, can use deep_copy in the future //deep_copy is slower than BLAS XCOPY
 #if defined(KOKKOS_ENABLE_CUDA)
-        //Kokkos::deep_copy(subview(ZV, Kokkos::ALL(), Kokkos::make_pair(my_cols, my_cols+n_rhs_this)), subview(h_row2, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)));
-        cudaMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(ZV.data()+my_rows*my_cols), reinterpret_cast<ADELUS_DATA_TYPE *>(h_row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), cudaMemcpyHostToDevice);
+        //Kokkos::deep_copy(subview(RHS, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)), subview(h_row2, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)));
+        cudaMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(h_row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), cudaMemcpyHostToDevice);
 #elif defined(KOKKOS_ENABLE_HIP)
-        hipMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(ZV.data()+my_rows*my_cols), reinterpret_cast<ADELUS_DATA_TYPE *>(h_row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), hipMemcpyHostToDevice);
+        hipMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(h_row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), hipMemcpyHostToDevice);
 #endif
 #else
 #if defined(KOKKOS_ENABLE_CUDA)
-        cudaMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(ZV.data()+my_rows*my_cols), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), cudaMemcpyDeviceToDevice);
+        cudaMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), cudaMemcpyDeviceToDevice);
 #elif defined(KOKKOS_ENABLE_HIP)
-        hipMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(ZV.data()+my_rows*my_cols), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), hipMemcpyDeviceToDevice);
+        hipMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), hipMemcpyDeviceToDevice);
 #else
-        memcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(ZV.data()+my_rows*my_cols), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE));
+        memcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE));
 #endif
 #endif
       }
diff --git a/packages/adelus/src/Adelus_x_solve.hpp b/packages/adelus/src/Adelus_x_solve.hpp
index f87da88a60b3..116531733b8d 100644
--- a/packages/adelus/src/Adelus_x_solve.hpp
+++ b/packages/adelus/src/Adelus_x_solve.hpp
@@ -69,9 +69,9 @@
 
 namespace Adelus {
 
-template<class ZViewType, class PViewType>
+template<class ZViewType, class RHSViewType, class PViewType>
 inline
-void solve_(ZViewType& ZRHS, PViewType& permute, int *num_rhs, double *secs)
+void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
@@ -101,9 +101,11 @@ void solve_(ZViewType& ZRHS, PViewType& permute, int *num_rhs, double *secs)
     
     //NOTE: Currently doing RHS permute and forward solve in host memory and for a single RHS
     //TODO: do these in device memory
-    typename ZViewType::HostMirror h_Z = Kokkos::create_mirror_view( ZRHS );
-    Kokkos::deep_copy (h_Z, ZRHS);
-    auto h_RHS = subview(h_Z, Kokkos::ALL(), Kokkos::make_pair(my_cols, my_cols + my_rhs + 6));
+    typename ZViewType::HostMirror h_Z = Kokkos::create_mirror_view( Z );
+    typename RHSViewType::HostMirror h_RHS = Kokkos::create_mirror_view( RHS );
+    // Bring data to host memory
+    Kokkos::deep_copy (h_Z, Z);
+    Kokkos::deep_copy (h_RHS, RHS);
 
 #ifdef ADELUS_HAVE_TIME_MONITOR
     {
@@ -125,7 +127,9 @@ void solve_(ZViewType& ZRHS, PViewType& permute, int *num_rhs, double *secs)
     }
 #endif
 
-    Kokkos::deep_copy (ZRHS, h_Z);//bring back to device memory
+    // Copy back to device memory
+    Kokkos::deep_copy (Z,   h_Z);  
+    Kokkos::deep_copy (RHS, h_RHS);
 
     MPI_Barrier(MPI_COMM_WORLD);
 
@@ -133,8 +137,7 @@ void solve_(ZViewType& ZRHS, PViewType& permute, int *num_rhs, double *secs)
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: backsolve"));
 #endif
-      //TODO: Need to separate Z and RHS in the input argument of back_solve6()
-      back_solve6(ZRHS);
+      back_solve6(Z, RHS);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
@@ -145,7 +148,6 @@ void solve_(ZViewType& ZRHS, PViewType& permute, int *num_rhs, double *secs)
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: permutation"));
 #endif
-      auto RHS = subview(ZRHS, Kokkos::ALL(), Kokkos::make_pair(my_cols, my_cols + my_rhs + 6));
       perm1_(RHS, &my_rhs);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
diff --git a/packages/adelus/src/Adelus_xlu_solve.hpp b/packages/adelus/src/Adelus_xlu_solve.hpp
index 32151d3a77af..b7d864848ef6 100644
--- a/packages/adelus/src/Adelus_xlu_solve.hpp
+++ b/packages/adelus/src/Adelus_xlu_solve.hpp
@@ -68,19 +68,19 @@
 
 namespace Adelus {
 
-template<class ZDView>
+template<class ZRHSViewType>
 inline
-void lusolve_(ZDView& ZV, int *matrix_size, int *num_procsr, int *num_rhs, double *secs)
+void lusolve_(ZRHSViewType& ZRHS, int *matrix_size, int *num_procsr, int *num_rhs, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
 #endif
 
-  using value_type      = typename ZDView::value_type;
+  using value_type      = typename ZRHSViewType::value_type;
 #ifdef PRINT_STATUS
-  using execution_space = typename ZDView::device_type::execution_space;
+  using execution_space = typename ZRHSViewType::device_type::execution_space;
 #endif
-  using memory_space    = typename ZDView::device_type::memory_space;
+  using memory_space    = typename ZRHSViewType::device_type::memory_space;
 
   double run_secs;              // time (in secs) during which the prog ran
   double tsecs;                 // intermediate storage of timing info
@@ -161,7 +161,7 @@ void lusolve_(ZDView& ZV, int *matrix_size, int *num_procsr, int *num_rhs, doubl
   {
     TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: factor"));
 #endif
-    factor(ZV,
+    factor(ZRHS,
            col1_view,
            row1_view,
            row2_view, 
@@ -172,6 +172,9 @@ void lusolve_(ZDView& ZV, int *matrix_size, int *num_procsr, int *num_rhs, doubl
 #endif
 
   if (nrhs > 0) {
+    auto Z   = subview(ZRHS, Kokkos::ALL(), Kokkos::make_pair(0, my_cols));
+    auto RHS = subview(ZRHS, Kokkos::ALL(), Kokkos::make_pair(my_cols, my_cols + my_rhs + 6));
+
     // Perform the backsolve
 
 #ifdef PRINT_STATUS
@@ -181,7 +184,7 @@ void lusolve_(ZDView& ZV, int *matrix_size, int *num_procsr, int *num_rhs, doubl
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: backsolve"));
 #endif
-      back_solve6(ZV);
+      back_solve6(Z, RHS);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
@@ -195,8 +198,7 @@ void lusolve_(ZDView& ZV, int *matrix_size, int *num_procsr, int *num_rhs, doubl
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: permutation"));
 #endif
-      auto sub_ZV = subview(ZV, Kokkos::ALL(), Kokkos::make_pair(my_cols, my_cols + my_rhs + 6));
-      perm1_(sub_ZV, &my_rhs);
+      perm1_(RHS, &my_rhs);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif

From 43b6601a59785209fc4805092d18fc0d2f9f49ce Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Tue, 19 Apr 2022 00:26:59 -0600
Subject: [PATCH 013/130] Increase test problem size

---
 packages/adelus/test/definition                |  8 ++++----
 .../adelus/test/vector_random/CMakeLists.txt   |  8 ++++----
 .../test/vector_random_fs/CMakeLists.txt       |  8 ++++----
 .../adelus/test/vector_random_fs/cxx_main.cpp  | 18 ++++++++++--------
 4 files changed, 22 insertions(+), 20 deletions(-)

diff --git a/packages/adelus/test/definition b/packages/adelus/test/definition
index fc78f641fdcc..acfeeeda2a27 100644
--- a/packages/adelus/test/definition
+++ b/packages/adelus/test/definition
@@ -6,25 +6,25 @@ PACKAGE_NAME=Adelus
 
 (FRAMEWORK, INSTALL) {
     DIRS = vector_random;
-    ARGS = 1000 1;
+    ARGS = 3500 1;
     COMM = MPI(1 2 3);
 }
 
 (FRAMEWORK, INSTALL) {
     DIRS = vector_random;
-    ARGS = 1000 2;
+    ARGS = 3500 2;
     COMM = MPI(4);
 }
 
 (FRAMEWORK, INSTALL) {
     DIRS = vector_random_fs;
-    ARGS = 1000 1;
+    ARGS = 3500 1;
     COMM = MPI(1 2 3);
 }
 
 (FRAMEWORK, INSTALL) {
     DIRS = vector_random_fs;
-    ARGS = 1000 2;
+    ARGS = 3500 2;
     COMM = MPI(4);
 }
 
diff --git a/packages/adelus/test/vector_random/CMakeLists.txt b/packages/adelus/test/vector_random/CMakeLists.txt
index 2d12bfcf5cea..c53b4d5234e4 100644
--- a/packages/adelus/test/vector_random/CMakeLists.txt
+++ b/packages/adelus/test/vector_random/CMakeLists.txt
@@ -3,27 +3,27 @@ TRIBITS_ADD_EXECUTABLE_AND_TEST(
   vector_random
   SOURCES cxx_main.cpp
   NUM_MPI_PROCS 1
-  ARGS "1000 1 1"
+  ARGS "3500 1 1"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random
   NUM_MPI_PROCS 2
-  ARGS "1000 1 2"
+  ARGS "3500 1 2"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random
   NUM_MPI_PROCS 3
-  ARGS "1000 1 3"
+  ARGS "3500 1 3"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random
   NUM_MPI_PROCS 4
-  ARGS "1000 2 4"
+  ARGS "3500 2 4"
   COMM mpi
   )
diff --git a/packages/adelus/test/vector_random_fs/CMakeLists.txt b/packages/adelus/test/vector_random_fs/CMakeLists.txt
index 9686f7467f51..8cedda048b2b 100644
--- a/packages/adelus/test/vector_random_fs/CMakeLists.txt
+++ b/packages/adelus/test/vector_random_fs/CMakeLists.txt
@@ -3,27 +3,27 @@ TRIBITS_ADD_EXECUTABLE_AND_TEST(
   vector_random_fs
   SOURCES cxx_main.cpp
   NUM_MPI_PROCS 1
-  ARGS "1000 1 1"
+  ARGS "3500 1 1"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random_fs
   NUM_MPI_PROCS 2
-  ARGS "1000 1 2"
+  ARGS "3500 1 2"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random_fs
   NUM_MPI_PROCS 3
-  ARGS "1000 1 3"
+  ARGS "3500 1 3"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random_fs
   NUM_MPI_PROCS 4
-  ARGS "1000 2 4"
+  ARGS "3500 2 4"
   COMM mpi
   )
diff --git a/packages/adelus/test/vector_random_fs/cxx_main.cpp b/packages/adelus/test/vector_random_fs/cxx_main.cpp
index 6b00c5f0f728..955b9c5f1f08 100644
--- a/packages/adelus/test/vector_random_fs/cxx_main.cpp
+++ b/packages/adelus/test/vector_random_fs/cxx_main.cpp
@@ -268,9 +268,11 @@ int main(int argc, char *argv[])
 
   printf("Rank %d, ViewMatrixType execution_space %s, memory_space %s, value_type %s\n",rank, typeid(execution_space).name(), typeid(memory_space).name(), typeid(ScalarA).name());
 
-  ViewMatrixType A( "A", myrows, mycols + myrhs + 6 );
+  ViewMatrixType A( "A", myrows, mycols );
+  ViewMatrixType B( "B", myrows, myrhs + 6 );
 
   ViewMatrixType::HostMirror h_A = Kokkos::create_mirror( A );
+  ViewMatrixType::HostMirror h_B = Kokkos::create_mirror( B );
 
   // Some temp arrays
 
@@ -324,7 +326,7 @@ int main(int argc, char *argv[])
   // Now put the RHS in the appropriate position
 
   if( myrhs > 0 ) {
-    Kokkos::deep_copy( subview(h_A,Kokkos::ALL(),mycols), temp2 );
+    Kokkos::deep_copy( subview(h_B,Kokkos::ALL(),0), temp2 );
     Kokkos::deep_copy( subview(rhs,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), temp2 );
   }
 
@@ -338,7 +340,7 @@ int main(int argc, char *argv[])
 
   rhs_nrm = KokkosBlas::nrm2(rhs);
 
-  Kokkos::deep_copy( subview(A,Kokkos::ALL(),mycols), subview(h_A,Kokkos::ALL(),mycols) );
+  Kokkos::deep_copy( B, h_B );
 
   // Now Factor the matrix
 
@@ -360,31 +362,31 @@ int main(int argc, char *argv[])
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve (1st)   ****" << std::endl;
 
-  Adelus::Solve (A, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::Solve (A, B, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
 
   if( rank == 0)
     std::cout << " ----  Solution time (1st)  ----   " << secs << "  in secs. " << std::endl;
 
   // Restore the orig. RHS for testing Adelus::Solve() on a pre-computed LU factorization
-  Kokkos::deep_copy( subview(A,Kokkos::ALL(),mycols), subview(h_A,Kokkos::ALL(),mycols) );
+  Kokkos::deep_copy( B, h_B );
 
   // Call Solve (2nd time)
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve (2nd)   ****" << std::endl;
 
-  Adelus::Solve (A, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::Solve (A, B, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
 
   if( rank == 0)
     std::cout << " ----  Solution time (2nd)  ----   " << secs << "  in secs. " << std::endl;
 
   // Now Check the Solution
 
-  Kokkos::deep_copy( subview(h_A,Kokkos::ALL(),mycols), subview(A,Kokkos::ALL(),mycols) );
+  Kokkos::deep_copy( h_B, B );
 
   // Pack the Answer into the apropriate position
 
   if ( myrhs > 0) {
-    Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), subview(h_A,Kokkos::ALL(),mycols) );
+    Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), subview(h_B, Kokkos::ALL(), 0) );
   }
 
   // All processors get the answer

From 078401d55389ce4df6ba8a3a2fa2e87dcaccac72 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sat, 4 Jun 2022 21:04:19 -0700
Subject: [PATCH 014/130] Forward solve with mutiple RHS and GPU

---
 packages/adelus/src/Adelus_forward.hpp  | 82 ++++++++++----------
 packages/adelus/src/Adelus_perm_rhs.hpp | 99 ++++++++++++++++++-------
 packages/adelus/src/Adelus_x_solve.hpp  | 22 ++++--
 3 files changed, 132 insertions(+), 71 deletions(-)

diff --git a/packages/adelus/src/Adelus_forward.hpp b/packages/adelus/src/Adelus_forward.hpp
index 7a8fbc094b01..6b8a7a4e5a30 100644
--- a/packages/adelus/src/Adelus_forward.hpp
+++ b/packages/adelus/src/Adelus_forward.hpp
@@ -56,36 +56,32 @@
 #include "Adelus_pcomm.hpp"
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
+#include "KokkosBlas3_gemm.hpp"
 
 namespace Adelus {
 
-template<class ZView, class RHSView>
+template<class ZViewType, class RHSViewType>
 inline
-void forward(ZView& Z, RHSView& RHS)
+void forward(ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
 {
-  //NOTE: Currently assume that Z and RHS reside in host memory, and 
-  //                            there is only a single RHS vector
-  using value_type = typename ZView::value_type ;
-#ifdef PRINT_STATUS
-  using execution_space = typename ZView::device_type::execution_space ;
-  using memory_space    = typename ZView::device_type::memory_space ;
-#endif
-  using ViewVectorType  =  Kokkos::View<value_type*, Kokkos::LayoutLeft, Kokkos::HostSpace>;
+  //TODO: add host pinned memory support
+  using value_type      = typename ZViewType::value_type ;
+  using execution_space = typename ZViewType::device_type::execution_space ;
+  using memory_space    = typename ZViewType::device_type::memory_space ;
+  using ViewMatrixType  =  Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space>;
 
-  int rhs_col;     // torus-wrap column containing the rhs
   int k_row;       // torus-wrap row corresponding to kth global row
   int k_col;       // torus-wrap column corresponding to kth global col
   int istart;      // Starting row index for pivot column
   int count_row;   // dummy index
+  value_type d_one     = static_cast<value_type>( 1.0);
+  value_type d_min_one = static_cast<value_type>(-1.0);
 
-  value_type ck;   // rhs corresponding to current column of the backsubstitution
-  ViewVectorType piv_col( "piv_col", my_rows ); // portion of pivot column I am sending
-
-  MPI_Request msgrequest;
-  MPI_Status msgstatus;
+  ViewMatrixType piv_col( "piv_col", my_rows, 1 ); // portion of pivot column I am sending
+  ViewMatrixType ck( "ck", 1, RHS.extent(1) ); // rhs corresponding to current column of the backsubstitution
 
 #ifdef PRINT_STATUS
-  printf("Rank %i -- forward() Begin forward solve with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- forward() Begin forward solve with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, my_num_rhs %d, value_type %s, execution_space %s, memory_space %s\n", me, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, my_num_rhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 
 #ifdef GET_TIMING
@@ -93,35 +89,43 @@ void forward(ZView& Z, RHSView& RHS)
   t1 = MPI_Wtime();
 #endif
 
-  // Perform the Forward Substitution:
-  rhs_col = 0;
+  // Perform the Forward Substitution
   for (int k=0; k<= nrows_matrix-2; k++) {
     k_row=k%nprocs_col;
     k_col=k%nprocs_row;
     istart = (k+1-myrow)/nprocs_col;
     if (istart * nprocs_col < k+1-myrow) istart++;
-    count_row = 0;
-    for (int i=istart;i<=my_rows-1;i++) {
-      piv_col(count_row)=Z(i,k/nprocs_row);
-      count_row++;
-    }
-    if (mycol == rhs_col && myrow == k_row) ck = RHS(k/nprocs_col,0);
-    if (mycol == rhs_col) {
-      MPI_Irecv(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, 0, row_comm, &msgrequest);
-    }
-    if (mycol == k_col) {
-      MPI_Send(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, rhs_col, 0, row_comm);
-    }
-    if (mycol == rhs_col) {
-      MPI_Wait(&msgrequest,&msgstatus);
+
+    if (istart < my_rows) {  
+      Kokkos::deep_copy( subview(piv_col, Kokkos::make_pair(0, my_rows - istart), 0), 
+                         subview(Z, Kokkos::make_pair(istart, my_rows), k/nprocs_row) );
     }
-    if (mycol == rhs_col) {
-      MPI_Bcast((char *)(&ck),sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_row,col_comm);
-      count_row=0;
+    count_row = my_rows - istart;
+
+    //Note: replace MPI_Send/MPI_Irecv with MPI_Bcast
+    //      Rank k_col broadcasts the pivot_col to all
+    //      other ranks in the row_comm
+    MPI_Bcast(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, row_comm);
 
-      for (int i=istart;i<=my_rows-1;i++) {
-        RHS(i,0) = RHS(i,0) - piv_col(count_row) * ck;
-        count_row++;
+    if (my_num_rhs > 0) {
+      //ck = RHS(k/nprocs_col,0);
+      //MPI_Bcast((char *)(&ck),sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_row,col_comm);
+      //count_row=0;
+      //printf("Point 2: k %d, istart %d, my_rows %d\n", k, istart, my_rows);
+      //for (int i=istart;i<=my_rows-1;i++) {
+      //  RHS(i,0) = RHS(i,0) - piv_col(count_row) * ck;
+      //  count_row++;
+      //}
+      int curr_lrid = k/nprocs_col;//note: nprocs_col (global var) cannot be read in a device function 
+      Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
+        ck(0,i) = RHS(curr_lrid,i);
+      });
+      Kokkos::fence();
+      MPI_Bcast(reinterpret_cast<char *>(ck.data()), RHS.extent(1)*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_row, col_comm);
+      auto sub_pivot_col = subview(piv_col, Kokkos::make_pair(0, my_rows - istart), Kokkos::ALL());
+      auto sub_rhs       = subview(RHS, Kokkos::make_pair(istart, my_rows), Kokkos::ALL());
+      if (istart < my_rows) {
+        KokkosBlas::gemm("N", "N", d_min_one, sub_pivot_col, ck, d_one, sub_rhs);
       }
     }
     MPI_Barrier(MPI_COMM_WORLD);
diff --git a/packages/adelus/src/Adelus_perm_rhs.hpp b/packages/adelus/src/Adelus_perm_rhs.hpp
index 0eaed240ad72..060e6e5791b8 100644
--- a/packages/adelus/src/Adelus_perm_rhs.hpp
+++ b/packages/adelus/src/Adelus_perm_rhs.hpp
@@ -56,7 +56,7 @@
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
 
-//extern int me;	               // processor id information
+//extern int me;                 // processor id information
 //extern int nprocs_row;         // num of procs to which a row is assigned
 //extern int nprocs_col;         // num of procs to which a col is assigned
 //extern int nrows_matrix;       // number of rows in the matrix
@@ -72,14 +72,28 @@ namespace Adelus {
   
   template<class ZViewType, class PViewType>
   inline
-  void permute_rhs(ZViewType& RHS, PViewType& permute) {
-    //NOTE: Currently assume that a single RHS resides in host memory
-    using value_type  = typename ZViewType::value_type;
+  void permute_rhs(ZViewType& RHS, PViewType& permute, int& my_num_rhs) {
+    using value_type      = typename ZViewType::value_type;
+    using execution_space = typename ZViewType::device_type::execution_space ;
+    using memory_space    = typename ZViewType::device_type::memory_space ;
+    using ViewVectorType  = Kokkos::View<value_type*, Kokkos::LayoutLeft, memory_space>;
+  
+    int pivot_row, k_row;
+    ViewVectorType tmpr( "tmpr", RHS.extent(1) );
+    ViewVectorType tmps( "tmps", RHS.extent(1) );
 
     MPI_Status msgstatus;
-  
-    int pivot_row, k_row, rhs_col;
-    value_type tmpr, tmps;
+
+    //TODO: add host pinned memory support
+
+    //TODO: try this later
+    //MPI_Datatype strided_vec_type;
+    //int strided_vec_nblocks  = RHS.extent(1);
+    //int strided_vec_blocklen = 1;
+    //int strided_vec_stride   = RHS.extent(0);
+    //MPI_Type_vector( strided_vec_nblocks, strided_vec_blocklen, strided_vec_stride,
+    //                 ADELUS_MPI_DATA_TYPE, &strided_vec_type);
+    //MPI_Type_commit(&strided_vec_type);
 
 #ifdef GET_TIMING
    double permuterhstime,t1;
@@ -87,32 +101,63 @@ namespace Adelus {
    t1 = MPI_Wtime();
 #endif
 
-    rhs_col = 0;
     for (int k=0;k<=nrows_matrix-2;k++) {
       k_row=k%nprocs_col;
-      if (mycol == rhs_col) {
-        if (myrow==k_row)
-          pivot_row=permute(k/nprocs_col);
+
+      if (my_num_rhs > 0) {
+        if (myrow==k_row) pivot_row = permute(k/nprocs_col);
         MPI_Bcast(&pivot_row,1,MPI_INT,k_row,col_comm);
+        int pivot_row_pid = pivot_row%nprocs_col;
+
         if (k != pivot_row) {
-          if (myrow == k_row) {
-            tmps = RHS(k/nprocs_col,0);
-            MPI_Send((char *)(&tmps),sizeof(value_type),MPI_CHAR,pivot_row%nprocs_col,2,col_comm);
-          }
-          if (myrow == pivot_row%nprocs_col) {
-            tmps = RHS(pivot_row/nprocs_col,0);
-            MPI_Send((char *)(&tmps),sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
-          }
-          if (myrow == k_row) {
-            MPI_Recv((char *)(&tmpr),sizeof(value_type),MPI_CHAR,pivot_row%nprocs_col,3,col_comm,&msgstatus);
-            RHS(k/nprocs_col,0) = tmpr;
-          }
-          if (myrow == pivot_row%nprocs_col) {
-            MPI_Recv((char *)(&tmpr),sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
-            RHS(pivot_row/nprocs_col,0)  = tmpr;
+          if (k_row == pivot_row_pid) {//pivot row is in the same rank
+            if (myrow == k_row) {
+              int curr_lrid = k/nprocs_col;
+              int piv_lrid  = pivot_row/nprocs_col;
+              Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
+                value_type tmp   = RHS(curr_lrid,i);
+                RHS(curr_lrid,i) = RHS(piv_lrid,i);
+                RHS(piv_lrid,i)  = tmp;
+              });
+              Kokkos::fence();
+            }
           }
+          else {//pivot row is is a different rank
+            if (myrow == k_row) {
+              int curr_lrid = k/nprocs_col;
+              Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
+                tmps(i) = RHS(curr_lrid,i);
+              });
+              Kokkos::fence();
+
+              MPI_Send(reinterpret_cast<char *>(tmps.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,pivot_row_pid,2,col_comm);
+              MPI_Recv(reinterpret_cast<char *>(tmpr.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,pivot_row_pid,3,col_comm,&msgstatus);
+
+              Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
+                RHS(curr_lrid,i) = tmpr(i);
+              });
+              Kokkos::fence();
+            }
+            if (myrow == pivot_row_pid) {
+              int piv_lrid = pivot_row/nprocs_col;
+              Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
+                tmps(i) = RHS(piv_lrid,i);
+              });
+              Kokkos::fence();
+
+              MPI_Recv(reinterpret_cast<char *>(tmpr.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
+              MPI_Send(reinterpret_cast<char *>(tmps.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
+
+              Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
+                RHS(piv_lrid,i) = tmpr(i);
+              });
+              Kokkos::fence();
+            }
+          }//End of pivot row is is a different rank
         }// End of if (k != pivot_row)
-      }
+
+      }// End of if (my_num_rhs > 0)
+
     }// End of for (k=0;k<=nrows_matrix-2;k++)
 
 #ifdef GET_TIMING
diff --git a/packages/adelus/src/Adelus_x_solve.hpp b/packages/adelus/src/Adelus_x_solve.hpp
index 116531733b8d..156f8351caaf 100644
--- a/packages/adelus/src/Adelus_x_solve.hpp
+++ b/packages/adelus/src/Adelus_x_solve.hpp
@@ -67,6 +67,8 @@
 #include "Teuchos_TimeMonitor.hpp"
 #endif
 
+//#define ADELUS_FORWARD_COPY_TO_HOST //NOTE: for perf comparison only
+
 namespace Adelus {
 
 template<class ZViewType, class RHSViewType, class PViewType>
@@ -99,20 +101,24 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
   {
     tsecs = get_seconds(0.0);
     
-    //NOTE: Currently doing RHS permute and forward solve in host memory and for a single RHS
-    //TODO: do these in device memory
+#ifdef ADELUS_FORWARD_COPY_TO_HOST
     typename ZViewType::HostMirror h_Z = Kokkos::create_mirror_view( Z );
     typename RHSViewType::HostMirror h_RHS = Kokkos::create_mirror_view( RHS );
     // Bring data to host memory
     Kokkos::deep_copy (h_Z, Z);
     Kokkos::deep_copy (h_RHS, RHS);
+#endif
 
 #ifdef ADELUS_HAVE_TIME_MONITOR
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: rhs permutation"));
 #endif
-      // Permute the RHS  
-      permute_rhs(h_RHS, permute);
+      // Permute the RHS
+#ifdef ADELUS_FORWARD_COPY_TO_HOST
+      permute_rhs(h_RHS, permute, my_rhs);
+#else
+      permute_rhs(RHS, permute, my_rhs);
+#endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
@@ -122,14 +128,20 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: forward solve"));
 #endif
       //Forward Solve
-      forward(h_Z, h_RHS);
+#ifdef ADELUS_FORWARD_COPY_TO_HOST
+      forward(h_Z, h_RHS, my_rhs);
+#else
+      forward(Z, RHS, my_rhs);
+#endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
 
+#ifdef ADELUS_FORWARD_COPY_TO_HOST
     // Copy back to device memory
     Kokkos::deep_copy (Z,   h_Z);  
     Kokkos::deep_copy (RHS, h_RHS);
+#endif
 
     MPI_Barrier(MPI_COMM_WORLD);
 

From 90d36f3e5402d8de9e01114e78ff637b24e2b596 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Fri, 10 Jun 2022 01:11:07 -0700
Subject: [PATCH 015/130] Permute matrix with GPU

---
 packages/adelus/src/Adelus_defines.h    |   2 +
 packages/adelus/src/Adelus_perm_mat.hpp | 111 +++++++++++++++++++++---
 packages/adelus/src/Adelus_x_factor.hpp |   5 +-
 packages/adelus/src/Adelus_x_solve.hpp  |  10 +--
 4 files changed, 111 insertions(+), 17 deletions(-)

diff --git a/packages/adelus/src/Adelus_defines.h b/packages/adelus/src/Adelus_defines.h
index 1b307a10ce70..ca78fdcf0ecd 100644
--- a/packages/adelus/src/Adelus_defines.h
+++ b/packages/adelus/src/Adelus_defines.h
@@ -53,6 +53,8 @@
 #undef DEBUG
 #define OVERLAP
 
+//#define ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST //NOTE: for perf comparison only
+
 //  ------------------ Define Data Types --------------------------
 //  ------------------ Define Constants and Operations ------------
 #ifdef SREAL
diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
index 4cd8848e3760..6fb814acad82 100644
--- a/packages/adelus/src/Adelus_perm_mat.hpp
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -56,7 +56,7 @@
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
 
-//extern int me;	               // processor id information
+//extern int me;	             // processor id information
 //extern int nprocs_row;         // num of procs to which a row is assigned
 //extern int nprocs_col;         // num of procs to which a col is assigned
 //extern int nrows_matrix;       // number of rows in the matrix
@@ -93,20 +93,34 @@ namespace Adelus {
       }
     }
     MPI_Barrier(MPI_COMM_WORLD);
-    // Broadcast to the rest of the processors  in row_comm
+    // Broadcast to the rest of the processors in row_comm
     MPI_Bcast(permute.data(),my_rows,MPI_INT,0,row_comm);
+
   }// End of function exchange_pivots
   
   template<class ZViewType, class PViewType>
   inline
-  void permute_mat(ZViewType& ZV, PViewType& lpiv_view, PViewType& permute) {
-    //NOTE: Currently assume that ZV resides in host memory
+  void permute_mat(ZViewType& Z, PViewType& lpiv_view, PViewType& permute) {
+    //TODO: add host pinned memory support
     using value_type  = typename ZViewType::value_type;
+#ifndef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
+    using execution_space = typename ZViewType::device_type::execution_space ;
+    using memory_space    = typename ZViewType::device_type::memory_space ;
+    using ViewVectorType  = Kokkos::View<value_type*, Kokkos::LayoutLeft, memory_space>;
+#ifdef PRINT_STATUS
+  printf("Rank %i -- permute_mat() Begin permute mat with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+#endif
+#endif
 
     MPI_Status msgstatus;
   
     int pivot_row, k_row;
+#ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
     value_type tmpr, tmps;
+#else
+    ViewVectorType tmpr( "tmpr", Z.extent(1) );
+    ViewVectorType tmps( "tmps", Z.extent(1) );
+#endif
 
 #ifdef GET_TIMING
    double exchpivtime,permutemattime,t1;
@@ -121,7 +135,8 @@ namespace Adelus {
 
     t1 = MPI_Wtime();
 #endif
-  
+
+#ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
     for (int j=0;j<=my_cols-1;j++) {
       int J=j*nprocs_row+mycol; // global column index
       for (int k=J+1;k<=nrows_matrix-1;k++) {
@@ -131,24 +146,100 @@ namespace Adelus {
         MPI_Bcast(&pivot_row,1,MPI_INT,k_row,col_comm);
         if (k != pivot_row) {
           if (myrow == k_row) {
-            tmps = ZV(k/nprocs_col, J/nprocs_row);
+            tmps = Z(k/nprocs_col, J/nprocs_row);
             MPI_Send((char *)(&tmps),sizeof(value_type),MPI_CHAR,pivot_row%nprocs_col,2,col_comm);
           }
           if (myrow == pivot_row%nprocs_col) {
-            tmps = ZV(pivot_row/nprocs_col, J/nprocs_row);
+            tmps = Z(pivot_row/nprocs_col, J/nprocs_row);
             MPI_Send((char *)(&tmps),sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
           }
           if (myrow == k_row) {
             MPI_Recv((char *)(&tmpr),sizeof(value_type),MPI_CHAR,pivot_row%nprocs_col,3,col_comm,&msgstatus);
-            ZV(k/nprocs_col, J/nprocs_row) = tmpr;
+            Z(k/nprocs_col, J/nprocs_row) = tmpr;
           }
           if (myrow == pivot_row%nprocs_col) {
             MPI_Recv((char *)(&tmpr),sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
-            ZV(pivot_row/nprocs_col, J/nprocs_row)  = tmpr;
+            Z(pivot_row/nprocs_col, J/nprocs_row)  = tmpr;
           }
         }// End of if (k != pivot_row)
-      }// End of for (k=J+1;k<=nrows_matrix-2;k++)
+      }// End of for (k=J+1;k<=nrows_matrix-1;k++)
     }// End of for (j=0;j<=my_cols-1;j++)
+#else
+    for (int k = 1 + mycol; k <= nrows_matrix - 1; k++) {
+      int max_gcol_k=k-1; // max. global column index in the k row
+      int max_lcol_k=0;   // max. local column index in the k row
+      k_row=k%nprocs_col; // mesh row id (in the MPI process mesh) of the process that holds k
+
+      if (myrow==k_row) pivot_row = permute(k/nprocs_col);
+      MPI_Bcast(&pivot_row,1,MPI_INT,k_row,col_comm);
+
+      int max_gcol_pivot=pivot_row-1;          // max. global column index in the pivot row
+      int max_lcol_pivot=0;                    // max. local column index in the pivot row
+      int pivot_row_pid = pivot_row%nprocs_col;// mesh row id (in the MPI process mesh) of the process that holds pivot_row
+
+      //Find max. local column index in the k row that covers the lower triangular part
+      if ( mycol <= max_gcol_k%nprocs_row)
+        max_lcol_k = max_gcol_k/nprocs_row;
+      else
+        max_lcol_k = max_gcol_k/nprocs_row - 1;//one element less
+
+      //Find max. local column index in the pivot row that covers the lower triangular part
+      if ( mycol <= max_gcol_pivot%nprocs_row)
+        max_lcol_pivot = max_gcol_pivot/nprocs_row;
+      else
+        max_lcol_pivot = max_gcol_pivot/nprocs_row - 1;//one element less
+
+      //Find the number of columns needs to be exchanged
+      int min_len = std::min(max_lcol_k,max_lcol_pivot) + 1;
+
+      if (k != pivot_row) {//k row is differrent from pivot_row, i.e. needs permutation
+        if (k_row == pivot_row_pid) {//pivot row is in the same rank
+          if (myrow == k_row) {//I am the right process to do permutation
+            int curr_lrid = k/nprocs_col;
+            int piv_lrid  = pivot_row/nprocs_col;
+            Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
+              value_type tmp = Z(curr_lrid,i);
+              Z(curr_lrid,i) = Z(piv_lrid,i);
+              Z(piv_lrid,i)  = tmp;
+            });
+            Kokkos::fence();
+          }
+        }
+        else {//k row and pivot row are in different processes (rank)
+          if (myrow == k_row) {//I am holding k row
+            int curr_lrid = k/nprocs_col;
+            Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
+              tmps(i) = Z(curr_lrid,i);
+            });
+            Kokkos::fence();
+
+            MPI_Send(reinterpret_cast<char *>(tmps.data()),min_len*sizeof(value_type),MPI_CHAR,pivot_row_pid,2,col_comm);
+            MPI_Recv(reinterpret_cast<char *>(tmpr.data()),min_len*sizeof(value_type),MPI_CHAR,pivot_row_pid,3,col_comm,&msgstatus);
+
+            Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
+              Z(curr_lrid,i) = tmpr(i);
+            });
+            Kokkos::fence();
+          }
+          if (myrow == pivot_row_pid) {//I am holding the pivot row
+            int piv_lrid = pivot_row/nprocs_col;
+            Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
+              tmps(i) = Z(piv_lrid,i);
+            });
+            Kokkos::fence();
+
+            MPI_Recv(reinterpret_cast<char *>(tmpr.data()),min_len*sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
+            MPI_Send(reinterpret_cast<char *>(tmps.data()),min_len*sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
+
+            Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
+              Z(piv_lrid,i) = tmpr(i);
+            });
+            Kokkos::fence();
+          }
+        }//End of k row and pivot row are in different processes (rank)
+      }// End of if (k != pivot_row)
+    }// End of for (int k=1+mycol;k<=nrows_matrix-1;k++) {
+#endif
 
 #ifdef GET_TIMING
     permutemattime = MPI_Wtime()-t1;
diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
index 1967ea2a430b..4bafd21c1230 100644
--- a/packages/adelus/src/Adelus_x_factor.hpp
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -164,17 +164,20 @@ void lu_(ZViewType& Z, PViewType& permute, int *matrix_size, int *num_procsr, do
 #endif
 
   // Permute the lower triangular matrix
-  //NOTE: Currently doing matrix permutation in host memory
 #ifdef ADELUS_HAVE_TIME_MONITOR
   {
     TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: matrix permutation"));
 #endif
+#ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
     typename ZViewType::HostMirror h_Z = Kokkos::create_mirror_view( Z );
     Kokkos::deep_copy (h_Z, Z);
   
     permute_mat(h_Z, lpiv_view, permute);
 
     Kokkos::deep_copy (Z, h_Z);
+#else
+    permute_mat(Z, lpiv_view, permute);
+#endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
   }
 #endif
diff --git a/packages/adelus/src/Adelus_x_solve.hpp b/packages/adelus/src/Adelus_x_solve.hpp
index 156f8351caaf..c6b021508128 100644
--- a/packages/adelus/src/Adelus_x_solve.hpp
+++ b/packages/adelus/src/Adelus_x_solve.hpp
@@ -67,8 +67,6 @@
 #include "Teuchos_TimeMonitor.hpp"
 #endif
 
-//#define ADELUS_FORWARD_COPY_TO_HOST //NOTE: for perf comparison only
-
 namespace Adelus {
 
 template<class ZViewType, class RHSViewType, class PViewType>
@@ -101,7 +99,7 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
   {
     tsecs = get_seconds(0.0);
     
-#ifdef ADELUS_FORWARD_COPY_TO_HOST
+#ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
     typename ZViewType::HostMirror h_Z = Kokkos::create_mirror_view( Z );
     typename RHSViewType::HostMirror h_RHS = Kokkos::create_mirror_view( RHS );
     // Bring data to host memory
@@ -114,7 +112,7 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: rhs permutation"));
 #endif
       // Permute the RHS
-#ifdef ADELUS_FORWARD_COPY_TO_HOST
+#ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
       permute_rhs(h_RHS, permute, my_rhs);
 #else
       permute_rhs(RHS, permute, my_rhs);
@@ -128,7 +126,7 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: forward solve"));
 #endif
       //Forward Solve
-#ifdef ADELUS_FORWARD_COPY_TO_HOST
+#ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
       forward(h_Z, h_RHS, my_rhs);
 #else
       forward(Z, RHS, my_rhs);
@@ -137,7 +135,7 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
     }
 #endif
 
-#ifdef ADELUS_FORWARD_COPY_TO_HOST
+#ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
     // Copy back to device memory
     Kokkos::deep_copy (Z,   h_Z);  
     Kokkos::deep_copy (RHS, h_RHS);

From 2121801ab5e620cba7461664fda8cd8229e8ba38 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 12 Jun 2022 01:24:26 -0700
Subject: [PATCH 016/130] Host pinned memory support for permute_mat,
 permute_rhs, forward

---
 packages/adelus/src/Adelus_forward.hpp  | 26 ++++++++++++++++++++-
 packages/adelus/src/Adelus_perm_mat.hpp | 28 +++++++++++++++++++++-
 packages/adelus/src/Adelus_perm_rhs.hpp | 31 ++++++++++++++++++++++---
 3 files changed, 80 insertions(+), 5 deletions(-)

diff --git a/packages/adelus/src/Adelus_forward.hpp b/packages/adelus/src/Adelus_forward.hpp
index 6b8a7a4e5a30..274999d57283 100644
--- a/packages/adelus/src/Adelus_forward.hpp
+++ b/packages/adelus/src/Adelus_forward.hpp
@@ -64,11 +64,17 @@ template<class ZViewType, class RHSViewType>
 inline
 void forward(ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
 {
-  //TODO: add host pinned memory support
   using value_type      = typename ZViewType::value_type ;
   using execution_space = typename ZViewType::device_type::execution_space ;
   using memory_space    = typename ZViewType::device_type::memory_space ;
   using ViewMatrixType  =  Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space>;
+#ifdef ADELUS_HOST_PINNED_MEM_MPI
+  #if defined(KOKKOS_ENABLE_CUDA)
+    using ViewMatrixHostPinnType = Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::CudaHostPinnedSpace>;//CudaHostPinnedSpace
+  #elif defined(KOKKOS_ENABLE_HIP)
+    using ViewMatrixHostPinnType = Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::Experimental::HIPHostPinnedSpace>;//HIPHostPinnedSpace
+  #endif
+#endif
 
   int k_row;       // torus-wrap row corresponding to kth global row
   int k_col;       // torus-wrap column corresponding to kth global col
@@ -79,6 +85,10 @@ void forward(ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
 
   ViewMatrixType piv_col( "piv_col", my_rows, 1 ); // portion of pivot column I am sending
   ViewMatrixType ck( "ck", 1, RHS.extent(1) ); // rhs corresponding to current column of the backsubstitution
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+    ViewMatrixHostPinnType h_piv_col( "h_piv_col", my_rows, 1 );
+    ViewMatrixHostPinnType h_ck( "h_ck", 1, RHS.extent(1) );
+#endif
 
 #ifdef PRINT_STATUS
   printf("Rank %i -- forward() Begin forward solve with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, my_num_rhs %d, value_type %s, execution_space %s, memory_space %s\n", me, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, my_num_rhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
@@ -105,7 +115,13 @@ void forward(ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
     //Note: replace MPI_Send/MPI_Irecv with MPI_Bcast
     //      Rank k_col broadcasts the pivot_col to all
     //      other ranks in the row_comm
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+    Kokkos::deep_copy(h_piv_col,piv_col);
+    MPI_Bcast(reinterpret_cast<char *>(h_piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, row_comm);
+    Kokkos::deep_copy(piv_col,h_piv_col);
+#else //GPU-aware MPI
     MPI_Bcast(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, row_comm);
+#endif
 
     if (my_num_rhs > 0) {
       //ck = RHS(k/nprocs_col,0);
@@ -120,8 +136,16 @@ void forward(ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
       Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
         ck(0,i) = RHS(curr_lrid,i);
       });
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+      Kokkos::deep_copy(h_ck,ck);
+      MPI_Bcast(reinterpret_cast<char *>(h_ck.data()), RHS.extent(1)*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_row, col_comm);
+      Kokkos::deep_copy(ck,h_ck);
+#else //GPU-aware MPI
       Kokkos::fence();
       MPI_Bcast(reinterpret_cast<char *>(ck.data()), RHS.extent(1)*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_row, col_comm);
+#endif
+
       auto sub_pivot_col = subview(piv_col, Kokkos::make_pair(0, my_rows - istart), Kokkos::ALL());
       auto sub_rhs       = subview(RHS, Kokkos::make_pair(istart, my_rows), Kokkos::ALL());
       if (istart < my_rows) {
diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
index 6fb814acad82..42a734ec4569 100644
--- a/packages/adelus/src/Adelus_perm_mat.hpp
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -101,12 +101,18 @@ namespace Adelus {
   template<class ZViewType, class PViewType>
   inline
   void permute_mat(ZViewType& Z, PViewType& lpiv_view, PViewType& permute) {
-    //TODO: add host pinned memory support
     using value_type  = typename ZViewType::value_type;
 #ifndef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
     using execution_space = typename ZViewType::device_type::execution_space ;
     using memory_space    = typename ZViewType::device_type::memory_space ;
     using ViewVectorType  = Kokkos::View<value_type*, Kokkos::LayoutLeft, memory_space>;
+#ifdef ADELUS_HOST_PINNED_MEM_MPI
+  #if defined(KOKKOS_ENABLE_CUDA)
+    using ViewVectorHostPinnType = Kokkos::View<value_type*, Kokkos::LayoutLeft, Kokkos::CudaHostPinnedSpace>;//CudaHostPinnedSpace
+  #elif defined(KOKKOS_ENABLE_HIP)
+    using ViewVectorHostPinnType = Kokkos::View<value_type*, Kokkos::LayoutLeft, Kokkos::Experimental::HIPHostPinnedSpace>;//HIPHostPinnedSpace
+  #endif
+#endif
 #ifdef PRINT_STATUS
   printf("Rank %i -- permute_mat() Begin permute mat with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
@@ -120,6 +126,10 @@ namespace Adelus {
 #else
     ViewVectorType tmpr( "tmpr", Z.extent(1) );
     ViewVectorType tmps( "tmps", Z.extent(1) );
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+    ViewVectorHostPinnType h_tmpr( "h_tmpr", Z.extent(1) );
+    ViewVectorHostPinnType h_tmps( "h_tmps", Z.extent(1) );
+#endif
 #endif
 
 #ifdef GET_TIMING
@@ -211,10 +221,18 @@ namespace Adelus {
             Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
               tmps(i) = Z(curr_lrid,i);
             });
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+            Kokkos::deep_copy(h_tmps,tmps);
+            MPI_Send(reinterpret_cast<char *>(h_tmps.data()),min_len*sizeof(value_type),MPI_CHAR,pivot_row_pid,2,col_comm);
+            MPI_Recv(reinterpret_cast<char *>(h_tmpr.data()),min_len*sizeof(value_type),MPI_CHAR,pivot_row_pid,3,col_comm,&msgstatus);
+            Kokkos::deep_copy(tmpr,h_tmpr);
+#else //GPU-aware MPI
             Kokkos::fence();
 
             MPI_Send(reinterpret_cast<char *>(tmps.data()),min_len*sizeof(value_type),MPI_CHAR,pivot_row_pid,2,col_comm);
             MPI_Recv(reinterpret_cast<char *>(tmpr.data()),min_len*sizeof(value_type),MPI_CHAR,pivot_row_pid,3,col_comm,&msgstatus);
+#endif
 
             Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
               Z(curr_lrid,i) = tmpr(i);
@@ -226,10 +244,18 @@ namespace Adelus {
             Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
               tmps(i) = Z(piv_lrid,i);
             });
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+            Kokkos::deep_copy(h_tmps,tmps);
+            MPI_Recv(reinterpret_cast<char *>(h_tmpr.data()),min_len*sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
+            MPI_Send(reinterpret_cast<char *>(h_tmps.data()),min_len*sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
+            Kokkos::deep_copy(tmpr,h_tmpr);
+#else // GPU-aware MPI
             Kokkos::fence();
 
             MPI_Recv(reinterpret_cast<char *>(tmpr.data()),min_len*sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
             MPI_Send(reinterpret_cast<char *>(tmps.data()),min_len*sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
+#endif
 
             Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,min_len), KOKKOS_LAMBDA (const int i) {
               Z(piv_lrid,i) = tmpr(i);
diff --git a/packages/adelus/src/Adelus_perm_rhs.hpp b/packages/adelus/src/Adelus_perm_rhs.hpp
index 060e6e5791b8..2e9b0196be55 100644
--- a/packages/adelus/src/Adelus_perm_rhs.hpp
+++ b/packages/adelus/src/Adelus_perm_rhs.hpp
@@ -77,15 +77,24 @@ namespace Adelus {
     using execution_space = typename ZViewType::device_type::execution_space ;
     using memory_space    = typename ZViewType::device_type::memory_space ;
     using ViewVectorType  = Kokkos::View<value_type*, Kokkos::LayoutLeft, memory_space>;
-  
+#ifdef ADELUS_HOST_PINNED_MEM_MPI
+  #if defined(KOKKOS_ENABLE_CUDA)
+    using ViewVectorHostPinnType = Kokkos::View<value_type*, Kokkos::LayoutLeft, Kokkos::CudaHostPinnedSpace>;//CudaHostPinnedSpace
+  #elif defined(KOKKOS_ENABLE_HIP)
+    using ViewVectorHostPinnType = Kokkos::View<value_type*, Kokkos::LayoutLeft, Kokkos::Experimental::HIPHostPinnedSpace>;//HIPHostPinnedSpace
+  #endif
+#endif
+
     int pivot_row, k_row;
     ViewVectorType tmpr( "tmpr", RHS.extent(1) );
     ViewVectorType tmps( "tmps", RHS.extent(1) );
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+    ViewVectorHostPinnType h_tmpr( "h_tmpr", RHS.extent(1) );
+    ViewVectorHostPinnType h_tmps( "h_tmps", RHS.extent(1) );
+#endif
 
     MPI_Status msgstatus;
 
-    //TODO: add host pinned memory support
-
     //TODO: try this later
     //MPI_Datatype strided_vec_type;
     //int strided_vec_nblocks  = RHS.extent(1);
@@ -128,10 +137,18 @@ namespace Adelus {
               Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
                 tmps(i) = RHS(curr_lrid,i);
               });
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+              Kokkos::deep_copy(h_tmps,tmps);
+              MPI_Send(reinterpret_cast<char *>(h_tmps.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,pivot_row_pid,2,col_comm);
+              MPI_Recv(reinterpret_cast<char *>(h_tmpr.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,pivot_row_pid,3,col_comm,&msgstatus);
+              Kokkos::deep_copy(tmpr,h_tmpr);
+#else //GPU-aware MPI
               Kokkos::fence();
 
               MPI_Send(reinterpret_cast<char *>(tmps.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,pivot_row_pid,2,col_comm);
               MPI_Recv(reinterpret_cast<char *>(tmpr.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,pivot_row_pid,3,col_comm,&msgstatus);
+#endif
 
               Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
                 RHS(curr_lrid,i) = tmpr(i);
@@ -143,10 +160,18 @@ namespace Adelus {
               Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
                 tmps(i) = RHS(piv_lrid,i);
               });
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+              Kokkos::deep_copy(h_tmps,tmps);
+              MPI_Recv(reinterpret_cast<char *>(h_tmpr.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
+              MPI_Send(reinterpret_cast<char *>(h_tmps.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
+              Kokkos::deep_copy(tmpr,h_tmpr);
+#else // GPU-aware MPI
               Kokkos::fence();
 
               MPI_Recv(reinterpret_cast<char *>(tmpr.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,k_row,2,col_comm,&msgstatus);
               MPI_Send(reinterpret_cast<char *>(tmps.data()),RHS.extent(1)*sizeof(value_type),MPI_CHAR,k_row,3,col_comm);
+#endif
 
               Kokkos::parallel_for(Kokkos::RangePolicy<execution_space>(0,RHS.extent(1)), KOKKOS_LAMBDA (const int i) {
                 RHS(piv_lrid,i) = tmpr(i);

From c39fa9fd64701b85acc448aecb5a7b1c3bd60291 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Thu, 16 Jun 2022 09:23:42 -0700
Subject: [PATCH 017/130] Add handle and replace MPI_COMM_WORLD

---
 packages/adelus/src/Adelus.hpp                | 137 ++--
 packages/adelus/src/Adelus.hpp_               | 639 ++++++++++++++++++
 packages/adelus/src/Adelus_factor.hpp         |  39 +-
 packages/adelus/src/Adelus_forward.hpp        |   6 +-
 packages/adelus/src/Adelus_perm1.hpp          |  12 +-
 packages/adelus/src/Adelus_perm_mat.hpp       |  16 +-
 packages/adelus/src/Adelus_perm_rhs.hpp       |   4 +-
 packages/adelus/src/Adelus_solve.hpp          |  12 +-
 packages/adelus/src/Adelus_vars.hpp           | 135 ++++
 packages/adelus/src/Adelus_vars.hpp_          |  80 +++
 packages/adelus/src/Adelus_x_factor.hpp       |  20 +-
 packages/adelus/src/Adelus_x_solve.hpp        |  17 +-
 packages/adelus/src/Adelus_xlu_solve.hpp      |  20 +-
 .../adelus/test/vector_random/cxx_main.cpp    |   6 +-
 .../adelus/test/vector_random_fs/cxx_main.cpp |  10 +-
 15 files changed, 1026 insertions(+), 127 deletions(-)
 create mode 100644 packages/adelus/src/Adelus.hpp_
 create mode 100644 packages/adelus/src/Adelus_vars.hpp_

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index 66ac927db29a..c0fa123d0ab0 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -103,6 +103,7 @@ namespace Adelus {
   /// Adelus FactorSolve
   /// Factors and solves the dense matrix
 
+  /// \param ahandle (In)     -- handle that contains metadata needed by the Adelus solver
   /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
   /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
   /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
@@ -111,24 +112,25 @@ namespace Adelus {
   /// \param num_rhs (In)     -- number of right hand sides
   /// \param secs (Out)       -- factor and solve time in seconds
     
-  template<class ZDView>
+  template<class HandleType, class ZRHSViewType>
   inline
-  void FactorSolve( ZDView AA,
+  void FactorSolve( HandleType& ahandle,
+                    ZRHSViewType& AA,
                     int my_rows_,
                     int my_cols_,
                     int* matrix_size,
                     int* num_procsr,
                     int* num_rhs,
                     double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+    int rank = ahandle.get_myrank();
 	
 #ifdef PRINT_STATUS
     printf("FactorSolve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA,
+    lusolve_(ahandle,
+             AA,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -139,6 +141,7 @@ namespace Adelus {
   /// Adelus Factor
   /// Factors the dense matrix for later solve
 
+  /// \param ahandle (In)     -- handle that contains metadata needed by the Adelus solver
   /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
   /// \param permute (In)     -- Kokkos View that has the global pivot vector
   /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
@@ -147,24 +150,25 @@ namespace Adelus {
   /// \param num_procsr (In)  -- number of processors for a row
   /// \param secs (Out)       -- factor and solve time in seconds
 
-  template<class ZDView, class IDView>
+  template<class HandleType, class ZViewType, class PViewType>
   inline
-  void Factor( ZDView AA,
-               IDView permute,
+  void Factor( HandleType& ahandle,
+               ZViewType& AA,
+               PViewType& permute,
                int my_rows_,
                int my_cols_,
                int* matrix_size,
                int* num_procsr,
                double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+    int rank = ahandle.get_myrank();
 
 #ifdef PRINT_STATUS
     printf("Factor (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr);
 #endif
 
-    lu_(AA,
+    lu_(ahandle,
+        AA,
         permute,
         matrix_size,
         num_procsr,
@@ -173,8 +177,9 @@ namespace Adelus {
   }
 
   /// Adelus Solve
-  /// Solves the previously factored dense matrix for provided RHS 
+  /// Solves the previously factored dense matrix for provided RHS
 
+  /// \param ahandle (In)     -- handle that contains metadata needed by the Adelus solver
   /// \param AA (In)          -- Kokkos View that has the LU-factorized matrix
   /// \param BB (InOut)       -- Kokkos View that has the rhs and solution (Note: rhs are overwritten)
   /// \param permute (In)     -- Kokkos View that has the global pivot vector
@@ -184,26 +189,28 @@ namespace Adelus {
   /// \param num_procsr (In)  -- number of processors for a row
   /// \param secs (Out)       -- factor and solve time in seconds
 
-  template<class ZDView, class BDView, class IDView>
+  template<class HandleType, class ZViewType,
+           class RHSViewType, class PViewType>
   inline
-  void Solve( ZDView AA,
-              BDView BB,
-              IDView permute,
+  void Solve( HandleType& ahandle,
+              ZViewType& AA,
+              RHSViewType& BB,
+              PViewType& permute,
               int my_rows_,
               int my_cols_,
               int* matrix_size,
               int* num_procsr,
               int* num_rhs,
               double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+    int rank = ahandle.get_myrank();
 
 #ifdef PRINT_STATUS
     printf("Solve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    solve_(AA,
+    solve_(ahandle,
+           AA,
            BB,
            permute,
            num_rhs,
@@ -215,8 +222,10 @@ namespace Adelus {
   /// Adelus FactorSolve_devPtr
   /// Matrix and rhs are packed and passed as device pointer
 
+  template<class HandleType>
   inline
-  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
+  void FactorSolve_devPtr( HandleType& ahandle,
+                           ADELUS_DATA_TYPE* AA,
                            int my_rows_,
                            int my_cols_,
                            int my_rhs_,
@@ -224,9 +233,8 @@ namespace Adelus {
                            int* num_procsr,
                            int* num_rhs,
                            double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    int rank = ahandle.get_myrank();
 
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
@@ -245,7 +253,8 @@ namespace Adelus {
     printf("FactorSolve_devPtr (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA_i,
+    lusolve_(ahandle,
+             AA_i,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -257,8 +266,10 @@ namespace Adelus {
   /// Adelus FactorSolve_hostPtr
   /// Matrix and rhs are packed and passed as host pointer
 
+  template<class HandleType>
   inline
-  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
+  void FactorSolve_hostPtr( HandleType& ahandle,
+                            ADELUS_DATA_TYPE* AA,
                             int my_rows_,
                             int my_cols_,
                             int my_rhs_,
@@ -266,9 +277,8 @@ namespace Adelus {
                             int* num_procsr,
                             int* num_rhs,
                             double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    int rank = ahandle.get_myrank();
 
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
     typedef Kokkos::View<Kokkos::complex<double>**,
@@ -295,7 +305,8 @@ namespace Adelus {
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
 
-    lusolve_(AA_i_dev,
+    lusolve_(ahandle,
+             AA_i_dev,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -307,7 +318,8 @@ namespace Adelus {
     printf("FactorSolve_hostPtr with host solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA_i,
+    lusolve_(ahandle,
+             AA_i,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -321,8 +333,10 @@ namespace Adelus {
   /// Adelus FactorSolve_devPtr
   /// Matrix and rhs are packed and passed as device pointer
 
+  template<class HandleType>
   inline
-  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
+  void FactorSolve_devPtr( HandleType& ahandle,
+                           ADELUS_DATA_TYPE* AA,
                            int my_rows_,
                            int my_cols_,
                            int my_rhs_,
@@ -330,9 +344,8 @@ namespace Adelus {
                            int* num_procsr,
                            int* num_rhs,
                            double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    int rank = ahandle.get_myrank();
 
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
@@ -351,7 +364,8 @@ namespace Adelus {
     printf("FactorSolve_devPtr (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA_i,
+    lusolve_(ahandle,
+             AA_i,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -363,8 +377,10 @@ namespace Adelus {
   /// Adelus FactorSolve_hostPtr
   /// Matrix and rhs are packed and passed as host pointer
 
+  template<class HandleType>
   inline
-  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
+  void FactorSolve_hostPtr( HandleType& ahandle,
+                            ADELUS_DATA_TYPE* AA,
                             int my_rows_,
                             int my_cols_,
                             int my_rhs_,
@@ -372,9 +388,8 @@ namespace Adelus {
                             int* num_procsr,
                             int* num_rhs,
                             double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    int rank = ahandle.get_myrank();
 
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
     typedef Kokkos::View<double**,
@@ -401,7 +416,8 @@ namespace Adelus {
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
 
-    lusolve_(AA_i_dev,
+    lusolve_(ahandle,
+             AA_i_dev,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -413,7 +429,8 @@ namespace Adelus {
     printf("FactorSolve_hostPtr with host solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA_i,
+    lusolve_(ahandle,
+             AA_i,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -427,8 +444,10 @@ namespace Adelus {
   /// Adelus FactorSolve_devPtr
   /// Matrix and rhs are packed and passed as device pointer
 
+  template<class HandleType>
   inline
-  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
+  void FactorSolve_devPtr( HandleType& ahandle,
+                           ADELUS_DATA_TYPE* AA,
                            int my_rows_,
                            int my_cols_,
                            int my_rhs_,
@@ -436,9 +455,8 @@ namespace Adelus {
                            int* num_procsr,
                            int* num_rhs,
                            double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    int rank = ahandle.get_myrank();
 
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
@@ -457,7 +475,8 @@ namespace Adelus {
     printf("FactorSolve_devPtr (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA_i,
+    lusolve_(ahandle,
+             AA_i,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -469,8 +488,10 @@ namespace Adelus {
   /// Adelus FactorSolve_hostPtr
   /// Matrix and rhs are packed and passed as host pointer
 
+  template<class HandleType>
   inline
-  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
+  void FactorSolve_hostPtr( HandleType& ahandle,
+                            ADELUS_DATA_TYPE* AA,
                             int my_rows_,
                             int my_cols_,
                             int my_rhs_,
@@ -478,9 +499,8 @@ namespace Adelus {
                             int* num_procsr,
                             int* num_rhs,
                             double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    int rank = ahandle.get_myrank();
 
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
     typedef Kokkos::View<Kokkos::complex<float>**,
@@ -507,7 +527,8 @@ namespace Adelus {
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
 
-    lusolve_(AA_i_dev,
+    lusolve_(ahandle,
+             AA_i_dev,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -519,7 +540,8 @@ namespace Adelus {
     printf("FactorSolve_hostPtr with host solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA_i,
+    lusolve_(ahandle,
+             AA_i,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -533,8 +555,10 @@ namespace Adelus {
   /// Adelus FactorSolve_devPtr
   /// Matrix and rhs are packed and passed as device pointer
 
+  template<class HandleType>
   inline
-  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
+  void FactorSolve_devPtr( HandleType& ahandle,
+                           ADELUS_DATA_TYPE* AA,
                            int my_rows_,
                            int my_cols_,
                            int my_rhs_,
@@ -542,9 +566,8 @@ namespace Adelus {
                            int* num_procsr,
                            int* num_rhs,
                            double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    int rank = ahandle.get_myrank();
 
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
@@ -563,7 +586,8 @@ namespace Adelus {
     printf("FactorSolve_devPtr (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA_i,
+    lusolve_(ahandle,
+             AA_i,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -575,8 +599,10 @@ namespace Adelus {
   /// Adelus FactorSolve_hostPtr
   /// Matrix and rhs are packed and passed as host pointer
 
+  template<class HandleType>
   inline
-  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
+  void FactorSolve_hostPtr( HandleType& ahandle,
+                            ADELUS_DATA_TYPE* AA,
                             int my_rows_,
                             int my_cols_,
                             int my_rhs_,
@@ -584,9 +610,8 @@ namespace Adelus {
                             int* num_procsr,
                             int* num_rhs,
                             double* secs ) {
-    int rank;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    int rank = ahandle.get_myrank();
 
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
     typedef Kokkos::View<float**,
@@ -613,7 +638,8 @@ namespace Adelus {
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
 
-    lusolve_(AA_i_dev,
+    lusolve_(ahandle,
+             AA_i_dev,
              matrix_size,
              num_procsr,
              num_rhs,
@@ -625,7 +651,8 @@ namespace Adelus {
     printf("FactorSolve_hostPtr with host solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(AA_i,
+    lusolve_(ahandle,
+             AA_i,
              matrix_size,
              num_procsr,
              num_rhs,
diff --git a/packages/adelus/src/Adelus.hpp_ b/packages/adelus/src/Adelus.hpp_
new file mode 100644
index 000000000000..66ac927db29a
--- /dev/null
+++ b/packages/adelus/src/Adelus.hpp_
@@ -0,0 +1,639 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#pragma once
+
+#include <Kokkos_View.hpp>
+#include <Adelus_defines.h>
+#include <Adelus_xlu_solve.hpp>
+#include <Adelus_x_factor.hpp>
+#include <Adelus_x_solve.hpp>
+#include <Adelus_distribute.hpp>
+#include <mpi.h>
+
+// Adelus: provides the functionality to interface to a dense LU solver
+
+namespace Adelus {
+
+  /// Adelus GetDistirbution
+  /// Gives the distribution information that is required by the dense solver
+  
+  /// \param nprocs_row_ (In)        - number of processors for a row
+  /// \param number_of_unknowns (In) - order of the dense matrix
+  /// \param nrhs_ (In)              - number of right hand sides
+  /// \param my_rows_ (Out)          - number of rows of the matrix on this processor
+  /// \param my_cols_ (Out)          - number of columns of the matrix on this processor
+  /// \param my_first_row_ (Out)     - first (global) row number on this processor (array starts at index 1)
+  /// \param my_first_col_ (Out)     - first (global) column number on this processor (array starts at index 1)
+  /// \param my_rhs_ (Out)           - number of right hand sides on this processor
+  /// \param my_row (Out)            - row number in processor mesh, 0 to the  number of processors for a column -1
+  /// \param my_col (Out)            - column number in processor mesh, 0 to the  number of processors for a row -1
+    
+  inline
+  int GetDistribution( int* nprocs_row_,
+                       int* number_of_unknowns,
+                       int* nrhs_,
+                       int* my_rows_,
+                       int* my_cols_,
+                       int* my_first_row_,
+                       int* my_first_col_,
+                       int* my_rhs_,
+                       int* my_row,
+                       int* my_col ) {
+    // This function echoes the multiprocessor distribution of the matrix
+
+    distmat_(nprocs_row_,
+             number_of_unknowns,
+             nrhs_,
+             my_rows_,
+             my_cols_,
+             my_first_row_,
+             my_first_col_,
+             my_rhs_,
+             my_row,
+             my_col);
+
+    return(0);
+
+  }
+
+  /// Adelus FactorSolve
+  /// Factors and solves the dense matrix
+
+  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
+  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
+  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
+  /// \param matrix_size (In) -- order of the dense matrix
+  /// \param num_procsr (In)  -- number of processors for a row
+  /// \param num_rhs (In)     -- number of right hand sides
+  /// \param secs (Out)       -- factor and solve time in seconds
+    
+  template<class ZDView>
+  inline
+  void FactorSolve( ZDView AA,
+                    int my_rows_,
+                    int my_cols_,
+                    int* matrix_size,
+                    int* num_procsr,
+                    int* num_rhs,
+                    double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+	
+#ifdef PRINT_STATUS
+    printf("FactorSolve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+
+  }
+
+  /// Adelus Factor
+  /// Factors the dense matrix for later solve
+
+  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
+  /// \param permute (In)     -- Kokkos View that has the global pivot vector
+  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
+  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
+  /// \param matrix_size (In) -- order of the dense matrix
+  /// \param num_procsr (In)  -- number of processors for a row
+  /// \param secs (Out)       -- factor and solve time in seconds
+
+  template<class ZDView, class IDView>
+  inline
+  void Factor( ZDView AA,
+               IDView permute,
+               int my_rows_,
+               int my_cols_,
+               int* matrix_size,
+               int* num_procsr,
+               double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+
+#ifdef PRINT_STATUS
+    printf("Factor (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr);
+#endif
+
+    lu_(AA,
+        permute,
+        matrix_size,
+        num_procsr,
+        secs);
+
+  }
+
+  /// Adelus Solve
+  /// Solves the previously factored dense matrix for provided RHS 
+
+  /// \param AA (In)          -- Kokkos View that has the LU-factorized matrix
+  /// \param BB (InOut)       -- Kokkos View that has the rhs and solution (Note: rhs are overwritten)
+  /// \param permute (In)     -- Kokkos View that has the global pivot vector
+  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
+  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
+  /// \param matrix_size (In) -- order of the dense matrix
+  /// \param num_procsr (In)  -- number of processors for a row
+  /// \param secs (Out)       -- factor and solve time in seconds
+
+  template<class ZDView, class BDView, class IDView>
+  inline
+  void Solve( ZDView AA,
+              BDView BB,
+              IDView permute,
+              int my_rows_,
+              int my_cols_,
+              int* matrix_size,
+              int* num_procsr,
+              int* num_rhs,
+              double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
+
+#ifdef PRINT_STATUS
+    printf("Solve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    solve_(AA,
+           BB,
+           permute,
+           num_rhs,
+           secs);
+
+  }
+
+#ifdef ZCPLX
+  /// Adelus FactorSolve_devPtr
+  /// Matrix and rhs are packed and passed as device pointer
+
+  inline
+  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
+                           int my_rows_,
+                           int my_cols_,
+                           int my_rhs_,
+                           int* matrix_size,
+                           int* num_procsr,
+                           int* num_rhs,
+                           double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+
+    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
+    typedef Kokkos::View<Kokkos::complex<double>**,
+                         Kokkos::LayoutLeft,
+#ifdef KOKKOS_ENABLE_CUDA
+                         Kokkos::CudaSpace,
+#else
+                         Kokkos::Experimental::HIPSpace,
+#endif
+                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
+
+    AA_Internal AA_i(reinterpret_cast<Kokkos::complex<double> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
+
+#ifdef PRINT_STATUS
+    printf("FactorSolve_devPtr (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA_i,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+#endif
+    }
+  }
+
+  /// Adelus FactorSolve_hostPtr
+  /// Matrix and rhs are packed and passed as host pointer
+
+  inline
+  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
+                            int my_rows_,
+                            int my_cols_,
+                            int my_rhs_,
+                            int* matrix_size,
+                            int* num_procsr,
+                            int* num_rhs,
+                            double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+
+    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
+    typedef Kokkos::View<Kokkos::complex<double>**,
+                         Kokkos::LayoutLeft,
+                         Kokkos::HostSpace,
+                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
+
+    AA_Internal AA_i(reinterpret_cast<Kokkos::complex<double> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
+
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP) 
+    typedef Kokkos::View<Kokkos::complex<double>**,
+                         Kokkos::LayoutLeft,
+#ifdef KOKKOS_ENABLE_CUDA
+                         Kokkos::CudaSpace> AA_Internal_dev;
+#else
+                         Kokkos::Experimental::HIPSpace> AA_Internal_dev;
+#endif
+
+    AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
+
+#ifdef PRINT_STATUS
+    printf("FactorSolve_hostPtr with CUDA solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    Kokkos::deep_copy( AA_i_dev, AA_i );
+
+    lusolve_(AA_i_dev,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+
+    Kokkos::deep_copy( AA_i, AA_i_dev );
+#else//OpenMP
+#ifdef PRINT_STATUS
+    printf("FactorSolve_hostPtr with host solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA_i,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+#endif
+    }
+  }
+#endif
+
+#ifdef DREAL
+  /// Adelus FactorSolve_devPtr
+  /// Matrix and rhs are packed and passed as device pointer
+
+  inline
+  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
+                           int my_rows_,
+                           int my_cols_,
+                           int my_rhs_,
+                           int* matrix_size,
+                           int* num_procsr,
+                           int* num_rhs,
+                           double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+
+    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
+    typedef Kokkos::View<double**,
+                         Kokkos::LayoutLeft,
+#ifdef KOKKOS_ENABLE_CUDA
+                         Kokkos::CudaSpace,
+#else
+                         Kokkos::Experimental::HIPSpace,
+#endif
+                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
+
+    AA_Internal AA_i(reinterpret_cast<double *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
+
+#ifdef PRINT_STATUS
+    printf("FactorSolve_devPtr (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA_i,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+#endif
+    }
+  }
+
+  /// Adelus FactorSolve_hostPtr
+  /// Matrix and rhs are packed and passed as host pointer
+
+  inline
+  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
+                            int my_rows_,
+                            int my_cols_,
+                            int my_rhs_,
+                            int* matrix_size,
+                            int* num_procsr,
+                            int* num_rhs,
+                            double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+
+    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
+    typedef Kokkos::View<double**,
+                         Kokkos::LayoutLeft,
+                         Kokkos::HostSpace,
+                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
+
+    AA_Internal AA_i(reinterpret_cast<double *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
+
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP) 
+    typedef Kokkos::View<double**,
+                         Kokkos::LayoutLeft,
+#ifdef KOKKOS_ENABLE_CUDA
+                         Kokkos::CudaSpace> AA_Internal_dev;
+#else
+                         Kokkos::Experimental::HIPSpace> AA_Internal_dev;
+#endif
+
+    AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
+
+#ifdef PRINT_STATUS
+    printf("FactorSolve_hostPtr with CUDA solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    Kokkos::deep_copy( AA_i_dev, AA_i );
+
+    lusolve_(AA_i_dev,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+
+    Kokkos::deep_copy( AA_i, AA_i_dev );
+#else//OpenMP
+#ifdef PRINT_STATUS
+    printf("FactorSolve_hostPtr with host solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA_i,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+#endif
+    }
+  }
+#endif
+
+#ifdef SCPLX
+  /// Adelus FactorSolve_devPtr
+  /// Matrix and rhs are packed and passed as device pointer
+
+  inline
+  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
+                           int my_rows_,
+                           int my_cols_,
+                           int my_rhs_,
+                           int* matrix_size,
+                           int* num_procsr,
+                           int* num_rhs,
+                           double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+
+    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
+    typedef Kokkos::View<Kokkos::complex<float>**,
+                         Kokkos::LayoutLeft,
+#ifdef KOKKOS_ENABLE_CUDA
+                         Kokkos::CudaSpace,
+#else
+                         Kokkos::Experimental::HIPSpace,
+#endif
+                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
+
+    AA_Internal AA_i(reinterpret_cast<Kokkos::complex<float> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
+
+#ifdef PRINT_STATUS
+    printf("FactorSolve_devPtr (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA_i,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+#endif
+    }
+  }
+
+  /// Adelus FactorSolve_hostPtr
+  /// Matrix and rhs are packed and passed as host pointer
+
+  inline
+  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
+                            int my_rows_,
+                            int my_cols_,
+                            int my_rhs_,
+                            int* matrix_size,
+                            int* num_procsr,
+                            int* num_rhs,
+                            double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+
+    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
+    typedef Kokkos::View<Kokkos::complex<float>**,
+                         Kokkos::LayoutLeft,
+                         Kokkos::HostSpace,
+                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
+
+    AA_Internal AA_i(reinterpret_cast<Kokkos::complex<float> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
+
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
+    typedef Kokkos::View<Kokkos::complex<float>**,
+                         Kokkos::LayoutLeft,
+#ifdef KOKKOS_ENABLE_CUDA
+                         Kokkos::CudaSpace> AA_Internal_dev;
+#else
+                         Kokkos::Experimental::HIPSpace> AA_Internal_dev;
+#endif
+
+    AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
+
+#ifdef PRINT_STATUS
+    printf("FactorSolve_hostPtr with CUDA solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    Kokkos::deep_copy( AA_i_dev, AA_i );
+
+    lusolve_(AA_i_dev,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+
+    Kokkos::deep_copy( AA_i, AA_i_dev );
+#else//OpenMP
+#ifdef PRINT_STATUS
+    printf("FactorSolve_hostPtr with host solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA_i,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+#endif
+    }
+  }
+#endif
+
+#ifdef SREAL
+  /// Adelus FactorSolve_devPtr
+  /// Matrix and rhs are packed and passed as device pointer
+
+  inline
+  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
+                           int my_rows_,
+                           int my_cols_,
+                           int my_rhs_,
+                           int* matrix_size,
+                           int* num_procsr,
+                           int* num_rhs,
+                           double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+
+    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
+    typedef Kokkos::View<float**,
+                         Kokkos::LayoutLeft,
+#ifdef KOKKOS_ENABLE_CUDA
+                         Kokkos::CudaSpace,
+#else
+                         Kokkos::Experimental::HIPSpace,
+#endif
+                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
+
+    AA_Internal AA_i(reinterpret_cast<float *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
+
+#ifdef PRINT_STATUS
+    printf("FactorSolve_devPtr (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA_i,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+#endif
+    }
+  }
+
+  /// Adelus FactorSolve_hostPtr
+  /// Matrix and rhs are packed and passed as host pointer
+
+  inline
+  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
+                            int my_rows_,
+                            int my_cols_,
+                            int my_rhs_,
+                            int* matrix_size,
+                            int* num_procsr,
+                            int* num_rhs,
+                            double* secs ) {
+    int rank;
+
+    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+
+    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
+    typedef Kokkos::View<float**,
+                         Kokkos::LayoutLeft,
+                         Kokkos::HostSpace,
+                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
+
+    AA_Internal AA_i(reinterpret_cast<float *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
+
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
+    typedef Kokkos::View<float**,
+                         Kokkos::LayoutLeft,
+#ifdef KOKKOS_ENABLE_CUDA
+                         Kokkos::CudaSpace> AA_Internal_dev;
+#else
+                         Kokkos::Experimental::HIPSpace> AA_Internal_dev;
+#endif
+
+    AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
+
+#ifdef PRINT_STATUS
+    printf("FactorSolve_hostPtr with CUDA solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    Kokkos::deep_copy( AA_i_dev, AA_i );
+
+    lusolve_(AA_i_dev,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+
+    Kokkos::deep_copy( AA_i, AA_i_dev );
+#else//OpenMP
+#ifdef PRINT_STATUS
+    printf("FactorSolve_hostPtr with host solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+#endif
+
+    lusolve_(AA_i,
+             matrix_size,
+             num_procsr,
+             num_rhs,
+             secs);
+#endif
+    }
+  }
+#endif
+
+}
+
diff --git a/packages/adelus/src/Adelus_factor.hpp b/packages/adelus/src/Adelus_factor.hpp
index 19902e69d5e5..b7f606e96a3c 100644
--- a/packages/adelus/src/Adelus_factor.hpp
+++ b/packages/adelus/src/Adelus_factor.hpp
@@ -92,9 +92,14 @@ extern MPI_Comm col_comm;
 
 namespace Adelus {
 
-template<class ZDView, class ViewType1D, class ViewType2D, class ViewIntType1D>
+template<class HandleType,
+         class ZDView,
+         class ViewType1D,
+         class ViewType2D,
+         class ViewIntType1D>
 inline
-void factor(ZDView& ZV,                    // matrix and rhs
+void factor(HandleType& ahandle,           // handle containg metadata
+            ZDView&     ZV,                // matrix and rhs
             ViewType2D& col1_view,         // col used for updating a col
             ViewType2D& row1_view,         // diagonal row
             ViewType1D& row2_view,         // pivot row
@@ -178,13 +183,13 @@ void factor(ZDView& ZV,                    // matrix and rhs
 
   // Distribution for the matrix on me
 
-  MPI_Comm_size(MPI_COMM_WORLD,&numprocs);
+  MPI_Comm_size(ahandle.get_comm(),&numprocs);
   if ( (numprocs/nprocs_row) * nprocs_row != numprocs ) {
      if (me == 0) {
        printf("nprocs_row must go into numprocs perfectly!\n");
        printf("Try a different value of nprocs_row.\n");
      }
-     MPI_Barrier(MPI_COMM_WORLD);
+     MPI_Barrier(ahandle.get_comm());
      exit(0);
   }
 
@@ -413,7 +418,7 @@ void factor(ZDView& ZV,                    // matrix and rhs
       for (rdist = 1;rdist <= MAXDIST;rdist++){
         if (rowplus(rdist) == c_owner) break;
         bytes = sizeof(gpivot_row);
-        MPI_Send(&gpivot_row,bytes,MPI_BYTE,rowplus(rdist),LUPIVROWTYPE+j,MPI_COMM_WORLD);
+        MPI_Send(&gpivot_row,bytes,MPI_BYTE,rowplus(rdist),LUPIVROWTYPE+j,ahandle.get_comm());
       }
 #ifdef GET_TIMING
       bcastpivstime += (MPI_Wtime()-t1);
@@ -436,9 +441,9 @@ void factor(ZDView& ZV,                    // matrix and rhs
         if (rowplus(rdist) == c_owner) break;
         bytes=sizeof(ADELUS_DATA_TYPE)*col_len;
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-        MPI_Send(h_coltmp.data(),bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,MPI_COMM_WORLD);
+        MPI_Send(h_coltmp.data(),bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,ahandle.get_comm());
 #else //GPU-aware MPI
-        MPI_Send(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,MPI_COMM_WORLD);
+        MPI_Send(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,ahandle.get_comm());
 #endif
       }
 #ifdef GET_TIMING
@@ -462,10 +467,10 @@ void factor(ZDView& ZV,                    // matrix and rhs
 
       bytes=col_len*sizeof(ADELUS_DATA_TYPE);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-      MPI_Irecv(h_coltmp.data(),bytes,MPI_BYTE,MPI_ANY_SOURCE,LUROWTYPE+j,MPI_COMM_WORLD,&msgrequest);
+      MPI_Irecv(h_coltmp.data(),bytes,MPI_BYTE,MPI_ANY_SOURCE,LUROWTYPE+j,ahandle.get_comm(),&msgrequest);
 #else //GPU-aware MPI
       MPI_Irecv(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,
-                MPI_ANY_SOURCE,LUROWTYPE+j,MPI_COMM_WORLD,&msgrequest);
+                MPI_ANY_SOURCE,LUROWTYPE+j,ahandle.get_comm(),&msgrequest);
 #endif
 
 #ifdef GET_TIMING
@@ -474,7 +479,7 @@ void factor(ZDView& ZV,                    // matrix and rhs
       bytes = 0; type = LUPIVROWTYPE+j;
       bytes=4;
       bytes = sizeof(gpivot_row);
-      MPI_Recv(&gpivot_row,bytes,MPI_BYTE,MPI_ANY_SOURCE,type,MPI_COMM_WORLD,&msgstatus);
+      MPI_Recv(&gpivot_row,bytes,MPI_BYTE,MPI_ANY_SOURCE,type,ahandle.get_comm(),&msgstatus);
 #ifdef GET_TIMING
       bcastpivrtime += (MPI_Wtime()-t1);
 #endif
@@ -488,7 +493,7 @@ void factor(ZDView& ZV,                    // matrix and rhs
         for (rdist = 1;rdist <= MAXDIST;rdist++) {
           if (rowplus(rdist) == c_owner) break;
           bytes = sizeof(gpivot_row);
-          MPI_Send(&gpivot_row,bytes,MPI_BYTE,rowplus(rdist),LUPIVROWTYPE+j,MPI_COMM_WORLD);
+          MPI_Send(&gpivot_row,bytes,MPI_BYTE,rowplus(rdist),LUPIVROWTYPE+j,ahandle.get_comm());
         }
 #ifdef GET_TIMING
         bcastpivstime += (MPI_Wtime()-t1);
@@ -520,9 +525,9 @@ void factor(ZDView& ZV,                    // matrix and rhs
           if (rowplus(rdist) == c_owner) break;
           bytes=col_len*sizeof(ADELUS_DATA_TYPE);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-          MPI_Send(h_coltmp.data(),bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,MPI_COMM_WORLD);
+          MPI_Send(h_coltmp.data(),bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,ahandle.get_comm());
 #else //GPU-aware MPI
-          MPI_Send(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,MPI_COMM_WORLD);
+          MPI_Send(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,ahandle.get_comm());
 #endif
         }
 #ifdef GET_TIMING
@@ -728,9 +733,9 @@ void factor(ZDView& ZV,                    // matrix and rhs
 #endif
         bytes=(row_len+colcnt)*sizeof(ADELUS_DATA_TYPE);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-        MPI_Send(h_row2.data(),bytes,MPI_BYTE,pivot_owner,LUSENDTYPE+j,MPI_COMM_WORLD);
+        MPI_Send(h_row2.data(),bytes,MPI_BYTE,pivot_owner,LUSENDTYPE+j,ahandle.get_comm());
 #else //GPU-aware MPI
-        MPI_Send(row2_view.data(),bytes,MPI_BYTE,pivot_owner,LUSENDTYPE+j,MPI_COMM_WORLD);
+        MPI_Send(row2_view.data(),bytes,MPI_BYTE,pivot_owner,LUSENDTYPE+j,ahandle.get_comm());
 #endif
 #ifdef GET_TIMING
         sendrowtime += (MPI_Wtime()-t1);
@@ -745,9 +750,9 @@ void factor(ZDView& ZV,                    // matrix and rhs
         if (me != r_owner) {
           bytes=(row_len+colcnt)*sizeof(ADELUS_DATA_TYPE);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-          MPI_Recv(h_row2.data(),bytes,MPI_BYTE,r_owner,LUSENDTYPE+j,MPI_COMM_WORLD,&msgstatus);
+          MPI_Recv(h_row2.data(),bytes,MPI_BYTE,r_owner,LUSENDTYPE+j,ahandle.get_comm(),&msgstatus);
 #else //GPU-aware MPI
-          MPI_Recv(row2_view.data(),bytes,MPI_BYTE,r_owner,LUSENDTYPE+j,MPI_COMM_WORLD,&msgstatus);
+          MPI_Recv(row2_view.data(),bytes,MPI_BYTE,r_owner,LUSENDTYPE+j,ahandle.get_comm(),&msgstatus);
 #endif
         }
 #ifdef GET_TIMING
diff --git a/packages/adelus/src/Adelus_forward.hpp b/packages/adelus/src/Adelus_forward.hpp
index 274999d57283..58c6f0fc89aa 100644
--- a/packages/adelus/src/Adelus_forward.hpp
+++ b/packages/adelus/src/Adelus_forward.hpp
@@ -60,9 +60,9 @@
 
 namespace Adelus {
 
-template<class ZViewType, class RHSViewType>
+template<class HandleType, class ZViewType, class RHSViewType>
 inline
-void forward(ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
+void forward(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
 {
   using value_type      = typename ZViewType::value_type ;
   using execution_space = typename ZViewType::device_type::execution_space ;
@@ -152,7 +152,7 @@ void forward(ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
         KokkosBlas::gemm("N", "N", d_min_one, sub_pivot_col, ck, d_one, sub_rhs);
       }
     }
-    MPI_Barrier(MPI_COMM_WORLD);
+    MPI_Barrier(ahandle.get_comm());
   }// end of for (k=0; k<= nrows_matrix-2; k++)
 
 #ifdef GET_TIMING
diff --git a/packages/adelus/src/Adelus_perm1.hpp b/packages/adelus/src/Adelus_perm1.hpp
index 99da2e6cf4dd..517bbaafd321 100644
--- a/packages/adelus/src/Adelus_perm1.hpp
+++ b/packages/adelus/src/Adelus_perm1.hpp
@@ -101,9 +101,9 @@ namespace Adelus {
   
   //  Permutes -- unwraps the torus-wrap for the solution
   //              using the communication buffer
-  template<class ZDView>
+  template<class HandleType, class ZDView>
   inline
-  void perm1_(ZDView& ZV, int *num_my_rhs) {
+  void perm1_(HandleType& ahandle, ZDView& ZV, int *num_my_rhs) {
   
     int i;
     int my_rhs_;
@@ -222,14 +222,14 @@ namespace Adelus {
             bytes = (my_rhs_ + 1)*sizeof(ADELUS_DATA_TYPE);
   
             MPI_Irecv( (char *)(reinterpret_cast<ADELUS_DATA_TYPE *>(rhs_temp.data())+next_s),bytes,MPI_CHAR,MPI_ANY_SOURCE,
-                  MPI_ANY_TAG,MPI_COMM_WORLD,&msgrequest);
+                  MPI_ANY_TAG,ahandle.get_comm(),&msgrequest);
 
            auto sub_ZV = subview(ZV, ptr1_idx, Kokkos::ALL());     				
            zcopy_wr_local_index(my_rhs_, sub_ZV, temp_s, local_index);
   
            type = PERMTYPE+change_send;
            MPI_Send((char *)(reinterpret_cast<ADELUS_DATA_TYPE *>(temp_s.data())),bytes,MPI_CHAR,dest,
-                   type,MPI_COMM_WORLD);
+                   type,ahandle.get_comm());
            change_send++;
   
            next_s = change_send * (my_rhs_+1);
@@ -286,9 +286,9 @@ namespace Adelus {
   
   //  Permutes -- unwraps the torus-wrap for the solution
   //              using the communication buffer
-  template<class ZDView>
+  template<class HandleType, class ZDView>
   inline
-  void perm1_(ZDView& ZV, int *num_my_rhs) {
+  void perm1_(HandleType& ahandle, ZDView& ZV, int *num_my_rhs) {
   
     int i;
     int my_rhs_;
diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
index 42a734ec4569..c7f36edcfbfa 100644
--- a/packages/adelus/src/Adelus_perm_mat.hpp
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -69,9 +69,9 @@
 
 namespace Adelus {
 
-  template<class PViewType>
+  template<class HandleType, class PViewType>
   inline 
-  void exchange_pivots(PViewType& lpiv_view, PViewType& permute) {
+  void exchange_pivots(HandleType& ahandle, PViewType& lpiv_view, PViewType& permute) {
   
     MPI_Status msgstatus;
     int rank_row,k_row,pivot_col;
@@ -84,23 +84,23 @@ namespace Adelus {
         rank_row = k_row*nprocs_row;
         if (me == pivot_col) {
           int j=k/nprocs_row;
-          MPI_Send(lpiv_view.data()+j,1,MPI_INT,rank_row,0,MPI_COMM_WORLD);
+          MPI_Send(lpiv_view.data()+j,1,MPI_INT,rank_row,0,ahandle.get_comm());
         }
         if (me == rank_row) {
           int i=k/nprocs_col;
-          MPI_Recv(permute.data()+i,1,MPI_INT,pivot_col,0,MPI_COMM_WORLD,&msgstatus);
+          MPI_Recv(permute.data()+i,1,MPI_INT,pivot_col,0,ahandle.get_comm(),&msgstatus);
         }
       }
     }
-    MPI_Barrier(MPI_COMM_WORLD);
+    MPI_Barrier(ahandle.get_comm());
     // Broadcast to the rest of the processors in row_comm
     MPI_Bcast(permute.data(),my_rows,MPI_INT,0,row_comm);
 
   }// End of function exchange_pivots
   
-  template<class ZViewType, class PViewType>
+  template<class HandleType, class ZViewType, class PViewType>
   inline
-  void permute_mat(ZViewType& Z, PViewType& lpiv_view, PViewType& permute) {
+  void permute_mat(HandleType& ahandle, ZViewType& Z, PViewType& lpiv_view, PViewType& permute) {
     using value_type  = typename ZViewType::value_type;
 #ifndef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
     using execution_space = typename ZViewType::device_type::execution_space ;
@@ -138,7 +138,7 @@ namespace Adelus {
    t1 = MPI_Wtime();
 #endif
 
-    exchange_pivots(lpiv_view, permute);
+    exchange_pivots(ahandle, lpiv_view, permute);
 
 #ifdef GET_TIMING
     exchpivtime = MPI_Wtime()-t1;
diff --git a/packages/adelus/src/Adelus_perm_rhs.hpp b/packages/adelus/src/Adelus_perm_rhs.hpp
index 2e9b0196be55..1805593b28a8 100644
--- a/packages/adelus/src/Adelus_perm_rhs.hpp
+++ b/packages/adelus/src/Adelus_perm_rhs.hpp
@@ -70,9 +70,9 @@
 
 namespace Adelus {
   
-  template<class ZViewType, class PViewType>
+  template<class HandleType, class ZViewType, class PViewType>
   inline
-  void permute_rhs(ZViewType& RHS, PViewType& permute, int& my_num_rhs) {
+  void permute_rhs(HandleType& ahandle, ZViewType& RHS, PViewType& permute, int& my_num_rhs) {
     using value_type      = typename ZViewType::value_type;
     using execution_space = typename ZViewType::device_type::execution_space ;
     using memory_space    = typename ZViewType::device_type::memory_space ;
diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index df691db93812..774dc5700a29 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -104,9 +104,9 @@ void elimination_rhs(int N, ZView& ptr2, RHSView& ptr3, DView& ptr4, int act_col
 #endif
 }
 
-template<class ZViewType, class RHSViewType>
+template<class HandleType, class ZViewType, class RHSViewType>
 inline
-void back_solve6(ZViewType& Z, RHSViewType& RHS)
+void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 {
   using value_type      = typename ZViewType::value_type;
 #ifdef PRINT_STATUS
@@ -324,9 +324,9 @@ void back_solve6(ZViewType& Z, RHSViewType& RHS)
         type[0]  = SOROWTYPE+j;
 
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        MPI_Irecv(reinterpret_cast<char *>(h_row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], MPI_COMM_WORLD, &msgrequest);
+        MPI_Irecv(reinterpret_cast<char *>(h_row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], ahandle.get_comm(), &msgrequest);
 #else
-        MPI_Irecv(reinterpret_cast<char *>(  row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], MPI_COMM_WORLD, &msgrequest);
+        MPI_Irecv(reinterpret_cast<char *>(  row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], ahandle.get_comm(), &msgrequest);
 #endif
 
         n_rhs_this = bytes[0]/sizeof(ADELUS_DATA_TYPE)/my_rows;
@@ -341,9 +341,9 @@ void back_solve6(ZViewType& Z, RHSViewType& RHS)
         type[1]  = SOROWTYPE+j;
 
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        MPI_Send(reinterpret_cast<char *>(h_rhs.data()), bytes[1], MPI_CHAR, dest[1], type[1], MPI_COMM_WORLD);
+        MPI_Send(reinterpret_cast<char *>(h_rhs.data()), bytes[1], MPI_CHAR, dest[1], type[1], ahandle.get_comm());
 #else //GPU-aware MPI
-        MPI_Send(reinterpret_cast<char *>(RHS.data()), bytes[1], MPI_CHAR, dest[1], type[1], MPI_COMM_WORLD);
+        MPI_Send(reinterpret_cast<char *>(RHS.data()), bytes[1], MPI_CHAR, dest[1], type[1], ahandle.get_comm());
 #endif
 
         MPI_Wait(&msgrequest,&msgstatus);
diff --git a/packages/adelus/src/Adelus_vars.hpp b/packages/adelus/src/Adelus_vars.hpp
index e58f5aeb255b..ec7f62679065 100644
--- a/packages/adelus/src/Adelus_vars.hpp
+++ b/packages/adelus/src/Adelus_vars.hpp
@@ -75,6 +75,141 @@ int  myrow,mycol;
 
 MPI_Comm row_comm,col_comm;
 
+template <class ScalarType,
+          class ExecutionSpace,
+          class MemorySpace>
+class AdelusHandle {
+ public:
+  using value_type      = ScalarType;
+  using execution_space = ExecutionSpace;
+  using memory_space    = MemorySpace;
+
+ private:
+  int myrank;         // process id information
+
+  /*int nprocs_cube;    // num of procs in the allocated cube
+  int nprocs_row;     // num of procs to which a row is assigned
+  int nprocs_col;     // num of procs to which a col is assigned
+  //int   max_procs;  // max num of procs in any dimension
+
+  int nrows_matrix;   // number of rows in the matrix
+  int ncols_matrix;   // number of cols in the matrix
+
+  int my_first_row;   // proc position in a row
+  int my_first_col;   // proc position in a col
+  
+  int my_rows;        // num of rows I own
+  int my_cols;        // num of cols I own
+  
+  int nrhs;           // number of right hand sides in the matrix
+  int my_rhs;         // number of right hand sides that I own
+  
+  int blksz;          // block size for BLAS 3 operations
+  
+  int myrow;          // process id in the row_comm 
+  int mycol;          // process id in the col_comm
+  
+  MPI_Comm row_comm;
+  MPI_Comm col_comm;*/
+  MPI_Comm comm;
+
+ public:
+  AdelusHandle( MPI_Comm comm_,
+                const int matrix_size_,
+                const int num_procsr_,
+                const int num_rhs_ )
+      : comm(comm_)/*,
+        nrows_matrix(matrix_size_),
+        ncols_matrix(matrix_size_),
+        nprocs_row(num_procsr_),
+        nrhs(num_rhs_)*/ {
+    //// Determine who I am (me ) and the total number of nodes (nprocs_cube)
+    //MPI_Comm_size(comm, &nprocs_cube);
+    MPI_Comm_rank(comm, &myrank);
+    /*nprocs_col = nprocs_cube/nprocs_row;
+
+    // Set up communicators for rows and columns
+    myrow = mesh_row(myrank);
+    mycol = mesh_col(myrank);
+.
+    MPI_Comm_split(comm, myrow,mycol, &row_comm);
+
+    MPI_Comm_split(comm, mycol, myrow, &col_comm);
+
+    // Distribution for the matrix on myrank
+    my_first_col = mesh_col(myrank);
+    my_first_row = mesh_row(myrank);
+
+    my_rows = nrows_matrix / nprocs_col;
+    if (my_first_row < nrows_matrix % nprocs_col) my_rows++;
+    my_cols = ncols_matrix / nprocs_row;
+    if (my_first_col < ncols_matrix % nprocs_row) my_cols++;
+
+    // blksz parameter must be set
+    blksz = DEFBLKSZ;
+
+    // Distribution for the rhs on myrank
+    my_rhs = nrhs / nprocs_row;
+    if (my_first_col < nrhs % nprocs_row) my_rhs++;*/
+  }
+
+  ~AdelusHandle(){}
+
+  KOKKOS_INLINE_FUNCTION
+  MPI_Comm get_comm() const { return comm; }
+
+  /*KOKKOS_INLINE_FUNCTION
+  MPI_Comm get_row_comm() const { return row_comm; }
+
+  KOKKOS_INLINE_FUNCTION
+  MPI_Comm get_col_comm() const { return col_comm; }*/
+
+  KOKKOS_INLINE_FUNCTION
+  int get_myrank() const { return myrank; }
+
+  /*KOKKOS_INLINE_FUNCTION
+  int get_myrow() const { return myrow; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_mycol() const { return mycol; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_nprocs_cube() const { return nprocs_cube; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_nprocs_row() const { return nprocs_row; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_nprocs_col() const { return nprocs_col; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_nrows_matrix() const { return nrows_matrix; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_ncols_matrix() const { return ncols_matrix; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_my_first_row() const { return my_first_row; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_my_first_col() const { return my_first_col; }
+  
+  KOKKOS_INLINE_FUNCTION
+  int get_my_rows() const { return my_rows; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_my_cols() const { return my_cols; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_nrhs() const { return nrhs; }
+  
+  KOKKOS_INLINE_FUNCTION
+  int get_my_rhs() const { return my_rhs; }
+
+  KOKKOS_INLINE_FUNCTION
+  int get_blksz() const { return blksz; }*/
+};
+
 }//namespace Adelus
 
 #endif
diff --git a/packages/adelus/src/Adelus_vars.hpp_ b/packages/adelus/src/Adelus_vars.hpp_
new file mode 100644
index 000000000000..e58f5aeb255b
--- /dev/null
+++ b/packages/adelus/src/Adelus_vars.hpp_
@@ -0,0 +1,80 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#ifndef __ADELUS_VARS_HPP__
+#define __ADELUS_VARS_HPP__
+
+
+namespace Adelus {
+	
+int   me;               // processor id information
+
+int   nprocs_cube;		// num of procs in the allocated cube
+int   nprocs_row;		// num of procs to which a row is assigned
+int   nprocs_col;		// num of procs to which a col is assigned
+int   max_procs;		// max num of procs in any dimension
+
+int   nrows_matrix;		// number of rows in the matrix
+int   ncols_matrix;		// number of cols in the matrix
+
+int   my_first_row;		// proc position in a row
+int   my_first_col;		// proc position in a col
+
+int   my_rows;			// num of rows I own
+int   my_cols;			// num of cols I own
+
+int   nrhs;             // number of right hand sides in the matrix
+int   my_rhs;           // number of right hand sides that I own
+
+int   blksz;			// block size for BLAS 3 operations
+
+int  myrow,mycol;
+
+MPI_Comm row_comm,col_comm;
+
+}//namespace Adelus
+
+#endif
diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
index 4bafd21c1230..1acd057d1e0e 100644
--- a/packages/adelus/src/Adelus_x_factor.hpp
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -67,9 +67,10 @@
 
 namespace Adelus {
 
-template<class ZViewType, class PViewType>
+template<class HandleType, class ZViewType, class PViewType>
 inline
-void lu_(ZViewType& Z, PViewType& permute, int *matrix_size, int *num_procsr, double *secs)
+void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute,
+         int *matrix_size, int *num_procsr, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
@@ -86,8 +87,8 @@ void lu_(ZViewType& Z, PViewType& permute, int *matrix_size, int *num_procsr, do
   int totmem;
 
   // Determine who I am (me ) and the total number of nodes (nprocs_cube)
-  MPI_Comm_size(MPI_COMM_WORLD,&nprocs_cube);
-  MPI_Comm_rank(MPI_COMM_WORLD, &me);
+  MPI_Comm_size(ahandle.get_comm(),&nprocs_cube);
+  MPI_Comm_rank(ahandle.get_comm(), &me);
 
   nrows_matrix = *matrix_size;
   ncols_matrix = *matrix_size;
@@ -101,9 +102,9 @@ void lu_(ZViewType& Z, PViewType& permute, int *matrix_size, int *num_procsr, do
   myrow = mesh_row(me);
   mycol = mesh_col(me);
 
-  MPI_Comm_split(MPI_COMM_WORLD,myrow,mycol,&row_comm);
+  MPI_Comm_split(ahandle.get_comm(),myrow,mycol,&row_comm);
 
-  MPI_Comm_split(MPI_COMM_WORLD,mycol,myrow,&col_comm);
+  MPI_Comm_split(ahandle.get_comm(),mycol,myrow,&col_comm);
 
   // Distribution for the matrix on me
   my_first_col = mesh_col(me);
@@ -153,7 +154,8 @@ void lu_(ZViewType& Z, PViewType& permute, int *matrix_size, int *num_procsr, do
   {
     TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: factor"));
 #endif
-    factor(Z,
+    factor(ahandle,
+           Z,
            col1_view,
            row1_view,
            row2_view, 
@@ -172,11 +174,11 @@ void lu_(ZViewType& Z, PViewType& permute, int *matrix_size, int *num_procsr, do
     typename ZViewType::HostMirror h_Z = Kokkos::create_mirror_view( Z );
     Kokkos::deep_copy (h_Z, Z);
   
-    permute_mat(h_Z, lpiv_view, permute);
+    permute_mat(ahandle, h_Z, lpiv_view, permute);
 
     Kokkos::deep_copy (Z, h_Z);
 #else
-    permute_mat(Z, lpiv_view, permute);
+    permute_mat(ahandle, Z, lpiv_view, permute);
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
   }
diff --git a/packages/adelus/src/Adelus_x_solve.hpp b/packages/adelus/src/Adelus_x_solve.hpp
index c6b021508128..e04d174c76e8 100644
--- a/packages/adelus/src/Adelus_x_solve.hpp
+++ b/packages/adelus/src/Adelus_x_solve.hpp
@@ -69,9 +69,10 @@
 
 namespace Adelus {
 
-template<class ZViewType, class RHSViewType, class PViewType>
+template<class HandleType, class ZViewType, class RHSViewType, class PViewType>
 inline
-void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, double *secs)
+void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& permute,
+            int *num_rhs, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
@@ -113,9 +114,9 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
 #endif
       // Permute the RHS
 #ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
-      permute_rhs(h_RHS, permute, my_rhs);
+      permute_rhs(ahandle, h_RHS, permute, my_rhs);
 #else
-      permute_rhs(RHS, permute, my_rhs);
+      permute_rhs(ahandle, RHS, permute, my_rhs);
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
@@ -127,9 +128,9 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
 #endif
       //Forward Solve
 #ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
-      forward(h_Z, h_RHS, my_rhs);
+      forward(ahandle, h_Z, h_RHS, my_rhs);
 #else
-      forward(Z, RHS, my_rhs);
+      forward(ahandle, Z, RHS, my_rhs);
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
@@ -147,7 +148,7 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: backsolve"));
 #endif
-      back_solve6(Z, RHS);
+      back_solve6(ahandle, Z, RHS);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
@@ -158,7 +159,7 @@ void solve_(ZViewType& Z, RHSViewType& RHS, PViewType& permute, int *num_rhs, do
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: permutation"));
 #endif
-      perm1_(RHS, &my_rhs);
+      perm1_(ahandle, RHS, &my_rhs);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
diff --git a/packages/adelus/src/Adelus_xlu_solve.hpp b/packages/adelus/src/Adelus_xlu_solve.hpp
index b7d864848ef6..092acb56f1fa 100644
--- a/packages/adelus/src/Adelus_xlu_solve.hpp
+++ b/packages/adelus/src/Adelus_xlu_solve.hpp
@@ -68,9 +68,10 @@
 
 namespace Adelus {
 
-template<class ZRHSViewType>
+template<class HandleType, class ZRHSViewType>
 inline
-void lusolve_(ZRHSViewType& ZRHS, int *matrix_size, int *num_procsr, int *num_rhs, double *secs)
+void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS,
+              int *matrix_size, int *num_procsr, int *num_rhs, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
@@ -87,8 +88,8 @@ void lusolve_(ZRHSViewType& ZRHS, int *matrix_size, int *num_procsr, int *num_rh
   int totmem;
 
   // Determine who I am (me ) and the total number of nodes (nprocs_cube)
-  MPI_Comm_size(MPI_COMM_WORLD,&nprocs_cube);
-  MPI_Comm_rank(MPI_COMM_WORLD, &me);
+  MPI_Comm_size(ahandle.get_comm(),&nprocs_cube);
+  MPI_Comm_rank(ahandle.get_comm(), &me);
 
   nrows_matrix = *matrix_size;
   ncols_matrix = *matrix_size;
@@ -102,9 +103,9 @@ void lusolve_(ZRHSViewType& ZRHS, int *matrix_size, int *num_procsr, int *num_rh
   myrow = mesh_row(me);
   mycol = mesh_col(me);
 
-  MPI_Comm_split(MPI_COMM_WORLD,myrow,mycol,&row_comm);
+  MPI_Comm_split(ahandle.get_comm(),myrow,mycol,&row_comm);
 
-  MPI_Comm_split(MPI_COMM_WORLD,mycol,myrow,&col_comm);
+  MPI_Comm_split(ahandle.get_comm(),mycol,myrow,&col_comm);
 
   // Distribution for the matrix on me
   my_first_col = mesh_col(me);
@@ -161,7 +162,8 @@ void lusolve_(ZRHSViewType& ZRHS, int *matrix_size, int *num_procsr, int *num_rh
   {
     TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: factor"));
 #endif
-    factor(ZRHS,
+    factor(ahandle,
+           ZRHS,
            col1_view,
            row1_view,
            row2_view, 
@@ -184,7 +186,7 @@ void lusolve_(ZRHSViewType& ZRHS, int *matrix_size, int *num_procsr, int *num_rh
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: backsolve"));
 #endif
-      back_solve6(Z, RHS);
+      back_solve6(ahandle, Z, RHS);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
@@ -198,7 +200,7 @@ void lusolve_(ZRHSViewType& ZRHS, int *matrix_size, int *num_procsr, int *num_rh
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: permutation"));
 #endif
-      perm1_(RHS, &my_rhs);
+      perm1_(ahandle, RHS, &my_rhs);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
diff --git a/packages/adelus/test/vector_random/cxx_main.cpp b/packages/adelus/test/vector_random/cxx_main.cpp
index 2cbd9cbf4642..fa9bf345e276 100644
--- a/packages/adelus/test/vector_random/cxx_main.cpp
+++ b/packages/adelus/test/vector_random/cxx_main.cpp
@@ -335,12 +335,16 @@ int main(int argc, char *argv[])
 
   Kokkos::deep_copy( subview(A,Kokkos::ALL(),mycols), subview(h_A,Kokkos::ALL(),mycols) );
 
+  // Create handle
+  Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
+    ahandle(MPI_COMM_WORLD, matrix_size, nprocs_per_row, numrhs );
+
   // Now Solve the Problem
 
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve   ****" << std::endl;
 
-  Adelus::FactorSolve (A, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::FactorSolve (ahandle, A, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
 
   if( rank == 0) {
     std::cout << " ----  Solution time  ----   " << secs << "  in secs. " << std::endl;
diff --git a/packages/adelus/test/vector_random_fs/cxx_main.cpp b/packages/adelus/test/vector_random_fs/cxx_main.cpp
index 955b9c5f1f08..2d4179e4e8d9 100644
--- a/packages/adelus/test/vector_random_fs/cxx_main.cpp
+++ b/packages/adelus/test/vector_random_fs/cxx_main.cpp
@@ -342,12 +342,16 @@ int main(int argc, char *argv[])
 
   Kokkos::deep_copy( B, h_B );
 
+  // Create handle
+  Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
+    ahandle(MPI_COMM_WORLD, matrix_size, nprocs_per_row, numrhs );
+
   // Now Factor the matrix
 
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Factor   ****" << std::endl;
 
-  Adelus::Factor (A, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &secs);
+  Adelus::Factor (ahandle, A, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &secs);
 
   if( rank == 0) {
     std::cout << " ----  Factor time  ----   " << secs << "  in secs. " << std::endl;
@@ -362,7 +366,7 @@ int main(int argc, char *argv[])
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve (1st)   ****" << std::endl;
 
-  Adelus::Solve (A, B, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::Solve (ahandle, A, B, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
 
   if( rank == 0)
     std::cout << " ----  Solution time (1st)  ----   " << secs << "  in secs. " << std::endl;
@@ -374,7 +378,7 @@ int main(int argc, char *argv[])
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve (2nd)   ****" << std::endl;
 
-  Adelus::Solve (A, B, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::Solve (ahandle, A, B, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
 
   if( rank == 0)
     std::cout << " ----  Solution time (2nd)  ----   " << secs << "  in secs. " << std::endl;

From 36832a4a1a1aa50a19f38c97e6e53a344ccdc93c Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Thu, 16 Jun 2022 09:25:16 -0700
Subject: [PATCH 018/130] Delete unnecessary files

---
 packages/adelus/src/Adelus.hpp_      | 639 ---------------------------
 packages/adelus/src/Adelus_vars.hpp_ |  80 ----
 2 files changed, 719 deletions(-)
 delete mode 100644 packages/adelus/src/Adelus.hpp_
 delete mode 100644 packages/adelus/src/Adelus_vars.hpp_

diff --git a/packages/adelus/src/Adelus.hpp_ b/packages/adelus/src/Adelus.hpp_
deleted file mode 100644
index 66ac927db29a..000000000000
--- a/packages/adelus/src/Adelus.hpp_
+++ /dev/null
@@ -1,639 +0,0 @@
-/*
-//@HEADER
-// ************************************************************************
-//
-//                        Adelus v. 1.0
-//       Copyright (2020) National Technology & Engineering
-//               Solutions of Sandia, LLC (NTESS).
-//
-// Under the terms of Contract DE-NA0003525 with NTESS,
-// the U.S. Government retains certain rights in this software.
-//
-// Redistribution and use in source and binary forms, with or without
-// modification, are permitted provided that the following conditions are
-// met:
-//
-// 1. Redistributions of source code must retain the above copyright
-// notice, this list of conditions and the following disclaimer.
-//
-// 2. Redistributions in binary form must reproduce the above copyright
-// notice, this list of conditions and the following disclaimer in the
-// documentation and/or other materials provided with the distribution.
-//
-// 3. Neither the name of NTESS nor the names of the contributors may be
-// used to endorse or promote products derived from this software without
-// specific prior written permission.
-//
-// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
-// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
-// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
-// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
-// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
-// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
-// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
-// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
-// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
-// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
-// POSSIBILITY OF SUCH DAMAGE.
-//
-// Questions? Contact Vinh Dang (vqdang@sandia.gov)
-//                    Joseph Kotulski (jdkotul@sandia.gov)
-//                    Siva Rajamanickam (srajama@sandia.gov)
-//
-// ************************************************************************
-//@HEADER
-*/
-
-#pragma once
-
-#include <Kokkos_View.hpp>
-#include <Adelus_defines.h>
-#include <Adelus_xlu_solve.hpp>
-#include <Adelus_x_factor.hpp>
-#include <Adelus_x_solve.hpp>
-#include <Adelus_distribute.hpp>
-#include <mpi.h>
-
-// Adelus: provides the functionality to interface to a dense LU solver
-
-namespace Adelus {
-
-  /// Adelus GetDistirbution
-  /// Gives the distribution information that is required by the dense solver
-  
-  /// \param nprocs_row_ (In)        - number of processors for a row
-  /// \param number_of_unknowns (In) - order of the dense matrix
-  /// \param nrhs_ (In)              - number of right hand sides
-  /// \param my_rows_ (Out)          - number of rows of the matrix on this processor
-  /// \param my_cols_ (Out)          - number of columns of the matrix on this processor
-  /// \param my_first_row_ (Out)     - first (global) row number on this processor (array starts at index 1)
-  /// \param my_first_col_ (Out)     - first (global) column number on this processor (array starts at index 1)
-  /// \param my_rhs_ (Out)           - number of right hand sides on this processor
-  /// \param my_row (Out)            - row number in processor mesh, 0 to the  number of processors for a column -1
-  /// \param my_col (Out)            - column number in processor mesh, 0 to the  number of processors for a row -1
-    
-  inline
-  int GetDistribution( int* nprocs_row_,
-                       int* number_of_unknowns,
-                       int* nrhs_,
-                       int* my_rows_,
-                       int* my_cols_,
-                       int* my_first_row_,
-                       int* my_first_col_,
-                       int* my_rhs_,
-                       int* my_row,
-                       int* my_col ) {
-    // This function echoes the multiprocessor distribution of the matrix
-
-    distmat_(nprocs_row_,
-             number_of_unknowns,
-             nrhs_,
-             my_rows_,
-             my_cols_,
-             my_first_row_,
-             my_first_col_,
-             my_rhs_,
-             my_row,
-             my_col);
-
-    return(0);
-
-  }
-
-  /// Adelus FactorSolve
-  /// Factors and solves the dense matrix
-
-  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
-  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
-  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
-  /// \param matrix_size (In) -- order of the dense matrix
-  /// \param num_procsr (In)  -- number of processors for a row
-  /// \param num_rhs (In)     -- number of right hand sides
-  /// \param secs (Out)       -- factor and solve time in seconds
-    
-  template<class ZDView>
-  inline
-  void FactorSolve( ZDView AA,
-                    int my_rows_,
-                    int my_cols_,
-                    int* matrix_size,
-                    int* num_procsr,
-                    int* num_rhs,
-                    double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
-	
-#ifdef PRINT_STATUS
-    printf("FactorSolve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-
-  }
-
-  /// Adelus Factor
-  /// Factors the dense matrix for later solve
-
-  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
-  /// \param permute (In)     -- Kokkos View that has the global pivot vector
-  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
-  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
-  /// \param matrix_size (In) -- order of the dense matrix
-  /// \param num_procsr (In)  -- number of processors for a row
-  /// \param secs (Out)       -- factor and solve time in seconds
-
-  template<class ZDView, class IDView>
-  inline
-  void Factor( ZDView AA,
-               IDView permute,
-               int my_rows_,
-               int my_cols_,
-               int* matrix_size,
-               int* num_procsr,
-               double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
-
-#ifdef PRINT_STATUS
-    printf("Factor (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr);
-#endif
-
-    lu_(AA,
-        permute,
-        matrix_size,
-        num_procsr,
-        secs);
-
-  }
-
-  /// Adelus Solve
-  /// Solves the previously factored dense matrix for provided RHS 
-
-  /// \param AA (In)          -- Kokkos View that has the LU-factorized matrix
-  /// \param BB (InOut)       -- Kokkos View that has the rhs and solution (Note: rhs are overwritten)
-  /// \param permute (In)     -- Kokkos View that has the global pivot vector
-  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
-  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
-  /// \param matrix_size (In) -- order of the dense matrix
-  /// \param num_procsr (In)  -- number of processors for a row
-  /// \param secs (Out)       -- factor and solve time in seconds
-
-  template<class ZDView, class BDView, class IDView>
-  inline
-  void Solve( ZDView AA,
-              BDView BB,
-              IDView permute,
-              int my_rows_,
-              int my_cols_,
-              int* matrix_size,
-              int* num_procsr,
-              int* num_rhs,
-              double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
-
-#ifdef PRINT_STATUS
-    printf("Solve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    solve_(AA,
-           BB,
-           permute,
-           num_rhs,
-           secs);
-
-  }
-
-#ifdef ZCPLX
-  /// Adelus FactorSolve_devPtr
-  /// Matrix and rhs are packed and passed as device pointer
-
-  inline
-  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
-                           int my_rows_,
-                           int my_cols_,
-                           int my_rhs_,
-                           int* matrix_size,
-                           int* num_procsr,
-                           int* num_rhs,
-                           double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
-
-    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
-#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
-    typedef Kokkos::View<Kokkos::complex<double>**,
-                         Kokkos::LayoutLeft,
-#ifdef KOKKOS_ENABLE_CUDA
-                         Kokkos::CudaSpace,
-#else
-                         Kokkos::Experimental::HIPSpace,
-#endif
-                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
-
-    AA_Internal AA_i(reinterpret_cast<Kokkos::complex<double> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
-
-#ifdef PRINT_STATUS
-    printf("FactorSolve_devPtr (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-#endif
-    }
-  }
-
-  /// Adelus FactorSolve_hostPtr
-  /// Matrix and rhs are packed and passed as host pointer
-
-  inline
-  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
-                            int my_rows_,
-                            int my_cols_,
-                            int my_rhs_,
-                            int* matrix_size,
-                            int* num_procsr,
-                            int* num_rhs,
-                            double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
-
-    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
-    typedef Kokkos::View<Kokkos::complex<double>**,
-                         Kokkos::LayoutLeft,
-                         Kokkos::HostSpace,
-                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
-
-    AA_Internal AA_i(reinterpret_cast<Kokkos::complex<double> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
-
-#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP) 
-    typedef Kokkos::View<Kokkos::complex<double>**,
-                         Kokkos::LayoutLeft,
-#ifdef KOKKOS_ENABLE_CUDA
-                         Kokkos::CudaSpace> AA_Internal_dev;
-#else
-                         Kokkos::Experimental::HIPSpace> AA_Internal_dev;
-#endif
-
-    AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
-
-#ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with CUDA solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    Kokkos::deep_copy( AA_i_dev, AA_i );
-
-    lusolve_(AA_i_dev,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-
-    Kokkos::deep_copy( AA_i, AA_i_dev );
-#else//OpenMP
-#ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with host solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-#endif
-    }
-  }
-#endif
-
-#ifdef DREAL
-  /// Adelus FactorSolve_devPtr
-  /// Matrix and rhs are packed and passed as device pointer
-
-  inline
-  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
-                           int my_rows_,
-                           int my_cols_,
-                           int my_rhs_,
-                           int* matrix_size,
-                           int* num_procsr,
-                           int* num_rhs,
-                           double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
-
-    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
-#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
-    typedef Kokkos::View<double**,
-                         Kokkos::LayoutLeft,
-#ifdef KOKKOS_ENABLE_CUDA
-                         Kokkos::CudaSpace,
-#else
-                         Kokkos::Experimental::HIPSpace,
-#endif
-                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
-
-    AA_Internal AA_i(reinterpret_cast<double *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
-
-#ifdef PRINT_STATUS
-    printf("FactorSolve_devPtr (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-#endif
-    }
-  }
-
-  /// Adelus FactorSolve_hostPtr
-  /// Matrix and rhs are packed and passed as host pointer
-
-  inline
-  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
-                            int my_rows_,
-                            int my_cols_,
-                            int my_rhs_,
-                            int* matrix_size,
-                            int* num_procsr,
-                            int* num_rhs,
-                            double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
-
-    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
-    typedef Kokkos::View<double**,
-                         Kokkos::LayoutLeft,
-                         Kokkos::HostSpace,
-                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
-
-    AA_Internal AA_i(reinterpret_cast<double *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
-
-#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP) 
-    typedef Kokkos::View<double**,
-                         Kokkos::LayoutLeft,
-#ifdef KOKKOS_ENABLE_CUDA
-                         Kokkos::CudaSpace> AA_Internal_dev;
-#else
-                         Kokkos::Experimental::HIPSpace> AA_Internal_dev;
-#endif
-
-    AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
-
-#ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with CUDA solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    Kokkos::deep_copy( AA_i_dev, AA_i );
-
-    lusolve_(AA_i_dev,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-
-    Kokkos::deep_copy( AA_i, AA_i_dev );
-#else//OpenMP
-#ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with host solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-#endif
-    }
-  }
-#endif
-
-#ifdef SCPLX
-  /// Adelus FactorSolve_devPtr
-  /// Matrix and rhs are packed and passed as device pointer
-
-  inline
-  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
-                           int my_rows_,
-                           int my_cols_,
-                           int my_rhs_,
-                           int* matrix_size,
-                           int* num_procsr,
-                           int* num_rhs,
-                           double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
-
-    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
-#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
-    typedef Kokkos::View<Kokkos::complex<float>**,
-                         Kokkos::LayoutLeft,
-#ifdef KOKKOS_ENABLE_CUDA
-                         Kokkos::CudaSpace,
-#else
-                         Kokkos::Experimental::HIPSpace,
-#endif
-                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
-
-    AA_Internal AA_i(reinterpret_cast<Kokkos::complex<float> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
-
-#ifdef PRINT_STATUS
-    printf("FactorSolve_devPtr (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-#endif
-    }
-  }
-
-  /// Adelus FactorSolve_hostPtr
-  /// Matrix and rhs are packed and passed as host pointer
-
-  inline
-  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
-                            int my_rows_,
-                            int my_cols_,
-                            int my_rhs_,
-                            int* matrix_size,
-                            int* num_procsr,
-                            int* num_rhs,
-                            double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
-
-    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
-    typedef Kokkos::View<Kokkos::complex<float>**,
-                         Kokkos::LayoutLeft,
-                         Kokkos::HostSpace,
-                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
-
-    AA_Internal AA_i(reinterpret_cast<Kokkos::complex<float> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
-
-#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
-    typedef Kokkos::View<Kokkos::complex<float>**,
-                         Kokkos::LayoutLeft,
-#ifdef KOKKOS_ENABLE_CUDA
-                         Kokkos::CudaSpace> AA_Internal_dev;
-#else
-                         Kokkos::Experimental::HIPSpace> AA_Internal_dev;
-#endif
-
-    AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
-
-#ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with CUDA solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    Kokkos::deep_copy( AA_i_dev, AA_i );
-
-    lusolve_(AA_i_dev,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-
-    Kokkos::deep_copy( AA_i, AA_i_dev );
-#else//OpenMP
-#ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with host solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-#endif
-    }
-  }
-#endif
-
-#ifdef SREAL
-  /// Adelus FactorSolve_devPtr
-  /// Matrix and rhs are packed and passed as device pointer
-
-  inline
-  void FactorSolve_devPtr( ADELUS_DATA_TYPE* AA,
-                           int my_rows_,
-                           int my_cols_,
-                           int my_rhs_,
-                           int* matrix_size,
-                           int* num_procsr,
-                           int* num_rhs,
-                           double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
-
-    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
-#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
-    typedef Kokkos::View<float**,
-                         Kokkos::LayoutLeft,
-#ifdef KOKKOS_ENABLE_CUDA
-                         Kokkos::CudaSpace,
-#else
-                         Kokkos::Experimental::HIPSpace,
-#endif
-                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
-
-    AA_Internal AA_i(reinterpret_cast<float *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
-
-#ifdef PRINT_STATUS
-    printf("FactorSolve_devPtr (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-#endif
-    }
-  }
-
-  /// Adelus FactorSolve_hostPtr
-  /// Matrix and rhs are packed and passed as host pointer
-
-  inline
-  void FactorSolve_hostPtr( ADELUS_DATA_TYPE* AA,
-                            int my_rows_,
-                            int my_cols_,
-                            int my_rhs_,
-                            int* matrix_size,
-                            int* num_procsr,
-                            int* num_rhs,
-                            double* secs ) {
-    int rank;
-
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
-
-    { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
-    typedef Kokkos::View<float**,
-                         Kokkos::LayoutLeft,
-                         Kokkos::HostSpace,
-                         Kokkos::MemoryTraits<Kokkos::Unmanaged> > AA_Internal;
-
-    AA_Internal AA_i(reinterpret_cast<float *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
-
-#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
-    typedef Kokkos::View<float**,
-                         Kokkos::LayoutLeft,
-#ifdef KOKKOS_ENABLE_CUDA
-                         Kokkos::CudaSpace> AA_Internal_dev;
-#else
-                         Kokkos::Experimental::HIPSpace> AA_Internal_dev;
-#endif
-
-    AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
-
-#ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with CUDA solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    Kokkos::deep_copy( AA_i_dev, AA_i );
-
-    lusolve_(AA_i_dev,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-
-    Kokkos::deep_copy( AA_i, AA_i_dev );
-#else//OpenMP
-#ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with host solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
-#endif
-
-    lusolve_(AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
-#endif
-    }
-  }
-#endif
-
-}
-
diff --git a/packages/adelus/src/Adelus_vars.hpp_ b/packages/adelus/src/Adelus_vars.hpp_
deleted file mode 100644
index e58f5aeb255b..000000000000
--- a/packages/adelus/src/Adelus_vars.hpp_
+++ /dev/null
@@ -1,80 +0,0 @@
-/*
-//@HEADER
-// ************************************************************************
-//
-//                        Adelus v. 1.0
-//       Copyright (2020) National Technology & Engineering
-//               Solutions of Sandia, LLC (NTESS).
-//
-// Under the terms of Contract DE-NA0003525 with NTESS,
-// the U.S. Government retains certain rights in this software.
-//
-// Redistribution and use in source and binary forms, with or without
-// modification, are permitted provided that the following conditions are
-// met:
-//
-// 1. Redistributions of source code must retain the above copyright
-// notice, this list of conditions and the following disclaimer.
-//
-// 2. Redistributions in binary form must reproduce the above copyright
-// notice, this list of conditions and the following disclaimer in the
-// documentation and/or other materials provided with the distribution.
-//
-// 3. Neither the name of NTESS nor the names of the contributors may be
-// used to endorse or promote products derived from this software without
-// specific prior written permission.
-//
-// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
-// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
-// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
-// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
-// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
-// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
-// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
-// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
-// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
-// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
-// POSSIBILITY OF SUCH DAMAGE.
-//
-// Questions? Contact Vinh Dang (vqdang@sandia.gov)
-//                    Joseph Kotulski (jdkotul@sandia.gov)
-//                    Siva Rajamanickam (srajama@sandia.gov)
-//
-// ************************************************************************
-//@HEADER
-*/
-
-#ifndef __ADELUS_VARS_HPP__
-#define __ADELUS_VARS_HPP__
-
-
-namespace Adelus {
-	
-int   me;               // processor id information
-
-int   nprocs_cube;		// num of procs in the allocated cube
-int   nprocs_row;		// num of procs to which a row is assigned
-int   nprocs_col;		// num of procs to which a col is assigned
-int   max_procs;		// max num of procs in any dimension
-
-int   nrows_matrix;		// number of rows in the matrix
-int   ncols_matrix;		// number of cols in the matrix
-
-int   my_first_row;		// proc position in a row
-int   my_first_col;		// proc position in a col
-
-int   my_rows;			// num of rows I own
-int   my_cols;			// num of cols I own
-
-int   nrhs;             // number of right hand sides in the matrix
-int   my_rhs;           // number of right hand sides that I own
-
-int   blksz;			// block size for BLAS 3 operations
-
-int  myrow,mycol;
-
-MPI_Comm row_comm,col_comm;
-
-}//namespace Adelus
-
-#endif

From 038d71406cab9706e4fa6273f2443057b4f4801b Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Fri, 17 Jun 2022 23:44:58 -0700
Subject: [PATCH 019/130] Move global variables to handle

---
 packages/adelus/src/Adelus.hpp                | 199 +++++-------------
 packages/adelus/src/Adelus_block.h            |  57 -----
 packages/adelus/src/Adelus_distribute.cpp     |  71 +++----
 packages/adelus/src/Adelus_distribute.hpp     |  22 +-
 packages/adelus/src/Adelus_factor.hpp         | 136 ++++++------
 packages/adelus/src/Adelus_forward.hpp        |  18 +-
 packages/adelus/src/Adelus_macros.h           |  10 +-
 packages/adelus/src/Adelus_mytime.hpp         |  11 +-
 packages/adelus/src/Adelus_pcomm.cpp          | 127 -----------
 packages/adelus/src/Adelus_pcomm.hpp          |  56 -----
 packages/adelus/src/Adelus_perm1.hpp          |  71 ++++---
 packages/adelus/src/Adelus_perm_mat.hpp       |  47 +++--
 packages/adelus/src/Adelus_perm_rhs.hpp       |  24 +--
 packages/adelus/src/Adelus_solve.hpp          |  55 +++--
 packages/adelus/src/Adelus_vars.hpp           | 106 ++++------
 packages/adelus/src/Adelus_x_factor.hpp       |  87 +++-----
 packages/adelus/src/Adelus_x_solve.hpp        |  40 ++--
 packages/adelus/src/Adelus_xlu_solve.hpp      |  81 ++-----
 packages/adelus/src/CMakeLists.txt            |   3 -
 .../adelus/test/vector_random/cxx_main.cpp    |  16 +-
 .../adelus/test/vector_random_fs/cxx_main.cpp |  20 +-
 21 files changed, 405 insertions(+), 852 deletions(-)
 delete mode 100644 packages/adelus/src/Adelus_block.h
 delete mode 100644 packages/adelus/src/Adelus_pcomm.cpp
 delete mode 100644 packages/adelus/src/Adelus_pcomm.hpp

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index c0fa123d0ab0..f3d551d64194 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -46,12 +46,13 @@
 
 #pragma once
 
-#include <Kokkos_View.hpp>
+#include <Kokkos_Core.hpp>
 #include <Adelus_defines.h>
+#include <Adelus_distribute.hpp>
 #include <Adelus_xlu_solve.hpp>
 #include <Adelus_x_factor.hpp>
 #include <Adelus_x_solve.hpp>
-#include <Adelus_distribute.hpp>
+
 #include <mpi.h>
 
 // Adelus: provides the functionality to interface to a dense LU solver
@@ -61,38 +62,41 @@ namespace Adelus {
   /// Adelus GetDistirbution
   /// Gives the distribution information that is required by the dense solver
   
-  /// \param nprocs_row_ (In)        - number of processors for a row
+  /// \param comm (In)               - communicator that Adelus runs on
+  /// \param nprocs_row (In)         - number of processors for a row
   /// \param number_of_unknowns (In) - order of the dense matrix
-  /// \param nrhs_ (In)              - number of right hand sides
-  /// \param my_rows_ (Out)          - number of rows of the matrix on this processor
-  /// \param my_cols_ (Out)          - number of columns of the matrix on this processor
-  /// \param my_first_row_ (Out)     - first (global) row number on this processor (array starts at index 1)
-  /// \param my_first_col_ (Out)     - first (global) column number on this processor (array starts at index 1)
-  /// \param my_rhs_ (Out)           - number of right hand sides on this processor
+  /// \param nrhs (In)               - number of right hand sides
+  /// \param my_rows (Out)           - number of rows of the matrix on this processor
+  /// \param my_cols (Out)           - number of columns of the matrix on this processor
+  /// \param my_first_row (Out)      - first (global) row number on this processor (array starts at index 1)
+  /// \param my_first_col (Out)      - first (global) column number on this processor (array starts at index 1)
+  /// \param my_rhs (Out)            - number of right hand sides on this processor
   /// \param my_row (Out)            - row number in processor mesh, 0 to the  number of processors for a column -1
   /// \param my_col (Out)            - column number in processor mesh, 0 to the  number of processors for a row -1
     
   inline
-  int GetDistribution( int* nprocs_row_,
-                       int* number_of_unknowns,
-                       int* nrhs_,
-                       int* my_rows_,
-                       int* my_cols_,
-                       int* my_first_row_,
-                       int* my_first_col_,
-                       int* my_rhs_,
-                       int* my_row,
-                       int* my_col ) {
+  int GetDistribution( MPI_Comm comm,
+                       const int nprocs_row,
+                       const int number_of_unknowns,
+                       const int nrhs,
+                       int& my_rows,
+                       int& my_cols,
+                       int& my_first_row,
+                       int& my_first_col,
+                       int& my_rhs,
+                       int& my_row,
+                       int& my_col ) {
     // This function echoes the multiprocessor distribution of the matrix
 
-    distmat_(nprocs_row_,
+    distmat_(comm,
+             nprocs_row,
              number_of_unknowns,
-             nrhs_,
-             my_rows_,
-             my_cols_,
-             my_first_row_,
-             my_first_col_,
-             my_rhs_,
+             nrhs,
+             my_rows,
+             my_cols,
+             my_first_row,
+             my_first_col,
+             my_rhs,
              my_row,
              my_col);
 
@@ -104,37 +108,23 @@ namespace Adelus {
   /// Factors and solves the dense matrix
 
   /// \param ahandle (In)     -- handle that contains metadata needed by the Adelus solver
-  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
-  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
-  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
-  /// \param matrix_size (In) -- order of the dense matrix
-  /// \param num_procsr (In)  -- number of processors for a row
-  /// \param num_rhs (In)     -- number of right hand sides
+  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed in this processor
+  ///                            (Note: matrix and rhs are overwritten)
   /// \param secs (Out)       -- factor and solve time in seconds
     
   template<class HandleType, class ZRHSViewType>
   inline
   void FactorSolve( HandleType& ahandle,
                     ZRHSViewType& AA,
-                    int my_rows_,
-                    int my_cols_,
-                    int* matrix_size,
-                    int* num_procsr,
-                    int* num_rhs,
                     double* secs ) {
 
     int rank = ahandle.get_myrank();
 	
 #ifdef PRINT_STATUS
-    printf("FactorSolve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve (Kokkos View interface) in rank %d\n", rank);
 #endif
 
-    lusolve_(ahandle,
-             AA,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA, secs);
 
   }
 
@@ -142,12 +132,8 @@ namespace Adelus {
   /// Factors the dense matrix for later solve
 
   /// \param ahandle (In)     -- handle that contains metadata needed by the Adelus solver
-  /// \param AA (InOut)       -- Kokkos View that has the matrix and rhs packed (Note: matrix and rhs are overwritten)
+  /// \param AA (InOut)       -- Kokkos View that has the matrix in this processor (Note: matrix is overwritten)
   /// \param permute (In)     -- Kokkos View that has the global pivot vector
-  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
-  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
-  /// \param matrix_size (In) -- order of the dense matrix
-  /// \param num_procsr (In)  -- number of processors for a row
   /// \param secs (Out)       -- factor and solve time in seconds
 
   template<class HandleType, class ZViewType, class PViewType>
@@ -155,24 +141,15 @@ namespace Adelus {
   void Factor( HandleType& ahandle,
                ZViewType& AA,
                PViewType& permute,
-               int my_rows_,
-               int my_cols_,
-               int* matrix_size,
-               int* num_procsr,
                double* secs ) {
 
     int rank = ahandle.get_myrank();
 
 #ifdef PRINT_STATUS
-    printf("Factor (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr);
+    printf("Factor (Kokkos View interface) in rank %d\n", rank);
 #endif
 
-    lu_(ahandle,
-        AA,
-        permute,
-        matrix_size,
-        num_procsr,
-        secs);
+    lu_(ahandle, AA, permute, secs);
 
   }
 
@@ -183,10 +160,6 @@ namespace Adelus {
   /// \param AA (In)          -- Kokkos View that has the LU-factorized matrix
   /// \param BB (InOut)       -- Kokkos View that has the rhs and solution (Note: rhs are overwritten)
   /// \param permute (In)     -- Kokkos View that has the global pivot vector
-  /// \param my_rows_ (In)    -- number of rows of the matrix on this processor
-  /// \param my_cols_ (In)    -- number of columns of the matrix on this processor
-  /// \param matrix_size (In) -- order of the dense matrix
-  /// \param num_procsr (In)  -- number of processors for a row
   /// \param secs (Out)       -- factor and solve time in seconds
 
   template<class HandleType, class ZViewType,
@@ -196,25 +169,15 @@ namespace Adelus {
               ZViewType& AA,
               RHSViewType& BB,
               PViewType& permute,
-              int my_rows_,
-              int my_cols_,
-              int* matrix_size,
-              int* num_procsr,
-              int* num_rhs,
               double* secs ) {
 
     int rank = ahandle.get_myrank();
 
 #ifdef PRINT_STATUS
-    printf("Solve (Kokkos View interface) in rank %d -- my_rows %u , my_cols %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, *matrix_size, *num_procsr, *num_rhs);
+    printf("Solve (Kokkos View interface) in rank %d\n", rank);
 #endif
 
-    solve_(ahandle,
-           AA,
-           BB,
-           permute,
-           num_rhs,
-           secs);
+    solve_(ahandle, AA, BB, permute, secs);
 
   }
 
@@ -253,12 +216,7 @@ namespace Adelus {
     printf("FactorSolve_devPtr (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(ahandle,
-             AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i, secs);
 #endif
     }
   }
@@ -305,12 +263,7 @@ namespace Adelus {
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
 
-    lusolve_(ahandle,
-             AA_i_dev,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i_dev, secs);
 
     Kokkos::deep_copy( AA_i, AA_i_dev );
 #else//OpenMP
@@ -318,12 +271,7 @@ namespace Adelus {
     printf("FactorSolve_hostPtr with host solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(ahandle,
-             AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i, secs);
 #endif
     }
   }
@@ -364,12 +312,7 @@ namespace Adelus {
     printf("FactorSolve_devPtr (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(ahandle,
-             AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i, secs);
 #endif
     }
   }
@@ -416,12 +359,7 @@ namespace Adelus {
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
 
-    lusolve_(ahandle,
-             AA_i_dev,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i_dev, secs);
 
     Kokkos::deep_copy( AA_i, AA_i_dev );
 #else//OpenMP
@@ -429,12 +367,7 @@ namespace Adelus {
     printf("FactorSolve_hostPtr with host solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(ahandle,
-             AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i, secs);
 #endif
     }
   }
@@ -475,12 +408,7 @@ namespace Adelus {
     printf("FactorSolve_devPtr (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(ahandle,
-             AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i, secs);
 #endif
     }
   }
@@ -527,12 +455,7 @@ namespace Adelus {
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
 
-    lusolve_(ahandle,
-             AA_i_dev,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i_dev, secs);
 
     Kokkos::deep_copy( AA_i, AA_i_dev );
 #else//OpenMP
@@ -540,12 +463,7 @@ namespace Adelus {
     printf("FactorSolve_hostPtr with host solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(ahandle,
-             AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i, secs);
 #endif
     }
   }
@@ -586,12 +504,7 @@ namespace Adelus {
     printf("FactorSolve_devPtr (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(ahandle,
-             AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i, secs);
 #endif
     }
   }
@@ -638,12 +551,7 @@ namespace Adelus {
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
 
-    lusolve_(ahandle,
-             AA_i_dev,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i_dev, secs);
 
     Kokkos::deep_copy( AA_i, AA_i_dev );
 #else//OpenMP
@@ -651,12 +559,7 @@ namespace Adelus {
     printf("FactorSolve_hostPtr with host solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
-    lusolve_(ahandle,
-             AA_i,
-             matrix_size,
-             num_procsr,
-             num_rhs,
-             secs);
+    lusolve_(ahandle, AA_i, secs);
 #endif
     }
   }
diff --git a/packages/adelus/src/Adelus_block.h b/packages/adelus/src/Adelus_block.h
deleted file mode 100644
index c77f01f408aa..000000000000
--- a/packages/adelus/src/Adelus_block.h
+++ /dev/null
@@ -1,57 +0,0 @@
-/*
-//@HEADER
-// ************************************************************************
-//
-//                        Adelus v. 1.0
-//       Copyright (2020) National Technology & Engineering
-//               Solutions of Sandia, LLC (NTESS).
-//
-// Under the terms of Contract DE-NA0003525 with NTESS,
-// the U.S. Government retains certain rights in this software.
-//
-// Redistribution and use in source and binary forms, with or without
-// modification, are permitted provided that the following conditions are
-// met:
-//
-// 1. Redistributions of source code must retain the above copyright
-// notice, this list of conditions and the following disclaimer.
-//
-// 2. Redistributions in binary form must reproduce the above copyright
-// notice, this list of conditions and the following disclaimer in the
-// documentation and/or other materials provided with the distribution.
-//
-// 3. Neither the name of NTESS nor the names of the contributors may be
-// used to endorse or promote products derived from this software without
-// specific prior written permission.
-//
-// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
-// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
-// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
-// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
-// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
-// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
-// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
-// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
-// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
-// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
-// POSSIBILITY OF SUCH DAMAGE.
-//
-// Questions? Contact Vinh Dang (vqdang@sandia.gov)
-//                    Joseph Kotulski (jdkotul@sandia.gov)
-//                    Siva Rajamanickam (srajama@sandia.gov)
-//
-// ************************************************************************
-//@HEADER
-*/
-
-// Set Block size for matrix update -- for the matrix matrix multiply
-// depends on the processor
-
-#ifndef __ADELUS_BLOCK_H__
-#define __ADELUS_BLOCK_H__
-
-//#define DEFBLKSZ 64
-//#define DEFBLKSZ 96   //TODO: allow users to input block size
-#define DEFBLKSZ 128
-
-#endif
diff --git a/packages/adelus/src/Adelus_distribute.cpp b/packages/adelus/src/Adelus_distribute.cpp
index c7c1158ec590..b81d2d049211 100644
--- a/packages/adelus/src/Adelus_distribute.cpp
+++ b/packages/adelus/src/Adelus_distribute.cpp
@@ -54,6 +54,7 @@
 //jdkotul@sandia.gov
 
 //  Variables  INPUT
+//             comm    --- communicator that Adelus is running on
 //             nprocsr --- number of processors assigned to a row
 //             ncols   --- number of columns(=rows) for the matrix
 //             nrhs    --- number of right hand sides
@@ -72,65 +73,61 @@
 
 namespace Adelus {
 
-void distmat_( int *nprocsr,
-               int *ncols,
-               int *nrhs_,
-               int *my_rows_,
-               int *my_cols_,
-               int *my_first_row_,
-               int *my_first_col_,
-               int *my_rhs_,
-               int *my_row,
-               int *my_col )
+void distmat_( MPI_Comm comm,
+               const int nprocsr,
+               const int ncols,
+               const int nrhs,
+               int& my_rows,
+               int& my_cols,
+               int& my_first_row,
+               int& my_first_col,
+               int& my_rhs,
+               int& my_row,
+               int& my_col )
 {
 
-    int rank,nprocs;
-    int nprocs_col_, nrows;
-    int nprocs_row_;
+    int rank, nprocs, nprocs_col, nprocs_row, nrows;
 
     //  Determine who I am and the number of processors that are being used
+    MPI_Comm_rank(comm, &rank) ;
 
-    MPI_Comm_rank(MPI_COMM_WORLD, &rank) ;
+    MPI_Comm_size(comm, &nprocs);
 
-    MPI_Comm_size(MPI_COMM_WORLD, &nprocs);
+    nrows = ncols;
 
-    nrows = *ncols;
+    nprocs_row = nprocsr;
 
-    nprocs_row_ = *nprocsr;
-
-    nprocs_col_ = nprocs/(*nprocsr) ;
+    nprocs_col = nprocs/nprocsr;
 
     // Distribute the rows and columns
 
-    *my_row = rank/(*nprocsr);
-    *my_col = rank %(nprocs_row_);
-
+    my_row = rank / nprocsr;
+    my_col = rank % nprocsr;
 
-    *my_rows_ = nrows / nprocs_col_;
+    //
+    my_rows = nrows / nprocs_col;
 
-    *my_first_row_ = (*my_row)*(*my_rows_) +1;
+    my_first_row = my_row * my_rows + 1;
 
-    *my_first_row_ = ((*my_row) > (nrows%nprocs_col_)) ? *my_first_row_ + (nrows%nprocs_col_) :
-       *my_first_row_ + (*my_row);
+    my_first_row = (my_row > (nrows%nprocs_col)) ? my_first_row + (nrows%nprocs_col) :
+       my_first_row + my_row;
 
-    if (*my_row < nrows % nprocs_col_)
-        ++(*my_rows_);
+    if (my_row < (nrows%nprocs_col)) ++my_rows;
 
-    *my_cols_ = nrows / nprocs_row_;
+    //
+    my_cols = ncols / nprocs_row;
 
-    *my_first_col_ = (*my_col)*(*my_cols_) + 1;
+    my_first_col = my_col * my_cols + 1;
 
-    *my_first_col_ = ((*my_col) > (nrows%nprocs_row_)) ? *my_first_col_ + (nrows%nprocs_row_) :
-       *my_first_col_ + (*my_col);
+    my_first_col = (my_col > (ncols%nprocs_row)) ? my_first_col + (ncols%nprocs_row) :
+       my_first_col + my_col;
 
-    *my_cols_ = *ncols / *nprocsr;
-    if (*my_col < *ncols % (*nprocsr))
-        ++(*my_cols_);
+    if (my_col < (ncols%nprocs_row)) ++my_cols;
 
     // Distribute the RHS per processor
 
-    *my_rhs_ = *nrhs_ / *nprocsr;
-    if (*my_col < *nrhs_ % (*nprocsr)) ++(*my_rhs_);
+    my_rhs = nrhs / nprocs_row;
+    if (my_col < (nrhs%nprocs_row)) ++my_rhs;
 
 }
 
diff --git a/packages/adelus/src/Adelus_distribute.hpp b/packages/adelus/src/Adelus_distribute.hpp
index 7405f8a67937..39bc1822395a 100644
--- a/packages/adelus/src/Adelus_distribute.hpp
+++ b/packages/adelus/src/Adelus_distribute.hpp
@@ -54,6 +54,7 @@
 //jdkotul@sandia.gov
 
 //  Variables  INPUT
+//             comm    --- communicator that Adelus is running on
 //             nprocsr --- number of processors assigned to a row
 //             ncols   --- number of columns(=rows) for the matrix
 //             nrhs    --- number of right hand sides
@@ -74,16 +75,17 @@
 
 namespace Adelus {
 
-void distmat_( int *nprocsr,
-               int *ncols,
-               int *nrhs_,
-               int *my_rows_,
-               int *my_cols_,
-               int *my_first_row_,
-               int *my_first_col_,
-               int *my_rhs_,
-               int *my_row,
-               int *my_col );
+void distmat_( MPI_Comm comm,
+               const int nprocsr,
+               const int ncols,
+               const int nrhs,
+               int& my_rows,
+               int& my_cols,
+               int& my_first_row,
+               int& my_first_col,
+               int& my_rhs,
+               int& my_row,
+               int& my_col );
 
 }//namespace Adelus
 
diff --git a/packages/adelus/src/Adelus_factor.hpp b/packages/adelus/src/Adelus_factor.hpp
index b7f606e96a3c..082eae2c0dbb 100644
--- a/packages/adelus/src/Adelus_factor.hpp
+++ b/packages/adelus/src/Adelus_factor.hpp
@@ -54,7 +54,6 @@
 
 #include "Adelus_defines.h"
 #include "Adelus_macros.h"
-#include "Adelus_pcomm.hpp"
 #include "Adelus_mytime.hpp"
 
 #include "Kokkos_Core.hpp"
@@ -63,22 +62,8 @@
 #include "KokkosBlas1_iamax.hpp"
 #include "KokkosBlas3_gemm.hpp"
 
-extern int myrow;
-extern int mycol;
-extern int me;	               // processor id information
-extern int nprocs_row;         // num of procs to which a row is assigned
-extern int nprocs_col;         // num of procs to which a col is assigned
-extern int nrows_matrix;       // number of rows in the matrix
-extern int ncols_matrix;       // number of cols in the matrix
-extern int my_rows;            // num of rows I own
-extern int my_cols;            // num of cols I own
-extern int my_rhs;             // num of right hand side I own
-extern int blksz;              // block size for BLAS 3 operations
-
 #define LUSTATUSINT 64
 
-extern MPI_Comm col_comm;
-
 //  Message tags
 #define LUPIVOTTYPE (1<<13)
 #define LUCOLTYPE (1<<14)
@@ -104,7 +89,9 @@ void factor(HandleType& ahandle,           // handle containg metadata
             ViewType2D& row1_view,         // diagonal row
             ViewType1D& row2_view,         // pivot row
             ViewType1D& row3_view,         // temporary vector for rows
-            ViewIntType1D& pivot_vec_view) // vector storing list of pivot rows
+            ViewIntType1D& pivot_vec_view, // vector storing list of pivot rows
+            int         nrhs,              // total num of RHS (note: set to 0 if factoring matrix only)
+            int         my_rhs)            // num of RHS I own (note: set to 0 if factoring matrix only)
 {
   typedef typename ZDView::value_type value_type;
 #ifdef PRINT_STATUS
@@ -118,6 +105,16 @@ void factor(HandleType& ahandle,           // handle containg metadata
   typedef Kokkos::View<value_type*, Kokkos::LayoutLeft, Kokkos::Experimental::HIPHostPinnedSpace> View1DHostPinnType;//HIPHostPinnedSpace
 #endif
 #endif
+
+  MPI_Comm comm     = ahandle.get_comm();
+  MPI_Comm col_comm = ahandle.get_col_comm();
+  int me            = ahandle.get_myrank();
+  int nprocs_row    = ahandle.get_nprocs_row();
+  int nprocs_col    = ahandle.get_nprocs_col();
+  int ncols_matrix  = ahandle.get_ncols_matrix();
+  int my_rows       = ahandle.get_my_rows();
+  int my_cols       = ahandle.get_my_cols();
+  int blksz         = ahandle.get_blksz();
   
   int j,k;               // loop counters
 
@@ -183,13 +180,13 @@ void factor(HandleType& ahandle,           // handle containg metadata
 
   // Distribution for the matrix on me
 
-  MPI_Comm_size(ahandle.get_comm(),&numprocs);
+  MPI_Comm_size(comm,&numprocs);
   if ( (numprocs/nprocs_row) * nprocs_row != numprocs ) {
      if (me == 0) {
        printf("nprocs_row must go into numprocs perfectly!\n");
        printf("Try a different value of nprocs_row.\n");
      }
-     MPI_Barrier(ahandle.get_comm());
+     MPI_Barrier(comm);
      exit(0);
   }
 
@@ -356,8 +353,11 @@ void factor(HandleType& ahandle,           // handle containg metadata
       gpivot_row = pivot.row;
       pivot_mag = abs(pivot.entry);
       if (pivot_mag == 0.0) {
-        printf("Node %d error -- zero pivot found in column %d -- exiting\n",me,j);
-        return; 
+        //printf("Node %d error -- zero pivot found in column %d -- exiting\n",me,j);
+        //return; 
+        std::ostringstream os;
+        os << "Adelus::factor: rank " << me << " error -- zero pivot found in column "<< j;
+        Kokkos::Impl::throw_runtime_exception (os.str ());
       }
 
       // divide everything including the diagonal by the pivot entry
@@ -418,7 +418,7 @@ void factor(HandleType& ahandle,           // handle containg metadata
       for (rdist = 1;rdist <= MAXDIST;rdist++){
         if (rowplus(rdist) == c_owner) break;
         bytes = sizeof(gpivot_row);
-        MPI_Send(&gpivot_row,bytes,MPI_BYTE,rowplus(rdist),LUPIVROWTYPE+j,ahandle.get_comm());
+        MPI_Send(&gpivot_row,bytes,MPI_BYTE,rowplus(rdist),LUPIVROWTYPE+j,comm);
       }
 #ifdef GET_TIMING
       bcastpivstime += (MPI_Wtime()-t1);
@@ -441,9 +441,9 @@ void factor(HandleType& ahandle,           // handle containg metadata
         if (rowplus(rdist) == c_owner) break;
         bytes=sizeof(ADELUS_DATA_TYPE)*col_len;
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-        MPI_Send(h_coltmp.data(),bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,ahandle.get_comm());
+        MPI_Send(h_coltmp.data(),bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,comm);
 #else //GPU-aware MPI
-        MPI_Send(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,ahandle.get_comm());
+        MPI_Send(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,comm);
 #endif
       }
 #ifdef GET_TIMING
@@ -467,10 +467,10 @@ void factor(HandleType& ahandle,           // handle containg metadata
 
       bytes=col_len*sizeof(ADELUS_DATA_TYPE);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-      MPI_Irecv(h_coltmp.data(),bytes,MPI_BYTE,MPI_ANY_SOURCE,LUROWTYPE+j,ahandle.get_comm(),&msgrequest);
+      MPI_Irecv(h_coltmp.data(),bytes,MPI_BYTE,MPI_ANY_SOURCE,LUROWTYPE+j,comm,&msgrequest);
 #else //GPU-aware MPI
       MPI_Irecv(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,
-                MPI_ANY_SOURCE,LUROWTYPE+j,ahandle.get_comm(),&msgrequest);
+                MPI_ANY_SOURCE,LUROWTYPE+j,comm,&msgrequest);
 #endif
 
 #ifdef GET_TIMING
@@ -479,7 +479,7 @@ void factor(HandleType& ahandle,           // handle containg metadata
       bytes = 0; type = LUPIVROWTYPE+j;
       bytes=4;
       bytes = sizeof(gpivot_row);
-      MPI_Recv(&gpivot_row,bytes,MPI_BYTE,MPI_ANY_SOURCE,type,ahandle.get_comm(),&msgstatus);
+      MPI_Recv(&gpivot_row,bytes,MPI_BYTE,MPI_ANY_SOURCE,type,comm,&msgstatus);
 #ifdef GET_TIMING
       bcastpivrtime += (MPI_Wtime()-t1);
 #endif
@@ -493,7 +493,7 @@ void factor(HandleType& ahandle,           // handle containg metadata
         for (rdist = 1;rdist <= MAXDIST;rdist++) {
           if (rowplus(rdist) == c_owner) break;
           bytes = sizeof(gpivot_row);
-          MPI_Send(&gpivot_row,bytes,MPI_BYTE,rowplus(rdist),LUPIVROWTYPE+j,ahandle.get_comm());
+          MPI_Send(&gpivot_row,bytes,MPI_BYTE,rowplus(rdist),LUPIVROWTYPE+j,comm);
         }
 #ifdef GET_TIMING
         bcastpivstime += (MPI_Wtime()-t1);
@@ -525,9 +525,9 @@ void factor(HandleType& ahandle,           // handle containg metadata
           if (rowplus(rdist) == c_owner) break;
           bytes=col_len*sizeof(ADELUS_DATA_TYPE);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-          MPI_Send(h_coltmp.data(),bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,ahandle.get_comm());
+          MPI_Send(h_coltmp.data(),bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,comm);
 #else //GPU-aware MPI
-          MPI_Send(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,ahandle.get_comm());
+          MPI_Send(col1_view.data()+sav_col_j*col1_view.stride(1)+sav_col_i,bytes,MPI_BYTE,rowplus(rdist),LUROWTYPE+j,comm);
 #endif
         }
 #ifdef GET_TIMING
@@ -733,9 +733,9 @@ void factor(HandleType& ahandle,           // handle containg metadata
 #endif
         bytes=(row_len+colcnt)*sizeof(ADELUS_DATA_TYPE);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-        MPI_Send(h_row2.data(),bytes,MPI_BYTE,pivot_owner,LUSENDTYPE+j,ahandle.get_comm());
+        MPI_Send(h_row2.data(),bytes,MPI_BYTE,pivot_owner,LUSENDTYPE+j,comm);
 #else //GPU-aware MPI
-        MPI_Send(row2_view.data(),bytes,MPI_BYTE,pivot_owner,LUSENDTYPE+j,ahandle.get_comm());
+        MPI_Send(row2_view.data(),bytes,MPI_BYTE,pivot_owner,LUSENDTYPE+j,comm);
 #endif
 #ifdef GET_TIMING
         sendrowtime += (MPI_Wtime()-t1);
@@ -750,9 +750,9 @@ void factor(HandleType& ahandle,           // handle containg metadata
         if (me != r_owner) {
           bytes=(row_len+colcnt)*sizeof(ADELUS_DATA_TYPE);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-          MPI_Recv(h_row2.data(),bytes,MPI_BYTE,r_owner,LUSENDTYPE+j,ahandle.get_comm(),&msgstatus);
+          MPI_Recv(h_row2.data(),bytes,MPI_BYTE,r_owner,LUSENDTYPE+j,comm,&msgstatus);
 #else //GPU-aware MPI
-          MPI_Recv(row2_view.data(),bytes,MPI_BYTE,r_owner,LUSENDTYPE+j,ahandle.get_comm(),&msgstatus);
+          MPI_Recv(row2_view.data(),bytes,MPI_BYTE,r_owner,LUSENDTYPE+j,comm,&msgstatus);
 #endif
         }
 #ifdef GET_TIMING
@@ -934,57 +934,57 @@ void factor(HandleType& ahandle,           // handle containg metadata
   copytime     = pivotswaptime+copycoltime+copyrowtime+copyrow1time+copypivrowtime+copypivrow1time;
   dgemmtime    = updatetime+colupdtime+rowupdtime+scaltime;
 #ifdef ADELUS_SHOW_TIMING_DETAILS
-  showtime("Time to do iamax",&iamaxtime);
-  showtime("Time to get local pivot",&getlocalpivtime);
+  showtime(comm,me,numprocs,"Time to do iamax",&iamaxtime);
+  showtime(comm,me,numprocs,"Time to get local pivot",&getlocalpivtime);
 #endif
-  showtime("Total finding local pivot time",&localpivtime);
+  showtime(comm,me,numprocs,"Total finding local pivot time",&localpivtime);
   double tmp = 100*localpivtime/totalfactortime;
-  showtime("Percent finding local pivot time",&tmp);
+  showtime(comm,me,numprocs,"Percent finding local pivot time",&tmp);
 #ifdef ADELUS_SHOW_TIMING_DETAILS
-  showtime("Time to xchgpivot",&xpivmsgtime);
-  showtime("Time to do send in bcast pivot",&bcastpivstime);
-  showtime("Time to do recv in bcast pivot",&bcastpivrtime);
+  showtime(comm,me,numprocs,"Time to xchgpivot",&xpivmsgtime);
+  showtime(comm,me,numprocs,"Time to do send in bcast pivot",&bcastpivstime);
+  showtime(comm,me,numprocs,"Time to do recv in bcast pivot",&bcastpivrtime);
   tmp = bcastpivrtime+bcastpivstime;
-  showtime("Time to do bcast pivot",&tmp);
-  showtime("Time to do send in bcast cur col",&bcastcolstime);
-  showtime("Time to do recv bcast cur col",&bcastcolrtime);
+  showtime(comm,me,numprocs,"Time to do bcast pivot",&tmp);
+  showtime(comm,me,numprocs,"Time to do send in bcast cur col",&bcastcolstime);
+  showtime(comm,me,numprocs,"Time to do recv bcast cur col",&bcastcolrtime);
   tmp = bcastcolrtime+bcastcolstime;
-  showtime("Time to do bcast cur col",&tmp);
+  showtime(comm,me,numprocs,"Time to do bcast cur col",&tmp);
   tmp = bcastcolrtime+bcastcolstime+bcastpivrtime+bcastpivstime;
-  showtime("Time to do bcast cur col and pivot",&tmp);
-  showtime("Time to bcast piv row",&bcastrowtime);
-  showtime("Time to send cur row",&sendrowtime);
-  showtime("Time to recv cur row",&recvrowtime);
+  showtime(comm,me,numprocs,"Time to do bcast cur col and pivot",&tmp);
+  showtime(comm,me,numprocs,"Time to bcast piv row",&bcastrowtime);
+  showtime(comm,me,numprocs,"Time to send cur row",&sendrowtime);
+  showtime(comm,me,numprocs,"Time to recv cur row",&recvrowtime);
 #endif
-  showtime("Total msg passing time",&msgtime);
+  showtime(comm,me,numprocs,"Total msg passing time",&msgtime);
   tmp = 100*msgtime/totalfactortime;
-  showtime("Percent msg passing time",&tmp);
+  showtime(comm,me,numprocs,"Percent msg passing time",&tmp);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-  showtime("Total copy between host pinned mem and dev mem time",&copyhostpinnedtime); 
+  showtime(comm,me,numprocs,"Total copy between host pinned mem and dev mem time",&copyhostpinnedtime); 
   tmp = 100*copyhostpinnedtime/totalfactortime;
-  showtime("Percent copy between host pinned mem and dev mem time",&tmp);  
+  showtime(comm,me,numprocs,"Percent copy between host pinned mem and dev mem time",&tmp);  
 #endif
 #ifdef ADELUS_SHOW_TIMING_DETAILS
-  showtime("Time to swap pivot",&pivotswaptime);
-  showtime("Time to copy cur col",&copycoltime);
-  showtime("Time to copy cur row to sav row",&copyrowtime);
-  showtime("Time to copy piv row to sav piv",&copypivrowtime);
-  showtime("Time to copy sav row to cur row",&copyrow1time);
-  showtime("Time to copy sav piv  to piv row",&copypivrow1time);
-#endif
-  showtime("Total copying time",&copytime);
+  showtime(comm,me,numprocs,"Time to swap pivot",&pivotswaptime);
+  showtime(comm,me,numprocs,"Time to copy cur col",&copycoltime);
+  showtime(comm,me,numprocs,"Time to copy cur row to sav row",&copyrowtime);
+  showtime(comm,me,numprocs,"Time to copy piv row to sav piv",&copypivrowtime);
+  showtime(comm,me,numprocs,"Time to copy sav row to cur row",&copyrow1time);
+  showtime(comm,me,numprocs,"Time to copy sav piv  to piv row",&copypivrow1time);
+#endif
+  showtime(comm,me,numprocs,"Total copying time",&copytime);
   tmp = 100*copytime/totalfactortime;
-  showtime("Percent copying time",&tmp);
+  showtime(comm,me,numprocs,"Percent copying time",&tmp);
 #ifdef ADELUS_SHOW_TIMING_DETAILS
-  showtime("Time to scale cur col",&scaltime);
-  showtime("Time to update cur col",&colupdtime);
-  showtime("Time to update piv row",&rowupdtime);
+  showtime(comm,me,numprocs,"Time to scale cur col",&scaltime);
+  showtime(comm,me,numprocs,"Time to update cur col",&colupdtime);
+  showtime(comm,me,numprocs,"Time to update piv row",&rowupdtime);
 #endif
-  showtime("Time to update matrix",&updatetime);
-  showtime("Total update time",&dgemmtime);
+  showtime(comm,me,numprocs,"Time to update matrix",&updatetime);
+  showtime(comm,me,numprocs,"Total update time",&dgemmtime);
   tmp = 100*dgemmtime/totalfactortime;
-  showtime("Percent update time",&tmp);
-  showtime("Total time in factor",&totalfactortime);
+  showtime(comm,me,numprocs,"Percent update time",&tmp);
+  showtime(comm,me,numprocs,"Total time in factor",&totalfactortime);
 #endif
 }
 
diff --git a/packages/adelus/src/Adelus_forward.hpp b/packages/adelus/src/Adelus_forward.hpp
index 58c6f0fc89aa..18bd8a6c3654 100644
--- a/packages/adelus/src/Adelus_forward.hpp
+++ b/packages/adelus/src/Adelus_forward.hpp
@@ -53,7 +53,6 @@
 #include <mpi.h>
 #include "Adelus_defines.h"
 #include "Adelus_macros.h"
-#include "Adelus_pcomm.hpp"
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
 #include "KokkosBlas3_gemm.hpp"
@@ -62,7 +61,7 @@ namespace Adelus {
 
 template<class HandleType, class ZViewType, class RHSViewType>
 inline
-void forward(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, int& my_num_rhs)
+void forward(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 {
   using value_type      = typename ZViewType::value_type ;
   using execution_space = typename ZViewType::device_type::execution_space ;
@@ -76,6 +75,14 @@ void forward(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, int& my_num_rh
   #endif
 #endif
 
+  MPI_Comm row_comm = ahandle.get_row_comm();
+  MPI_Comm col_comm = ahandle.get_col_comm();
+  int myrow         = ahandle.get_myrow();
+  int nprocs_row    = ahandle.get_nprocs_row();
+  int nprocs_col    = ahandle.get_nprocs_col();
+  int nrows_matrix  = ahandle.get_nrows_matrix();
+  int my_rows       = ahandle.get_my_rows();
+
   int k_row;       // torus-wrap row corresponding to kth global row
   int k_col;       // torus-wrap column corresponding to kth global col
   int istart;      // Starting row index for pivot column
@@ -91,7 +98,7 @@ void forward(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, int& my_num_rh
 #endif
 
 #ifdef PRINT_STATUS
-  printf("Rank %i -- forward() Begin forward solve with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, my_num_rhs %d, value_type %s, execution_space %s, memory_space %s\n", me, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, my_num_rhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- forward() Begin forward solve with myrow %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), myrow, nprocs_row, nprocs_col, nrows_matrix, ahandle.get_ncols_matrix(), my_rows, ahandle.get_my_cols(), ahandle.get_my_rhs(), ahandle.get_nrhs(), typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 
 #ifdef GET_TIMING
@@ -123,7 +130,7 @@ void forward(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, int& my_num_rh
     MPI_Bcast(reinterpret_cast<char *>(piv_col.data()), count_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, row_comm);
 #endif
 
-    if (my_num_rhs > 0) {
+    if (ahandle.get_my_rhs() > 0) {
       //ck = RHS(k/nprocs_col,0);
       //MPI_Bcast((char *)(&ck),sizeof(ADELUS_DATA_TYPE),MPI_CHAR,k_row,col_comm);
       //count_row=0;
@@ -157,7 +164,8 @@ void forward(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, int& my_num_rh
 
 #ifdef GET_TIMING
   fwdsolvetime = MPI_Wtime() - t1;
-  showtime("Total time in forward solve",&fwdsolvetime);
+  showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+           "Total time in forward solve", &fwdsolvetime);
 #endif
 }
 
diff --git a/packages/adelus/src/Adelus_macros.h b/packages/adelus/src/Adelus_macros.h
index 8a0b89e4c9c9..7c83522ff801 100644
--- a/packages/adelus/src/Adelus_macros.h
+++ b/packages/adelus/src/Adelus_macros.h
@@ -44,19 +44,19 @@
 //@HEADER
 */
 
-#define grey_c(P)     ((P)^((P)>>1))
+//#define grey_c(P)     ((P)^((P)>>1))
 
 #define lrow_to_grow(R) ( (mesh_row(me) + nprocs_col*(R))  )
 
 #define grow_to_lrow(R) ( (R/nprocs_col)  )
 
-// #define col_owner(C)  (((C)%nprocs_row) + (me - me%nprocs_row))
+//// #define col_owner(C)  (((C)%nprocs_row) + (me - me%nprocs_row))
 #define col_owner(C)  ( proc_num(mesh_row(me) , (C)%nprocs_row) )
 
-// #define row_owner(R)  ((((R)%nprocs_col)*nprocs_row) + (me%nprocs_row))
+//// #define row_owner(R)  ((((R)%nprocs_col)*nprocs_row) + (me%nprocs_row))
 #define row_owner(R)  ( proc_num((R)%nprocs_col , mesh_col(me)) )
 
-#define owner(R, C)   ((((R)%nprocs_col)*nprocs_row) + ((C)%nprocs_row))
+//#define owner(R, C)   ((((R)%nprocs_col)*nprocs_row) + ((C)%nprocs_row))
 
 #define mesh_col(P)   ((P)%nprocs_row)
 
@@ -64,4 +64,4 @@
 
 #define proc_num(R,C) ((R)*nprocs_row + (C))
 
-#define mac_send_msg(D,B,S,T)  MPI_Send(B,S,MPI_CHAR,D,T,MPI_COMM_WORLD)
+//#define mac_send_msg(D,B,S,T)  MPI_Send(B,S,MPI_CHAR,D,T,MPI_COMM_WORLD)
diff --git a/packages/adelus/src/Adelus_mytime.hpp b/packages/adelus/src/Adelus_mytime.hpp
index eb397a8929a4..1479c691f5c1 100644
--- a/packages/adelus/src/Adelus_mytime.hpp
+++ b/packages/adelus/src/Adelus_mytime.hpp
@@ -64,11 +64,8 @@ double get_seconds(double start)
 
 // Exchange and calculate max, min, and average timing information
 
-void showtime(const char *label, double *value)
+void showtime(MPI_Comm comm, int me, int nprocs_cube, const char *label, double *value)
 {
-  extern int me;		// current processor rank
-  extern int nprocs_cube;
-  
   double avgtime;
   
   struct {
@@ -77,12 +74,12 @@ void showtime(const char *label, double *value)
   } max_in, max_out, min_in, min_out;
   max_in.val = *value;
   max_in.proc = me;
-  MPI_Allreduce(&max_in,&max_out,1,MPI_DOUBLE_INT,MPI_MAXLOC,MPI_COMM_WORLD);
+  MPI_Allreduce(&max_in,&max_out,1,MPI_DOUBLE_INT,MPI_MAXLOC,comm);
   min_in.val = *value;
   min_in.proc = me;
-  MPI_Allreduce(&min_in,&min_out,1,MPI_DOUBLE_INT,MPI_MINLOC,MPI_COMM_WORLD);
+  MPI_Allreduce(&min_in,&min_out,1,MPI_DOUBLE_INT,MPI_MINLOC,comm);
   
-  MPI_Allreduce(value,&avgtime,1,MPI_DOUBLE,MPI_SUM,MPI_COMM_WORLD);
+  MPI_Allreduce(value,&avgtime,1,MPI_DOUBLE,MPI_SUM,comm);
   
   avgtime /= nprocs_cube;
   
diff --git a/packages/adelus/src/Adelus_pcomm.cpp b/packages/adelus/src/Adelus_pcomm.cpp
deleted file mode 100644
index 973bf96fe1ec..000000000000
--- a/packages/adelus/src/Adelus_pcomm.cpp
+++ /dev/null
@@ -1,127 +0,0 @@
-/*
-//@HEADER
-// ************************************************************************
-//
-//                        Adelus v. 1.0
-//       Copyright (2020) National Technology & Engineering
-//               Solutions of Sandia, LLC (NTESS).
-//
-// Under the terms of Contract DE-NA0003525 with NTESS,
-// the U.S. Government retains certain rights in this software.
-//
-// Redistribution and use in source and binary forms, with or without
-// modification, are permitted provided that the following conditions are
-// met:
-//
-// 1. Redistributions of source code must retain the above copyright
-// notice, this list of conditions and the following disclaimer.
-//
-// 2. Redistributions in binary form must reproduce the above copyright
-// notice, this list of conditions and the following disclaimer in the
-// documentation and/or other materials provided with the distribution.
-//
-// 3. Neither the name of NTESS nor the names of the contributors may be
-// used to endorse or promote products derived from this software without
-// specific prior written permission.
-//
-// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
-// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
-// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
-// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
-// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
-// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
-// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
-// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
-// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
-// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
-// POSSIBILITY OF SUCH DAMAGE.
-//
-// Questions? Contact Vinh Dang (vqdang@sandia.gov)
-//                    Joseph Kotulski (jdkotul@sandia.gov)
-//                    Siva Rajamanickam (srajama@sandia.gov)
-//
-// ************************************************************************
-//@HEADER
-*/
-
-#include <math.h>
-#include <stdio.h>
-#include <mpi.h>
-#include "Adelus_defines.h"
-#include "Adelus_macros.h"
-
-#define DEBUG1 0
-
-namespace Adelus {
-
-//  define variables to avoid compiler error
-
-int one = 1;
-double d_one = 1.;
-
-int ringnext,ringprev,hbit,rmbit,my_col_id,my_row_id;
-int ringnex2,ringpre2,ringnex3,ringpre3,ringnex4,ringpre4;
-//typedef struct {
-//  DATA_TYPE entry;
-//  DATA_TYPE current;
-//  int row;
-//} pivot_type;
-
-void initcomm(){
-  extern int nprocs_col, nprocs_row, me, hbit, my_col_id, my_row_id, rmbit;
-  extern int ringnext,ringprev,ringnex2,ringpre2,ringnex3,ringpre3,ringnex4,ringpre4;
-  int col_id,bit;
-
-  my_col_id = mesh_col(me);
-  my_row_id = mesh_row(me);
-
-
-  col_id = my_col_id + 1;
-  if (col_id >= nprocs_row) col_id = 0;
-  ringnext = proc_num(my_row_id,col_id);
-
-  col_id = my_col_id + 2;
-  if (col_id >= nprocs_row) col_id -= nprocs_row;
-  ringnex2 = proc_num(my_row_id,col_id);
-
-  col_id = my_col_id + 3;
-  if (col_id >= nprocs_row) col_id -= nprocs_row;
-  ringnex3 = proc_num(my_row_id,col_id);
-
-  col_id = my_col_id + 4;
-  if (col_id >= nprocs_row) col_id -= nprocs_row;
-  ringnex4 = proc_num(my_row_id,col_id);
-
-  col_id = my_col_id - 1;
-  if (col_id < 0) col_id = nprocs_row - 1;
-  ringprev = proc_num(my_row_id,col_id);
-
-  col_id = my_col_id - 2;
-  if (col_id < 0) col_id += nprocs_row;
-  ringpre2 = proc_num(my_row_id,col_id);
-
-  col_id = my_col_id - 3;
-  if (col_id < 0) col_id += nprocs_row;
-  ringpre3 = proc_num(my_row_id,col_id);
-
-  col_id = my_col_id - 4;
-  if (col_id < 0) col_id += nprocs_row;
-  ringpre4 = proc_num(my_row_id,col_id);
-
-  // calculate first power of two bigger or equal to the number of rows,
-  //   and low order one bit in own name
-
-  for (hbit = 1; nprocs_col > hbit ; hbit = hbit << 1);
-
-  rmbit = 0;
-  for (bit = 1; bit < hbit; bit = bit << 1) {
-    if ((my_row_id & bit) == bit) {
-      rmbit = bit; break;}
-  }
-
-#if (DEBUG1 > 0)
-  printf("In initcomm, node %d: my_col_id = %d, my_row_id = %d, hbit = %d, rmbit = %d, ringnext = %d, ringprev = %d\n",me,my_col_id,my_row_id,hbit,rmbit,ringnext,ringprev);
-#endif
-}
-
-}//namespace Adelus
diff --git a/packages/adelus/src/Adelus_pcomm.hpp b/packages/adelus/src/Adelus_pcomm.hpp
deleted file mode 100644
index 402d8bbcdb81..000000000000
--- a/packages/adelus/src/Adelus_pcomm.hpp
+++ /dev/null
@@ -1,56 +0,0 @@
-/*
-//@HEADER
-// ************************************************************************
-//
-//                        Adelus v. 1.0
-//       Copyright (2020) National Technology & Engineering
-//               Solutions of Sandia, LLC (NTESS).
-//
-// Under the terms of Contract DE-NA0003525 with NTESS,
-// the U.S. Government retains certain rights in this software.
-//
-// Redistribution and use in source and binary forms, with or without
-// modification, are permitted provided that the following conditions are
-// met:
-//
-// 1. Redistributions of source code must retain the above copyright
-// notice, this list of conditions and the following disclaimer.
-//
-// 2. Redistributions in binary form must reproduce the above copyright
-// notice, this list of conditions and the following disclaimer in the
-// documentation and/or other materials provided with the distribution.
-//
-// 3. Neither the name of NTESS nor the names of the contributors may be
-// used to endorse or promote products derived from this software without
-// specific prior written permission.
-//
-// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
-// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
-// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
-// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
-// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
-// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
-// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
-// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
-// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
-// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
-// POSSIBILITY OF SUCH DAMAGE.
-//
-// Questions? Contact Vinh Dang (vqdang@sandia.gov)
-//                    Joseph Kotulski (jdkotul@sandia.gov)
-//                    Siva Rajamanickam (srajama@sandia.gov)
-//
-// ************************************************************************
-//@HEADER
-*/
-
-#ifndef __ADELUS_PCOMM_HPP__
-#define __ADELUS_PCOMM_HPP__
-
-namespace Adelus {
-
-void initcomm(  );
-
-}//namespace Adelus
-
-#endif
diff --git a/packages/adelus/src/Adelus_perm1.hpp b/packages/adelus/src/Adelus_perm1.hpp
index 517bbaafd321..6049159aaf8d 100644
--- a/packages/adelus/src/Adelus_perm1.hpp
+++ b/packages/adelus/src/Adelus_perm1.hpp
@@ -60,17 +60,6 @@
 
 #define IBM_MPI_WRKAROUND
 
-extern int me;	               // processor id information
-extern int nprocs_row;         // num of procs to which a row is assigned
-extern int nprocs_col;         // num of procs to which a col is assigned
-extern int nrows_matrix;       // number of rows in the matrix
-extern int ncols_matrix;       // number of cols in the matrix
-extern int my_rows;            // num of rows I own
-extern int my_cols;            // num of cols I own
-extern int myrow;
-extern int mycol;
-extern MPI_Comm col_comm;
-
 namespace Adelus {
 
 #ifndef IBM_MPI_WRKAROUND
@@ -103,12 +92,22 @@ namespace Adelus {
   //              using the communication buffer
   template<class HandleType, class ZDView>
   inline
-  void perm1_(HandleType& ahandle, ZDView& ZV, int *num_my_rhs) {
-  
+  void perm1_(HandleType& ahandle, ZDView& ZV) {
+
+    MPI_Comm comm     = ahandle.get_comm();
+    MPI_Comm col_comm = ahandle.get_col_comm();
+    int me            = ahandle.get_myrank();
+    int my_rhs_       = ahandle.get_my_rhs();
+    int my_rows       = ahandle.get_my_rows();
+    int nprocs_row    = ahandle.get_nprocs_row();
+    int nprocs_col    = ahandle.get_nprocs_col();
+    int nrows_matrix  = ahandle.get_nrows_matrix();
+    int ncols_matrix  = ahandle.get_ncols_matrix();
+    int my_first_row  = ahandle.get_my_first_row();
+    int my_first_col  = ahandle.get_my_first_col();
+
     int i;
-    int my_rhs_;
-  
-  
+
     int bytes;
     int dest;
     int type;
@@ -139,8 +138,6 @@ namespace Adelus {
   #ifdef GET_TIMING
     t2 = MPI_Wtime();
   #endif
-  
-    my_rhs_=*num_my_rhs;
 
     typedef typename ZDView::value_type value_type;
     typedef typename ZDView::device_type::execution_space execution_space;
@@ -217,19 +214,19 @@ namespace Adelus {
   
           }
   
-          if( dest !=me ) {
+          if( dest != me ) {
   
             bytes = (my_rhs_ + 1)*sizeof(ADELUS_DATA_TYPE);
   
             MPI_Irecv( (char *)(reinterpret_cast<ADELUS_DATA_TYPE *>(rhs_temp.data())+next_s),bytes,MPI_CHAR,MPI_ANY_SOURCE,
-                  MPI_ANY_TAG,ahandle.get_comm(),&msgrequest);
+                  MPI_ANY_TAG,comm,&msgrequest);
 
            auto sub_ZV = subview(ZV, ptr1_idx, Kokkos::ALL());     				
            zcopy_wr_local_index(my_rhs_, sub_ZV, temp_s, local_index);
   
            type = PERMTYPE+change_send;
            MPI_Send((char *)(reinterpret_cast<ADELUS_DATA_TYPE *>(temp_s.data())),bytes,MPI_CHAR,dest,
-                   type,ahandle.get_comm());
+                   type,comm);
            change_send++;
   
            next_s = change_send * (my_rhs_+1);
@@ -270,7 +267,7 @@ namespace Adelus {
     totalpermtime = MPI_Wtime() - t2;
   #endif
   #ifdef GET_TIMING
-    showtime("Total time in perm",&totalpermtime);
+    showtime(comm, me, ahandle.get_nprocs_cube(), "Total time in perm", &totalpermtime);
   #endif
   }
 
@@ -288,13 +285,23 @@ namespace Adelus {
   //              using the communication buffer
   template<class HandleType, class ZDView>
   inline
-  void perm1_(HandleType& ahandle, ZDView& ZV, int *num_my_rhs) {
-  
+  void perm1_(HandleType& ahandle, ZDView& ZV) {
+
+    MPI_Comm comm     = ahandle.get_comm();
+    MPI_Comm col_comm = ahandle.get_col_comm();
+    int myrow         = ahandle.get_myrow();   
+    int my_rhs_       = ahandle.get_my_rhs();
+    int my_rows       = ahandle.get_my_rows();
+    int nprocs_row    = ahandle.get_nprocs_row();
+    int nprocs_col    = ahandle.get_nprocs_col();
+    int nrows_matrix  = ahandle.get_nrows_matrix();
+    int ncols_matrix  = ahandle.get_ncols_matrix();
+    int my_first_row  = ahandle.get_my_first_row();
+
     int i;
-    int my_rhs_;
   
     int dest, global_index, local_index;
-  
+
     int row_offset;
     int ncols_proc1, ncols_proc2, nprocs_row1;
     int ptr1_idx, myfirstrow;
@@ -310,8 +317,6 @@ namespace Adelus {
   #ifdef GET_TIMING
     t2 = MPI_Wtime();
   #endif
-  
-    my_rhs_=*num_my_rhs;
 
     typedef typename ZDView::value_type value_type;
   #ifdef PRINT_STATUS
@@ -346,11 +351,11 @@ namespace Adelus {
       myfirstrow = myrow * (nrows_matrix / nprocs_col) + 1;
       myfirstrow = ( myrow > (nrows_matrix%nprocs_col) ) ? myfirstrow + (nrows_matrix%nprocs_col) :
                                                            myfirstrow + myrow;
-  														 
+ 
       ptr1_idx = 0;
   
   #ifdef PRINT_STATUS
-      printf("Rank %i -- perm1_() Begin permutation, execution_space %s, memory_space %s\n",me,typeid(execution_space).name(),typeid(memory_space).name());
+      printf("Rank %i -- perm1_() Begin permutation, execution_space %s, memory_space %s\n",ahandle.get_myrank(),typeid(execution_space).name(),typeid(memory_space).name());
   #endif
   
       for (i=0; i<my_rows; i++) {
@@ -399,9 +404,11 @@ namespace Adelus {
 
   #ifdef GET_TIMING
   #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-    showtime("Time to copy dev mem --> host pinned mem",&copyhostpinnedtime);   
+    showtime(comm, ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+             "Time to copy dev mem --> host pinned mem", &copyhostpinnedtime);   
   #endif
-    showtime("Total time in perm",&totalpermtime);
+    showtime(comm, ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+             "Total time in perm", &totalpermtime);
   #endif
   }
 
diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
index c7f36edcfbfa..993abbf6acdc 100644
--- a/packages/adelus/src/Adelus_perm_mat.hpp
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -56,23 +56,22 @@
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
 
-//extern int me;	             // processor id information
-//extern int nprocs_row;         // num of procs to which a row is assigned
-//extern int nprocs_col;         // num of procs to which a col is assigned
-//extern int nrows_matrix;       // number of rows in the matrix
-//extern int ncols_matrix;       // number of cols in the matrix
-//extern int my_rows;            // num of rows I own
-//extern int my_cols;            // num of cols I own
-//extern int myrow;
-//extern int mycol;
-//extern MPI_Comm col_comm;
-
 namespace Adelus {
 
   template<class HandleType, class PViewType>
   inline 
   void exchange_pivots(HandleType& ahandle, PViewType& lpiv_view, PViewType& permute) {
-  
+
+    MPI_Comm comm     = ahandle.get_comm();
+    MPI_Comm row_comm = ahandle.get_row_comm();
+    int me            = ahandle.get_myrank();
+    int myrow         = ahandle.get_myrow();
+    int mycol         = ahandle.get_mycol();
+    int nprocs_row    = ahandle.get_nprocs_row();
+    int nprocs_col    = ahandle.get_nprocs_col();
+    int nrows_matrix  = ahandle.get_nrows_matrix();
+    int my_rows       = ahandle.get_my_rows();
+
     MPI_Status msgstatus;
     int rank_row,k_row,pivot_col;
 
@@ -84,15 +83,15 @@ namespace Adelus {
         rank_row = k_row*nprocs_row;
         if (me == pivot_col) {
           int j=k/nprocs_row;
-          MPI_Send(lpiv_view.data()+j,1,MPI_INT,rank_row,0,ahandle.get_comm());
+          MPI_Send(lpiv_view.data()+j,1,MPI_INT,rank_row,0,comm);
         }
         if (me == rank_row) {
           int i=k/nprocs_col;
-          MPI_Recv(permute.data()+i,1,MPI_INT,pivot_col,0,ahandle.get_comm(),&msgstatus);
+          MPI_Recv(permute.data()+i,1,MPI_INT,pivot_col,0,comm,&msgstatus);
         }
       }
     }
-    MPI_Barrier(ahandle.get_comm());
+    MPI_Barrier(comm);
     // Broadcast to the rest of the processors in row_comm
     MPI_Bcast(permute.data(),my_rows,MPI_INT,0,row_comm);
 
@@ -113,13 +112,21 @@ namespace Adelus {
     using ViewVectorHostPinnType = Kokkos::View<value_type*, Kokkos::LayoutLeft, Kokkos::Experimental::HIPHostPinnedSpace>;//HIPHostPinnedSpace
   #endif
 #endif
+    MPI_Comm col_comm = ahandle.get_col_comm();
+    int myrow         = ahandle.get_myrow();
+    int mycol         = ahandle.get_mycol();
+    int nprocs_row    = ahandle.get_nprocs_row();
+    int nprocs_col    = ahandle.get_nprocs_col();
+    int nrows_matrix  = ahandle.get_nrows_matrix();
+    int my_cols       = ahandle.get_my_cols();
+
 #ifdef PRINT_STATUS
-  printf("Rank %i -- permute_mat() Begin permute mat with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- permute_mat() Begin permute mat with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ahandle.get_ncols_matrix(), ahandle.get_my_rows(), my_cols, ahandle.get_my_rhs(), ahandle.get_nrhs(), typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 #endif
 
     MPI_Status msgstatus;
-  
+
     int pivot_row, k_row;
 #ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
     value_type tmpr, tmps;
@@ -270,8 +277,10 @@ namespace Adelus {
 #ifdef GET_TIMING
     permutemattime = MPI_Wtime()-t1;
 
-    showtime("Time to exchange pivot information",&exchpivtime);
-    showtime("Time to permute matrix",&permutemattime);    
+    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+             "Time to exchange pivot information", &exchpivtime);
+    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+             "Time to permute matrix", &permutemattime);    
 #endif
   }// End of function permute_mat
 
diff --git a/packages/adelus/src/Adelus_perm_rhs.hpp b/packages/adelus/src/Adelus_perm_rhs.hpp
index 1805593b28a8..6c7818f3bbe9 100644
--- a/packages/adelus/src/Adelus_perm_rhs.hpp
+++ b/packages/adelus/src/Adelus_perm_rhs.hpp
@@ -56,23 +56,11 @@
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
 
-//extern int me;                 // processor id information
-//extern int nprocs_row;         // num of procs to which a row is assigned
-//extern int nprocs_col;         // num of procs to which a col is assigned
-//extern int nrows_matrix;       // number of rows in the matrix
-//extern int ncols_matrix;       // number of cols in the matrix
-//extern int my_rows;            // num of rows I own
-//extern int my_cols;            // num of cols I own
-//extern int my_rhs;             // num of right hand side I own
-//extern int myrow;
-//extern int mycol;
-//extern MPI_Comm col_comm;
-
 namespace Adelus {
   
   template<class HandleType, class ZViewType, class PViewType>
   inline
-  void permute_rhs(HandleType& ahandle, ZViewType& RHS, PViewType& permute, int& my_num_rhs) {
+  void permute_rhs(HandleType& ahandle, ZViewType& RHS, PViewType& permute) {
     using value_type      = typename ZViewType::value_type;
     using execution_space = typename ZViewType::device_type::execution_space ;
     using memory_space    = typename ZViewType::device_type::memory_space ;
@@ -85,6 +73,11 @@ namespace Adelus {
   #endif
 #endif
 
+    MPI_Comm col_comm = ahandle.get_col_comm();
+    int myrow         = ahandle.get_myrow();
+    int nprocs_col    = ahandle.get_nprocs_col();
+    int nrows_matrix  = ahandle.get_nrows_matrix();
+
     int pivot_row, k_row;
     ViewVectorType tmpr( "tmpr", RHS.extent(1) );
     ViewVectorType tmps( "tmps", RHS.extent(1) );
@@ -113,7 +106,7 @@ namespace Adelus {
     for (int k=0;k<=nrows_matrix-2;k++) {
       k_row=k%nprocs_col;
 
-      if (my_num_rhs > 0) {
+      if (ahandle.get_my_rhs() > 0) {
         if (myrow==k_row) pivot_row = permute(k/nprocs_col);
         MPI_Bcast(&pivot_row,1,MPI_INT,k_row,col_comm);
         int pivot_row_pid = pivot_row%nprocs_col;
@@ -188,7 +181,8 @@ namespace Adelus {
 #ifdef GET_TIMING
     permuterhstime = MPI_Wtime()-t1;
 
-    showtime("Time to permute rhs",&permuterhstime);    
+    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+             "Time to permute rhs", &permuterhstime);
 #endif
   }// End of function permute_rhs
 
diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index 774dc5700a29..8b976a63bbce 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -53,32 +53,12 @@
 #include <mpi.h>
 #include "Adelus_defines.h"
 #include "Adelus_macros.h"
-#include "Adelus_pcomm.hpp"
 #include "Adelus_mytime.hpp"
 #include "Kokkos_Core.hpp"
 #include "KokkosBlas3_gemm.hpp"
 
 #define IBM_MPI_WRKAROUND2
 
-extern int me;
-
-extern int ncols_matrix;  // number of cols in the matrix
-
-extern int nprocs_col;    // num of procs to which a col is assigned
-extern int nprocs_row;    // num of procs to which a row is assigned
-
-extern int my_first_col;  // proc position in a col
-extern int my_first_row;  // proc position in a row
-
-extern int my_rows;       // num of rows I own
-extern int my_cols;       // num of cols I own
-
-extern int nrhs;          // number of right hand sides
-extern int my_rhs;        // number of right hand sides that I own
-
-extern MPI_Comm col_comm;
-
-
 #define SOSTATUSINT 32768
 
 // Message tags
@@ -123,6 +103,19 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 #endif
 
+  MPI_Comm comm     = ahandle.get_comm();
+  MPI_Comm col_comm = ahandle.get_col_comm();
+  int me            = ahandle.get_myrank();
+  int nprocs_row    = ahandle.get_nprocs_row();
+  int nprocs_col    = ahandle.get_nprocs_col();
+  int ncols_matrix  = ahandle.get_ncols_matrix();
+  int my_rows       = ahandle.get_my_rows();
+  int my_cols       = ahandle.get_my_cols();
+  int my_first_row  = ahandle.get_my_first_row();
+  int my_first_col  = ahandle.get_my_first_col();
+  int nrhs          = ahandle.get_nrhs();
+  int my_rhs        = ahandle.get_my_rhs();
+
   int  j;         // loop counters
   int end_row;    // row num to end column operations
   int bytes[16];  // number of bytes in messages
@@ -324,9 +317,9 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
         type[0]  = SOROWTYPE+j;
 
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        MPI_Irecv(reinterpret_cast<char *>(h_row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], ahandle.get_comm(), &msgrequest);
+        MPI_Irecv(reinterpret_cast<char *>(h_row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], comm, &msgrequest);
 #else
-        MPI_Irecv(reinterpret_cast<char *>(  row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], ahandle.get_comm(), &msgrequest);
+        MPI_Irecv(reinterpret_cast<char *>(  row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], comm, &msgrequest);
 #endif
 
         n_rhs_this = bytes[0]/sizeof(ADELUS_DATA_TYPE)/my_rows;
@@ -341,9 +334,9 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
         type[1]  = SOROWTYPE+j;
 
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        MPI_Send(reinterpret_cast<char *>(h_rhs.data()), bytes[1], MPI_CHAR, dest[1], type[1], ahandle.get_comm());
+        MPI_Send(reinterpret_cast<char *>(h_rhs.data()), bytes[1], MPI_CHAR, dest[1], type[1], comm);
 #else //GPU-aware MPI
-        MPI_Send(reinterpret_cast<char *>(RHS.data()), bytes[1], MPI_CHAR, dest[1], type[1], ahandle.get_comm());
+        MPI_Send(reinterpret_cast<char *>(RHS.data()), bytes[1], MPI_CHAR, dest[1], type[1], comm);
 #endif
 
         MPI_Wait(&msgrequest,&msgstatus);
@@ -383,15 +376,15 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
   totalsolvetime = MPI_Wtime() - t2;
 #endif
 #ifdef GET_TIMING
-  showtime("Time to alloc view",&allocviewtime);
-  showtime("Time to eliminate rhs",&eliminaterhstime);
-  showtime("Time to bcast temp row",&bcastrowtime);
-  showtime("Time to update rhs",&updrhstime);
+  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to alloc view", &allocviewtime);
+  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to eliminate rhs",&eliminaterhstime);
+  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to bcast temp row",&bcastrowtime);
+  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to update rhs",&updrhstime);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-  showtime("Time to copy host pinned mem <--> dev mem",&copyhostpinnedtime);   
+  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to copy host pinned mem <--> dev mem",&copyhostpinnedtime);   
 #endif
-  showtime("Time to xchg rhs",&xchgrhstime);
-  showtime("Total time in solve",&totalsolvetime);
+  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to xchg rhs",&xchgrhstime);
+  showtime(comm, me, ahandle.get_nprocs_cube(), "Total time in solve",&totalsolvetime);
 #endif
 }
 
diff --git a/packages/adelus/src/Adelus_vars.hpp b/packages/adelus/src/Adelus_vars.hpp
index ec7f62679065..6b6b59f2ffce 100644
--- a/packages/adelus/src/Adelus_vars.hpp
+++ b/packages/adelus/src/Adelus_vars.hpp
@@ -49,31 +49,6 @@
 
 
 namespace Adelus {
-	
-int   me;               // processor id information
-
-int   nprocs_cube;		// num of procs in the allocated cube
-int   nprocs_row;		// num of procs to which a row is assigned
-int   nprocs_col;		// num of procs to which a col is assigned
-int   max_procs;		// max num of procs in any dimension
-
-int   nrows_matrix;		// number of rows in the matrix
-int   ncols_matrix;		// number of cols in the matrix
-
-int   my_first_row;		// proc position in a row
-int   my_first_col;		// proc position in a col
-
-int   my_rows;			// num of rows I own
-int   my_cols;			// num of cols I own
-
-int   nrhs;             // number of right hand sides in the matrix
-int   my_rhs;           // number of right hand sides that I own
-
-int   blksz;			// block size for BLAS 3 operations
-
-int  myrow,mycol;
-
-MPI_Comm row_comm,col_comm;
 
 template <class ScalarType,
           class ExecutionSpace,
@@ -85,72 +60,71 @@ class AdelusHandle {
   using memory_space    = MemorySpace;
 
  private:
-  int myrank;         // process id information
+  int myrank;        // process id information
 
-  /*int nprocs_cube;    // num of procs in the allocated cube
-  int nprocs_row;     // num of procs to which a row is assigned
-  int nprocs_col;     // num of procs to which a col is assigned
-  //int   max_procs;  // max num of procs in any dimension
+  int nprocs_cube;   // num of procs in the allocated cube
+  int nprocs_row;    // num of procs to which a row is assigned
+  int nprocs_col;    // num of procs to which a col is assigned
 
-  int nrows_matrix;   // number of rows in the matrix
-  int ncols_matrix;   // number of cols in the matrix
+  int nrows_matrix;  // number of rows in the matrix
+  int ncols_matrix;  // number of cols in the matrix
 
-  int my_first_row;   // proc position in a row
-  int my_first_col;   // proc position in a col
+  int my_first_row;  // proc position in a row
+  int my_first_col;  // proc position in a col
   
-  int my_rows;        // num of rows I own
-  int my_cols;        // num of cols I own
+  int my_rows;       // num of rows I own
+  int my_cols;       // num of cols I own
   
-  int nrhs;           // number of right hand sides in the matrix
-  int my_rhs;         // number of right hand sides that I own
+  int nrhs;          // number of right hand sides in the matrix
+  int my_rhs;        // number of right hand sides that I own
   
-  int blksz;          // block size for BLAS 3 operations
-  
-  int myrow;          // process id in the row_comm 
-  int mycol;          // process id in the col_comm
-  
-  MPI_Comm row_comm;
-  MPI_Comm col_comm;*/
-  MPI_Comm comm;
+  int blksz;         // block size for matrix update (matrix-matrix multiply)
+                     // (e.g. blksz = 128 for GPU, or blksz = 96 for CPU)
+
+  int myrow;         // process id in the row_comm 
+  int mycol;         // process id in the col_comm
+
+  MPI_Comm row_comm; // row communicator that I belong to
+  MPI_Comm col_comm; // column communicator that I belong to
+  MPI_Comm comm;     // global communicator that I belong to
 
  public:
   AdelusHandle( MPI_Comm comm_,
                 const int matrix_size_,
                 const int num_procsr_,
-                const int num_rhs_ )
-      : comm(comm_)/*,
+                const int num_rhs_,
+                const int blksz_ = 128 )
+      : comm(comm_),
         nrows_matrix(matrix_size_),
         ncols_matrix(matrix_size_),
         nprocs_row(num_procsr_),
-        nrhs(num_rhs_)*/ {
-    //// Determine who I am (me ) and the total number of nodes (nprocs_cube)
-    //MPI_Comm_size(comm, &nprocs_cube);
+        nrhs(num_rhs_),
+        blksz(blksz_) {
+    // Determine who I am (myrank) and the total number of processes (nprocs_cube)
+    MPI_Comm_size(comm, &nprocs_cube);
     MPI_Comm_rank(comm, &myrank);
-    /*nprocs_col = nprocs_cube/nprocs_row;
+    nprocs_col = nprocs_cube/nprocs_row;
 
     // Set up communicators for rows and columns
-    myrow = mesh_row(myrank);
-    mycol = mesh_col(myrank);
-.
-    MPI_Comm_split(comm, myrow,mycol, &row_comm);
+    mycol = myrank%nprocs_row;
+    myrow = myrank/nprocs_row;
+
+    MPI_Comm_split(comm, myrow, mycol, &row_comm);
 
     MPI_Comm_split(comm, mycol, myrow, &col_comm);
 
     // Distribution for the matrix on myrank
-    my_first_col = mesh_col(myrank);
-    my_first_row = mesh_row(myrank);
+    my_first_col = myrank % nprocs_row;
+    my_first_row = myrank / nprocs_row;
 
     my_rows = nrows_matrix / nprocs_col;
     if (my_first_row < nrows_matrix % nprocs_col) my_rows++;
     my_cols = ncols_matrix / nprocs_row;
     if (my_first_col < ncols_matrix % nprocs_row) my_cols++;
 
-    // blksz parameter must be set
-    blksz = DEFBLKSZ;
-
     // Distribution for the rhs on myrank
     my_rhs = nrhs / nprocs_row;
-    if (my_first_col < nrhs % nprocs_row) my_rhs++;*/
+    if (my_first_col < nrhs % nprocs_row) my_rhs++;
   }
 
   ~AdelusHandle(){}
@@ -158,16 +132,16 @@ class AdelusHandle {
   KOKKOS_INLINE_FUNCTION
   MPI_Comm get_comm() const { return comm; }
 
-  /*KOKKOS_INLINE_FUNCTION
+  KOKKOS_INLINE_FUNCTION
   MPI_Comm get_row_comm() const { return row_comm; }
 
   KOKKOS_INLINE_FUNCTION
-  MPI_Comm get_col_comm() const { return col_comm; }*/
+  MPI_Comm get_col_comm() const { return col_comm; }
 
   KOKKOS_INLINE_FUNCTION
   int get_myrank() const { return myrank; }
 
-  /*KOKKOS_INLINE_FUNCTION
+  KOKKOS_INLINE_FUNCTION
   int get_myrow() const { return myrow; }
 
   KOKKOS_INLINE_FUNCTION
@@ -207,7 +181,7 @@ class AdelusHandle {
   int get_my_rhs() const { return my_rhs; }
 
   KOKKOS_INLINE_FUNCTION
-  int get_blksz() const { return blksz; }*/
+  int get_blksz() const { return blksz; }
 };
 
 }//namespace Adelus
diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
index 1acd057d1e0e..a488b6569e77 100644
--- a/packages/adelus/src/Adelus_x_factor.hpp
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -50,16 +50,15 @@
 #include <stdio.h>
 #include <stdlib.h>
 #include <math.h>
-#include "Adelus_defines.h"
 #include "mpi.h"
-#include "Adelus_vars.hpp"
+#include "Kokkos_Core.hpp"
+#include "Adelus_defines.h"
 #include "Adelus_macros.h"
-#include "Adelus_block.h"
+#include "Adelus_vars.hpp"
+#include "Adelus_mytime.hpp"
 #include "Adelus_factor.hpp"
 #include "Adelus_perm_mat.hpp"
-#include "Adelus_pcomm.hpp"
-#include "Adelus_mytime.hpp"
-#include "Kokkos_Core.hpp"
+
 
 #ifdef ADELUS_HAVE_TIME_MONITOR
 #include "Teuchos_TimeMonitor.hpp"
@@ -69,8 +68,7 @@ namespace Adelus {
 
 template<class HandleType, class ZViewType, class PViewType>
 inline
-void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute,
-         int *matrix_size, int *num_procsr, double *secs)
+void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
@@ -82,62 +80,33 @@ void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute,
 #endif
   using memory_space    = typename ZViewType::device_type::memory_space;
 
-  double run_secs;              // time (in secs) during which the prog ran
-  double tsecs;                 // intermediate storage of timing info
-  int totmem;
-
-  // Determine who I am (me ) and the total number of nodes (nprocs_cube)
-  MPI_Comm_size(ahandle.get_comm(),&nprocs_cube);
-  MPI_Comm_rank(ahandle.get_comm(), &me);
-
-  nrows_matrix = *matrix_size;
-  ncols_matrix = *matrix_size;
-  nprocs_row   = *num_procsr;
-
-  totmem=0;  // Initialize the total memory used
-  nprocs_col = nprocs_cube/nprocs_row;
-  max_procs = (nprocs_row < nprocs_col) ? nprocs_col : nprocs_row;
-
-  // Set up communicators for rows and columns
-  myrow = mesh_row(me);
-  mycol = mesh_col(me);
-
-  MPI_Comm_split(ahandle.get_comm(),myrow,mycol,&row_comm);
-
-  MPI_Comm_split(ahandle.get_comm(),mycol,myrow,&col_comm);
-
-  // Distribution for the matrix on me
-  my_first_col = mesh_col(me);
-  my_first_row = mesh_row(me);
-
-  my_rows = nrows_matrix / nprocs_col;
-  if (my_first_row < nrows_matrix % nprocs_col)
-    ++my_rows;
-  my_cols = ncols_matrix / nprocs_row;
-  if (my_first_col < ncols_matrix % nprocs_row)
-    ++my_cols;
-
-  // blksz parameter must be set
-  blksz = DEFBLKSZ;
+  int blksz   = ahandle.get_blksz();
+  int my_rows = ahandle.get_my_rows();
+  int my_cols = ahandle.get_my_cols();
+  int nrhs    = ahandle.get_nrhs();
 
+  double run_secs; // time (in secs) during which the prog ran
+  double tsecs;    // intermediate storage of timing info
+  int totmem = 0;  // Initialize the total memory used
+  
 #ifdef PRINT_STATUS
-  printf("Rank %i -- factor_() Begin LU with blksz %d, myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, blksz, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- factor_() Begin LU with blksz %d, myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), blksz, ahandle.get_myrow(), ahandle.get_mycol(), ahandle.get_nprocs_row(), ahandle.get_nprocs_col(), ahandle.get_nrows_matrix(), ahandle.get_ncols_matrix(), my_rows, my_cols, ahandle.get_my_rhs(), nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 
   // Allocate arrays for factor
   using ViewType1D = Kokkos::View<value_type*,  Kokkos::LayoutLeft, memory_space>;
   using ViewType2D = Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space>;
 
-  totmem += (blksz) * (my_rows) * sizeof(ADELUS_DATA_TYPE);             //col1_view
-  totmem += blksz * (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);//row1_view
-  totmem += (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);        //row2_view
-  totmem += (my_cols + blksz + nrhs) * sizeof(ADELUS_DATA_TYPE);        //row3_view
-  totmem += my_cols * sizeof(int);                                      //lpiv_view
+  totmem += (blksz) * (my_rows) * sizeof(ADELUS_DATA_TYPE);          //col1_view
+  totmem += blksz * (my_cols + blksz + 0) * sizeof(ADELUS_DATA_TYPE);//row1_view
+  totmem += (my_cols + blksz + 0) * sizeof(ADELUS_DATA_TYPE);        //row2_view
+  totmem += (my_cols + blksz + 0) * sizeof(ADELUS_DATA_TYPE);        //row3_view
+  totmem += my_cols * sizeof(int);                                   //lpiv_view
   
   ViewType2D  col1_view ( "col1_view", my_rows, blksz );
-  ViewType2D  row1_view ( "row1_view", blksz, my_cols + blksz + nrhs );
-  ViewType1D  row2_view ( "row2_view", my_cols + blksz + nrhs );
-  ViewType1D  row3_view ( "row3_view", my_cols + blksz + nrhs );
+  ViewType2D  row1_view ( "row1_view", blksz, my_cols + blksz + 0 );
+  ViewType1D  row2_view ( "row2_view", my_cols + blksz + 0 );
+  ViewType1D  row3_view ( "row3_view", my_cols + blksz + 0 );
   PViewType   lpiv_view ( "lpiv_view", my_cols );
 
   {
@@ -145,10 +114,8 @@ void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute,
 
   tsecs = get_seconds(0.0);
 
-  initcomm();
-
 #ifdef PRINT_STATUS
-  printf("OpenMP or Cuda: Rank %i -- factor() starts ...\n", me);
+  printf("OpenMP or Cuda: Rank %i -- factor() starts ...\n", ahandle.get_myrank());
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
   {
@@ -160,7 +127,8 @@ void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute,
            row1_view,
            row2_view, 
            row3_view, 
-           lpiv_view);
+           lpiv_view,
+           0, 0);
 #ifdef ADELUS_HAVE_TIME_MONITOR
   }
 #endif
@@ -189,7 +157,8 @@ void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute,
   run_secs = (double) tsecs;
   
   *secs = run_secs;
-  showtime("Total time in Factor (inl. matrix permutation)",&run_secs);
+  showtime( ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+           "Total time in Factor (inl. matrix permutation)", &run_secs );
   }
 }
 
diff --git a/packages/adelus/src/Adelus_x_solve.hpp b/packages/adelus/src/Adelus_x_solve.hpp
index e04d174c76e8..596f81afc844 100644
--- a/packages/adelus/src/Adelus_x_solve.hpp
+++ b/packages/adelus/src/Adelus_x_solve.hpp
@@ -50,18 +50,16 @@
 #include <stdio.h>
 #include <stdlib.h>
 #include <math.h>
-#include "Adelus_defines.h"
 #include "mpi.h"
-#include "Adelus_vars.hpp"
+#include "Kokkos_Core.hpp"
+#include "Adelus_defines.h"
 #include "Adelus_macros.h"
-#include "Adelus_block.h"
+#include "Adelus_vars.hpp"
+#include "Adelus_mytime.hpp"
 #include "Adelus_perm_rhs.hpp"
 #include "Adelus_forward.hpp"
 #include "Adelus_solve.hpp"
 #include "Adelus_perm1.hpp"
-#include "Adelus_pcomm.hpp"
-#include "Adelus_mytime.hpp"
-#include "Kokkos_Core.hpp"
 
 #ifdef ADELUS_HAVE_TIME_MONITOR
 #include "Teuchos_TimeMonitor.hpp"
@@ -71,8 +69,7 @@ namespace Adelus {
 
 template<class HandleType, class ZViewType, class RHSViewType, class PViewType>
 inline
-void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& permute,
-            int *num_rhs, double *secs)
+void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& permute, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
@@ -84,17 +81,11 @@ void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& perm
   using memory_space    = typename ZViewType::device_type::memory_space;
 #endif
 
-
   double run_secs; // time (in secs) during which the prog ran
   double tsecs;    // intermediate storage of timing info
 
-  // Distribution for the rhs on me
-  nrhs = *num_rhs;
-  my_rhs = nrhs / nprocs_row;
-  if (my_first_col < nrhs % nprocs_row) ++my_rhs;
-
 #ifdef PRINT_STATUS
-  printf("Rank %i -- solve_() Begin FwdSolve+BwdSolve+Perm with blksz %d, myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", me, blksz, myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ncols_matrix, my_rows, my_cols, my_rhs, nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- solve_() Begin FwdSolve+BwdSolve+Perm with blksz %d, myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), ahandle.get_blksz(), ahandle.get_myrow(), ahandle.get_mycol(), ahandle.get_nprocs_row(), ahandle.get_nprocs_col(), ahandle.get_nrows_matrix(), ahandle.get_ncols_matrix(), ahandle.get_my_rows(), ahandle.get_my_cols(), ahandle.get_my_rhs(), ahandle.get_nrhs(), typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 
   {
@@ -114,9 +105,9 @@ void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& perm
 #endif
       // Permute the RHS
 #ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
-      permute_rhs(ahandle, h_RHS, permute, my_rhs);
+      permute_rhs(ahandle, h_RHS, permute);
 #else
-      permute_rhs(ahandle, RHS, permute, my_rhs);
+      permute_rhs(ahandle, RHS, permute);
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
@@ -128,9 +119,9 @@ void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& perm
 #endif
       //Forward Solve
 #ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
-      forward(ahandle, h_Z, h_RHS, my_rhs);
+      forward(ahandle, h_Z, h_RHS);
 #else
-      forward(ahandle, Z, RHS, my_rhs);
+      forward(ahandle, Z, RHS);
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
@@ -142,7 +133,7 @@ void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& perm
     Kokkos::deep_copy (RHS, h_RHS);
 #endif
 
-    MPI_Barrier(MPI_COMM_WORLD);
+    MPI_Barrier(ahandle.get_comm());
 
 #ifdef ADELUS_HAVE_TIME_MONITOR
     {
@@ -153,25 +144,26 @@ void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& perm
     }
 #endif
 
-    MPI_Barrier(MPI_COMM_WORLD);
+    MPI_Barrier(ahandle.get_comm());
 
 #ifdef ADELUS_HAVE_TIME_MONITOR
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: permutation"));
 #endif
-      perm1_(ahandle, RHS, &my_rhs);
+      perm1_(ahandle, RHS);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
 
-    MPI_Barrier(MPI_COMM_WORLD);
+    MPI_Barrier(ahandle.get_comm());
 
     tsecs = get_seconds(tsecs);
 
     run_secs = (double) tsecs;
   
     *secs = run_secs;
-    showtime("Total time in Solve",&run_secs);
+    showtime( ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+              "Total time in Solve", &run_secs );
   }
 }
 
diff --git a/packages/adelus/src/Adelus_xlu_solve.hpp b/packages/adelus/src/Adelus_xlu_solve.hpp
index 092acb56f1fa..37c624de3648 100644
--- a/packages/adelus/src/Adelus_xlu_solve.hpp
+++ b/packages/adelus/src/Adelus_xlu_solve.hpp
@@ -50,17 +50,15 @@
 #include <stdio.h>
 #include <stdlib.h>
 #include <math.h>
-#include "Adelus_defines.h"
 #include "mpi.h"
-#include "Adelus_vars.hpp"
+#include "Kokkos_Core.hpp"
+#include "Adelus_defines.h"
 #include "Adelus_macros.h"
-#include "Adelus_block.h"
+#include "Adelus_vars.hpp"
+#include "Adelus_mytime.hpp"
 #include "Adelus_solve.hpp"
 #include "Adelus_factor.hpp"
 #include "Adelus_perm1.hpp"
-#include "Adelus_pcomm.hpp"
-#include "Adelus_mytime.hpp"
-#include "Kokkos_Core.hpp"
 
 #ifdef ADELUS_HAVE_TIME_MONITOR
 #include "Teuchos_TimeMonitor.hpp"
@@ -70,8 +68,7 @@ namespace Adelus {
 
 template<class HandleType, class ZRHSViewType>
 inline
-void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS,
-              int *matrix_size, int *num_procsr, int *num_rhs, double *secs)
+void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS, double *secs)
 {
 #ifdef ADELUS_HAVE_TIME_MONITOR
   using Teuchos::TimeMonitor;
@@ -83,51 +80,18 @@ void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS,
 #endif
   using memory_space    = typename ZRHSViewType::device_type::memory_space;
 
-  double run_secs;              // time (in secs) during which the prog ran
-  double tsecs;                 // intermediate storage of timing info
-  int totmem;
-
-  // Determine who I am (me ) and the total number of nodes (nprocs_cube)
-  MPI_Comm_size(ahandle.get_comm(),&nprocs_cube);
-  MPI_Comm_rank(ahandle.get_comm(), &me);
-
-  nrows_matrix = *matrix_size;
-  ncols_matrix = *matrix_size;
-  nprocs_row   = *num_procsr;
+  int blksz   = ahandle.get_blksz();
+  int my_rows = ahandle.get_my_rows();
+  int my_cols = ahandle.get_my_cols();
+  int nrhs    = ahandle.get_nrhs();
+  int my_rhs  = ahandle.get_my_rhs();
 
-  totmem=0;                      // Initialize the total memory used
-  nprocs_col = nprocs_cube/nprocs_row;
-  max_procs = (nprocs_row < nprocs_col) ? nprocs_col : nprocs_row;
-
-  // Set up communicators for rows and columns
-  myrow = mesh_row(me);
-  mycol = mesh_col(me);
-
-  MPI_Comm_split(ahandle.get_comm(),myrow,mycol,&row_comm);
-
-  MPI_Comm_split(ahandle.get_comm(),mycol,myrow,&col_comm);
-
-  // Distribution for the matrix on me
-  my_first_col = mesh_col(me);
-  my_first_row = mesh_row(me);
-
-  my_rows = nrows_matrix / nprocs_col;
-  if (my_first_row < nrows_matrix % nprocs_col)
-    ++my_rows;
-  my_cols = ncols_matrix / nprocs_row;
-  if (my_first_col < ncols_matrix % nprocs_row)
-    ++my_cols;
-
-  // blksz parameter must be set
-  blksz = DEFBLKSZ;
-
-  // Distribution for the rhs on me
-  nrhs = *num_rhs;
-  my_rhs = nrhs / nprocs_row;
-  if (my_first_col < nrhs % nprocs_row) ++my_rhs;
+  double run_secs; // time (in secs) during which the prog ran
+  double tsecs;    // intermediate storage of timing info
+  int totmem = 0;  // Initialize the total memory used
 
 #ifdef PRINT_STATUS
-  printf("Rank %i -- lusolve_() Begin LU+Solve+Perm with blksz %d, value_type %s, execution_space %s, memory_space %s\n", me, blksz, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- lusolve_() Begin LU+Solve+Perm with blksz %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), blksz, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 
   // Allocate arrays for factor/solve
@@ -147,16 +111,13 @@ void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS,
   ViewType1D    row3_view      ( "row3_view",      my_cols + blksz + nrhs );  
   ViewIntType1D pivot_vec_view ( "pivot_vec_view", my_cols );
 
-  
   {
   // Factor and Solve the system
 
   tsecs = get_seconds(0.0);
 
-  initcomm();
-
 #ifdef PRINT_STATUS
-  printf("OpenMP or Cuda: Rank %i -- factor() starts ...\n", me);
+  printf("OpenMP or Cuda: Rank %i -- factor() starts ...\n", ahandle.get_myrank());
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
   {
@@ -168,7 +129,8 @@ void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS,
            row1_view,
            row2_view, 
            row3_view, 
-           pivot_vec_view);
+           pivot_vec_view,
+           nrhs, my_rhs);
 #ifdef ADELUS_HAVE_TIME_MONITOR
   }
 #endif
@@ -180,7 +142,7 @@ void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS,
     // Perform the backsolve
 
 #ifdef PRINT_STATUS
-    printf("OpenMP or Cuda: Rank %i -- back_solve6() starts ...\n", me);
+    printf("OpenMP or Cuda: Rank %i -- back_solve6() starts ...\n", ahandle.get_myrank());
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
     {
@@ -194,13 +156,13 @@ void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS,
     // Permute the results -- undo the torus map
 
 #ifdef PRINT_STATUS
-    printf("OpenMP or Cuda: Rank %i -- perm1_()(permute the results -- undo the torus map) starts ...\n", me);
+    printf("OpenMP or Cuda: Rank %i -- perm1_()(permute the results -- undo the torus map) starts ...\n", ahandle.get_myrank());
 #endif
 #ifdef ADELUS_HAVE_TIME_MONITOR
     {
       TimeMonitor t(*TimeMonitor::getNewTimer("Adelus: permutation"));
 #endif
-      perm1_(ahandle, RHS, &my_rhs);
+      perm1_(ahandle, RHS);
 #ifdef ADELUS_HAVE_TIME_MONITOR
     }
 #endif
@@ -213,7 +175,8 @@ void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS,
   // Solve time secs
 
   *secs = run_secs;
-  showtime("Total time in Factor and Solve",&run_secs);
+  showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+           "Total time in Factor and Solve", &run_secs);
   }
 }
 
diff --git a/packages/adelus/src/CMakeLists.txt b/packages/adelus/src/CMakeLists.txt
index 4138fb03a0a0..81717dd70d3b 100644
--- a/packages/adelus/src/CMakeLists.txt
+++ b/packages/adelus/src/CMakeLists.txt
@@ -55,11 +55,9 @@ IF (TPL_ENABLE_MPI)
   #
 
   APPEND_SET(HEADERS
-    Adelus_block.h
     Adelus_distribute.hpp
     Adelus_factor.hpp
     Adelus_forward.hpp
-    Adelus_pcomm.hpp
     Adelus_perm1.hpp
     Adelus_perm_mat.hpp
     Adelus_perm_rhs.hpp
@@ -74,7 +72,6 @@ IF (TPL_ENABLE_MPI)
     )
 
   APPEND_SET(SOURCES
-    Adelus_pcomm.cpp
     Adelus_distribute.cpp
     )
 
diff --git a/packages/adelus/test/vector_random/cxx_main.cpp b/packages/adelus/test/vector_random/cxx_main.cpp
index fa9bf345e276..13c628181506 100644
--- a/packages/adelus/test/vector_random/cxx_main.cpp
+++ b/packages/adelus/test/vector_random/cxx_main.cpp
@@ -179,16 +179,10 @@ int main(int argc, char *argv[])
 
   // Get Info to build the matrix on a processor
 
-  Adelus::GetDistribution( &nprocs_per_row,
-                           &matrix_size,
-                           &numrhs,
-                           &myrows,
-                           &mycols,
-                           &myfirstrow,
-                           &myfirstcol,
-                           &myrhs,
-                           &my_row,
-                           &my_col );
+  Adelus::GetDistribution( MPI_COMM_WORLD, 
+                           nprocs_per_row, matrix_size, numrhs,
+                           myrows, mycols, myfirstrow, myfirstcol,
+                           myrhs, my_row, my_col );
 
   //   Define a new communicator
 
@@ -344,7 +338,7 @@ int main(int argc, char *argv[])
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve   ****" << std::endl;
 
-  Adelus::FactorSolve (ahandle, A, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::FactorSolve (ahandle, A, &secs);
 
   if( rank == 0) {
     std::cout << " ----  Solution time  ----   " << secs << "  in secs. " << std::endl;
diff --git a/packages/adelus/test/vector_random_fs/cxx_main.cpp b/packages/adelus/test/vector_random_fs/cxx_main.cpp
index 2d4179e4e8d9..a9d54cc53509 100644
--- a/packages/adelus/test/vector_random_fs/cxx_main.cpp
+++ b/packages/adelus/test/vector_random_fs/cxx_main.cpp
@@ -179,16 +179,10 @@ int main(int argc, char *argv[])
 
   // Get Info to build the matrix on a processor
 
-  Adelus::GetDistribution( &nprocs_per_row,
-                           &matrix_size,
-                           &numrhs,
-                           &myrows,
-                           &mycols,
-                           &myfirstrow,
-                           &myfirstcol,
-                           &myrhs,
-                           &my_row,
-                           &my_col );
+  Adelus::GetDistribution( MPI_COMM_WORLD,
+                           nprocs_per_row, matrix_size, numrhs,
+                           myrows, mycols, myfirstrow, myfirstcol,
+                           myrhs, my_row, my_col );
 
   //   Define a new communicator
 
@@ -351,7 +345,7 @@ int main(int argc, char *argv[])
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Factor   ****" << std::endl;
 
-  Adelus::Factor (ahandle, A, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &secs);
+  Adelus::Factor (ahandle, A, h_permute, &secs);
 
   if( rank == 0) {
     std::cout << " ----  Factor time  ----   " << secs << "  in secs. " << std::endl;
@@ -366,7 +360,7 @@ int main(int argc, char *argv[])
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve (1st)   ****" << std::endl;
 
-  Adelus::Solve (ahandle, A, B, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::Solve (ahandle, A, B, h_permute, &secs);
 
   if( rank == 0)
     std::cout << " ----  Solution time (1st)  ----   " << secs << "  in secs. " << std::endl;
@@ -378,7 +372,7 @@ int main(int argc, char *argv[])
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve (2nd)   ****" << std::endl;
 
-  Adelus::Solve (ahandle, A, B, h_permute, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::Solve (ahandle, A, B, h_permute, &secs);
 
   if( rank == 0)
     std::cout << " ----  Solution time (2nd)  ----   " << secs << "  in secs. " << std::endl;

From bdbcae82496f5421c6df151229b6d1517527e9a8 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 19 Jun 2022 00:18:36 -0700
Subject: [PATCH 020/130] Do some cleanup

---
 packages/adelus/src/Adelus.hpp          | 6 +++++-
 packages/adelus/src/Adelus_macros.h     | 5 +++++
 packages/adelus/src/Adelus_perm1.hpp    | 8 +++-----
 packages/adelus/src/Adelus_perm_mat.hpp | 5 ++---
 packages/adelus/src/Adelus_vars.hpp     | 4 ++--
 5 files changed, 17 insertions(+), 11 deletions(-)

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index f3d551d64194..cec8f471ef7e 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -44,6 +44,9 @@
 //@HEADER
 */
 
+#ifndef __ADELUS_HPP__
+#define __ADELUS_HPP__
+
 #pragma once
 
 #include <Kokkos_Core.hpp>
@@ -565,5 +568,6 @@ namespace Adelus {
   }
 #endif
 
-}
+}//namespace Adelus
 
+#endif
diff --git a/packages/adelus/src/Adelus_macros.h b/packages/adelus/src/Adelus_macros.h
index 7c83522ff801..5acf4dddfb7c 100644
--- a/packages/adelus/src/Adelus_macros.h
+++ b/packages/adelus/src/Adelus_macros.h
@@ -44,6 +44,9 @@
 //@HEADER
 */
 
+#ifndef __ADELUS_MACROS_H__
+#define __ADELUS_MACROS_H__
+
 //#define grey_c(P)     ((P)^((P)>>1))
 
 #define lrow_to_grow(R) ( (mesh_row(me) + nprocs_col*(R))  )
@@ -65,3 +68,5 @@
 #define proc_num(R,C) ((R)*nprocs_row + (C))
 
 //#define mac_send_msg(D,B,S,T)  MPI_Send(B,S,MPI_CHAR,D,T,MPI_COMM_WORLD)
+
+#endif
diff --git a/packages/adelus/src/Adelus_perm1.hpp b/packages/adelus/src/Adelus_perm1.hpp
index 6049159aaf8d..8c6cae68cde4 100644
--- a/packages/adelus/src/Adelus_perm1.hpp
+++ b/packages/adelus/src/Adelus_perm1.hpp
@@ -41,7 +41,7 @@
 //                    Siva Rajamanickam (srajama@sandia.gov)
 //
 // ************************************************************************
-//@HEADER
+//@HEADER]
 */
 
 #ifndef __ADELUS_PERM1_HPP__
@@ -95,7 +95,6 @@ namespace Adelus {
   void perm1_(HandleType& ahandle, ZDView& ZV) {
 
     MPI_Comm comm     = ahandle.get_comm();
-    MPI_Comm col_comm = ahandle.get_col_comm();
     int me            = ahandle.get_myrank();
     int my_rhs_       = ahandle.get_my_rhs();
     int my_rows       = ahandle.get_my_rows();
@@ -287,7 +286,6 @@ namespace Adelus {
   inline
   void perm1_(HandleType& ahandle, ZDView& ZV) {
 
-    MPI_Comm comm     = ahandle.get_comm();
     MPI_Comm col_comm = ahandle.get_col_comm();
     int myrow         = ahandle.get_myrow();   
     int my_rhs_       = ahandle.get_my_rhs();
@@ -404,10 +402,10 @@ namespace Adelus {
 
   #ifdef GET_TIMING
   #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-    showtime(comm, ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
              "Time to copy dev mem --> host pinned mem", &copyhostpinnedtime);   
   #endif
-    showtime(comm, ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
              "Total time in perm", &totalpermtime);
   #endif
   }
diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
index 993abbf6acdc..de326151f5e0 100644
--- a/packages/adelus/src/Adelus_perm_mat.hpp
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -118,10 +118,9 @@ namespace Adelus {
     int nprocs_row    = ahandle.get_nprocs_row();
     int nprocs_col    = ahandle.get_nprocs_col();
     int nrows_matrix  = ahandle.get_nrows_matrix();
-    int my_cols       = ahandle.get_my_cols();
 
 #ifdef PRINT_STATUS
-  printf("Rank %i -- permute_mat() Begin permute mat with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ahandle.get_ncols_matrix(), ahandle.get_my_rows(), my_cols, ahandle.get_my_rhs(), ahandle.get_nrhs(), typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- permute_mat() Begin permute mat with myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), myrow, mycol, nprocs_row, nprocs_col, nrows_matrix, ahandle.get_ncols_matrix(), ahandle.get_my_rows(), ahandle.get_my_cols(), ahandle.get_my_rhs(), ahandle.get_nrhs(), typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 #endif
 
@@ -154,7 +153,7 @@ namespace Adelus {
 #endif
 
 #ifdef ADELUS_PERM_MAT_FORWARD_COPY_TO_HOST
-    for (int j=0;j<=my_cols-1;j++) {
+    for (int j=0;j<=ahandle.get_my_cols()-1;j++) {
       int J=j*nprocs_row+mycol; // global column index
       for (int k=J+1;k<=nrows_matrix-1;k++) {
         k_row=k%nprocs_col;
diff --git a/packages/adelus/src/Adelus_vars.hpp b/packages/adelus/src/Adelus_vars.hpp
index 6b6b59f2ffce..4b5407ec9928 100644
--- a/packages/adelus/src/Adelus_vars.hpp
+++ b/packages/adelus/src/Adelus_vars.hpp
@@ -106,8 +106,8 @@ class AdelusHandle {
     nprocs_col = nprocs_cube/nprocs_row;
 
     // Set up communicators for rows and columns
-    mycol = myrank%nprocs_row;
-    myrow = myrank/nprocs_row;
+    mycol = myrank % nprocs_row;
+    myrow = myrank / nprocs_row;
 
     MPI_Comm_split(comm, myrow, mycol, &row_comm);
 

From ddec4d58166a2f0c3e7a69d82761f7830d9dab79 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 19 Jun 2022 00:21:41 -0700
Subject: [PATCH 021/130] Do some cleanup

---
 packages/adelus/src/Adelus_perm1.hpp | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/adelus/src/Adelus_perm1.hpp b/packages/adelus/src/Adelus_perm1.hpp
index 8c6cae68cde4..8f316c129681 100644
--- a/packages/adelus/src/Adelus_perm1.hpp
+++ b/packages/adelus/src/Adelus_perm1.hpp
@@ -41,7 +41,7 @@
 //                    Siva Rajamanickam (srajama@sandia.gov)
 //
 // ************************************************************************
-//@HEADER]
+//@HEADER
 */
 
 #ifndef __ADELUS_PERM1_HPP__

From 0a05a69da0a5bcb30d31c69f5cd99a173cf9c052 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 19 Jun 2022 22:58:59 -0700
Subject: [PATCH 022/130] Add comm id to handle and showtime

---
 packages/adelus/src/Adelus_factor.hpp         | 70 +++++++++----------
 packages/adelus/src/Adelus_forward.hpp        |  2 +-
 packages/adelus/src/Adelus_mytime.hpp         |  6 +-
 packages/adelus/src/Adelus_perm1.hpp          |  6 +-
 packages/adelus/src/Adelus_perm_mat.hpp       |  4 +-
 packages/adelus/src/Adelus_perm_rhs.hpp       |  2 +-
 packages/adelus/src/Adelus_solve.hpp          | 14 ++--
 packages/adelus/src/Adelus_vars.hpp           | 16 +++--
 packages/adelus/src/Adelus_x_factor.hpp       |  2 +-
 packages/adelus/src/Adelus_x_solve.hpp        |  2 +-
 packages/adelus/src/Adelus_xlu_solve.hpp      |  2 +-
 .../adelus/test/vector_random/cxx_main.cpp    |  2 +-
 .../adelus/test/vector_random_fs/cxx_main.cpp |  2 +-
 13 files changed, 68 insertions(+), 62 deletions(-)

diff --git a/packages/adelus/src/Adelus_factor.hpp b/packages/adelus/src/Adelus_factor.hpp
index 082eae2c0dbb..686e7e37f055 100644
--- a/packages/adelus/src/Adelus_factor.hpp
+++ b/packages/adelus/src/Adelus_factor.hpp
@@ -934,57 +934,57 @@ void factor(HandleType& ahandle,           // handle containg metadata
   copytime     = pivotswaptime+copycoltime+copyrowtime+copyrow1time+copypivrowtime+copypivrow1time;
   dgemmtime    = updatetime+colupdtime+rowupdtime+scaltime;
 #ifdef ADELUS_SHOW_TIMING_DETAILS
-  showtime(comm,me,numprocs,"Time to do iamax",&iamaxtime);
-  showtime(comm,me,numprocs,"Time to get local pivot",&getlocalpivtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to do iamax",&iamaxtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to get local pivot",&getlocalpivtime);
 #endif
-  showtime(comm,me,numprocs,"Total finding local pivot time",&localpivtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Total finding local pivot time",&localpivtime);
   double tmp = 100*localpivtime/totalfactortime;
-  showtime(comm,me,numprocs,"Percent finding local pivot time",&tmp);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Percent finding local pivot time",&tmp);
 #ifdef ADELUS_SHOW_TIMING_DETAILS
-  showtime(comm,me,numprocs,"Time to xchgpivot",&xpivmsgtime);
-  showtime(comm,me,numprocs,"Time to do send in bcast pivot",&bcastpivstime);
-  showtime(comm,me,numprocs,"Time to do recv in bcast pivot",&bcastpivrtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to xchgpivot",&xpivmsgtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to do send in bcast pivot",&bcastpivstime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to do recv in bcast pivot",&bcastpivrtime);
   tmp = bcastpivrtime+bcastpivstime;
-  showtime(comm,me,numprocs,"Time to do bcast pivot",&tmp);
-  showtime(comm,me,numprocs,"Time to do send in bcast cur col",&bcastcolstime);
-  showtime(comm,me,numprocs,"Time to do recv bcast cur col",&bcastcolrtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to do bcast pivot",&tmp);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to do send in bcast cur col",&bcastcolstime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to do recv bcast cur col",&bcastcolrtime);
   tmp = bcastcolrtime+bcastcolstime;
-  showtime(comm,me,numprocs,"Time to do bcast cur col",&tmp);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to do bcast cur col",&tmp);
   tmp = bcastcolrtime+bcastcolstime+bcastpivrtime+bcastpivstime;
-  showtime(comm,me,numprocs,"Time to do bcast cur col and pivot",&tmp);
-  showtime(comm,me,numprocs,"Time to bcast piv row",&bcastrowtime);
-  showtime(comm,me,numprocs,"Time to send cur row",&sendrowtime);
-  showtime(comm,me,numprocs,"Time to recv cur row",&recvrowtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to do bcast cur col and pivot",&tmp);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to bcast piv row",&bcastrowtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to send cur row",&sendrowtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to recv cur row",&recvrowtime);
 #endif
-  showtime(comm,me,numprocs,"Total msg passing time",&msgtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Total msg passing time",&msgtime);
   tmp = 100*msgtime/totalfactortime;
-  showtime(comm,me,numprocs,"Percent msg passing time",&tmp);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Percent msg passing time",&tmp);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined (KOKKOS_ENABLE_HIP))
-  showtime(comm,me,numprocs,"Total copy between host pinned mem and dev mem time",&copyhostpinnedtime); 
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Total copy between host pinned mem and dev mem time",&copyhostpinnedtime); 
   tmp = 100*copyhostpinnedtime/totalfactortime;
-  showtime(comm,me,numprocs,"Percent copy between host pinned mem and dev mem time",&tmp);  
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Percent copy between host pinned mem and dev mem time",&tmp);  
 #endif
 #ifdef ADELUS_SHOW_TIMING_DETAILS
-  showtime(comm,me,numprocs,"Time to swap pivot",&pivotswaptime);
-  showtime(comm,me,numprocs,"Time to copy cur col",&copycoltime);
-  showtime(comm,me,numprocs,"Time to copy cur row to sav row",&copyrowtime);
-  showtime(comm,me,numprocs,"Time to copy piv row to sav piv",&copypivrowtime);
-  showtime(comm,me,numprocs,"Time to copy sav row to cur row",&copyrow1time);
-  showtime(comm,me,numprocs,"Time to copy sav piv  to piv row",&copypivrow1time);
-#endif
-  showtime(comm,me,numprocs,"Total copying time",&copytime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to swap pivot",&pivotswaptime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to copy cur col",&copycoltime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to copy cur row to sav row",&copyrowtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to copy piv row to sav piv",&copypivrowtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to copy sav row to cur row",&copyrow1time);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to copy sav piv  to piv row",&copypivrow1time);
+#endif
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Total copying time",&copytime);
   tmp = 100*copytime/totalfactortime;
-  showtime(comm,me,numprocs,"Percent copying time",&tmp);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Percent copying time",&tmp);
 #ifdef ADELUS_SHOW_TIMING_DETAILS
-  showtime(comm,me,numprocs,"Time to scale cur col",&scaltime);
-  showtime(comm,me,numprocs,"Time to update cur col",&colupdtime);
-  showtime(comm,me,numprocs,"Time to update piv row",&rowupdtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to scale cur col",&scaltime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to update cur col",&colupdtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to update piv row",&rowupdtime);
 #endif
-  showtime(comm,me,numprocs,"Time to update matrix",&updatetime);
-  showtime(comm,me,numprocs,"Total update time",&dgemmtime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Time to update matrix",&updatetime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Total update time",&dgemmtime);
   tmp = 100*dgemmtime/totalfactortime;
-  showtime(comm,me,numprocs,"Percent update time",&tmp);
-  showtime(comm,me,numprocs,"Total time in factor",&totalfactortime);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Percent update time",&tmp);
+  showtime(ahandle.get_comm_id(),comm,me,numprocs,"Total time in factor",&totalfactortime);
 #endif
 }
 
diff --git a/packages/adelus/src/Adelus_forward.hpp b/packages/adelus/src/Adelus_forward.hpp
index 18bd8a6c3654..d46b959378a1 100644
--- a/packages/adelus/src/Adelus_forward.hpp
+++ b/packages/adelus/src/Adelus_forward.hpp
@@ -164,7 +164,7 @@ void forward(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 
 #ifdef GET_TIMING
   fwdsolvetime = MPI_Wtime() - t1;
-  showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+  showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
            "Total time in forward solve", &fwdsolvetime);
 #endif
 }
diff --git a/packages/adelus/src/Adelus_mytime.hpp b/packages/adelus/src/Adelus_mytime.hpp
index 1479c691f5c1..30dc4ee9bb37 100644
--- a/packages/adelus/src/Adelus_mytime.hpp
+++ b/packages/adelus/src/Adelus_mytime.hpp
@@ -64,7 +64,7 @@ double get_seconds(double start)
 
 // Exchange and calculate max, min, and average timing information
 
-void showtime(MPI_Comm comm, int me, int nprocs_cube, const char *label, double *value)
+void showtime(int comm_id, MPI_Comm comm, int me, int nprocs_cube, const char *label, double *value)
 {
   double avgtime;
   
@@ -84,8 +84,8 @@ void showtime(MPI_Comm comm, int me, int nprocs_cube, const char *label, double
   avgtime /= nprocs_cube;
   
   if (me == 0) {
-    fprintf(stderr, "%s = %.4f (min, on proc %d), %.4f (avg), %.4f (max, on proc %d).\n",
-      label,min_out.val,min_out.proc,avgtime, max_out.val,max_out.proc);
+    fprintf(stderr, "Communicator %d -- %s = %.4f (min, on proc %d), %.4f (avg), %.4f (max, on proc %d).\n",
+      comm_id,label,min_out.val,min_out.proc,avgtime, max_out.val,max_out.proc);
   }
 }
 
diff --git a/packages/adelus/src/Adelus_perm1.hpp b/packages/adelus/src/Adelus_perm1.hpp
index 8f316c129681..6a96aaa8aff3 100644
--- a/packages/adelus/src/Adelus_perm1.hpp
+++ b/packages/adelus/src/Adelus_perm1.hpp
@@ -266,7 +266,7 @@ namespace Adelus {
     totalpermtime = MPI_Wtime() - t2;
   #endif
   #ifdef GET_TIMING
-    showtime(comm, me, ahandle.get_nprocs_cube(), "Total time in perm", &totalpermtime);
+    showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Total time in perm", &totalpermtime);
   #endif
   }
 
@@ -402,10 +402,10 @@ namespace Adelus {
 
   #ifdef GET_TIMING
   #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+    showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
              "Time to copy dev mem --> host pinned mem", &copyhostpinnedtime);   
   #endif
-    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+    showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
              "Total time in perm", &totalpermtime);
   #endif
   }
diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
index de326151f5e0..917bfc38ad34 100644
--- a/packages/adelus/src/Adelus_perm_mat.hpp
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -276,9 +276,9 @@ namespace Adelus {
 #ifdef GET_TIMING
     permutemattime = MPI_Wtime()-t1;
 
-    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+    showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
              "Time to exchange pivot information", &exchpivtime);
-    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+    showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
              "Time to permute matrix", &permutemattime);    
 #endif
   }// End of function permute_mat
diff --git a/packages/adelus/src/Adelus_perm_rhs.hpp b/packages/adelus/src/Adelus_perm_rhs.hpp
index 6c7818f3bbe9..9d2000268df3 100644
--- a/packages/adelus/src/Adelus_perm_rhs.hpp
+++ b/packages/adelus/src/Adelus_perm_rhs.hpp
@@ -181,7 +181,7 @@ namespace Adelus {
 #ifdef GET_TIMING
     permuterhstime = MPI_Wtime()-t1;
 
-    showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+    showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
              "Time to permute rhs", &permuterhstime);
 #endif
   }// End of function permute_rhs
diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index 8b976a63bbce..55d7ec515df1 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -376,15 +376,15 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
   totalsolvetime = MPI_Wtime() - t2;
 #endif
 #ifdef GET_TIMING
-  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to alloc view", &allocviewtime);
-  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to eliminate rhs",&eliminaterhstime);
-  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to bcast temp row",&bcastrowtime);
-  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to update rhs",&updrhstime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to alloc view", &allocviewtime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to eliminate rhs",&eliminaterhstime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to bcast temp row",&bcastrowtime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to update rhs",&updrhstime);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to copy host pinned mem <--> dev mem",&copyhostpinnedtime);   
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to copy host pinned mem <--> dev mem",&copyhostpinnedtime);   
 #endif
-  showtime(comm, me, ahandle.get_nprocs_cube(), "Time to xchg rhs",&xchgrhstime);
-  showtime(comm, me, ahandle.get_nprocs_cube(), "Total time in solve",&totalsolvetime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to xchg rhs",&xchgrhstime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Total time in solve",&totalsolvetime);
 #endif
 }
 
diff --git a/packages/adelus/src/Adelus_vars.hpp b/packages/adelus/src/Adelus_vars.hpp
index 4b5407ec9928..9aaa540af9f4 100644
--- a/packages/adelus/src/Adelus_vars.hpp
+++ b/packages/adelus/src/Adelus_vars.hpp
@@ -84,17 +84,20 @@ class AdelusHandle {
   int myrow;         // process id in the row_comm 
   int mycol;         // process id in the col_comm
 
-  MPI_Comm row_comm; // row communicator that I belong to
-  MPI_Comm col_comm; // column communicator that I belong to
-  MPI_Comm comm;     // global communicator that I belong to
+  MPI_Comm row_comm; // row sub-communicator that I belong to
+  MPI_Comm col_comm; // column sub-communicator that I belong to
+  MPI_Comm comm;     // communicator that I belong to
+  int comm_id;       // communicator id
 
  public:
-  AdelusHandle( MPI_Comm comm_,
+  AdelusHandle( const int comm_id_,
+                MPI_Comm comm_,
                 const int matrix_size_,
                 const int num_procsr_,
                 const int num_rhs_,
                 const int blksz_ = 128 )
-      : comm(comm_),
+      : comm_id(comm_id_),
+        comm(comm_),
         nrows_matrix(matrix_size_),
         ncols_matrix(matrix_size_),
         nprocs_row(num_procsr_),
@@ -129,6 +132,9 @@ class AdelusHandle {
 
   ~AdelusHandle(){}
 
+  KOKKOS_INLINE_FUNCTION
+  int get_comm_id() const { return comm_id; }
+
   KOKKOS_INLINE_FUNCTION
   MPI_Comm get_comm() const { return comm; }
 
diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
index a488b6569e77..844c7c935602 100644
--- a/packages/adelus/src/Adelus_x_factor.hpp
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -157,7 +157,7 @@ void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute, double *secs)
   run_secs = (double) tsecs;
   
   *secs = run_secs;
-  showtime( ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+  showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
            "Total time in Factor (inl. matrix permutation)", &run_secs );
   }
 }
diff --git a/packages/adelus/src/Adelus_x_solve.hpp b/packages/adelus/src/Adelus_x_solve.hpp
index 596f81afc844..2d996297742a 100644
--- a/packages/adelus/src/Adelus_x_solve.hpp
+++ b/packages/adelus/src/Adelus_x_solve.hpp
@@ -162,7 +162,7 @@ void solve_(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS, PViewType& perm
     run_secs = (double) tsecs;
   
     *secs = run_secs;
-    showtime( ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+    showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
               "Total time in Solve", &run_secs );
   }
 }
diff --git a/packages/adelus/src/Adelus_xlu_solve.hpp b/packages/adelus/src/Adelus_xlu_solve.hpp
index 37c624de3648..eb3474f857a9 100644
--- a/packages/adelus/src/Adelus_xlu_solve.hpp
+++ b/packages/adelus/src/Adelus_xlu_solve.hpp
@@ -175,7 +175,7 @@ void lusolve_(HandleType& ahandle, ZRHSViewType& ZRHS, double *secs)
   // Solve time secs
 
   *secs = run_secs;
-  showtime(ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
+  showtime(ahandle.get_comm_id(), ahandle.get_comm(), ahandle.get_myrank(), ahandle.get_nprocs_cube(),
            "Total time in Factor and Solve", &run_secs);
   }
 }
diff --git a/packages/adelus/test/vector_random/cxx_main.cpp b/packages/adelus/test/vector_random/cxx_main.cpp
index 13c628181506..317c24291ac4 100644
--- a/packages/adelus/test/vector_random/cxx_main.cpp
+++ b/packages/adelus/test/vector_random/cxx_main.cpp
@@ -331,7 +331,7 @@ int main(int argc, char *argv[])
 
   // Create handle
   Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
-    ahandle(MPI_COMM_WORLD, matrix_size, nprocs_per_row, numrhs );
+    ahandle(0, MPI_COMM_WORLD, matrix_size, nprocs_per_row, numrhs );
 
   // Now Solve the Problem
 
diff --git a/packages/adelus/test/vector_random_fs/cxx_main.cpp b/packages/adelus/test/vector_random_fs/cxx_main.cpp
index a9d54cc53509..d0ab98265e5e 100644
--- a/packages/adelus/test/vector_random_fs/cxx_main.cpp
+++ b/packages/adelus/test/vector_random_fs/cxx_main.cpp
@@ -338,7 +338,7 @@ int main(int argc, char *argv[])
 
   // Create handle
   Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
-    ahandle(MPI_COMM_WORLD, matrix_size, nprocs_per_row, numrhs );
+    ahandle(0, MPI_COMM_WORLD, matrix_size, nprocs_per_row, numrhs );
 
   // Now Factor the matrix
 

From c050722c33db40ca224756900ac92c1bfa8e6ee4 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Wed, 22 Jun 2022 13:17:46 -0700
Subject: [PATCH 023/130] A placeholder for the changes

---
 packages/adelus/src/Adelus_solve.hpp | 311 +++++++++++++++++++++++++++
 1 file changed, 311 insertions(+)

diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index 55d7ec515df1..ccf1b80798b1 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -58,6 +58,7 @@
 #include "KokkosBlas3_gemm.hpp"
 
 #define IBM_MPI_WRKAROUND2
+#define NEW_IMPL 
 
 #define SOSTATUSINT 32768
 
@@ -84,6 +85,8 @@ void elimination_rhs(int N, ZView& ptr2, RHSView& ptr3, DView& ptr4, int act_col
 #endif
 }
 
+#ifdef NEW_IMPL
+
 template<class HandleType, class ZViewType, class RHSViewType>
 inline
 void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
@@ -388,6 +391,314 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 }
 
+#else//OLD_IMPL
+
+template<class HandleType, class ZViewType, class RHSViewType>
+inline
+void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
+{
+  using value_type      = typename ZViewType::value_type;
+#ifdef PRINT_STATUS
+  using execution_space = typename ZViewType::device_type::execution_space;
+#endif
+  using memory_space    = typename ZViewType::device_type::memory_space;
+  using View2DType      = Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space>;
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)
+#if defined(KOKKOS_ENABLE_CUDA)
+  using View2DHostPinnType = Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::CudaHostPinnedSpace>;//CudaHostPinnedSpace
+#elif defined(KOKKOS_ENABLE_HIP)
+  using View2DHostPinnType = Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::Experimental::HIPHostPinnedSpace>;//HIPHostPinnedSpace
+#endif
+#endif
+
+  MPI_Comm comm     = ahandle.get_comm();
+  MPI_Comm col_comm = ahandle.get_col_comm();
+  int me            = ahandle.get_myrank();
+  int nprocs_row    = ahandle.get_nprocs_row();
+  int nprocs_col    = ahandle.get_nprocs_col();
+  int ncols_matrix  = ahandle.get_ncols_matrix();
+  int my_rows       = ahandle.get_my_rows();
+  int my_cols       = ahandle.get_my_cols();
+  int my_first_row  = ahandle.get_my_first_row();
+  int my_first_col  = ahandle.get_my_first_col();
+  int nrhs          = ahandle.get_nrhs();
+  int my_rhs        = ahandle.get_my_rhs();
+
+  int  j;         // loop counters
+  int end_row;    // row num to end column operations
+  int bytes[16];  // number of bytes in messages
+  int root;       // root processor for fanout
+  int type[16];   // mesage type for messages
+  int dest[16];   // dest for message sends
+
+  int one = 1;
+
+  value_type d_one = 1.0;
+  value_type d_min_one = -1.0;
+  
+  int j2;
+
+  int n_rhs_this; // num rhs that I currently own
+  int col_offset; // which processor starts the pipeline
+  int my_pos;     // my position in the new linup
+  int extra;      // extra loop to realign data after pipeline
+  int act_col;    // act this column (that I own)
+  int on_col;     // on this collection of rhs's
+  int global_col; // global col number for act_col
+  int max_bytes;  // max number of bytes of rhs I can receive
+
+  int my_col_id, my_row_id, id_temp;
+  int dest_right, dest_left;
+
+#ifdef GET_TIMING
+  double t1,t2;
+  double allocviewtime,eliminaterhstime,bcastrowtime,updrhstime,xchgrhstime;
+  double totalsolvetime;
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+  double copyhostpinnedtime;
+#endif
+#endif
+
+  MPI_Request msgrequest;
+  MPI_Status msgstatus;
+
+#ifdef GET_TIMING
+  t2 = MPI_Wtime();
+#endif
+
+  // find left, right destination procs
+
+  my_col_id = mesh_col(me);
+  my_row_id = mesh_row(me);
+
+  id_temp = my_col_id + 1;
+  if (id_temp >= nprocs_row) id_temp = 0;
+  dest_right = proc_num(my_row_id,id_temp);
+
+  id_temp = my_col_id - 1;
+  if (id_temp < 0) id_temp = nprocs_row-1;
+  dest_left = proc_num(my_row_id,id_temp);
+
+  // set j2 to be first column in last group of columns
+  max_bytes = nrhs/nprocs_row;
+  if (nrhs%nprocs_row > 0) max_bytes++; 
+  max_bytes = max_bytes*sizeof(ADELUS_DATA_TYPE)*my_rows;
+
+#ifdef GET_TIMING
+  allocviewtime=eliminaterhstime=bcastrowtime=updrhstime=xchgrhstime=0.0;
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+  copyhostpinnedtime=0.0;
+#endif
+
+  t1 = MPI_Wtime();
+#endif
+
+  View2DType row1( "row1", one, nrhs );   // row1: diagonal row (temp variables)
+#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+  View2DHostPinnType h_row2( "h_row2", my_rows, max_bytes/sizeof(ADELUS_DATA_TYPE)/my_rows );
+#else
+  View2DType row2( "row2", my_rows, max_bytes/sizeof(ADELUS_DATA_TYPE)/my_rows );
+#endif
+#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+  View2DHostPinnType h_row1( "h_row1", one, nrhs );
+  View2DHostPinnType h_rhs ( "h_rhs",  my_rows, nrhs );
+#endif
+
+  Kokkos::fence();
+
+#ifdef GET_TIMING
+  allocviewtime += (MPI_Wtime()-t1);
+#endif
+   
+  n_rhs_this = my_rhs;// why "n_rhs_this" is changing after the first iteration (need to as Joe???)
+  j2 = ncols_matrix-1;
+  col_offset = (j2%nprocs_row);
+  my_pos = my_first_col - col_offset;
+  if (my_pos < 0) my_pos += nprocs_row;
+  extra = (nprocs_row - (col_offset-1))%nprocs_row;
+
+  act_col = my_cols-1;
+  if (my_pos != 0) act_col++;
+
+  on_col = my_pos;
+
+#ifdef PRINT_STATUS
+  printf("Rank %i -- back_solve6() Begin back solve, execution_space %s, memory_space %s\n",me, typeid(execution_space).name(), typeid(memory_space).name());
+#endif
+
+  for (j = j2; j >= 1-nprocs_row-extra; j--) {
+
+    if ((j+nprocs_row-1 >= 0) && (n_rhs_this > 0)) {
+
+      if ((act_col < my_cols) && (act_col >= 0)) {
+
+        global_col = act_col*nprocs_row + my_first_col;
+
+        end_row = global_col/nprocs_col;
+        if (my_first_row <= global_col%nprocs_col) ++end_row;
+                 
+        // do an elimination step on the rhs that I own
+
+        //auto ptr2_view = subview(Z, end_row-1, Kokkos::ALL());
+
+        root = row_owner(global_col);
+
+        if (me == root) {
+#ifdef GET_TIMING
+          t1 = MPI_Wtime();
+#endif
+          auto ptr2_view = subview(Z,   end_row-1, Kokkos::ALL());
+          auto ptr3_view = subview(RHS, end_row-1, Kokkos::make_pair(0, n_rhs_this));
+          elimination_rhs(n_rhs_this, ptr2_view, ptr3_view, row1, act_col);//note: row1 = ptr4
+          end_row--;
+#ifdef GET_TIMING
+          eliminaterhstime += (MPI_Wtime()-t1);
+#endif
+        }
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+#ifdef GET_TIMING
+        t1 = MPI_Wtime();
+#endif
+        Kokkos::deep_copy(h_row1,row1);
+#ifdef GET_TIMING
+        copyhostpinnedtime += (MPI_Wtime()-t1);
+#endif
+#endif
+
+#ifdef GET_TIMING
+        t1 = MPI_Wtime();
+#endif
+        bytes[0] = n_rhs_this*sizeof(ADELUS_DATA_TYPE);
+        type[0]  = SOCOLTYPE+j;
+
+        //MPI_Bcast((char *) row1, bytes[0], MPI_CHAR, mesh_row(root), col_comm);
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+        MPI_Bcast(reinterpret_cast<char *>(h_row1.data()), bytes[0], MPI_CHAR, mesh_row(root), col_comm);
+#else //GPU-aware MPI
+        MPI_Bcast(reinterpret_cast<char *>(row1.data()), bytes[0], MPI_CHAR, mesh_row(root), col_comm);		
+#endif
+        // added this barrier for CPLANT operation
+
+        MPI_Barrier(col_comm);
+#ifdef GET_TIMING
+        bcastrowtime += (MPI_Wtime()-t1);
+#endif
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+#ifdef GET_TIMING
+        t1 = MPI_Wtime();
+#endif
+        Kokkos::deep_copy(row1,h_row1);
+#ifdef GET_TIMING
+        copyhostpinnedtime += (MPI_Wtime()-t1);
+#endif
+#endif
+
+#ifdef GET_TIMING
+        t1 = MPI_Wtime();
+#endif
+
+        auto A_view = subview(Z,    Kokkos::make_pair(0, end_row), Kokkos::make_pair(act_col, act_col+one));
+        auto C_view = subview(RHS,  Kokkos::make_pair(0, end_row), Kokkos::make_pair(0, n_rhs_this));
+        auto B_view = subview(row1, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this));
+
+        KokkosBlas::gemm("N","N",d_min_one,
+                         A_view,
+                         B_view,
+                         d_one,
+                         C_view);
+
+#ifdef GET_TIMING
+        updrhstime += (MPI_Wtime()-t1);
+#endif
+      }
+    }
+
+#ifdef GET_TIMING
+    t1 = MPI_Wtime();
+#endif
+    if (j != 1-nprocs_row-extra) {
+      dest[0] = dest_right;
+      if (me != dest[0]) {
+        bytes[0] = max_bytes;
+        type[0]  = SOROWTYPE+j;
+
+#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+        MPI_Irecv(reinterpret_cast<char *>(h_row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], comm, &msgrequest);
+#else
+        MPI_Irecv(reinterpret_cast<char *>(  row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], comm, &msgrequest);
+#endif
+
+        n_rhs_this = bytes[0]/sizeof(ADELUS_DATA_TYPE)/my_rows;
+
+#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+        Kokkos::deep_copy(subview(h_rhs, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)), 
+                          subview(RHS,   Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)));
+#endif
+
+        dest[1]  = dest_left;
+        bytes[1] = n_rhs_this * sizeof(ADELUS_DATA_TYPE) * my_rows;
+        type[1]  = SOROWTYPE+j;
+
+#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+        MPI_Send(reinterpret_cast<char *>(h_rhs.data()), bytes[1], MPI_CHAR, dest[1], type[1], comm);
+#else //GPU-aware MPI
+        MPI_Send(reinterpret_cast<char *>(RHS.data()), bytes[1], MPI_CHAR, dest[1], type[1], comm);
+#endif
+
+        MPI_Wait(&msgrequest,&msgstatus);
+
+        // Copy row2 -> rhs
+        int blas_length = n_rhs_this*my_rows;
+#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)) //Use memcpy for now, can use deep_copy in the future //deep_copy is slower than BLAS XCOPY
+#if defined(KOKKOS_ENABLE_CUDA)
+        //Kokkos::deep_copy(subview(RHS, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)), subview(h_row2, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)));
+        cudaMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(h_row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), cudaMemcpyHostToDevice);
+#elif defined(KOKKOS_ENABLE_HIP)
+        hipMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(h_row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), hipMemcpyHostToDevice);
+#endif
+#else
+#if defined(KOKKOS_ENABLE_CUDA)
+        cudaMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), cudaMemcpyDeviceToDevice);
+#elif defined(KOKKOS_ENABLE_HIP)
+        hipMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), hipMemcpyDeviceToDevice);
+#else
+        memcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE));
+#endif
+#endif
+      }
+      on_col++;
+      if (on_col >= nprocs_row) {
+        on_col = 0;
+        act_col--;
+      }
+    }
+#ifdef GET_TIMING
+    xchgrhstime += (MPI_Wtime()-t1);
+#endif
+
+  }
+
+#ifdef GET_TIMING
+  totalsolvetime = MPI_Wtime() - t2;
+#endif
+#ifdef GET_TIMING
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to alloc view", &allocviewtime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to eliminate rhs",&eliminaterhstime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to bcast temp row",&bcastrowtime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to update rhs",&updrhstime);
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to copy host pinned mem <--> dev mem",&copyhostpinnedtime);   
+#endif
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to xchg rhs",&xchgrhstime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Total time in solve",&totalsolvetime);
+#endif
+}
+
+#endif//OLD_IMPL
+
 }//namespace Adelus
 
 #endif

From d93da7d5c23a3512ef9a8c29353fe8ed1e9510c2 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Wed, 22 Jun 2022 13:46:58 -0700
Subject: [PATCH 024/130] Add printf to debug

---
 packages/adelus/src/Adelus_solve.hpp | 7 ++++---
 1 file changed, 4 insertions(+), 3 deletions(-)

diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index ccf1b80798b1..e1be916e41af 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -85,7 +85,7 @@ void elimination_rhs(int N, ZView& ptr2, RHSView& ptr3, DView& ptr4, int act_col
 #endif
 }
 
-#ifdef NEW_IMPL
+#ifndef NEW_IMPL
 
 template<class HandleType, class ZViewType, class RHSViewType>
 inline
@@ -391,7 +391,7 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 }
 
-#else//OLD_IMPL
+#else//NEW_IMPL
 
 template<class HandleType, class ZViewType, class RHSViewType>
 inline
@@ -543,6 +543,7 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
         //auto ptr2_view = subview(Z, end_row-1, Kokkos::ALL());
 
         root = row_owner(global_col);
+        fprintf(stderr,"me %d, global_col %d, end_row %d, root %d", me, global_col, end_row, root);
 
         if (me == root) {
 #ifdef GET_TIMING
@@ -697,7 +698,7 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 }
 
-#endif//OLD_IMPL
+#endif//NEW_IMPL
 
 }//namespace Adelus
 

From e29d8ce5c86e39515bd2223934ab96544b5a94dc Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 26 Jun 2022 01:48:50 -0700
Subject: [PATCH 025/130] Broadcast current column in row communicator instead
 of moving RHS around

---
 packages/adelus/src/Adelus_solve.hpp | 229 +++++++--------------------
 packages/adelus/src/Adelus_vars.hpp  |   4 +-
 2 files changed, 56 insertions(+), 177 deletions(-)

diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index e1be916e41af..a7b3c4f1dc13 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -397,6 +397,7 @@ template<class HandleType, class ZViewType, class RHSViewType>
 inline
 void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 {
+  //TODO: add host pinned mem support
   using value_type      = typename ZViewType::value_type;
 #ifdef PRINT_STATUS
   using execution_space = typename ZViewType::device_type::execution_space;
@@ -414,42 +415,17 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 
   MPI_Comm comm     = ahandle.get_comm();
   MPI_Comm col_comm = ahandle.get_col_comm();
+  MPI_Comm row_comm = ahandle.get_row_comm();
   int me            = ahandle.get_myrank();
+  int myrow         = ahandle.get_myrow();
   int nprocs_row    = ahandle.get_nprocs_row();
   int nprocs_col    = ahandle.get_nprocs_col();
   int ncols_matrix  = ahandle.get_ncols_matrix();
   int my_rows       = ahandle.get_my_rows();
-  int my_cols       = ahandle.get_my_cols();
-  int my_first_row  = ahandle.get_my_first_row();
-  int my_first_col  = ahandle.get_my_first_col();
-  int nrhs          = ahandle.get_nrhs();
   int my_rhs        = ahandle.get_my_rhs();
 
-  int  j;         // loop counters
-  int end_row;    // row num to end column operations
-  int bytes[16];  // number of bytes in messages
-  int root;       // root processor for fanout
-  int type[16];   // mesage type for messages
-  int dest[16];   // dest for message sends
-
-  int one = 1;
-
   value_type d_one = 1.0;
   value_type d_min_one = -1.0;
-  
-  int j2;
-
-  int n_rhs_this; // num rhs that I currently own
-  int col_offset; // which processor starts the pipeline
-  int my_pos;     // my position in the new linup
-  int extra;      // extra loop to realign data after pipeline
-  int act_col;    // act this column (that I own)
-  int on_col;     // on this collection of rhs's
-  int global_col; // global col number for act_col
-  int max_bytes;  // max number of bytes of rhs I can receive
-
-  int my_col_id, my_row_id, id_temp;
-  int dest_right, dest_left;
 
 #ifdef GET_TIMING
   double t1,t2;
@@ -460,31 +436,10 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 #endif
 
-  MPI_Request msgrequest;
-  MPI_Status msgstatus;
-
 #ifdef GET_TIMING
   t2 = MPI_Wtime();
 #endif
 
-  // find left, right destination procs
-
-  my_col_id = mesh_col(me);
-  my_row_id = mesh_row(me);
-
-  id_temp = my_col_id + 1;
-  if (id_temp >= nprocs_row) id_temp = 0;
-  dest_right = proc_num(my_row_id,id_temp);
-
-  id_temp = my_col_id - 1;
-  if (id_temp < 0) id_temp = nprocs_row-1;
-  dest_left = proc_num(my_row_id,id_temp);
-
-  // set j2 to be first column in last group of columns
-  max_bytes = nrhs/nprocs_row;
-  if (nrhs%nprocs_row > 0) max_bytes++; 
-  max_bytes = max_bytes*sizeof(ADELUS_DATA_TYPE)*my_rows;
-
 #ifdef GET_TIMING
   allocviewtime=eliminaterhstime=bcastrowtime=updrhstime=xchgrhstime=0.0;
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
@@ -494,15 +449,10 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
   t1 = MPI_Wtime();
 #endif
 
-  View2DType row1( "row1", one, nrhs );   // row1: diagonal row (temp variables)
-#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-  View2DHostPinnType h_row2( "h_row2", my_rows, max_bytes/sizeof(ADELUS_DATA_TYPE)/my_rows );
-#else
-  View2DType row2( "row2", my_rows, max_bytes/sizeof(ADELUS_DATA_TYPE)/my_rows );
-#endif
+  View2DType curr_col( "curr_col", my_rows, 1 ); //current column
+  View2DType rhs_row ( "rhs_row", 1, my_rhs );   //current row of RHS to hold the elimination results (i.e row of solution)
 #if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-  View2DHostPinnType h_row1( "h_row1", one, nrhs );
-  View2DHostPinnType h_rhs ( "h_rhs",  my_rows, nrhs );
+  View2DHostPinnType h_rhs_row( "h_rhs_row", 1, my_rhs );
 #endif
 
   Kokkos::fence();
@@ -510,59 +460,58 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #ifdef GET_TIMING
   allocviewtime += (MPI_Wtime()-t1);
 #endif
-   
-  n_rhs_this = my_rhs;// why "n_rhs_this" is changing after the first iteration (need to as Joe???)
-  j2 = ncols_matrix-1;
-  col_offset = (j2%nprocs_row);
-  my_pos = my_first_col - col_offset;
-  if (my_pos < 0) my_pos += nprocs_row;
-  extra = (nprocs_row - (col_offset-1))%nprocs_row;
-
-  act_col = my_cols-1;
-  if (my_pos != 0) act_col++;
-
-  on_col = my_pos;
 
 #ifdef PRINT_STATUS
   printf("Rank %i -- back_solve6() Begin back solve, execution_space %s, memory_space %s\n",me, typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 
-  for (j = j2; j >= 1-nprocs_row-extra; j--) {
-
-    if ((j+nprocs_row-1 >= 0) && (n_rhs_this > 0)) {
-
-      if ((act_col < my_cols) && (act_col >= 0)) {
-
-        global_col = act_col*nprocs_row + my_first_col;
+  for (int k = ncols_matrix-1; k >= 0; k--) {
+    int k_row = k%nprocs_col;//proc. id (in the col_comm) having global k 
+    int k_col = k%nprocs_row;//proc. id (in the row_comm) having global k
+    int end_row = k/nprocs_col;
+    if (myrow <= k_row) end_row++;
 
-        end_row = global_col/nprocs_col;
-        if (my_first_row <= global_col%nprocs_col) ++end_row;
-                 
-        // do an elimination step on the rhs that I own
+    //fprintf(stderr,"MYTEST me %d, k %d, procid (row) holding k %d, procid (col) holding k %d, end_row %d, kdivnprocs_row %d\n", me, k, k_row, k_col, end_row, k/nprocs_row);
 
-        //auto ptr2_view = subview(Z, end_row-1, Kokkos::ALL());
+#ifdef GET_TIMING
+    t1 = MPI_Wtime();
+#endif
+    //Step 1: copy the current column of Z to a temporary view
+    Kokkos::deep_copy( Kokkos::subview(curr_col, Kokkos::make_pair(0, end_row), 0), 
+                       Kokkos::subview(Z, Kokkos::make_pair(0, end_row), k/nprocs_row) );
 
-        root = row_owner(global_col);
-        fprintf(stderr,"me %d, global_col %d, end_row %d, root %d", me, global_col, end_row, root);
+    //Step 2: broadcast the current column to all ranks in the row_comm
+    MPI_Bcast(reinterpret_cast<char *>(curr_col.data()), end_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, row_comm);
+#ifdef GET_TIMING
+    xchgrhstime += (MPI_Wtime()-t1);//will change this time var name later
+#endif
 
-        if (me == root) {
 #ifdef GET_TIMING
-          t1 = MPI_Wtime();
+    t1 = MPI_Wtime();
 #endif
-          auto ptr2_view = subview(Z,   end_row-1, Kokkos::ALL());
-          auto ptr3_view = subview(RHS, end_row-1, Kokkos::make_pair(0, n_rhs_this));
-          elimination_rhs(n_rhs_this, ptr2_view, ptr3_view, row1, act_col);//note: row1 = ptr4
-          end_row--;
+    //Step 3: do rhs elimination to get solution x
+    if (myrow == k_row) {//only on ranks having row k
+      if (my_rhs > 0) {  //only on ranks having some rhs
+        auto sub_curr_col = Kokkos::subview(curr_col, end_row-1, Kokkos::ALL());
+        auto sub_rhs      = Kokkos::subview(RHS,      end_row-1, Kokkos::make_pair(0, my_rhs));
+        int act_col = 0;
+        elimination_rhs(my_rhs, sub_curr_col, sub_rhs, rhs_row, act_col); Kokkos::fence();
+        end_row--;//do not count the eliminated row in Step 5
+      }
+    }
 #ifdef GET_TIMING
-          eliminaterhstime += (MPI_Wtime()-t1);
+    eliminaterhstime += (MPI_Wtime()-t1);
 #endif
-        }
 
+    MPI_Barrier(comm);
+
+    if (my_rhs > 0) { //only on ranks having some rhs
+      if (k >= 1) {//still have row(s) to do rhs updates with elimination results
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
 #ifdef GET_TIMING
         t1 = MPI_Wtime();
 #endif
-        Kokkos::deep_copy(h_row1,row1);
+        Kokkos::deep_copy(h_rhs_row,rhs_row);
 #ifdef GET_TIMING
         copyhostpinnedtime += (MPI_Wtime()-t1);
 #endif
@@ -571,18 +520,13 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #ifdef GET_TIMING
         t1 = MPI_Wtime();
 #endif
-        bytes[0] = n_rhs_this*sizeof(ADELUS_DATA_TYPE);
-        type[0]  = SOCOLTYPE+j;
-
-        //MPI_Bcast((char *) row1, bytes[0], MPI_CHAR, mesh_row(root), col_comm);
+        //Step 4: broadcast elimination results to all ranks in col_comm
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        MPI_Bcast(reinterpret_cast<char *>(h_row1.data()), bytes[0], MPI_CHAR, mesh_row(root), col_comm);
+        MPI_Bcast(reinterpret_cast<char *>(h_rhs_row.data()), my_rhs*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_row, col_comm);
 #else //GPU-aware MPI
-        MPI_Bcast(reinterpret_cast<char *>(row1.data()), bytes[0], MPI_CHAR, mesh_row(root), col_comm);		
+        MPI_Bcast(reinterpret_cast<char *>(rhs_row.data()), my_rhs*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_row, col_comm);		
 #endif
-        // added this barrier for CPLANT operation
 
-        MPI_Barrier(col_comm);
 #ifdef GET_TIMING
         bcastrowtime += (MPI_Wtime()-t1);
 #endif
@@ -591,7 +535,7 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #ifdef GET_TIMING
         t1 = MPI_Wtime();
 #endif
-        Kokkos::deep_copy(row1,h_row1);
+        Kokkos::deep_copy(rhs_row,h_rhs_row);
 #ifdef GET_TIMING
         copyhostpinnedtime += (MPI_Wtime()-t1);
 #endif
@@ -600,87 +544,22 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #ifdef GET_TIMING
         t1 = MPI_Wtime();
 #endif
+        //Step 5: call gemm to update RHS with partial solution
+        auto A_view = Kokkos::subview(curr_col, Kokkos::make_pair(0, end_row), Kokkos::ALL());
+        auto B_view = Kokkos::subview(rhs_row,  Kokkos::ALL(), Kokkos::make_pair(0, my_rhs));
+        auto C_view = Kokkos::subview(RHS,      Kokkos::make_pair(0, end_row), Kokkos::make_pair(0, my_rhs));
 
-        auto A_view = subview(Z,    Kokkos::make_pair(0, end_row), Kokkos::make_pair(act_col, act_col+one));
-        auto C_view = subview(RHS,  Kokkos::make_pair(0, end_row), Kokkos::make_pair(0, n_rhs_this));
-        auto B_view = subview(row1, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this));
-
-        KokkosBlas::gemm("N","N",d_min_one,
-                         A_view,
-                         B_view,
-                         d_one,
-                         C_view);
-
+        KokkosBlas::gemm("N","N",d_min_one, A_view, B_view, d_one, C_view);
+        Kokkos::fence();
 #ifdef GET_TIMING
         updrhstime += (MPI_Wtime()-t1);
 #endif
-      }
-    }
+      }//end of (k >= 1)
+    }//end of (my_rhs > 0)
 
-#ifdef GET_TIMING
-    t1 = MPI_Wtime();
-#endif
-    if (j != 1-nprocs_row-extra) {
-      dest[0] = dest_right;
-      if (me != dest[0]) {
-        bytes[0] = max_bytes;
-        type[0]  = SOROWTYPE+j;
+    MPI_Barrier(comm);
 
-#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        MPI_Irecv(reinterpret_cast<char *>(h_row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], comm, &msgrequest);
-#else
-        MPI_Irecv(reinterpret_cast<char *>(  row2.data()), bytes[0], MPI_CHAR, MPI_ANY_SOURCE, type[0], comm, &msgrequest);
-#endif
-
-        n_rhs_this = bytes[0]/sizeof(ADELUS_DATA_TYPE)/my_rows;
-
-#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        Kokkos::deep_copy(subview(h_rhs, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)), 
-                          subview(RHS,   Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)));
-#endif
-
-        dest[1]  = dest_left;
-        bytes[1] = n_rhs_this * sizeof(ADELUS_DATA_TYPE) * my_rows;
-        type[1]  = SOROWTYPE+j;
-
-#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-        MPI_Send(reinterpret_cast<char *>(h_rhs.data()), bytes[1], MPI_CHAR, dest[1], type[1], comm);
-#else //GPU-aware MPI
-        MPI_Send(reinterpret_cast<char *>(RHS.data()), bytes[1], MPI_CHAR, dest[1], type[1], comm);
-#endif
-
-        MPI_Wait(&msgrequest,&msgstatus);
-
-        // Copy row2 -> rhs
-        int blas_length = n_rhs_this*my_rows;
-#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)) //Use memcpy for now, can use deep_copy in the future //deep_copy is slower than BLAS XCOPY
-#if defined(KOKKOS_ENABLE_CUDA)
-        //Kokkos::deep_copy(subview(RHS, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)), subview(h_row2, Kokkos::ALL(), Kokkos::make_pair(0, n_rhs_this)));
-        cudaMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(h_row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), cudaMemcpyHostToDevice);
-#elif defined(KOKKOS_ENABLE_HIP)
-        hipMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(h_row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), hipMemcpyHostToDevice);
-#endif
-#else
-#if defined(KOKKOS_ENABLE_CUDA)
-        cudaMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), cudaMemcpyDeviceToDevice);
-#elif defined(KOKKOS_ENABLE_HIP)
-        hipMemcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE), hipMemcpyDeviceToDevice);
-#else
-        memcpy(reinterpret_cast<ADELUS_DATA_TYPE *>(RHS.data()), reinterpret_cast<ADELUS_DATA_TYPE *>(row2.data()), blas_length*sizeof(ADELUS_DATA_TYPE));
-#endif
-#endif
-      }
-      on_col++;
-      if (on_col >= nprocs_row) {
-        on_col = 0;
-        act_col--;
-      }
-    }
-#ifdef GET_TIMING
-    xchgrhstime += (MPI_Wtime()-t1);
-#endif
-
-  }
+  }//end of for (int k = ncols_matrix-1; k >= 0; k--)
 
 #ifdef GET_TIMING
   totalsolvetime = MPI_Wtime() - t2;
diff --git a/packages/adelus/src/Adelus_vars.hpp b/packages/adelus/src/Adelus_vars.hpp
index 9aaa540af9f4..59b069e034e8 100644
--- a/packages/adelus/src/Adelus_vars.hpp
+++ b/packages/adelus/src/Adelus_vars.hpp
@@ -81,8 +81,8 @@ class AdelusHandle {
   int blksz;         // block size for matrix update (matrix-matrix multiply)
                      // (e.g. blksz = 128 for GPU, or blksz = 96 for CPU)
 
-  int myrow;         // process id in the row_comm 
-  int mycol;         // process id in the col_comm
+  int myrow;         // process id in the col_comm 
+  int mycol;         // process id in the row_comm
 
   MPI_Comm row_comm; // row sub-communicator that I belong to
   MPI_Comm col_comm; // column sub-communicator that I belong to

From 8aed4b0e2611d50a9671af11a84090f9f45c9538 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Thu, 30 Jun 2022 11:45:25 -0700
Subject: [PATCH 026/130] Clean up and add host pinned mem support

---
 packages/adelus/src/Adelus_solve.hpp | 63 ++++++++++++++++++++--------
 1 file changed, 45 insertions(+), 18 deletions(-)

diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index a7b3c4f1dc13..f6f8899d786b 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -58,7 +58,6 @@
 #include "KokkosBlas3_gemm.hpp"
 
 #define IBM_MPI_WRKAROUND2
-#define NEW_IMPL 
 
 #define SOSTATUSINT 32768
 
@@ -85,7 +84,7 @@ void elimination_rhs(int N, ZView& ptr2, RHSView& ptr3, DView& ptr4, int act_col
 #endif
 }
 
-#ifndef NEW_IMPL
+#if 0
 
 template<class HandleType, class ZViewType, class RHSViewType>
 inline
@@ -397,7 +396,6 @@ template<class HandleType, class ZViewType, class RHSViewType>
 inline
 void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 {
-  //TODO: add host pinned mem support
   using value_type      = typename ZViewType::value_type;
 #ifdef PRINT_STATUS
   using execution_space = typename ZViewType::device_type::execution_space;
@@ -405,7 +403,7 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
   using memory_space    = typename ZViewType::device_type::memory_space;
   using View2DType      = Kokkos::View<value_type**, Kokkos::LayoutLeft, memory_space>;
 
-#if defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)
+#if defined(ADELUS_HOST_PINNED_MEM_MPI)
 #if defined(KOKKOS_ENABLE_CUDA)
   using View2DHostPinnType = Kokkos::View<value_type**, Kokkos::LayoutLeft, Kokkos::CudaHostPinnedSpace>;//CudaHostPinnedSpace
 #elif defined(KOKKOS_ENABLE_HIP)
@@ -429,7 +427,7 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 
 #ifdef GET_TIMING
   double t1,t2;
-  double allocviewtime,eliminaterhstime,bcastrowtime,updrhstime,xchgrhstime;
+  double allocviewtime,eliminaterhstime,bcastrowtime,updrhstime,bcastcoltime,copycoltime;
   double totalsolvetime;
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
   double copyhostpinnedtime;
@@ -441,7 +439,7 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 
 #ifdef GET_TIMING
-  allocviewtime=eliminaterhstime=bcastrowtime=updrhstime=xchgrhstime=0.0;
+  allocviewtime=eliminaterhstime=bcastrowtime=updrhstime=bcastcoltime=copycoltime=0.0;
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
   copyhostpinnedtime=0.0;
 #endif
@@ -451,11 +449,12 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 
   View2DType curr_col( "curr_col", my_rows, 1 ); //current column
   View2DType rhs_row ( "rhs_row", 1, my_rhs );   //current row of RHS to hold the elimination results (i.e row of solution)
-#if (defined(ADELUS_HOST_PINNED_MEM_MPI) || defined(IBM_MPI_WRKAROUND2)) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+  View2DHostPinnType h_curr_col( "h_curr_col", my_rows, 1 );
   View2DHostPinnType h_rhs_row( "h_rhs_row", 1, my_rhs );
 #endif
 
-  Kokkos::fence();
+  //Kokkos::fence();//NOTE: Should we need this?
 
 #ifdef GET_TIMING
   allocviewtime += (MPI_Wtime()-t1);
@@ -471,19 +470,47 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
     int end_row = k/nprocs_col;
     if (myrow <= k_row) end_row++;
 
-    //fprintf(stderr,"MYTEST me %d, k %d, procid (row) holding k %d, procid (col) holding k %d, end_row %d, kdivnprocs_row %d\n", me, k, k_row, k_col, end_row, k/nprocs_row);
-
 #ifdef GET_TIMING
     t1 = MPI_Wtime();
 #endif
     //Step 1: copy the current column of Z to a temporary view
     Kokkos::deep_copy( Kokkos::subview(curr_col, Kokkos::make_pair(0, end_row), 0), 
                        Kokkos::subview(Z, Kokkos::make_pair(0, end_row), k/nprocs_row) );
+#ifdef GET_TIMING
+    copycoltime += (MPI_Wtime()-t1);
+#endif
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+#ifdef GET_TIMING
+    t1 = MPI_Wtime();
+#endif
+    Kokkos::deep_copy(h_curr_col,curr_col);
+#ifdef GET_TIMING
+    copyhostpinnedtime += (MPI_Wtime()-t1);
+#endif
+#endif
 
+#ifdef GET_TIMING
+    t1 = MPI_Wtime();
+#endif
     //Step 2: broadcast the current column to all ranks in the row_comm
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+    MPI_Bcast(reinterpret_cast<char *>(h_curr_col.data()), end_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, row_comm);
+#else //GPU-aware MPI
     MPI_Bcast(reinterpret_cast<char *>(curr_col.data()), end_row*sizeof(ADELUS_DATA_TYPE), MPI_CHAR, k_col, row_comm);
+#endif
+#ifdef GET_TIMING
+    bcastcoltime += (MPI_Wtime()-t1);
+#endif
+
+#if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
+#ifdef GET_TIMING
+    t1 = MPI_Wtime();
+#endif
+    Kokkos::deep_copy(curr_col,h_curr_col);
 #ifdef GET_TIMING
-    xchgrhstime += (MPI_Wtime()-t1);//will change this time var name later
+    copyhostpinnedtime += (MPI_Wtime()-t1);
+#endif
 #endif
 
 #ifdef GET_TIMING
@@ -503,9 +530,9 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
     eliminaterhstime += (MPI_Wtime()-t1);
 #endif
 
-    MPI_Barrier(comm);
+    //MPI_Barrier(comm);//NOTE: Should we need this?
 
-    if (my_rhs > 0) { //only on ranks having some rhs
+    if (my_rhs > 0) { //only on ranks having rhs
       if (k >= 1) {//still have row(s) to do rhs updates with elimination results
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
 #ifdef GET_TIMING
@@ -549,15 +576,14 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
         auto B_view = Kokkos::subview(rhs_row,  Kokkos::ALL(), Kokkos::make_pair(0, my_rhs));
         auto C_view = Kokkos::subview(RHS,      Kokkos::make_pair(0, end_row), Kokkos::make_pair(0, my_rhs));
 
-        KokkosBlas::gemm("N","N",d_min_one, A_view, B_view, d_one, C_view);
-        Kokkos::fence();
+        KokkosBlas::gemm("N","N",d_min_one, A_view, B_view, d_one, C_view); Kokkos::fence();
 #ifdef GET_TIMING
         updrhstime += (MPI_Wtime()-t1);
 #endif
       }//end of (k >= 1)
     }//end of (my_rhs > 0)
 
-    MPI_Barrier(comm);
+    //MPI_Barrier(comm);//NOTE: Should we need this?
 
   }//end of for (int k = ncols_matrix-1; k >= 0; k--)
 
@@ -566,13 +592,14 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 #ifdef GET_TIMING
   showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to alloc view", &allocviewtime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to copy matrix column",&copycoltime);
+  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to bcast matrix column",&bcastcoltime);
   showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to eliminate rhs",&eliminaterhstime);
   showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to bcast temp row",&bcastrowtime);
   showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to update rhs",&updrhstime);
 #if defined(ADELUS_HOST_PINNED_MEM_MPI) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
   showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to copy host pinned mem <--> dev mem",&copyhostpinnedtime);   
-#endif
-  showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Time to xchg rhs",&xchgrhstime);
+#endif 
   showtime(ahandle.get_comm_id(), comm, me, ahandle.get_nprocs_cube(), "Total time in solve",&totalsolvetime);
 #endif
 }

From 70e128535dd1c51e80017a3a0115aa6fc256afce Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Tue, 5 Jul 2022 22:28:43 -0700
Subject: [PATCH 027/130] Add switching point to switch between old and new
 backsolve

---
 packages/adelus/src/Adelus_solve.hpp | 24 +++++++++++++++++-------
 1 file changed, 17 insertions(+), 7 deletions(-)

diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index f6f8899d786b..cd15b652707f 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -84,11 +84,9 @@ void elimination_rhs(int N, ZView& ptr2, RHSView& ptr3, DView& ptr4, int act_col
 #endif
 }
 
-#if 0
-
 template<class HandleType, class ZViewType, class RHSViewType>
 inline
-void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
+void back_solve_rhs_pipelined_comm(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 {
   using value_type      = typename ZViewType::value_type;
 #ifdef PRINT_STATUS
@@ -390,11 +388,9 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 }
 
-#else//NEW_IMPL
-
 template<class HandleType, class ZViewType, class RHSViewType>
 inline
-void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
+void back_solve_currcol_bcast(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 {
   using value_type      = typename ZViewType::value_type;
 #ifdef PRINT_STATUS
@@ -604,7 +600,21 @@ void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
 #endif
 }
 
-#endif//NEW_IMPL
+template<class HandleType, class ZViewType, class RHSViewType>
+inline
+void back_solve6(HandleType& ahandle, ZViewType& Z, RHSViewType& RHS)
+{
+#if 0
+  back_solve_rhs_pipelined_comm(ahandle, Z, RHS);
+#else
+  if (ahandle.get_nrhs() <= ahandle.get_nprocs_row()) {
+    back_solve_rhs_pipelined_comm(ahandle, Z, RHS);
+  }
+  else {
+    back_solve_currcol_bcast(ahandle, Z, RHS);
+  }
+#endif
+}
 
 }//namespace Adelus
 

From bd1f6c54d8f1740234b463b72941edb510f2b653 Mon Sep 17 00:00:00 2001
From: "Timothy A. Smith" <tasmit@sandia.gov>
Date: Fri, 8 Jul 2022 10:23:25 -0600
Subject: [PATCH 028/130] Tpetra: code reduction in MultiVector async group
 transfer tests

---
 .../ImportExport2/AsyncTransfer_UnitTests.cpp | 196 +++++++-----------
 1 file changed, 72 insertions(+), 124 deletions(-)

diff --git a/packages/tpetra/core/test/ImportExport2/AsyncTransfer_UnitTests.cpp b/packages/tpetra/core/test/ImportExport2/AsyncTransfer_UnitTests.cpp
index 6780d2459ee1..1dfad1f7ecd4 100644
--- a/packages/tpetra/core/test/ImportExport2/AsyncTransfer_UnitTests.cpp
+++ b/packages/tpetra/core/test/ImportExport2/AsyncTransfer_UnitTests.cpp
@@ -289,99 +289,6 @@ namespace {
     std::vector<RCP<mv_type>> targetMVs;
   };
 
-  template <typename Scalar, typename LO, typename GO>
-  class MultiVectorCyclicGroupTransferFixture {
-  private:
-    using map_type = Map<LO, GO>;
-    using mv_type = MultiVector<Scalar, LO, GO>;
-
-  public:
-    MultiVectorCyclicGroupTransferFixture(FancyOStream& o, bool& s)
-      : out(o),
-        success(s),
-        comm(getDefaultComm()),
-        numProcs(comm->getSize()),
-        myRank(comm->getRank()),
-        numMVs(4)
-    { }
-
-    ~MultiVectorCyclicGroupTransferFixture() { }
-
-    void setup(int collectRank) {
-      setupMaps(collectRank);
-      setupMultiVectors();
-    }
-
-    template <typename TransferMethod>
-    void performTransfer(const TransferMethod& transfer) {
-      transfer(sourceMVs, targetMVs);
-      for (int i=0; i<numMVs; i++) {
-        TEST_EQUALITY(targetMVs[i]->importsAreAliased(), false);
-      }
-    }
-
-    template <typename ReferenceSolution>
-    void checkResults(const ReferenceSolution& referenceSolution) {
-      for (int i=0; i<numMVs; i++) {
-        RCP<const mv_type> referenceMV = referenceSolution.generateWithClassicalCodePath(sourceMVs[i], targetMap);
-        compareMultiVectors(targetMVs[i], referenceMV);
-      }
-    }
-
-  private:
-    void setupMaps(int collectRank) {
-      const GO indexBase = 0;
-      const global_size_t INVALID = OrdinalTraits<global_size_t>::invalid();
-
-      const size_t sourceNumLocalElements = 3;
-      const size_t totalElements = numProcs*sourceNumLocalElements;
-      const size_t targetNumLocalElements = (myRank == collectRank) ? totalElements : 0;
-
-      Teuchos::Array<GO> sourceEntries(sourceNumLocalElements);
-      for (size_t i=0; i<sourceNumLocalElements; i++) {
-        sourceEntries[i] = i*numProcs + myRank;
-      }
-
-      sourceMap = rcp(new map_type(INVALID, sourceEntries, indexBase, comm));
-      targetMap = rcp(new map_type(INVALID, targetNumLocalElements, indexBase, comm));
-    }
-
-    void setupMultiVectors() {
-      for (int i=0; i<numMVs; i++) {
-        sourceMVs.push_back(rcp(new mv_type(sourceMap, 1)));
-        sourceMVs[i]->randomize();
-
-        targetMVs.push_back(rcp(new mv_type(targetMap, 1)));
-        targetMVs[i]->putScalar(ScalarTraits<Scalar>::zero());
-      }
-    }
-
-    void compareMultiVectors(RCP<const mv_type> resultMV, RCP<const mv_type> referenceMV) {
-      auto data = resultMV->getLocalViewHost(Tpetra::Access::ReadOnly);
-      auto referenceData = referenceMV->getLocalViewHost(Tpetra::Access::ReadOnly);
-
-      TEST_EQUALITY(data.size(), referenceData.size());
-      for (LO localRow = 0; localRow < as<LO>(data.size()); localRow++) {
-        TEST_EQUALITY(data(localRow, 0), referenceData(localRow, 0));
-      }
-    }
-
-    FancyOStream& out;
-    bool& success;
-
-    RCP<const Comm<int>> comm;
-    const int numProcs;
-    const int myRank;
-
-    const int numMVs;
-
-    RCP<const map_type> sourceMap;
-    RCP<const map_type> targetMap;
-
-    std::vector<RCP<mv_type>> sourceMVs;
-    std::vector<RCP<mv_type>> targetMVs;
-  };
-
   template <typename Scalar, typename LO, typename GO>
   class DiagonalCrsMatrixTransferFixture {
   private:
@@ -1086,6 +993,34 @@ namespace {
   }
 
 
+  template <typename Packet, typename LO, typename GO>
+  class ForwardImportGroup {
+  private:
+    using DistObjectRCP = RCP<MultiVector<Packet, LO, GO>>;
+
+  public:
+    void operator()(std::vector<DistObjectRCP>& sources, std::vector<DistObjectRCP>& targets) const {
+      Import<LO, GO> importer(sources[0]->getMap(), targets[0]->getMap());
+
+      for (unsigned i=0; i<sources.size(); i++) {
+        targets[i]->beginImport(*sources[i], importer, INSERT);
+      }
+
+      unsigned completedImports = 0;
+      std::vector<bool> completedImport(sources.size(), false);
+      while (completedImports < completedImport.size()) {
+        for (unsigned i=0; i<sources.size(); i++) {
+          if (completedImport[i]) continue;
+          if (targets[i]->transferArrived()) {
+            targets[i]->endImport(*sources[i], importer, INSERT);
+            completedImport[i] = true;
+            completedImports++;
+          }
+        }
+      }
+    }
+  };
+
   template <typename LO, typename GO>
   class ContiguousMaps {
   private:
@@ -1122,48 +1057,61 @@ namespace {
     RCP<const map_type> targetMap;
   };
 
-  template <typename Packet, typename LO, typename GO>
-  class ForwardImportGroup {
+  TEUCHOS_UNIT_TEST_TEMPLATE_3_DECL( AsyncForwardImport, MultiVectorGroup_ContiguousMaps_rank0, Scalar, LO, GO )
+  {
+    MultiVectorGroupTransferFixture<Scalar, LO, GO> fixture(out, success);
+
+    fixture.template setup<ContiguousMaps<LO, GO>>(0);
+    fixture.performTransfer(ForwardImportGroup<Scalar, LO, GO>());
+    fixture.checkResults(ReferenceImportMultiVector<Scalar, LO, GO>());
+  }
+
+  template <typename LO, typename GO>
+  class CyclicMaps {
   private:
-    using DistObjectRCP = RCP<MultiVector<Packet, LO, GO>>;
+    using map_type = Map<LO, GO>;
 
   public:
-    void operator()(std::vector<DistObjectRCP>& sources, std::vector<DistObjectRCP>& targets) const {
-      Import<LO, GO> importer(sources[0]->getMap(), targets[0]->getMap());
+    CyclicMaps(RCP<const Comm<int>> c)
+      : comm(c),
+        numProcs(comm->getSize()),
+        myRank(comm->getRank())
+    { }
 
-      for (unsigned i=0; i<sources.size(); i++) {
-        targets[i]->beginImport(*sources[i], importer, INSERT);
-      }
+    void setup(int collectRank) {
+      const GO indexBase = 0;
+      const global_size_t INVALID = OrdinalTraits<global_size_t>::invalid();
 
-      unsigned completedImports = 0;
-      std::vector<bool> completedImport(sources.size(), false);
-      while (completedImports < completedImport.size()) {
-        for (unsigned i=0; i<sources.size(); i++) {
-          if (completedImport[i]) continue;
-          if (targets[i]->transferArrived()) {
-            targets[i]->endImport(*sources[i], importer, INSERT);
-            completedImport[i] = true;
-            completedImports++;
-          }
-        }
+      const size_t sourceNumLocalElements = 3;
+      const size_t totalElements = numProcs*sourceNumLocalElements;
+      const size_t targetNumLocalElements = (myRank == collectRank) ? totalElements : 0;
+
+      Teuchos::Array<GO> sourceEntries(sourceNumLocalElements);
+      for (size_t i=0; i<sourceNumLocalElements; i++) {
+        sourceEntries[i] = i*numProcs + myRank;
       }
+
+      sourceMap = rcp(new map_type(INVALID, sourceEntries, indexBase, comm));
+      targetMap = rcp(new map_type(INVALID, targetNumLocalElements, indexBase, comm));
     }
-  };
 
-  TEUCHOS_UNIT_TEST_TEMPLATE_3_DECL( AsyncForwardImport, MultiVectorGroup_ContiguousMaps_rank0, Scalar, LO, GO )
-  {
-    MultiVectorGroupTransferFixture<Scalar, LO, GO> fixture(out, success);
+    RCP<const map_type> getSourceMap() { return sourceMap; }
+    RCP<const map_type> getTargetMap() { return targetMap; }
 
-    fixture.template setup<ContiguousMaps<LO, GO>>(0);
-    fixture.performTransfer(ForwardImportGroup<Scalar, LO, GO>());
-    fixture.checkResults(ReferenceImportMultiVector<Scalar, LO, GO>());
-  }
+  private:
+    RCP<const Comm<int>> comm;
+    const int numProcs;
+    const int myRank;
 
-  TEUCHOS_UNIT_TEST_TEMPLATE_3_DECL( AsyncForwardImport, MultiVectorCyclicGroup_rank0, Scalar, LO, GO )
+    RCP<const map_type> sourceMap;
+    RCP<const map_type> targetMap;
+  };
+
+  TEUCHOS_UNIT_TEST_TEMPLATE_3_DECL( AsyncForwardImport, MultiVectorGroup_CyclicMaps_rank0, Scalar, LO, GO )
   {
-    MultiVectorCyclicGroupTransferFixture<Scalar, LO, GO> fixture(out, success);
+    MultiVectorGroupTransferFixture<Scalar, LO, GO> fixture(out, success);
 
-    fixture.setup(0);
+    fixture.template setup<CyclicMaps<LO, GO>>(0);
     fixture.performTransfer(ForwardImportGroup<Scalar, LO, GO>());
     fixture.checkResults(ReferenceImportMultiVector<Scalar, LO, GO>());
   }
@@ -1198,7 +1146,7 @@ namespace {
   TEUCHOS_UNIT_TEST_TEMPLATE_3_INSTANT( TransferArrived, MultiVector_forwardImportFalse, SC, LO, GO ) \
   TEUCHOS_UNIT_TEST_TEMPLATE_3_INSTANT( TransferArrived, MultiVector_forwardExportFalse, SC, LO, GO ) \
   TEUCHOS_UNIT_TEST_TEMPLATE_3_INSTANT( AsyncForwardImport, MultiVectorGroup_ContiguousMaps_rank0, SC, LO, GO ) \
-  TEUCHOS_UNIT_TEST_TEMPLATE_3_INSTANT( AsyncForwardImport, MultiVectorCyclicGroup_rank0, SC, LO, GO ) \
+  TEUCHOS_UNIT_TEST_TEMPLATE_3_INSTANT( AsyncForwardImport, MultiVectorGroup_CyclicMaps_rank0, SC, LO, GO ) \
 
   TPETRA_ETI_MANGLING_TYPEDEFS()
 

From 16be3043d1c9c2e29fb954b1044af4c25b420b9a Mon Sep 17 00:00:00 2001
From: tcclevenger <tccleve@sandia.gov>
Date: Wed, 6 Jul 2022 14:45:35 -0600
Subject: [PATCH 029/130] add BlockCrsMatrix::importAndFillComplete

---
 .../core/src/Tpetra_BlockCrsMatrix_decl.hpp   |  55 ++
 .../core/src/Tpetra_BlockCrsMatrix_def.hpp    |  54 ++
 .../tpetra/core/test/Block/BlockCrsMatrix.cpp | 501 ++++++++++++++++++
 3 files changed, 610 insertions(+)

diff --git a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_decl.hpp b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_decl.hpp
index 5217d8e6fb32..a6f6ea61c732 100644
--- a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_decl.hpp
+++ b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_decl.hpp
@@ -50,6 +50,20 @@
 
 namespace Tpetra {
 
+template<class BlockCrsMatrixType>
+Teuchos::RCP<BlockCrsMatrixType>
+importAndFillCompleteBlockCrsMatrix (const Teuchos::RCP<const BlockCrsMatrixType>& sourceMatrix,
+                                     const Import<typename BlockCrsMatrixType::local_ordinal_type,
+                                                  typename BlockCrsMatrixType::global_ordinal_type,
+                                                  typename BlockCrsMatrixType::node_type>& importer,
+                                     const Teuchos::RCP<const Map<typename BlockCrsMatrixType::local_ordinal_type,
+                                                                  typename BlockCrsMatrixType::global_ordinal_type,
+                                                                  typename BlockCrsMatrixType::node_type> >& domainMap = Teuchos::null,
+                                     const Teuchos::RCP<const Map<typename BlockCrsMatrixType::local_ordinal_type,
+                                                                  typename BlockCrsMatrixType::global_ordinal_type,
+                                                                  typename BlockCrsMatrixType::node_type> >& rangeMap = Teuchos::null,
+                                     const Teuchos::RCP<Teuchos::ParameterList>& params = Teuchos::null);
+
 /// \class BlockCrsMatrix
 /// \brief Sparse matrix whose entries are small dense square blocks,
 ///   all of the same dimensions.
@@ -378,6 +392,13 @@ class BlockCrsMatrix :
               const Scalar alpha = Teuchos::ScalarTraits<Scalar>::one (),
               const Scalar beta = Teuchos::ScalarTraits<Scalar>::zero ());
 
+  void
+  importAndFillComplete (Teuchos::RCP<BlockCrsMatrix<Scalar, LO, GO, Node> >& destMatrix,
+                         const Import<LO, GO, Node>& importer,
+                         const Teuchos::RCP<const map_type>& domainMap,
+                         const Teuchos::RCP<const map_type>& rangeMap,
+                         const Teuchos::RCP<Teuchos::ParameterList>& params = Teuchos::null) const;
+
   /// \brief Replace values at the given (mesh, i.e., block) column
   ///   indices, in the given (mesh, i.e., block) row.
   ///
@@ -1195,8 +1216,42 @@ class BlockCrsMatrix :
   virtual typename ::Tpetra::RowMatrix<Scalar, LO, GO, Node>::mag_type
   getFrobeniusNorm () const override;
   //@}
+
+  // Friend declaration for nonmember function.
+  template<class BlockCrsMatrixType>
+  friend Teuchos::RCP<BlockCrsMatrixType>
+  Tpetra::importAndFillCompleteBlockCrsMatrix (const Teuchos::RCP<const BlockCrsMatrixType>& sourceMatrix,
+                                               const Import<typename BlockCrsMatrixType::local_ordinal_type,
+                                                            typename BlockCrsMatrixType::global_ordinal_type,
+                                                            typename BlockCrsMatrixType::node_type>& importer,
+                                               const Teuchos::RCP<const Map<typename BlockCrsMatrixType::local_ordinal_type,
+                                                                            typename BlockCrsMatrixType::global_ordinal_type,
+                                                                            typename BlockCrsMatrixType::node_type> >& domainMap,
+                                               const Teuchos::RCP<const Map<typename BlockCrsMatrixType::local_ordinal_type,
+                                                                            typename BlockCrsMatrixType::global_ordinal_type,
+                                                                            typename BlockCrsMatrixType::node_type> >& rangeMap,
+                                               const Teuchos::RCP<Teuchos::ParameterList>& params);
 };
 
+template<class BlockCrsMatrixType>
+Teuchos::RCP<BlockCrsMatrixType>
+importAndFillCompleteBlockCrsMatrix (const Teuchos::RCP<const BlockCrsMatrixType>& sourceMatrix,
+                                     const Import<typename BlockCrsMatrixType::local_ordinal_type,
+                                                  typename BlockCrsMatrixType::global_ordinal_type,
+                                                  typename BlockCrsMatrixType::node_type>& importer,
+                                     const Teuchos::RCP<const Map<typename BlockCrsMatrixType::local_ordinal_type,
+                                                                  typename BlockCrsMatrixType::global_ordinal_type,
+                                                                  typename BlockCrsMatrixType::node_type> >& domainMap,
+                                     const Teuchos::RCP<const Map<typename BlockCrsMatrixType::local_ordinal_type,
+                                                                  typename BlockCrsMatrixType::global_ordinal_type,
+                                                                  typename BlockCrsMatrixType::node_type> >& rangeMap,
+                                     const Teuchos::RCP<Teuchos::ParameterList>& params)
+{
+  Teuchos::RCP<BlockCrsMatrixType> destMatrix;
+  sourceMatrix->importAndFillComplete (destMatrix, importer, domainMap, rangeMap, params);
+  return destMatrix;
+}
+
 } // namespace Tpetra
 
 #endif // TPETRA_BLOCKCRSMATRIX_DECL_HPP
diff --git a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
index 19ca96919c17..8f8cfa0863d8 100644
--- a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
+++ b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
@@ -943,6 +943,40 @@ class GetLocalDiagCopy {
     }
   }
 
+  template<class Scalar, class LO, class GO, class Node>
+  void
+  BlockCrsMatrix<Scalar, LO, GO, Node>::
+  importAndFillComplete (Teuchos::RCP<BlockCrsMatrix<Scalar, LO, GO, Node> >& destMatrix,
+                         const Import<LO, GO, Node>& importer,
+                         const Teuchos::RCP<const map_type>& domainMap,
+                         const Teuchos::RCP<const map_type>& rangeMap,
+                         const Teuchos::RCP<Teuchos::ParameterList>& params) const
+  {
+    using Teuchos::RCP;
+    using Teuchos::rcp;
+    using this_type = BlockCrsMatrix<Scalar, LO, GO, Node>;
+
+    // Right now, we make many assumptions...
+    TEUCHOS_TEST_FOR_EXCEPTION(!destMatrix.is_null(), std::invalid_argument,
+                               "Right now, assuming destMatrix is null.");
+    TEUCHOS_TEST_FOR_EXCEPTION(!domainMap.is_null(), std::invalid_argument,
+                               "Right now, assuming domainMap is null.");
+    TEUCHOS_TEST_FOR_EXCEPTION(!rangeMap.is_null(), std::invalid_argument,
+                               "Right now, assuming rangeMap is null.");
+    TEUCHOS_TEST_FOR_EXCEPTION(!params.is_null(), std::invalid_argument,
+                               "Right now, assuming params is null.");
+
+    // BlockCrsMatrix requires a complete graph at construction.
+    // So first step is to import and fill complete the destGraph.
+    RCP<crs_graph_type> destGraph = rcp (new crs_graph_type (importer.getTargetMap(), 0));
+    destGraph->doImport(this->getCrsGraph(), importer, Tpetra::INSERT);
+    destGraph->fillComplete();
+
+    // Final step, create and import the destMatrix.
+    destMatrix = rcp (new this_type (*destGraph, getBlockSize()));
+    destMatrix->doImport(*this, importer, Tpetra::INSERT);
+  }
+
   template<class Scalar, class LO, class GO, class Node>
   void
   BlockCrsMatrix<Scalar, LO, GO, Node>::
@@ -2478,6 +2512,15 @@ class GetLocalDiagCopy {
         const auto policy =
           policy_type(numExportLIDs, 1, 1)
           .set_scratch_size(0, Kokkos::PerTeam(sizeof(GO)*maxRowLength));
+
+        const int myRank = this->graph_.getRowMap ()->getComm ()->getRank ();
+        std::cout << std::endl << std::endl
+                  << "proc" << myRank
+                  << " packAndPrepare"
+                  << " - scratchsize " << sizeof(GO)*maxRowLength
+                  << std::endl << std::endl;
+
+
         Kokkos::parallel_for
           (policy,
            [=](const typename policy_type::member_type &member) {
@@ -2653,6 +2696,7 @@ class GetLocalDiagCopy {
         PackTraits<impl_scalar_type>::packValueCount
         (val_host.extent (0) ? val_host(0) : impl_scalar_type ());
     }
+
     const size_t maxRowNumEnt = graph_.getLocalMaxNumRowEntries ();
     const size_t maxRowNumScalarEnt = maxRowNumEnt * blockSize * blockSize;
 
@@ -2742,6 +2786,16 @@ class GetLocalDiagCopy {
         .set_scratch_size (0, Kokkos::PerTeam (sizeof (GO) * maxRowNumEnt +
                                                sizeof (LO) * maxRowNumEnt +
                                                numBytesPerValue * maxRowNumScalarEnt));
+
+       const int myRank = this->graph_.getRowMap ()->getComm ()->getRank ();
+       std::cout << std::endl << std::endl
+                 << "proc" << myRank
+                 << " unpackAndCombine"
+                 << " - scratchsize " << sizeof (GO) * maxRowNumEnt +
+                                         sizeof (LO) * maxRowNumEnt +
+                                         numBytesPerValue * maxRowNumScalarEnt
+                 << std::endl << std::endl;
+
       using host_scratch_space = typename host_exec::scratch_memory_space;
       using pair_type = Kokkos::pair<size_t, size_t>;
       Kokkos::parallel_for
diff --git a/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp b/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
index 42c99ff85ff4..b4a954d992cf 100644
--- a/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
+++ b/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
@@ -61,6 +61,7 @@ namespace {
   using Teuchos::reduceAll;
   using Teuchos::RCP;
   using Teuchos::rcp;
+  using Teuchos::ScalarTraits;
   using std::endl;
   typedef Tpetra::global_size_t GST;
 
@@ -1524,6 +1525,505 @@ namespace {
     TEST_EQUALITY_CONST( gblSuccess, 1 );
   }
 
+  // Test that two graphs are same.
+  template<class Graph>
+  bool graphs_are_same(const Graph& G1, const Graph& G2)
+  {
+    typedef typename Graph::local_ordinal_type LO;
+
+    int my_rank = G1.getRowMap()->getComm()->getRank();
+
+    // Make sure each graph is fill complete before checking other properties
+    if (! G1.isFillComplete()) {
+      if (my_rank == 0)
+        std::cerr << "Error: Graph 1 is not fill complete!" << std::endl;
+      return false;
+    }
+    if (! G2.isFillComplete()) {
+      if (my_rank == 0)
+        std::cerr << "Error: Graph 2 is not fill complete!" << std::endl;
+      return false;
+    }
+
+    int errors = 0;
+
+    if (! G1.getRowMap()->isSameAs(*G2.getRowMap())) {
+      if (my_rank == 0)
+        std::cerr << "Error: Graph 1's row map is different than Graph 2's" << std::endl;
+      errors++;
+    }
+    if (! G1.getDomainMap()->isSameAs(*G2.getDomainMap())) {
+      if (my_rank == 0)
+        std::cerr << "Error: Graph 1's domain map is different than Graph 2's" << std::endl;
+      errors++;
+    }
+    if (! G1.getRangeMap()->isSameAs(*G2.getRangeMap())) {
+      if (my_rank == 0)
+        std::cerr << "Error: Graph 1's range map is different than Graph 2's" << std::endl;
+      errors++;
+    }
+    if (G1.getLocalNumEntries() != G2.getLocalNumEntries()) {
+      std::cerr << "Error: Graph 1 does not have the same number of entries as Graph 2 on Process "
+           << my_rank << std::endl;
+      errors++;
+    }
+
+    if (errors != 0) return false;
+
+    for (LO i=0; i<static_cast<LO>(G1.getLocalNumRows()); i++) {
+      typename Graph::local_inds_host_view_type V1, V2;
+      G1.getLocalRowView(i, V1);
+      G2.getLocalRowView(i, V2);
+      if (V1.size() != V2.size()) {
+        std::cerr << "Error: Graph 1 and Graph 2 have different number of entries in local row "
+             << i << " on Process " << my_rank << std::endl;
+        errors++;
+        continue;
+      }
+      int jerr = 0;
+      for (LO j=0; j<static_cast<LO>(V1.size()); j++) {
+        if (V1[j] != V2[j])
+          jerr++;
+      }
+      if (jerr != 0) {
+        std::cerr << "Error: One or more entries in row " << i << " on Process " << my_rank
+             << " Graphs 1 and 2 are not the same" << std::endl;
+        errors++;
+        continue;
+      }
+    }
+
+    return (errors == 0);
+
+  }
+
+  // Test that two matrices' rows have the same entries.
+  template<class BlockCrsMatrixType>
+  bool matrices_are_same(const RCP<BlockCrsMatrixType>& A1,
+                         const RCP<BlockCrsMatrixType>& A2)
+  {
+    // Loop through A1 and make sure each row has the same
+    // entries as A2.  In the fully general case, the
+    // redistribution may have added together values, resulting in
+    // small rounding errors.  This is why we use an error tolerance
+    // (with a little bit of wiggle room).
+
+    int my_rank = A1->getRowMap()->getComm()->getRank();
+
+    using LO = typename BlockCrsMatrixType::local_ordinal_type;
+    using Scalar = typename BlockCrsMatrixType::scalar_type;
+    using lids_type = typename BlockCrsMatrixType::local_inds_host_view_type;
+    using vals_type = typename BlockCrsMatrixType::values_host_view_type;
+
+    using ST = ScalarTraits<Scalar>;
+    using magnitude_type = typename ST::magnitudeType;
+    const magnitude_type tol =
+       Teuchos::as<magnitude_type> (10) * ScalarTraits<magnitude_type>::eps ();
+
+    const LO blocksize = A1->getBlockSize();
+    // Verify the blocksizes are identical
+    if (blocksize != A2->getBlockSize()) {
+      if (my_rank==0) std::cerr << "Error: Blocksizes are not the same!" << std::endl;
+      return false;
+    }
+
+    // Verify the maps are identical
+    bool maps_same = A1->getRowMap()->isSameAs(*(A2->getRowMap()));
+    if (!maps_same) {
+      if (my_rank==0) std::cerr << "Error: RowMaps are not the same!" << std::endl;
+      return false;
+    }
+
+    // Verify the graphs are identical
+    bool graphs_same = graphs_are_same(A1->getCrsGraph(), A2->getCrsGraph());
+    if (!graphs_same) {
+      if (my_rank==0) std::cerr << "Error: Graphs are not the same!" << std::endl;
+      return false;
+    }
+
+    lids_type A1RowInds;
+    vals_type A1RowVals;
+    lids_type A2RowInds;
+    vals_type A2RowVals;
+    for (LO localrow = A1->getRowMap()->getMinLocalIndex();
+        localrow <= A1->getRowMap()->getMaxLocalIndex();
+        ++localrow)
+    {
+      size_t A1NumEntries = A1->getNumEntriesInLocalRow (localrow);
+      size_t A2NumEntries = A1->getNumEntriesInLocalRow (localrow);
+
+      // Verify the same number of entries in each row
+      if (A1NumEntries != A2NumEntries) {
+        if (my_rank==0) std::cerr << "Error: Matrices have different number of entries in at least one row!" << std::endl;
+        return false;
+      }
+
+      A1->getLocalRowView (localrow, A1RowInds, A1RowVals);
+      A2->getLocalRowView (localrow, A2RowInds, A2RowVals);
+
+      // Verify the same number of values in each row
+      if (A1RowVals.extent(0) != A2RowVals.extent(0)) {
+        if (my_rank==0) std::cerr << "Error: Matrices have different number of entries in at least one row!" << std::endl;
+        return false;
+      }
+
+      typedef typename Array<Scalar>::size_type size_type;
+      for (size_type k = 0; k < static_cast<size_type> (A1NumEntries); ++k) {
+        // Verify the same column indices
+        if(A1RowInds[k]!=A2RowInds[k]) {
+          if (my_rank==0) std::cerr << "Error: Matrices have different column indices!" << std::endl;
+          return false;
+        }
+      }
+
+      for (size_t val=0; val<A1RowVals.extent(0); ++val) {
+        // Verify the same matrix values
+        const magnitude_type rel_err = ST::magnitude(A1RowVals[val] - A2RowVals[val]);
+        if(rel_err > tol) {
+          if (my_rank==0) std::cerr << "Error: Matrices have different values!" << std::endl;
+          return false;
+        }
+      }
+    }
+
+    return true;
+  }
+
+  // Build lower diag matrix for test
+  template<class BlockCrsMatrixType>
+  void build_lower_diag_matrix (const RCP<BlockCrsMatrixType>& A) {
+
+    using LO = typename BlockCrsMatrixType::local_ordinal_type;
+    using GO = typename BlockCrsMatrixType::global_ordinal_type;
+    using Scalar = typename BlockCrsMatrixType::scalar_type;
+
+    const typename BlockCrsMatrixType::map_type row_map = *(A->getRowMap());
+    const typename BlockCrsMatrixType::map_type col_map = *(A->getColMap());
+
+    int my_rank = row_map.getComm()->getRank();
+
+    if(A->getBlockSize() != 3) {
+      if (my_rank==0) std::cerr << "Error: A->getBlockSize != 3!" << std::endl;
+      return;
+    }
+    const int blocksize = 3;
+
+    for (LO localrow = row_map.getMinLocalIndex();
+         localrow <= row_map.getMaxLocalIndex();
+         ++localrow) {
+
+      const GO globalrow = row_map.getGlobalElement(localrow);
+
+      if (globalrow == 0) {
+
+        LO local_col_indices[1];
+        local_col_indices[0] = col_map.getLocalElement(0);
+
+        Scalar values[blocksize*blocksize];
+        for (size_t b=0; b<blocksize*blocksize; ++b) {
+          values[b] = 10*(globalrow+1);
+        }
+        A->replaceLocalValues(localrow,
+                              local_col_indices,
+                              values,
+                              1);
+      }
+      else if (globalrow == 1) {
+
+        LO local_col_indices[2];
+        local_col_indices[0] = col_map.getLocalElement(0);
+        local_col_indices[1] = col_map.getLocalElement(1);
+
+        Scalar values[2*blocksize*blocksize];
+        for (GO globalcol=0; globalcol<2; ++globalcol) {
+          int start = globalcol*blocksize*blocksize;
+          for (size_t b=0; b<blocksize*blocksize; ++b) {
+            values[start+b] = 10*(globalrow+1)+globalcol;
+          }
+        }
+        A->replaceLocalValues(localrow,
+                              local_col_indices,
+                              values,
+                              2);
+      } else {
+
+        LO local_col_indices[3];
+        local_col_indices[0] = col_map.getLocalElement(globalrow-2);
+        local_col_indices[1] = col_map.getLocalElement(globalrow-1);
+        local_col_indices[2] = col_map.getLocalElement(globalrow);
+
+        Scalar values[3*blocksize*blocksize];
+        int local_indx = 0;
+        for (GO globalcol=globalrow-2; globalcol<=globalrow; ++globalcol) {
+          int start = local_indx*blocksize*blocksize;
+          for (size_t b=0; b<blocksize*blocksize; ++b) {
+            values[start+b] = 10*(globalrow+1)+globalcol;
+          }
+          ++local_indx;
+        }
+        A->replaceLocalValues(localrow,
+                              local_col_indices,
+                              values,
+                              3);
+      }
+    }
+
+    return;
+  }
+
+  // Test BlockCrsMatrix importAndFillComplete
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL( BlockCrsMatrix, importAndFillComplete, Scalar, LO, GO, Node )
+  {
+    using Tpetra::Details::gathervPrint;
+    typedef Tpetra::BlockCrsMatrix<Scalar, LO, GO, Node> block_crs_type;
+    typedef Tpetra::CrsGraph<LO, GO, Node> crs_graph_type;
+    typedef Tpetra::Map<LO, GO, Node> map_type;
+    typedef Tpetra::Import<LO, GO, Node> import_type;
+    using Teuchos::REDUCE_MAX;
+
+    std::ostringstream err;
+    int lclErr = 0;
+    int gblErr = 0;
+
+    out << "Testing Tpetra::BlockCrsMatrix importAndFillComplete" << endl;
+    Teuchos::OSTab tab0 (out);
+
+    RCP<const Comm<int> > comm = getDefaultComm ();
+    const int myRank = comm->getRank ();
+    const int numRanks = comm->getSize();
+    const GST INVALID = Teuchos::OrdinalTraits<GST>::invalid ();
+
+    out << "1st test: Import a diagonal BlockCrsMatrix from a source row Map "
+           "that has all indices on Process 0, to a target row Map that is "
+           "uniformly distributed over processes. Blocksize=3." << endl;
+    try {
+      Teuchos::OSTab tab1 (out);
+
+      const GO indexBase = 0;
+      const LO tgt_num_local_elements = 2;
+      const LO src_num_local_elements = (myRank == 0) ?
+        static_cast<LO> (numRanks*tgt_num_local_elements) :
+        static_cast<LO> (0);
+
+      const int blocksize = 3;
+
+      // Create row Maps for the source and target
+      RCP<const map_type> src_map =
+        rcp (new map_type (INVALID,
+                           src_num_local_elements,
+                           indexBase, comm));
+      RCP<const map_type> tgt_map =
+        rcp (new map_type (INVALID,
+                           tgt_num_local_elements,
+                           indexBase, comm));
+
+      // Build src graph.
+      Teuchos::RCP<crs_graph_type> src_graph =
+        Teuchos::rcp (new crs_graph_type (src_map, 1));
+      for (LO localrow = src_map->getMinLocalIndex();
+           localrow<=src_map->getMaxLocalIndex(); 
+           ++localrow) {
+
+        const GO globalrow = src_map->getGlobalElement(localrow);
+        GO globalcol[1];
+        globalcol[0] = globalrow;
+        
+        src_graph->insertGlobalIndices(globalrow, 1, globalcol);
+      }
+      src_graph->fillComplete();
+
+      // Build src matrix. Simple block diagonal matrix with A(b,b) = [b*b*row,...,+b*b].
+      RCP<block_crs_type> src_mat =
+        rcp (new block_crs_type (*src_graph, blocksize)); 
+      if (src_num_local_elements != 0) {
+        for (LO localrow = src_map->getMinLocalIndex();
+             localrow <= src_map->getMaxLocalIndex();
+             ++localrow) {
+          const GO globalrow = src_map->getGlobalElement(localrow);
+          LO col_indices[1];  Scalar values[blocksize*blocksize];
+          col_indices[0] = localrow; 
+          for (size_t b=0; b<blocksize*blocksize; ++b) {
+            values[b] = blocksize*blocksize*globalrow + b;
+          }
+          const LO actual_num_replaces = src_mat->replaceLocalValues(localrow,
+                                                                     col_indices,
+                                                                     values,
+                                                                     1);
+          TEST_EQUALITY_CONST(actual_num_replaces, 1);
+        }
+      }
+
+      // Create the importer
+      import_type importer (src_map, tgt_map);
+
+      // Call importAndFillComplete to get the tgt matrix
+      RCP<block_crs_type> tgt_mat =
+        Tpetra::importAndFillCompleteBlockCrsMatrix<block_crs_type> (src_mat, importer);
+     
+      // Manually build the tgt matrix and test that it matches the returned matrix
+
+      // Build tgt graph.
+      Teuchos::RCP<crs_graph_type> tgt_graph_for_testing =
+        Teuchos::rcp (new crs_graph_type (tgt_map, 1));
+      for (LO localrow = tgt_map->getMinLocalIndex();
+           localrow<=tgt_map->getMaxLocalIndex();
+           ++localrow) {
+
+        const GO globalrow = tgt_map->getGlobalElement(localrow);
+        GO globalcol[1];
+        globalcol[0] = globalrow;
+
+        tgt_graph_for_testing->insertGlobalIndices(globalrow, 1, globalcol);
+      }
+      tgt_graph_for_testing->fillComplete();
+
+      // Build tgt matrix
+      RCP<block_crs_type> tgt_mat_for_testing =
+        rcp (new block_crs_type (*tgt_graph_for_testing, blocksize));
+      for (LO localrow = tgt_map->getMinLocalIndex();
+           localrow <= tgt_map->getMaxLocalIndex();
+           ++localrow) {
+        const GO globalrow = tgt_map->getGlobalElement(localrow);
+        LO col_indices[1];  Scalar values[blocksize*blocksize];
+        col_indices[0] = localrow;
+        for (size_t b=0; b<blocksize*blocksize; ++b) {
+          values[b] = blocksize*blocksize*globalrow + b;
+        }
+        const LO actual_num_replaces = tgt_mat_for_testing->replaceLocalValues(localrow,
+                                                                               col_indices,
+                                                                               values,
+                                                                               1);
+        TEST_EQUALITY_CONST(actual_num_replaces, 1);
+      }
+
+      // Test that matrices are identical
+      bool matrices_match = matrices_are_same<block_crs_type>(tgt_mat, tgt_mat_for_testing);
+      TEST_ASSERT(matrices_match);
+     }
+     catch (std::exception& e) { // end of the first test
+       err << "Proc " << myRank << ": " << e.what () << endl;
+       lclErr = 1;
+     }
+
+     reduceAll<int, int> (*comm, REDUCE_MAX, lclErr, outArg (gblErr));
+     TEST_EQUALITY_CONST( gblErr, 0 );
+     if (gblErr != 0) {
+       Tpetra::Details::gathervPrint (out, err.str (), *comm);
+       out << "Above test failed; aborting further tests" << endl;
+       return;
+     }
+
+     //auto out_to_screen = Teuchos::getFancyOStream (Teuchos::rcpFromRef (std::cout));
+
+     out << "2nd test: Import a lower triangular BlockCrsMatrix from a source row Map "
+            "where even processors have 1 element and odd processors have 3 elements, "
+            "to a target row Map where each processor have 2 elements. Blocksize=3." << endl;
+     try {
+       Teuchos::OSTab tab1 (out);
+
+       // This test only makes sense for even number of ranks
+       if (numRanks % 2 != 0) {
+         return;
+       }
+
+       const GO indexBase = 0;
+       LO src_num_local_elements;
+       if (myRank % 2 == 0) src_num_local_elements = 1;
+       else                 src_num_local_elements = 3;
+       LO tgt_num_local_elements = 2;
+       const int blocksize = 3;
+
+       // Create row Maps for the source and target
+       RCP<const map_type> src_map =
+         rcp (new map_type (INVALID,
+                            src_num_local_elements,
+                            indexBase, comm));
+       RCP<const map_type> tgt_map =
+         rcp (new map_type (INVALID,
+                            tgt_num_local_elements,
+                            indexBase, comm));
+       //src_map->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+       //tgt_map->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+
+       // Build src graph. Allow for up to 2 off-diagonal entries.
+       Teuchos::RCP<crs_graph_type> src_graph =
+         Teuchos::rcp (new crs_graph_type (src_map, 3));
+       {
+         Array<GO> cols(3);
+         for (GO globalrow = src_map->getMinGlobalIndex ();
+              globalrow <= src_map->getMaxGlobalIndex (); ++globalrow) {
+           if      (globalrow==0) cols.resize(1);
+           else if (globalrow==1) cols.resize(2);
+           else                   cols.resize(3);
+           for (GO col = 0; col < cols.size(); ++col) {
+             cols[col] = globalrow - col;
+           }
+           src_graph->insertGlobalIndices (globalrow, cols());
+         }
+         src_graph->fillComplete();
+         //src_graph->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+       }
+
+       // Build src matrix. Simple block lower-diagonal matrix with
+       // A(b1,b2) = [(b1)+10*(b2+1)].
+       RCP<block_crs_type> src_mat =
+         rcp (new block_crs_type (*src_graph, blocksize));
+       build_lower_diag_matrix<block_crs_type>(src_mat);
+       //src_mat->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+
+       // Create the importer
+       import_type importer (src_map, tgt_map);
+
+       // Call importAndFillComplete to get the tgt matrix
+       RCP<block_crs_type> tgt_mat =
+         Tpetra::importAndFillCompleteBlockCrsMatrix<block_crs_type> (src_mat, importer);
+       //tgt_mat->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+
+       // Manually build the tgt matrix and test that it matches the returned matrix
+
+       // Build tgt graph.
+       Teuchos::RCP<crs_graph_type> tgt_graph_for_testing =
+         Teuchos::rcp (new crs_graph_type (tgt_map, 3));
+       {
+         Array<GO> cols(3);
+         for (GO globalrow = tgt_map->getMinGlobalIndex ();
+              globalrow <= tgt_map->getMaxGlobalIndex (); ++globalrow) {
+           if      (globalrow==0) cols.resize(1);
+           else if (globalrow==1) cols.resize(2);
+           else                   cols.resize(3);
+           for (GO col = 0; col < cols.size(); ++col) {
+             cols[col] = globalrow - col;
+           }
+           tgt_graph_for_testing->insertGlobalIndices (globalrow, cols());
+         }
+         tgt_graph_for_testing->fillComplete();
+         //tgt_graph_for_testing->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+       }
+
+       // Build tgt matrix
+       RCP<block_crs_type> tgt_mat_for_testing =
+         rcp (new block_crs_type (*tgt_graph_for_testing, blocksize));
+       build_lower_diag_matrix<block_crs_type>(tgt_mat_for_testing);
+       //tgt_mat_for_testing->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+
+       // Test that matrices are identical
+       bool matrices_match = matrices_are_same<block_crs_type>(tgt_mat, tgt_mat_for_testing);
+       TEST_ASSERT(matrices_match);
+      }
+      catch (std::exception& e) { // end of the first test
+        err << "Proc " << myRank << ": " << e.what () << endl;
+        lclErr = 1;
+      }
+
+      reduceAll<int, int> (*comm, REDUCE_MAX, lclErr, outArg (gblErr));
+      TEST_EQUALITY_CONST( gblErr, 0 );
+      if (gblErr != 0) {
+        Tpetra::Details::gathervPrint (out, err.str (), *comm);
+        out << "Above test failed; aborting further tests" << endl;
+        return;
+      }
+   }
+
   // Test BlockCrsMatrix Export for different graphs with different
   // row Maps.  This tests packAndPrepare and unpackAndCombine.
   TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL( BlockCrsMatrix, ExportDiffRowMaps, Scalar, LO, GO, Node )
@@ -2307,6 +2807,7 @@ namespace {
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT( BlockCrsMatrix, getLocalDiagCopy, SCALAR, LO, GO, NODE ) \
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT( BlockCrsMatrix, SetAllToScalar, SCALAR, LO, GO, NODE ) \
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT( BlockCrsMatrix, ImportCopy, SCALAR, LO, GO, NODE ) \
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT( BlockCrsMatrix, importAndFillComplete, SCALAR, LO, GO, NODE ) \
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT( BlockCrsMatrix, ExportDiffRowMaps, SCALAR, LO, GO, NODE ) \
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT( BlockCrsMatrix, point2block, SCALAR, LO, GO, NODE ) \
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT( BlockCrsMatrix, block2point, SCALAR, LO, GO, NODE )

From db269a0a21769c5f62a9dacbbf935bdb6aef74d3 Mon Sep 17 00:00:00 2001
From: tcclevenger <tccleve@sandia.gov>
Date: Mon, 18 Jul 2022 17:23:38 -0600
Subject: [PATCH 030/130] flip tests

---
 .../core/src/Tpetra_BlockCrsMatrix_def.hpp    |  18 --
 .../tpetra/core/test/Block/BlockCrsMatrix.cpp | 222 +++++++++---------
 2 files changed, 112 insertions(+), 128 deletions(-)

diff --git a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
index 8f8cfa0863d8..3fc50431bd4d 100644
--- a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
+++ b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
@@ -2512,15 +2512,6 @@ class GetLocalDiagCopy {
         const auto policy =
           policy_type(numExportLIDs, 1, 1)
           .set_scratch_size(0, Kokkos::PerTeam(sizeof(GO)*maxRowLength));
-
-        const int myRank = this->graph_.getRowMap ()->getComm ()->getRank ();
-        std::cout << std::endl << std::endl
-                  << "proc" << myRank
-                  << " packAndPrepare"
-                  << " - scratchsize " << sizeof(GO)*maxRowLength
-                  << std::endl << std::endl;
-
-
         Kokkos::parallel_for
           (policy,
            [=](const typename policy_type::member_type &member) {
@@ -2696,7 +2687,6 @@ class GetLocalDiagCopy {
         PackTraits<impl_scalar_type>::packValueCount
         (val_host.extent (0) ? val_host(0) : impl_scalar_type ());
     }
-
     const size_t maxRowNumEnt = graph_.getLocalMaxNumRowEntries ();
     const size_t maxRowNumScalarEnt = maxRowNumEnt * blockSize * blockSize;
 
@@ -2787,14 +2777,6 @@ class GetLocalDiagCopy {
                                                sizeof (LO) * maxRowNumEnt +
                                                numBytesPerValue * maxRowNumScalarEnt));
 
-       const int myRank = this->graph_.getRowMap ()->getComm ()->getRank ();
-       std::cout << std::endl << std::endl
-                 << "proc" << myRank
-                 << " unpackAndCombine"
-                 << " - scratchsize " << sizeof (GO) * maxRowNumEnt +
-                                         sizeof (LO) * maxRowNumEnt +
-                                         numBytesPerValue * maxRowNumScalarEnt
-                 << std::endl << std::endl;
 
       using host_scratch_space = typename host_exec::scratch_memory_space;
       using pair_type = Kokkos::pair<size_t, size_t>;
diff --git a/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp b/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
index b4a954d992cf..255ce884d03a 100644
--- a/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
+++ b/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
@@ -1793,6 +1793,118 @@ namespace {
     const int numRanks = comm->getSize();
     const GST INVALID = Teuchos::OrdinalTraits<GST>::invalid ();
 
+    //auto out_to_screen = Teuchos::getFancyOStream (Teuchos::rcpFromRef (std::cout));
+
+    if (myRank==0) std::cout << "TEST LOWER DIAG" << std::endl;
+    out << "2nd test: Import a lower triangular BlockCrsMatrix from a source row Map "
+           "where even processors have 1 element and odd processors have 3 elements, "
+           "to a target row Map where each processor have 2 elements. Blocksize=3." << endl;
+    try {
+      Teuchos::OSTab tab1 (out);
+
+      // This test only makes sense for even number of ranks
+      if (numRanks % 2 != 0) {
+        return;
+      }
+
+      const GO indexBase = 0;
+      LO src_num_local_elements;
+      if (myRank % 2 == 0) src_num_local_elements = 1;
+      else                 src_num_local_elements = 3;
+      LO tgt_num_local_elements = 2;
+      const int blocksize = 3;
+
+      // Create row Maps for the source and target
+      RCP<const map_type> src_map =
+        rcp (new map_type (INVALID,
+                           src_num_local_elements,
+                           indexBase, comm));
+      RCP<const map_type> tgt_map =
+        rcp (new map_type (INVALID,
+                           tgt_num_local_elements,
+                           indexBase, comm));
+      //src_map->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+      //tgt_map->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+
+      // Build src graph. Allow for up to 2 off-diagonal entries.
+      Teuchos::RCP<crs_graph_type> src_graph =
+        Teuchos::rcp (new crs_graph_type (src_map, 3));
+      {
+        Array<GO> cols(3);
+        for (GO globalrow = src_map->getMinGlobalIndex ();
+             globalrow <= src_map->getMaxGlobalIndex (); ++globalrow) {
+          if      (globalrow==0) cols.resize(1);
+          else if (globalrow==1) cols.resize(2);
+          else                   cols.resize(3);
+          for (GO col = 0; col < cols.size(); ++col) {
+            cols[col] = globalrow - col;
+          }
+          src_graph->insertGlobalIndices (globalrow, cols());
+        }
+        src_graph->fillComplete();
+        //src_graph->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+      }
+
+      // Build src matrix. Simple block lower-diagonal matrix with
+      // A(b1,b2) = [(b1)+10*(b2+1)].
+      RCP<block_crs_type> src_mat =
+        rcp (new block_crs_type (*src_graph, blocksize));
+      build_lower_diag_matrix<block_crs_type>(src_mat);
+      //src_mat->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+
+      // Create the importer
+      import_type importer (src_map, tgt_map);
+
+      // Call importAndFillComplete to get the tgt matrix
+      RCP<block_crs_type> tgt_mat =
+        Tpetra::importAndFillCompleteBlockCrsMatrix<block_crs_type> (src_mat, importer);
+      //tgt_mat->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+
+      // Manually build the tgt matrix and test that it matches the returned matrix
+
+      // Build tgt graph.
+      Teuchos::RCP<crs_graph_type> tgt_graph_for_testing =
+        Teuchos::rcp (new crs_graph_type (tgt_map, 3));
+      {
+        Array<GO> cols(3);
+        for (GO globalrow = tgt_map->getMinGlobalIndex ();
+             globalrow <= tgt_map->getMaxGlobalIndex (); ++globalrow) {
+          if      (globalrow==0) cols.resize(1);
+          else if (globalrow==1) cols.resize(2);
+          else                   cols.resize(3);
+          for (GO col = 0; col < cols.size(); ++col) {
+            cols[col] = globalrow - col;
+          }
+          tgt_graph_for_testing->insertGlobalIndices (globalrow, cols());
+        }
+        tgt_graph_for_testing->fillComplete();
+        //tgt_graph_for_testing->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+      }
+
+      // Build tgt matrix
+      RCP<block_crs_type> tgt_mat_for_testing =
+        rcp (new block_crs_type (*tgt_graph_for_testing, blocksize));
+      build_lower_diag_matrix<block_crs_type>(tgt_mat_for_testing);
+      //tgt_mat_for_testing->describe(*out_to_screen, Teuchos::VERB_EXTREME);
+
+      // Test that matrices are identical
+      bool matrices_match = matrices_are_same<block_crs_type>(tgt_mat, tgt_mat_for_testing);
+      TEST_ASSERT(matrices_match);
+     }
+     catch (std::exception& e) { // end of the first test
+       err << "Proc " << myRank << ": " << e.what () << endl;
+       lclErr = 1;
+     }
+
+     reduceAll<int, int> (*comm, REDUCE_MAX, lclErr, outArg (gblErr));
+     TEST_EQUALITY_CONST( gblErr, 0 );
+     if (gblErr != 0) {
+       Tpetra::Details::gathervPrint (out, err.str (), *comm);
+       out << "Above test failed; aborting further tests" << endl;
+       return;
+     }
+
+    if (myRank==0) std::cout << "TEST DIAG" << std::endl;
     out << "1st test: Import a diagonal BlockCrsMatrix from a source row Map "
            "that has all indices on Process 0, to a target row Map that is "
            "uniformly distributed over processes. Blocksize=3." << endl;
@@ -1912,116 +2024,6 @@ namespace {
        out << "Above test failed; aborting further tests" << endl;
        return;
      }
-
-     //auto out_to_screen = Teuchos::getFancyOStream (Teuchos::rcpFromRef (std::cout));
-
-     out << "2nd test: Import a lower triangular BlockCrsMatrix from a source row Map "
-            "where even processors have 1 element and odd processors have 3 elements, "
-            "to a target row Map where each processor have 2 elements. Blocksize=3." << endl;
-     try {
-       Teuchos::OSTab tab1 (out);
-
-       // This test only makes sense for even number of ranks
-       if (numRanks % 2 != 0) {
-         return;
-       }
-
-       const GO indexBase = 0;
-       LO src_num_local_elements;
-       if (myRank % 2 == 0) src_num_local_elements = 1;
-       else                 src_num_local_elements = 3;
-       LO tgt_num_local_elements = 2;
-       const int blocksize = 3;
-
-       // Create row Maps for the source and target
-       RCP<const map_type> src_map =
-         rcp (new map_type (INVALID,
-                            src_num_local_elements,
-                            indexBase, comm));
-       RCP<const map_type> tgt_map =
-         rcp (new map_type (INVALID,
-                            tgt_num_local_elements,
-                            indexBase, comm));
-       //src_map->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-       //tgt_map->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-
-       // Build src graph. Allow for up to 2 off-diagonal entries.
-       Teuchos::RCP<crs_graph_type> src_graph =
-         Teuchos::rcp (new crs_graph_type (src_map, 3));
-       {
-         Array<GO> cols(3);
-         for (GO globalrow = src_map->getMinGlobalIndex ();
-              globalrow <= src_map->getMaxGlobalIndex (); ++globalrow) {
-           if      (globalrow==0) cols.resize(1);
-           else if (globalrow==1) cols.resize(2);
-           else                   cols.resize(3);
-           for (GO col = 0; col < cols.size(); ++col) {
-             cols[col] = globalrow - col;
-           }
-           src_graph->insertGlobalIndices (globalrow, cols());
-         }
-         src_graph->fillComplete();
-         //src_graph->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-       }
-
-       // Build src matrix. Simple block lower-diagonal matrix with
-       // A(b1,b2) = [(b1)+10*(b2+1)].
-       RCP<block_crs_type> src_mat =
-         rcp (new block_crs_type (*src_graph, blocksize));
-       build_lower_diag_matrix<block_crs_type>(src_mat);
-       //src_mat->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-
-       // Create the importer
-       import_type importer (src_map, tgt_map);
-
-       // Call importAndFillComplete to get the tgt matrix
-       RCP<block_crs_type> tgt_mat =
-         Tpetra::importAndFillCompleteBlockCrsMatrix<block_crs_type> (src_mat, importer);
-       //tgt_mat->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-
-       // Manually build the tgt matrix and test that it matches the returned matrix
-
-       // Build tgt graph.
-       Teuchos::RCP<crs_graph_type> tgt_graph_for_testing =
-         Teuchos::rcp (new crs_graph_type (tgt_map, 3));
-       {
-         Array<GO> cols(3);
-         for (GO globalrow = tgt_map->getMinGlobalIndex ();
-              globalrow <= tgt_map->getMaxGlobalIndex (); ++globalrow) {
-           if      (globalrow==0) cols.resize(1);
-           else if (globalrow==1) cols.resize(2);
-           else                   cols.resize(3);
-           for (GO col = 0; col < cols.size(); ++col) {
-             cols[col] = globalrow - col;
-           }
-           tgt_graph_for_testing->insertGlobalIndices (globalrow, cols());
-         }
-         tgt_graph_for_testing->fillComplete();
-         //tgt_graph_for_testing->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-       }
-
-       // Build tgt matrix
-       RCP<block_crs_type> tgt_mat_for_testing =
-         rcp (new block_crs_type (*tgt_graph_for_testing, blocksize));
-       build_lower_diag_matrix<block_crs_type>(tgt_mat_for_testing);
-       //tgt_mat_for_testing->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-
-       // Test that matrices are identical
-       bool matrices_match = matrices_are_same<block_crs_type>(tgt_mat, tgt_mat_for_testing);
-       TEST_ASSERT(matrices_match);
-      }
-      catch (std::exception& e) { // end of the first test
-        err << "Proc " << myRank << ": " << e.what () << endl;
-        lclErr = 1;
-      }
-
-      reduceAll<int, int> (*comm, REDUCE_MAX, lclErr, outArg (gblErr));
-      TEST_EQUALITY_CONST( gblErr, 0 );
-      if (gblErr != 0) {
-        Tpetra::Details::gathervPrint (out, err.str (), *comm);
-        out << "Above test failed; aborting further tests" << endl;
-        return;
-      }
    }
 
   // Test BlockCrsMatrix Export for different graphs with different

From b9602113f0376ea0d1962f09e0dc961224c15fc9 Mon Sep 17 00:00:00 2001
From: tcclevenger <tccleve@sandia.gov>
Date: Tue, 19 Jul 2022 15:39:57 -0600
Subject: [PATCH 031/130] remove scratch space

---
 .../core/src/Tpetra_BlockCrsMatrix_def.hpp    | 20 +++++++------------
 1 file changed, 7 insertions(+), 13 deletions(-)

diff --git a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
index 3fc50431bd4d..8c43bdf6f878 100644
--- a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
+++ b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
@@ -2772,25 +2772,19 @@ class GetLocalDiagCopy {
     errorDuringUnpack () = 0;
     {
       using policy_type = Kokkos::TeamPolicy<host_exec>;
-      const auto policy = policy_type (numImportLIDs, 1, 1)
-        .set_scratch_size (0, Kokkos::PerTeam (sizeof (GO) * maxRowNumEnt +
-                                               sizeof (LO) * maxRowNumEnt +
-                                               numBytesPerValue * maxRowNumScalarEnt));
-
-
-      using host_scratch_space = typename host_exec::scratch_memory_space;
+      const auto policy = policy_type (numImportLIDs, 1, 1);
       using pair_type = Kokkos::pair<size_t, size_t>;
       Kokkos::parallel_for
         ("Tpetra::BlockCrsMatrix::unpackAndCombine: unpack", policy,
          [=] (const typename policy_type::member_type& member) {
           const size_t i = member.league_rank();
 
-          Kokkos::View<GO*, host_scratch_space> gblColInds
-            (member.team_scratch (0), maxRowNumEnt);
-          Kokkos::View<LO*, host_scratch_space> lclColInds
-            (member.team_scratch (0), maxRowNumEnt);
-          Kokkos::View<impl_scalar_type*, host_scratch_space> vals
-            (member.team_scratch (0), maxRowNumScalarEnt);
+          Kokkos::View<GO*, host_exec> gblColInds
+            ("", maxRowNumEnt);
+          Kokkos::View<LO*, host_exec> lclColInds
+            ("", maxRowNumEnt);
+          Kokkos::View<impl_scalar_type*, host_exec> vals
+            ("", maxRowNumScalarEnt);
 
           const size_t offval = offset(i);
           const LO lclRow = importLIDsHost(i);

From 73f514ea8194af71e926e67f40254aaa28d1eacf Mon Sep 17 00:00:00 2001
From: tcclevenger <tccleve@sandia.gov>
Date: Tue, 19 Jul 2022 15:44:43 -0600
Subject: [PATCH 032/130] flip tests back

---
 .../tpetra/core/test/Block/BlockCrsMatrix.cpp | 220 +++++++++---------
 1 file changed, 108 insertions(+), 112 deletions(-)

diff --git a/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp b/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
index 255ce884d03a..1b92db5a415f 100644
--- a/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
+++ b/packages/tpetra/core/test/Block/BlockCrsMatrix.cpp
@@ -1793,118 +1793,6 @@ namespace {
     const int numRanks = comm->getSize();
     const GST INVALID = Teuchos::OrdinalTraits<GST>::invalid ();
 
-    //auto out_to_screen = Teuchos::getFancyOStream (Teuchos::rcpFromRef (std::cout));
-
-    if (myRank==0) std::cout << "TEST LOWER DIAG" << std::endl;
-    out << "2nd test: Import a lower triangular BlockCrsMatrix from a source row Map "
-           "where even processors have 1 element and odd processors have 3 elements, "
-           "to a target row Map where each processor have 2 elements. Blocksize=3." << endl;
-    try {
-      Teuchos::OSTab tab1 (out);
-
-      // This test only makes sense for even number of ranks
-      if (numRanks % 2 != 0) {
-        return;
-      }
-
-      const GO indexBase = 0;
-      LO src_num_local_elements;
-      if (myRank % 2 == 0) src_num_local_elements = 1;
-      else                 src_num_local_elements = 3;
-      LO tgt_num_local_elements = 2;
-      const int blocksize = 3;
-
-      // Create row Maps for the source and target
-      RCP<const map_type> src_map =
-        rcp (new map_type (INVALID,
-                           src_num_local_elements,
-                           indexBase, comm));
-      RCP<const map_type> tgt_map =
-        rcp (new map_type (INVALID,
-                           tgt_num_local_elements,
-                           indexBase, comm));
-      //src_map->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-      //tgt_map->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-
-      // Build src graph. Allow for up to 2 off-diagonal entries.
-      Teuchos::RCP<crs_graph_type> src_graph =
-        Teuchos::rcp (new crs_graph_type (src_map, 3));
-      {
-        Array<GO> cols(3);
-        for (GO globalrow = src_map->getMinGlobalIndex ();
-             globalrow <= src_map->getMaxGlobalIndex (); ++globalrow) {
-          if      (globalrow==0) cols.resize(1);
-          else if (globalrow==1) cols.resize(2);
-          else                   cols.resize(3);
-          for (GO col = 0; col < cols.size(); ++col) {
-            cols[col] = globalrow - col;
-          }
-          src_graph->insertGlobalIndices (globalrow, cols());
-        }
-        src_graph->fillComplete();
-        //src_graph->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-      }
-
-      // Build src matrix. Simple block lower-diagonal matrix with
-      // A(b1,b2) = [(b1)+10*(b2+1)].
-      RCP<block_crs_type> src_mat =
-        rcp (new block_crs_type (*src_graph, blocksize));
-      build_lower_diag_matrix<block_crs_type>(src_mat);
-      //src_mat->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-
-      // Create the importer
-      import_type importer (src_map, tgt_map);
-
-      // Call importAndFillComplete to get the tgt matrix
-      RCP<block_crs_type> tgt_mat =
-        Tpetra::importAndFillCompleteBlockCrsMatrix<block_crs_type> (src_mat, importer);
-      //tgt_mat->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-
-      // Manually build the tgt matrix and test that it matches the returned matrix
-
-      // Build tgt graph.
-      Teuchos::RCP<crs_graph_type> tgt_graph_for_testing =
-        Teuchos::rcp (new crs_graph_type (tgt_map, 3));
-      {
-        Array<GO> cols(3);
-        for (GO globalrow = tgt_map->getMinGlobalIndex ();
-             globalrow <= tgt_map->getMaxGlobalIndex (); ++globalrow) {
-          if      (globalrow==0) cols.resize(1);
-          else if (globalrow==1) cols.resize(2);
-          else                   cols.resize(3);
-          for (GO col = 0; col < cols.size(); ++col) {
-            cols[col] = globalrow - col;
-          }
-          tgt_graph_for_testing->insertGlobalIndices (globalrow, cols());
-        }
-        tgt_graph_for_testing->fillComplete();
-        //tgt_graph_for_testing->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-      }
-
-      // Build tgt matrix
-      RCP<block_crs_type> tgt_mat_for_testing =
-        rcp (new block_crs_type (*tgt_graph_for_testing, blocksize));
-      build_lower_diag_matrix<block_crs_type>(tgt_mat_for_testing);
-      //tgt_mat_for_testing->describe(*out_to_screen, Teuchos::VERB_EXTREME);
-
-      // Test that matrices are identical
-      bool matrices_match = matrices_are_same<block_crs_type>(tgt_mat, tgt_mat_for_testing);
-      TEST_ASSERT(matrices_match);
-     }
-     catch (std::exception& e) { // end of the first test
-       err << "Proc " << myRank << ": " << e.what () << endl;
-       lclErr = 1;
-     }
-
-     reduceAll<int, int> (*comm, REDUCE_MAX, lclErr, outArg (gblErr));
-     TEST_EQUALITY_CONST( gblErr, 0 );
-     if (gblErr != 0) {
-       Tpetra::Details::gathervPrint (out, err.str (), *comm);
-       out << "Above test failed; aborting further tests" << endl;
-       return;
-     }
-
-    if (myRank==0) std::cout << "TEST DIAG" << std::endl;
     out << "1st test: Import a diagonal BlockCrsMatrix from a source row Map "
            "that has all indices on Process 0, to a target row Map that is "
            "uniformly distributed over processes. Blocksize=3." << endl;
@@ -2024,6 +1912,114 @@ namespace {
        out << "Above test failed; aborting further tests" << endl;
        return;
      }
+
+     out << "2nd test: Import a lower triangular BlockCrsMatrix from a source row Map "
+            "where even processors have 1 element and odd processors have 3 elements, "
+            "to a target row Map where each processor have 2 elements. Blocksize=3." << endl;
+     try {
+       Teuchos::OSTab tab1 (out);
+
+       // This test only makes sense for even number of ranks
+       if (numRanks % 2 != 0) {
+         return;
+       }
+
+       const GO indexBase = 0;
+       LO src_num_local_elements;
+       if (myRank % 2 == 0) src_num_local_elements = 1;
+       else                 src_num_local_elements = 3;
+       LO tgt_num_local_elements = 2;
+       const int blocksize = 3;
+
+       // Create row Maps for the source and target
+       RCP<const map_type> src_map =
+         rcp (new map_type (INVALID,
+                            src_num_local_elements,
+                            indexBase, comm));
+       RCP<const map_type> tgt_map =
+         rcp (new map_type (INVALID,
+                            tgt_num_local_elements,
+                            indexBase, comm));
+       //src_map->describe(out, Teuchos::VERB_EXTREME);
+       //tgt_map->describe(out, Teuchos::VERB_EXTREME);
+
+       // Build src graph. Allow for up to 2 off-diagonal entries.
+       Teuchos::RCP<crs_graph_type> src_graph =
+         Teuchos::rcp (new crs_graph_type (src_map, 3));
+       {
+         Array<GO> cols(3);
+         for (GO globalrow = src_map->getMinGlobalIndex ();
+              globalrow <= src_map->getMaxGlobalIndex (); ++globalrow) {
+           if      (globalrow==0) cols.resize(1);
+           else if (globalrow==1) cols.resize(2);
+           else                   cols.resize(3);
+           for (GO col = 0; col < cols.size(); ++col) {
+             cols[col] = globalrow - col;
+           }
+           src_graph->insertGlobalIndices (globalrow, cols());
+         }
+         src_graph->fillComplete();
+         //src_graph->describe(out, Teuchos::VERB_EXTREME);
+       }
+
+       // Build src matrix. Simple block lower-diagonal matrix with
+       // A(b1,b2) = [(b1)+10*(b2+1)].
+       RCP<block_crs_type> src_mat =
+         rcp (new block_crs_type (*src_graph, blocksize));
+       build_lower_diag_matrix<block_crs_type>(src_mat);
+       //src_mat->describe(out, Teuchos::VERB_EXTREME);
+
+       // Create the importer
+       import_type importer (src_map, tgt_map);
+
+       // Call importAndFillComplete to get the tgt matrix
+       RCP<block_crs_type> tgt_mat =
+         Tpetra::importAndFillCompleteBlockCrsMatrix<block_crs_type> (src_mat, importer);
+       //tgt_mat->describe(out, Teuchos::VERB_EXTREME);
+
+       // Manually build the tgt matrix and test that it matches the returned matrix
+
+       // Build tgt graph.
+       Teuchos::RCP<crs_graph_type> tgt_graph_for_testing =
+         Teuchos::rcp (new crs_graph_type (tgt_map, 3));
+       {
+         Array<GO> cols(3);
+         for (GO globalrow = tgt_map->getMinGlobalIndex ();
+              globalrow <= tgt_map->getMaxGlobalIndex (); ++globalrow) {
+           if      (globalrow==0) cols.resize(1);
+           else if (globalrow==1) cols.resize(2);
+           else                   cols.resize(3);
+           for (GO col = 0; col < cols.size(); ++col) {
+             cols[col] = globalrow - col;
+           }
+           tgt_graph_for_testing->insertGlobalIndices (globalrow, cols());
+         }
+         tgt_graph_for_testing->fillComplete();
+         //tgt_graph_for_testing->describe(out, Teuchos::VERB_EXTREME);
+       }
+
+       // Build tgt matrix
+       RCP<block_crs_type> tgt_mat_for_testing =
+         rcp (new block_crs_type (*tgt_graph_for_testing, blocksize));
+       build_lower_diag_matrix<block_crs_type>(tgt_mat_for_testing);
+       //tgt_mat_for_testing->describe(out, Teuchos::VERB_EXTREME);
+
+       // Test that matrices are identical
+       bool matrices_match = matrices_are_same<block_crs_type>(tgt_mat, tgt_mat_for_testing);
+       TEST_ASSERT(matrices_match);
+      }
+      catch (std::exception& e) { // end of the first test
+        err << "Proc " << myRank << ": " << e.what () << endl;
+        lclErr = 1;
+      }
+
+      reduceAll<int, int> (*comm, REDUCE_MAX, lclErr, outArg (gblErr));
+      TEST_EQUALITY_CONST( gblErr, 0 );
+      if (gblErr != 0) {
+        Tpetra::Details::gathervPrint (out, err.str (), *comm);
+        out << "Above test failed; aborting further tests" << endl;
+        return;
+      }
    }
 
   // Test BlockCrsMatrix Export for different graphs with different

From c5cc56106f39829fea980bcef961668ab17efe40 Mon Sep 17 00:00:00 2001
From: "Paul A. Patience" <paul@apatience.com>
Date: Wed, 27 Jul 2022 13:19:38 -0700
Subject: [PATCH 033/130] Tpetra: Fix CMake test for default ordinal type

The CMakeLists.txt was testing for

  DEFINED Tpetra_INST_INT_LONG AND Tpetra_INST_INT_UNSIGNED_LONG

instead of

  DEFINED Tpetra_INST_INT_LONG AND Tpetra_INST_INT_LONG

which resulted in -DTpetra_INST_INT_LONG=ON requiring the explicit
-DTpetra_INST_INT_LONG_LONG=OFF to prevent the build failing from two
ordinal types being specified.
---
 packages/tpetra/CMakeLists.txt | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/tpetra/CMakeLists.txt b/packages/tpetra/CMakeLists.txt
index a3c855107418..919ce4ab8120 100644
--- a/packages/tpetra/CMakeLists.txt
+++ b/packages/tpetra/CMakeLists.txt
@@ -684,7 +684,7 @@ MESSAGE(STATUS "Tpetra: Tpetra_INST_INT_LONG is disabled by default.")
 
 # IF anything other than long long is defined and enabled, and long long isn't defined then we disable long long
 IF( (    (    DEFINED Tpetra_INST_INT_INT           AND Tpetra_INST_INT_INT)
-     OR  (    DEFINED Tpetra_INST_INT_LONG          AND Tpetra_INST_INT_UNSIGNED_LONG)
+     OR  (    DEFINED Tpetra_INST_INT_LONG          AND Tpetra_INST_INT_LONG)
      OR  (    DEFINED Tpetra_INST_INT_UNSIGNED      AND Tpetra_INST_INT_UNSIGNED)
      OR  (    DEFINED Tpetra_INST_INT_UNSIGNED_LONG AND Tpetra_INST_INT_UNSIGNED_LONG))
      AND (NOT DEFINED Tpetra_INST_INT_LONG_LONG) )

From 4dcec5f3a523ee22bc59157e333a84b3e8e1824f Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Sun, 31 Jul 2022 16:52:48 -0600
Subject: [PATCH 034/130] Add vector random tests for multiple RHS

---
 .../adelus/test/vector_random/CMakeLists.txt  | 177 +++++++++++++++++-
 .../adelus/test/vector_random/cxx_main.cpp    | 153 ++++++++++-----
 2 files changed, 276 insertions(+), 54 deletions(-)

diff --git a/packages/adelus/test/vector_random/CMakeLists.txt b/packages/adelus/test/vector_random/CMakeLists.txt
index c53b4d5234e4..c91f95131d41 100644
--- a/packages/adelus/test/vector_random/CMakeLists.txt
+++ b/packages/adelus/test/vector_random/CMakeLists.txt
@@ -1,29 +1,196 @@
-
+#1 RANK
 TRIBITS_ADD_EXECUTABLE_AND_TEST(
   vector_random
   SOURCES cxx_main.cpp
+  NAME vector_random_npr1_rhs1
+  NUM_MPI_PROCS 1
+  ARGS "3501 1 1 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs4
+  NUM_MPI_PROCS 1
+  ARGS "3501 1 1 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs5
   NUM_MPI_PROCS 1
-  ARGS "3500 1 1"
+  ARGS "3501 1 1 5"
+  COMM mpi
+  )
+
+#2 RANKS
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs1
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs4
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs5
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 5"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random
+  NAME vector_random_npr2_rhs1
   NUM_MPI_PROCS 2
-  ARGS "3500 1 2"
+  ARGS "3501 2 2 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr2_rhs4
+  NUM_MPI_PROCS 2
+  ARGS "3501 2 2 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr2_rhs5
+  NUM_MPI_PROCS 2
+  ARGS "3501 2 2 5"
+  COMM mpi
+  )
+
+#3 RANKS
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs1
+  NUM_MPI_PROCS 3
+  ARGS "3501 1 3 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs4
+  NUM_MPI_PROCS 3
+  ARGS "3501 1 3 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs5
+  NUM_MPI_PROCS 3
+  ARGS "3501 1 3 5"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random
+  NAME vector_random_npr3_rhs1
   NUM_MPI_PROCS 3
-  ARGS "3500 1 3"
+  ARGS "3501 3 3 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr3_rhs4
+  NUM_MPI_PROCS 3
+  ARGS "3501 3 3 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr3_rhs5
+  NUM_MPI_PROCS 3
+  ARGS "3501 3 3 5"
+  COMM mpi
+  )
+
+#4 RANKS
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs1
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs4
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr1_rhs5
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 5"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr2_rhs1
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr2_rhs4
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr2_rhs5
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 5"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr4_rhs1
+  NUM_MPI_PROCS 4
+  ARGS "3501 4 4 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random
+  NAME vector_random_npr4_rhs4
+  NUM_MPI_PROCS 4
+  ARGS "3501 4 4 4"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random
+  NAME vector_random_npr4_rhs5
   NUM_MPI_PROCS 4
-  ARGS "3500 2 4"
+  ARGS "3501 4 4 5"
   COMM mpi
   )
diff --git a/packages/adelus/test/vector_random/cxx_main.cpp b/packages/adelus/test/vector_random/cxx_main.cpp
index 317c24291ac4..bef05bd1d0e4 100644
--- a/packages/adelus/test/vector_random/cxx_main.cpp
+++ b/packages/adelus/test/vector_random/cxx_main.cpp
@@ -54,8 +54,9 @@
 #include <Kokkos_Core.hpp>
 #include <Kokkos_Random.hpp>
 #include <KokkosBlas1_axpby.hpp>
+#include <KokkosBlas1_scal.hpp>
 #include <KokkosBlas1_nrm2.hpp>
-#include <KokkosBlas2_gemv.hpp>
+#include <KokkosBlas3_gemm.hpp>
 #include <Adelus.hpp>
 
 int main(int argc, char *argv[])
@@ -74,13 +75,13 @@ int main(int argc, char *argv[])
   int  matrix_size;
   int  nprocs_per_row;
   int  nptile = 1; // number of processors per node
+  int  numrhs = 1;
 
   double mflops;
 
-  MPI_Comm rowcomm;
+  MPI_Comm rowcomm, colcomm;
 
   static int buf[4];
-  int numrhs;
 
   int i, m, k;
 
@@ -98,8 +99,6 @@ int main(int argc, char *argv[])
 
   double tempc;
 
-  double rhs_nrm, m_nrm;
-
   int result;
 
   // Enroll into MPI
@@ -126,10 +125,12 @@ int main(int argc, char *argv[])
         buf[1] = atoi(argv[2]);
         // argv[3] should be #procs per node
         buf[2] = atoi(argv[3]);
+        // argv[4] should be #rhs
+        buf[3] = atoi(argv[4]);
       }
       else {
         // default is 1, but sqrt(p) would be better
-        buf[1] = 1; buf[2] = 1;
+        buf[1] = 1; buf[2] = 1; buf[3] = 1;
       }
     }
     else {
@@ -147,6 +148,10 @@ int main(int argc, char *argv[])
         std::cout << "Enter number of processors per node "  << std::endl;
         std::cin >> buf[2];
       }
+      if (buf[3] < 0) {
+        std::cout << "Enter number of rhs vectors "  << std::endl;
+        std::cin >> buf[3];
+      }
     }
   }
 
@@ -163,16 +168,15 @@ int main(int argc, char *argv[])
 
   nptile = buf[2];
 
+  numrhs = buf[3];
+
   if( rank == 0 ) {
     std::cout << " Matrix Size " << matrix_size << std::endl;
     std::cout << " Processors in a row  "  << nprocs_per_row << std::endl;
     std::cout << " Processors in a node  " << nptile << std::endl;
+    std::cout << " Number of RHS vectors " << numrhs << std::endl;
   }
 
-  // Example for 1 RHS
-
-  numrhs = 1;
-
   if( rank == 0) {
     std::cout << " ---- Building Adelus solver ----" << std::endl;
   }
@@ -184,9 +188,10 @@ int main(int argc, char *argv[])
                            myrows, mycols, myfirstrow, myfirstcol,
                            myrhs, my_row, my_col );
 
-  //   Define a new communicator
+  //   Define new communicators: rowcomm and colcomm
 
   MPI_Comm_split(MPI_COMM_WORLD,my_row,my_col,&rowcomm);
+  MPI_Comm_split(MPI_COMM_WORLD,my_col,my_row,&colcomm);
 
   std::cout << " ------ PARALLEL Distribution Info for : ---------" <<std::endl;
 
@@ -243,15 +248,23 @@ int main(int argc, char *argv[])
 #ifdef DREAL
   typedef Kokkos::View<double**, Layout, TestSpace>  ViewMatrixType;
   typedef Kokkos::View<double*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
+  typedef Kokkos::View<double**, Layout, Kokkos::HostSpace>  ViewMatrixType_Host;
+  typedef Kokkos::View<double*,  Layout, Kokkos::HostSpace>  ViewNrmVectorType_Host;
 #elif defined(SREAL)
   typedef Kokkos::View<float**, Layout, TestSpace>  ViewMatrixType;
   typedef Kokkos::View<float*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
+  typedef Kokkos::View<float**, Layout, Kokkos::HostSpace>  ViewMatrixType_Host;
+  typedef Kokkos::View<float*,  Layout, Kokkos::HostSpace>  ViewNrmVectorType_Host;
 #elif defined(SCPLX)
   typedef Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>  ViewMatrixType;
   typedef Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
+  typedef Kokkos::View<Kokkos::complex<float>**, Layout, Kokkos::HostSpace>  ViewMatrixType_Host;
+  typedef Kokkos::View<float*,  Layout, Kokkos::HostSpace>                   ViewNrmVectorType_Host;
 #else
   typedef Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>  ViewMatrixType;
   typedef Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
+  typedef Kokkos::View<Kokkos::complex<double>**, Layout, Kokkos::HostSpace>  ViewMatrixType_Host;
+  typedef Kokkos::View<double*,  Layout, Kokkos::HostSpace>                   ViewNrmVectorType_Host;
 #endif
   typedef typename ViewMatrixType::device_type::execution_space execution_space;
   typedef typename ViewMatrixType::device_type::memory_space memory_space;
@@ -269,15 +282,19 @@ int main(int argc, char *argv[])
 
   ViewVectorType_Host temp2 ( "temp2", myrows );
 
-  ViewVectorType_Host rhs   ( "rhs", matrix_size );
+  ViewMatrixType_Host rhs   ( "rhs", matrix_size, numrhs );
 
-  ViewVectorType_Host temp3 ( "temp3", matrix_size );
+  ViewMatrixType_Host temp3 ( "temp3", matrix_size, numrhs );
 
-  ViewVectorType_Host temp4 ( "temp4", matrix_size );
+  ViewMatrixType_Host temp4 ( "temp4", matrix_size, numrhs );
   
-  ViewVectorType_Host tempp ( "tempp", matrix_size );
+  ViewMatrixType_Host tempp ( "tempp", matrix_size, numrhs );
+
+  ViewMatrixType_Host temp22( "temp22", matrix_size, numrhs );
 
-  ViewVectorType_Host temp22( "temp22", matrix_size );
+  ViewNrmVectorType_Host rhs_nrm( "rhs_nrm", numrhs );
+
+  ViewNrmVectorType_Host m_nrm  ( "m_nrm", numrhs );
 
   // Set Random values
 
@@ -303,31 +320,62 @@ int main(int argc, char *argv[])
     }
   }
 
-  // Sum to Processor 0
+  // Sum from all processes and distribute the result back to all processes in rowcomm
 
   MPI_Allreduce(temp.data(), temp2.data(), myrows, ADELUS_MPI_DATA_TYPE, MPI_SUM, rowcomm);
 
+  int *nrhs_procs_rowcomm;
+  int my_rhs_offset = 0;
+
+  nrhs_procs_rowcomm  = (int*)malloc( nprocs_per_row * sizeof(int));
+  MPI_Allgather(&myrhs, 1, MPI_INT, nrhs_procs_rowcomm, 1, MPI_INT, rowcomm);//gather numbers of rhs of other processes 
+
+  // Find the location of my RHS in the global RHS
+
+  for (i=0; i<my_col; i++) {
+    my_rhs_offset += nrhs_procs_rowcomm[i];
+  }
+
   if( rank == 0 )
     std::cout << " ****   Packing RHS in Matrix   ****" << std::endl;
 
   // Now put the RHS in the appropriate position
 
   if( myrhs > 0 ) {
-    Kokkos::deep_copy( subview(h_A,Kokkos::ALL(),mycols), temp2 );
-    Kokkos::deep_copy( subview(rhs,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), temp2 );
+    for (k = 0; k < myrhs; k++) {
+#if defined(DREAL) || defined(ZCPLX)
+      ScalarA scal_factor = static_cast<double>(my_rhs_offset+k+1);
+#else
+      ScalarA scal_factor = static_cast<float>(my_rhs_offset+k+1);
+#endif
+      auto cur_rhs_vec_1d = subview(h_A,Kokkos::ALL(),mycols+k);
+      Kokkos::deep_copy( cur_rhs_vec_1d, temp2 );
+      KokkosBlas::scal(cur_rhs_vec_1d,scal_factor,cur_rhs_vec_1d);
+    }
+    for (k = 0; k < numrhs; k++) {
+#if defined(DREAL) || defined(ZCPLX)
+      ScalarA scal_factor = static_cast<double>(k+1);
+#else
+      ScalarA scal_factor = static_cast<float>(k+1);
+#endif
+      auto cur_rhs_vec_1d = subview(rhs,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),k);
+      Kokkos::deep_copy( cur_rhs_vec_1d, temp2 );
+      KokkosBlas::scal(cur_rhs_vec_1d,scal_factor,cur_rhs_vec_1d);
+    }
   }
 
   // Globally Sum the RHS needed for testing later
 
-  MPI_Allreduce(rhs.data(), temp4.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
+  MPI_Allreduce(rhs.data(), temp4.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, colcomm);
 
   // Pack back into RHS
 
   Kokkos::deep_copy( rhs, temp4 );
 
-  rhs_nrm = KokkosBlas::nrm2(rhs);
+  KokkosBlas::nrm2(rhs_nrm, rhs);
 
-  Kokkos::deep_copy( subview(A,Kokkos::ALL(),mycols), subview(h_A,Kokkos::ALL(),mycols) );
+  Kokkos::deep_copy( subview(A,   Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)),
+                     subview(h_A, Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );
 
   // Create handle
   Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
@@ -350,28 +398,33 @@ int main(int argc, char *argv[])
 
   // Now Check the Solution
 
-  Kokkos::deep_copy( subview(h_A,Kokkos::ALL(),mycols), subview(A,Kokkos::ALL(),mycols) );
+  Kokkos::deep_copy( subview(h_A, Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)),
+                     subview(A,   Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );
+
 
   // Pack the Answer into the apropriate position
 
-  if ( myrhs > 0) {
-    Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), subview(h_A,Kokkos::ALL(),mycols) );
+  if ( myrhs > 0 ) {
+    Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),
+                                     Kokkos::make_pair(my_rhs_offset, my_rhs_offset + myrhs)),
+                       subview(h_A,Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );//different layouts, is it OK?
   }
 
   // All processors get the answer
 
-  MPI_Allreduce(tempp.data(), temp22.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
-  
-  // perform the Matrix vector product
+  MPI_Allreduce(tempp.data(), temp22.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
 
+  // Perform the Matrix vector product
+  
   ScalarA alpha = 1.0;
   ScalarA beta  = 0.0;
 
-  KokkosBlas::gemv("N", alpha, subview(h_A,Kokkos::ALL(),Kokkos::make_pair(0, mycols)),
-                               subview(temp22,Kokkos::make_pair(myfirstcol - 1, myfirstcol - 1 + mycols)),
-                         beta, subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)));
+  KokkosBlas::gemm("N", "N", alpha, 
+                   subview(h_A,Kokkos::ALL(),Kokkos::make_pair(0, mycols)),
+                   subview(temp22,Kokkos::make_pair(myfirstcol - 1, myfirstcol - 1 + mycols),Kokkos::ALL()),
+                   beta, subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),Kokkos::ALL()));
 
-  MPI_Allreduce(tempp.data(), temp3.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
+  MPI_Allreduce(tempp.data(), temp3.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
 
   if( rank == 0) {
     std::cout <<  "======================================" << std::endl;
@@ -379,9 +432,9 @@ int main(int argc, char *argv[])
 
     ScalarA alpha_ = -1.0;
 
-    KokkosBlas::axpy(alpha_,rhs,temp3);//temp3=temp3-rhs
+    KokkosBlas::axpy(alpha_, rhs, temp3);//temp3=temp3-rhs
 
-    m_nrm = KokkosBlas::nrm2(temp3);
+    KokkosBlas::nrm2(m_nrm, temp3);
   }
 
   // Machine epsilon Calculation
@@ -393,32 +446,34 @@ int main(int argc, char *argv[])
   eps = fabs(tempc-1.0);
 
   if ( rank == 0 ) {
-	std::cout << "   Machine eps  " << eps  << std::endl;
-  }
-
-  if ( rank == 0 ) {
+    std::cout << "   Machine eps  " << eps  << std::endl;
 
-    std::cout << "   ||Ax - b||_2 = " << m_nrm << std::endl;
+    std::cout << "   Threshold = " << eps*1e4  << std::endl;
 
-    std::cout << "   ||b||_2 = " << rhs_nrm << std::endl;
+    for (k = 0; k < numrhs; k++) {
+      std::cout << "   Solution " << k << ":   ||Ax - b||_2 = " << m_nrm(k) << std::endl;
 
-    std::cout << "   ||Ax - b||_2 / ||b||_2  = " << m_nrm/rhs_nrm  << std::endl;
+      std::cout << "   Solution " << k << ":   ||b||_2 = " << rhs_nrm(k) << std::endl;
 
-    std::cout << "   Threshold = " << eps*1e4  << std::endl;
+      std::cout << "   Solution " << k << ":   ||Ax - b||_2 / ||b||_2  = " << m_nrm(k)/rhs_nrm(k)  << std::endl;
 
-    if ( m_nrm/rhs_nrm  > (eps*1e4)) {
-      std::cout << " ****    Solution Fails   ****" <<  std::endl;
-      result = 1;
-    }
-    else {
-      std::cout << " ****   Solution Passes   ****" << std::endl;
-      result = 0;
+      if ( m_nrm(k)/rhs_nrm(k)  > (eps*1e4)) {
+        std::cout << " ****   Solution " << k << " Fails   ****" <<  std::endl;
+        result = 1;
+        break;
+      }
+      else {
+        std::cout << " ****   Solution " << k << " Passes   ****" << std::endl;
+        result = 0;
+      }
     }
     std::cout <<  "======================================" << std::endl;
   }
 
   MPI_Bcast(&result, 1, MPI_INT, 0, MPI_COMM_WORLD);
 
+  free(nrhs_procs_rowcomm);
+
   }
   Kokkos::finalize();
 

From 15daa11c2b1520567e5f864f0d4a131325162eb0 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 1 Aug 2022 02:36:35 -0600
Subject: [PATCH 035/130] Add vector_random_fs tests for multiple RHS

---
 .../adelus/test/vector_random/cxx_main.cpp    |  61 +++---
 .../test/vector_random_fs/CMakeLists.txt      | 177 +++++++++++++++++-
 .../adelus/test/vector_random_fs/cxx_main.cpp | 166 ++++++++++------
 3 files changed, 312 insertions(+), 92 deletions(-)

diff --git a/packages/adelus/test/vector_random/cxx_main.cpp b/packages/adelus/test/vector_random/cxx_main.cpp
index bef05bd1d0e4..0ba6b728778e 100644
--- a/packages/adelus/test/vector_random/cxx_main.cpp
+++ b/packages/adelus/test/vector_random/cxx_main.cpp
@@ -155,7 +155,7 @@ int main(int argc, char *argv[])
     }
   }
 
-  /* Send the initilization data to each processor    */
+  // Send the initilization data to each processor
   mlen = 4*sizeof(int);
 
   MPI_Bcast(reinterpret_cast<char *>(buf), mlen, MPI_CHAR, 0, MPI_COMM_WORLD);
@@ -188,7 +188,7 @@ int main(int argc, char *argv[])
                            myrows, mycols, myfirstrow, myfirstcol,
                            myrhs, my_row, my_col );
 
-  //   Define new communicators: rowcomm and colcomm
+  // Define new communicators: rowcomm and colcomm
 
   MPI_Comm_split(MPI_COMM_WORLD,my_row,my_col,&rowcomm);
   MPI_Comm_split(MPI_COMM_WORLD,my_col,my_row,&colcomm);
@@ -235,40 +235,40 @@ int main(int argc, char *argv[])
   Kokkos::initialize( argc, argv );
 #endif
   {
-  //  Local size -- myrows  * (mycols + myrhs)
+  // Local size -- myrows  * (mycols + myrhs)
   
-  typedef Kokkos::LayoutLeft Layout;
+  using Layout = Kokkos::LayoutLeft;
 #if defined(KOKKOS_ENABLE_CUDA)
-  typedef Kokkos::CudaSpace TestSpace;
+  using TestSpace = Kokkos::CudaSpace;
 #elif defined(KOKKOS_ENABLE_HIP)
-  typedef Kokkos::Experimental::HIPSpace TestSpace;
+  using TestSpace = Kokkos::Experimental::HIPSpace;
 #else
-  typedef Kokkos::HostSpace TestSpace;
+  using TestSpace = Kokkos::HostSpace;
 #endif
 #ifdef DREAL
-  typedef Kokkos::View<double**, Layout, TestSpace>  ViewMatrixType;
-  typedef Kokkos::View<double*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
-  typedef Kokkos::View<double**, Layout, Kokkos::HostSpace>  ViewMatrixType_Host;
-  typedef Kokkos::View<double*,  Layout, Kokkos::HostSpace>  ViewNrmVectorType_Host;
+  using ViewMatrixType         = Kokkos::View<double**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<double**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
 #elif defined(SREAL)
-  typedef Kokkos::View<float**, Layout, TestSpace>  ViewMatrixType;
-  typedef Kokkos::View<float*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
-  typedef Kokkos::View<float**, Layout, Kokkos::HostSpace>  ViewMatrixType_Host;
-  typedef Kokkos::View<float*,  Layout, Kokkos::HostSpace>  ViewNrmVectorType_Host;
+  using ViewMatrixType         = Kokkos::View<float**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<float**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
 #elif defined(SCPLX)
-  typedef Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>  ViewMatrixType;
-  typedef Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
-  typedef Kokkos::View<Kokkos::complex<float>**, Layout, Kokkos::HostSpace>  ViewMatrixType_Host;
-  typedef Kokkos::View<float*,  Layout, Kokkos::HostSpace>                   ViewNrmVectorType_Host;
+  using ViewMatrixType         = Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<Kokkos::complex<float>**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
 #else
-  typedef Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>  ViewMatrixType;
-  typedef Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
-  typedef Kokkos::View<Kokkos::complex<double>**, Layout, Kokkos::HostSpace>  ViewMatrixType_Host;
-  typedef Kokkos::View<double*,  Layout, Kokkos::HostSpace>                   ViewNrmVectorType_Host;
+  using ViewMatrixType         = Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<Kokkos::complex<double>**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
 #endif
-  typedef typename ViewMatrixType::device_type::execution_space execution_space;
-  typedef typename ViewMatrixType::device_type::memory_space memory_space;
-  typedef typename ViewMatrixType::value_type ScalarA;
+  using execution_space = typename ViewMatrixType::device_type::execution_space;
+  using memory_space    = typename ViewMatrixType::device_type::memory_space;
+  using ScalarA         = typename ViewMatrixType::value_type;
 
   printf("Rank %d, ViewMatrixType execution_space %s, memory_space %s, value_type %s\n",rank, typeid(execution_space).name(), typeid(memory_space).name(), typeid(ScalarA).name());
 
@@ -324,13 +324,13 @@ int main(int argc, char *argv[])
 
   MPI_Allreduce(temp.data(), temp2.data(), myrows, ADELUS_MPI_DATA_TYPE, MPI_SUM, rowcomm);
 
+  // Find the location of my RHS in the global RHS
+
   int *nrhs_procs_rowcomm;
   int my_rhs_offset = 0;
 
   nrhs_procs_rowcomm  = (int*)malloc( nprocs_per_row * sizeof(int));
-  MPI_Allgather(&myrhs, 1, MPI_INT, nrhs_procs_rowcomm, 1, MPI_INT, rowcomm);//gather numbers of rhs of other processes 
-
-  // Find the location of my RHS in the global RHS
+  MPI_Allgather(&myrhs, 1, MPI_INT, nrhs_procs_rowcomm, 1, MPI_INT, rowcomm);//gather numbers of rhs of other processes
 
   for (i=0; i<my_col; i++) {
     my_rhs_offset += nrhs_procs_rowcomm[i];
@@ -401,13 +401,12 @@ int main(int argc, char *argv[])
   Kokkos::deep_copy( subview(h_A, Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)),
                      subview(A,   Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );
 
-
   // Pack the Answer into the apropriate position
 
   if ( myrhs > 0 ) {
     Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),
                                      Kokkos::make_pair(my_rhs_offset, my_rhs_offset + myrhs)),
-                       subview(h_A,Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );//different layouts, is it OK?
+                       subview(h_A,Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );
   }
 
   // All processors get the answer
diff --git a/packages/adelus/test/vector_random_fs/CMakeLists.txt b/packages/adelus/test/vector_random_fs/CMakeLists.txt
index 8cedda048b2b..b529a64dac62 100644
--- a/packages/adelus/test/vector_random_fs/CMakeLists.txt
+++ b/packages/adelus/test/vector_random_fs/CMakeLists.txt
@@ -1,29 +1,196 @@
-
+#1 RANK
 TRIBITS_ADD_EXECUTABLE_AND_TEST(
   vector_random_fs
   SOURCES cxx_main.cpp
+  NAME vector_random_fs_npr1_rhs1
+  NUM_MPI_PROCS 1
+  ARGS "3501 1 1 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs4
+  NUM_MPI_PROCS 1
+  ARGS "3501 1 1 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs5
   NUM_MPI_PROCS 1
-  ARGS "3500 1 1"
+  ARGS "3501 1 1 5"
+  COMM mpi
+  )
+
+#2 RANKS
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs1
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs4
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs5
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 5"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random_fs
+  NAME vector_random_fs_npr2_rhs1
   NUM_MPI_PROCS 2
-  ARGS "3500 1 2"
+  ARGS "3501 2 2 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr2_rhs4
+  NUM_MPI_PROCS 2
+  ARGS "3501 2 2 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr2_rhs5
+  NUM_MPI_PROCS 2
+  ARGS "3501 2 2 5"
+  COMM mpi
+  )
+
+#3 RANKS
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs1
+  NUM_MPI_PROCS 3
+  ARGS "3501 1 3 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs4
+  NUM_MPI_PROCS 3
+  ARGS "3501 1 3 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs5
+  NUM_MPI_PROCS 3
+  ARGS "3501 1 3 5"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random_fs
+  NAME vector_random_fs_npr3_rhs1
   NUM_MPI_PROCS 3
-  ARGS "3500 1 3"
+  ARGS "3501 3 3 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr3_rhs4
+  NUM_MPI_PROCS 3
+  ARGS "3501 3 3 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr3_rhs5
+  NUM_MPI_PROCS 3
+  ARGS "3501 3 3 5"
+  COMM mpi
+  )
+
+#4 RANKS
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs1
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs4
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr1_rhs5
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 5"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr2_rhs1
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr2_rhs4
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr2_rhs5
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 5"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr4_rhs1
+  NUM_MPI_PROCS 4
+  ARGS "3501 4 4 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_fs
+  NAME vector_random_fs_npr4_rhs4
+  NUM_MPI_PROCS 4
+  ARGS "3501 4 4 4"
   COMM mpi
   )
 
 TRIBITS_ADD_TEST(
   vector_random_fs
+  NAME vector_random_fs_npr4_rhs5
   NUM_MPI_PROCS 4
-  ARGS "3500 2 4"
+  ARGS "3501 4 4 5"
   COMM mpi
   )
diff --git a/packages/adelus/test/vector_random_fs/cxx_main.cpp b/packages/adelus/test/vector_random_fs/cxx_main.cpp
index d0ab98265e5e..9c44dd119330 100644
--- a/packages/adelus/test/vector_random_fs/cxx_main.cpp
+++ b/packages/adelus/test/vector_random_fs/cxx_main.cpp
@@ -54,8 +54,9 @@
 #include <Kokkos_Core.hpp>
 #include <Kokkos_Random.hpp>
 #include <KokkosBlas1_axpby.hpp>
+#include <KokkosBlas1_scal.hpp>
 #include <KokkosBlas1_nrm2.hpp>
-#include <KokkosBlas2_gemv.hpp>
+#include <KokkosBlas3_gemm.hpp>
 #include <Adelus.hpp>
 
 int main(int argc, char *argv[])
@@ -74,13 +75,13 @@ int main(int argc, char *argv[])
   int  matrix_size;
   int  nprocs_per_row;
   int  nptile = 1; // number of processors per node
+  int  numrhs = 1;
 
   double mflops;
 
-  MPI_Comm rowcomm;
+  MPI_Comm rowcomm, colcomm;
 
   static int buf[4];
-  int numrhs;
 
   int i, m, k;
 
@@ -98,8 +99,6 @@ int main(int argc, char *argv[])
 
   double tempc;
 
-  double rhs_nrm, m_nrm;
-
   int result;
 
   // Enroll into MPI
@@ -126,10 +125,12 @@ int main(int argc, char *argv[])
         buf[1] = atoi(argv[2]);
         // argv[3] should be #procs per node
         buf[2] = atoi(argv[3]);
+        // argv[4] should be #rhs
+        buf[3] = atoi(argv[4]);
       }
       else {
         // default is 1, but sqrt(p) would be better
-        buf[1] = 1; buf[2] = 1;
+        buf[1] = 1; buf[2] = 1; buf[3] = 1;
       }
     }
     else {
@@ -147,10 +148,14 @@ int main(int argc, char *argv[])
         std::cout << "Enter number of processors per node "  << std::endl;
         std::cin >> buf[2];
       }
+      if (buf[3] < 0) {
+        std::cout << "Enter number of rhs vectors "  << std::endl;
+        std::cin >> buf[3];
+      }
     }
   }
 
-  /* Send the initilization data to each processor    */
+  // Send the initilization data to each processor
   mlen = 4*sizeof(int);
 
   MPI_Bcast(reinterpret_cast<char *>(buf), mlen, MPI_CHAR, 0, MPI_COMM_WORLD);
@@ -163,16 +168,15 @@ int main(int argc, char *argv[])
 
   nptile = buf[2];
 
+  numrhs = buf[3];
+
   if( rank == 0 ) {
     std::cout << " Matrix Size " << matrix_size << std::endl;
     std::cout << " Processors in a row  "  << nprocs_per_row << std::endl;
     std::cout << " Processors in a node  " << nptile << std::endl;
+    std::cout << " Number of RHS vectors " << numrhs << std::endl;
   }
 
-  // Example for 1 RHS
-
-  numrhs = 1;
-
   if( rank == 0) {
     std::cout << " ---- Building Adelus solver ----" << std::endl;
   }
@@ -184,9 +188,10 @@ int main(int argc, char *argv[])
                            myrows, mycols, myfirstrow, myfirstcol,
                            myrhs, my_row, my_col );
 
-  //   Define a new communicator
+  // Define new communicators: rowcomm and colcomm
 
   MPI_Comm_split(MPI_COMM_WORLD,my_row,my_col,&rowcomm);
+  MPI_Comm_split(MPI_COMM_WORLD,my_col,my_row,&colcomm);
 
   std::cout << " ------ PARALLEL Distribution Info for : ---------" <<std::endl;
 
@@ -230,7 +235,7 @@ int main(int argc, char *argv[])
   Kokkos::initialize( argc, argv );
 #endif
   {
-  //  Local size -- myrows  * (mycols + myrhs)
+  // Local size -- myrows  * (mycols + myrhs)
   
   using Layout = Kokkos::LayoutLeft;
 #if defined(KOKKOS_ENABLE_CUDA)
@@ -241,17 +246,25 @@ int main(int argc, char *argv[])
   using TestSpace = Kokkos::HostSpace;
 #endif
 #ifdef DREAL
-  using ViewMatrixType      = Kokkos::View<double**, Layout, TestSpace>;
-  using ViewVectorType_Host = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType         = Kokkos::View<double**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<double**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
 #elif defined(SREAL)
-  using ViewMatrixType      = Kokkos::View<float**, Layout, TestSpace>;
-  using ViewVectorType_Host = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType         = Kokkos::View<float**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<float**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
 #elif defined(SCPLX)
-  using ViewMatrixType      = Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>;
-  using ViewVectorType_Host = Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType         = Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<Kokkos::complex<float>**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
 #else
-  using ViewMatrixType      = Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>;
-  using ViewVectorType_Host = Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType         = Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<Kokkos::complex<double>**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
 #endif
 
   using ViewIntType_Host= Kokkos::View<int*, Layout, Kokkos::HostSpace>;
@@ -274,15 +287,19 @@ int main(int argc, char *argv[])
 
   ViewVectorType_Host temp2 ( "temp2", myrows );
 
-  ViewVectorType_Host rhs   ( "rhs", matrix_size );
+  ViewMatrixType_Host rhs   ( "rhs", matrix_size, numrhs );
 
-  ViewVectorType_Host temp3 ( "temp3", matrix_size );
+  ViewMatrixType_Host temp3 ( "temp3", matrix_size, numrhs );
 
-  ViewVectorType_Host temp4 ( "temp4", matrix_size );
+  ViewMatrixType_Host temp4 ( "temp4", matrix_size, numrhs );
   
-  ViewVectorType_Host tempp ( "tempp", matrix_size );
+  ViewMatrixType_Host tempp ( "tempp", matrix_size, numrhs );
+
+  ViewMatrixType_Host temp22( "temp22", matrix_size, numrhs );
 
-  ViewVectorType_Host temp22( "temp22", matrix_size );
+  ViewNrmVectorType_Host rhs_nrm( "rhs_nrm", numrhs );
+
+  ViewNrmVectorType_Host m_nrm  ( "m_nrm", numrhs );
 
   ViewIntType_Host h_permute( "h_permute", matrix_size);// Permutation array for factor and solve done independently
 
@@ -310,32 +327,63 @@ int main(int argc, char *argv[])
     }
   }
 
-  // Sum to Processor 0
+  // Sum from all processes and distribute the result back to all processes in rowcomm
 
   MPI_Allreduce(temp.data(), temp2.data(), myrows, ADELUS_MPI_DATA_TYPE, MPI_SUM, rowcomm);
 
+  // Find the location of my RHS in the global RHS
+
+  int *nrhs_procs_rowcomm;
+  int my_rhs_offset = 0;
+
+  nrhs_procs_rowcomm  = (int*)malloc( nprocs_per_row * sizeof(int));
+  MPI_Allgather(&myrhs, 1, MPI_INT, nrhs_procs_rowcomm, 1, MPI_INT, rowcomm);//gather numbers of rhs of other processes
+
+  for (i=0; i<my_col; i++) {
+    my_rhs_offset += nrhs_procs_rowcomm[i];
+  }
+
   if( rank == 0 )
-    std::cout << " ****   Packing RHS in Matrix   ****" << std::endl;
+    std::cout << " ****   Backing up RHS   ****" << std::endl;
 
   // Now put the RHS in the appropriate position
 
   if( myrhs > 0 ) {
-    Kokkos::deep_copy( subview(h_B,Kokkos::ALL(),0), temp2 );
-    Kokkos::deep_copy( subview(rhs,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), temp2 );
+    for (k = 0; k < myrhs; k++) {
+#if defined(DREAL) || defined(ZCPLX)
+      ScalarA scal_factor = static_cast<double>(my_rhs_offset+k+1);
+#else
+      ScalarA scal_factor = static_cast<float>(my_rhs_offset+k+1);
+#endif
+      auto cur_rhs_vec_1d = subview(h_B,Kokkos::ALL(),k);
+      Kokkos::deep_copy( cur_rhs_vec_1d, temp2 );
+      KokkosBlas::scal(cur_rhs_vec_1d,scal_factor,cur_rhs_vec_1d);
+    }
+    for (k = 0; k < numrhs; k++) {
+#if defined(DREAL) || defined(ZCPLX)
+      ScalarA scal_factor = static_cast<double>(k+1);
+#else
+      ScalarA scal_factor = static_cast<float>(k+1);
+#endif
+      auto cur_rhs_vec_1d = subview(rhs,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),k);
+      Kokkos::deep_copy( cur_rhs_vec_1d, temp2 );
+      KokkosBlas::scal(cur_rhs_vec_1d,scal_factor,cur_rhs_vec_1d);
+    }
   }
 
   // Globally Sum the RHS needed for testing later
 
-  MPI_Allreduce(rhs.data(), temp4.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
+  MPI_Allreduce(rhs.data(), temp4.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, colcomm);
 
   // Pack back into RHS
 
   Kokkos::deep_copy( rhs, temp4 );
 
-  rhs_nrm = KokkosBlas::nrm2(rhs);
+  KokkosBlas::nrm2(rhs_nrm, rhs);
 
   Kokkos::deep_copy( B, h_B );
 
+
   // Create handle
   Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
     ahandle(0, MPI_COMM_WORLD, matrix_size, nprocs_per_row, numrhs );
@@ -381,26 +429,30 @@ int main(int argc, char *argv[])
 
   Kokkos::deep_copy( h_B, B );
 
+
   // Pack the Answer into the apropriate position
 
-  if ( myrhs > 0) {
-    Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)), subview(h_B, Kokkos::ALL(), 0) );
+  if ( myrhs > 0 ) {
+    Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),
+                                     Kokkos::make_pair(my_rhs_offset, my_rhs_offset + myrhs)),
+                       subview(h_B,Kokkos::ALL(),Kokkos::make_pair(0, myrhs)) );
   }
 
   // All processors get the answer
 
-  MPI_Allreduce(tempp.data(), temp22.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
+  MPI_Allreduce(tempp.data(), temp22.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
   
-  // perform the Matrix vector product
+  // Perform the Matrix vector product
 
   ScalarA alpha = 1.0;
   ScalarA beta  = 0.0;
 
-  KokkosBlas::gemv("N", alpha, subview(h_A,Kokkos::ALL(),Kokkos::make_pair(0, mycols)),
-                               subview(temp22,Kokkos::make_pair(myfirstcol - 1, myfirstcol - 1 + mycols)),
-                         beta, subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows)));
+  KokkosBlas::gemm("N", "N", alpha, 
+                   subview(h_A,Kokkos::ALL(),Kokkos::make_pair(0, mycols)),
+                   subview(temp22,Kokkos::make_pair(myfirstcol - 1, myfirstcol - 1 + mycols),Kokkos::ALL()),
+                   beta, subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),Kokkos::ALL()));
 
-  MPI_Allreduce(tempp.data(), temp3.data(), matrix_size, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
+  MPI_Allreduce(tempp.data(), temp3.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, MPI_COMM_WORLD);
 
   if( rank == 0) {
     std::cout <<  "======================================" << std::endl;
@@ -408,9 +460,9 @@ int main(int argc, char *argv[])
 
     ScalarA alpha_ = -1.0;
 
-    KokkosBlas::axpy(alpha_,rhs,temp3);//temp3=temp3-rhs
+    KokkosBlas::axpy(alpha_, rhs, temp3);//temp3=temp3-rhs
 
-    m_nrm = KokkosBlas::nrm2(temp3);
+    KokkosBlas::nrm2(m_nrm, temp3);
   }
 
   // Machine epsilon Calculation
@@ -423,31 +475,33 @@ int main(int argc, char *argv[])
 
   if ( rank == 0 ) {
 	std::cout << "   Machine eps  " << eps  << std::endl;
-  }
 
-  if ( rank == 0 ) {
+    std::cout << "   Threshold = " << eps*1e4  << std::endl;
 
-    std::cout << "   ||Ax - b||_2 = " << m_nrm << std::endl;
+    for (k = 0; k < numrhs; k++) {
+      std::cout << "   Solution " << k << ":   ||Ax - b||_2 = " << m_nrm(k) << std::endl;
 
-    std::cout << "   ||b||_2 = " << rhs_nrm << std::endl;
+      std::cout << "   Solution " << k << ":   ||b||_2 = " << rhs_nrm(k) << std::endl;
 
-    std::cout << "   ||Ax - b||_2 / ||b||_2  = " << m_nrm/rhs_nrm  << std::endl;
+      std::cout << "   Solution " << k << ":   ||Ax - b||_2 / ||b||_2  = " << m_nrm(k)/rhs_nrm(k)  << std::endl;
 
-    std::cout << "   Threshold = " << eps*1e4  << std::endl;
-
-    if ( m_nrm/rhs_nrm  > (eps*1e4)) {
-      std::cout << " ****    Solution Fails   ****" <<  std::endl;
-      result = 1;
-    }
-    else {
-      std::cout << " ****   Solution Passes   ****" << std::endl;
-      result = 0;
+      if ( m_nrm(k)/rhs_nrm(k)  > (eps*1e4)) {
+        std::cout << " ****   Solution " << k << " Fails   ****" <<  std::endl;
+        result = 1;
+        break;
+      }
+      else {
+        std::cout << " ****   Solution " << k << " Passes   ****" << std::endl;
+        result = 0;
+      }
     }
     std::cout <<  "======================================" << std::endl;
   }
 
   MPI_Bcast(&result, 1, MPI_INT, 0, MPI_COMM_WORLD);
 
+  free(nrhs_procs_rowcomm);
+
   }
   Kokkos::finalize();
 

From 367467e25381f6c992a72b90a6594f5bc3e8a2af Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 1 Aug 2022 02:40:42 -0600
Subject: [PATCH 036/130] Only deep_copy if holding the current column

---
 packages/adelus/src/Adelus_solve.hpp | 7 +++++--
 1 file changed, 5 insertions(+), 2 deletions(-)

diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index cd15b652707f..9a2ca4d8c92e 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -412,6 +412,7 @@ void back_solve_currcol_bcast(HandleType& ahandle, ZViewType& Z, RHSViewType& RH
   MPI_Comm row_comm = ahandle.get_row_comm();
   int me            = ahandle.get_myrank();
   int myrow         = ahandle.get_myrow();
+  int mycol         = ahandle.get_mycol();
   int nprocs_row    = ahandle.get_nprocs_row();
   int nprocs_col    = ahandle.get_nprocs_col();
   int ncols_matrix  = ahandle.get_ncols_matrix();
@@ -470,8 +471,10 @@ void back_solve_currcol_bcast(HandleType& ahandle, ZViewType& Z, RHSViewType& RH
     t1 = MPI_Wtime();
 #endif
     //Step 1: copy the current column of Z to a temporary view
-    Kokkos::deep_copy( Kokkos::subview(curr_col, Kokkos::make_pair(0, end_row), 0), 
-                       Kokkos::subview(Z, Kokkos::make_pair(0, end_row), k/nprocs_row) );
+    if (mycol == k_col) { //only deep_copy if holding the current column
+      Kokkos::deep_copy( Kokkos::subview(curr_col, Kokkos::make_pair(0, end_row), 0), 
+                         Kokkos::subview(Z, Kokkos::make_pair(0, end_row), k/nprocs_row) );
+    }
 #ifdef GET_TIMING
     copycoltime += (MPI_Wtime()-t1);
 #endif

From 033d3ec6e8f8c3b9717fbffecfed07b1c30dfd60 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 1 Aug 2022 11:49:25 -0600
Subject: [PATCH 037/130] Update new Adelus interface

---
 packages/adelus/test/perf_test/cxx_main.cpp | 50 ++++++++++-----------
 1 file changed, 24 insertions(+), 26 deletions(-)

diff --git a/packages/adelus/test/perf_test/cxx_main.cpp b/packages/adelus/test/perf_test/cxx_main.cpp
index 226f5fb4709d..ea9de8674648 100644
--- a/packages/adelus/test/perf_test/cxx_main.cpp
+++ b/packages/adelus/test/perf_test/cxx_main.cpp
@@ -180,16 +180,10 @@ int main(int argc, char *argv[])
 
   // Get Info to build the matrix on a processor
 
-  Adelus::GetDistribution( &nprocs_per_row,
-                           &matrix_size,
-                           &numrhs,
-                           &myrows,
-                           &mycols,
-                           &myfirstrow,
-                           &myfirstcol,
-                           &myrhs,
-                           &my_row,
-                           &my_col );
+  Adelus::GetDistribution( MPI_COMM_WORLD, 
+                           nprocs_per_row, matrix_size, numrhs,
+                           myrows, mycols, myfirstrow, myfirstcol,
+                           myrhs, my_row, my_col );
 
   //   Define a new communicator
 
@@ -228,30 +222,30 @@ int main(int argc, char *argv[])
   {
   //  Local size -- myrows  * (mycols + myrhs)
   
-  typedef Kokkos::LayoutLeft Layout;
+  using Layout = Kokkos::LayoutLeft;
 #if defined(KOKKOS_ENABLE_CUDA)
-  typedef Kokkos::CudaSpace TestSpace;
+  using TestSpace = Kokkos::CudaSpace;
 #elif defined(KOKKOS_ENABLE_HIP)
-  typedef Kokkos::Experimental::HIPSpace TestSpace;
+  using TestSpace = Kokkos::Experimental::HIPSpace;
 #else
-  typedef Kokkos::HostSpace TestSpace;
+  using TestSpace = Kokkos::HostSpace;
 #endif
 #ifdef DREAL
-  typedef Kokkos::View<double**, Layout, TestSpace>  ViewMatrixType;
-  typedef Kokkos::View<double*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
+  using ViewMatrixType         = Kokkos::View<double**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
 #elif defined(SREAL)
-  typedef Kokkos::View<float**, Layout, TestSpace>  ViewMatrixType;
-  typedef Kokkos::View<float*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
+  using ViewMatrixType         = Kokkos::View<float**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
 #elif defined(SCPLX)
-  typedef Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>  ViewMatrixType;
-  typedef Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
+  using ViewMatrixType         = Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>;
 #else
-  typedef Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>  ViewMatrixType;
-  typedef Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>  ViewVectorType_Host;
+  using ViewMatrixType         = Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>;
 #endif
-  typedef typename ViewMatrixType::device_type::execution_space execution_space;
-  typedef typename ViewMatrixType::device_type::memory_space memory_space;
-  typedef typename ViewMatrixType::value_type ScalarA;
+  using execution_space = typename ViewMatrixType::device_type::execution_space;
+  using memory_space    = typename ViewMatrixType::device_type::memory_space;
+  using ScalarA         = typename ViewMatrixType::value_type;
 
   printf("Rank %d, ViewMatrixType execution_space %s, memory_space %s, value_type %s\n",rank, typeid(execution_space).name(), typeid(memory_space).name(), typeid(ScalarA).name());
 
@@ -325,6 +319,10 @@ int main(int argc, char *argv[])
 
   Kokkos::deep_copy( subview(A,Kokkos::ALL(),mycols), subview(h_A,Kokkos::ALL(),mycols) );
 
+  // Create handle
+  Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
+    ahandle(0, MPI_COMM_WORLD, matrix_size, nprocs_per_row, numrhs );
+
   // Now Solve the Problem
   RCP<StackedTimer> timer = rcp(new StackedTimer("Adelus: total"));
   TimeMonitor::setStackedTimer(timer);
@@ -332,7 +330,7 @@ int main(int argc, char *argv[])
   if( rank == 0 )
     std::cout << " ****   Beginning Matrix Solve   ****" << std::endl;
 
-    Adelus::FactorSolve (A, myrows, mycols, &matrix_size, &nprocs_per_row, &numrhs, &secs);
+  Adelus::FactorSolve (ahandle, A, &secs);
 
   if( rank == 0) {
     std::cout << " ----  Solution time  ----   " << secs << "  in secs. " << std::endl;

From cda0d97e6b4f2d2b5f3df3daeac3d3a00804bb70 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 1 Aug 2022 14:01:47 -0600
Subject: [PATCH 038/130] Add multi-comm test

---
 packages/adelus/test/CMakeLists.txt           |   1 +
 packages/adelus/test/perf_test/cxx_main.cpp   |   2 +-
 .../adelus/test/vector_random/cxx_main.cpp    |   2 +-
 .../adelus/test/vector_random_fs/cxx_main.cpp |   2 +-
 .../test/vector_random_mc/CMakeLists.txt      |  74 +++
 .../adelus/test/vector_random_mc/cxx_main.cpp | 496 ++++++++++++++++++
 6 files changed, 574 insertions(+), 3 deletions(-)
 create mode 100644 packages/adelus/test/vector_random_mc/CMakeLists.txt
 create mode 100644 packages/adelus/test/vector_random_mc/cxx_main.cpp

diff --git a/packages/adelus/test/CMakeLists.txt b/packages/adelus/test/CMakeLists.txt
index 1f93b6e019b2..a1f92123a73c 100644
--- a/packages/adelus/test/CMakeLists.txt
+++ b/packages/adelus/test/CMakeLists.txt
@@ -1,6 +1,7 @@
 IF(Adelus_ENABLE_ZCPLX OR Adelus_ENABLE_DREAL)
   ADD_SUBDIRECTORY(vector_random)
   ADD_SUBDIRECTORY(vector_random_fs)
+  ADD_SUBDIRECTORY(vector_random_mc)
 ENDIF()
 
 IF(Adelus_ENABLE_Teuchos AND (Adelus_ENABLE_ZCPLX OR Adelus_ENABLE_DREAL))
diff --git a/packages/adelus/test/perf_test/cxx_main.cpp b/packages/adelus/test/perf_test/cxx_main.cpp
index ea9de8674648..b159c757a444 100644
--- a/packages/adelus/test/perf_test/cxx_main.cpp
+++ b/packages/adelus/test/perf_test/cxx_main.cpp
@@ -109,7 +109,7 @@ int main(int argc, char *argv[])
 
   double rhs_nrm, m_nrm;
 
-  int result;
+  int result=1;
 
   // Enroll into MPI
 
diff --git a/packages/adelus/test/vector_random/cxx_main.cpp b/packages/adelus/test/vector_random/cxx_main.cpp
index 0ba6b728778e..8e4f2723fa28 100644
--- a/packages/adelus/test/vector_random/cxx_main.cpp
+++ b/packages/adelus/test/vector_random/cxx_main.cpp
@@ -99,7 +99,7 @@ int main(int argc, char *argv[])
 
   double tempc;
 
-  int result;
+  int result=1;
 
   // Enroll into MPI
 
diff --git a/packages/adelus/test/vector_random_fs/cxx_main.cpp b/packages/adelus/test/vector_random_fs/cxx_main.cpp
index 9c44dd119330..e0d49021d905 100644
--- a/packages/adelus/test/vector_random_fs/cxx_main.cpp
+++ b/packages/adelus/test/vector_random_fs/cxx_main.cpp
@@ -99,7 +99,7 @@ int main(int argc, char *argv[])
 
   double tempc;
 
-  int result;
+  int result=1;
 
   // Enroll into MPI
 
diff --git a/packages/adelus/test/vector_random_mc/CMakeLists.txt b/packages/adelus/test/vector_random_mc/CMakeLists.txt
new file mode 100644
index 000000000000..40758e01a44b
--- /dev/null
+++ b/packages/adelus/test/vector_random_mc/CMakeLists.txt
@@ -0,0 +1,74 @@
+#2 RANKS -- 2 COMMS, EACH COMM has 1 RANK
+TRIBITS_ADD_EXECUTABLE_AND_TEST(
+  vector_random_mc
+  SOURCES cxx_main.cpp
+  NAME vector_random_mc_npr1_rhs1
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_mc
+  NAME vector_random_mc_npr1_rhs4
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_mc
+  NAME vector_random_mc_npr1_rhs5
+  NUM_MPI_PROCS 2
+  ARGS "3501 1 2 5"
+  COMM mpi
+  )
+
+#4 RANKS -- 2 COMMS, EACH COMM has 2 RANKS
+TRIBITS_ADD_TEST(
+  vector_random_mc
+  NAME vector_random_mc_npr1_rhs1
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_mc
+  NAME vector_random_mc_npr1_rhs4
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_mc
+  NAME vector_random_mc_npr1_rhs5
+  NUM_MPI_PROCS 4
+  ARGS "3501 1 4 5"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_mc
+  NAME vector_random_mc_npr2_rhs1
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 1"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_mc
+  NAME vector_random_mc_npr2_rhs4
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 4"
+  COMM mpi
+  )
+
+TRIBITS_ADD_TEST(
+  vector_random_mc
+  NAME vector_random_mc_npr2_rhs5
+  NUM_MPI_PROCS 4
+  ARGS "3501 2 4 5"
+  COMM mpi
+  )
diff --git a/packages/adelus/test/vector_random_mc/cxx_main.cpp b/packages/adelus/test/vector_random_mc/cxx_main.cpp
new file mode 100644
index 000000000000..c7904f361b29
--- /dev/null
+++ b/packages/adelus/test/vector_random_mc/cxx_main.cpp
@@ -0,0 +1,496 @@
+/*
+//@HEADER
+// ************************************************************************
+//
+//                        Adelus v. 1.0
+//       Copyright (2020) National Technology & Engineering
+//               Solutions of Sandia, LLC (NTESS).
+//
+// Under the terms of Contract DE-NA0003525 with NTESS,
+// the U.S. Government retains certain rights in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+// 1. Redistributions of source code must retain the above copyright
+// notice, this list of conditions and the following disclaimer.
+//
+// 2. Redistributions in binary form must reproduce the above copyright
+// notice, this list of conditions and the following disclaimer in the
+// documentation and/or other materials provided with the distribution.
+//
+// 3. Neither the name of NTESS nor the names of the contributors may be
+// used to endorse or promote products derived from this software without
+// specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY NTESS "AS IS" AND ANY EXPRESS OR IMPLIED
+// WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
+// MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
+// IN NO EVENT SHALL NTESS OR THE CONTRIBUTORS BE LIABLE FOR ANY DIRECT,
+// INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+// (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR 
+// SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+// HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+// STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
+// IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE 
+// POSSIBILITY OF SUCH DAMAGE.
+//
+// Questions? Contact Vinh Dang (vqdang@sandia.gov)
+//                    Joseph Kotulski (jdkotul@sandia.gov)
+//                    Siva Rajamanickam (srajama@sandia.gov)
+//
+// ************************************************************************
+//@HEADER
+*/
+
+#include <iostream>
+#include <cstdio>
+#include <cstdlib>
+#include <cstring>
+#include <sys/time.h>
+#include <mpi.h>
+
+#include <Kokkos_Core.hpp>
+#include <Kokkos_Random.hpp>
+#include <KokkosBlas1_axpby.hpp>
+#include <KokkosBlas1_scal.hpp>
+#include <KokkosBlas1_nrm2.hpp>
+#include <KokkosBlas3_gemm.hpp>
+#include <Adelus.hpp>
+
+int main(int argc, char *argv[])
+{
+  char processor_name[MPI_MAX_PROCESSOR_NAME];
+  int name_len;
+  int rank, size;
+  int sub_rank/*, sub_size*/;
+
+  int  myrows;
+  int  mycols;
+  int  myfirstrow;
+  int  myfirstcol;
+  int  myrhs;
+  int  my_row;
+  int  my_col;
+  int  matrix_size;
+  int  nprocs_per_row;
+  int  nptile = 1; // number of processors per node
+  int  numrhs = 1;
+
+  double mflops;
+
+  MPI_Comm sub_comm, rowcomm, colcomm;
+
+  static int buf[4];
+
+  int i, m, k;
+
+  int mlen;   // Message length for input data
+
+  unsigned int seed= 10;
+
+  double secs;
+
+  double eps;
+
+  double othird;
+
+  double four_thirds = 4./3.;
+
+  double tempc;
+
+  int result=1;
+
+  // Enroll into MPI
+
+  MPI_Init(&argc,&argv);                             /* starts MPI */
+  MPI_Comm_rank (MPI_COMM_WORLD, &rank);             /* get current process id */
+  MPI_Comm_size (MPI_COMM_WORLD, &size);             /* get number of processes */
+  MPI_Get_processor_name(processor_name, &name_len); /* get name of the processor */
+
+  // Divide the global comm into 2 halves communicators
+  int my_color = rank/(size/2);//NOTE: colors for first and second communicators
+  int my_key   = rank%(size/2);//NOTE: rank in each new communicator
+  MPI_Comm_split (MPI_COMM_WORLD, my_color, my_key, &sub_comm);
+  MPI_Comm_rank (sub_comm, &sub_rank);
+  //MPI_Comm_size (sub_comm, &sub_size);
+
+  // Initialize Input buffer
+
+  for(i=0;i<4;i++) buf[i]=-1;
+
+  std::cout << "proc " << rank << " (sub rank " << sub_rank << ") (" << processor_name << ") is alive of " << size << " Processors" << std::endl;
+
+  if( rank == 0 ) {
+    // Check for commandline input
+
+    if (argc > 1) {
+      // argv[1] should be size of matrix
+      buf[0] = atoi(argv[1]);
+      if (argc > 2) {
+        // argv[2] should be #procs per row
+        buf[1] = atoi(argv[2]);
+        // argv[3] should be #procs per node
+        buf[2] = atoi(argv[3]);
+        // argv[4] should be #rhs
+        buf[3] = atoi(argv[4]);
+      }
+      else {
+        // default is 1, but sqrt(p) would be better
+        buf[1] = 1; buf[2] = 1; buf[3] = 1;
+      }
+    }
+    else {
+      // Input Data about matrix and distribution
+
+      if (buf[0] < 0) {
+        std::cout << "Enter size of matrix " << std::endl;
+        std::cin >> buf[0];
+      }
+      if (buf[1] < 0) {
+        std::cout << "Enter number of processors to which each row is assigned "  << std::endl;
+        std::cin >> buf[1];
+      }
+      if (buf[2] < 0) {
+        std::cout << "Enter number of processors per node "  << std::endl;
+        std::cin >> buf[2];
+      }
+      if (buf[3] < 0) {
+        std::cout << "Enter number of rhs vectors "  << std::endl;
+        std::cin >> buf[3];
+      }
+    }
+  }
+
+  // Send the initilization data to each processor
+  mlen = 4*sizeof(int);
+
+  MPI_Bcast(reinterpret_cast<char *>(buf), mlen, MPI_CHAR, 0, MPI_COMM_WORLD);
+
+  // Set the values where needed
+
+  matrix_size = buf[0];
+
+  nprocs_per_row = buf[1];
+
+  nptile = buf[2];
+
+  numrhs = buf[3];
+
+  if( rank == 0 ) {
+    std::cout << " Matrix Size " << matrix_size << std::endl;
+    std::cout << " Processors in a row  "  << nprocs_per_row << std::endl;
+    std::cout << " Processors in a node  " << nptile << std::endl;
+    std::cout << " Number of RHS vectors " << numrhs << std::endl;
+  }
+
+  if( rank == 0) {
+    std::cout << " ---- Building Adelus solver ----" << std::endl;
+  }
+
+  // Get Info to build the matrix on a processor
+
+  Adelus::GetDistribution( sub_comm, 
+                           nprocs_per_row, matrix_size, numrhs,
+                           myrows, mycols, myfirstrow, myfirstcol,
+                           myrhs, my_row, my_col );
+
+  // Define new communicators: rowcomm and colcomm
+
+  MPI_Comm_split(sub_comm,my_row,my_col,&rowcomm);
+  MPI_Comm_split(sub_comm,my_col,my_row,&colcomm);
+
+  std::cout << " ------ PARALLEL Distribution Info for : ---------" <<std::endl;
+
+  std::cout << "   Processor  " << rank << std::endl
+       << "    sub-rank " << sub_rank << std::endl
+       << "    my rows  " << myrows << std::endl
+       << "    my cols  " << mycols << std::endl
+       << "    my rhs  " << myrhs << std::endl
+       << "    my first col  " << myfirstcol  << std::endl
+       << "    my first row  " << myfirstrow << std::endl
+       << "    my_row  " << my_row << std::endl
+       << "    num procs row   " << nprocs_per_row << std::endl
+       << "    my_col  " << my_col << std::endl;
+
+  // Adelus example using the Kokkos Views
+#if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
+  int gpu_count;
+#ifdef KOKKOS_ENABLE_CUDA
+  cudaGetDeviceCount ( &gpu_count );
+#else
+  hipGetDeviceCount ( &gpu_count );
+#endif
+  if (nptile > gpu_count) {
+    if( rank == 0 ) {
+      std::cout << "Request more GPUs than the number of GPUs available "
+                << "to MPI processes (requested: " << nptile 
+                << " vs. available: " << gpu_count 
+                << "). Exit without test." << std::endl;
+    }
+    MPI_Finalize() ;
+    return 0;
+  }
+
+  Kokkos::InitArguments args;
+  args.num_threads = 0;
+  args.num_numa    = 0;
+  args.device_id   = rank%nptile;
+  std::cout << "   Processor  " << rank << " (" << processor_name << "), GPU: " 
+            << args.device_id << "/" << gpu_count << std::endl;
+  Kokkos::initialize( args );
+#else
+  Kokkos::initialize( argc, argv );
+#endif
+  {
+  // Local size -- myrows  * (mycols + myrhs)
+  
+  using Layout = Kokkos::LayoutLeft;
+#if defined(KOKKOS_ENABLE_CUDA)
+  using TestSpace = Kokkos::CudaSpace;
+#elif defined(KOKKOS_ENABLE_HIP)
+  using TestSpace = Kokkos::Experimental::HIPSpace;
+#else
+  using TestSpace = Kokkos::HostSpace;
+#endif
+#ifdef DREAL
+  using ViewMatrixType         = Kokkos::View<double**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<double**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
+#elif defined(SREAL)
+  using ViewMatrixType         = Kokkos::View<float**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<float**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
+#elif defined(SCPLX)
+  using ViewMatrixType         = Kokkos::View<Kokkos::complex<float>**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<Kokkos::complex<float>*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<Kokkos::complex<float>**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<float*,  Layout, Kokkos::HostSpace>;
+#else
+  using ViewMatrixType         = Kokkos::View<Kokkos::complex<double>**, Layout, TestSpace>;
+  using ViewVectorType_Host    = Kokkos::View<Kokkos::complex<double>*,  Layout, Kokkos::HostSpace>;
+  using ViewMatrixType_Host    = Kokkos::View<Kokkos::complex<double>**, Layout, Kokkos::HostSpace>;
+  using ViewNrmVectorType_Host = Kokkos::View<double*,  Layout, Kokkos::HostSpace>;
+#endif
+  using execution_space = typename ViewMatrixType::device_type::execution_space;
+  using memory_space    = typename ViewMatrixType::device_type::memory_space;
+  using ScalarA         = typename ViewMatrixType::value_type;
+
+  printf("Rank %d, ViewMatrixType execution_space %s, memory_space %s, value_type %s\n",rank, typeid(execution_space).name(), typeid(memory_space).name(), typeid(ScalarA).name());
+
+  ViewMatrixType A( "A", myrows, mycols + myrhs + 6 );
+	
+  ViewMatrixType::HostMirror h_A = Kokkos::create_mirror( A );
+
+  // Some temp arrays
+
+  ViewVectorType_Host temp  ( "temp", myrows );
+
+  ViewVectorType_Host temp2 ( "temp2", myrows );
+
+  ViewMatrixType_Host rhs   ( "rhs", matrix_size, numrhs );
+
+  ViewMatrixType_Host temp3 ( "temp3", matrix_size, numrhs );
+
+  ViewMatrixType_Host temp4 ( "temp4", matrix_size, numrhs );
+  
+  ViewMatrixType_Host tempp ( "tempp", matrix_size, numrhs );
+
+  ViewMatrixType_Host temp22( "temp22", matrix_size, numrhs );
+
+  ViewNrmVectorType_Host rhs_nrm( "rhs_nrm", numrhs );
+
+  ViewNrmVectorType_Host m_nrm  ( "m_nrm", numrhs );
+
+  // Set Random values
+
+  if( rank == 0 )
+    std::cout << " ****   Setting Random Matrix    ****" << std::endl;
+ 
+  Kokkos::Random_XorShift64_Pool<execution_space> rand_pool(seed+rank);
+  Kokkos::fill_random(A, rand_pool,Kokkos::rand<Kokkos::Random_XorShift64<execution_space>,ScalarA >::max());
+
+  Kokkos::deep_copy( h_A, A );
+
+  // Now Create the RHS
+
+  if( rank == 0 )
+    std::cout << " ****   Creating RHS   ****" << std::endl;
+
+  // Sum the portion of the row that I have
+
+  for (k= 0; k < myrows; k++) {
+    temp(k) = 0;
+    for (m=0; m < mycols; m++) {
+     temp(k) = temp(k) + h_A(k,m);
+    }
+  }
+
+  // Sum from all processes and distribute the result back to all processes in rowcomm
+
+  MPI_Allreduce(temp.data(), temp2.data(), myrows, ADELUS_MPI_DATA_TYPE, MPI_SUM, rowcomm);
+
+  // Find the location of my RHS in the global RHS
+
+  int *nrhs_procs_rowcomm;
+  int my_rhs_offset = 0;
+
+  nrhs_procs_rowcomm  = (int*)malloc( nprocs_per_row * sizeof(int));
+  MPI_Allgather(&myrhs, 1, MPI_INT, nrhs_procs_rowcomm, 1, MPI_INT, rowcomm);//gather numbers of rhs of other processes
+
+  for (i=0; i<my_col; i++) {
+    my_rhs_offset += nrhs_procs_rowcomm[i];
+  }
+
+  if( rank == 0 )
+    std::cout << " ****   Packing RHS in Matrix   ****" << std::endl;
+
+  // Now put the RHS in the appropriate position
+
+  if( myrhs > 0 ) {
+    for (k = 0; k < myrhs; k++) {
+#if defined(DREAL) || defined(ZCPLX)
+      ScalarA scal_factor = static_cast<double>(my_rhs_offset+k+1);
+#else
+      ScalarA scal_factor = static_cast<float>(my_rhs_offset+k+1);
+#endif
+      auto cur_rhs_vec_1d = subview(h_A,Kokkos::ALL(),mycols+k);
+      Kokkos::deep_copy( cur_rhs_vec_1d, temp2 );
+      KokkosBlas::scal(cur_rhs_vec_1d,scal_factor,cur_rhs_vec_1d);
+    }
+    for (k = 0; k < numrhs; k++) {
+#if defined(DREAL) || defined(ZCPLX)
+      ScalarA scal_factor = static_cast<double>(k+1);
+#else
+      ScalarA scal_factor = static_cast<float>(k+1);
+#endif
+      auto cur_rhs_vec_1d = subview(rhs,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),k);
+      Kokkos::deep_copy( cur_rhs_vec_1d, temp2 );
+      KokkosBlas::scal(cur_rhs_vec_1d,scal_factor,cur_rhs_vec_1d);
+    }
+  }
+
+  // Globally Sum the RHS needed for testing later
+
+  MPI_Allreduce(rhs.data(), temp4.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, colcomm);
+
+  // Pack back into RHS
+
+  Kokkos::deep_copy( rhs, temp4 );
+
+  KokkosBlas::nrm2(rhs_nrm, rhs);
+
+  Kokkos::deep_copy( subview(A,   Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)),
+                     subview(h_A, Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );
+
+  // Create handle
+  Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
+    ahandle(my_color, sub_comm, matrix_size, nprocs_per_row, numrhs );
+
+  // Now Solve the Problem
+
+  if( rank == 0 )
+    std::cout << " ****   Beginning Matrix Solve   ****" << std::endl;
+
+  Adelus::FactorSolve (ahandle, A, &secs);
+
+  if( rank == 0) {
+    std::cout << " ----  Solution time  ----   " << secs << "  in secs. " << std::endl;
+
+    mflops = 2./3.*pow(matrix_size,3.)/secs/1000000.;
+
+    std::cout << " *****   MFLOPS   *****  " << mflops << std::endl;
+  }
+
+  // Now Check the Solution
+
+  Kokkos::deep_copy( subview(h_A, Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)),
+                     subview(A,   Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );
+
+  // Pack the Answer into the apropriate position
+
+  if ( myrhs > 0 ) {
+    Kokkos::deep_copy( subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),
+                                     Kokkos::make_pair(my_rhs_offset, my_rhs_offset + myrhs)),
+                       subview(h_A,Kokkos::ALL(),Kokkos::make_pair(mycols, mycols + myrhs)) );
+  }
+
+  // All processors get the answer
+
+  MPI_Allreduce(tempp.data(), temp22.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, sub_comm);
+
+  // Perform the Matrix vector product
+  
+  ScalarA alpha = 1.0;
+  ScalarA beta  = 0.0;
+
+  KokkosBlas::gemm("N", "N", alpha, 
+                   subview(h_A,Kokkos::ALL(),Kokkos::make_pair(0, mycols)),
+                   subview(temp22,Kokkos::make_pair(myfirstcol - 1, myfirstcol - 1 + mycols),Kokkos::ALL()),
+                   beta, subview(tempp,Kokkos::make_pair(myfirstrow - 1, myfirstrow - 1 + myrows),Kokkos::ALL()));
+
+  MPI_Allreduce(tempp.data(), temp3.data(), matrix_size*numrhs, ADELUS_MPI_DATA_TYPE, MPI_SUM, sub_comm);
+
+  if( rank == 0) {
+    std::cout <<  "======================================" << std::endl;
+    std::cout << " ---- Error Calculation ----" << std::endl;
+  }
+  if( sub_rank == 0) {
+    ScalarA alpha_ = -1.0;
+
+    KokkosBlas::axpy(alpha_, rhs, temp3);//temp3=temp3-rhs
+
+    KokkosBlas::nrm2(m_nrm, temp3);
+  }
+
+  // Machine epsilon Calculation
+
+  othird = four_thirds - 1.;
+
+  tempc = othird + othird + othird;
+
+  eps = fabs(tempc-1.0);
+
+  if ( rank == 0 ) {
+    std::cout << "   Machine eps  " << eps  << std::endl;
+
+    std::cout << "   Threshold = " << eps*1e4  << std::endl;
+  }
+  if ( sub_rank == 0 ) {
+    for (k = 0; k < numrhs; k++) {
+      std::cout << "   Solution " << k << ":   ||Ax - b||_2 = " << m_nrm(k) << " on comm " << my_color << std::endl;
+
+      std::cout << "   Solution " << k << ":   ||b||_2 = " << rhs_nrm(k) << " on comm " << my_color << std::endl;
+
+      std::cout << "   Solution " << k << ":   ||Ax - b||_2 / ||b||_2  = " << m_nrm(k)/rhs_nrm(k) << " on comm " << my_color  << std::endl;
+
+      if ( m_nrm(k)/rhs_nrm(k)  > (eps*1e4)) {
+        std::cout << " ****   Solution " << k << " Fails   ****" << " on comm " << my_color << std::endl;
+        result = 1;
+        break;
+      }
+      else {
+        std::cout << " ****   Solution " << k << " Passes   ****" << " on comm " << my_color << std::endl;
+        result = 0;
+      }
+    }
+  }
+  if ( rank == 0 ) {
+    std::cout <<  "======================================" << std::endl;
+  }
+
+  MPI_Bcast(&result, 1, MPI_INT, 0, sub_comm);
+  MPI_Allreduce(MPI_IN_PLACE, &result, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
+
+  free(nrhs_procs_rowcomm);
+
+  }
+  Kokkos::finalize();
+
+  MPI_Finalize() ;
+
+  return (result);
+}

From cc4e1ff621e8dbeb10ffc3762f78db4ed78306ba Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 1 Aug 2022 14:24:13 -0600
Subject: [PATCH 039/130] Update example with handle and new Adelus interface

---
 packages/adelus/example/CMakeLists.txt    |  8 +++----
 packages/adelus/example/adelus_driver.cpp | 26 +++++++++++------------
 2 files changed, 16 insertions(+), 18 deletions(-)

diff --git a/packages/adelus/example/CMakeLists.txt b/packages/adelus/example/CMakeLists.txt
index 44e3bd839536..6106ad183b8a 100644
--- a/packages/adelus/example/CMakeLists.txt
+++ b/packages/adelus/example/CMakeLists.txt
@@ -1,5 +1,5 @@
 # CMAKE File for "adelus_driver" application building against an installed Trilinos
-cmake_minimum_required(VERSION 3.1)
+cmake_minimum_required(VERSION 3.12)
 
 # Use Trilinos_PREFIX, if the user set it, to help find Trilinos.
 # The final location will actually be held in Trilinos_DIR which must
@@ -28,7 +28,7 @@ MESSAGE("   Trilinos_Fortran_COMPILER = ${Trilinos_Fortran_COMPILER}")
 MESSAGE("   Trilinos_CXX_COMPILER_FLAGS = ${Trilinos_CXX_COMPILER_FLAGS}")
 MESSAGE("   Trilinos_C_COMPILER_FLAGS = ${Trilinos_C_COMPILER_FLAGS}")
 MESSAGE("   Trilinos_Fortran_COMPILER_FLAGS = ${Trilinos_Fortran_COMPILER_FLAGS}")
-MESSAGE("   Trilinos_EXTRA_LINK_FLAGS = ${Trilinos_EXTRA_LINK_FLAGS}")
+MESSAGE("   Trilinos_EXTRA_LD_FLAGS = ${Trilinos_EXTRA_LD_FLAGS}")
 MESSAGE("End of Trilinos details\n")
 
 # Make sure to use same compilers and flags as Trilinos
@@ -36,7 +36,7 @@ SET(CMAKE_CXX_COMPILER ${Trilinos_CXX_COMPILER} )
 SET(CMAKE_C_COMPILER ${Trilinos_C_COMPILER} )
 SET(CMAKE_Fortran_COMPILER ${Trilinos_Fortran_COMPILER} )
 
-SET(CMAKE_CXX_FLAGS  "${Trilinos_CXX_COMPILER_FLAGS} ${CMAKE_CXX_FLAGS} -L$ENV{MPI_ROOT}/lib -lmpi_ibm -fopenmp")
+SET(CMAKE_CXX_FLAGS  "${Trilinos_CXX_COMPILER_FLAGS} ${CMAKE_CXX_FLAGS}")
 SET(CMAKE_C_FLAGS  "${Trilinos_C_COMPILER_FLAGS} ${CMAKE_C_FLAGS}")
 SET(CMAKE_Fortran_FLAGS  "${Trilinos_Fortran_COMPILER_FLAGS} ${CMAKE_Fortran_FLAGS}")
 
@@ -56,5 +56,5 @@ ADD_EXECUTABLE(adelus_driver adelus_driver.cpp)
 
 set_property(TARGET adelus_driver PROPERTY CXX_STANDARD 14)
 
-TARGET_LINK_LIBRARIES(adelus_driver ${Trilinos_LIBRARIES} ${Trilinos_TPL_LIBRARIES} ${Trilinos_EXTRA_LINK_FLAGS})
+TARGET_LINK_LIBRARIES(adelus_driver ${Trilinos_LIBRARIES} ${Trilinos_TPL_LIBRARIES} ${Trilinos_EXTRA_LD_FLAGS})
 
diff --git a/packages/adelus/example/adelus_driver.cpp b/packages/adelus/example/adelus_driver.cpp
index d5c8c0896bb5..aa4df48d3914 100644
--- a/packages/adelus/example/adelus_driver.cpp
+++ b/packages/adelus/example/adelus_driver.cpp
@@ -151,16 +151,10 @@ int main( int argc, char* argv[] )
   int my_rows_max;
   int my_cols_max;
  
-  Adelus::GetDistribution( &nprocs_row,
-                           &matrix_size,
-                           &nrhs,
-                           &my_rows,
-                           &my_cols,
-                           &my_first_row,
-                           &my_first_col,
-                           &my_rhs,
-                           &my_row,
-                           &my_col );
+  Adelus::GetDistribution( MPI_COMM_WORLD,
+                           nprocs_row, matrix_size, nrhs,
+                           my_rows, my_cols, my_first_row, my_first_col,
+                           my_rhs, my_row, my_col );
 
   MPI_Allreduce( &my_rows, &my_rows_max, 1, MPI_INT, MPI_MAX, MPI_COMM_WORLD);
   MPI_Allreduce( &my_cols, &my_cols_max, 1, MPI_INT, MPI_MAX, MPI_COMM_WORLD);
@@ -340,6 +334,10 @@ int main( int argc, char* argv[] )
 #endif
     }
 
+    // Create handle
+    Adelus::AdelusHandle<typename ViewMatrixType::value_type, execution_space, memory_space> 
+      ahandle(0, MPI_COMM_WORLD, matrix_size, nprocs_row, nrhs );
+
     double time = 0.0;
 
     MPI_Barrier (MPI_COMM_WORLD);
@@ -358,16 +356,16 @@ int main( int argc, char* argv[] )
       gettimeofday( &begin, NULL );
   
 #ifdef KKVIEW_API
-      Adelus::FactorSolve (my_A, my_rows, my_cols, &matrix_size, &nprocs_row, &nrhs, &secs);
+      Adelus::FactorSolve (ahandle, my_A, &secs);
 #endif
 #if defined(DEVPTR_API) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-      Adelus::FactorSolve_devPtr (reinterpret_cast<ADELUS_DATA_TYPE *>(my_A.data()),my_rows,my_cols,my_rhs,&matrix_size,&nprocs_row,&nrhs,&secs);
+      Adelus::FactorSolve_devPtr (ahandle, reinterpret_cast<ADELUS_DATA_TYPE *>(my_A.data()), my_rows, my_cols, my_rhs, &matrix_size, &nprocs_row, &nrhs, &secs);
 #endif
 #if defined(HOSTPTR_API) && !(defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))//KOKKOS_ENABLE_OPENMP
-      Adelus::FactorSolve_hostPtr (reinterpret_cast<ADELUS_DATA_TYPE *>(my_A.data()),my_rows,my_cols,my_rhs,&matrix_size,&nprocs_row,&nrhs,&secs);
+      Adelus::FactorSolve_hostPtr (ahandle, reinterpret_cast<ADELUS_DATA_TYPE *>(my_A.data()), my_rows, my_cols, my_rhs, &matrix_size, &nprocs_row, &nrhs, &secs);
 #endif
 #if defined(HOSTPTR_API) && (defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP))
-      Adelus::FactorSolve_hostPtr (reinterpret_cast<ADELUS_DATA_TYPE *>(h_my_A_hptr.data()),my_rows,my_cols,my_rhs,&matrix_size,&nprocs_row,&nrhs,&secs);
+      Adelus::FactorSolve_hostPtr (ahandle, reinterpret_cast<ADELUS_DATA_TYPE *>(h_my_A_hptr.data()), my_rows, my_cols, my_rhs, &matrix_size, &nprocs_row, &nrhs, &secs);
 #endif
 
       Kokkos::fence();

From 5cb7b67554cb0b9e657e51a367c76933e4446964 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 1 Aug 2022 16:19:52 -0600
Subject: [PATCH 040/130] Update CMake policy in example

---
 packages/adelus/example/CMakeLists.txt | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/packages/adelus/example/CMakeLists.txt b/packages/adelus/example/CMakeLists.txt
index 6106ad183b8a..fa7b437d4bf0 100644
--- a/packages/adelus/example/CMakeLists.txt
+++ b/packages/adelus/example/CMakeLists.txt
@@ -1,6 +1,8 @@
 # CMAKE File for "adelus_driver" application building against an installed Trilinos
 cmake_minimum_required(VERSION 3.12)
 
+cmake_policy(SET CMP0057 NEW)
+
 # Use Trilinos_PREFIX, if the user set it, to help find Trilinos.
 # The final location will actually be held in Trilinos_DIR which must
 # point at "<prefix>/lib/cmake/Trilinos", but this helps the search.

From c5841c00cbcbad5d5c2e8d723389bff2daf97df3 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Tue, 2 Aug 2022 01:21:31 -0600
Subject: [PATCH 041/130] Update README

---
 packages/adelus/README.md | 16 ++++++++++++----
 1 file changed, 12 insertions(+), 4 deletions(-)

diff --git a/packages/adelus/README.md b/packages/adelus/README.md
index 1e5b46b692e1..26127ed2b169 100755
--- a/packages/adelus/README.md
+++ b/packages/adelus/README.md
@@ -98,6 +98,8 @@ We organize the directories as follows:
 * ```Adelus::GetDistribution()```: gives the distribution information that is required
 by the dense solver to the user that defines the matrix block and right hand side information.
 
+* ```Adelus::AdelusHandle<...>```: an application must create a handle to the Adelus communicator and necessary metadata (the handle is passed to every subsequent Adelus function call)
+
 * ```Adelus::FactorSolve()```: factors and solves the dense matrix in which the matrix
 and rhs are packed in Kokkos View
 
@@ -105,10 +107,14 @@ and rhs are packed in Kokkos View
 
 * ```Adelus::FactorSolve_hostPtr()```: matrix and rhs are packed and passed as host pointer
 
+* ```Adelus::Factor()```: factors the dense matrix for later solve
+
+* ```Adelus::Solve()```: solves the previously factored dense matrix for provided RHS
+
 2. Implementations of the phases of the solver (i.e. factor, solve, permutation)  
 and other utility functions also locate in the ```src/``` subdirectory.
 
-3. A correctness test is in the ```test/``` subdirectory.
+3. Correctness tests is in the ```test/``` subdirectory.
 
 4. A simple example that generates a random matrix and a right-hand-side to
     exercise the solver is in the ```example/``` subdirectory.
@@ -249,12 +255,14 @@ the solver can be called. In this example, the portion of matrix on each MPI
 process and the reference solution vector are randomly generated. Then, the
 assigned RHS vectors on MPI processes can be computed.
 
-3. Launch Adelus using ```Adelus::FactorSolve```, or ```Adelus::FactorSolve_devPtr```,
+3. Create a handle to the Adelus communicator and necessary metadata
+
+4. Launch Adelus using ```Adelus::FactorSolve```, or ```Adelus::FactorSolve_devPtr```,
 or ```Adelus::FactorSolve_hostPtr```.
 
-4. Gather results.
+5. Gather results.
 
-5. Compare the returned solution vector with the reference vector.
+6. Compare the returned solution vector with the reference vector.
 
 ### Compile with Makefile
 

From 6fd97cfca30e0ec7ffdca53823c04814d553be70 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Tue, 2 Aug 2022 11:49:21 -0700
Subject: [PATCH 042/130] Move host allocations to symbolic and change layout
 of iw

---
 .../src/sparse/KokkosSparse_spiluk_handle.hpp |  50 +++--
 .../impl/KokkosSparse_spiluk_numeric_impl.hpp | 195 +++++++-----------
 .../KokkosSparse_spiluk_symbolic_impl.hpp     |  41 ++--
 3 files changed, 129 insertions(+), 157 deletions(-)

diff --git a/packages/kokkos-kernels/src/sparse/KokkosSparse_spiluk_handle.hpp b/packages/kokkos-kernels/src/sparse/KokkosSparse_spiluk_handle.hpp
index 3cabcd0f73bf..54cc12447489 100644
--- a/packages/kokkos-kernels/src/sparse/KokkosSparse_spiluk_handle.hpp
+++ b/packages/kokkos-kernels/src/sparse/KokkosSparse_spiluk_handle.hpp
@@ -45,6 +45,7 @@
 #include <Kokkos_Core.hpp>
 #include <iostream>
 #include <string>
+#include <KokkosKernels_HashmapAccumulator.hpp>
 
 #ifndef _SPILUKHANDLE_HPP
 #define _SPILUKHANDLE_HPP
@@ -87,6 +88,12 @@ class SPILUKHandle {
   typedef typename Kokkos::View<nnz_lno_t *, HandlePersistentMemorySpace>
       nnz_lno_view_t;
 
+  typedef typename Kokkos::View<size_type *, Kokkos::HostSpace>
+      nnz_row_view_host_t;
+
+  typedef typename Kokkos::View<nnz_lno_t *, Kokkos::HostSpace>
+      nnz_lno_view_host_t;
+
   typedef typename std::make_signed<
       typename nnz_row_view_t::non_const_value_type>::type signed_integral_t;
   typedef Kokkos::View<signed_integral_t *,
@@ -95,14 +102,19 @@ class SPILUKHandle {
                        typename nnz_row_view_t::memory_traits>
       signed_nnz_lno_view_t;
 
+  typedef Kokkos::View<nnz_lno_t **, Kokkos::LayoutRight,
+                       HandlePersistentMemorySpace>
+      work_view_t;
+
  private:
   nnz_row_view_t level_list;  // level IDs which the rows belong to
   nnz_lno_view_t level_idx;   // the list of rows in each level
   nnz_lno_view_t
       level_ptr;  // the starting index (into the view level_idx) of each level
-  nnz_lno_view_t level_nchunks;  // number of chunks of rows at each level
-  nnz_lno_view_t
+  nnz_lno_view_host_t level_nchunks;  // number of chunks of rows at each level
+  nnz_lno_view_host_t
       level_nrowsperchunk;  // maximum number of rows among chunks at each level
+  work_view_t iw;  // working view for mapping dense indices to sparse indices
 
   size_type nrows;
   size_type nlevels;
@@ -128,6 +140,7 @@ class SPILUKHandle {
         level_ptr(),
         level_nchunks(),
         level_nrowsperchunk(),
+        iw(),
         nrows(nrows_),
         nlevels(0),
         nnzL(nnzL_),
@@ -147,11 +160,12 @@ class SPILUKHandle {
     set_nnzU(nnzU_);
     set_level_maxrows(0);
     set_level_maxrowsperchunk(0);
-    level_list    = nnz_row_view_t("level_list", nrows_),
-    level_idx     = nnz_lno_view_t("level_idx", nrows_),
-    level_ptr     = nnz_lno_view_t("level_ptr", nrows_ + 1),
-    level_nchunks = nnz_lno_view_t(), level_nrowsperchunk = nnz_lno_view_t(),
-    reset_symbolic_complete();
+    level_list          = nnz_row_view_t("level_list", nrows_),
+    level_idx           = nnz_lno_view_t("level_idx", nrows_),
+    level_ptr           = nnz_lno_view_t("level_ptr", nrows_ + 1),
+    level_nchunks       = nnz_lno_view_host_t(),
+    level_nrowsperchunk = nnz_lno_view_host_t(), reset_symbolic_complete(),
+    iw                  = work_view_t();
   }
 
   virtual ~SPILUKHandle(){};
@@ -170,17 +184,28 @@ class SPILUKHandle {
   nnz_lno_view_t get_level_ptr() const { return level_ptr; }
 
   KOKKOS_INLINE_FUNCTION
-  nnz_lno_view_t get_level_nchunks() const { return level_nchunks; }
+  nnz_lno_view_host_t get_level_nchunks() const { return level_nchunks; }
 
   void alloc_level_nchunks(const size_type nlevels_) {
-    level_nchunks = nnz_lno_view_t("level_nchunks", nlevels_);
+    level_nchunks = nnz_lno_view_host_t("level_nchunks", nlevels_);
   }
 
   KOKKOS_INLINE_FUNCTION
-  nnz_lno_view_t get_level_nrowsperchunk() const { return level_nrowsperchunk; }
+  nnz_lno_view_host_t get_level_nrowsperchunk() const {
+    return level_nrowsperchunk;
+  }
 
   void alloc_level_nrowsperchunk(const size_type nlevels_) {
-    level_nrowsperchunk = nnz_lno_view_t("level_nrowsperchunk", nlevels_);
+    level_nrowsperchunk = nnz_lno_view_host_t("level_nrowsperchunk", nlevels_);
+  }
+
+  KOKKOS_INLINE_FUNCTION
+  work_view_t get_iw() const { return iw; }
+
+  void alloc_iw(const size_type nrows_, const size_type ncols_) {
+    iw = work_view_t(Kokkos::view_alloc(Kokkos::WithoutInitializing, "iw"),
+                     nrows_, ncols_);
+    Kokkos::deep_copy(iw, nnz_lno_t(-1));
   }
 
   KOKKOS_INLINE_FUNCTION
@@ -238,8 +263,7 @@ class SPILUKHandle {
     if (algm == SPILUKAlgorithm::SEQLVLSCHD_TP1)
       std::cout << "SEQLVLSCHD_TP1" << std::endl;
 
-    /*
-    if ( algm == SPILUKAlgorithm::SEQLVLSCHED_TP2 ) {
+    /*if ( algm == SPILUKAlgorithm::SEQLVLSCHED_TP2 ) {
       std::cout << "SEQLVLSCHED_TP2" << std::endl;;
       std::cout << "WARNING: With CUDA this is currently only reliable with
     int-int ordinal-offset pair" << std::endl;
diff --git a/packages/kokkos-kernels/src/sparse/impl/KokkosSparse_spiluk_numeric_impl.hpp b/packages/kokkos-kernels/src/sparse/impl/KokkosSparse_spiluk_numeric_impl.hpp
index d0b80ace6928..4af8606dfbde 100644
--- a/packages/kokkos-kernels/src/sparse/impl/KokkosSparse_spiluk_numeric_impl.hpp
+++ b/packages/kokkos-kernels/src/sparse/impl/KokkosSparse_spiluk_numeric_impl.hpp
@@ -242,52 +242,54 @@ struct ILUKLvlSchedTP1NumericFunctor {
 
   KOKKOS_INLINE_FUNCTION
   void operator()(const member_type &team) const {
-    auto my_league = team.league_rank();  // map to rowid
-    auto rowid     = level_idx(my_league + lev_start);
-    auto my_team   = team.team_rank();
+    nnz_lno_t my_team = static_cast<nnz_lno_t>(team.league_rank());
+    nnz_lno_t rowid =
+        static_cast<nnz_lno_t>(level_idx(my_team + lev_start));  // map to rowid
 
-    auto k1 = L_row_map(rowid);
-    auto k2 = L_row_map(rowid + 1);
+    size_type k1 = static_cast<size_type>(L_row_map(rowid));
+    size_type k2 = static_cast<size_type>(L_row_map(rowid + 1));
 #ifdef KEEP_DIAG
     Kokkos::parallel_for(Kokkos::TeamThreadRange(team, k1, k2 - 1),
                          [&](const size_type k) {
-                           auto col           = L_entries(k);
-                           L_values(k)        = 0.0;
-                           iw(my_league, col) = k;
+                           nnz_lno_t col = static_cast<nnz_lno_t>(L_entries(k));
+                           L_values(k)   = 0.0;
+                           iw(my_team, col) = static_cast<nnz_lno_t>(k);
                          });
 #else
     Kokkos::parallel_for(Kokkos::TeamThreadRange(team, k1, k2),
                          [&](const size_type k) {
-                           auto col           = L_entries(k);
-                           L_values(k)        = 0.0;
-                           iw(my_league, col) = k;
+                           nnz_lno_t col = static_cast<nnz_lno_t>(L_entries(k));
+                           L_values(k)   = 0.0;
+                           iw(my_team, col) = static_cast<nnz_lno_t>(k);
                          });
 #endif
 
 #ifdef KEEP_DIAG
-    if (my_team == 0) L_values(k2 - 1) = scalar_t(1.0);
+    // if (my_thread == 0) L_values(k2 - 1) = scalar_t(1.0);
+    Kokkos::single(Kokkos::PerTeam(team),
+                   [&]() { L_values(k2 - 1) = scalar_t(1.0); });
 #endif
 
     team.team_barrier();
 
-    k1 = U_row_map(rowid);
-    k2 = U_row_map(rowid + 1);
+    k1 = static_cast<size_type>(U_row_map(rowid));
+    k2 = static_cast<size_type>(U_row_map(rowid + 1));
     Kokkos::parallel_for(Kokkos::TeamThreadRange(team, k1, k2),
                          [&](const size_type k) {
-                           auto col           = U_entries(k);
-                           U_values(k)        = 0.0;
-                           iw(my_league, col) = k;
+                           nnz_lno_t col = static_cast<nnz_lno_t>(U_entries(k));
+                           U_values(k)   = 0.0;
+                           iw(my_team, col) = static_cast<nnz_lno_t>(k);
                          });
 
     team.team_barrier();
 
     // Unpack the ith row of A
-    k1 = A_row_map(rowid);
-    k2 = A_row_map(rowid + 1);
+    k1 = static_cast<size_type>(A_row_map(rowid));
+    k2 = static_cast<size_type>(A_row_map(rowid + 1));
     Kokkos::parallel_for(Kokkos::TeamThreadRange(team, k1, k2),
                          [&](const size_type k) {
-                           auto col  = A_entries(k);
-                           auto ipos = iw(my_league, col);
+                           nnz_lno_t col = static_cast<nnz_lno_t>(A_entries(k));
+                           nnz_lno_t ipos = iw(my_team, col);
                            if (col < rowid)
                              L_values(ipos) = A_values(k);
                            else
@@ -297,20 +299,22 @@ struct ILUKLvlSchedTP1NumericFunctor {
     team.team_barrier();
 
     // Eliminate prev rows
-    k1 = L_row_map(rowid);
-    k2 = L_row_map(rowid + 1);
+    k1 = static_cast<size_type>(L_row_map(rowid));
+    k2 = static_cast<size_type>(L_row_map(rowid + 1));
 #ifdef KEEP_DIAG
-    for (auto k = k1; k < k2 - 1; ++k) {
+    for (size_type k = k1; k < k2 - 1; k++)
 #else
-    for (auto k = k1; k < k2; ++k) {
+    for (size_type k = k1; k < k2; k++)
 #endif
-      auto prev_row = L_entries(k);
+    {
+      nnz_lno_t prev_row = L_entries(k);
 #ifdef KEEP_DIAG
-      auto fact = L_values(k) / U_values(U_row_map(prev_row));
+      scalar_t fact = L_values(k) / U_values(U_row_map(prev_row));
 #else
-      auto fact = L_values(k) * U_values(U_row_map(prev_row));
+      scalar_t fact = L_values(k) * U_values(U_row_map(prev_row));
 #endif
-      if (my_team == 0) L_values(k) = fact;
+      // if (my_thread == 0) L_values(k) = fact;
+      Kokkos::single(Kokkos::PerTeam(team), [&]() { L_values(k) = fact; });
 
       team.team_barrier();
 
@@ -318,10 +322,10 @@ struct ILUKLvlSchedTP1NumericFunctor {
           Kokkos::TeamThreadRange(team, U_row_map(prev_row) + 1,
                                   U_row_map(prev_row + 1)),
           [&](const size_type kk) {
-            auto col  = U_entries(kk);
-            auto ipos = iw(my_league, col);
+            nnz_lno_t col  = static_cast<nnz_lno_t>(U_entries(kk));
+            nnz_lno_t ipos = iw(my_team, col);
+            auto lxu       = -U_values(kk) * fact;
             if (ipos != -1) {
-              auto lxu = -U_values(kk) * fact;
               if (col < rowid)
                 Kokkos::atomic_add(&L_values(ipos), lxu);
               else
@@ -332,40 +336,49 @@ struct ILUKLvlSchedTP1NumericFunctor {
       team.team_barrier();
     }  // end for k
 
-    if (my_team == 0) {
+    // if (my_thread == 0) {
+    Kokkos::single(Kokkos::PerTeam(team), [&]() {
+      nnz_lno_t ipos = iw(my_team, rowid);
 #ifdef KEEP_DIAG
-      if (U_values(iw(my_league, rowid)) == 0.0) {
-        U_values(iw(my_league, rowid)) = 1e6;
+      if (U_values(ipos) == 0.0) {
+        U_values(ipos) = 1e6;
       }
 #else
-      if (U_values(iw(my_league, rowid)) == 0.0) {
-        U_values(iw(my_league, rowid)) = 1e6;
+      if (U_values(ipos) == 0.0) {
+        U_values(ipos) = 1e6;
       } else {
-        U_values(iw(my_league, rowid)) = 1.0 / U_values(iw(my_league, rowid));
+        U_values(ipos) = 1.0 / U_values(ipos);
       }
 #endif
-    }
+    });
+    //}
 
     team.team_barrier();
 
     // Reset
-    k1 = L_row_map(rowid);
-    k2 = L_row_map(rowid + 1);
+    k1 = static_cast<size_type>(L_row_map(rowid));
+    k2 = static_cast<size_type>(L_row_map(rowid + 1));
 #ifdef KEEP_DIAG
-    Kokkos::parallel_for(
-        Kokkos::TeamThreadRange(team, k1, k2 - 1),
-        [&](const size_type k) { iw(my_league, L_entries(k)) = -1; });
+    Kokkos::parallel_for(Kokkos::TeamThreadRange(team, k1, k2 - 1),
+                         [&](const size_type k) {
+                           nnz_lno_t col = static_cast<nnz_lno_t>(L_entries(k));
+                           iw(my_team, col) = -1;
+                         });
 #else
-    Kokkos::parallel_for(
-        Kokkos::TeamThreadRange(team, k1, k2),
-        [&](const size_type k) { iw(my_league, L_entries(k)) = -1; });
+    Kokkos::parallel_for(Kokkos::TeamThreadRange(team, k1, k2),
+                         [&](const size_type k) {
+                           nnz_lno_t col = static_cast<nnz_lno_t>(L_entries(k));
+                           iw(my_team, col) = -1;
+                         });
 #endif
 
-    k1 = U_row_map(rowid);
-    k2 = U_row_map(rowid + 1);
-    Kokkos::parallel_for(
-        Kokkos::TeamThreadRange(team, k1, k2),
-        [&](const size_type k) { iw(my_league, U_entries(k)) = -1; });
+    k1 = static_cast<size_type>(U_row_map(rowid));
+    k2 = static_cast<size_type>(U_row_map(rowid + 1));
+    Kokkos::parallel_for(Kokkos::TeamThreadRange(team, k1, k2),
+                         [&](const size_type k) {
+                           nnz_lno_t col = static_cast<nnz_lno_t>(U_entries(k));
+                           iw(my_team, col) = -1;
+                         });
   }
 };
 
@@ -379,23 +392,17 @@ void iluk_numeric(IlukHandle &thandle, const ARowMapType &A_row_map,
                   LValuesType &L_values, const URowMapType &U_row_map,
                   const UEntriesType &U_entries, UValuesType &U_values) {
   using execution_space         = typename IlukHandle::execution_space;
-  using memory_space            = typename IlukHandle::memory_space;
   using size_type               = typename IlukHandle::size_type;
   using nnz_lno_t               = typename IlukHandle::nnz_lno_t;
   using HandleDeviceEntriesType = typename IlukHandle::nnz_lno_view_t;
-  using WorkViewType =
-      Kokkos::View<nnz_lno_t **, Kokkos::Device<execution_space, memory_space>>;
-  using LevelHostViewType = Kokkos::View<nnz_lno_t *, Kokkos::HostSpace>;
+  using WorkViewType            = typename IlukHandle::work_view_t;
+  using LevelHostViewType       = typename IlukHandle::nnz_lno_view_host_t;
 
   size_type nlevels = thandle.get_num_levels();
-  size_type nrows   = thandle.get_nrows();
 
   // Keep these as host View, create device version and copy back to host
-  HandleDeviceEntriesType level_ptr     = thandle.get_level_ptr();
-  HandleDeviceEntriesType level_idx     = thandle.get_level_idx();
-  HandleDeviceEntriesType level_nchunks = thandle.get_level_nchunks();
-  HandleDeviceEntriesType level_nrowsperchunk =
-      thandle.get_level_nrowsperchunk();
+  HandleDeviceEntriesType level_ptr = thandle.get_level_ptr();
+  HandleDeviceEntriesType level_idx = thandle.get_level_idx();
 
   // Make level_ptr_h a separate allocation, since it will be accessed on host
   // between kernel launches. If a mirror were used and level_ptr is in UVM
@@ -409,25 +416,13 @@ void iluk_numeric(IlukHandle &thandle, const ARowMapType &A_row_map,
       level_ptr.extent(0));
   Kokkos::deep_copy(level_ptr_h, level_ptr);
 
+  //{
   if (thandle.get_algorithm() ==
       KokkosSparse::Experimental::SPILUKAlgorithm::SEQLVLSCHD_TP1) {
-    level_nchunks_h = LevelHostViewType(
-        Kokkos::view_alloc(Kokkos::WithoutInitializing, "Host level nchunks"),
-        level_nchunks.extent(0));
-    level_nrowsperchunk_h =
-        LevelHostViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing,
-                                             "Host level nrowsperchunk"),
-                          level_nrowsperchunk.extent(0));
-    Kokkos::deep_copy(level_nchunks_h, level_nchunks);
-    Kokkos::deep_copy(level_nrowsperchunk_h, level_nrowsperchunk);
-    iw = WorkViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "iw"),
-                      thandle.get_level_maxrowsperchunk(), nrows);
-    Kokkos::deep_copy(iw, nnz_lno_t(-1));
-  } else {
-    iw = WorkViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "iw"),
-                      thandle.get_level_maxrows(), nrows);
-    Kokkos::deep_copy(iw, nnz_lno_t(-1));
+    level_nchunks_h       = thandle.get_level_nchunks();
+    level_nrowsperchunk_h = thandle.get_level_nrowsperchunk();
   }
+  iw = thandle.get_iw();
 
   // Main loop must be performed sequential. Question: Try out Cuda's graph
   // stuff to reduce kernel launch overhead
@@ -476,49 +471,13 @@ void iluk_numeric(IlukHandle &thandle, const ARowMapType &A_row_map,
           else
             Kokkos::parallel_for("parfor_l_team",
                                  policy_type(lvl_nrows_chunk, team_size), tstf);
-
+          Kokkos::fence();
           lvl_rowid_start += lvl_nrows_chunk;
         }
       }
-      //      /*
-      //      // TP2 algorithm has issues with some offset-ordinal combo to be
-      //      addressed else if ( thandle.get_algorithm() ==
-      //      KokkosSparse::Experimental::SPTRSVAlgorithm::SEQLVLSCHED_TP2 ) {
-      //        typedef Kokkos::TeamPolicy<execution_space> tvt_policy_type;
-      //
-      //        int team_size = thandle.get_team_size();
-      //        if ( team_size == -1 ) {
-      //          team_size = std::is_same< typename
-      //          Kokkos::DefaultExecutionSpace::memory_space, Kokkos::HostSpace
-      //          >::value ? 1 : 128;
-      //        }
-      //        int vector_size = thandle.get_team_size();
-      //        if ( vector_size == -1 ) {
-      //          vector_size = std::is_same< typename
-      //          Kokkos::DefaultExecutionSpace::memory_space, Kokkos::HostSpace
-      //          >::value ? 1 : 4;
-      //        }
-      //
-      //        // This impl: "chunk" lvl_nodes into node_groups; a league_rank
-      //        is responsible for processing that many nodes
-      //        //       TeamThreadRange over number of node_groups
-      //        //       To avoid masking threads, 1 thread (team) per node in
-      //        node_group
-      //        //       ThreadVectorRange responsible for the actual solve
-      //        computation const int node_groups = team_size;
-      //
-      //        LowerTriLvlSchedTP2SolverFunctor<RowMapType, EntriesType,
-      //        ValuesType, LHSType, RHSType, HandleDeviceEntriesType>
-      //        tstf(row_map, entries, values, lhs, rhs, nodes_grouped_by_level,
-      //        row_count, node_groups);
-      //        Kokkos::parallel_for("parfor_u_team_vector", tvt_policy_type(
-      //        (int)std::ceil((float)lvl_nodes/(float)node_groups) , team_size,
-      //        vector_size ), tstf);
-      //      } // end elseif
-      //      */
-
     }  // end if
   }    // end for lvl
+  //}
 
 // Output check
 #ifdef NUMERIC_OUTPUT_INFO
@@ -526,7 +485,7 @@ void iluk_numeric(IlukHandle &thandle, const ARowMapType &A_row_map,
 
   std::cout << "  nnzL: " << thandle.get_nnzL() << std::endl;
   std::cout << "  L_row_map = ";
-  for (size_type i = 0; i < nrows + 1; ++i) {
+  for (size_type i = 0; i < thandle.get_nrows() + 1; ++i) {
     std::cout << L_row_map(i) << " ";
   }
   std::cout << std::endl;
@@ -545,7 +504,7 @@ void iluk_numeric(IlukHandle &thandle, const ARowMapType &A_row_map,
 
   std::cout << "  nnzU: " << thandle.get_nnzU() << std::endl;
   std::cout << "  U_row_map = ";
-  for (size_type i = 0; i < nrows + 1; ++i) {
+  for (size_type i = 0; i < thandle.get_nrows() + 1; ++i) {
     std::cout << U_row_map(i) << " ";
   }
   std::cout << std::endl;
diff --git a/packages/kokkos-kernels/src/sparse/impl/KokkosSparse_spiluk_symbolic_impl.hpp b/packages/kokkos-kernels/src/sparse/impl/KokkosSparse_spiluk_symbolic_impl.hpp
index 90bb88e05709..691d6249639f 100644
--- a/packages/kokkos-kernels/src/sparse/impl/KokkosSparse_spiluk_symbolic_impl.hpp
+++ b/packages/kokkos-kernels/src/sparse/impl/KokkosSparse_spiluk_symbolic_impl.hpp
@@ -121,15 +121,15 @@ void level_sched(IlukHandle& thandle, const RowMapType row_map,
 
 // SEQLVLSCHD_TP1 algorithm (chunks)
 template <class IlukHandle, class RowMapType, class EntriesType,
-          class LevelType1, class LevelType2, class LevelType3, class size_type>
-void level_sched(IlukHandle& thandle, const RowMapType row_map,
-                 const EntriesType entries, LevelType1& level_list,
-                 LevelType2& level_ptr, LevelType2& level_idx,
-                 LevelType3& level_nchunks, LevelType3& level_nrowsperchunk,
-                 size_type& nlevels) {
+          class LevelType1, class LevelType2, class size_type>
+void level_sched_tp(IlukHandle& thandle, const RowMapType row_map,
+                    const EntriesType entries, LevelType1& level_list,
+                    LevelType2& level_ptr, LevelType2& level_idx,
+                    size_type& nlevels) {
   // Scheduling currently compute on host
 
-  using nnz_lno_t = typename IlukHandle::nnz_lno_t;
+  using nnz_lno_t           = typename IlukHandle::nnz_lno_t;
+  using nnz_lno_view_host_t = typename IlukHandle::nnz_lno_view_host_t;
 
   size_type nrows = thandle.get_nrows();
 
@@ -168,11 +168,10 @@ void level_sched(IlukHandle& thandle, const RowMapType row_map,
   level_ptr(0) = 0;
 
   // Find max rows, number of chunks, max rows of chunks across levels
-  using HostViewType =
-      Kokkos::View<nnz_lno_t*, Kokkos::LayoutLeft, Kokkos::HostSpace>;
-
-  HostViewType lnchunks("lnchunks", nlevels);
-  HostViewType lnrowsperchunk("lnrowsperchunk", nlevels);
+  thandle.alloc_level_nchunks(nlevels);
+  thandle.alloc_level_nrowsperchunk(nlevels);
+  nnz_lno_view_host_t lnchunks       = thandle.get_level_nchunks();
+  nnz_lno_view_host_t lnrowsperchunk = thandle.get_level_nrowsperchunk();
 
 #ifdef KOKKOS_ENABLE_CUDA
   using memory_space = typename IlukHandle::memory_space;
@@ -214,9 +213,6 @@ void level_sched(IlukHandle& thandle, const RowMapType row_map,
   thandle.set_num_levels(nlevels);
   thandle.set_level_maxrows(maxrows);
   thandle.set_level_maxrowsperchunk(maxrowsperchunk);
-
-  level_nchunks       = lnchunks;
-  level_nrowsperchunk = lnrowsperchunk;
 }
 
 // Linear Search for the smallest row index
@@ -326,7 +322,6 @@ void iluk_symbolic(IlukHandle& thandle,
     HostTmpViewType h_iw("h_iw", nrows);
     HostTmpViewType h_iL("h_iL", nrows);
     HostTmpViewType h_llev("h_llev", nrows);
-    HostTmpViewType level_nchunks, level_nrowsperchunk;
 
     size_type cntL = 0;
     size_type cntU = 0;
@@ -472,19 +467,13 @@ void iluk_symbolic(IlukHandle& thandle,
     // Level scheduling on L
     if (thandle.get_algorithm() ==
         KokkosSparse::Experimental::SPILUKAlgorithm::SEQLVLSCHD_TP1) {
-      level_sched(thandle, L_row_map, L_entries, level_list, level_ptr,
-                  level_idx, level_nchunks, level_nrowsperchunk, nlev);
-
-      thandle.alloc_level_nchunks(nlev);
-      thandle.alloc_level_nrowsperchunk(nlev);
-      HandleDeviceEntriesType dlevel_nchunks = thandle.get_level_nchunks();
-      HandleDeviceEntriesType dlevel_nrowsperchunk =
-          thandle.get_level_nrowsperchunk();
-      Kokkos::deep_copy(dlevel_nchunks, level_nchunks);
-      Kokkos::deep_copy(dlevel_nrowsperchunk, level_nrowsperchunk);
+      level_sched_tp(thandle, L_row_map, L_entries, level_list, level_ptr,
+                     level_idx, nlev);
+      thandle.alloc_iw(thandle.get_level_maxrowsperchunk(), nrows);
     } else {
       level_sched(thandle, L_row_map, L_entries, level_list, level_ptr,
                   level_idx, nlev);
+      thandle.alloc_iw(thandle.get_level_maxrows(), nrows);
     }
 
     Kokkos::deep_copy(dlevel_ptr, level_ptr);

From 48ed47d1620eac121a48b183f78e791c25565223 Mon Sep 17 00:00:00 2001
From: Michael Powell <micpowe@sandia.gov>
Date: Tue, 2 Aug 2022 15:46:26 -0600
Subject: [PATCH 043/130] Fix a deprecated call to Kokkos::parallel_scan

---
 packages/tpetra/core/src/Tpetra_Details_computeOffsets.hpp | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/tpetra/core/src/Tpetra_Details_computeOffsets.hpp b/packages/tpetra/core/src/Tpetra_Details_computeOffsets.hpp
index 193633f265dd..e0ccadd155fc 100644
--- a/packages/tpetra/core/src/Tpetra_Details_computeOffsets.hpp
+++ b/packages/tpetra/core/src/Tpetra_Details_computeOffsets.hpp
@@ -127,7 +127,7 @@ class ComputeOffsetsFromCounts {
     functor_type functor (offsets, counts);
     OffsetType total (0);
     const char funcName[] = "Tpetra::Details::computeOffsetsFromCounts";
-    Kokkos::parallel_scan (range, functor, total, funcName);
+    Kokkos::parallel_scan (funcName, range, functor, total);
     return total;
   }
 

From 2ae12f3976a2c2c6aabb329f71dc7d67e8d0201e Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 20 Jul 2022 12:15:38 -0600
Subject: [PATCH 044/130] MueLu: Updates to Ifpack2 smoother support for
 BlockCrs

---
 .../Smoothers/MueLu_Ifpack2Smoother_def.hpp   | 26 ++++++++++------
 .../unit_tests/Smoothers/Ifpack2Smoother.cpp  | 31 +++++++++++++++++--
 2 files changed, 45 insertions(+), 12 deletions(-)

diff --git a/packages/muelu/src/Smoothers/MueLu_Ifpack2Smoother_def.hpp b/packages/muelu/src/Smoothers/MueLu_Ifpack2Smoother_def.hpp
index 798209774e57..14357b2feba9 100644
--- a/packages/muelu/src/Smoothers/MueLu_Ifpack2Smoother_def.hpp
+++ b/packages/muelu/src/Smoothers/MueLu_Ifpack2Smoother_def.hpp
@@ -67,6 +67,7 @@
 #include <Xpetra_CrsMatrixWrap.hpp>
 #include <Xpetra_TpetraBlockCrsMatrix.hpp>
 #include <Xpetra_Matrix.hpp>
+#include <Xpetra_MatrixMatrix.hpp>
 #include <Xpetra_MultiVectorFactory.hpp>
 #include <Xpetra_TpetraMultiVector.hpp>
 
@@ -234,16 +235,21 @@ namespace MueLu {
         if(Acrs.is_null())
           throw std::runtime_error("Ifpack2Smoother: Cannot extract CrsMatrix from matrix A.");
         RCP<TpetraCrsMatrix> At = rcp_dynamic_cast<TpetraCrsMatrix>(Acrs);
-        if(At.is_null())
-          throw std::runtime_error("Ifpack2Smoother: Cannot extract TpetraCrsMatrix from matrix A.");
-
-        RCP<Tpetra::BlockCrsMatrix<Scalar, LO, GO, Node> > blockCrs = Tpetra::convertToBlockCrsMatrix(*At->getTpetra_CrsMatrix(),blocksize);
-        RCP<CrsMatrix> blockCrs_as_crs  = rcp(new TpetraBlockCrsMatrix(blockCrs));
-        RCP<CrsMatrixWrap> blockWrap = rcp(new CrsMatrixWrap(blockCrs_as_crs));
-        A_ = blockWrap;
-        this->GetOStream(Statistics0) << "Ifpack2Smoother: Using BlockCrsMatrix storage with blocksize "<<blocksize<<std::endl;
-
-        paramList.remove("smoother: use blockcrsmatrix storage");
+        if(At.is_null()) {
+          if(!Xpetra::Helpers<Scalar,LO,GO,Node>::isTpetraBlockCrs(matA))
+            throw std::runtime_error("Ifpack2Smoother: Cannot extract CrsMatrix or BlockCrsMatrix from matrix A.");          
+          this->GetOStream(Statistics0) << "Ifpack2Smoother: Using (native) BlockCrsMatrix storage with blocksize "<<blocksize<<std::endl;
+          paramList.remove("smoother: use blockcrsmatrix storage");
+        }
+        else {
+          RCP<Tpetra::BlockCrsMatrix<Scalar, LO, GO, Node> > blockCrs = Tpetra::convertToBlockCrsMatrix(*At->getTpetra_CrsMatrix(),blocksize);
+          RCP<CrsMatrix> blockCrs_as_crs  = rcp(new TpetraBlockCrsMatrix(blockCrs));
+          RCP<CrsMatrixWrap> blockWrap = rcp(new CrsMatrixWrap(blockCrs_as_crs));
+          A_ = blockWrap;
+          this->GetOStream(Statistics0) << "Ifpack2Smoother: Using BlockCrsMatrix storage with blocksize "<<blocksize<<std::endl;
+          
+          paramList.remove("smoother: use blockcrsmatrix storage");
+        }
       }
     }
 
diff --git a/packages/muelu/test/unit_tests/Smoothers/Ifpack2Smoother.cpp b/packages/muelu/test/unit_tests/Smoothers/Ifpack2Smoother.cpp
index eb8d11f54ba0..81bcf614654e 100644
--- a/packages/muelu/test/unit_tests/Smoothers/Ifpack2Smoother.cpp
+++ b/packages/muelu/test/unit_tests/Smoothers/Ifpack2Smoother.cpp
@@ -567,7 +567,7 @@ namespace MueLuTests {
   } // banded
 
 
- TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(Ifpack2Smoother, BlockCrsMatrix_Relaxation, Scalar, LocalOrdinal, GlobalOrdinal, Node)
+ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(Ifpack2Smoother, BlockCrsMatrix_Relaxation_ViaPoint, Scalar, LocalOrdinal, GlobalOrdinal, Node)
   {
 #   include <MueLu_UseShortNames.hpp>
     MUELU_TESTING_SET_OSTREAM;
@@ -592,6 +592,32 @@ namespace MueLuTests {
     }
   }
 
+ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(Ifpack2Smoother, BlockCrsMatrix_Relaxation_AsBlock, Scalar, LocalOrdinal, GlobalOrdinal, Node)
+  {
+#   include <MueLu_UseShortNames.hpp>
+    MUELU_TESTING_SET_OSTREAM;
+    MUELU_TESTING_LIMIT_SCOPE(Scalar,GlobalOrdinal,Node);
+
+    MUELU_TEST_ONLY_FOR(Xpetra::UseTpetra) {
+      Teuchos::ParameterList matrixParams, ifpack2Params;
+
+      matrixParams.set("matrixType","Laplace1D");
+      matrixParams.set("nx",(GlobalOrdinal)20);// needs to be even
+
+      RCP<Matrix> A = TestHelpers::TpetraTestFactory<SC, LO, GO, NO>::BuildBlockMatrix(matrixParams,Xpetra::UseTpetra);     
+      ifpack2Params.set("smoother: use blockcrsmatrix storage",true);
+      
+      Ifpack2Smoother smoother("RELAXATION",ifpack2Params);
+      
+      Level level; TestHelpers::TestFactory<SC,LO,GO,NO>::createSingleLevelHierarchy(level);
+      level.Set("A", A);
+      smoother.Setup(level);
+
+      TEST_EQUALITY(1,1);
+    }
+  }
+
+
 
 
 #define MUELU_ETI_GROUP(SC,LO,GO,NO) \
@@ -605,7 +631,8 @@ namespace MueLuTests {
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Ifpack2Smoother,BandedRelaxation,SC,LO,GO,NO) \
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Ifpack2Smoother,TriDiRelaxation,SC,LO,GO,NO) \
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Ifpack2Smoother,BlockRelaxation_Autosize,SC,LO,GO,NO) \
-  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Ifpack2Smoother,BlockCrsMatrix_Relaxation,SC,LO,GO,NO)
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Ifpack2Smoother,BlockCrsMatrix_Relaxation_ViaPoint,SC,LO,GO,NO) \
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Ifpack2Smoother,BlockCrsMatrix_Relaxation_AsBlock,SC,LO,GO,NO)
 
 #include <MueLu_ETI_4arg.hpp>
 

From cc78ad3eb423228fdae75f6780e80496382ffa77 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 20 Jul 2022 13:35:53 -0600
Subject: [PATCH 045/130] MueLu: Renaming test

---
 packages/muelu/test/unit_tests/Hierarchy.cpp | 6 ++++--
 1 file changed, 4 insertions(+), 2 deletions(-)

diff --git a/packages/muelu/test/unit_tests/Hierarchy.cpp b/packages/muelu/test/unit_tests/Hierarchy.cpp
index 1a8c92841ed7..dd605c6de360 100644
--- a/packages/muelu/test/unit_tests/Hierarchy.cpp
+++ b/packages/muelu/test/unit_tests/Hierarchy.cpp
@@ -1672,7 +1672,7 @@ namespace MueLuTests {
 
   }
 
-  TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(Hierarchy, BlockCrs, Scalar, LocalOrdinal, GlobalOrdinal, Node)
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(Hierarchy, BlockCrs_Mixed, Scalar, LocalOrdinal, GlobalOrdinal, Node)
   {
 #   include <MueLu_UseShortNames.hpp>
     MUELU_TESTING_SET_OSTREAM;
@@ -1789,6 +1789,7 @@ namespace MueLuTests {
     TEST_EQUALITY(0,0);
   }
 
+
   TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(Hierarchy, CheckNullspaceDimension, Scalar, LocalOrdinal, GlobalOrdinal, Node)
   {
     // Test that HierarchyManager throws if user-supplied nullspace has dimension smaller than numPDEs
@@ -1835,7 +1836,8 @@ namespace MueLuTests {
     TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, SetupHierarchy3levelFacManagers, Scalar, LO, GO, Node) \
     TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, SetupHierarchyTestBreakCondition, Scalar, LO, GO, Node) \
     TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, Write, Scalar, LO, GO, Node) \
-    TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, BlockCrs, Scalar, LO, GO, Node) \
+    TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, BlockCrs_Mixed, Scalar, LO, GO, Node) \
+    TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, BlockCrs_Pure, Scalar, LO, GO, Node) \
     TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, CheckNullspaceDimension, Scalar, LO, GO, Node) \
     
 
From 1eaa68b81eefb8ae56b80972c771a51fa3700099 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 21 Jul 2022 15:43:22 -0600
Subject: [PATCH 046/130] MueLu: Fixing error

---
 packages/muelu/test/unit_tests/Hierarchy.cpp | 1 -
 1 file changed, 1 deletion(-)

diff --git a/packages/muelu/test/unit_tests/Hierarchy.cpp b/packages/muelu/test/unit_tests/Hierarchy.cpp
index dd605c6de360..6132086accfb 100644
--- a/packages/muelu/test/unit_tests/Hierarchy.cpp
+++ b/packages/muelu/test/unit_tests/Hierarchy.cpp
@@ -1837,7 +1837,6 @@ namespace MueLuTests {
     TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, SetupHierarchyTestBreakCondition, Scalar, LO, GO, Node) \
     TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, Write, Scalar, LO, GO, Node) \
     TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, BlockCrs_Mixed, Scalar, LO, GO, Node) \
-    TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, BlockCrs_Pure, Scalar, LO, GO, Node) \
     TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(Hierarchy, CheckNullspaceDimension, Scalar, LO, GO, Node) \
     
 
From 9c03dac56941e40608053054f850163263bc85f4 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 21 Jul 2022 16:12:31 -0600
Subject: [PATCH 047/130] MueLu: Making progress

---
 .../test/unit_tests/MueLu_TestHelpers.hpp     | 14 +++++
 .../ParameterListInterpreter.cpp              | 52 ++++++++++++++++++-
 .../ParameterListInterpreter/BlockCrs1.xml    | 28 ++++++++++
 .../ParameterListInterpreter/CMakeLists.txt   |  1 +
 4 files changed, 93 insertions(+), 2 deletions(-)
 create mode 100644 packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs1.xml

diff --git a/packages/muelu/test/unit_tests/MueLu_TestHelpers.hpp b/packages/muelu/test/unit_tests/MueLu_TestHelpers.hpp
index 4bd0c652af14..a6f3e9af16c9 100644
--- a/packages/muelu/test/unit_tests/MueLu_TestHelpers.hpp
+++ b/packages/muelu/test/unit_tests/MueLu_TestHelpers.hpp
@@ -881,10 +881,24 @@ namespace MueLuTests {
          basematrix[4] = two;
          basematrix[7] = three;
          basematrix[8] = two;
+         Teuchos::Array<Scalar> offmatrix(blocksize*blocksize, zero);
+         offmatrix[0]=offmatrix[4]=offmatrix[8]=-1;
+
          Teuchos::Array<LocalOrdinal> lclColInds(1);
          for (LocalOrdinal lclRowInd = meshRowMap.getMinLocalIndex (); lclRowInd <= meshRowMap.getMaxLocalIndex(); ++lclRowInd) {
            lclColInds[0] = lclRowInd;
            bcrsmatrix->replaceLocalValues(lclRowInd, lclColInds.getRawPtr(), &basematrix[0], 1);
+           
+           // Off diagonals
+           if(lclRowInd > meshRowMap.getMinLocalIndex ()) {
+             lclColInds[0] = lclRowInd - 1;
+             bcrsmatrix->replaceLocalValues(lclRowInd, lclColInds.getRawPtr(), &offmatrix[0], 1);
+           }
+           if(lclRowInd < meshRowMap.getMaxLocalIndex ()) {
+             lclColInds[0] = lclRowInd + 1;
+             bcrsmatrix->replaceLocalValues(lclRowInd, lclColInds.getRawPtr(), &offmatrix[0], 1);
+           }
+
          }
 
          RCP<Xpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > temp = rcp(new Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>(bcrsmatrix));
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
index a0f0ada4b9b7..75efcd51a3f8 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
@@ -43,8 +43,8 @@
 // ***********************************************************************
 //
 // @HEADER
-
 #include <Teuchos_UnitTestHarness.hpp>
+#include <Teuchos_ParameterList.hpp>
 #include <Teuchos_XMLParameterListHelpers.hpp>
 
 #include <MueLu_TestHelpers.hpp>
@@ -52,6 +52,8 @@
 #include <MueLu_ParameterListInterpreter.hpp>
 #include <MueLu_Exceptions.hpp>
 
+#include <Xpetra_IO.hpp>
+
 namespace MueLuTests {
 
   TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, SetParameterList, Scalar, LocalOrdinal, GlobalOrdinal, Node)
@@ -67,6 +69,10 @@ namespace MueLuTests {
     ArrayRCP<std::string> fileList = TestHelpers::GetFileList(std::string("ParameterList/ParameterListInterpreter/"), std::string(".xml"));
 
     for(int i=0; i< fileList.size(); i++) {
+      // Ignore files with "BlockCrs" in their name
+      auto found = fileList[i].find("BlockCrs");
+      if(found != std::string::npos) continue;
+
       out << "Processing file: " << fileList[i] << std::endl;
       ParameterListInterpreter mueluFactory("ParameterList/ParameterListInterpreter/" + fileList[i],*comm);
 
@@ -83,8 +89,50 @@ namespace MueLuTests {
     out << "Skipping test because some required packages are not enabled (Tpetra, Epetra, EpetraExt, Ifpack, Ifpack2, Amesos, Amesos2)." << std::endl;
 #   endif
   }
+
+
+TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, BlockCrs, Scalar, LocalOrdinal, GlobalOrdinal, Node)
+  {
+#   include <MueLu_UseShortNames.hpp>
+    MUELU_TESTING_SET_OSTREAM;
+    MUELU_TESTING_LIMIT_SCOPE(Scalar,GlobalOrdinal,Node);
+#if defined(HAVE_MUELU_TPETRA)
+    MUELU_TEST_ONLY_FOR(Xpetra::UseTpetra) {
+      Teuchos::ParameterList matrixParams;
+      matrixParams.set("matrixType","Laplace1D");
+      matrixParams.set("nx",(GlobalOrdinal)300);// needs to be even
+
+      RCP<Matrix> A = TestHelpers::TpetraTestFactory<SC, LO, GO, NO>::BuildBlockMatrix(matrixParams,Xpetra::UseTpetra);  
+      out<<"Matrix Size = "<<A->getGlobalNumRows()<<std::endl;
+
+      RCP<const Teuchos::Comm<int> > comm = TestHelpers::Parameters::getDefaultComm();
+      
+      ArrayRCP<std::string> fileList = TestHelpers::GetFileList(std::string("ParameterList/ParameterListInterpreter/"), std::string(".xml"));
+      
+      for(int i=0; i< fileList.size(); i++) {
+        // Only run files with "BlockCrs" in their name
+        auto found = fileList[i].find("BlockCrs");
+        if(found == std::string::npos) continue;
+
+        out << "Processing file: " << fileList[i] << std::endl;
+        ParameterListInterpreter mueluFactory("ParameterList/ParameterListInterpreter/" + fileList[i],*comm);
+        
+        RCP<Hierarchy> H = mueluFactory.CreateHierarchy();
+        H->GetLevel(0)->Set("A", A);
+        
+        mueluFactory.SetupHierarchy(*H);
+        
+        //TODO: check no unused parameters
+        //TODO: check results of Iterate()
+      }
+    }
+#   endif
+    TEST_EQUALITY(1,1);
+  }
+
 #define MUELU_ETI_GROUP(Scalar, LocalOrdinal, GlobalOrdinal, Node) \
-  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(ParameterListInterpreter, SetParameterList, Scalar, LocalOrdinal, GlobalOrdinal, Node)
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(ParameterListInterpreter, SetParameterList, Scalar, LocalOrdinal, GlobalOrdinal, Node) \
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(ParameterListInterpreter, BlockCrs, Scalar, LocalOrdinal, GlobalOrdinal, Node)
 
 #include <MueLu_ETI_4arg.hpp>
 
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs1.xml b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs1.xml
new file mode 100644
index 000000000000..5d16af3fb045
--- /dev/null
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs1.xml
@@ -0,0 +1,28 @@
+<ParameterList name="MueLu">
+
+  <!--
+    For a generic symmetric scalar problem, these are the recommended settings for MueLu.
+  -->
+
+  <!-- ===========  GENERAL ================ -->
+    <Parameter        name="verbosity"                            type="string"   value="high"/>
+
+    <Parameter        name="coarse: max size"                     type="int"      value="50"/>
+
+    <Parameter        name="multigrid algorithm"                  type="string"   value="unsmoothed"/>
+
+    <Parameter        name="max levels"                	          type="int"      value="2"/>
+
+    <!-- This is hardwired in the test generator -->
+    <Parameter        name="number of equations"                  type="int"      value="3"/>
+
+    <Parameter        name="smoother: type"                       type="string"  value="RELAXATION"/>
+    <Parameter        name="coarse: type"                         type="string"  value="RELAXATION"/>
+
+    <!-- end of default values -->
+
+    <!-- ===========  REPARTITIONING  =========== -->
+    <Parameter        name="repartition: enable"                  type="bool"     value="false"/>
+    <!-- end of default values -->
+
+</ParameterList>
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/CMakeLists.txt b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/CMakeLists.txt
index 8e56cda05351..b7b40f9fac60 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/CMakeLists.txt
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/CMakeLists.txt
@@ -3,6 +3,7 @@
 # regenerate a build system incorporating the new file.
 # YOU MUST ALSO TOUCH A CMAKE CONFIGURATION FILE WHEN YOU PUSH THE NEW
 # FILE TO FORCE THE RECONFIGURE ON OTHER PEOPLE'S BUILDS.
+
 FILE(GLOB xmlFiles RELATIVE ${CMAKE_CURRENT_SOURCE_DIR} *.xml)
 
 TRIBITS_COPY_FILES_TO_BINARY_DIR(ParameterList_ParameterListInterpreter_cp

From 2c4bb66c1e82acee2dc094c03acc957df4d4f318 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 25 Jul 2022 10:32:35 -0600
Subject: [PATCH 048/130] Xpetra: Adding more BlockCrs support

---
 packages/xpetra/sup/Utils/Xpetra_IO.hpp       | 16 ++++
 .../sup/Utils/Xpetra_TripleMatrixMultiply.hpp | 85 +++++++++++++------
 2 files changed, 77 insertions(+), 24 deletions(-)

diff --git a/packages/xpetra/sup/Utils/Xpetra_IO.hpp b/packages/xpetra/sup/Utils/Xpetra_IO.hpp
index 364b6743fdb4..0194de90bf59 100644
--- a/packages/xpetra/sup/Utils/Xpetra_IO.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_IO.hpp
@@ -313,6 +313,14 @@ namespace Xpetra {
         Tpetra::MatrixMarket::Writer<Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >::writeSparseFile(fileName, A);
         return;
       }
+      const RCP<const Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >& tmp_BlockCrs = 
+        Teuchos::rcp_dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >(tmp_CrsMtx);
+      if(tmp_BlockCrs != Teuchos::null) {
+        std::ofstream outstream (fileName,std::ofstream::out);
+        Teuchos::FancyOStream ofs(Teuchos::rcpFromRef(outstream));
+        tmp_BlockCrs->getTpetra_BlockCrsMatrix()->describe(ofs,Teuchos::VERB_EXTREME);        
+      }
+
 #endif // HAVE_XPETRA_TPETRA
 
       throw Exceptions::BadCast("Could not cast to EpetraCrsMatrix or TpetraCrsMatrix in matrix writing");
@@ -1037,6 +1045,14 @@ namespace Xpetra {
         Tpetra::MatrixMarket::Writer<Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >::writeSparseFile(fileName, A);
         return;
       }
+      const RCP<const Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >& tmp_BlockCrs = 
+        Teuchos::rcp_dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >(tmp_CrsMtx);
+      if(tmp_BlockCrs != Teuchos::null) {
+        std::ofstream outstream (fileName,std::ofstream::out);
+        Teuchos::FancyOStream ofs(Teuchos::rcpFromRef(outstream));
+        tmp_BlockCrs->getTpetra_BlockCrsMatrix()->describe(ofs,Teuchos::VERB_EXTREME);
+      }
+
 # endif
 #endif // HAVE_XPETRA_TPETRA
 
diff --git a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
index 3b5798fc62ce..afae82935439 100644
--- a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
@@ -126,14 +126,26 @@ namespace Xpetra {
         throw(Xpetra::Exceptions::RuntimeError("Xpetra::TripleMatrixMultiply::MultiplyRAP is only implemented for Tpetra"));
       } else if (Ac.getRowMap()->lib() == Xpetra::UseTpetra) {
 #ifdef HAVE_XPETRA_TPETRA
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpR = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(R);
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpA = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(A);
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpP = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(P);
-        Tpetra::CrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraCrs(Ac);
-
-        // 18Feb2013 JJH I'm reenabling the code that allows the matrix matrix multiply to do the fillComplete.
-        // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
-        Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
+        using helpers = Xpetra::Helpers<SC,LO,GO,NO>;
+        if(helpers::isTpetraCrs(R) && helpers::isTpetraCrs(A) && helpers::isTpetraCrs(P)) {
+          // All matrices are Crs
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpR = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(R);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpA = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(A);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpP = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(P);
+          Tpetra::CrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraCrs(Ac);
+          
+          // 18Feb2013 JJH I'm reenabling the code that allows the matrix matrix multiply to do the fillComplete.
+          // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
+          Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
+        }
+        else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
+          // All matrices are BlockCrs
+          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+        }
+        else {
+          // Mix and match
+          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "Mix-and-match Crs/BlockCrs Multiply not currently supported");      
+        }            
 #else
         throw(Xpetra::Exceptions::RuntimeError("Xpetra must be compiled with Tpetra."));
 #endif
@@ -215,14 +227,26 @@ namespace Xpetra {
       (!defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_SERIAL) || !defined(HAVE_TPETRA_INST_INT_INT))))
         throw(Xpetra::Exceptions::RuntimeError("Xpetra must be compiled with Tpetra <double,int,int> ETI enabled."));
 # else
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpR = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(R);
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpA = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(A);
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpP = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(P);
-        Tpetra::CrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraCrs(Ac);
-
-        // 18Feb2013 JJH I'm reenabling the code that allows the matrix matrix multiply to do the fillComplete.
-        // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
-        Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
+        using helpers = Xpetra::Helpers<SC,LO,GO,NO>;
+        if(helpers::isTpetraCrs(R) && helpers::isTpetraCrs(A) && helpers::isTpetraCrs(P)) {
+          // All matrices are Crs
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpR = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(R);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpA = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(A);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpP = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(P);
+          Tpetra::CrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraCrs(Ac);
+          
+          // 18Feb2013 JJH I'm reenabling the code that allows the matrix matrix multiply to do the fillComplete.
+          // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
+          Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
+        }
+        else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
+          // All matrices are BlockCrs
+          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+        }
+        else {
+          // Mix and match
+          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "Mix-and-match Crs/BlockCrs Multiply not currently supported");      
+        }              
 # endif
 #else
         throw(Xpetra::Exceptions::RuntimeError("Xpetra must be compiled with Tpetra."));
@@ -303,14 +327,27 @@ namespace Xpetra {
       (!defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_SERIAL) || !defined(HAVE_TPETRA_INST_INT_LONG_LONG))))
         throw(Xpetra::Exceptions::RuntimeError("Xpetra must be compiled with Tpetra <double,int,long long,EpetraNode> ETI enabled."));
 # else
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpR = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(R);
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpA = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(A);
-        const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpP = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(P);
-        Tpetra::CrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraCrs(Ac);
-
-        // 18Feb2013 JJH I'm reenabling the code that allows the matrix matrix multiply to do the fillComplete.
-        // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
-        Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
+        using helpers = Xpetra::Helpers<SC,LO,GO,NO>;
+        if(helpers::isTpetraCrs(R) && helpers::isTpetraCrs(A) && helpers::isTpetraCrs(P)) {
+          // All matrices are Crs
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpR = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(R);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpA = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(A);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpP = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(P);
+          Tpetra::CrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraCrs(Ac);
+          
+          // 18Feb2013 JJH I'm reenabling the code that allows the matrix matrix multiply to do the fillComplete.
+          // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
+          Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
+        }
+        else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
+          // All matrices are BlockCrs
+          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+        }
+        else {
+          // Mix and match
+          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "Mix-and-match Crs/BlockCrs Multiply not currently supported");      
+        }    
+
 # endif
 #else
         throw(Xpetra::Exceptions::RuntimeError("Xpetra must be compiled with Tpetra."));

From 01db25d447005b7de2f7dabf439aa0a6453f851d Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 25 Jul 2022 10:32:50 -0600
Subject: [PATCH 049/130] MueLu: Adding more BlockCrs support

---
 .../MueLu_TentativePFactory_def.hpp                  | 12 +++++++++++-
 1 file changed, 11 insertions(+), 1 deletion(-)

diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index c5d76496c439..8efa35141b1d 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -50,6 +50,7 @@
 #include <Xpetra_Map.hpp>
 #include <Xpetra_CrsMatrix.hpp>
 #include <Xpetra_Matrix.hpp>
+#include <Xpetra_MatrixMatrix.hpp>
 #include <Xpetra_MultiVector.hpp>
 #include <Xpetra_MultiVectorFactory.hpp>
 #include <Xpetra_VectorFactory.hpp>
@@ -157,7 +158,16 @@ namespace MueLu {
       Set<RCP<const Teuchos::Comm<int> > >(coarseLevel, "Node Comm", nodeComm);
     }
 
-    TEUCHOS_TEST_FOR_EXCEPTION(A->getRowMap()->getLocalNumElements() != fineNullspace->getMap()->getLocalNumElements(),
+   if(A->IsView("stridedMaps")==true) 
+     printf("striedMaps = true\n");
+
+    size_t num_rows = A->getRowMap()->getLocalNumElements();
+#ifdef HAVE_XPETRA_TPETRA
+    if(Xpetra::Helpers<Scalar,LO,GO,NO>::isTpetraBlockCrs(A))
+      num_rows *= A->GetFixedBlockSize();
+#endif
+
+    TEUCHOS_TEST_FOR_EXCEPTION(num_rows != fineNullspace->getMap()->getLocalNumElements(),
 			       Exceptions::RuntimeError,"MueLu::TentativePFactory::MakeTentative: Size mismatch between A and Nullspace");
 
     RCP<Matrix>                Ptentative;

From f64144302760cac63060381d66299490fe225772 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 26 Jul 2022 15:44:13 -0600
Subject: [PATCH 050/130] MueLu: Next steps towards a BlockCrs P

---
 .../MueLu_AmalgamationInfo_decl.hpp           |   2 +-
 .../MueLu_AmalgamationInfo_def.hpp            |   6 +-
 .../MueLu_TentativePFactory_decl.hpp          |   3 +
 .../MueLu_TentativePFactory_def.hpp           | 538 ++++++++++++++++--
 4 files changed, 502 insertions(+), 47 deletions(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_decl.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_decl.hpp
index 84c747dcc870..9a36632e158d 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_decl.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_decl.hpp
@@ -133,7 +133,7 @@ namespace MueLu {
       Puts all dofs for aggregate \c i in aggToRowMap[\c i].  Also calculate aggregate sizes.
     */
     void UnamalgamateAggregates(const Aggregates& aggregates, Teuchos::ArrayRCP<LocalOrdinal>& aggStart, Teuchos::ArrayRCP<GlobalOrdinal>& aggToRowMap) const;
-    void UnamalgamateAggregatesLO(const Aggregates& aggregates, Teuchos::ArrayRCP<LocalOrdinal>& aggStart, Teuchos::ArrayRCP<LO>& aggToRowMap) const;
+    void UnamalgamateAggregatesLO(const Aggregates& aggregates, Teuchos::ArrayRCP<LocalOrdinal>& aggStart, Teuchos::ArrayRCP<LO>& aggToRowMap, bool stay_amalgamated=false) const;
 
     /*! @brief ComputeUnamalgamatedImportDofMap
      * build overlapping dof row map from aggregates needed for overlapping null space
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_def.hpp
index 9bd4b73d1169..226179687a70 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_def.hpp
@@ -132,7 +132,7 @@ namespace MueLu {
 
   template <class LocalOrdinal, class GlobalOrdinal, class Node>
   void AmalgamationInfo<LocalOrdinal, GlobalOrdinal, Node>::UnamalgamateAggregatesLO(const Aggregates& aggregates,
-        Teuchos::ArrayRCP<LO>& aggStart, Teuchos::ArrayRCP<LO>& aggToRowMap) const {
+                      Teuchos::ArrayRCP<LO>& aggStart, Teuchos::ArrayRCP<LO>& aggToRowMap, bool stay_amalgamated) const {
 
     int myPid = aggregates.GetMap()->getComm()->getRank();
     Teuchos::ArrayView<const GO> nodeGlobalElts = aggregates.GetMap()->getLocalElementList();
@@ -146,7 +146,7 @@ namespace MueLu {
     const LO size = procWinner.size();
 
     std::vector<LO> sizes(numAggregates);
-    if (stridedblocksize_ == 1) {
+    if (stay_amalgamated || stridedblocksize_ == 1) {
       for (LO lnode = 0; lnode < size; lnode++)
         if (procWinner[lnode] == myPid)
           sizes[vertex2AggId[lnode]]++;
@@ -172,7 +172,7 @@ namespace MueLu {
 
     // count, how many dofs have been recorded for each aggregate so far
     Array<LO> numDofs(numAggregates, 0); // empty array with number of DOFs for each aggregate
-    if (stridedblocksize_ == 1) {
+    if (stay_amalgamated || stridedblocksize_ == 1) {
       for (LO lnode = 0; lnode < size; ++lnode)
         if (procWinner[lnode] == myPid) {
           LO myAgg = vertex2AggId[lnode];
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_decl.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_decl.hpp
index 24673877c7e6..2cce10e7d3e3 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_decl.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_decl.hpp
@@ -50,6 +50,7 @@
 #include <Teuchos_SerialDenseMatrix.hpp>
 #include <Teuchos_SerialQRDenseSolver.hpp>
 
+#include <Xpetra_CrsGraphFactory_fwd.hpp>
 #include <Xpetra_CrsMatrix_fwd.hpp>
 #include <Xpetra_Matrix_fwd.hpp>
 #include <Xpetra_MultiVector_fwd.hpp>
@@ -157,6 +158,8 @@ template <class Scalar = DefaultScalar,
                          RCP<const Map> coarseMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const;
     void BuildPcoupled  (RCP<Matrix> A, RCP<Aggregates> aggregates, RCP<AmalgamationInfo> amalgInfo, RCP<MultiVector> fineNullspace,
                          RCP<const Map> coarseMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace) const;
+    void BuildPuncoupledBlockCrs(RCP<Matrix> A, RCP<Aggregates> aggregates, RCP<AmalgamationInfo> amalgInfo, RCP<MultiVector> fineNullspace,
+                         RCP<const Map> coarseMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const;
 
     mutable bool bTransferCoordinates_ = false;
 
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index 8efa35141b1d..b10f34826283 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -49,6 +49,7 @@
 #include <Xpetra_MapFactory.hpp>
 #include <Xpetra_Map.hpp>
 #include <Xpetra_CrsMatrix.hpp>
+#include <Xpetra_CrsGraphFactory.hpp>
 #include <Xpetra_Matrix.hpp>
 #include <Xpetra_MatrixMatrix.hpp>
 #include <Xpetra_MultiVector.hpp>
@@ -59,6 +60,12 @@
 #include <Xpetra_CrsMatrixWrap.hpp>
 #include <Xpetra_StridedMap.hpp>
 #include <Xpetra_StridedMapFactory.hpp>
+#include <Xpetra_IO.hpp>
+
+#ifdef HAVE_MUELU_TPETRA
+#include "Xpetra_TpetraBlockCrsMatrix.hpp"
+//#include "Tpetra_BlockCrsMatrix.hpp"
+#endif
 
 #include "MueLu_TentativePFactory_decl.hpp"
 
@@ -72,6 +79,9 @@
 #include "MueLu_PerfUtils.hpp"
 #include "MueLu_Utilities.hpp"
 
+
+
+
 namespace MueLu {
 
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
@@ -158,16 +168,8 @@ namespace MueLu {
       Set<RCP<const Teuchos::Comm<int> > >(coarseLevel, "Node Comm", nodeComm);
     }
 
-   if(A->IsView("stridedMaps")==true) 
-     printf("striedMaps = true\n");
-
-    size_t num_rows = A->getRowMap()->getLocalNumElements();
-#ifdef HAVE_XPETRA_TPETRA
-    if(Xpetra::Helpers<Scalar,LO,GO,NO>::isTpetraBlockCrs(A))
-      num_rows *= A->GetFixedBlockSize();
-#endif
-
-    TEUCHOS_TEST_FOR_EXCEPTION(num_rows != fineNullspace->getMap()->getLocalNumElements(),
+    // NOTE:  We check DomainMap here rather than RowMap because those are different for BlockCrs matrices
+    TEUCHOS_TEST_FOR_EXCEPTION( A->getDomainMap()->getLocalNumElements() != fineNullspace->getMap()->getLocalNumElements(),
 			       Exceptions::RuntimeError,"MueLu::TentativePFactory::MakeTentative: Size mismatch between A and Nullspace");
 
     RCP<Matrix>                Ptentative;
@@ -235,10 +237,16 @@ namespace MueLu {
       }
     }
 
-    if (!aggregates->AggregatesCrossProcessors())
-      BuildPuncoupled(A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace,coarseLevel.GetLevelID());
+    if (!aggregates->AggregatesCrossProcessors()) {
+      if(Xpetra::Helpers<SC,LO,GO,NO>::isTpetraBlockCrs(A)) {
+        BuildPuncoupledBlockCrs(A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace,coarseLevel.GetLevelID());
+      }
+      else {
+        BuildPuncoupled(A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace,coarseLevel.GetLevelID());
+      }
+    }
     else
-      BuildPcoupled  (A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace);
+      BuildPcoupled(A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace);
 
     // If available, use striding information of fine level matrix A for range
     // map and coarseMap as domain map; otherwise use plain range map of
@@ -268,12 +276,14 @@ namespace MueLu {
 
   template <class Scalar,class LocalOrdinal, class GlobalOrdinal, class Node>
   void TentativePFactory<Scalar, LocalOrdinal, GlobalOrdinal, Node>::
-  BuildPuncoupled(RCP<Matrix> A, RCP<Aggregates> aggregates, RCP<AmalgamationInfo> amalgInfo, RCP<MultiVector> fineNullspace,
-                RCP<const Map> coarseMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const {
-    RCP<const Map> rowMap = A->getRowMap();
-    RCP<const Map> colMap = A->getColMap();
-
-    const size_t numRows   = rowMap->getLocalNumElements();
+  BuildPuncoupledBlockCrs(RCP<Matrix> A, RCP<Aggregates> aggregates, RCP<AmalgamationInfo> amalgInfo, RCP<MultiVector> fineNullspace,
+                          RCP<const Map> coarsePointMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const {
+#ifdef HAVE_MUELU_TPETRA
+    RCP<const Map> rowMap     = A->getRowMap();
+    RCP<const Map> rangeMap   = A->getRangeMap();
+    RCP<const Map> colMap     = A->getColMap();
+    const size_t numFinePointRows = rangeMap->getLocalNumElements();
+    const size_t numFineBlockRows = rowMap->getLocalNumElements();
 
     typedef Teuchos::ScalarTraits<SC> STS;
     typedef typename STS::magnitudeType Magnitude;
@@ -285,6 +295,21 @@ namespace MueLu {
     const size_t NSDim     = fineNullspace->getNumVectors();
     ArrayRCP<LO> aggSizes  = aggregates->ComputeAggregateSizes();
 
+    printf("A # point rows = %d #  block rows = %d\n",(int)numFinePointRows,(int)numFineBlockRows);
+
+
+    // Need to generate the coarse block map
+    // NOTE: We assume NSDim == block size here
+    // NOTE: We also assume that coarseMap has contiguous GIDs
+    const size_t numCoarsePointRows = coarsePointMap->getLocalNumElements();
+    const size_t numCoarseBlockRows = coarsePointMap->getLocalNumElements() / NSDim;
+    RCP<const Map> coarseBlockMap = MapFactory::Build(coarsePointMap->lib(),
+                                                      Teuchos::OrdinalTraits<Xpetra::global_size_t>::invalid(),
+                                                      numCoarseBlockRows,
+                                                      coarsePointMap->getIndexBase(),
+                                                      coarsePointMap->getComm());    
+    //    Set(currentLevel, "CoarseBlockMap", coarseBlockMap);
+       
 
     // Sanity checking
     const ParameterList& pL = GetParameterList();
@@ -294,6 +319,8 @@ namespace MueLu {
     TEUCHOS_TEST_FOR_EXCEPTION(doQRStep && constantColSums,Exceptions::RuntimeError,
                                "MueLu::TentativePFactory::MakeTentative: cannot use 'constant column sums' and 'calculate qr' at the same time");
 
+    // The aggregates use the amalgamated column map, which in this case is what we want
+
     // Aggregates map is based on the amalgamated column map
     // We can skip global-to-local conversion if LIDs in row map are
     // same as LIDs in column map
@@ -307,52 +334,140 @@ namespace MueLu {
     ArrayRCP<LO> aggToRowMapLO;
     ArrayRCP<GO> aggToRowMapGO;
     if (goodMap) {
-      amalgInfo->UnamalgamateAggregatesLO(*aggregates, aggStart, aggToRowMapLO);
+      const bool stay_amalgamated = true;
+      amalgInfo->UnamalgamateAggregatesLO(*aggregates, aggStart, aggToRowMapLO,stay_amalgamated);
       GetOStream(Runtime1) << "Column map is consistent with the row map, good." << std::endl;
-
     } else {
-      amalgInfo->UnamalgamateAggregates(*aggregates, aggStart, aggToRowMapGO);
-      GetOStream(Warnings0) << "Column map is not consistent with the row map\n"
-                            << "using GO->LO conversion with performance penalty" << std::endl;
+      //      GetOStream(Warnings0) << "Column map is not consistent with the row map\n"
+      // << "using GO->LO conversion with performance penalty" << std::endl;
+      throw std::runtime_error("TentativePFactory::PuncoupledBlockCrs: Inconsistent maps not currently supported");
     }
-
-    coarseNullspace = MultiVectorFactory::Build(coarseMap, NSDim);
+  
+    coarseNullspace = MultiVectorFactory::Build(coarsePointMap, NSDim);
 
     // Pull out the nullspace vectors so that we can have random access.
     ArrayRCP<ArrayRCP<const SC> > fineNS  (NSDim);
     ArrayRCP<ArrayRCP<SC> >       coarseNS(NSDim);
     for (size_t i = 0; i < NSDim; i++) {
       fineNS[i] = fineNullspace->getData(i);
-      if (coarseMap->getLocalNumElements() > 0)
+      if (coarsePointMap->getLocalNumElements() > 0)
         coarseNS[i] = coarseNullspace->getDataNonConst(i);
     }
 
-    size_t nnzEstimate = numRows * NSDim;
-
-    // Time to construct the matrix and fill in the values
-    Ptentative = rcp(new CrsMatrixWrap(rowMap, coarseMap, 0));
-    RCP<CrsMatrix> PtentCrs   = rcp_dynamic_cast<CrsMatrixWrap>(Ptentative)->getCrsMatrix();
 
+    // BlockCrs requires that we build the (block) graph first, so let's do that...
+    // NOTE: Because we're assuming that the NSDim == BlockSize, we only have one 
+    // block non-zero per row in the matrix;
+    RCP<CrsGraph> BlockGraph = CrsGraphFactory::Build(rowMap,coarseBlockMap,0);
     ArrayRCP<size_t>  iaPtent;
     ArrayRCP<LO>      jaPtent;
-    ArrayRCP<SC>     valPtent;
-
-    PtentCrs->allocateAllValues(nnzEstimate, iaPtent, jaPtent, valPtent);
-
+    BlockGraph->allocateAllIndices(numFineBlockRows, iaPtent, jaPtent);
     ArrayView<size_t> ia  = iaPtent();
     ArrayView<LO>     ja  = jaPtent();
-    ArrayView<SC>     val = valPtent();
 
-    ia[0] = 0;
-    for (size_t i = 1; i <= numRows; i++)
-      ia[i] = ia[i-1] + NSDim;
 
-    for (size_t j = 0; j < nnzEstimate; j++) {
-      ja [j] = INVALID;
-      val[j] = zero;
+    printf("ia.size() = %d ja.size =%d numAggs=%d\n",(int)ia.size(),(int)ja.size(),numAggs);
+    fflush(stdout);
+
+    for (size_t i = 0; i < numFineBlockRows; i++) {
+      ia[i] = i;
+      ja[i] = INVALID;
     }
+    ia[numCoarseBlockRows] = numCoarseBlockRows;
+
 
+    for (GO agg = 0; agg < numAggs; agg++) {
+      LO aggSize = aggStart[agg+1] - aggStart[agg];
+      Xpetra::global_size_t offset = agg;
 
+      for (LO j = 0; j < aggSize; j++) {
+        // FIXME: Allow for bad maps
+        const LO localRow = aggToRowMapLO[aggStart[agg]+j];
+        const size_t rowStart = ia[localRow];
+        //        printf("Writing (%d,%d) rowStart=%d\n",(int)localRow,(int)agg,(int)rowStart);fflush(stdout);
+        ja[rowStart] = offset;
+      }      
+    }
+
+    /*
+    printf("Before compression: \nja:");
+    for(int i=0; i< (int)ja.size(); i++)
+      printf("%d ",(int)ja[i]);
+    printf("\n");
+    for (size_t i = 0; i < numFineBlockRows; i++) {
+      for (size_t j = ia[i]; j < ia[i+1]; j++) {
+        printf("%d %d\n",(int)i,(int)ja[j]);
+      }
+    }
+    */
+    // Compress storage (remove all INVALID, which happen when we skip zeros)
+    // We do that in-place
+    size_t ia_tmp = 0, nnz = 0;
+    for (size_t i = 0; i < numFineBlockRows; i++) {
+      for (size_t j = ia_tmp; j < ia[i+1]; j++)
+        if (ja[j] != INVALID) {
+          ja [nnz] = ja [j];
+          nnz++;
+        }
+      ia_tmp  = ia[i+1];
+      ia[i+1] = nnz;
+    }
+
+    /*
+    printf("After compression: \n");
+    for (size_t i = 0; i < numFineBlockRows; i++) {
+      for (size_t j = ia[i]; j < ia[i+1]; j++) {
+        printf("%d %d\n",(int)i,(int)ja[j]);
+      }
+    }
+    */
+
+    if (rowMap->lib() == Xpetra::UseTpetra) {
+      // - Cannot resize for Epetra, as it checks for same pointers
+      // - Need to resize for Tpetra, as it check ().size() == ia[numRows]
+      // NOTE: these invalidate ja and val views
+      jaPtent .resize(nnz);
+    }
+
+    GetOStream(Runtime1) << "TentativePFactory : generating block graph" << std::endl;
+    BlockGraph->setAllIndices(iaPtent, jaPtent);
+
+    // Managing labels & constants for ESFC
+    {
+      RCP<ParameterList> FCparams;
+      if(pL.isSublist("matrixmatrix: kernel params"))
+        FCparams=rcp(new ParameterList(pL.sublist("matrixmatrix: kernel params")));
+      else
+        FCparams= rcp(new ParameterList);
+      // By default, we don't need global constants for TentativeP
+      FCparams->set("compute global constants",FCparams->get("compute global constants",false));
+      std::string levelIDs = toString(levelID);
+      FCparams->set("Timer Label",std::string("MueLu::TentativeP-")+levelIDs);
+      RCP<const Export> dummy_e;
+      RCP<const Import> dummy_i;
+      BlockGraph->expertStaticFillComplete(coarseBlockMap,rowMap,dummy_i,dummy_e,FCparams);
+    }
+
+    //    Xpetra::IO<SC,LO,GO,NO>::Write("graph.dat",*BlockGraph);
+
+    // Now let's make a BlockCrs Matrix
+    // NOTE: Assumes block size== NSDim
+    // FIXME: Push this all into Xpetra_MatrixFactory
+    RCP<Xpetra::TpetraCrsGraph<LO,GO,NO> > BlockGraph_tcg = rcp_dynamic_cast<Xpetra::TpetraCrsGraph<LO,GO,NO> >(BlockGraph_tcg);
+    RCP<const Tpetra::CrsGraph<LO,GO,NO> > BlockGraph_t =BlockGraph_tcg->getTpetra_CrsGraph();
+
+    RCP<const Xpetra::TpetraMap<LO,GO,NO> > rangeMap_t = rcp_dynamic_cast<const Xpetra::TpetraMap<LO,GO,NO> >(rangeMap);
+    RCP<const Xpetra::TpetraMap<LO,GO,NO> > coarsePointMap_t = rcp_dynamic_cast<const Xpetra::TpetraMap<LO,GO,NO> >(coarsePointMap);
+       
+    RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp(new Tpetra::BlockCrsMatrix<SC,LO,GO,NO>(*BlockGraph_t, *coarsePointMap_t->getTpetra_Map(), *rangeMap_t->getTpetra_Map(),NSDim));    
+
+    RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(P_tpetra));
+    RCP<CrsMatrixWrap> P_wrap = rcp(new CrsMatrixWrap(P_xpetra));
+
+
+    //CMSCMSCMS
+
+#ifdef OLD_AND_BUSTED
     if (doQRStep) {
       ////////////////////////////////
       // Standard aggregate-wise QR //
@@ -596,6 +711,11 @@ namespace MueLu {
     RCP<const Import> dummy_i;
 
     PtentCrs->expertStaticFillComplete(coarseMap, A->getDomainMap(),dummy_i,dummy_e,FCparams);
+#endif
+
+#else
+    throw std::runtime_error("TentativePFactory::BuildPuncoupledBlockCrs: Requires Tpetra");
+#endif
   }
 
   template <class Scalar,class LocalOrdinal, class GlobalOrdinal, class Node>
@@ -971,6 +1091,338 @@ namespace MueLu {
 
 
+  template <class Scalar,class LocalOrdinal, class GlobalOrdinal, class Node>
+  void TentativePFactory<Scalar, LocalOrdinal, GlobalOrdinal, Node>::
+  BuildPuncoupled(RCP<Matrix> A, RCP<Aggregates> aggregates, RCP<AmalgamationInfo> amalgInfo, RCP<MultiVector> fineNullspace,
+                RCP<const Map> coarseMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const {
+    RCP<const Map> rowMap = A->getRowMap();
+    RCP<const Map> colMap = A->getColMap();
+    const size_t numRows   = rowMap->getLocalNumElements();
+
+    typedef Teuchos::ScalarTraits<SC> STS;
+    typedef typename STS::magnitudeType Magnitude;
+    const SC     zero      = STS::zero();
+    const SC     one       = STS::one();
+    const LO     INVALID   = Teuchos::OrdinalTraits<LO>::invalid();
+
+    const GO     numAggs   = aggregates->GetNumAggregates();
+    const size_t NSDim     = fineNullspace->getNumVectors();
+    ArrayRCP<LO> aggSizes  = aggregates->ComputeAggregateSizes();
+
+
+    // Sanity checking
+    const ParameterList& pL = GetParameterList();
+    const bool &doQRStep = pL.get<bool>("tentative: calculate qr");
+    const bool &constantColSums = pL.get<bool>("tentative: constant column sums");
+
+    TEUCHOS_TEST_FOR_EXCEPTION(doQRStep && constantColSums,Exceptions::RuntimeError,
+                               "MueLu::TentativePFactory::MakeTentative: cannot use 'constant column sums' and 'calculate qr' at the same time");
+
+    // Aggregates map is based on the amalgamated column map
+    // We can skip global-to-local conversion if LIDs in row map are
+    // same as LIDs in column map
+    bool goodMap = MueLu::Utilities<SC,LO,GO,NO>::MapsAreNested(*rowMap, *colMap);
+
+    // Create a lookup table to determine the rows (fine DOFs) that belong to a given aggregate.
+    // aggStart is a pointer into aggToRowMapLO
+    // aggStart[i]..aggStart[i+1] are indices into aggToRowMapLO
+    // aggToRowMapLO[aggStart[i]]..aggToRowMapLO[aggStart[i+1]-1] are the DOFs in aggregate i
+    ArrayRCP<LO> aggStart;
+    ArrayRCP<LO> aggToRowMapLO;
+    ArrayRCP<GO> aggToRowMapGO;
+    if (goodMap) {
+      amalgInfo->UnamalgamateAggregatesLO(*aggregates, aggStart, aggToRowMapLO);
+      GetOStream(Runtime1) << "Column map is consistent with the row map, good." << std::endl;
+
+    } else {
+      amalgInfo->UnamalgamateAggregates(*aggregates, aggStart, aggToRowMapGO);
+      GetOStream(Warnings0) << "Column map is not consistent with the row map\n"
+                            << "using GO->LO conversion with performance penalty" << std::endl;
+    }
+    coarseNullspace = MultiVectorFactory::Build(coarseMap, NSDim);
+
+    // Pull out the nullspace vectors so that we can have random access.
+    ArrayRCP<ArrayRCP<const SC> > fineNS  (NSDim);
+    ArrayRCP<ArrayRCP<SC> >       coarseNS(NSDim);
+    for (size_t i = 0; i < NSDim; i++) {
+      fineNS[i] = fineNullspace->getData(i);
+      if (coarseMap->getLocalNumElements() > 0)
+        coarseNS[i] = coarseNullspace->getDataNonConst(i);
+    }
+
+    size_t nnzEstimate = numRows * NSDim;
+
+    // Time to construct the matrix and fill in the values
+    Ptentative = rcp(new CrsMatrixWrap(rowMap, coarseMap, 0));
+    RCP<CrsMatrix> PtentCrs   = rcp_dynamic_cast<CrsMatrixWrap>(Ptentative)->getCrsMatrix();
+
+    ArrayRCP<size_t>  iaPtent;
+    ArrayRCP<LO>      jaPtent;
+    ArrayRCP<SC>     valPtent;
+
+    PtentCrs->allocateAllValues(nnzEstimate, iaPtent, jaPtent, valPtent);
+
+    ArrayView<size_t> ia  = iaPtent();
+    ArrayView<LO>     ja  = jaPtent();
+    ArrayView<SC>     val = valPtent();
+
+    ia[0] = 0;
+    for (size_t i = 1; i <= numRows; i++)
+      ia[i] = ia[i-1] + NSDim;
+
+    for (size_t j = 0; j < nnzEstimate; j++) {
+      ja [j] = INVALID;
+      val[j] = zero;
+    }
+
+
+    if (doQRStep) {
+      ////////////////////////////////
+      // Standard aggregate-wise QR //
+      ////////////////////////////////
+      for (GO agg = 0; agg < numAggs; agg++) {
+        LO aggSize = aggStart[agg+1] - aggStart[agg];
+
+        Xpetra::global_size_t offset = agg*NSDim;
+
+        // Extract the piece of the nullspace corresponding to the aggregate, and
+        // put it in the flat array, "localQR" (in column major format) for the
+        // QR routine.
+        Teuchos::SerialDenseMatrix<LO,SC> localQR(aggSize, NSDim);
+        if (goodMap) {
+          for (size_t j = 0; j < NSDim; j++)
+            for (LO k = 0; k < aggSize; k++)
+              localQR(k,j) = fineNS[j][aggToRowMapLO[aggStart[agg]+k]];
+        } else {
+          for (size_t j = 0; j < NSDim; j++)
+            for (LO k = 0; k < aggSize; k++)
+              localQR(k,j) = fineNS[j][rowMap->getLocalElement(aggToRowMapGO[aggStart[agg]+k])];
+        }
+
+        // Test for zero columns
+        for (size_t j = 0; j < NSDim; j++) {
+          bool bIsZeroNSColumn = true;
+
+          for (LO k = 0; k < aggSize; k++)
+            if (localQR(k,j) != zero)
+              bIsZeroNSColumn = false;
+
+          TEUCHOS_TEST_FOR_EXCEPTION(bIsZeroNSColumn == true, Exceptions::RuntimeError,
+                                     "MueLu::TentativePFactory::MakeTentative: fine level NS part has a zero column in NS column " << j);
+        }
+
+        // Calculate QR decomposition (standard)
+        // NOTE: Q is stored in localQR and R is stored in coarseNS
+        if (aggSize >= Teuchos::as<LO>(NSDim)) {
+
+          if (NSDim == 1) {
+            // Only one nullspace vector, calculate Q and R by hand
+            Magnitude norm = STS::magnitude(zero);
+            for (size_t k = 0; k < Teuchos::as<size_t>(aggSize); k++)
+              norm += STS::magnitude(localQR(k,0)*localQR(k,0));
+            norm = Teuchos::ScalarTraits<Magnitude>::squareroot(norm);
+
+            // R = norm
+            coarseNS[0][offset] = norm;
+
+            // Q = localQR(:,0)/norm
+            for (LO i = 0; i < aggSize; i++)
+              localQR(i,0) /= norm;
+
+          } else {
+            Teuchos::SerialQRDenseSolver<LO,SC> qrSolver;
+            qrSolver.setMatrix(Teuchos::rcp(&localQR, false));
+            qrSolver.factor();
+
+            // R = upper triangular part of localQR
+            for (size_t j = 0; j < NSDim; j++)
+              for (size_t k = 0; k <= j; k++)
+                coarseNS[j][offset+k] = localQR(k,j); //TODO is offset+k the correct local ID?!
+
+            // Calculate Q, the tentative prolongator.
+            // The Lapack GEQRF call only works for myAggsize >= NSDim
+            qrSolver.formQ();
+            Teuchos::RCP<Teuchos::SerialDenseMatrix<LO,SC> > qFactor = qrSolver.getQ();
+            for (size_t j = 0; j < NSDim; j++)
+              for (size_t i = 0; i < Teuchos::as<size_t>(aggSize); i++)
+                localQR(i,j) = (*qFactor)(i,j);
+          }
+
+        } else {
+          // Special handling for aggSize < NSDim (i.e. single node aggregates in structural mechanics)
+
+          // The local QR decomposition is not possible in the "overconstrained"
+          // case (i.e. number of columns in localQR > number of rows), which
+          // corresponds to #DOFs in Aggregate < NSDim. For usual problems this
+          // is only possible for single node aggregates in structural mechanics.
+          // (Similar problems may arise in discontinuous Galerkin problems...)
+          // We bypass the QR decomposition and use an identity block in the
+          // tentative prolongator for the single node aggregate and transfer the
+          // corresponding fine level null space information 1-to-1 to the coarse
+          // level null space part.
+
+          // NOTE: The resulting tentative prolongation operator has
+          // (aggSize*DofsPerNode-NSDim) zero columns leading to a singular
+          // coarse level operator A.  To deal with that one has the following
+          // options:
+          // - Use the "RepairMainDiagonal" flag in the RAPFactory (default:
+          //   false) to add some identity block to the diagonal of the zero rows
+          //   in the coarse level operator A, such that standard level smoothers
+          //   can be used again.
+          // - Use special (projection-based) level smoothers, which can deal
+          //   with singular matrices (very application specific)
+          // - Adapt the code below to avoid zero columns. However, we do not
+          //   support a variable number of DOFs per node in MueLu/Xpetra which
+          //   makes the implementation really hard.
+
+          // R = extended (by adding identity rows) localQR
+          for (size_t j = 0; j < NSDim; j++)
+            for (size_t k = 0; k < NSDim; k++)
+              if (k < as<size_t>(aggSize))
+                coarseNS[j][offset+k] = localQR(k,j);
+              else
+                coarseNS[j][offset+k] = (k == j ? one : zero);
+
+          // Q = I (rectangular)
+          for (size_t i = 0; i < as<size_t>(aggSize); i++)
+            for (size_t j = 0; j < NSDim; j++)
+              localQR(i,j) = (j == i ? one : zero);
+        }
+
+
+        // Process each row in the local Q factor
+        // FIXME: What happens if maps are blocked?
+        for (LO j = 0; j < aggSize; j++) {
+          LO localRow = (goodMap ? aggToRowMapLO[aggStart[agg]+j] : rowMap->getLocalElement(aggToRowMapGO[aggStart[agg]+j]));
+
+          size_t rowStart = ia[localRow];
+          for (size_t k = 0, lnnz = 0; k < NSDim; k++) {
+            // Skip zeros (there may be plenty of them, i.e., NSDim > 1 or boundary conditions)
+            if (localQR(j,k) != zero) {
+              ja [rowStart+lnnz] = offset + k;
+              val[rowStart+lnnz] = localQR(j,k);
+              lnnz++;
+            }
+          }
+        }
+      }
+
+    } else {
+      GetOStream(Runtime1) << "TentativePFactory : bypassing local QR phase" << std::endl;
+      if (NSDim>1)
+        GetOStream(Warnings0) << "TentativePFactory : for nontrivial nullspace, this may degrade performance" << std::endl;
+      /////////////////////////////
+      //      "no-QR" option     //
+      /////////////////////////////
+      // Local Q factor is just the fine nullspace support over the current aggregate.
+      // Local R factor is the identity.
+      // TODO I have not implemented any special handling for aggregates that are too
+      // TODO small to locally support the nullspace, as is done in the standard QR
+      // TODO case above.
+      if (goodMap) {
+        for (GO agg = 0; agg < numAggs; agg++) {
+          const LO aggSize = aggStart[agg+1] - aggStart[agg];
+          Xpetra::global_size_t offset = agg*NSDim;
+
+          // Process each row in the local Q factor
+          // FIXME: What happens if maps are blocked?
+          for (LO j = 0; j < aggSize; j++) {
+
+            //TODO Here I do not check for a zero nullspace column on the aggregate.
+            //     as is done in the standard QR case.
+
+            const LO localRow = aggToRowMapLO[aggStart[agg]+j];
+
+            const size_t rowStart = ia[localRow];
+
+            for (size_t k = 0, lnnz = 0; k < NSDim; k++) {
+              // Skip zeros (there may be plenty of them, i.e., NSDim > 1 or boundary conditions)
+              SC qr_jk = fineNS[k][aggToRowMapLO[aggStart[agg]+j]];
+              if(constantColSums) qr_jk = qr_jk / (Magnitude)aggSizes[agg];
+              if (qr_jk != zero) {
+                ja [rowStart+lnnz] = offset + k;
+                val[rowStart+lnnz] = qr_jk;
+                lnnz++;
+              }
+            }
+          }
+          for (size_t j = 0; j < NSDim; j++)
+            coarseNS[j][offset+j] = one;
+        } //for (GO agg = 0; agg < numAggs; agg++)
+
+      } else {
+        for (GO agg = 0; agg < numAggs; agg++) {
+          const LO aggSize = aggStart[agg+1] - aggStart[agg];
+          Xpetra::global_size_t offset = agg*NSDim;
+          for (LO j = 0; j < aggSize; j++) {
+
+            const LO localRow = rowMap->getLocalElement(aggToRowMapGO[aggStart[agg]+j]);
+
+            const size_t rowStart = ia[localRow];
+
+            for (size_t k = 0, lnnz = 0; k < NSDim; ++k) {
+              // Skip zeros (there may be plenty of them, i.e., NSDim > 1 or boundary conditions)
+              SC qr_jk = fineNS[k][rowMap->getLocalElement(aggToRowMapGO[aggStart[agg]+j])];
+              if(constantColSums) qr_jk = qr_jk / (Magnitude)aggSizes[agg];
+              if (qr_jk != zero) {
+                ja [rowStart+lnnz] = offset + k;
+                val[rowStart+lnnz] = qr_jk;
+                lnnz++;
+              }
+            }
+          }
+          for (size_t j = 0; j < NSDim; j++)
+            coarseNS[j][offset+j] = one;
+        } //for (GO agg = 0; agg < numAggs; agg++)
+
+      } //if (goodmap) else ...
+
+    } //if doQRStep ... else
+
+    // Compress storage (remove all INVALID, which happen when we skip zeros)
+    // We do that in-place
+    size_t ia_tmp = 0, nnz = 0;
+    for (size_t i = 0; i < numRows; i++) {
+      for (size_t j = ia_tmp; j < ia[i+1]; j++)
+        if (ja[j] != INVALID) {
+          ja [nnz] = ja [j];
+          val[nnz] = val[j];
+          nnz++;
+        }
+      ia_tmp  = ia[i+1];
+      ia[i+1] = nnz;
+    }
+    if (rowMap->lib() == Xpetra::UseTpetra) {
+      // - Cannot resize for Epetra, as it checks for same pointers
+      // - Need to resize for Tpetra, as it check ().size() == ia[numRows]
+      // NOTE: these invalidate ja and val views
+      jaPtent .resize(nnz);
+      valPtent.resize(nnz);
+    }
+
+    GetOStream(Runtime1) << "TentativePFactory : aggregates do not cross process boundaries" << std::endl;
+
+    PtentCrs->setAllValues(iaPtent, jaPtent, valPtent);
+
+
+    // Managing labels & constants for ESFC
+    RCP<ParameterList> FCparams;
+    if(pL.isSublist("matrixmatrix: kernel params"))
+      FCparams=rcp(new ParameterList(pL.sublist("matrixmatrix: kernel params")));
+    else
+      FCparams= rcp(new ParameterList);
+    // By default, we don't need global constants for TentativeP
+    FCparams->set("compute global constants",FCparams->get("compute global constants",false));
+    std::string levelIDs = toString(levelID);
+    FCparams->set("Timer Label",std::string("MueLu::TentativeP-")+levelIDs);
+    RCP<const Export> dummy_e;
+    RCP<const Import> dummy_i;
+
+    PtentCrs->expertStaticFillComplete(coarseMap, A->getDomainMap(),dummy_i,dummy_e,FCparams);
+  }
+
+
+
 } //namespace MueLu
 
 // TODO ReUse: If only P or Nullspace is missing, TentativePFactory can be smart and skip part of the computation.

From 0b24e1d41718a78a40be1fe04f0082cc75179fd0 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 27 Jul 2022 09:13:01 -0600
Subject: [PATCH 051/130] Xpetra: Updates to IO, MatrixMatrix

---
 packages/xpetra/sup/Utils/Xpetra_IO.hpp           | 2 ++
 packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp | 7 +++++++
 2 files changed, 9 insertions(+)

diff --git a/packages/xpetra/sup/Utils/Xpetra_IO.hpp b/packages/xpetra/sup/Utils/Xpetra_IO.hpp
index 0194de90bf59..da863a390f23 100644
--- a/packages/xpetra/sup/Utils/Xpetra_IO.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_IO.hpp
@@ -319,6 +319,7 @@ namespace Xpetra {
         std::ofstream outstream (fileName,std::ofstream::out);
         Teuchos::FancyOStream ofs(Teuchos::rcpFromRef(outstream));
         tmp_BlockCrs->getTpetra_BlockCrsMatrix()->describe(ofs,Teuchos::VERB_EXTREME);        
+        return;
       }
 
 #endif // HAVE_XPETRA_TPETRA
@@ -1051,6 +1052,7 @@ namespace Xpetra {
         std::ofstream outstream (fileName,std::ofstream::out);
         Teuchos::FancyOStream ofs(Teuchos::rcpFromRef(outstream));
         tmp_BlockCrs->getTpetra_BlockCrsMatrix()->describe(ofs,Teuchos::VERB_EXTREME);
+        return;
       }
 
 # endif
diff --git a/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp b/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
index 5fad0246aafe..533cb2309a95 100644
--- a/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
@@ -298,7 +298,14 @@ Note: this class is not in the Xpetra_UseShortNames.hpp
        return false;
      }
     }
+#else // HAVE_XPETRA_TPETRA
+    static bool isTpetraCrs(const Matrix& Op) {
+      return false;
+    }
 
+    static bool isTpetraBlockCrs(const Matrix&  Op) {
+      return false;
+    }
 
 #endif // HAVE_XPETRA_TPETRA
 

From 43e30b68a758bb15c4b32f9d5f378edc549cb9a9 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 27 Jul 2022 13:11:01 -0600
Subject: [PATCH 052/130] MueLu: More BlockCrs Support

---
 .../MueLu_AmalgamationFactory_def.hpp         |  11 +-
 .../MueLu_AmalgamationInfo_decl.hpp           |   2 +-
 .../MueLu_AmalgamationInfo_def.hpp            |   6 +-
 .../MueLu_CoalesceDropFactory_def.hpp         |  24 +-
 .../MueLu_TentativePFactory_def.hpp           | 291 +++---------------
 .../ParameterListInterpreter.cpp              |   4 +-
 6 files changed, 72 insertions(+), 266 deletions(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
index 549b00075d81..9e84ee4a9f5b 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
@@ -80,6 +80,7 @@ namespace MueLu {
     LO blockid          = -1;  // block id in strided map
     LO nStridedOffset   = 0;   // DOF offset for strided block id "blockid" (default = 0)
     LO stridedblocksize = fullblocksize; // size of strided block id "blockid" (default = fullblocksize, only if blockid!=-1 stridedblocksize <= fullblocksize)
+    LO storageblocksize = A->GetStorageBlockSize();
     // GO indexBase        = A->getRowMap()->getIndexBase();  // index base for maps (unused)
 
     // 1) check for blocking/striding information
@@ -101,13 +102,19 @@ namespace MueLu {
       } else {
         stridedblocksize = fullblocksize;
       }
+      // Correct for the storageblocksize
+      TEUCHOS_TEST_FOR_EXCEPTION(fullblocksize % storageblocksize != 0,Exceptions::RuntimeError,"AmalgamationFactory: fullblocksize needs to be a multiple of A->GetStorageBlockSize()");
+      fullblocksize /= storageblocksize;
+      stridedblocksize /= storageblocksize;
+
       oldView = A->SwitchToView(oldView);
-      GetOStream(Runtime1) << "AmalagamationFactory::Build():" << " found fullblocksize=" << fullblocksize << " and stridedblocksize=" << stridedblocksize << " from strided maps. offset=" << offset << std::endl;
+      GetOStream(Runtime1) << "AmalagamationFactory::Build():" << " found fullblocksize=" << fullblocksize << ", stridedblocksize=" << stridedblocksize << " and storageblocksize="<<storageblocksize<<" from strided maps. offset=" << offset << std::endl;
 
     } else {
       GetOStream(Warnings0) << "AmalagamationFactory::Build(): no striding information available. Use blockdim=1 with offset=0" << std::endl;
     }
 
+
     // build node row map (uniqueMap) and node column map (nonUniqueMap)
     // the arrays rowTranslation and colTranslation contain the local node id
     // given a local dof id. They are only necessary for the CoalesceDropFactory if
@@ -166,7 +173,7 @@ namespace MueLu {
     container               filter;
 
     GO offset = 0;
-    LO blkSize = A.GetFixedBlockSize();
+    LO blkSize = A.GetFixedBlockSize() / A.GetStorageBlockSize();
     if (A.IsView("stridedMaps") == true) {
       Teuchos::RCP<const Map> myMap = A.getRowMap("stridedMaps");
       Teuchos::RCP<const StridedMap> strMap = Teuchos::rcp_dynamic_cast<const StridedMap>(myMap);
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_decl.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_decl.hpp
index 9a36632e158d..84c747dcc870 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_decl.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_decl.hpp
@@ -133,7 +133,7 @@ namespace MueLu {
       Puts all dofs for aggregate \c i in aggToRowMap[\c i].  Also calculate aggregate sizes.
     */
     void UnamalgamateAggregates(const Aggregates& aggregates, Teuchos::ArrayRCP<LocalOrdinal>& aggStart, Teuchos::ArrayRCP<GlobalOrdinal>& aggToRowMap) const;
-    void UnamalgamateAggregatesLO(const Aggregates& aggregates, Teuchos::ArrayRCP<LocalOrdinal>& aggStart, Teuchos::ArrayRCP<LO>& aggToRowMap, bool stay_amalgamated=false) const;
+    void UnamalgamateAggregatesLO(const Aggregates& aggregates, Teuchos::ArrayRCP<LocalOrdinal>& aggStart, Teuchos::ArrayRCP<LO>& aggToRowMap) const;
 
     /*! @brief ComputeUnamalgamatedImportDofMap
      * build overlapping dof row map from aggregates needed for overlapping null space
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_def.hpp
index 226179687a70..edfad670c279 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationInfo_def.hpp
@@ -132,7 +132,7 @@ namespace MueLu {
 
   template <class LocalOrdinal, class GlobalOrdinal, class Node>
   void AmalgamationInfo<LocalOrdinal, GlobalOrdinal, Node>::UnamalgamateAggregatesLO(const Aggregates& aggregates,
-                      Teuchos::ArrayRCP<LO>& aggStart, Teuchos::ArrayRCP<LO>& aggToRowMap, bool stay_amalgamated) const {
+                      Teuchos::ArrayRCP<LO>& aggStart, Teuchos::ArrayRCP<LO>& aggToRowMap) const {
 
     int myPid = aggregates.GetMap()->getComm()->getRank();
     Teuchos::ArrayView<const GO> nodeGlobalElts = aggregates.GetMap()->getLocalElementList();
@@ -146,7 +146,7 @@ namespace MueLu {
     const LO size = procWinner.size();
 
     std::vector<LO> sizes(numAggregates);
-    if (stay_amalgamated || stridedblocksize_ == 1) {
+    if (stridedblocksize_ == 1) {
       for (LO lnode = 0; lnode < size; lnode++)
         if (procWinner[lnode] == myPid)
           sizes[vertex2AggId[lnode]]++;
@@ -172,7 +172,7 @@ namespace MueLu {
 
     // count, how many dofs have been recorded for each aggregate so far
     Array<LO> numDofs(numAggregates, 0); // empty array with number of DOFs for each aggregate
-    if (stay_amalgamated || stridedblocksize_ == 1) {
+    if (stridedblocksize_ == 1) {
       for (LO lnode = 0; lnode < size; ++lnode)
         if (procWinner[lnode] == myPid) {
           LO myAgg = vertex2AggId[lnode];
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
index 6c2241c12b8d..3af5eaf58509 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
@@ -370,7 +370,7 @@ namespace MueLu {
           distanceLaplacianAlgo = scaled_cut_symmetric;
         else
           TEUCHOS_TEST_FOR_EXCEPTION(true, Exceptions::RuntimeError, "\"aggregation: distance laplacian algo\" must be one of (default|unscaled cut|scaled cut), not \"" << distanceLaplacianAlgoStr << "\"");
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" distance laplacian algorithm = \"" << distanceLaplacianAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" distance laplacian algorithm = \"" << distanceLaplacianAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize()<< "storageblocksize = "<<A->GetStorageBlockSize() << std::endl;
       } else if (algo == "classical") {
         if (classicalAlgoStr == "default")
           classicalAlgo = defaultAlgo;
@@ -380,10 +380,10 @@ namespace MueLu {
           classicalAlgo = scaled_cut;
         else
           TEUCHOS_TEST_FOR_EXCEPTION(true, Exceptions::RuntimeError, "\"aggregation: classical algo\" must be one of (default|unscaled cut|scaled cut), not \"" << classicalAlgoStr << "\"");
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" classical algorithm = \"" << classicalAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" classical algorithm = \"" << classicalAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize()<< "storageblocksize = "<<A->GetStorageBlockSize() << std::endl;
         
       } else
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << "storageblocksize = "<<A->GetStorageBlockSize()<< std::endl;
       Set<bool>(currentLevel, "Filtering", (threshold != STS::zero()));
 
       const typename STS::magnitudeType dirichletThreshold = STS::magnitude(as<SC>(pL.get<double>("aggregation: Dirichlet threshold")));
@@ -396,6 +396,10 @@ namespace MueLu {
       GO numDropped = 0, numTotal = 0;
       std::string graphType = "unamalgamated"; //for description purposes only
 
+      TEUCHOS_TEST_FOR_EXCEPTION(A->GetFixedBlockSize() % A->GetStorageBlockSize() != 0,Exceptions::RuntimeError,"A->GetFixedBlockSize() needs to be a multiple of A->GetStorageBlockSize()");
+      const LO BlockSize = A->GetFixedBlockSize() / A->GetStorageBlockSize();
+
+
       /************************** RS or SA-style Classical Dropping (and variants) **************************/
       if (algo == "classical") {
         if (predrop_ == null) {
@@ -417,7 +421,7 @@ namespace MueLu {
         // At this points we either have
         //     (predrop_ != null)
         // Therefore, it is sufficient to check only threshold
-        if (A->GetFixedBlockSize() == 1 && threshold == STS::zero() && !useSignedClassicalRS && !useSignedClassicalSA && A->hasCrsGraph()) {
+        if ( BlockSize==1 && threshold == STS::zero() && !useSignedClassicalRS && !useSignedClassicalSA && A->hasCrsGraph()) {
           // Case 1:  scalar problem, no dropping => just use matrix graph
           RCP<GraphBase> graph = rcp(new Graph(A->getCrsGraph(), "graph of A"));
           // Detect and record rows that correspond to Dirichlet boundary conditions
@@ -442,10 +446,10 @@ namespace MueLu {
           Set(currentLevel, "DofsPerNode", 1);
           Set(currentLevel, "Graph", graph);
 
-        } else if ( (A->GetFixedBlockSize() == 1 && threshold != STS::zero()) ||
-                    (A->GetFixedBlockSize() == 1 && threshold == STS::zero() && !A->hasCrsGraph()) ||
-                    (A->GetFixedBlockSize() == 1 && useSignedClassicalRS) ||
-                    (A->GetFixedBlockSize() == 1 && useSignedClassicalSA) ) {	  
+        } else if ( (BlockSize == 1 && threshold != STS::zero()) ||
+                    (BlockSize == 1 && threshold == STS::zero() && !A->hasCrsGraph()) ||
+                    (BlockSize == 1 && useSignedClassicalRS) ||
+                    (BlockSize == 1 && useSignedClassicalSA) ) {	  
           // Case 2:  scalar problem with dropping => record the column indices of undropped entries, but still use original
           //                                          graph's map information, e.g., whether index is local
           // OR a matrix without a CrsGraph
@@ -721,7 +725,7 @@ namespace MueLu {
            }
 #endif
           }//end generateColoringGraph
-        } else if (A->GetFixedBlockSize() > 1 && threshold == STS::zero()) {
+        } else if (BlockSize > 1 && threshold == STS::zero()) {
           // Case 3:  Multiple DOF/node problem without dropping
           const RCP<const Map> rowMap = A->getRowMap();
           const RCP<const Map> colMap = A->getColMap();
@@ -853,7 +857,7 @@ namespace MueLu {
           Set(currentLevel, "Graph",       graph);
           Set(currentLevel, "DofsPerNode", blkSize); // full block size
 
-        } else if (A->GetFixedBlockSize() > 1 && threshold != STS::zero()) {
+        } else if (BlockSize > 1 && threshold != STS::zero()) {
           // Case 4:  Multiple DOF/node problem with dropping
           const RCP<const Map> rowMap = A->getRowMap();
           const RCP<const Map> colMap = A->getColMap();
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index b10f34826283..94cf235ffe92 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -335,7 +335,7 @@ namespace MueLu {
     ArrayRCP<GO> aggToRowMapGO;
     if (goodMap) {
       const bool stay_amalgamated = true;
-      amalgInfo->UnamalgamateAggregatesLO(*aggregates, aggStart, aggToRowMapLO,stay_amalgamated);
+      amalgInfo->UnamalgamateAggregatesLO(*aggregates, aggStart, aggToRowMapLO);
       GetOStream(Runtime1) << "Column map is consistent with the row map, good." << std::endl;
     } else {
       //      GetOStream(Warnings0) << "Column map is not consistent with the row map\n"
@@ -384,7 +384,7 @@ namespace MueLu {
         // FIXME: Allow for bad maps
         const LO localRow = aggToRowMapLO[aggStart[agg]+j];
         const size_t rowStart = ia[localRow];
-        //        printf("Writing (%d,%d) rowStart=%d\n",(int)localRow,(int)agg,(int)rowStart);fflush(stdout);
+        printf("Writing (%d,%d) rowStart=%d\n",(int)localRow,(int)agg,(int)rowStart);fflush(stdout);
         ja[rowStart] = offset;
       }      
     }
@@ -448,270 +448,65 @@ namespace MueLu {
       BlockGraph->expertStaticFillComplete(coarseBlockMap,rowMap,dummy_i,dummy_e,FCparams);
     }
 
-    //    Xpetra::IO<SC,LO,GO,NO>::Write("graph.dat",*BlockGraph);
-
     // Now let's make a BlockCrs Matrix
     // NOTE: Assumes block size== NSDim
     // FIXME: Push this all into Xpetra_MatrixFactory
-    RCP<Xpetra::TpetraCrsGraph<LO,GO,NO> > BlockGraph_tcg = rcp_dynamic_cast<Xpetra::TpetraCrsGraph<LO,GO,NO> >(BlockGraph_tcg);
+    RCP<Xpetra::TpetraCrsGraph<LO,GO,NO> > BlockGraph_tcg = rcp_dynamic_cast<Xpetra::TpetraCrsGraph<LO,GO,NO> >(BlockGraph);
     RCP<const Tpetra::CrsGraph<LO,GO,NO> > BlockGraph_t =BlockGraph_tcg->getTpetra_CrsGraph();
 
-    RCP<const Xpetra::TpetraMap<LO,GO,NO> > rangeMap_t = rcp_dynamic_cast<const Xpetra::TpetraMap<LO,GO,NO> >(rangeMap);
-    RCP<const Xpetra::TpetraMap<LO,GO,NO> > coarsePointMap_t = rcp_dynamic_cast<const Xpetra::TpetraMap<LO,GO,NO> >(coarsePointMap);
+    RCP<const Xpetra::TpetraMap<LO,GO,NO> > rangeMap_x = rcp_dynamic_cast<const Xpetra::TpetraMap<LO,GO,NO> >(rangeMap);
+    RCP<const Xpetra::TpetraMap<LO,GO,NO> > coarsePointMap_x = rcp_dynamic_cast<const Xpetra::TpetraMap<LO,GO,NO> >(coarsePointMap->getMap());
+    if(rangeMap_x.is_null()) throw std::runtime_error("TentativePFactory: rangeMap is not a Tpetra Map");    
+    if(coarsePointMap_x.is_null()) throw std::runtime_error("TentativePFactory: coarsePointMap is not a Tpetra Map");
+
+
+    RCP<const Tpetra::Map<LO,GO,NO> > rangeMap_t = rangeMap_x->getTpetra_Map();
+    RCP<const Tpetra::Map<LO,GO,NO> > coarsePointMap_t = coarsePointMap_x->getTpetra_Map();
        
-    RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp(new Tpetra::BlockCrsMatrix<SC,LO,GO,NO>(*BlockGraph_t, *coarsePointMap_t->getTpetra_Map(), *rangeMap_t->getTpetra_Map(),NSDim));    
+    RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp(new Tpetra::BlockCrsMatrix<SC,LO,GO,NO>(*BlockGraph_t, *coarsePointMap_t, *rangeMap_t,NSDim));    
 
     RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(P_tpetra));
     RCP<CrsMatrixWrap> P_wrap = rcp(new CrsMatrixWrap(P_xpetra));
 
 
-    //CMSCMSCMS
-
-#ifdef OLD_AND_BUSTED
-    if (doQRStep) {
-      ////////////////////////////////
-      // Standard aggregate-wise QR //
-      ////////////////////////////////
-      for (GO agg = 0; agg < numAggs; agg++) {
-        LO aggSize = aggStart[agg+1] - aggStart[agg];
-
-        Xpetra::global_size_t offset = agg*NSDim;
-
-        // Extract the piece of the nullspace corresponding to the aggregate, and
-        // put it in the flat array, "localQR" (in column major format) for the
-        // QR routine.
-        Teuchos::SerialDenseMatrix<LO,SC> localQR(aggSize, NSDim);
-        if (goodMap) {
-          for (size_t j = 0; j < NSDim; j++)
-            for (LO k = 0; k < aggSize; k++)
-              localQR(k,j) = fineNS[j][aggToRowMapLO[aggStart[agg]+k]];
-        } else {
-          for (size_t j = 0; j < NSDim; j++)
-            for (LO k = 0; k < aggSize; k++)
-              localQR(k,j) = fineNS[j][rowMap->getLocalElement(aggToRowMapGO[aggStart[agg]+k])];
-        }
-
-        // Test for zero columns
-        for (size_t j = 0; j < NSDim; j++) {
-          bool bIsZeroNSColumn = true;
-
-          for (LO k = 0; k < aggSize; k++)
-            if (localQR(k,j) != zero)
-              bIsZeroNSColumn = false;
-
-          TEUCHOS_TEST_FOR_EXCEPTION(bIsZeroNSColumn == true, Exceptions::RuntimeError,
-                                     "MueLu::TentativePFactory::MakeTentative: fine level NS part has a zero column in NS column " << j);
-        }
-
-        // Calculate QR decomposition (standard)
-        // NOTE: Q is stored in localQR and R is stored in coarseNS
-        if (aggSize >= Teuchos::as<LO>(NSDim)) {
-
-          if (NSDim == 1) {
-            // Only one nullspace vector, calculate Q and R by hand
-            Magnitude norm = STS::magnitude(zero);
-            for (size_t k = 0; k < Teuchos::as<size_t>(aggSize); k++)
-              norm += STS::magnitude(localQR(k,0)*localQR(k,0));
-            norm = Teuchos::ScalarTraits<Magnitude>::squareroot(norm);
-
-            // R = norm
-            coarseNS[0][offset] = norm;
-
-            // Q = localQR(:,0)/norm
-            for (LO i = 0; i < aggSize; i++)
-              localQR(i,0) /= norm;
-
-          } else {
-            Teuchos::SerialQRDenseSolver<LO,SC> qrSolver;
-            qrSolver.setMatrix(Teuchos::rcp(&localQR, false));
-            qrSolver.factor();
-
-            // R = upper triangular part of localQR
-            for (size_t j = 0; j < NSDim; j++)
-              for (size_t k = 0; k <= j; k++)
-                coarseNS[j][offset+k] = localQR(k,j); //TODO is offset+k the correct local ID?!
-
-            // Calculate Q, the tentative prolongator.
-            // The Lapack GEQRF call only works for myAggsize >= NSDim
-            qrSolver.formQ();
-            Teuchos::RCP<Teuchos::SerialDenseMatrix<LO,SC> > qFactor = qrSolver.getQ();
-            for (size_t j = 0; j < NSDim; j++)
-              for (size_t i = 0; i < Teuchos::as<size_t>(aggSize); i++)
-                localQR(i,j) = (*qFactor)(i,j);
-          }
-
-        } else {
-          // Special handling for aggSize < NSDim (i.e. single node aggregates in structural mechanics)
-
-          // The local QR decomposition is not possible in the "overconstrained"
-          // case (i.e. number of columns in localQR > number of rows), which
-          // corresponds to #DOFs in Aggregate < NSDim. For usual problems this
-          // is only possible for single node aggregates in structural mechanics.
-          // (Similar problems may arise in discontinuous Galerkin problems...)
-          // We bypass the QR decomposition and use an identity block in the
-          // tentative prolongator for the single node aggregate and transfer the
-          // corresponding fine level null space information 1-to-1 to the coarse
-          // level null space part.
-
-          // NOTE: The resulting tentative prolongation operator has
-          // (aggSize*DofsPerNode-NSDim) zero columns leading to a singular
-          // coarse level operator A.  To deal with that one has the following
-          // options:
-          // - Use the "RepairMainDiagonal" flag in the RAPFactory (default:
-          //   false) to add some identity block to the diagonal of the zero rows
-          //   in the coarse level operator A, such that standard level smoothers
-          //   can be used again.
-          // - Use special (projection-based) level smoothers, which can deal
-          //   with singular matrices (very application specific)
-          // - Adapt the code below to avoid zero columns. However, we do not
-          //   support a variable number of DOFs per node in MueLu/Xpetra which
-          //   makes the implementation really hard.
-
-          // R = extended (by adding identity rows) localQR
-          for (size_t j = 0; j < NSDim; j++)
-            for (size_t k = 0; k < NSDim; k++)
-              if (k < as<size_t>(aggSize))
-                coarseNS[j][offset+k] = localQR(k,j);
-              else
-                coarseNS[j][offset+k] = (k == j ? one : zero);
-
-          // Q = I (rectangular)
-          for (size_t i = 0; i < as<size_t>(aggSize); i++)
-            for (size_t j = 0; j < NSDim; j++)
-              localQR(i,j) = (j == i ? one : zero);
-        }
-
-
-        // Process each row in the local Q factor
-        // FIXME: What happens if maps are blocked?
-        for (LO j = 0; j < aggSize; j++) {
-          LO localRow = (goodMap ? aggToRowMapLO[aggStart[agg]+j] : rowMap->getLocalElement(aggToRowMapGO[aggStart[agg]+j]));
-
-          size_t rowStart = ia[localRow];
-          for (size_t k = 0, lnnz = 0; k < NSDim; k++) {
-            // Skip zeros (there may be plenty of them, i.e., NSDim > 1 or boundary conditions)
-            if (localQR(j,k) != zero) {
-              ja [rowStart+lnnz] = offset + k;
-              val[rowStart+lnnz] = localQR(j,k);
-              lnnz++;
-            }
-          }
-        }
-      }
-
-    } else {
-      GetOStream(Runtime1) << "TentativePFactory : bypassing local QR phase" << std::endl;
-      if (NSDim>1)
-        GetOStream(Warnings0) << "TentativePFactory : for nontrivial nullspace, this may degrade performance" << std::endl;
-      /////////////////////////////
-      //      "no-QR" option     //
-      /////////////////////////////
-      // Local Q factor is just the fine nullspace support over the current aggregate.
-      // Local R factor is the identity.
-      // TODO I have not implemented any special handling for aggregates that are too
-      // TODO small to locally support the nullspace, as is done in the standard QR
-      // TODO case above.
-      if (goodMap) {
-        for (GO agg = 0; agg < numAggs; agg++) {
-          const LO aggSize = aggStart[agg+1] - aggStart[agg];
-          Xpetra::global_size_t offset = agg*NSDim;
-
-          // Process each row in the local Q factor
-          // FIXME: What happens if maps are blocked?
-          for (LO j = 0; j < aggSize; j++) {
-
-            //TODO Here I do not check for a zero nullspace column on the aggregate.
-            //     as is done in the standard QR case.
-
-            const LO localRow = aggToRowMapLO[aggStart[agg]+j];
-
-            const size_t rowStart = ia[localRow];
-
-            for (size_t k = 0, lnnz = 0; k < NSDim; k++) {
-              // Skip zeros (there may be plenty of them, i.e., NSDim > 1 or boundary conditions)
-              SC qr_jk = fineNS[k][aggToRowMapLO[aggStart[agg]+j]];
-              if(constantColSums) qr_jk = qr_jk / (Magnitude)aggSizes[agg];
-              if (qr_jk != zero) {
-                ja [rowStart+lnnz] = offset + k;
-                val[rowStart+lnnz] = qr_jk;
-                lnnz++;
-              }
-            }
-          }
-          for (size_t j = 0; j < NSDim; j++)
-            coarseNS[j][offset+j] = one;
-        } //for (GO agg = 0; agg < numAggs; agg++)
-
-      } else {
-        for (GO agg = 0; agg < numAggs; agg++) {
-          const LO aggSize = aggStart[agg+1] - aggStart[agg];
-          Xpetra::global_size_t offset = agg*NSDim;
-          for (LO j = 0; j < aggSize; j++) {
-
-            const LO localRow = rowMap->getLocalElement(aggToRowMapGO[aggStart[agg]+j]);
-
-            const size_t rowStart = ia[localRow];
+    /////////////////////////////
+    //      "no-QR" option     //
+    /////////////////////////////
+    // Local Q factor is just the fine nullspace support over the current aggregate.
+    // Local R factor is the identity.
+    // NOTE: We're not going to do a QR here as we're assuming that blocksize == NSDim
+    // NOTE: "goodMap" case only
+    Teuchos::Array<Scalar> block(NSDim*NSDim, zero);
 
-            for (size_t k = 0, lnnz = 0; k < NSDim; ++k) {
-              // Skip zeros (there may be plenty of them, i.e., NSDim > 1 or boundary conditions)
-              SC qr_jk = fineNS[k][rowMap->getLocalElement(aggToRowMapGO[aggStart[agg]+j])];
-              if(constantColSums) qr_jk = qr_jk / (Magnitude)aggSizes[agg];
-              if (qr_jk != zero) {
-                ja [rowStart+lnnz] = offset + k;
-                val[rowStart+lnnz] = qr_jk;
-                lnnz++;
-              }
-            }
-          }
-          for (size_t j = 0; j < NSDim; j++)
-            coarseNS[j][offset+j] = one;
-        } //for (GO agg = 0; agg < numAggs; agg++)
-
-      } //if (goodmap) else ...
+    GetOStream(Runtime1) << "TentativePFactory : bypassing local QR phase" << std::endl;
+    for (GO agg = 0; agg < numAggs; agg++) {
+      const LO aggSize = aggStart[agg+1] - aggStart[agg];
+      Xpetra::global_size_t offset = agg*NSDim;
 
-    } //if doQRStep ... else
+      // Process each row in the local Q factor
+      // NOTE: Blocks are in row-major order
+      for (LO j = 0; j < aggSize; j++) {
+        const LO localBlockRow = aggToRowMapLO[aggStart[agg]+j];
 
-    // Compress storage (remove all INVALID, which happen when we skip zeros)
-    // We do that in-place
-    size_t ia_tmp = 0, nnz = 0;
-    for (size_t i = 0; i < numRows; i++) {
-      for (size_t j = ia_tmp; j < ia[i+1]; j++)
-        if (ja[j] != INVALID) {
-          ja [nnz] = ja [j];
-          val[nnz] = val[j];
-          nnz++;
+        for (size_t r = 0; r < NSDim; r++) {
+          LO localPointRow = localBlockRow*NSDim + r;
+          for (size_t c = 0; c < NSDim; c++) 
+            block[r*NSDim+c] = fineNS[c][localPointRow];
         }
-      ia_tmp  = ia[i+1];
-      ia[i+1] = nnz;
-    }
-    if (rowMap->lib() == Xpetra::UseTpetra) {
-      // - Cannot resize for Epetra, as it checks for same pointers
-      // - Need to resize for Tpetra, as it check ().size() == ia[numRows]
-      // NOTE: these invalidate ja and val views
-      jaPtent .resize(nnz);
-      valPtent.resize(nnz);
-    }
-
-    GetOStream(Runtime1) << "TentativePFactory : aggregates do not cross process boundaries" << std::endl;
-
-    PtentCrs->setAllValues(iaPtent, jaPtent, valPtent);
+        // NOTE: Assumes columns==aggs and are ordered sequentially
+        P_tpetra->replaceLocalValues(localBlockRow,&agg,block.getRawPtr(),1);
 
+      }//end aggSize
+        
+      for (size_t j = 0; j < NSDim; j++)
+        coarseNS[j][offset+j] = one;
+      
+    } //for (GO agg = 0; agg < numAggs; agg++)
 
-    // Managing labels & constants for ESFC
-    RCP<ParameterList> FCparams;
-    if(pL.isSublist("matrixmatrix: kernel params"))
-      FCparams=rcp(new ParameterList(pL.sublist("matrixmatrix: kernel params")));
-    else
-      FCparams= rcp(new ParameterList);
-    // By default, we don't need global constants for TentativeP
-    FCparams->set("compute global constants",FCparams->get("compute global constants",false));
-    std::string levelIDs = toString(levelID);
-    FCparams->set("Timer Label",std::string("MueLu::TentativeP-")+levelIDs);
-    RCP<const Export> dummy_e;
-    RCP<const Import> dummy_i;
+    Ptentative = P_wrap;
 
-    PtentCrs->expertStaticFillComplete(coarseMap, A->getDomainMap(),dummy_i,dummy_e,FCparams);
-#endif
+    Xpetra::IO<SC,LO,GO,NO>::Write("pblock.dat",*Ptentative);
+    Xpetra::IO<SC,LO,GO,NO>::Write("fnullspace.dat",*fineNullspace);
 
 #else
     throw std::runtime_error("TentativePFactory::BuildPuncoupledBlockCrs: Requires Tpetra");
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
index 75efcd51a3f8..12aaf2743d23 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
@@ -103,8 +103,8 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, BlockCrs, Scalar, Lo
       matrixParams.set("nx",(GlobalOrdinal)300);// needs to be even
 
       RCP<Matrix> A = TestHelpers::TpetraTestFactory<SC, LO, GO, NO>::BuildBlockMatrix(matrixParams,Xpetra::UseTpetra);  
-      out<<"Matrix Size = "<<A->getGlobalNumRows()<<std::endl;
-
+      out<<"Matrix Size (block) = "<<A->getGlobalNumRows()<<" (point) "<<A->getRangeMap()->getGlobalNumElements()<<std::endl;
+      Xpetra::IO<SC,LO,GO,NO>::Write("Ablock.dat",*A);
       RCP<const Teuchos::Comm<int> > comm = TestHelpers::Parameters::getDefaultComm();
       
       ArrayRCP<std::string> fileList = TestHelpers::GetFileList(std::string("ParameterList/ParameterListInterpreter/"), std::string(".xml"));

From f93596369a1ba3b40d19b9ebafaf335bdbfb3528 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 27 Jul 2022 14:42:56 -0600
Subject: [PATCH 053/130] Xpetra: Adding StorageBlockSize support

---
 .../src/BlockedCrsMatrix/Xpetra_BlockedCrsMatrix.hpp  |  3 +++
 packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrix.hpp    |  3 +++
 .../xpetra/src/CrsMatrix/Xpetra_EpetraCrsMatrix.hpp   | 11 +++++++++++
 .../CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp    |  3 +++
 .../src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp |  8 +++++++-
 .../src/CrsMatrix/Xpetra_TpetraCrsMatrix_decl.hpp     |  9 +++++++++
 .../xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp   |  3 +++
 .../xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp    |  5 +++++
 packages/xpetra/sup/Matrix/Xpetra_Matrix.hpp          |  6 ++++++
 9 files changed, 50 insertions(+), 1 deletion(-)

diff --git a/packages/xpetra/src/BlockedCrsMatrix/Xpetra_BlockedCrsMatrix.hpp b/packages/xpetra/src/BlockedCrsMatrix/Xpetra_BlockedCrsMatrix.hpp
index bb9d38caf18b..4c7893e0734b 100644
--- a/packages/xpetra/src/BlockedCrsMatrix/Xpetra_BlockedCrsMatrix.hpp
+++ b/packages/xpetra/src/BlockedCrsMatrix/Xpetra_BlockedCrsMatrix.hpp
@@ -1520,6 +1520,9 @@ namespace Xpetra {
       return thbOp;
     }
 #endif
+    //! Returns the block size of the storage mechanism
+    LocalOrdinal GetStorageBlockSize() const {return 1;}
+
 
     //! Compute a residual R = B - (*this) * X
     void residual(const MultiVector & X,
diff --git a/packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrix.hpp b/packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrix.hpp
index 407f1d45f31a..c0806e943ba8 100644
--- a/packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrix.hpp
+++ b/packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrix.hpp
@@ -352,6 +352,9 @@ namespace Xpetra {
     //! Does this have an underlying matrix
     virtual bool hasMatrix() const = 0;
 
+    //! Returns the block size of the storage mechanism, which is usually 1, except for Tpetra::BlockCrsMatrix
+    virtual LocalOrdinal GetStorageBlockSize() const = 0;
+
     //! Compute a residual R = B - (*this) * X
     virtual void residual(const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X,
                           const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & B,
diff --git a/packages/xpetra/src/CrsMatrix/Xpetra_EpetraCrsMatrix.hpp b/packages/xpetra/src/CrsMatrix/Xpetra_EpetraCrsMatrix.hpp
index 9b9321049333..42dc9b4d390a 100644
--- a/packages/xpetra/src/CrsMatrix/Xpetra_EpetraCrsMatrix.hpp
+++ b/packages/xpetra/src/CrsMatrix/Xpetra_EpetraCrsMatrix.hpp
@@ -258,6 +258,9 @@ local_matrix_type getLocalMatrixDevice () const {
     TEUCHOS_TEST_FOR_EXCEPTION(true, Xpetra::Exceptions::RuntimeError,
                                "Xpetra::EpetraCrsMatrix only available for GO=int or GO=long long with EpetraNode (Serial or OpenMP depending on configuration)");
   }
+
+  LocalOrdinal GetStorageBlockSize() const {return 1;}
+
 #else
 #ifdef __GNUC__
 #warning "Xpetra Kokkos interface for CrsMatrix is enabled (HAVE_XPETRA_KOKKOS_REFACTOR) but Tpetra is disabled. The Kokkos interface needs Tpetra to be enabled, too."
@@ -265,6 +268,7 @@ local_matrix_type getLocalMatrixDevice () const {
 #endif
 #endif
 
+
   void residual(const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X,
                 const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & B,
                 MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & R) const{ 
@@ -1305,6 +1309,7 @@ typename local_matrix_type::HostMirror getLocalMatrixHost () const {
   }
 
 
+  LocalOrdinal GetStorageBlockSize() const {return 1;}
 
 private:
 #else
@@ -1315,6 +1320,8 @@ typename local_matrix_type::HostMirror getLocalMatrixHost () const {
 #endif
   //@}
 
+
+
   void residual(const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X,
                 const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & B,
                 MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & R) const {
@@ -2348,6 +2355,8 @@ class EpetraCrsMatrixT <long long, EpetraNode>
 
   }
 
+
+  LocalOrdinal GetStorageBlockSize() const {return 1;}
  
 private:
 #else
@@ -2356,6 +2365,8 @@ class EpetraCrsMatrixT <long long, EpetraNode>
 #endif
 #endif
 #endif
+
+
   //@}
 
  void residual(const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X,
diff --git a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp
index 1db4e9d5bd3f..5e7021365f48 100644
--- a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp
+++ b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp
@@ -410,6 +410,9 @@ namespace Xpetra {
 #endif  // HAVE_XPETRA_TPETRA
 #endif  // HAVE_XPETRA_KOKKOS_REFACTOR
 
+    //! Returns the block size of the storage mechanism
+    LocalOrdinal GetStorageBlockSize() const {return mtx_->getBlockSize();}
+
     //! Compute a residual R = B - (*this) * X
     void residual(const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X,
                   const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & B,
diff --git a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp
index 410dbddfab76..27f04f232739 100644
--- a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp
+++ b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp
@@ -47,6 +47,7 @@
 #define XPETRA_TPETRABLOCKCRSMATRIX_DEF_HPP
 
 #include "Xpetra_TpetraBlockCrsMatrix_decl.hpp"
+#include "Xpetra_TpetraCrsGraph.hpp"
 
 namespace Xpetra {
 
@@ -377,7 +378,12 @@ namespace Xpetra {
     TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>::
     getCrsGraph() const
     {
-      throw std::runtime_error("Xpetra::TpetraBlockCrsMatrix function not implemented in "+std::string(__FILE__)+":"+std::to_string(__LINE__));
+      XPETRA_MONITOR("TpetraBlockCrsMatrix::getCrsGraph"); 
+      using G_t = Tpetra::CrsGraph<LocalOrdinal,GlobalOrdinal,Node>;
+      using G_x = TpetraCrsGraph<LocalOrdinal,GlobalOrdinal,Node>;
+      RCP<G_t> t_graph = Teuchos::rcp_const_cast<G_t>(Teuchos::rcpFromRef(mtx_->getCrsGraph()));
+      RCP<const G_x> x_graph = rcp(new G_x(t_graph));
+      return x_graph;
     }
     
 
diff --git a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraCrsMatrix_decl.hpp b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraCrsMatrix_decl.hpp
index d5e94fee5ade..b6fa11b68eae 100644
--- a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraCrsMatrix_decl.hpp
+++ b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraCrsMatrix_decl.hpp
@@ -453,6 +453,9 @@ namespace Xpetra {
 #endif
 #endif
 
+    //! Returns the block size of the storage mechanism, which is usually 1, except for Tpetra::BlockCrsMatrix
+    LocalOrdinal GetStorageBlockSize() const {return 1;}
+
     //! Compute a residual R = B - (*this) * X
     void residual(const MultiVector & X,
                   const MultiVector & B,
@@ -860,6 +863,9 @@ namespace Xpetra {
 #endif
 #endif
 
+    //! Returns the block size of the storage mechanism, which is usually 1, except for Tpetra::BlockCrsMatrix
+    LocalOrdinal GetStorageBlockSize() const {return 1;}
+
     //! Compute a residual R = B - (*this) * X
     void residual(const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X,
                   const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & B,
@@ -1263,6 +1269,9 @@ namespace Xpetra {
 #endif
 #endif
 
+    //! Returns the block size of the storage mechanism, which is usually 1, except for Tpetra::BlockCrsMatrix
+    LocalOrdinal GetStorageBlockSize() const {return 1;}
+
     //! Compute a residual R = B - (*this) * X
     void residual(const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X,
                   const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & B,
diff --git a/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp b/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp
index c30d1a00991f..bde79e1800e7 100644
--- a/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp
+++ b/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp
@@ -480,6 +480,9 @@ class CrsMatrixWrap :
   RCP<CrsMatrix> getCrsMatrix() const;
 
 
+  //! Returns the block size of the storage mechanism, which is usually 1, except for Tpetra::BlockCrsMatrix
+  LocalOrdinal GetStorageBlockSize() const;
+
   //! Compute a residual R = B - (*this) * X
   void residual(const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X,
                 const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & B,
diff --git a/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp b/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp
index c3914921aa83..9efb6aa4e0b5 100644
--- a/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp
+++ b/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp
@@ -497,6 +497,11 @@ namespace Xpetra {
   }
 
 
+  template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
+  LocalOrdinal CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>::GetStorageBlockSize() const {
+    return matrixData_->GetStorageBlockSize();
+  }
+
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
   void CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>::residual(
             const MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & X, 
diff --git a/packages/xpetra/sup/Matrix/Xpetra_Matrix.hpp b/packages/xpetra/sup/Matrix/Xpetra_Matrix.hpp
index b7f9432f054f..69c11f74ccec 100644
--- a/packages/xpetra/sup/Matrix/Xpetra_Matrix.hpp
+++ b/packages/xpetra/sup/Matrix/Xpetra_Matrix.hpp
@@ -559,11 +559,17 @@ namespace Xpetra {
         return 1;
     }; //TODO: why LocalOrdinal?
 
+
     //! Returns true, if `SetFixedBlockSize` has been called before.
     bool IsFixedBlockSizeSet() const {
       return IsView("stridedMaps");
     };
 
+
+    //! Returns the block size of the storage mechanism, which is usually 1, except for Tpetra::BlockCrsMatrix
+    virtual LocalOrdinal GetStorageBlockSize() const = 0;
+
+
     // ----------------------------------------------------------------------------------
 
     virtual void SetMaxEigenvalueEstimate(Scalar const &sigma) {

From 0d3523de50cfcca6b11978a5def263153c582b8e Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 27 Jul 2022 14:43:41 -0600
Subject: [PATCH 054/130] MueLu: Adding placeholder BlockCrs support

---
 .../muelu/src/Utils/MueLu_Utilities_decl.hpp  | 124 +++++++++++++++++-
 1 file changed, 119 insertions(+), 5 deletions(-)

diff --git a/packages/muelu/src/Utils/MueLu_Utilities_decl.hpp b/packages/muelu/src/Utils/MueLu_Utilities_decl.hpp
index b3f8ab3fc887..0d66dbf06f82 100644
--- a/packages/muelu/src/Utils/MueLu_Utilities_decl.hpp
+++ b/packages/muelu/src/Utils/MueLu_Utilities_decl.hpp
@@ -97,6 +97,8 @@ class Epetra_Vector;
 
 #ifdef HAVE_MUELU_TPETRA
 #include <Tpetra_CrsMatrix.hpp>
+#include <Tpetra_BlockCrsMatrix.hpp>
+#include <Tpetra_BlockCrsMatrix_Helpers.hpp>
 #include <Tpetra_FECrsMatrix.hpp>
 #include <Tpetra_RowMatrixTransposer.hpp>
 #include <Tpetra_Map.hpp>
@@ -199,6 +201,14 @@ namespace MueLu {
     static const Tpetra::CrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Op2TpetraCrs(const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op);
     static       Tpetra::CrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Op2NonConstTpetraCrs(Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op);
 
+    static RCP<const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Op2TpetraBlockCrs(RCP<const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > Op);
+   static RCP<      Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Op2NonConstTpetraBlockCrs(RCP<Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > Op);
+
+   static const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Op2TpetraBlockCrs(const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op);
+    static       Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Op2NonConstTpetraBlockCrs(Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op);
+
+
+
     static RCP<const Tpetra::RowMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Op2TpetraRow(RCP<const Xpetra::Operator<Scalar,LocalOrdinal,GlobalOrdinal,Node> > Op);
     static RCP<      Tpetra::RowMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Op2NonConstTpetraRow(RCP<Xpetra::Operator<Scalar,LocalOrdinal,GlobalOrdinal,Node> > Op);
 
@@ -532,6 +542,76 @@ namespace MueLu {
 #endif
     }
 
+
+    static RCP<const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Op2TpetraBlockCrs(RCP<const Matrix> Op)  {
+#if ((defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_OPENMP) || !defined(HAVE_TPETRA_INST_INT_INT))) || \
+    (!defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_SERIAL) || !defined(HAVE_TPETRA_INST_INT_INT))))
+      throw Exceptions::RuntimeError("Op2TpetraBlockCrs: Tpetra has not been compiled with support for LO=GO=int.");
+#else
+      // Get the underlying Tpetra Mtx
+      RCP<const CrsMatrixWrap> crsOp = rcp_dynamic_cast<const CrsMatrixWrap>(Op);
+      if (crsOp == Teuchos::null)
+        throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
+      const RCP<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > &tmp_ECrsMtx = rcp_dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >(crsOp->getCrsMatrix());
+      if (tmp_ECrsMtx == Teuchos::null)
+        throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
+      return tmp_ECrsMtx->getTpetra_BlockCrsMatrix();
+#endif
+    }
+
+    static RCP<      Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Op2NonConstTpetraBlockCrs(RCP<Matrix> Op){
+#if ((defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_OPENMP) || !defined(HAVE_TPETRA_INST_INT_INT))) || \
+    (!defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_SERIAL) || !defined(HAVE_TPETRA_INST_INT_INT))))
+      throw Exceptions::RuntimeError("Op2NonConstTpetraBlockCrs: Tpetra has not been compiled with support for LO=GO=int.");
+#else
+      RCP<const CrsMatrixWrap> crsOp = rcp_dynamic_cast<const CrsMatrixWrap>(Op);
+      if (crsOp == Teuchos::null)
+        throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
+      const RCP<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > &tmp_ECrsMtx = rcp_dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >(crsOp->getCrsMatrix());
+      if (tmp_ECrsMtx == Teuchos::null)
+        throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
+      return tmp_ECrsMtx->getTpetra_BlockCrsMatrixNonConst();
+#endif
+    };
+
+    static const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Op2TpetraBlockCrs(const Matrix& Op)   {
+#if ((defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_OPENMP) || !defined(HAVE_TPETRA_INST_INT_INT))) || \
+    (!defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_SERIAL) || !defined(HAVE_TPETRA_INST_INT_INT))))
+      throw Exceptions::RuntimeError("Op2TpetraBlockCrs: Tpetra has not been compiled with support for LO=GO=int.");
+#else
+      try {
+        const CrsMatrixWrap& crsOp = dynamic_cast<const CrsMatrixWrap&>(Op);
+        try {
+          const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& tmp_ECrsMtx = dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&>(*crsOp.getCrsMatrix());
+          return *tmp_ECrsMtx.getTpetra_BlockCrsMatrix();
+        } catch (std::bad_cast&) {
+          throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
+        }
+      } catch (std::bad_cast&) {
+        throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
+      }
+#endif
+    }
+    static       Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Op2NonConstTpetraBlockCrs(Matrix& Op) {
+#if ((defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_OPENMP) || !defined(HAVE_TPETRA_INST_INT_INT))) || \
+    (!defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_SERIAL) || !defined(HAVE_TPETRA_INST_INT_INT))))
+      throw Exceptions::RuntimeError("Op2NonConstTpetraCrs: Tpetra has not been compiled with support for LO=GO=int.");
+#else
+      try {
+        CrsMatrixWrap& crsOp = dynamic_cast<CrsMatrixWrap&>(Op);
+        try {
+          Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& tmp_ECrsMtx = dynamic_cast<Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&>(*crsOp.getCrsMatrix());
+          return *tmp_ECrsMtx.getTpetra_BlockCrsMatrixNonConst();
+        } catch (std::bad_cast&) {
+          throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
+        }
+      } catch (std::bad_cast&) {
+        throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
+      }
+#endif
+    }
+
+
     static RCP<const Tpetra::RowMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Op2TpetraRow(RCP<const Operator> Op)   {
 #if ((defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_OPENMP) || !defined(HAVE_TPETRA_INST_INT_INT))) || \
     (!defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_SERIAL) || !defined(HAVE_TPETRA_INST_INT_INT))))
@@ -799,9 +879,11 @@ namespace MueLu {
     (!defined(EPETRA_HAVE_OMP) && (!defined(HAVE_TPETRA_INST_SERIAL) || !defined(HAVE_TPETRA_INST_INT_INT))))
             throw Exceptions::RuntimeError("Utilities::Transpose: Tpetra is not compiled with LO=GO=int. Add TPETRA_INST_INT_INT:BOOL=ON to your configuration!");
 #else
-            try {
+            using Helpers = Xpetra::Helpers<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+            /***************************************************************/
+            if(Helpers::isTpetraCrs(Op)) {
               const Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>& tpetraOp = Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraCrs(Op);
-
+              
               // Compute the transpose A of the Tpetra matrix tpetraOp.
               RCP<Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > A;
               Tpetra::RowMatrixTransposer<Scalar, LocalOrdinal, GlobalOrdinal, Node> transposer(rcpFromRef(tpetraOp),label);
@@ -825,9 +907,41 @@ namespace MueLu {
 
               return AAAA;
             }
-            catch (std::exception& e) {
-              std::cout << "threw exception '" << e.what() << "'" << std::endl;
-              throw Exceptions::RuntimeError("Utilities::Transpose failed, perhaps because matrix is not a Crs matrix");
+              /***************************************************************/
+            else if(Helpers::isTpetraBlockCrs(Op)) {
+              using BCRS = Tpetra::BlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+              using CRS  = Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+              const BCRS & tpetraOp = Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(Op);
+
+              std::cout<<"WARNING: Utilities::Transpose(): Using inefficient placeholder algorithm for Transpose"<<std::endl;//CMSCMS
+              RCP<BCRS> At;
+              RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpetraOp);
+              {
+                Tpetra::RowMatrixTransposer<Scalar, LocalOrdinal, GlobalOrdinal, Node> transposer(Acrs,label);
+
+                using Teuchos::ParameterList;
+                using Teuchos::rcp;
+                RCP<ParameterList> transposeParams = params.is_null () ?
+                  rcp (new ParameterList) :
+                  rcp (new ParameterList (*params));
+                transposeParams->set ("sort", false);
+                RCP<CRS> Atcrs = transposer.createTranspose(transposeParams);
+                
+                At = Tpetra::convertToBlockCrsMatrix(*Atcrs,Op.GetStorageBlockSize());
+              }
+              RCP<Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > AA   = rcp(new Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>(At));
+              RCP<CrsMatrix>                                                           AAA  = rcp_implicit_cast<CrsMatrix>(AA);
+              RCP<Matrix>                                                              AAAA = rcp( new CrsMatrixWrap(AAA));
+              
+              if (Op.IsView("stridedMaps"))
+                AAAA->CreateView("stridedMaps", Teuchos::rcpFromRef(Op), true/*doTranspose*/);
+
+              return AAAA;
+
+            }
+            /***************************************************************/
+            else {
+              throw Exceptions::RuntimeError("Utilities::Transpose failed, perhaps because matrix is not a Crs or BlockCrs matrix");
             }
 #endif
 #else

From 0e92ad49c0b44d76f7c5ce97663412ea3da7afd9 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 27 Jul 2022 14:44:51 -0600
Subject: [PATCH 055/130] MueLu: Removing comments / debugging output

---
 .../MueLu_TentativePFactory_def.hpp           | 29 +------------------
 1 file changed, 1 insertion(+), 28 deletions(-)

diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index 94cf235ffe92..c75e29e850cb 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -338,8 +338,6 @@ namespace MueLu {
       amalgInfo->UnamalgamateAggregatesLO(*aggregates, aggStart, aggToRowMapLO);
       GetOStream(Runtime1) << "Column map is consistent with the row map, good." << std::endl;
     } else {
-      //      GetOStream(Warnings0) << "Column map is not consistent with the row map\n"
-      // << "using GO->LO conversion with performance penalty" << std::endl;
       throw std::runtime_error("TentativePFactory::PuncoupledBlockCrs: Inconsistent maps not currently supported");
     }
   
@@ -354,7 +352,6 @@ namespace MueLu {
         coarseNS[i] = coarseNullspace->getDataNonConst(i);
     }
 
-
     // BlockCrs requires that we build the (block) graph first, so let's do that...
     // NOTE: Because we're assuming that the NSDim == BlockSize, we only have one 
     // block non-zero per row in the matrix;
@@ -365,10 +362,6 @@ namespace MueLu {
     ArrayView<size_t> ia  = iaPtent();
     ArrayView<LO>     ja  = jaPtent();
 
-
-    printf("ia.size() = %d ja.size =%d numAggs=%d\n",(int)ia.size(),(int)ja.size(),numAggs);
-    fflush(stdout);
-
     for (size_t i = 0; i < numFineBlockRows; i++) {
       ia[i] = i;
       ja[i] = INVALID;
@@ -384,22 +377,11 @@ namespace MueLu {
         // FIXME: Allow for bad maps
         const LO localRow = aggToRowMapLO[aggStart[agg]+j];
         const size_t rowStart = ia[localRow];
-        printf("Writing (%d,%d) rowStart=%d\n",(int)localRow,(int)agg,(int)rowStart);fflush(stdout);
+        //printf("Writing (%d,%d) rowStart=%d\n",(int)localRow,(int)agg,(int)rowStart);fflush(stdout);
         ja[rowStart] = offset;
       }      
     }
 
-    /*
-    printf("Before compression: \nja:");
-    for(int i=0; i< (int)ja.size(); i++)
-      printf("%d ",(int)ja[i]);
-    printf("\n");
-    for (size_t i = 0; i < numFineBlockRows; i++) {
-      for (size_t j = ia[i]; j < ia[i+1]; j++) {
-        printf("%d %d\n",(int)i,(int)ja[j]);
-      }
-    }
-    */
     // Compress storage (remove all INVALID, which happen when we skip zeros)
     // We do that in-place
     size_t ia_tmp = 0, nnz = 0;
@@ -413,15 +395,6 @@ namespace MueLu {
       ia[i+1] = nnz;
     }
 
-    /*
-    printf("After compression: \n");
-    for (size_t i = 0; i < numFineBlockRows; i++) {
-      for (size_t j = ia[i]; j < ia[i+1]; j++) {
-        printf("%d %d\n",(int)i,(int)ja[j]);
-      }
-    }
-    */
-
     if (rowMap->lib() == Xpetra::UseTpetra) {
       // - Cannot resize for Epetra, as it checks for same pointers
       // - Need to resize for Tpetra, as it check ().size() == ia[numRows]

From c1cae46b07fbb19d25462dcd4ffd799f275718da Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 27 Jul 2022 21:27:59 -0600
Subject: [PATCH 056/130] Xpetra: Placeholder triple-matrix product
 implementation

---
 .../xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp  |  8 ++--
 .../sup/Utils/Xpetra_TripleMatrixMultiply.hpp | 46 +++++++++++++++----
 2 files changed, 42 insertions(+), 12 deletions(-)

diff --git a/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp b/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
index 533cb2309a95..da080b651be2 100644
--- a/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
@@ -254,25 +254,25 @@ Note: this class is not in the Xpetra_UseShortNames.hpp
       return tmp_BlockCrs->getTpetra_BlockCrsMatrixNonConst();
     }
 
-    static RCP<const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Op2TpetraBlockCrs(const Matrix& Op) {
+    static const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & Op2TpetraBlockCrs(const Matrix& Op) {
       try {
         const CrsMatrixWrap& crsOp = dynamic_cast<const CrsMatrixWrap&>(Op);
         RCP<const CrsMatrix> tmp_CrsMtx = crsOp.getCrsMatrix();
         RCP<const TpetraBlockCrsMatrix> tmp_BlockCrs= Teuchos::rcp_dynamic_cast<const TpetraBlockCrsMatrix>(tmp_CrsMtx);
         TEUCHOS_TEST_FOR_EXCEPTION(tmp_BlockCrs == Teuchos::null, Xpetra::Exceptions::BadCast, "Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
-        return tmp_BlockCrs->getTpetra_BlockCrsMatrix();
+        return *tmp_BlockCrs->getTpetra_BlockCrsMatrix();
       } catch(...) {
         throw(Xpetra::Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed"));
       }
     }
 
-    static RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Op2NonTpetraBlockCrs(const Matrix& Op) {
+    static Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & Op2NonConstTpetraBlockCrs(const Matrix& Op) {
       try {
         const CrsMatrixWrap& crsOp = dynamic_cast<const CrsMatrixWrap&>(Op);
         RCP<const CrsMatrix> tmp_CrsMtx = crsOp.getCrsMatrix();
         RCP<const TpetraBlockCrsMatrix> tmp_BlockCrs= Teuchos::rcp_dynamic_cast<const TpetraBlockCrsMatrix>(tmp_CrsMtx);     
         TEUCHOS_TEST_FOR_EXCEPTION(tmp_BlockCrs == Teuchos::null, Xpetra::Exceptions::BadCast, "Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
-        return tmp_BlockCrs->getTpetra_BlockCrsMatrixNonConst();
+        return *tmp_BlockCrs->getTpetra_BlockCrsMatrixNonConst();
       } catch(...) {
         throw(Xpetra::Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed"));
       }
diff --git a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
index afae82935439..227a1df570e4 100644
--- a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
@@ -58,10 +58,13 @@
 #include "Xpetra_Matrix.hpp"
 #include "Xpetra_StridedMapFactory.hpp"
 #include "Xpetra_StridedMap.hpp"
+#include "Xpetra_IO.hpp"
 
 #ifdef HAVE_XPETRA_TPETRA
 #include <TpetraExt_TripleMatrixMultiply.hpp>
 #include <Xpetra_TpetraCrsMatrix.hpp>
+#include <Tpetra_BlockCrsMatrix.hpp>
+#include <Tpetra_BlockCrsMatrix_Helpers.hpp>
 // #include <Xpetra_TpetraMultiVector.hpp>
 // #include <Xpetra_TpetraVector.hpp>
 #endif // HAVE_XPETRA_TPETRA
@@ -228,25 +231,52 @@ namespace Xpetra {
         throw(Xpetra::Exceptions::RuntimeError("Xpetra must be compiled with Tpetra <double,int,int> ETI enabled."));
 # else
         using helpers = Xpetra::Helpers<SC,LO,GO,NO>;
-        if(helpers::isTpetraCrs(R) && helpers::isTpetraCrs(A) && helpers::isTpetraCrs(P)) {
+        if(helpers::isTpetraCrs(R) && helpers::isTpetraCrs(A) && helpers::isTpetraCrs(P) && helpers::isTpetraCrs(Ac)) {
           // All matrices are Crs
-          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpR = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(R);
-          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpA = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(A);
-          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpP = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(P);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(R);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(A);
+          const Tpetra::CrsMatrix<SC,LO,GO,NO> & tpP  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraCrs(P);
           Tpetra::CrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraCrs(Ac);
           
           // 18Feb2013 JJH I'm reenabling the code that allows the matrix matrix multiply to do the fillComplete.
           // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
           Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
         }
-        else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
+        else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P) && helpers::isTpetraBlockCrs(Ac)) {
           // All matrices are BlockCrs
-          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(R);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpP  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(P);
+          Tpetra::BlockCrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraBlockCrs(Ac);
+
+          using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
+          RCP<const CRS> Rcrs = Tpetra::convertToCrsMatrix(tpR);
+          RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpA);
+          RCP<const CRS> Pcrs = Tpetra::convertToCrsMatrix(tpP);
+          RCP<CRS> Accrs = Tpetra::convertToCrsMatrix(tpAc);
+          Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, haveMultiplyDoFillComplete, label, params);
+
+          // Temporary output matrix
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_temp = Tpetra::convertToBlockCrsMatrix(*Accrs,Ac.GetStorageBlockSize());
+          
+          // We can now cheat and replace the innards of Ac
+          // WARNING: This assumes we're size compatible.  If not, well, errors happen.
+          Kokkos::deep_copy(tpAc.getValuesDeviceNonConst(),Ac_temp->getValuesDevice());
+          Kokkos::fence();
+
         }
         else {
-          // Mix and match
+          // Mix and match (not supported)
+          printf("A(%s)=%dx%d\n P(%s)=%dx%d R(%s)=%dx%d Ac(%s)=%dx%d\n",
+                 helpers::isTpetraBlockCrs(A) ? "Block" : "Point",A.getRangeMap()->getGlobalNumElements(),A.getDomainMap()->getGlobalNumElements(),
+                 helpers::isTpetraBlockCrs(P) ? "Block" : "Point",P.getRangeMap()->getGlobalNumElements(),P.getDomainMap()->getGlobalNumElements(),
+                 helpers::isTpetraBlockCrs(R) ? "Block" : "Point",R.getRangeMap()->getGlobalNumElements(),R.getDomainMap()->getGlobalNumElements(),
+                 helpers::isTpetraBlockCrs(Ac) ? "Block" : "Point",Ac.getRangeMap()->getGlobalNumElements(),Ac.getDomainMap()->getGlobalNumElements());
+
+
           TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "Mix-and-match Crs/BlockCrs Multiply not currently supported");      
-        }              
+        }            
 # endif
 #else
         throw(Xpetra::Exceptions::RuntimeError("Xpetra must be compiled with Tpetra."));

From 60a6fbbccb231e573676186ac393f036957e9fa0 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 28 Jul 2022 14:16:14 -0600
Subject: [PATCH 057/130] MueLu: This works

---
 packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp      | 11 +++++++++--
 .../MueLu_TentativePFactory_def.hpp                   |  3 +--
 .../ParameterListInterpreter/BlockCrs1.xml            |  2 +-
 3 files changed, 11 insertions(+), 5 deletions(-)

diff --git a/packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp b/packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp
index 318da1790a21..b4d5e4520ce2 100644
--- a/packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp
+++ b/packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp
@@ -56,6 +56,7 @@
 #include <Xpetra_TripleMatrixMultiply.hpp>
 #include <Xpetra_Vector.hpp>
 #include <Xpetra_VectorFactory.hpp>
+#include <Xpetra_IO.hpp>
 
 #include "MueLu_RAPFactory_decl.hpp"
 
@@ -281,8 +282,7 @@ namespace MueLu {
           Xpetra::TripleMatrixMultiply<SC,LO,GO,NO>::
             MultiplyRAP(*P, doTranspose, *A, !doTranspose, *P, !doTranspose, *Ac, doFillComplete,
                         doOptimizeStorage, labelstr+std::string("MueLu::R*A*P-implicit-")+levelstr.str(),
-                        RAPparams);
-
+                        RAPparams);         
         } else {
           RCP<Matrix> R = Get< RCP<Matrix> >(coarseLevel, "R");
           Ac = MatrixFactory::Build(R->getRowMap(), Teuchos::as<LO>(0));
@@ -293,6 +293,13 @@ namespace MueLu {
             MultiplyRAP(*R, !doTranspose, *A, !doTranspose, *P, !doTranspose, *Ac, doFillComplete,
                         doOptimizeStorage, labelstr+std::string("MueLu::R*A*P-explicit-")+levelstr.str(),
                         RAPparams);
+          printf("RAP: A range/row/summary = %d/%d/%d Ac range/row/summary = %d/%d/%d\n",
+                 (int)A->getRangeMap()->getGlobalNumElements(),(int)A->getRowMap()->getGlobalNumElements(),
+                 (int)A->getGlobalNumRows(),
+                 (int)Ac->getRangeMap()->getGlobalNumElements(),(int)Ac->getRowMap()->getGlobalNumElements(),
+                 (int)Ac->getGlobalNumRows());
+          //          Xpetra::IO<SC,LO,GO,NO>::Write("Ac.dat",*Ac);
+
         }
       
         Teuchos::ArrayView<const double> relativeFloor = pL.get<Teuchos::Array<double> >("rap: relative diagonal floor")();
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index c75e29e850cb..611cccfe5e95 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -301,7 +301,7 @@ namespace MueLu {
     // Need to generate the coarse block map
     // NOTE: We assume NSDim == block size here
     // NOTE: We also assume that coarseMap has contiguous GIDs
-    const size_t numCoarsePointRows = coarsePointMap->getLocalNumElements();
+    //const size_t numCoarsePointRows = coarsePointMap->getLocalNumElements();
     const size_t numCoarseBlockRows = coarsePointMap->getLocalNumElements() / NSDim;
     RCP<const Map> coarseBlockMap = MapFactory::Build(coarsePointMap->lib(),
                                                       Teuchos::OrdinalTraits<Xpetra::global_size_t>::invalid(),
@@ -334,7 +334,6 @@ namespace MueLu {
     ArrayRCP<LO> aggToRowMapLO;
     ArrayRCP<GO> aggToRowMapGO;
     if (goodMap) {
-      const bool stay_amalgamated = true;
       amalgInfo->UnamalgamateAggregatesLO(*aggregates, aggStart, aggToRowMapLO);
       GetOStream(Runtime1) << "Column map is consistent with the row map, good." << std::endl;
     } else {
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs1.xml b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs1.xml
index 5d16af3fb045..d048ab0d38d8 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs1.xml
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs1.xml
@@ -11,7 +11,7 @@
 
     <Parameter        name="multigrid algorithm"                  type="string"   value="unsmoothed"/>
 
-    <Parameter        name="max levels"                	          type="int"      value="2"/>
+    <Parameter        name="max levels"                	          type="int"      value="3"/>
 
     <!-- This is hardwired in the test generator -->
     <Parameter        name="number of equations"                  type="int"      value="3"/>

From ee3ece00e77d8a722c0f107e0851f249c009432e Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 28 Jul 2022 14:16:30 -0600
Subject: [PATCH 058/130] Xpetra: This works

---
 .../sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp  |  3 ++
 .../sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp   | 17 +++++++
 .../sup/Utils/Xpetra_TripleMatrixMultiply.hpp | 50 +++++++++++++------
 3 files changed, 56 insertions(+), 14 deletions(-)

diff --git a/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp b/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp
index bde79e1800e7..415acfa6c940 100644
--- a/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp
+++ b/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_decl.hpp
@@ -489,6 +489,9 @@ class CrsMatrixWrap :
                 MultiVector< Scalar, LocalOrdinal, GlobalOrdinal, Node > & R) const;
   
 
+  //! Expert only
+  void replaceCrsMatrix(RCP<CrsMatrix> & M);
+
   //@}
 private:
 
diff --git a/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp b/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp
index 9efb6aa4e0b5..8a1d48d3b181 100644
--- a/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp
+++ b/packages/xpetra/sup/Matrix/Xpetra_CrsMatrixWrap_def.hpp
@@ -497,6 +497,23 @@ namespace Xpetra {
   }
 
 
+  // Expert only
+  template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
+  void CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>::replaceCrsMatrix(RCP<CrsMatrix> & M) {
+    // Clear the old view table
+    Teuchos::Hashtable<viewLabel_t, RCP<MatrixView> > dummy_table;
+    Matrix::operatorViewTable_ = dummy_table;
+
+    finalDefaultView_ = M->isFillComplete();
+    // Set matrix data
+    matrixData_ = M;
+    
+
+    // Default view
+    CreateDefaultView();
+  }
+
+
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
   LocalOrdinal CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>::GetStorageBlockSize() const {
     return matrixData_->GetStorageBlockSize();
diff --git a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
index 227a1df570e4..b0359290208a 100644
--- a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
@@ -242,37 +242,59 @@ namespace Xpetra {
           // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
           Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
         }
-        else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P) && helpers::isTpetraBlockCrs(Ac)) {
-          // All matrices are BlockCrs
+        else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
+          // All matrices are BlockCrs (except maybe Ac)
+          // FIXME: For the moment we're just going to clobber the innards of AC, so no reuse. Once we have a reuse kernel,
+          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
           std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(R);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpP  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(P);
-          Tpetra::BlockCrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraBlockCrs(Ac);
+          //          Tpetra::BlockCrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraBlockCrs(Ac);
 
           using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
           RCP<const CRS> Rcrs = Tpetra::convertToCrsMatrix(tpR);
           RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpA);
           RCP<const CRS> Pcrs = Tpetra::convertToCrsMatrix(tpP);
-          RCP<CRS> Accrs = Tpetra::convertToCrsMatrix(tpAc);
-          Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, haveMultiplyDoFillComplete, label, params);
+          //          RCP<CRS> Accrs = Tpetra::convertToCrsMatrix(tpAc);
+          
+          // FIXME: This lines below only works because we're assuming Ac is Point
+          RCP<CRS> Accrs = Teuchos::rcp(new CRS(Rcrs->getRowMap(),0));
+          const bool do_fill_complete=true;
+          Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, do_fill_complete, label, params);
 
           // Temporary output matrix
-          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_temp = Tpetra::convertToBlockCrsMatrix(*Accrs,Ac.GetStorageBlockSize());
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());
           
+          printf("Ac_t r/r/s=%d/%d/%d\n",
+                 (int)Ac_t->getRangeMap()->getGlobalNumElements(),(int)Ac_t->getRowMap()->getGlobalNumElements(),
+                 (int)Ac_t->getGlobalNumRows());
+
+          RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
+          RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
+
           // We can now cheat and replace the innards of Ac
-          // WARNING: This assumes we're size compatible.  If not, well, errors happen.
-          Kokkos::deep_copy(tpAc.getValuesDeviceNonConst(),Ac_temp->getValuesDevice());
-          Kokkos::fence();
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO>>(Teuchos::rcpFromRef(Ac));
+          Ac_w->replaceCrsMatrix(Ac_p);
+          //          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp(new Xpetra::CrsMatrixWrap<SC,LO,GO,NO>(Ac_p));
+          //          Ac = *Ac_w;
+          printf("Ac_w row = %d\n",(int)Ac_w->getRowMap()->getGlobalNumElements());
+          printf("Ac_w range = %d\n",(int)Ac_w->getRangeMap()->getGlobalNumElements());
+          printf("Ac_w summary = %d\n",(int)Ac_w->getGlobalNumRows());
+
+          printf("Ac row = %d\n",(int)Ac.getRowMap()->getGlobalNumElements());
+          printf("Ac range = %d\n",(int)Ac.getRangeMap()->getGlobalNumElements());
+          printf("Ac summary = %d\n",(int)Ac.getGlobalNumRows());
 
         }
         else {
           // Mix and match (not supported)
-          printf("A(%s)=%dx%d\n P(%s)=%dx%d R(%s)=%dx%d Ac(%s)=%dx%d\n",
-                 helpers::isTpetraBlockCrs(A) ? "Block" : "Point",A.getRangeMap()->getGlobalNumElements(),A.getDomainMap()->getGlobalNumElements(),
-                 helpers::isTpetraBlockCrs(P) ? "Block" : "Point",P.getRangeMap()->getGlobalNumElements(),P.getDomainMap()->getGlobalNumElements(),
-                 helpers::isTpetraBlockCrs(R) ? "Block" : "Point",R.getRangeMap()->getGlobalNumElements(),R.getDomainMap()->getGlobalNumElements(),
-                 helpers::isTpetraBlockCrs(Ac) ? "Block" : "Point",Ac.getRangeMap()->getGlobalNumElements(),Ac.getDomainMap()->getGlobalNumElements());
+          printf("A(%s)=%dx%d\n P(%s)=%dx%d R(%s)=%dx%d  Ac(%s)\n",
+                 helpers::isTpetraBlockCrs(A) ? "Block" : "Point",(int)A.getRangeMap()->getGlobalNumElements(),(int)A.getDomainMap()->getGlobalNumElements(),
+                 helpers::isTpetraBlockCrs(P) ? "Block" : "Point",(int)P.getRangeMap()->getGlobalNumElements(),(int)P.getDomainMap()->getGlobalNumElements(),
+                 helpers::isTpetraBlockCrs(R) ? "Block" : "Point",(int)R.getRangeMap()->getGlobalNumElements(),(int)R.getDomainMap()->getGlobalNumElements(),
+                 helpers::isTpetraBlockCrs(Ac) ? "Block" : "Point");
+          fflush(stdout);
 
 
           TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "Mix-and-match Crs/BlockCrs Multiply not currently supported");      

From 44edecff9c3a783c3f371d6158a48a3aac0dc96f Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 28 Jul 2022 14:21:57 -0600
Subject: [PATCH 059/130] Xpetra: Adding BlockCrs placeholders to the test of
 3xProduct

---
 .../sup/Utils/Xpetra_TripleMatrixMultiply.hpp | 87 ++++++++++++++-----
 1 file changed, 66 insertions(+), 21 deletions(-)

diff --git a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
index b0359290208a..d800df859a58 100644
--- a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
@@ -142,8 +142,39 @@ namespace Xpetra {
           Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
         }
         else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
-          // All matrices are BlockCrs
-          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+          // All matrices are BlockCrs (except maybe Ac)
+          // FIXME: For the moment we're just going to clobber the innards of AC, so no reuse. Once we have a reuse kernel,
+          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
+          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(R);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpP  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(P);
+          //          Tpetra::BlockCrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraBlockCrs(Ac);
+
+          using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
+          RCP<const CRS> Rcrs = Tpetra::convertToCrsMatrix(tpR);
+          RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpA);
+          RCP<const CRS> Pcrs = Tpetra::convertToCrsMatrix(tpP);
+          //          RCP<CRS> Accrs = Tpetra::convertToCrsMatrix(tpAc);
+          
+          // FIXME: This lines below only works because we're assuming Ac is Point
+          RCP<CRS> Accrs = Teuchos::rcp(new CRS(Rcrs->getRowMap(),0));
+          const bool do_fill_complete=true;
+          Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, do_fill_complete, label, params);
+
+          // Temporary output matrix
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());
+          
+          printf("Ac_t r/r/s=%d/%d/%d\n",
+                 (int)Ac_t->getRangeMap()->getGlobalNumElements(),(int)Ac_t->getRowMap()->getGlobalNumElements(),
+                 (int)Ac_t->getGlobalNumRows());
+
+          RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
+          RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
+
+          // We can now cheat and replace the innards of Ac
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO>>(Teuchos::rcpFromRef(Ac));
+          Ac_w->replaceCrsMatrix(Ac_p);         
         }
         else {
           // Mix and match
@@ -276,27 +307,10 @@ namespace Xpetra {
           // We can now cheat and replace the innards of Ac
           RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO>>(Teuchos::rcpFromRef(Ac));
           Ac_w->replaceCrsMatrix(Ac_p);
-          //          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp(new Xpetra::CrsMatrixWrap<SC,LO,GO,NO>(Ac_p));
-          //          Ac = *Ac_w;
-          printf("Ac_w row = %d\n",(int)Ac_w->getRowMap()->getGlobalNumElements());
-          printf("Ac_w range = %d\n",(int)Ac_w->getRangeMap()->getGlobalNumElements());
-          printf("Ac_w summary = %d\n",(int)Ac_w->getGlobalNumRows());
-
-          printf("Ac row = %d\n",(int)Ac.getRowMap()->getGlobalNumElements());
-          printf("Ac range = %d\n",(int)Ac.getRangeMap()->getGlobalNumElements());
-          printf("Ac summary = %d\n",(int)Ac.getGlobalNumRows());
 
         }
         else {
           // Mix and match (not supported)
-          printf("A(%s)=%dx%d\n P(%s)=%dx%d R(%s)=%dx%d  Ac(%s)\n",
-                 helpers::isTpetraBlockCrs(A) ? "Block" : "Point",(int)A.getRangeMap()->getGlobalNumElements(),(int)A.getDomainMap()->getGlobalNumElements(),
-                 helpers::isTpetraBlockCrs(P) ? "Block" : "Point",(int)P.getRangeMap()->getGlobalNumElements(),(int)P.getDomainMap()->getGlobalNumElements(),
-                 helpers::isTpetraBlockCrs(R) ? "Block" : "Point",(int)R.getRangeMap()->getGlobalNumElements(),(int)R.getDomainMap()->getGlobalNumElements(),
-                 helpers::isTpetraBlockCrs(Ac) ? "Block" : "Point");
-          fflush(stdout);
-
-
           TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "Mix-and-match Crs/BlockCrs Multiply not currently supported");      
         }            
 # endif
@@ -392,8 +406,39 @@ namespace Xpetra {
           Tpetra::TripleMatrixMultiply::MultiplyRAP(tpR, transposeR, tpA, transposeA, tpP, transposeP, tpAc, haveMultiplyDoFillComplete, label, params);
         }
         else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
-          // All matrices are BlockCrs
-          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+          // All matrices are BlockCrs (except maybe Ac)
+          // FIXME: For the moment we're just going to clobber the innards of AC, so no reuse. Once we have a reuse kernel,
+          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
+          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(R);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpP  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(P);
+          //          Tpetra::BlockCrsMatrix<SC,LO,GO,NO> &       tpAc = Xpetra::Helpers<SC,LO,GO,NO>::Op2NonConstTpetraBlockCrs(Ac);
+
+          using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
+          RCP<const CRS> Rcrs = Tpetra::convertToCrsMatrix(tpR);
+          RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpA);
+          RCP<const CRS> Pcrs = Tpetra::convertToCrsMatrix(tpP);
+          //          RCP<CRS> Accrs = Tpetra::convertToCrsMatrix(tpAc);
+          
+          // FIXME: This lines below only works because we're assuming Ac is Point
+          RCP<CRS> Accrs = Teuchos::rcp(new CRS(Rcrs->getRowMap(),0));
+          const bool do_fill_complete=true;
+          Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, do_fill_complete, label, params);
+
+          // Temporary output matrix
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());
+          
+          printf("Ac_t r/r/s=%d/%d/%d\n",
+                 (int)Ac_t->getRangeMap()->getGlobalNumElements(),(int)Ac_t->getRowMap()->getGlobalNumElements(),
+                 (int)Ac_t->getGlobalNumRows());
+
+          RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
+          RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
+
+          // We can now cheat and replace the innards of Ac
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO>>(Teuchos::rcpFromRef(Ac));
+          Ac_w->replaceCrsMatrix(Ac_p);   
         }
         else {
           // Mix and match

From 6918707764319fc7bce08d549e020cad6d401ffa Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 28 Jul 2022 14:28:36 -0600
Subject: [PATCH 060/130] MueLu: More cleanup

---
 packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp           | 7 -------
 .../Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp   | 4 ----
 .../unit_tests/ParameterList/ParameterListInterpreter.cpp  | 1 -
 3 files changed, 12 deletions(-)

diff --git a/packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp b/packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp
index b4d5e4520ce2..1a95e3cd1c7f 100644
--- a/packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp
+++ b/packages/muelu/src/Misc/MueLu_RAPFactory_def.hpp
@@ -293,13 +293,6 @@ namespace MueLu {
             MultiplyRAP(*R, !doTranspose, *A, !doTranspose, *P, !doTranspose, *Ac, doFillComplete,
                         doOptimizeStorage, labelstr+std::string("MueLu::R*A*P-explicit-")+levelstr.str(),
                         RAPparams);
-          printf("RAP: A range/row/summary = %d/%d/%d Ac range/row/summary = %d/%d/%d\n",
-                 (int)A->getRangeMap()->getGlobalNumElements(),(int)A->getRowMap()->getGlobalNumElements(),
-                 (int)A->getGlobalNumRows(),
-                 (int)Ac->getRangeMap()->getGlobalNumElements(),(int)Ac->getRowMap()->getGlobalNumElements(),
-                 (int)Ac->getGlobalNumRows());
-          //          Xpetra::IO<SC,LO,GO,NO>::Write("Ac.dat",*Ac);
-
         }
       
         Teuchos::ArrayView<const double> relativeFloor = pL.get<Teuchos::Array<double> >("rap: relative diagonal floor")();
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index 611cccfe5e95..5746a9118d1d 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -476,10 +476,6 @@ namespace MueLu {
     } //for (GO agg = 0; agg < numAggs; agg++)
 
     Ptentative = P_wrap;
-
-    Xpetra::IO<SC,LO,GO,NO>::Write("pblock.dat",*Ptentative);
-    Xpetra::IO<SC,LO,GO,NO>::Write("fnullspace.dat",*fineNullspace);
-
 #else
     throw std::runtime_error("TentativePFactory::BuildPuncoupledBlockCrs: Requires Tpetra");
 #endif
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
index 12aaf2743d23..8d0ce3a7cfe8 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
@@ -104,7 +104,6 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, BlockCrs, Scalar, Lo
 
       RCP<Matrix> A = TestHelpers::TpetraTestFactory<SC, LO, GO, NO>::BuildBlockMatrix(matrixParams,Xpetra::UseTpetra);  
       out<<"Matrix Size (block) = "<<A->getGlobalNumRows()<<" (point) "<<A->getRangeMap()->getGlobalNumElements()<<std::endl;
-      Xpetra::IO<SC,LO,GO,NO>::Write("Ablock.dat",*A);
       RCP<const Teuchos::Comm<int> > comm = TestHelpers::Parameters::getDefaultComm();
       
       ArrayRCP<std::string> fileList = TestHelpers::GetFileList(std::string("ParameterList/ParameterListInterpreter/"), std::string(".xml"));

From 989dcffb7303b09ca00c4c712f12c0aa299bb392 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 28 Jul 2022 14:41:57 -0600
Subject: [PATCH 061/130] MueLu: Fixing reporting

---
 packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp b/packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp
index 81751dab90ec..3aedb1b2cf70 100644
--- a/packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp
+++ b/packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp
@@ -1245,9 +1245,10 @@ namespace MueLu {
           break;
         }
 
-        Xpetra::global_size_t nnz = Am->getGlobalNumEntries();
+        LO storageblocksize=Am->GetStorageBlockSize();
+        Xpetra::global_size_t nnz = Am->getGlobalNumEntries()*storageblocksize*storageblocksize;
         nnzPerLevel     .push_back(nnz);
-        rowsPerLevel    .push_back(Am->getGlobalNumRows());
+        rowsPerLevel    .push_back(Am->getGlobalNumRows()*storageblocksize);
         numProcsPerLevel.push_back(Am->getRowMap()->getComm()->getSize());
       }
 

From ef7bb2328becb5b24044c43e10731cffad770828 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 28 Jul 2022 14:43:14 -0600
Subject: [PATCH 062/130] MueLu: Trying to prevent broken gold files

---
 .../MatrixTransformation/MueLu_AmalgamationFactory_def.hpp      | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
index 9e84ee4a9f5b..c2611f7ede72 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
@@ -108,7 +108,7 @@ namespace MueLu {
       stridedblocksize /= storageblocksize;
 
       oldView = A->SwitchToView(oldView);
-      GetOStream(Runtime1) << "AmalagamationFactory::Build():" << " found fullblocksize=" << fullblocksize << ", stridedblocksize=" << stridedblocksize << " and storageblocksize="<<storageblocksize<<" from strided maps. offset=" << offset << std::endl;
+      GetOStream(Runtime1) << "AmalagamationFactory::Build():" << " found fullblocksize=" << fullblocksize << ", stridedblocksize=" << stridedblocksize << " from strided maps. offset=" << offset << std::endl;
 
     } else {
       GetOStream(Warnings0) << "AmalagamationFactory::Build(): no striding information available. Use blockdim=1 with offset=0" << std::endl;

From 8e4d0c9602c8354bccc42a5fcf5b2177a6c2e60d Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 28 Jul 2022 14:50:21 -0600
Subject: [PATCH 063/130] Xpetra: removing debugging output

---
 packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp | 7 +------
 1 file changed, 1 insertion(+), 6 deletions(-)

diff --git a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
index d800df859a58..8d7a1ee9091a 100644
--- a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
@@ -163,12 +163,7 @@ namespace Xpetra {
           Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, do_fill_complete, label, params);
 
           // Temporary output matrix
-          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());
-          
-          printf("Ac_t r/r/s=%d/%d/%d\n",
-                 (int)Ac_t->getRangeMap()->getGlobalNumElements(),(int)Ac_t->getRowMap()->getGlobalNumElements(),
-                 (int)Ac_t->getGlobalNumRows());
-
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());          
           RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
           RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
 

From 27d5f791b9c0bf191a1ed7ab5c4e914c15fdbbfe Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 28 Jul 2022 16:15:22 -0600
Subject: [PATCH 064/130] MueLu: output fixes

---
 .../MueLu_AmalgamationFactory_def.hpp         |  2 +-
 .../MueLu_CoalesceDropFactory_def.hpp         | 24 ++++++++-----------
 2 files changed, 11 insertions(+), 15 deletions(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
index c2611f7ede72..260c7e5a741a 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
@@ -108,7 +108,7 @@ namespace MueLu {
       stridedblocksize /= storageblocksize;
 
       oldView = A->SwitchToView(oldView);
-      GetOStream(Runtime1) << "AmalagamationFactory::Build():" << " found fullblocksize=" << fullblocksize << ", stridedblocksize=" << stridedblocksize << " from strided maps. offset=" << offset << std::endl;
+      GetOStream(Runtime1) << "AmalagamationFactory::Build():" << " found fullblocksize=" << fullblocksize << " and stridedblocksize=" << stridedblocksize << " from strided maps. offset=" << offset << std::endl;
 
     } else {
       GetOStream(Warnings0) << "AmalagamationFactory::Build(): no striding information available. Use blockdim=1 with offset=0" << std::endl;
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
index 3af5eaf58509..6c2241c12b8d 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
@@ -370,7 +370,7 @@ namespace MueLu {
           distanceLaplacianAlgo = scaled_cut_symmetric;
         else
           TEUCHOS_TEST_FOR_EXCEPTION(true, Exceptions::RuntimeError, "\"aggregation: distance laplacian algo\" must be one of (default|unscaled cut|scaled cut), not \"" << distanceLaplacianAlgoStr << "\"");
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" distance laplacian algorithm = \"" << distanceLaplacianAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize()<< "storageblocksize = "<<A->GetStorageBlockSize() << std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" distance laplacian algorithm = \"" << distanceLaplacianAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
       } else if (algo == "classical") {
         if (classicalAlgoStr == "default")
           classicalAlgo = defaultAlgo;
@@ -380,10 +380,10 @@ namespace MueLu {
           classicalAlgo = scaled_cut;
         else
           TEUCHOS_TEST_FOR_EXCEPTION(true, Exceptions::RuntimeError, "\"aggregation: classical algo\" must be one of (default|unscaled cut|scaled cut), not \"" << classicalAlgoStr << "\"");
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" classical algorithm = \"" << classicalAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize()<< "storageblocksize = "<<A->GetStorageBlockSize() << std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" classical algorithm = \"" << classicalAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
         
       } else
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << "storageblocksize = "<<A->GetStorageBlockSize()<< std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
       Set<bool>(currentLevel, "Filtering", (threshold != STS::zero()));
 
       const typename STS::magnitudeType dirichletThreshold = STS::magnitude(as<SC>(pL.get<double>("aggregation: Dirichlet threshold")));
@@ -396,10 +396,6 @@ namespace MueLu {
       GO numDropped = 0, numTotal = 0;
       std::string graphType = "unamalgamated"; //for description purposes only
 
-      TEUCHOS_TEST_FOR_EXCEPTION(A->GetFixedBlockSize() % A->GetStorageBlockSize() != 0,Exceptions::RuntimeError,"A->GetFixedBlockSize() needs to be a multiple of A->GetStorageBlockSize()");
-      const LO BlockSize = A->GetFixedBlockSize() / A->GetStorageBlockSize();
-
-
       /************************** RS or SA-style Classical Dropping (and variants) **************************/
       if (algo == "classical") {
         if (predrop_ == null) {
@@ -421,7 +417,7 @@ namespace MueLu {
         // At this points we either have
         //     (predrop_ != null)
         // Therefore, it is sufficient to check only threshold
-        if ( BlockSize==1 && threshold == STS::zero() && !useSignedClassicalRS && !useSignedClassicalSA && A->hasCrsGraph()) {
+        if (A->GetFixedBlockSize() == 1 && threshold == STS::zero() && !useSignedClassicalRS && !useSignedClassicalSA && A->hasCrsGraph()) {
           // Case 1:  scalar problem, no dropping => just use matrix graph
           RCP<GraphBase> graph = rcp(new Graph(A->getCrsGraph(), "graph of A"));
           // Detect and record rows that correspond to Dirichlet boundary conditions
@@ -446,10 +442,10 @@ namespace MueLu {
           Set(currentLevel, "DofsPerNode", 1);
           Set(currentLevel, "Graph", graph);
 
-        } else if ( (BlockSize == 1 && threshold != STS::zero()) ||
-                    (BlockSize == 1 && threshold == STS::zero() && !A->hasCrsGraph()) ||
-                    (BlockSize == 1 && useSignedClassicalRS) ||
-                    (BlockSize == 1 && useSignedClassicalSA) ) {	  
+        } else if ( (A->GetFixedBlockSize() == 1 && threshold != STS::zero()) ||
+                    (A->GetFixedBlockSize() == 1 && threshold == STS::zero() && !A->hasCrsGraph()) ||
+                    (A->GetFixedBlockSize() == 1 && useSignedClassicalRS) ||
+                    (A->GetFixedBlockSize() == 1 && useSignedClassicalSA) ) {	  
           // Case 2:  scalar problem with dropping => record the column indices of undropped entries, but still use original
           //                                          graph's map information, e.g., whether index is local
           // OR a matrix without a CrsGraph
@@ -725,7 +721,7 @@ namespace MueLu {
            }
 #endif
           }//end generateColoringGraph
-        } else if (BlockSize > 1 && threshold == STS::zero()) {
+        } else if (A->GetFixedBlockSize() > 1 && threshold == STS::zero()) {
           // Case 3:  Multiple DOF/node problem without dropping
           const RCP<const Map> rowMap = A->getRowMap();
           const RCP<const Map> colMap = A->getColMap();
@@ -857,7 +853,7 @@ namespace MueLu {
           Set(currentLevel, "Graph",       graph);
           Set(currentLevel, "DofsPerNode", blkSize); // full block size
 
-        } else if (BlockSize > 1 && threshold != STS::zero()) {
+        } else if (A->GetFixedBlockSize() > 1 && threshold != STS::zero()) {
           // Case 4:  Multiple DOF/node problem with dropping
           const RCP<const Map> rowMap = A->getRowMap();
           const RCP<const Map> colMap = A->getColMap();

From 752ba62b53443a54b673a347460c4038c22cb2e0 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 1 Aug 2022 08:48:48 -0600
Subject: [PATCH 065/130] MueLu: Reverting poor choice of revert

---
 .../MueLu_CoalesceDropFactory_def.hpp         | 22 +++++++++++--------
 1 file changed, 13 insertions(+), 9 deletions(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
index 6c2241c12b8d..63dc2882ab88 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
@@ -370,7 +370,7 @@ namespace MueLu {
           distanceLaplacianAlgo = scaled_cut_symmetric;
         else
           TEUCHOS_TEST_FOR_EXCEPTION(true, Exceptions::RuntimeError, "\"aggregation: distance laplacian algo\" must be one of (default|unscaled cut|scaled cut), not \"" << distanceLaplacianAlgoStr << "\"");
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" distance laplacian algorithm = \"" << distanceLaplacianAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" distance laplacian algorithm = \"" << distanceLaplacianAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize()<< std::endl;
       } else if (algo == "classical") {
         if (classicalAlgoStr == "default")
           classicalAlgo = defaultAlgo;
@@ -380,7 +380,7 @@ namespace MueLu {
           classicalAlgo = scaled_cut;
         else
           TEUCHOS_TEST_FOR_EXCEPTION(true, Exceptions::RuntimeError, "\"aggregation: classical algo\" must be one of (default|unscaled cut|scaled cut), not \"" << classicalAlgoStr << "\"");
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" classical algorithm = \"" << classicalAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" classical algorithm = \"" << classicalAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize()<< "storageblocksize = "<<A->GetStorageBlockSize() << std::endl;
         
       } else
         GetOStream(Runtime0) << "algorithm = \"" << algo << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
@@ -396,6 +396,10 @@ namespace MueLu {
       GO numDropped = 0, numTotal = 0;
       std::string graphType = "unamalgamated"; //for description purposes only
 
+      TEUCHOS_TEST_FOR_EXCEPTION(A->GetFixedBlockSize() % A->GetStorageBlockSize() != 0,Exceptions::RuntimeError,"A->GetFixedBlockSize() needs to be a multiple of A->GetStorageBlockSize()");
+      const LO BlockSize = A->GetFixedBlockSize() / A->GetStorageBlockSize();
+
+
       /************************** RS or SA-style Classical Dropping (and variants) **************************/
       if (algo == "classical") {
         if (predrop_ == null) {
@@ -417,7 +421,7 @@ namespace MueLu {
         // At this points we either have
         //     (predrop_ != null)
         // Therefore, it is sufficient to check only threshold
-        if (A->GetFixedBlockSize() == 1 && threshold == STS::zero() && !useSignedClassicalRS && !useSignedClassicalSA && A->hasCrsGraph()) {
+        if ( BlockSize==1 && threshold == STS::zero() && !useSignedClassicalRS && !useSignedClassicalSA && A->hasCrsGraph()) {
           // Case 1:  scalar problem, no dropping => just use matrix graph
           RCP<GraphBase> graph = rcp(new Graph(A->getCrsGraph(), "graph of A"));
           // Detect and record rows that correspond to Dirichlet boundary conditions
@@ -442,10 +446,10 @@ namespace MueLu {
           Set(currentLevel, "DofsPerNode", 1);
           Set(currentLevel, "Graph", graph);
 
-        } else if ( (A->GetFixedBlockSize() == 1 && threshold != STS::zero()) ||
-                    (A->GetFixedBlockSize() == 1 && threshold == STS::zero() && !A->hasCrsGraph()) ||
-                    (A->GetFixedBlockSize() == 1 && useSignedClassicalRS) ||
-                    (A->GetFixedBlockSize() == 1 && useSignedClassicalSA) ) {	  
+        } else if ( (BlockSize == 1 && threshold != STS::zero()) ||
+                    (BlockSize == 1 && threshold == STS::zero() && !A->hasCrsGraph()) ||
+                    (BlockSize == 1 && useSignedClassicalRS) ||
+                    (BlockSize == 1 && useSignedClassicalSA) ) {	  
           // Case 2:  scalar problem with dropping => record the column indices of undropped entries, but still use original
           //                                          graph's map information, e.g., whether index is local
           // OR a matrix without a CrsGraph
@@ -721,7 +725,7 @@ namespace MueLu {
            }
 #endif
           }//end generateColoringGraph
-        } else if (A->GetFixedBlockSize() > 1 && threshold == STS::zero()) {
+        } else if (BlockSize > 1 && threshold == STS::zero()) {
           // Case 3:  Multiple DOF/node problem without dropping
           const RCP<const Map> rowMap = A->getRowMap();
           const RCP<const Map> colMap = A->getColMap();
@@ -853,7 +857,7 @@ namespace MueLu {
           Set(currentLevel, "Graph",       graph);
           Set(currentLevel, "DofsPerNode", blkSize); // full block size
 
-        } else if (A->GetFixedBlockSize() > 1 && threshold != STS::zero()) {
+        } else if (BlockSize > 1 && threshold != STS::zero()) {
           // Case 4:  Multiple DOF/node problem with dropping
           const RCP<const Map> rowMap = A->getRowMap();
           const RCP<const Map> colMap = A->getColMap();

From 6316f712da066b0bcb2f91812bdf990719e720b7 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 1 Aug 2022 09:05:39 -0600
Subject: [PATCH 066/130] MueLu: Adding clarifying comments

---
 .../MueLu_AmalgamationFactory_def.hpp           | 10 ++++++++++
 .../MueLu_TentativePFactory_def.hpp             | 17 ++++++++++-------
 2 files changed, 20 insertions(+), 7 deletions(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
index 260c7e5a741a..56d4fdb216cc 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
@@ -75,6 +75,16 @@ namespace MueLu {
 
     RCP<Matrix> A = Get< RCP<Matrix> >(currentLevel, "A");
 
+    /* NOTE: Fullblocksize here represents the number of blocks of whatever storage type is represented by the matrix, specifically
+       the GetFixedBlockSize() which should come from the # PDEs specified on the input deck (or null space dimension on finer levels).
+       So for a point matrix, that's the block size.  
+       
+       For a BlockCrsMatrix, that's the number of blocks of the BlockCrs object which make up a logical block for amalgamation.  Here we 
+       divide the GetFixedBlockSize() by the GetStorageBlockSize().  We've only tested fullblocksize=1 in the BlockCrs case, but in theory
+       you could use a larger number here.
+     */
+
+
     LO fullblocksize    = 1;   // block dim for fixed size blocks
     GO offset           = 0;   // global offset of dof gids
     LO blockid          = -1;  // block id in strided map
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index 5746a9118d1d..35984f36d182 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -279,6 +279,16 @@ namespace MueLu {
   BuildPuncoupledBlockCrs(RCP<Matrix> A, RCP<Aggregates> aggregates, RCP<AmalgamationInfo> amalgInfo, RCP<MultiVector> fineNullspace,
                           RCP<const Map> coarsePointMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const {
 #ifdef HAVE_MUELU_TPETRA
+
+    /* This routine generates a BlockCrs P for a BlockCrs A.  There are a few assumptions here, which meet the use cases we care about, but could 
+       be generalized later, if we ever need to do so:
+       1) Null space dimension === block size of matrix:  So no elasticity right now
+       2) QR is not supported:  Under assumption #1, this shouldn't cause problems.
+       3) Maps are "good": Aka the first chunk of the ColMap is the RowMap.
+
+       These assumptions keep our code way simpler and still support the use cases we actually care about.
+     */
+
     RCP<const Map> rowMap     = A->getRowMap();
     RCP<const Map> rangeMap   = A->getRangeMap();
     RCP<const Map> colMap     = A->getColMap();
@@ -295,9 +305,6 @@ namespace MueLu {
     const size_t NSDim     = fineNullspace->getNumVectors();
     ArrayRCP<LO> aggSizes  = aggregates->ComputeAggregateSizes();
 
-    printf("A # point rows = %d #  block rows = %d\n",(int)numFinePointRows,(int)numFineBlockRows);
-
-
     // Need to generate the coarse block map
     // NOTE: We assume NSDim == block size here
     // NOTE: We also assume that coarseMap has contiguous GIDs
@@ -308,9 +315,6 @@ namespace MueLu {
                                                       numCoarseBlockRows,
                                                       coarsePointMap->getIndexBase(),
                                                       coarsePointMap->getComm());    
-    //    Set(currentLevel, "CoarseBlockMap", coarseBlockMap);
-       
-
     // Sanity checking
     const ParameterList& pL = GetParameterList();
     const bool &doQRStep = pL.get<bool>("tentative: calculate qr");
@@ -376,7 +380,6 @@ namespace MueLu {
         // FIXME: Allow for bad maps
         const LO localRow = aggToRowMapLO[aggStart[agg]+j];
         const size_t rowStart = ia[localRow];
-        //printf("Writing (%d,%d) rowStart=%d\n",(int)localRow,(int)agg,(int)rowStart);fflush(stdout);
         ja[rowStart] = offset;
       }      
     }

From 4472f7924cbf31994c30eda3727aa53c2662e37d Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 1 Aug 2022 09:53:50 -0600
Subject: [PATCH 067/130] Xpetra: Expanding BlockCrsMatrix support

---
 .../src/CrsMatrix/Xpetra_CrsMatrixFactory.hpp | 62 ++++++++++++++++++-
 .../Xpetra_TpetraBlockCrsMatrix_decl.hpp      |  6 ++
 .../Xpetra_TpetraBlockCrsMatrix_def.hpp       | 12 ++++
 3 files changed, 78 insertions(+), 2 deletions(-)

diff --git a/packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrixFactory.hpp b/packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrixFactory.hpp
index d7ad7d410d61..9a81d816f02b 100644
--- a/packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrixFactory.hpp
+++ b/packages/xpetra/src/CrsMatrix/Xpetra_CrsMatrixFactory.hpp
@@ -52,6 +52,7 @@
 
 #ifdef HAVE_XPETRA_TPETRA
 #include "Xpetra_TpetraCrsMatrix.hpp"
+#include "Xpetra_TpetraBlockCrsMatrix.hpp"
 #endif
 
 #ifdef HAVE_XPETRA_EPETRA
@@ -289,6 +290,25 @@ namespace Xpetra {
       XPETRA_FACTORY_END;
     }
 #endif
+    
+    // Builds a BlockCrsMatrix
+    static RCP<CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > BuildBlock (
+        const Teuchos::RCP<const Xpetra::CrsGraph<LocalOrdinal, GlobalOrdinal, Node> >& blockGraph,
+        const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& domainMap,
+        const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& rangeMap,
+        LocalOrdinal blockSize) {
+  
+      XPETRA_MONITOR("CrsMatrixFactory::BuildBlock");
+
+#ifdef HAVE_XPETRA_TPETRA
+      if (domainMap->lib() == UseTpetra) {
+        return rcp(new Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>(blockGraph,domainMap,rangeMap,blockSize) );
+      }
+#endif
+      TEUCHOS_TEST_FOR_EXCEPTION(domainMap->lib() == UseEpetra, std::logic_error, "Epetra doesn't support this matrix constructor");
+
+      XPETRA_FACTORY_END;
+    }
 
   };
 
@@ -318,10 +338,9 @@ namespace Xpetra {
       if (rowMap->lib() == UseTpetra)
         return rcp( new TpetraCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>(rowMap, 0) );
 #endif
-#ifdef HAVE_XPETRA_EPETRA
       if(rowMap->lib() == UseEpetra)
         return rcp( new EpetraCrsMatrixT<int,Node>(rowMap));
-#endif
+
       XPETRA_FACTORY_END;
     }
 
@@ -543,6 +562,23 @@ namespace Xpetra {
     }
 #endif
 
+    //! Build a BlockCrsMatrix
+    static RCP<CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > BuildBlock (
+        const Teuchos::RCP<const Xpetra::CrsGraph<LocalOrdinal, GlobalOrdinal, Node> >& blockGraph,
+        const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& domainMap,
+        const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& rangeMap,
+        LocalOrdinal blockSize) {
+  
+      XPETRA_MONITOR("CrsMatrixFactory::BuildBlock");
+#ifdef HAVE_XPETRA_TPETRA
+      if (domainMap->lib() == UseTpetra)
+        return rcp(new Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>(blockGraph,domainMap,rangeMap,blockSize) );
+#endif
+      TEUCHOS_TEST_FOR_EXCEPTION(domainMap->lib() == UseEpetra, std::logic_error, "Epetra doesn't support this matrix constructor");
+
+      XPETRA_FACTORY_END;
+    }
+
   };
 #endif
 
@@ -772,6 +808,28 @@ namespace Xpetra {
     }
 #endif
 
+
+    //! Build a BlockCrsMatrix
+    static RCP<CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > BuildBlock (
+        const Teuchos::RCP<const Xpetra::CrsGraph<LocalOrdinal, GlobalOrdinal, Node> >& blockGraph,
+        const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& domainMap,
+        const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& rangeMap,
+        LocalOrdinal blockSize) {
+  
+      XPETRA_MONITOR("CrsMatrixFactory::BuildBlock");
+
+#ifdef HAVE_XPETRA_TPETRA
+      if (domainMap->lib() == UseTpetra) {
+        return rcp(new Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>(blockGraph,domainMap,rangemap,blockSize) );
+      }
+#endif
+      TEUCHOS_TEST_FOR_EXCEPTION(domainMap->lib() == UseEpetra, std::logic_error, "Epetra doesn't support this matrix constructor");
+
+      XPETRA_FACTORY_END;
+    }
+
+
+
   };
 #endif
 
diff --git a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp
index 5e7021365f48..2dc8bccf794b 100644
--- a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp
+++ b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_decl.hpp
@@ -113,6 +113,12 @@ namespace Xpetra {
     TpetraBlockCrsMatrix(const Teuchos::RCP< const CrsGraph< LocalOrdinal, GlobalOrdinal, Node> > &graph, 
                          const LocalOrdinal blockSize);
 
+    //! Constructor specifying a previously constructed graph, point maps & blocksize
+    TpetraBlockCrsMatrix(const Teuchos::RCP< const CrsGraph< LocalOrdinal, GlobalOrdinal, Node> > &graph, 
+                         const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& pointDomainMap,
+                         const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& pointRangeMap,
+                         const LocalOrdinal blockSize);
+
 
     //! Constructor for a fused import ( not implemented )
     TpetraBlockCrsMatrix(const Teuchos::RCP<const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >& sourceMatrix,
diff --git a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp
index 27f04f232739..fd069dd54356 100644
--- a/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp
+++ b/packages/xpetra/src/CrsMatrix/Xpetra_TpetraBlockCrsMatrix_def.hpp
@@ -46,6 +46,7 @@
 #ifndef XPETRA_TPETRABLOCKCRSMATRIX_DEF_HPP
 #define XPETRA_TPETRABLOCKCRSMATRIX_DEF_HPP
 
+
 #include "Xpetra_TpetraBlockCrsMatrix_decl.hpp"
 #include "Xpetra_TpetraCrsGraph.hpp"
 
@@ -119,6 +120,17 @@ namespace Xpetra {
     { }
 
 
+    //! Constructor specifying a previously constructed graph, point maps & blocksize
+    template<class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
+    TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>::
+    TpetraBlockCrsMatrix(const Teuchos::RCP< const CrsGraph< LocalOrdinal, GlobalOrdinal, Node> > &graph, 
+                         const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& pointDomainMap,
+                         const Teuchos::RCP<const Map<LocalOrdinal,GlobalOrdinal,Node> >& pointRangeMap,
+                         const LocalOrdinal blockSize)
+      : mtx_(Teuchos::rcp(new Tpetra::BlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>(*toTpetra(graph), *toTpetra(pointDomainMap), *toTpetra(pointRangeMap),blockSize)))
+    { }
+
+
     //! Constructor for a fused import ( not implemented )
     template<class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
     TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>::

From b4b9598601c3a74f25b1931e9e91adbd0c93756c Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 1 Aug 2022 10:50:44 -0600
Subject: [PATCH 068/130] MueLu: Using fancy new Xpetra code

---
 .../MueLu_TentativePFactory_def.hpp           | 27 +++++--------------
 1 file changed, 7 insertions(+), 20 deletions(-)

diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index 35984f36d182..8f6d3a2c0a10 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -292,7 +292,7 @@ namespace MueLu {
     RCP<const Map> rowMap     = A->getRowMap();
     RCP<const Map> rangeMap   = A->getRangeMap();
     RCP<const Map> colMap     = A->getColMap();
-    const size_t numFinePointRows = rangeMap->getLocalNumElements();
+    //    const size_t numFinePointRows = rangeMap->getLocalNumElements();
     const size_t numFineBlockRows = rowMap->getLocalNumElements();
 
     typedef Teuchos::ScalarTraits<SC> STS;
@@ -425,25 +425,10 @@ namespace MueLu {
 
     // Now let's make a BlockCrs Matrix
     // NOTE: Assumes block size== NSDim
-    // FIXME: Push this all into Xpetra_MatrixFactory
-    RCP<Xpetra::TpetraCrsGraph<LO,GO,NO> > BlockGraph_tcg = rcp_dynamic_cast<Xpetra::TpetraCrsGraph<LO,GO,NO> >(BlockGraph);
-    RCP<const Tpetra::CrsGraph<LO,GO,NO> > BlockGraph_t =BlockGraph_tcg->getTpetra_CrsGraph();
-
-    RCP<const Xpetra::TpetraMap<LO,GO,NO> > rangeMap_x = rcp_dynamic_cast<const Xpetra::TpetraMap<LO,GO,NO> >(rangeMap);
-    RCP<const Xpetra::TpetraMap<LO,GO,NO> > coarsePointMap_x = rcp_dynamic_cast<const Xpetra::TpetraMap<LO,GO,NO> >(coarsePointMap->getMap());
-    if(rangeMap_x.is_null()) throw std::runtime_error("TentativePFactory: rangeMap is not a Tpetra Map");    
-    if(coarsePointMap_x.is_null()) throw std::runtime_error("TentativePFactory: coarsePointMap is not a Tpetra Map");
-
-
-    RCP<const Tpetra::Map<LO,GO,NO> > rangeMap_t = rangeMap_x->getTpetra_Map();
-    RCP<const Tpetra::Map<LO,GO,NO> > coarsePointMap_t = coarsePointMap_x->getTpetra_Map();
-       
-    RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp(new Tpetra::BlockCrsMatrix<SC,LO,GO,NO>(*BlockGraph_t, *coarsePointMap_t, *rangeMap_t,NSDim));    
-
-    RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(P_tpetra));
+    RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = Xpetra::CrsMatrixFactory<SC,LO,GO,NO>::BuildBlock(BlockGraph, coarsePointMap, rangeMap,NSDim);
+    RCP<Xpetra::TpetraCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp_dynamic_cast<Xpetra::TpetraCrsMatrix<SC,LO,GO,NO> >(P_xpetra);
     RCP<CrsMatrixWrap> P_wrap = rcp(new CrsMatrixWrap(P_xpetra));
 
-
     /////////////////////////////
     //      "no-QR" option     //
     /////////////////////////////
@@ -452,9 +437,11 @@ namespace MueLu {
     // NOTE: We're not going to do a QR here as we're assuming that blocksize == NSDim
     // NOTE: "goodMap" case only
     Teuchos::Array<Scalar> block(NSDim*NSDim, zero);
+    Teuchos::Array<LO> bcol(1);
 
     GetOStream(Runtime1) << "TentativePFactory : bypassing local QR phase" << std::endl;
-    for (GO agg = 0; agg < numAggs; agg++) {
+    for (LO agg = 0; agg < numAggs; agg++) {
+      bcol[0] = agg;
       const LO aggSize = aggStart[agg+1] - aggStart[agg];
       Xpetra::global_size_t offset = agg*NSDim;
 
@@ -469,7 +456,7 @@ namespace MueLu {
             block[r*NSDim+c] = fineNS[c][localPointRow];
         }
         // NOTE: Assumes columns==aggs and are ordered sequentially
-        P_tpetra->replaceLocalValues(localBlockRow,&agg,block.getRawPtr(),1);
+        P_tpetra->replaceLocalValues(localBlockRow,bcol(),block());
 
       }//end aggSize
         

From 41d73bffe45cee1f7c397fbab20b0766df0b8996 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 1 Aug 2022 11:14:17 -0600
Subject: [PATCH 069/130] MueLu: Checking that the BlockCrs Hierarchy is
 actually BlockCrs

---
 .../ParameterList/ParameterListInterpreter.cpp   | 16 +++++++++++++++-
 1 file changed, 15 insertions(+), 1 deletion(-)

diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
index 8d0ce3a7cfe8..1a2730d3a217 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
@@ -52,7 +52,7 @@
 #include <MueLu_ParameterListInterpreter.hpp>
 #include <MueLu_Exceptions.hpp>
 
-#include <Xpetra_IO.hpp>
+#include <Xpetra_MatrixMatrix.hpp>
 
 namespace MueLuTests {
 
@@ -120,6 +120,20 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, BlockCrs, Scalar, Lo
         H->GetLevel(0)->Set("A", A);
         
         mueluFactory.SetupHierarchy(*H);
+
+        // Test to make sure all of the matrices in the Hierarchy are actually Block Matrices
+        // NOTE: Don't check the coarsest level to avoid (a) KLU and (b) lack of transfer operators
+        using helpers = Xpetra::Helpers<Scalar,LocalOrdinal,GlobalOrdinal,Node>;        
+        for(int j=0; j<H->GetNumLevels()-1; j++) {
+          RCP<Level> level = H->GetLevel(j);
+
+          RCP<Matrix> Am = level->Get<RCP<Matrix> >("A");
+          TEST_EQUALITY(helpers::isTpetraBlockCrs(Am),true);
+          RCP<Matrix> P = level->Get<RCP<Matrix> >("P");
+          TEST_EQUALITY(helpers::isTpetraBlockCrs(P),true);
+          RCP<Matrix> R = level->Get<RCP<Matrix> >("R");
+          TEST_EQUALITY(helpers::isTpetraBlockCrs(R),true);          
+        }
         
         //TODO: check no unused parameters
         //TODO: check results of Iterate()

From 9d22fab9d37ad48319d85eeece0d5e76ec02abfc Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 1 Aug 2022 11:20:33 -0600
Subject: [PATCH 070/130] MueLu: I fear the gold files

---
 .../MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp      | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
index 63dc2882ab88..3b0f72e8490e 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
@@ -380,7 +380,7 @@ namespace MueLu {
           classicalAlgo = scaled_cut;
         else
           TEUCHOS_TEST_FOR_EXCEPTION(true, Exceptions::RuntimeError, "\"aggregation: classical algo\" must be one of (default|unscaled cut|scaled cut), not \"" << classicalAlgoStr << "\"");
-        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" classical algorithm = \"" << classicalAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize()<< "storageblocksize = "<<A->GetStorageBlockSize() << std::endl;
+        GetOStream(Runtime0) << "algorithm = \"" << algo << "\" classical algorithm = \"" << classicalAlgoStr << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;
         
       } else
         GetOStream(Runtime0) << "algorithm = \"" << algo << "\": threshold = " << threshold << ", blocksize = " << A->GetFixedBlockSize() << std::endl;

From ea31bc6f8006f60e4dccf548e2953ebdd47a348f Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 1 Aug 2022 13:49:58 -0600
Subject: [PATCH 071/130] MueLu: Finishing off non-Kokkos BlockCrs support

---
 .../MueLu_TentativePFactory_def.hpp           |  3 +-
 .../ParameterListInterpreter.cpp              | 13 ++++----
 .../ParameterListInterpreter/BlockCrs2.xml    | 32 +++++++++++++++++++
 3 files changed, 41 insertions(+), 7 deletions(-)
 create mode 100644 packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs2.xml

diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index 8f6d3a2c0a10..9ff2146db854 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -426,7 +426,8 @@ namespace MueLu {
     // Now let's make a BlockCrs Matrix
     // NOTE: Assumes block size== NSDim
     RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = Xpetra::CrsMatrixFactory<SC,LO,GO,NO>::BuildBlock(BlockGraph, coarsePointMap, rangeMap,NSDim);
-    RCP<Xpetra::TpetraCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp_dynamic_cast<Xpetra::TpetraCrsMatrix<SC,LO,GO,NO> >(P_xpetra);
+    RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp_dynamic_cast<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> >(P_xpetra);
+    if(P_tpetra.is_null()) throw std::runtime_error("BuildPUncoupled: Matrix factory did not return a Tpetra::BlockCrsMatrix");
     RCP<CrsMatrixWrap> P_wrap = rcp(new CrsMatrixWrap(P_xpetra));
 
     /////////////////////////////
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
index 1a2730d3a217..42498a63cbf4 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
@@ -122,17 +122,18 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, BlockCrs, Scalar, Lo
         mueluFactory.SetupHierarchy(*H);
 
         // Test to make sure all of the matrices in the Hierarchy are actually Block Matrices
-        // NOTE: Don't check the coarsest level to avoid (a) KLU and (b) lack of transfer operators
         using helpers = Xpetra::Helpers<Scalar,LocalOrdinal,GlobalOrdinal,Node>;        
-        for(int j=0; j<H->GetNumLevels()-1; j++) {
+        for(int j=0; j<H->GetNumLevels(); j++) {
           RCP<Level> level = H->GetLevel(j);
 
           RCP<Matrix> Am = level->Get<RCP<Matrix> >("A");
           TEST_EQUALITY(helpers::isTpetraBlockCrs(Am),true);
-          RCP<Matrix> P = level->Get<RCP<Matrix> >("P");
-          TEST_EQUALITY(helpers::isTpetraBlockCrs(P),true);
-          RCP<Matrix> R = level->Get<RCP<Matrix> >("R");
-          TEST_EQUALITY(helpers::isTpetraBlockCrs(R),true);          
+          if(j>0) {
+            RCP<Matrix> P = level->Get<RCP<Matrix> >("P");
+            TEST_EQUALITY(helpers::isTpetraBlockCrs(P),true);
+            RCP<Matrix> R = level->Get<RCP<Matrix> >("R");
+            TEST_EQUALITY(helpers::isTpetraBlockCrs(R),true);          
+          }
         }
         
         //TODO: check no unused parameters
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs2.xml b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs2.xml
new file mode 100644
index 000000000000..5954af0d9af4
--- /dev/null
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/BlockCrs2.xml
@@ -0,0 +1,32 @@
+<ParameterList name="MueLu">
+
+  <!--
+    For a generic symmetric scalar problem, these are the recommended settings for MueLu.
+  -->
+
+  <!-- ===========  GENERAL ================ -->
+    <Parameter        name="verbosity"                            type="string"   value="high"/>
+
+    <Parameter        name="coarse: max size"                     type="int"      value="50"/>
+
+    <Parameter        name="multigrid algorithm"                  type="string"   value="unsmoothed"/>
+
+    <Parameter        name="max levels"                	          type="int"      value="3"/>
+
+    <!-- This is hardwired in the test generator -->
+    <Parameter        name="number of equations"                  type="int"      value="3"/>
+
+    <Parameter        name="smoother: type"                       type="string"  value="RELAXATION"/>
+    <Parameter        name="coarse: type"                         type="string"  value="RELAXATION"/>
+
+
+    <!-- What makes this different from BlockCrs1.xml -->
+    <Parameter        name="rap: triple product"                  type="bool"      value="false"/>
+
+    <!-- end of default values -->
+
+    <!-- ===========  REPARTITIONING  =========== -->
+    <Parameter        name="repartition: enable"                  type="bool"     value="false"/>
+    <!-- end of default values -->
+
+</ParameterList>

From 301f9379307503617ba109531cdef2d17905d07f Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 1 Aug 2022 15:01:14 -0600
Subject: [PATCH 072/130] Xpetra: Finished the non-Kokkos path

---
 .../xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp  | 100 ++++++++++++++++--
 .../sup/Utils/Xpetra_TripleMatrixMultiply.hpp |  28 ++---
 2 files changed, 100 insertions(+), 28 deletions(-)

diff --git a/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp b/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
index da080b651be2..c95ae6d91b73 100644
--- a/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
@@ -75,6 +75,7 @@
 #include <MatrixMarket_Tpetra.hpp>
 #include <Xpetra_TpetraCrsMatrix.hpp>
 #include <Xpetra_TpetraBlockCrsMatrix.hpp>
+#include <Tpetra_BlockCrsMatrix_Helpers.hpp>
 #include <Xpetra_TpetraMultiVector.hpp>
 #include <Xpetra_TpetraVector.hpp>
 #endif // HAVE_XPETRA_TPETRA
@@ -498,9 +499,36 @@ Note: this class is not in the Xpetra_UseShortNames.hpp
           // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
           Tpetra::MatrixMatrix::Multiply(tpA, transposeA, tpB, transposeB, tpC, haveMultiplyDoFillComplete, label, params);
         }
-        else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B) && helpers::isTpetraBlockCrs(C)) {
-          // All matrices are BlockCrs
-          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+        else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B)) {
+          // All matrices are BlockCrs (except maybe Ac)
+          // FIXME: For the moment we're just going to clobber the innards of Ac, so no reuse. Once we have a reuse kernel,
+          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
+          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpB  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(B);
+          using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
+          RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpA);
+          RCP<const CRS> Bcrs = Tpetra::convertToCrsMatrix(tpB);
+
+          // We need the global constants to do the copy back to BlockCrs
+          RCP<ParameterList> new_params;
+          if(!params.is_null()) {
+            new_params = rcp(new Teuchos::ParameterList(*params));
+            new_params->set("compute global constants",true);
+          }
+
+          // FIXME: The lines below only works because we're assuming Ac is Point
+          RCP<CRS> tempAc = Teuchos::rcp(new CRS(Acrs->getRowMap(),0));
+          Tpetra::MatrixMatrix::Multiply(*Acrs, transposeA, *Bcrs, transposeB, *tempAc, haveMultiplyDoFillComplete, label, new_params);
+
+          // Temporary output matrix
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*tempAc,A.GetStorageBlockSize());          
+          RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
+          RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
+
+          // We can now cheat and replace the innards of Ac
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> >(Teuchos::rcpFromRef(C));
+          Ac_w->replaceCrsMatrix(Ac_p);         
         }
         else {
           // Mix and match
@@ -1029,9 +1057,36 @@ Note: this class is not in the Xpetra_UseShortNames.hpp
           // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
           Tpetra::MatrixMatrix::Multiply(tpA, transposeA, tpB, transposeB, tpC, haveMultiplyDoFillComplete, label, params);
         }
-        else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B) && helpers::isTpetraBlockCrs(C)) {
-          // All matrices are BlockCrs
-          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+        else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B)) {
+          // All matrices are BlockCrs (except maybe Ac)
+          // FIXME: For the moment we're just going to clobber the innards of Ac, so no reuse. Once we have a reuse kernel,
+          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
+          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpB  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(B);
+          using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
+          RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpA);
+          RCP<const CRS> Bcrs = Tpetra::convertToCrsMatrix(tpB);
+
+          // We need the global constants to do the copy back to BlockCrs
+          RCP<ParameterList> new_params;
+          if(!params.is_null()) {
+            new_params = rcp(new Teuchos::ParameterList(*params));
+            new_params->set("compute global constants",true);
+          }
+
+          // FIXME: The lines below only works because we're assuming Ac is Point
+          RCP<CRS> tempAc = Teuchos::rcp(new CRS(Acrs->getRowMap(),0));
+          Tpetra::MatrixMatrix::Multiply(*Acrs, transposeA, *Bcrs, transposeB, *tempAc, haveMultiplyDoFillComplete, label, new_params);
+
+          // Temporary output matrix
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*tempAc,A.GetStorageBlockSize());          
+          RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
+          RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
+
+          // We can now cheat and replace the innards of Ac
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> >(Teuchos::rcpFromRef(C));
+          Ac_w->replaceCrsMatrix(Ac_p);  
         }
         else {
           // Mix and match
@@ -1794,9 +1849,36 @@ Note: this class is not in the Xpetra_UseShortNames.hpp
           // Previously, Tpetra's matrix matrix multiply did not support fillComplete.
           Tpetra::MatrixMatrix::Multiply(tpA, transposeA, tpB, transposeB, tpC, haveMultiplyDoFillComplete, label, params);
         }
-        else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B) && helpers::isTpetraBlockCrs(C)) {
-          // All matrices are BlockCrs
-          TEUCHOS_TEST_FOR_EXCEPTION(1, Exceptions::RuntimeError, "BlockCrs Multiply not currently supported");          
+        else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B)) {
+// All matrices are BlockCrs (except maybe Ac)
+          // FIXME: For the moment we're just going to clobber the innards of Ac, so no reuse. Once we have a reuse kernel,
+          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
+          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
+          const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpB  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(B);
+          using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
+          RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpA);
+          RCP<const CRS> Bcrs = Tpetra::convertToCrsMatrix(tpB);
+
+          // We need the global constants to do the copy back to BlockCrs
+          RCP<ParameterList> new_params;
+          if(!params.is_null()) {
+            new_params = rcp(new Teuchos::ParameterList(*params));
+            new_params->set("compute global constants",true);
+          }
+
+          // FIXME: The lines below only works because we're assuming Ac is Point
+          RCP<CRS> tempAc = Teuchos::rcp(new CRS(Acrs->getRowMap(),0));
+          Tpetra::MatrixMatrix::Multiply(*Acrs, transposeA, *Bcrs, transposeB, *tempAc, haveMultiplyDoFillComplete, label, new_params);
+
+          // Temporary output matrix
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*tempAc,A.GetStorageBlockSize());          
+          RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
+          RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
+
+          // We can now cheat and replace the innards of Ac
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> >(Teuchos::rcpFromRef(C));
+          Ac_w->replaceCrsMatrix(Ac_p);         
         }
         else {
           // Mix and match
diff --git a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
index 8d7a1ee9091a..87eae0493546 100644
--- a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
@@ -143,7 +143,7 @@ namespace Xpetra {
         }
         else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
           // All matrices are BlockCrs (except maybe Ac)
-          // FIXME: For the moment we're just going to clobber the innards of AC, so no reuse. Once we have a reuse kernel,
+          // FIXME: For the moment we're just going to clobber the innards of Ac, so no reuse. Once we have a reuse kernel,
           // we'll need to think about refactoring BlockCrs so we can do something smartet here.
           std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(R);
@@ -157,7 +157,7 @@ namespace Xpetra {
           RCP<const CRS> Pcrs = Tpetra::convertToCrsMatrix(tpP);
           //          RCP<CRS> Accrs = Tpetra::convertToCrsMatrix(tpAc);
           
-          // FIXME: This lines below only works because we're assuming Ac is Point
+          // FIXME: The lines below only works because we're assuming Ac is Point
           RCP<CRS> Accrs = Teuchos::rcp(new CRS(Rcrs->getRowMap(),0));
           const bool do_fill_complete=true;
           Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, do_fill_complete, label, params);
@@ -168,7 +168,7 @@ namespace Xpetra {
           RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
 
           // We can now cheat and replace the innards of Ac
-          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO>>(Teuchos::rcpFromRef(Ac));
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> >(Teuchos::rcpFromRef(Ac));
           Ac_w->replaceCrsMatrix(Ac_p);         
         }
         else {
@@ -284,23 +284,18 @@ namespace Xpetra {
           RCP<const CRS> Pcrs = Tpetra::convertToCrsMatrix(tpP);
           //          RCP<CRS> Accrs = Tpetra::convertToCrsMatrix(tpAc);
           
-          // FIXME: This lines below only works because we're assuming Ac is Point
+          // FIXME: The lines below only works because we're assuming Ac is Point
           RCP<CRS> Accrs = Teuchos::rcp(new CRS(Rcrs->getRowMap(),0));
           const bool do_fill_complete=true;
           Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, do_fill_complete, label, params);
 
           // Temporary output matrix
-          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());
-          
-          printf("Ac_t r/r/s=%d/%d/%d\n",
-                 (int)Ac_t->getRangeMap()->getGlobalNumElements(),(int)Ac_t->getRowMap()->getGlobalNumElements(),
-                 (int)Ac_t->getGlobalNumRows());
-
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());          
           RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
           RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
 
           // We can now cheat and replace the innards of Ac
-          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO>>(Teuchos::rcpFromRef(Ac));
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> >(Teuchos::rcpFromRef(Ac));
           Ac_w->replaceCrsMatrix(Ac_p);
 
         }
@@ -416,23 +411,18 @@ namespace Xpetra {
           RCP<const CRS> Pcrs = Tpetra::convertToCrsMatrix(tpP);
           //          RCP<CRS> Accrs = Tpetra::convertToCrsMatrix(tpAc);
           
-          // FIXME: This lines below only works because we're assuming Ac is Point
+          // FIXME: The lines below only works because we're assuming Ac is Point
           RCP<CRS> Accrs = Teuchos::rcp(new CRS(Rcrs->getRowMap(),0));
           const bool do_fill_complete=true;
           Tpetra::TripleMatrixMultiply::MultiplyRAP(*Rcrs, transposeR, *Acrs, transposeA, *Pcrs, transposeP, *Accrs, do_fill_complete, label, params);
 
           // Temporary output matrix
-          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());
-          
-          printf("Ac_t r/r/s=%d/%d/%d\n",
-                 (int)Ac_t->getRangeMap()->getGlobalNumElements(),(int)Ac_t->getRowMap()->getGlobalNumElements(),
-                 (int)Ac_t->getGlobalNumRows());
-
+          RCP<Tpetra::BlockCrsMatrix<SC,LO,GO,NO> > Ac_t = Tpetra::convertToBlockCrsMatrix(*Accrs,A.GetStorageBlockSize());         
           RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > Ac_x = Teuchos::rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(Ac_t));
           RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > Ac_p = Ac_x;
 
           // We can now cheat and replace the innards of Ac
-          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO>>(Teuchos::rcpFromRef(Ac));
+          RCP<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> > Ac_w = Teuchos::rcp_dynamic_cast<Xpetra::CrsMatrixWrap<SC,LO,GO,NO> >(Teuchos::rcpFromRef(Ac));
           Ac_w->replaceCrsMatrix(Ac_p);   
         }
         else {

From aac91fcfd16dda5c7ed3a7d79483c1aa7a59e54f Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 2 Aug 2022 14:00:45 -0600
Subject: [PATCH 073/130] MueLu: Adding Dirichlet detection for BlockCrs

---
 .../src/Utils/MueLu_Utilities_kokkos_def.hpp  | 102 +++++++++++++-----
 1 file changed, 74 insertions(+), 28 deletions(-)

diff --git a/packages/muelu/src/Utils/MueLu_Utilities_kokkos_def.hpp b/packages/muelu/src/Utils/MueLu_Utilities_kokkos_def.hpp
index 536d034db19a..8922d170c798 100644
--- a/packages/muelu/src/Utils/MueLu_Utilities_kokkos_def.hpp
+++ b/packages/muelu/src/Utils/MueLu_Utilities_kokkos_def.hpp
@@ -348,47 +348,93 @@ namespace MueLu {
     using impl_scalar_type = typename Kokkos::ArithTraits<SC>::val_type;
     using ATS        = Kokkos::ArithTraits<impl_scalar_type>;
     using range_type = Kokkos::RangePolicy<LO, typename NO::execution_space>;
+    using helpers    = Xpetra::Helpers<SC,LO,GO,NO>;
 
-    auto localMatrix = A.getLocalMatrixDevice();
-    LO   numRows     = A.getLocalNumRows();
 
-    Kokkos::View<bool*, typename NO::device_type> boundaryNodes(Kokkos::ViewAllocateWithoutInitializing("boundaryNodes"), numRows);
-    if (count_twos_as_dirichlet)
-      Kokkos::parallel_for("MueLu:Utils::DetectDirichletRows_Twos_As_Dirichlet", range_type(0,numRows),
+    if(helpers::isTpetraBlockCrs(A)) {
+#ifdef HAVE_MUELU_TPETRA
+      const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & Am = helpers::Op2TpetraBlockCrs(A);
+      auto b_graph      = Am.getCrsGraph().getLocalGraphDevice();
+      auto b_rowptr     = Am.getCrsGraph().getLocalRowPtrsDevice();
+      auto values       = Am.getValuesDevice();
+      LO   numBlockRows = Am.getLocalNumRows();      
+      const LO stride   = Am.getBlockSize() * Am.getBlockSize();
+
+      Kokkos::View<bool*, typename NO::device_type> boundaryNodes(Kokkos::ViewAllocateWithoutInitializing("boundaryNodes"), numBlockRows);      
+
+      if (count_twos_as_dirichlet)
+        throw Exceptions::RuntimeError("BlockCrs does not support counting twos as Dirichlet");
+
+      Kokkos::parallel_for("MueLu:Utils::DetectDirichletRowsBlockCrs", range_type(0,numBlockRows),
                            KOKKOS_LAMBDA(const LO row) {
-                             auto rowView = localMatrix.row(row);
+                             auto rowView = b_graph.rowConst(row);
                              auto length  = rowView.length;
+                             LO valstart  = b_rowptr[row] * stride;
 
                              boundaryNodes(row) = true;
-                             if (length > 2) {
-                               decltype(length) colID = 0;
-                               for (; colID < length; colID++)
-                                 if ((rowView.colidx(colID) != row) &&
-                                     (ATS::magnitude(rowView.value(colID)) > tol)) {
-                                   if (!boundaryNodes(row))
+                             decltype(length) colID =0;
+                             for (; colID < length; colID++) {
+                               if (rowView.colidx(colID) != row) {
+                                 LO current = valstart + colID*stride;
+                                 for(LO k=0; k<stride; k++) {
+                                   if (ATS::magnitude(values[current+ k]) > tol) {
+                                     boundaryNodes(row) = false;
                                      break;
-                                   boundaryNodes(row) = false;
+                                   }
                                  }
-                               if (colID == length)
-                                 boundaryNodes(row) = true;
+                               }
+                               if(boundaryNodes(row) == false)
+                                 break;
                              }
                            });
-    else
-      Kokkos::parallel_for("MueLu:Utils::DetectDirichletRows", range_type(0,numRows),
-                           KOKKOS_LAMBDA(const LO row) {
-                             auto rowView = localMatrix.row(row);
-                             auto length  = rowView.length;
 
-                             boundaryNodes(row) = true;
-                             for (decltype(length) colID = 0; colID < length; colID++)
-                               if ((rowView.colidx(colID) != row) &&
-                                   (ATS::magnitude(rowView.value(colID)) > tol)) {
-                                 boundaryNodes(row) = false;
-                                 break;
+      return boundaryNodes;
+#else 
+      throw Exceptions::RuntimeError("BlockCrs requires Tpetra");
+#endif
+    } 
+    else {
+      auto localMatrix = A.getLocalMatrixDevice();
+      LO   numRows     = A.getLocalNumRows();
+      Kokkos::View<bool*, typename NO::device_type> boundaryNodes(Kokkos::ViewAllocateWithoutInitializing("boundaryNodes"), numRows);      
+
+      if (count_twos_as_dirichlet)
+        Kokkos::parallel_for("MueLu:Utils::DetectDirichletRows_Twos_As_Dirichlet", range_type(0,numRows),
+                             KOKKOS_LAMBDA(const LO row) {
+                               auto rowView = localMatrix.row(row);
+                               auto length  = rowView.length;
+                               
+                               boundaryNodes(row) = true;
+                               if (length > 2) {
+                                 decltype(length) colID =0;
+                                 for ( ; colID < length; colID++)
+                                   if ((rowView.colidx(colID) != row) &&
+                                       (ATS::magnitude(rowView.value(colID)) > tol)) {
+                                     if (!boundaryNodes(row))
+                                       break;
+                                     boundaryNodes(row) = false;
+                                   }
+                                 if (colID == length)
+                                   boundaryNodes(row) = true;
                                }
-                           });
-
+                             });
+      else
+        Kokkos::parallel_for("MueLu:Utils::DetectDirichletRows", range_type(0,numRows),
+                             KOKKOS_LAMBDA(const LO row) {
+                               auto rowView = localMatrix.row(row);
+                               auto length  = rowView.length;
+                               
+                               boundaryNodes(row) = true;
+                               for (decltype(length) colID = 0; colID < length; colID++)
+                                 if ((rowView.colidx(colID) != row) &&
+                                     (ATS::magnitude(rowView.value(colID)) > tol)) {
+                                   boundaryNodes(row) = false;
+                                   break;
+                                 }
+                             });
     return boundaryNodes;
+    }
+
   }
 
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>

From a7adb8c9e3684a55f5d9d52a0a05a87542e292de Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 2 Aug 2022 14:53:22 -0600
Subject: [PATCH 074/130] MueLu: Working Kokkos path up to graph generation

---
 .../MueLu_AmalgamationFactory_kokkos_def.hpp  |  17 +-
 .../MueLu_CoalesceDropFactory_kokkos_def.hpp  |   6 +-
 .../MueLu_TentativePFactory_kokkos_decl.hpp   |  26 +-
 .../MueLu_TentativePFactory_kokkos_def.hpp    | 532 +++++++++++++++++-
 4 files changed, 562 insertions(+), 19 deletions(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_kokkos_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_kokkos_def.hpp
index e945469b5ba1..088a065f8d4a 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_kokkos_def.hpp
@@ -80,11 +80,21 @@ namespace MueLu {
 
     RCP<Matrix> A = Get< RCP<Matrix> >(currentLevel, "A");
 
+    /* NOTE: Fullblocksize here represents the number of blocks of whatever storage type is represented by the matrix, specifically
+       the GetFixedBlockSize() which should come from the # PDEs specified on the input deck (or null space dimension on finer levels).
+       So for a point matrix, that's the block size.  
+       
+       For a BlockCrsMatrix, that's the number of blocks of the BlockCrs object which make up a logical block for amalgamation.  Here we 
+       divide the GetFixedBlockSize() by the GetStorageBlockSize().  We've only tested fullblocksize=1 in the BlockCrs case, but in theory
+       you could use a larger number here.
+     */
+
     LO fullblocksize    = 1;   // block dim for fixed size blocks
     GO offset           = 0;   // global offset of dof gids
     LO blockid          = -1;  // block id in strided map
     LO nStridedOffset   = 0;   // DOF offset for strided block id "blockid" (default = 0)
     LO stridedblocksize = fullblocksize; // size of strided block id "blockid" (default = fullblocksize, only if blockid!=-1 stridedblocksize <= fullblocksize)
+    LO storageblocksize = A->GetStorageBlockSize();
     // GO indexBase        = A->getRowMap()->getIndexBase();  // index base for maps (unused)
 
     // 1) check for blocking/striding information
@@ -106,6 +116,11 @@ namespace MueLu {
       } else {
         stridedblocksize = fullblocksize;
       }
+      // Correct for the storageblocksize
+      TEUCHOS_TEST_FOR_EXCEPTION(fullblocksize % storageblocksize != 0,Exceptions::RuntimeError,"AmalgamationFactory::Build(): fullblocksize needs to be a multiple of A->GetStorageBlockSize()");
+      fullblocksize /= storageblocksize;
+      stridedblocksize /= storageblocksize;
+
       oldView = A->SwitchToView(oldView);
       GetOStream(Runtime1) << "AmalagamationFactory::Build():" << " found fullblocksize=" << fullblocksize << " and stridedblocksize=" << stridedblocksize << " from strided maps. offset=" << offset << std::endl;
 
@@ -172,7 +187,7 @@ namespace MueLu {
     container               filter; // TODO:  replace std::set with an object having faster lookup/insert, hashtable for instance
 
     GO offset = 0;
-    LO blkSize = A.GetFixedBlockSize();
+    LO blkSize = A.GetFixedBlockSize() / A.GetStorageBlockSize();
     if (A.IsView("stridedMaps") == true) {
       Teuchos::RCP<const Map> myMap = A.getRowMap("stridedMaps");
       Teuchos::RCP<const StridedMap> strMap = Teuchos::rcp_dynamic_cast<const StridedMap>(myMap);
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_kokkos_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_kokkos_def.hpp
index a3f394fe36b8..bed7c17901f1 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_kokkos_def.hpp
@@ -506,7 +506,9 @@ namespace MueLu {
     const MT zero = Teuchos::ScalarTraits<MT>::zero();
 
     auto A         = Get< RCP<Matrix> >(currentLevel, "A");
-    LO   blkSize   = A->GetFixedBlockSize();
+
+    TEUCHOS_TEST_FOR_EXCEPTION(A->GetFixedBlockSize() % A->GetStorageBlockSize() != 0,Exceptions::RuntimeError,"A->GetFixedBlockSize() needs to be a multiple of A->GetStorageBlockSize()");
+    LO   blkSize   = A->GetFixedBlockSize() / A->GetStorageBlockSize();
 
     auto amalInfo = Get< RCP<AmalgamationInfo_kokkos> >(currentLevel, "UnAmalgamationInfo");
 
@@ -542,7 +544,7 @@ namespace MueLu {
       boundaryNodes = Utilities_kokkos::DetectDirichletRows(*A, dirichletThreshold);
 
       // Trivial LWGraph construction
-      graph = rcp(new LWGraph_kokkos(A->getLocalMatrixDevice().graph, A->getRowMap(), A->getColMap(), "graph of A"));
+      graph = rcp(new LWGraph_kokkos(A->getCrsGraph()->getLocalGraphDevice(), A->getRowMap(), A->getColMap(), "graph of A"));
       graph->getLocalLWGraph().SetBoundaryNodeMap(boundaryNodes);
 
       numTotal = A->getLocalNumEntries();
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_decl.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_decl.hpp
index 35b3151fc4b2..0fe6fa5c5c6e 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_decl.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_decl.hpp
@@ -55,6 +55,8 @@
 
 #include "Teuchos_ScalarTraits.hpp"
 
+#include "Xpetra_CrsGraphFactory_fwd.hpp"
+
 #include "MueLu_Aggregates_kokkos_fwd.hpp"
 #include "MueLu_AmalgamationFactory_kokkos_fwd.hpp"
 #include "MueLu_AmalgamationInfo_kokkos_fwd.hpp"
@@ -151,27 +153,23 @@ namespace MueLu {
 
     //@}
 
-    // CUDA 7.5 and 8.0 place a restriction on the placement of __device__ lambdas:
-    //
-    //     An explicit __device__ lambda cannot be defined in a member function
-    //     that has private or protected access within its class.
-    //
-    // Therefore, we expose BuildPuncoupled and isGoodMap for now. An alternative solution
-    // could be writing an out of class implementation, and then calling it in
-    // a member function.
-    void BuildPuncoupled(Level& coarseLevel, RCP<Matrix> A, RCP<Aggregates_kokkos> aggregates,
-                         RCP<AmalgamationInfo_kokkos> amalgInfo, RCP<MultiVector> fineNullspace,
-                         RCP<const Map> coarseMap, RCP<Matrix>& Ptentative,
-                         RCP<MultiVector>& coarseNullspace, const int levelID) const;
-    bool isGoodMap(const Map& rowMap, const Map& colMap) const;
-
   private:
 
+    bool isGoodMap(const Map& rowMap, const Map& colMap) const;
+
     void BuildPcoupled  (RCP<Matrix> A, RCP<Aggregates_kokkos> aggregates,
                          RCP<AmalgamationInfo_kokkos> amalgInfo, RCP<MultiVector> fineNullspace,
                          RCP<const Map> coarseMap, RCP<Matrix>& Ptentative,
                          RCP<MultiVector>& coarseNullspace) const;
 
+    void BuildPuncoupled(Level& coarseLevel, RCP<Matrix> A, RCP<Aggregates_kokkos> aggregates,
+                         RCP<AmalgamationInfo_kokkos> amalgInfo, RCP<MultiVector> fineNullspace,
+                         RCP<const Map> coarseMap, RCP<Matrix>& Ptentative,
+                         RCP<MultiVector>& coarseNullspace, const int levelID) const;
+
+    void BuildPuncoupledBlockCrs(Level& coarseLevel, RCP<Matrix> A, RCP<Aggregates_kokkos> aggregates, RCP<AmalgamationInfo_kokkos> amalgInfo, 
+                                 RCP<MultiVector> fineNullspace, RCP<const Map> coarseMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const;
+
     mutable bool bTransferCoordinates_ = false;
 
   };
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
index 08f647cbcce9..22c46eea5790 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
@@ -49,6 +49,7 @@
 #ifdef HAVE_MUELU_KOKKOS_REFACTOR
 
 #include "Kokkos_UnorderedMap.hpp"
+#include "Xpetra_CrsGraphFactory.hpp"
 
 #include "MueLu_TentativePFactory_kokkos_decl.hpp"
 
@@ -56,12 +57,15 @@
 #include "MueLu_AmalgamationFactory_kokkos.hpp"
 #include "MueLu_AmalgamationInfo_kokkos.hpp"
 #include "MueLu_CoarseMapFactory_kokkos.hpp"
+
 #include "MueLu_MasterList.hpp"
 #include "MueLu_NullspaceFactory_kokkos.hpp"
 #include "MueLu_PerfUtils.hpp"
 #include "MueLu_Monitor.hpp"
 #include "MueLu_Utilities_kokkos.hpp"
 
+#include "Xpetra_IO.hpp"
+
 namespace MueLu {
 
   namespace { // anonymous
@@ -531,8 +535,15 @@ namespace MueLu {
       }
     }
 
-    if (!aggregates->AggregatesCrossProcessors())
-      BuildPuncoupled(coarseLevel, A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace, coarseLevel.GetLevelID());
+    if (!aggregates->AggregatesCrossProcessors()) {
+      if(Xpetra::Helpers<SC,LO,GO,NO>::isTpetraBlockCrs(A)) {
+        BuildPuncoupledBlockCrs(coarseLevel,A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace,
+                                coarseLevel.GetLevelID());
+      }
+      else {
+        BuildPuncoupled(coarseLevel, A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace, coarseLevel.GetLevelID());
+      }
+    }
     else
       BuildPcoupled  (A, aggregates, amalgInfo, fineNullspace, coarseMap, Ptentative, coarseNullspace);
 
@@ -966,6 +977,523 @@ namespace MueLu {
     }
   }
 
+
+  template <class Scalar,class LocalOrdinal, class GlobalOrdinal, class DeviceType>
+  void TentativePFactory_kokkos<Scalar,LocalOrdinal,GlobalOrdinal,Kokkos::Compat::KokkosDeviceWrapperNode<DeviceType>>::
+    BuildPuncoupledBlockCrs(Level& coarseLevel, RCP<Matrix> A, RCP<Aggregates_kokkos> aggregates,
+                  RCP<AmalgamationInfo_kokkos> amalgInfo, RCP<MultiVector> fineNullspace,
+                  RCP<const Map> coarsePointMap, RCP<Matrix>& Ptentative,
+                  RCP<MultiVector>& coarseNullspace, const int levelID) const {
+#ifdef HAVE_MUELU_TPETRA
+  /* This routine generates a BlockCrs P for a BlockCrs A.  There are a few assumptions here, which meet the use cases we care about, but could 
+       be generalized later, if we ever need to do so:
+       1) Null space dimension === block size of matrix:  So no elasticity right now
+       2) QR is not supported:  Under assumption #1, this shouldn't cause problems.
+       3) Maps are "good": Aka the first chunk of the ColMap is the RowMap.
+
+       These assumptions keep our code way simpler and still support the use cases we actually care about.
+     */
+
+    RCP<const Map> rowMap     = A->getRowMap();
+    RCP<const Map> rangeMap   = A->getRangeMap();
+    RCP<const Map> colMap     = A->getColMap();
+    const size_t numFinePointRows = rangeMap->getLocalNumElements();
+    const size_t numFineBlockRows = rowMap->getLocalNumElements();
+
+    typedef Teuchos::ScalarTraits<SC> STS;
+    typedef typename STS::magnitudeType Magnitude;
+    const SC     zero      = STS::zero();
+    const SC     one       = STS::one();
+    const LO     INVALID   = Teuchos::OrdinalTraits<LO>::invalid();
+
+    const GO     numAggs   = aggregates->GetNumAggregates();
+    const size_t NSDim     = fineNullspace->getNumVectors();
+    auto aggSizes          = aggregates->ComputeAggregateSizes();
+
+
+    typename Aggregates_kokkos::local_graph_type aggGraph;
+    {
+      SubFactoryMonitor m2(*this, "Get Aggregates graph", coarseLevel);
+      aggGraph = aggregates->GetGraph();
+    }
+    auto aggRows  = aggGraph.row_map;
+    auto aggCols  = aggGraph.entries;
+
+
+    // Need to generate the coarse block map
+    // NOTE: We assume NSDim == block size here
+    // NOTE: We also assume that coarseMap has contiguous GIDs
+    //const size_t numCoarsePointRows = coarsePointMap->getLocalNumElements();
+    const size_t numCoarseBlockRows = coarsePointMap->getLocalNumElements() / NSDim;
+    RCP<const Map> coarseBlockMap = MapFactory::Build(coarsePointMap->lib(),
+                                                      Teuchos::OrdinalTraits<Xpetra::global_size_t>::invalid(),
+                                                      numCoarseBlockRows,
+                                                      coarsePointMap->getIndexBase(),
+                                                      coarsePointMap->getComm());    
+    // Sanity checking
+    const ParameterList& pL = GetParameterList();
+    //    const bool &doQRStep = pL.get<bool>("tentative: calculate qr");
+
+
+    // The aggregates use the amalgamated column map, which in this case is what we want
+
+    // Aggregates map is based on the amalgamated column map
+    // We can skip global-to-local conversion if LIDs in row map are
+    // same as LIDs in column map
+    bool goodMap = MueLu::Utilities<SC,LO,GO,NO>::MapsAreNested(*rowMap, *colMap);
+    TEUCHOS_TEST_FOR_EXCEPTION(!goodMap, Exceptions::RuntimeError,
+                               "MueLu: TentativePFactory_kokkos: for now works only with good maps "
+                               "(i.e. \"matching\" row and column maps)");
+
+    // STEP 1: do unamalgamation
+    // The non-kokkos version uses member functions from the AmalgamationInfo
+    // container class to unamalgamate the data. In contrast, the kokkos
+    // version of TentativePFactory does the unamalgamation here and only uses
+    // the data of the AmalgamationInfo container class
+
+    // Extract information for unamalgamation
+    LO fullBlockSize, blockID, stridingOffset, stridedBlockSize;
+    GO indexBase;
+    amalgInfo->GetStridingInformation(fullBlockSize, blockID, stridingOffset, stridedBlockSize, indexBase);
+    GO globalOffset = amalgInfo->GlobalOffset();
+
+    // Extract aggregation info (already in Kokkos host views)
+    auto         procWinner    = aggregates->GetProcWinner()  ->getDeviceLocalView(Xpetra::Access::ReadOnly);
+    auto         vertex2AggId  = aggregates->GetVertex2AggId()->getDeviceLocalView(Xpetra::Access::ReadOnly);
+    const size_t numAggregates = aggregates->GetNumAggregates();
+
+    int myPID = aggregates->GetMap()->getComm()->getRank();
+
+    // Create Kokkos::View (on the device) to store the aggreate dof sizes
+    // Later used to get aggregate dof offsets
+    // NOTE: This zeros itself on construction
+    typedef typename Aggregates_kokkos::aggregates_sizes_type::non_const_type AggSizeType;
+    AggSizeType aggDofSizes; // This turns into "starts" after the parallel_scan
+
+    {
+      SubFactoryMonitor m2(*this, "Calc AggSizes", coarseLevel);
+
+      // FIXME_KOKKOS: use ViewAllocateWithoutInitializing + set a single value
+      aggDofSizes = AggSizeType("agg_dof_sizes", numAggregates+1);
+
+      Kokkos::deep_copy(Kokkos::subview(aggDofSizes, Kokkos::make_pair(static_cast<size_t>(1), numAggregates+1)), aggSizes);
+    } 
+
+    // Find maximum dof size for aggregates
+    // Later used to reserve enough scratch space for local QR decompositions
+    LO maxAggSize = 0;
+    ReduceMaxFunctor<LO,decltype(aggDofSizes)> reduceMax(aggDofSizes);
+    Kokkos::parallel_reduce("MueLu:TentativePF:Build:max_agg_size", range_type(0, aggDofSizes.extent(0)), reduceMax, maxAggSize);
+
+    // parallel_scan (exclusive)
+    // The aggDofSizes View then contains the aggregate dof offsets
+    Kokkos::parallel_scan("MueLu:TentativePF:Build:aggregate_sizes:stage1_scan", range_type(0,numAggregates+1),
+      KOKKOS_LAMBDA(const LO i, LO& update, const bool& final_pass) {
+        update += aggDofSizes(i);
+        if (final_pass)
+          aggDofSizes(i) = update;
+      });
+
+    // Create Kokkos::View on the device to store mapping
+    // between (local) aggregate id and row map ids (LIDs)
+    Kokkos::View<LO*, DeviceType> aggToRowMapLO(Kokkos::ViewAllocateWithoutInitializing("aggtorow_map_LO"), numFineBlockRows);
+    {
+      SubFactoryMonitor m2(*this, "Create Agg2RowMap", coarseLevel);
+
+      AggSizeType aggOffsets(Kokkos::ViewAllocateWithoutInitializing("aggOffsets"), numAggregates);
+      Kokkos::deep_copy(aggOffsets, Kokkos::subview(aggDofSizes, Kokkos::make_pair(static_cast<size_t>(0), numAggregates)));
+
+      Kokkos::parallel_for("MueLu:TentativePF:Build:createAgg2RowMap", range_type(0, vertex2AggId.extent(0)),
+        KOKKOS_LAMBDA(const LO lnode) {
+          if (procWinner(lnode, 0) == myPID) {
+            // No need for atomics, it's one-to-one
+            auto aggID = vertex2AggId(lnode,0);
+
+            auto offset = Kokkos::atomic_fetch_add( &aggOffsets(aggID), stridedBlockSize );
+            // FIXME: I think this may be wrong
+            // We unconditionally add the whole block here. When we calculated
+            // aggDofSizes, we did the isLocalElement check. Something's fishy.
+            for (LO k = 0; k < stridedBlockSize; k++)
+              aggToRowMapLO(offset + k) = lnode*stridedBlockSize + k;
+          }
+        });
+    }
+
+    // STEP 2: prepare local QR decomposition
+    // Reserve memory for tentative prolongation operator
+    coarseNullspace = MultiVectorFactory::Build(coarsePointMap, NSDim);
+
+    // Pull out the nullspace vectors so that we can have random access (on the device)
+    auto fineNS   = fineNullspace  ->getDeviceLocalView(Xpetra::Access::ReadWrite);
+    auto coarseNS = coarseNullspace->getDeviceLocalView(Xpetra::Access::OverwriteAll);
+
+    typedef typename Xpetra::Matrix<SC,LO,GO,NO>::local_matrix_type    local_matrix_type;
+    typedef typename local_matrix_type::row_map_type::non_const_type   rows_type;
+    typedef typename local_matrix_type::index_type::non_const_type     cols_type;
+    typedef typename local_matrix_type::values_type::non_const_type    vals_type;
+
+
+    // Device View for status (error messages...)
+    typedef Kokkos::View<int[10], DeviceType> status_type;
+    status_type status("status");
+
+    typename AppendTrait<decltype(fineNS), Kokkos::RandomAccess>::type fineNSRandom = fineNS;
+    typename AppendTrait<status_type,      Kokkos::Atomic>      ::type statusAtomic = status;
+
+    // We're going to bypass QR in the BlockCrs version of the code regardless of what the user asks for
+    GetOStream(Runtime1) << "TentativePFactory : bypassing local QR phase" << std::endl;
+
+    // BlockCrs requires that we build the (block) graph first, so let's do that...
+
+    // NOTE: Because we're assuming that the NSDim == BlockSize, we only have one 
+    // block non-zero per row in the matrix;
+    rows_type ia(Kokkos::ViewAllocateWithoutInitializing("BlockGraph_rowptr"), numFineBlockRows+1);
+    cols_type ja(Kokkos::ViewAllocateWithoutInitializing("BlockGraph_colind"), numFineBlockRows);
+
+    Kokkos::parallel_for("MueLu:TentativePF:BlockCrs:graph_init", range_type(0, numFineBlockRows),
+                         KOKKOS_LAMBDA(const LO j) {
+                           ia[j] = j;
+                           ja[j] = INVALID;
+
+                           if(j==(LO)numFineBlockRows-1)
+                             ia[numFineBlockRows] = numFineBlockRows;
+                         });
+
+    // Fill Graph
+    const Kokkos::TeamPolicy<execution_space> policy(numAggregates, 1);
+    Kokkos::parallel_for("MueLu:TentativePF:BlockCrs:fillGraph", policy,
+                         KOKKOS_LAMBDA(const typename Kokkos::TeamPolicy<execution_space>::member_type &thread) {
+                           auto agg = thread.league_rank();
+                           Xpetra::global_size_t offset = agg;
+                           
+                           // size of the aggregate (number of DOFs in aggregate)
+                           LO aggSize = aggRows(agg+1) - aggRows(agg);
+                           
+                           for (LO j = 0; j < aggSize; j++) {
+                             // FIXME: Allow for bad maps
+                             const LO localRow = aggToRowMapLO[aggDofSizes[agg]+j];
+                             const size_t rowStart = ia[localRow];
+                             ja[rowStart] = offset;
+                           }
+                         });
+
+    {
+      printf("***Initial ***\n");
+      printf("ia = ");
+      for(int i=0;i<(int)ia.extent(0);i++)
+        printf("%d ",(int)ia[i]);
+      printf("\nja = ");
+      for(int i=0;i<(int)ja.extent(0);i++)
+        printf("%d ",(int)ja[i]);
+      printf("\n");
+    }
+  
+    // Compress storage (remove all INVALID, which happen when we skip zeros)
+    // We do that in-place
+    {
+      // Stage 2: compress the arrays
+      SubFactoryMonitor m2(*this, "Stage 2 (CompressData)", coarseLevel);
+      // Fill i_temp with the correct row starts
+      rows_type i_temp(Kokkos::ViewAllocateWithoutInitializing("BlockGraph_rowptr"), numFineBlockRows+1);
+      size_t nnz=0;
+      Kokkos::parallel_scan("MueLu:TentativePF:BlockCrs:compress_rows", range_type(0,numFineBlockRows+1),
+                            KOKKOS_LAMBDA(const LO i, LO& upd, const bool& final) {
+                              if(final)
+                                i_temp[i] = upd;
+                              for (auto j = ia[i]; j < ia[i+1]; j++)
+                                if (ja[j] != INVALID)
+                                  upd++;
+                            },nnz);
+
+      cols_type j_temp(Kokkos::ViewAllocateWithoutInitializing("BlockGraph_colind"), nnz);
+      
+      
+      Kokkos::parallel_for("MueLu:TentativePF:BlockCrs:compress_cols", range_type(0,numFineBlockRows),
+                           KOKKOS_LAMBDA(const LO i) {
+                             size_t rowStart = i_temp[i];
+                             size_t lnnz = 0;
+                             for (auto j = ia[i]; j < ia[i+1]; j++)
+                               if (ja[j] != INVALID) {
+                                 j_temp[rowStart+lnnz] = ja[j];
+                                 lnnz++;
+                               }
+                           });     
+      
+      ia = i_temp;
+      ja = j_temp;
+    }
+    RCP<CrsGraph> BlockGraph = CrsGraphFactory::Build(rowMap,coarseBlockMap,ia,ja);
+ 
+
+    // Managing labels & constants for ESFC
+    {
+      RCP<ParameterList> FCparams;
+      if(pL.isSublist("matrixmatrix: kernel params"))
+        FCparams=rcp(new ParameterList(pL.sublist("matrixmatrix: kernel params")));
+      else
+        FCparams= rcp(new ParameterList);
+      // By default, we don't need global constants for TentativeP
+      FCparams->set("compute global constants",FCparams->get("compute global constants",false));
+      std::string levelIDs = toString(levelID);
+      FCparams->set("Timer Label",std::string("MueLu::TentativeP-")+levelIDs);
+      RCP<const Export> dummy_e;
+      RCP<const Import> dummy_i;
+      BlockGraph->expertStaticFillComplete(coarseBlockMap,rowMap,dummy_i,dummy_e,FCparams);
+    }
+
+    {
+      printf("*** After ***\n");
+      printf("ia = ");
+      for(int i=0;i<(int)ia.extent(0);i++)
+        printf("%d ",(int)ia[i]);
+      printf("\nja = ");
+      for(int i=0;i<(int)ja.extent(0);i++)
+        printf("%d ",(int)ja[i]);
+      printf("\n");
+    }
+
+
+    Xpetra::IO<SC,LO,GO,NO>::Write("pgraph.dat",*BlockGraph);//CMSCMS
+    exit(1);
+
+#ifdef OLD_AND_BUSTED
+
+
+
+    size_t nnzEstimate = numRows * NSDim;
+
+    vals_type valsAux("Ptent_aux_vals", nnzEstimate);
+    rows_type rows("Ptent_rows", numRows+1);
+    {
+      // Stage 0: fill in views.
+      SubFactoryMonitor m2(*this, "Stage 0 (InitViews)", coarseLevel);
+
+      // The main thing to notice is initialization of vals with INVALID. These
+      // values will later be used to compress the arrays
+      Kokkos::parallel_for("MueLu:TentativePF:BuildPuncoupled:for1", range_type(0, numRows+1),
+                           KOKKOS_LAMBDA(const LO row) {
+                             rowsAux(row) = row*NSDim;
+                           });
+      Kokkos::parallel_for("MueLu:TentativePF:BuildUncoupled:for2", range_type(0, nnzEstimate),
+                           KOKKOS_LAMBDA(const LO j) {
+                             colsAux(j) = INVALID;
+                           });
+    }
+
+    if (NSDim == 1) {
+      // 1D is special, as it is the easiest. We don't even need to the QR,
+      // just normalize an array. Plus, no worries abot small aggregates.  In
+      // addition, we do not worry about compression. It is unlikely that
+      // nullspace will have zeros. If it does, a prolongator row would be
+      // zero and we'll get singularity anyway.
+      SubFactoryMonitor m2(*this, "Stage 1 (LocalQR)", coarseLevel);
+
+      // Set up team policy with numAggregates teams and one thread per team.
+      // Each team handles a slice of the data associated with one aggregate
+      // and performs a local QR decomposition (in this case real QR is
+      // unnecessary).
+      const Kokkos::TeamPolicy<execution_space> policy(numAggregates, 1);
+
+      if (doQRStep) {
+        Kokkos::parallel_for("MueLu:TentativePF:BuildUncoupled:main_loop", policy,
+          KOKKOS_LAMBDA(const typename Kokkos::TeamPolicy<execution_space>::member_type &thread) {
+            auto agg = thread.league_rank();
+
+            // size of the aggregate (number of DOFs in aggregate)
+            LO aggSize = aggRows(agg+1) - aggRows(agg);
+
+            // Extract the piece of the nullspace corresponding to the aggregate, and
+            // put it in the flat array, "localQR" (in column major format) for the
+            // QR routine. Trivial in 1D.
+            auto norm = impl_ATS::magnitude(zero);
+
+            // Calculate QR by hand
+            // FIXME: shouldn't there be stridedblock here?
+            // FIXME_KOKKOS: shouldn't there be stridedblock here?
+            for (decltype(aggSize) k = 0; k < aggSize; k++) {
+              auto dnorm = impl_ATS::magnitude(fineNSRandom(agg2RowMapLO(aggRows(agg)+k),0));
+              norm += dnorm*dnorm;
+            }
+            norm = sqrt(norm);
+
+            if (norm == zero) {
+              // zero column; terminate the execution
+              statusAtomic(1) = true;
+              return;
+            }
+
+            // R = norm
+            coarseNS(agg, 0) = norm;
+
+            // Q = localQR(:,0)/norm
+            for (decltype(aggSize) k = 0; k < aggSize; k++) {
+              LO localRow = agg2RowMapLO(aggRows(agg)+k);
+              impl_SC localVal = fineNSRandom(agg2RowMapLO(aggRows(agg)+k),0) / norm;
+
+              rows(localRow+1) = 1;
+              colsAux(localRow) = agg;
+              valsAux(localRow) = localVal;
+
+            }
+          });
+
+        typename status_type::HostMirror statusHost = Kokkos::create_mirror_view(status);
+        Kokkos::deep_copy(statusHost, status);
+        for (decltype(statusHost.size()) i = 0; i < statusHost.size(); i++)
+          if (statusHost(i)) {
+            std::ostringstream oss;
+            oss << "MueLu::TentativePFactory::MakeTentative: ";
+            switch (i) {
+              case 0: oss << "!goodMap is not implemented";               break;
+              case 1: oss << "fine level NS part has a zero column";      break;
+            }
+            throw Exceptions::RuntimeError(oss.str());
+          }
+
+      } else {
+        Kokkos::parallel_for("MueLu:TentativePF:BuildUncoupled:main_loop_noqr", policy,
+          KOKKOS_LAMBDA(const typename Kokkos::TeamPolicy<execution_space>::member_type &thread) {
+            auto agg = thread.league_rank();
+
+            // size of the aggregate (number of DOFs in aggregate)
+            LO aggSize = aggRows(agg+1) - aggRows(agg);
+
+            // R = norm
+            coarseNS(agg, 0) = one;
+
+            // Q = localQR(:,0)/norm
+            for (decltype(aggSize) k = 0; k < aggSize; k++) {
+              LO localRow = agg2RowMapLO(aggRows(agg)+k);
+              impl_SC localVal = fineNSRandom(agg2RowMapLO(aggRows(agg)+k),0);
+
+              rows(localRow+1) = 1;
+              colsAux(localRow) = agg;
+              valsAux(localRow) = localVal;
+
+            }
+          });
+      }
+
+      Kokkos::parallel_reduce("MueLu:TentativeP:CountNNZ", range_type(0, numRows+1),
+                              KOKKOS_LAMBDA(const LO i, size_t &nnz_count) {
+                                nnz_count += rows(i);
+                              }, nnz);
+
+    } else { // NSdim > 1
+      // FIXME_KOKKOS: This code branch is completely unoptimized.
+      // Work to do:
+      //   - Optimize QR decomposition
+      //   - Remove INVALID usage similarly to CoalesceDropFactory_kokkos by
+      //     packing new values in the beginning of each row
+      // We do use auxilary view in this case, so keep a second rows view for
+      // counting nonzeros in rows
+
+      {
+        SubFactoryMonitor m2 = SubFactoryMonitor(*this, doQRStep ? "Stage 1 (LocalQR)" : "Stage 1 (Fill coarse nullspace and tentative P)", coarseLevel);
+        // Set up team policy with numAggregates teams and one thread per team.
+        // Each team handles a slice of the data associated with one aggregate
+        // and performs a local QR decomposition
+        const Kokkos::TeamPolicy<execution_space> policy(numAggregates,1); // numAggregates teams a 1 thread
+        LocalQRDecompFunctor<LocalOrdinal, GlobalOrdinal, Scalar, DeviceType, decltype(fineNSRandom),
+            decltype(aggDofSizes /*aggregate sizes in dofs*/), decltype(maxAggSize), decltype(agg2RowMapLO),
+            decltype(statusAtomic), decltype(rows), decltype(rowsAux), decltype(colsAux),
+            decltype(valsAux)>
+                localQRFunctor(fineNSRandom, coarseNS, aggDofSizes, maxAggSize, agg2RowMapLO, statusAtomic,
+                               rows, rowsAux, colsAux, valsAux, doQRStep);
+        Kokkos::parallel_reduce("MueLu:TentativePF:BuildUncoupled:main_qr_loop", policy, localQRFunctor, nnz);
+      }
+
+      typename status_type::HostMirror statusHost = Kokkos::create_mirror_view(status);
+      Kokkos::deep_copy(statusHost, status);
+      for (decltype(statusHost.size()) i = 0; i < statusHost.size(); i++)
+        if (statusHost(i)) {
+          std::ostringstream oss;
+          oss << "MueLu::TentativePFactory::MakeTentative: ";
+          switch(i) {
+            case 0: oss << "!goodMap is not implemented";               break;
+            case 1: oss << "fine level NS part has a zero column";      break;
+          }
+          throw Exceptions::RuntimeError(oss.str());
+        }
+    }
+
+    // Compress the cols and vals by ignoring INVALID column entries that correspond
+    // to 0 in QR.
+
+    // The real cols and vals are constructed using calculated (not estimated) nnz
+    cols_type cols;
+    vals_type vals;
+
+    if (nnz != nnzEstimate) {
+      {
+        // Stage 2: compress the arrays
+        SubFactoryMonitor m2(*this, "Stage 2 (CompressRows)", coarseLevel);
+
+        Kokkos::parallel_scan("MueLu:TentativePF:Build:compress_rows", range_type(0,numRows+1),
+                              KOKKOS_LAMBDA(const LO i, LO& upd, const bool& final) {
+                                upd += rows(i);
+                                if (final)
+                                  rows(i) = upd;
+                              });
+      }
+
+      {
+        SubFactoryMonitor m2(*this, "Stage 2 (CompressCols)", coarseLevel);
+
+        cols = cols_type("Ptent_cols", nnz);
+        vals = vals_type("Ptent_vals", nnz);
+
+        // FIXME_KOKKOS: this can be spedup by moving correct cols and vals values
+        // to the beginning of rows. See CoalesceDropFactory_kokkos for
+        // example.
+        Kokkos::parallel_for("MueLu:TentativePF:Build:compress_cols_vals", range_type(0,numRows),
+                             KOKKOS_LAMBDA(const LO i) {
+                               LO rowStart = rows(i);
+
+                               size_t lnnz = 0;
+                               for (auto j = rowsAux(i); j < rowsAux(i+1); j++)
+                                 if (colsAux(j) != INVALID) {
+                                   cols(rowStart+lnnz) = colsAux(j);
+                                   vals(rowStart+lnnz) = valsAux(j);
+                                   lnnz++;
+                                 }
+                             });
+      }
+
+    } else {
+      rows = rowsAux;
+      cols = colsAux;
+      vals = valsAux;
+    }
+
+    GetOStream(Runtime1) << "TentativePFactory : aggregates do not cross process boundaries" << std::endl;
+
+    {
+      // Stage 3: construct Xpetra::Matrix
+      SubFactoryMonitor m2(*this, "Stage 3 (LocalMatrix+FillComplete)", coarseLevel);
+
+      local_matrix_type lclMatrix = local_matrix_type("A", numRows, coarseMap->getLocalNumElements(), nnz, vals, rows, cols);
+
+      // Managing labels & constants for ESFC
+      RCP<ParameterList> FCparams;
+      if (pL.isSublist("matrixmatrix: kernel params"))
+        FCparams = rcp(new ParameterList(pL.sublist("matrixmatrix: kernel params")));
+      else
+        FCparams = rcp(new ParameterList);
+
+      // By default, we don't need global constants for TentativeP
+      FCparams->set("compute global constants", FCparams->get("compute global constants", false));
+      FCparams->set("Timer Label",              std::string("MueLu::TentativeP-") + toString(levelID));
+
+      auto PtentCrs = CrsMatrixFactory::Build(lclMatrix, rowMap, coarseMap, coarseMap, A->getDomainMap());
+      Ptentative = rcp(new CrsMatrixWrap(PtentCrs));
+    }
+#endif
+#else
+    throw std::runtime_error("TentativePFactory::BuildPuncoupledBlockCrs: Requires Tpetra");
+#endif
+  }
+
   template <class Scalar,class LocalOrdinal, class GlobalOrdinal, class DeviceType>
   void TentativePFactory_kokkos<Scalar,LocalOrdinal,GlobalOrdinal,Kokkos::Compat::KokkosDeviceWrapperNode<DeviceType>>::
   BuildPcoupled(RCP<Matrix> /* A */, RCP<Aggregates_kokkos> /* aggregates */,

From 7e643064ac1c03bbeff72d28ed46c10cbe8e4389 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 2 Aug 2022 16:30:53 -0600
Subject: [PATCH 075/130] MueLu: Not working matrix generation

---
 .../MueLu_TentativePFactory_kokkos_def.hpp    | 133 +++++++-----------
 1 file changed, 51 insertions(+), 82 deletions(-)

diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
index 22c46eea5790..d3ceb316ab0b 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
@@ -997,16 +997,16 @@ namespace MueLu {
     RCP<const Map> rowMap     = A->getRowMap();
     RCP<const Map> rangeMap   = A->getRangeMap();
     RCP<const Map> colMap     = A->getColMap();
-    const size_t numFinePointRows = rangeMap->getLocalNumElements();
+    //    const size_t numFinePointRows = rangeMap->getLocalNumElements();
     const size_t numFineBlockRows = rowMap->getLocalNumElements();
 
     typedef Teuchos::ScalarTraits<SC> STS;
     typedef typename STS::magnitudeType Magnitude;
-    const SC     zero      = STS::zero();
+    //    const SC     zero      = STS::zero();
     const SC     one       = STS::one();
     const LO     INVALID   = Teuchos::OrdinalTraits<LO>::invalid();
 
-    const GO     numAggs   = aggregates->GetNumAggregates();
+    //    const GO     numAggs   = aggregates->GetNumAggregates();
     const size_t NSDim     = fineNullspace->getNumVectors();
     auto aggSizes          = aggregates->ComputeAggregateSizes();
 
@@ -1055,7 +1055,7 @@ namespace MueLu {
     LO fullBlockSize, blockID, stridingOffset, stridedBlockSize;
     GO indexBase;
     amalgInfo->GetStridingInformation(fullBlockSize, blockID, stridingOffset, stridedBlockSize, indexBase);
-    GO globalOffset = amalgInfo->GlobalOffset();
+    //GO globalOffset = amalgInfo->GlobalOffset();
 
     // Extract aggregation info (already in Kokkos host views)
     auto         procWinner    = aggregates->GetProcWinner()  ->getDeviceLocalView(Xpetra::Access::ReadOnly);
@@ -1098,7 +1098,7 @@ namespace MueLu {
     // between (local) aggregate id and row map ids (LIDs)
     Kokkos::View<LO*, DeviceType> aggToRowMapLO(Kokkos::ViewAllocateWithoutInitializing("aggtorow_map_LO"), numFineBlockRows);
     {
-      SubFactoryMonitor m2(*this, "Create Agg2RowMap", coarseLevel);
+      SubFactoryMonitor m2(*this, "Create AggToRowMap", coarseLevel);
 
       AggSizeType aggOffsets(Kokkos::ViewAllocateWithoutInitializing("aggOffsets"), numAggregates);
       Kokkos::deep_copy(aggOffsets, Kokkos::subview(aggDofSizes, Kokkos::make_pair(static_cast<size_t>(0), numAggregates)));
@@ -1176,8 +1176,8 @@ namespace MueLu {
                              ja[rowStart] = offset;
                            }
                          });
-
-    {
+    
+    {  
       printf("***Initial ***\n");
       printf("ia = ");
       for(int i=0;i<(int)ia.extent(0);i++)
@@ -1187,6 +1187,7 @@ namespace MueLu {
         printf("%d ",(int)ja[i]);
       printf("\n");
     }
+    
   
     // Compress storage (remove all INVALID, which happen when we skip zeros)
     // We do that in-place
@@ -1196,13 +1197,15 @@ namespace MueLu {
       // Fill i_temp with the correct row starts
       rows_type i_temp(Kokkos::ViewAllocateWithoutInitializing("BlockGraph_rowptr"), numFineBlockRows+1);
       size_t nnz=0;
-      Kokkos::parallel_scan("MueLu:TentativePF:BlockCrs:compress_rows", range_type(0,numFineBlockRows+1),
+      Kokkos::parallel_scan("MueLu:TentativePF:BlockCrs:compress_rows", range_type(0,numFineBlockRows),
                             KOKKOS_LAMBDA(const LO i, LO& upd, const bool& final) {
-                              if(final)
+                              if(final) 
                                 i_temp[i] = upd;
                               for (auto j = ia[i]; j < ia[i+1]; j++)
                                 if (ja[j] != INVALID)
                                   upd++;
+                              if(final && i == (LO) numFineBlockRows-1)
+                                i_temp[i] = upd;
                             },nnz);
 
       cols_type j_temp(Kokkos::ViewAllocateWithoutInitializing("BlockGraph_colind"), nnz);
@@ -1222,6 +1225,7 @@ namespace MueLu {
       ia = i_temp;
       ja = j_temp;
     }
+    
     RCP<CrsGraph> BlockGraph = CrsGraphFactory::Build(rowMap,coarseBlockMap,ia,ja);
  
 
@@ -1241,6 +1245,7 @@ namespace MueLu {
       BlockGraph->expertStaticFillComplete(coarseBlockMap,rowMap,dummy_i,dummy_e,FCparams);
     }
 
+    
     {
       printf("*** After ***\n");
       printf("ia = ");
@@ -1251,34 +1256,50 @@ namespace MueLu {
         printf("%d ",(int)ja[i]);
       printf("\n");
     }
-
+    
 
     Xpetra::IO<SC,LO,GO,NO>::Write("pgraph.dat",*BlockGraph);//CMSCMS
-    exit(1);
 
-#ifdef OLD_AND_BUSTED
 
+    // Now let's make a BlockCrs Matrix
+    // NOTE: Assumes block size== NSDim
+    RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = Xpetra::CrsMatrixFactory<SC,LO,GO,NO>::BuildBlock(BlockGraph, coarsePointMap, rangeMap,NSDim);
+    RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp_dynamic_cast<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> >(P_xpetra);
+    if(P_tpetra.is_null()) throw std::runtime_error("BuildPUncoupled: Matrix factory did not return a Tpetra::BlockCrsMatrix");
+    RCP<CrsMatrixWrap> P_wrap = rcp(new CrsMatrixWrap(P_xpetra));
 
+    auto values = P_tpetra->getTpetra_BlockCrsMatrix()->getValuesDeviceNonConst();
+    const LO stride = NSDim*NSDim;
 
-    size_t nnzEstimate = numRows * NSDim;
+    Kokkos::parallel_for("MueLu:TentativePF:BlockCrs:main_loop_noqr", policy,
+                         KOKKOS_LAMBDA(const typename Kokkos::TeamPolicy<execution_space>::member_type &thread) {
+                           auto agg = thread.league_rank();
+                           
+                           // size of the aggregate (number of DOFs in aggregate)
+                           LO aggSize = aggRows(agg+1) - aggRows(agg);
+                           Xpetra::global_size_t offset = agg*NSDim;
 
-    vals_type valsAux("Ptent_aux_vals", nnzEstimate);
-    rows_type rows("Ptent_rows", numRows+1);
-    {
-      // Stage 0: fill in views.
-      SubFactoryMonitor m2(*this, "Stage 0 (InitViews)", coarseLevel);
+                           // Q = localQR(:,0)/norm
+                           for (LO j = 0; j < aggSize; j++) {
+                             LO localBlockRow = aggToRowMapLO(aggRows(agg)+j);
+                             LO rowStart = localBlockRow * stride;
+                             for (LO r = 0; r < (LO)NSDim; r++) {
+                               LO localPointRow = localBlockRow*NSDim + r;
+                               for (LO c = 0; c < (LO)NSDim; c++) {
+                                 values[rowStart + r*NSDim + c] = fineNSRandom(localPointRow,c);
+                               }
+                             }
+                           }
+
+                           // R = norm
+                           for(LO j=0; j<(LO)NSDim; j++)
+                             coarseNS(offset+j,j) = one;                                                    
+                         });
+
+  Ptentative = P_wrap;
+  Xpetra::IO<SC,LO,GO,NO>::Write("pmatrix.dat",*Ptentative);//CMSCMS
+#ifdef OLD_AND_BUSTED
 
-      // The main thing to notice is initialization of vals with INVALID. These
-      // values will later be used to compress the arrays
-      Kokkos::parallel_for("MueLu:TentativePF:BuildPuncoupled:for1", range_type(0, numRows+1),
-                           KOKKOS_LAMBDA(const LO row) {
-                             rowsAux(row) = row*NSDim;
-                           });
-      Kokkos::parallel_for("MueLu:TentativePF:BuildUncoupled:for2", range_type(0, nnzEstimate),
-                           KOKKOS_LAMBDA(const LO j) {
-                             colsAux(j) = INVALID;
-                           });
-    }
 
     if (NSDim == 1) {
       // 1D is special, as it is the easiest. We don't even need to the QR,
@@ -1296,59 +1317,7 @@ namespace MueLu {
 
       if (doQRStep) {
         Kokkos::parallel_for("MueLu:TentativePF:BuildUncoupled:main_loop", policy,
-          KOKKOS_LAMBDA(const typename Kokkos::TeamPolicy<execution_space>::member_type &thread) {
-            auto agg = thread.league_rank();
-
-            // size of the aggregate (number of DOFs in aggregate)
-            LO aggSize = aggRows(agg+1) - aggRows(agg);
-
-            // Extract the piece of the nullspace corresponding to the aggregate, and
-            // put it in the flat array, "localQR" (in column major format) for the
-            // QR routine. Trivial in 1D.
-            auto norm = impl_ATS::magnitude(zero);
-
-            // Calculate QR by hand
-            // FIXME: shouldn't there be stridedblock here?
-            // FIXME_KOKKOS: shouldn't there be stridedblock here?
-            for (decltype(aggSize) k = 0; k < aggSize; k++) {
-              auto dnorm = impl_ATS::magnitude(fineNSRandom(agg2RowMapLO(aggRows(agg)+k),0));
-              norm += dnorm*dnorm;
-            }
-            norm = sqrt(norm);
-
-            if (norm == zero) {
-              // zero column; terminate the execution
-              statusAtomic(1) = true;
-              return;
-            }
-
-            // R = norm
-            coarseNS(agg, 0) = norm;
-
-            // Q = localQR(:,0)/norm
-            for (decltype(aggSize) k = 0; k < aggSize; k++) {
-              LO localRow = agg2RowMapLO(aggRows(agg)+k);
-              impl_SC localVal = fineNSRandom(agg2RowMapLO(aggRows(agg)+k),0) / norm;
-
-              rows(localRow+1) = 1;
-              colsAux(localRow) = agg;
-              valsAux(localRow) = localVal;
-
-            }
-          });
-
-        typename status_type::HostMirror statusHost = Kokkos::create_mirror_view(status);
-        Kokkos::deep_copy(statusHost, status);
-        for (decltype(statusHost.size()) i = 0; i < statusHost.size(); i++)
-          if (statusHost(i)) {
-            std::ostringstream oss;
-            oss << "MueLu::TentativePFactory::MakeTentative: ";
-            switch (i) {
-              case 0: oss << "!goodMap is not implemented";               break;
-              case 1: oss << "fine level NS part has a zero column";      break;
-            }
-            throw Exceptions::RuntimeError(oss.str());
-          }
+    
 
       } else {
         Kokkos::parallel_for("MueLu:TentativePF:BuildUncoupled:main_loop_noqr", policy,

From 39fa682d852a033d25a463025959e00e1c85dad8 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 2 Aug 2022 21:36:50 -0600
Subject: [PATCH 076/130] MueLu: Working Kokkos matrix generation

---
 .../MueLu_TentativePFactory_kokkos_def.hpp    | 191 +-----------------
 1 file changed, 2 insertions(+), 189 deletions(-)

diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
index d3ceb316ab0b..001a1ba6e578 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
@@ -1176,19 +1176,7 @@ namespace MueLu {
                              ja[rowStart] = offset;
                            }
                          });
-    
-    {  
-      printf("***Initial ***\n");
-      printf("ia = ");
-      for(int i=0;i<(int)ia.extent(0);i++)
-        printf("%d ",(int)ia[i]);
-      printf("\nja = ");
-      for(int i=0;i<(int)ja.extent(0);i++)
-        printf("%d ",(int)ja[i]);
-      printf("\n");
-    }
-    
-  
+
     // Compress storage (remove all INVALID, which happen when we skip zeros)
     // We do that in-place
     {
@@ -1205,7 +1193,7 @@ namespace MueLu {
                                 if (ja[j] != INVALID)
                                   upd++;
                               if(final && i == (LO) numFineBlockRows-1)
-                                i_temp[i] = upd;
+                                i_temp[numFineBlockRows] = upd;
                             },nnz);
 
       cols_type j_temp(Kokkos::ViewAllocateWithoutInitializing("BlockGraph_colind"), nnz);
@@ -1246,21 +1234,6 @@ namespace MueLu {
     }
 
     
-    {
-      printf("*** After ***\n");
-      printf("ia = ");
-      for(int i=0;i<(int)ia.extent(0);i++)
-        printf("%d ",(int)ia[i]);
-      printf("\nja = ");
-      for(int i=0;i<(int)ja.extent(0);i++)
-        printf("%d ",(int)ja[i]);
-      printf("\n");
-    }
-    
-
-    Xpetra::IO<SC,LO,GO,NO>::Write("pgraph.dat",*BlockGraph);//CMSCMS
-
-
     // Now let's make a BlockCrs Matrix
     // NOTE: Assumes block size== NSDim
     RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = Xpetra::CrsMatrixFactory<SC,LO,GO,NO>::BuildBlock(BlockGraph, coarsePointMap, rangeMap,NSDim);
@@ -1297,167 +1270,7 @@ namespace MueLu {
                          });
 
   Ptentative = P_wrap;
-  Xpetra::IO<SC,LO,GO,NO>::Write("pmatrix.dat",*Ptentative);//CMSCMS
-#ifdef OLD_AND_BUSTED
 
-
-    if (NSDim == 1) {
-      // 1D is special, as it is the easiest. We don't even need to the QR,
-      // just normalize an array. Plus, no worries abot small aggregates.  In
-      // addition, we do not worry about compression. It is unlikely that
-      // nullspace will have zeros. If it does, a prolongator row would be
-      // zero and we'll get singularity anyway.
-      SubFactoryMonitor m2(*this, "Stage 1 (LocalQR)", coarseLevel);
-
-      // Set up team policy with numAggregates teams and one thread per team.
-      // Each team handles a slice of the data associated with one aggregate
-      // and performs a local QR decomposition (in this case real QR is
-      // unnecessary).
-      const Kokkos::TeamPolicy<execution_space> policy(numAggregates, 1);
-
-      if (doQRStep) {
-        Kokkos::parallel_for("MueLu:TentativePF:BuildUncoupled:main_loop", policy,
-    
-
-      } else {
-        Kokkos::parallel_for("MueLu:TentativePF:BuildUncoupled:main_loop_noqr", policy,
-          KOKKOS_LAMBDA(const typename Kokkos::TeamPolicy<execution_space>::member_type &thread) {
-            auto agg = thread.league_rank();
-
-            // size of the aggregate (number of DOFs in aggregate)
-            LO aggSize = aggRows(agg+1) - aggRows(agg);
-
-            // R = norm
-            coarseNS(agg, 0) = one;
-
-            // Q = localQR(:,0)/norm
-            for (decltype(aggSize) k = 0; k < aggSize; k++) {
-              LO localRow = agg2RowMapLO(aggRows(agg)+k);
-              impl_SC localVal = fineNSRandom(agg2RowMapLO(aggRows(agg)+k),0);
-
-              rows(localRow+1) = 1;
-              colsAux(localRow) = agg;
-              valsAux(localRow) = localVal;
-
-            }
-          });
-      }
-
-      Kokkos::parallel_reduce("MueLu:TentativeP:CountNNZ", range_type(0, numRows+1),
-                              KOKKOS_LAMBDA(const LO i, size_t &nnz_count) {
-                                nnz_count += rows(i);
-                              }, nnz);
-
-    } else { // NSdim > 1
-      // FIXME_KOKKOS: This code branch is completely unoptimized.
-      // Work to do:
-      //   - Optimize QR decomposition
-      //   - Remove INVALID usage similarly to CoalesceDropFactory_kokkos by
-      //     packing new values in the beginning of each row
-      // We do use auxilary view in this case, so keep a second rows view for
-      // counting nonzeros in rows
-
-      {
-        SubFactoryMonitor m2 = SubFactoryMonitor(*this, doQRStep ? "Stage 1 (LocalQR)" : "Stage 1 (Fill coarse nullspace and tentative P)", coarseLevel);
-        // Set up team policy with numAggregates teams and one thread per team.
-        // Each team handles a slice of the data associated with one aggregate
-        // and performs a local QR decomposition
-        const Kokkos::TeamPolicy<execution_space> policy(numAggregates,1); // numAggregates teams a 1 thread
-        LocalQRDecompFunctor<LocalOrdinal, GlobalOrdinal, Scalar, DeviceType, decltype(fineNSRandom),
-            decltype(aggDofSizes /*aggregate sizes in dofs*/), decltype(maxAggSize), decltype(agg2RowMapLO),
-            decltype(statusAtomic), decltype(rows), decltype(rowsAux), decltype(colsAux),
-            decltype(valsAux)>
-                localQRFunctor(fineNSRandom, coarseNS, aggDofSizes, maxAggSize, agg2RowMapLO, statusAtomic,
-                               rows, rowsAux, colsAux, valsAux, doQRStep);
-        Kokkos::parallel_reduce("MueLu:TentativePF:BuildUncoupled:main_qr_loop", policy, localQRFunctor, nnz);
-      }
-
-      typename status_type::HostMirror statusHost = Kokkos::create_mirror_view(status);
-      Kokkos::deep_copy(statusHost, status);
-      for (decltype(statusHost.size()) i = 0; i < statusHost.size(); i++)
-        if (statusHost(i)) {
-          std::ostringstream oss;
-          oss << "MueLu::TentativePFactory::MakeTentative: ";
-          switch(i) {
-            case 0: oss << "!goodMap is not implemented";               break;
-            case 1: oss << "fine level NS part has a zero column";      break;
-          }
-          throw Exceptions::RuntimeError(oss.str());
-        }
-    }
-
-    // Compress the cols and vals by ignoring INVALID column entries that correspond
-    // to 0 in QR.
-
-    // The real cols and vals are constructed using calculated (not estimated) nnz
-    cols_type cols;
-    vals_type vals;
-
-    if (nnz != nnzEstimate) {
-      {
-        // Stage 2: compress the arrays
-        SubFactoryMonitor m2(*this, "Stage 2 (CompressRows)", coarseLevel);
-
-        Kokkos::parallel_scan("MueLu:TentativePF:Build:compress_rows", range_type(0,numRows+1),
-                              KOKKOS_LAMBDA(const LO i, LO& upd, const bool& final) {
-                                upd += rows(i);
-                                if (final)
-                                  rows(i) = upd;
-                              });
-      }
-
-      {
-        SubFactoryMonitor m2(*this, "Stage 2 (CompressCols)", coarseLevel);
-
-        cols = cols_type("Ptent_cols", nnz);
-        vals = vals_type("Ptent_vals", nnz);
-
-        // FIXME_KOKKOS: this can be spedup by moving correct cols and vals values
-        // to the beginning of rows. See CoalesceDropFactory_kokkos for
-        // example.
-        Kokkos::parallel_for("MueLu:TentativePF:Build:compress_cols_vals", range_type(0,numRows),
-                             KOKKOS_LAMBDA(const LO i) {
-                               LO rowStart = rows(i);
-
-                               size_t lnnz = 0;
-                               for (auto j = rowsAux(i); j < rowsAux(i+1); j++)
-                                 if (colsAux(j) != INVALID) {
-                                   cols(rowStart+lnnz) = colsAux(j);
-                                   vals(rowStart+lnnz) = valsAux(j);
-                                   lnnz++;
-                                 }
-                             });
-      }
-
-    } else {
-      rows = rowsAux;
-      cols = colsAux;
-      vals = valsAux;
-    }
-
-    GetOStream(Runtime1) << "TentativePFactory : aggregates do not cross process boundaries" << std::endl;
-
-    {
-      // Stage 3: construct Xpetra::Matrix
-      SubFactoryMonitor m2(*this, "Stage 3 (LocalMatrix+FillComplete)", coarseLevel);
-
-      local_matrix_type lclMatrix = local_matrix_type("A", numRows, coarseMap->getLocalNumElements(), nnz, vals, rows, cols);
-
-      // Managing labels & constants for ESFC
-      RCP<ParameterList> FCparams;
-      if (pL.isSublist("matrixmatrix: kernel params"))
-        FCparams = rcp(new ParameterList(pL.sublist("matrixmatrix: kernel params")));
-      else
-        FCparams = rcp(new ParameterList);
-
-      // By default, we don't need global constants for TentativeP
-      FCparams->set("compute global constants", FCparams->get("compute global constants", false));
-      FCparams->set("Timer Label",              std::string("MueLu::TentativeP-") + toString(levelID));
-
-      auto PtentCrs = CrsMatrixFactory::Build(lclMatrix, rowMap, coarseMap, coarseMap, A->getDomainMap());
-      Ptentative = rcp(new CrsMatrixWrap(PtentCrs));
-    }
-#endif
 #else
     throw std::runtime_error("TentativePFactory::BuildPuncoupledBlockCrs: Requires Tpetra");
 #endif

From c1438b074545ef661df5d3e4a40bf8b79ff6dae0 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 3 Aug 2022 12:27:51 -0600
Subject: [PATCH 077/130] MueLu: Adding reuse interface for BlockCrs

---
 .../MueLu_CreateTpetraPreconditioner.hpp      | 19 +++++++++++++++++++
 1 file changed, 19 insertions(+)

diff --git a/packages/muelu/adapters/tpetra/MueLu_CreateTpetraPreconditioner.hpp b/packages/muelu/adapters/tpetra/MueLu_CreateTpetraPreconditioner.hpp
index db1c7777acb2..e41be8434d6a 100644
--- a/packages/muelu/adapters/tpetra/MueLu_CreateTpetraPreconditioner.hpp
+++ b/packages/muelu/adapters/tpetra/MueLu_CreateTpetraPreconditioner.hpp
@@ -171,6 +171,25 @@ namespace MueLu {
     MueLu::ReuseXpetraPreconditioner<SC,LO,GO,NO>(A, H);
   }
 
+  template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
+  void ReuseTpetraPreconditioner(const Teuchos::RCP<Tpetra::BlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >& inA,
+                                 MueLu::TpetraOperator<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op) {
+    typedef Scalar          SC;
+    typedef LocalOrdinal    LO;
+    typedef GlobalOrdinal   GO;
+    typedef Node            NO;
+
+    typedef Xpetra::Matrix<SC,LO,GO,NO>     Matrix;
+    typedef MueLu ::Hierarchy<SC,LO,GO,NO>  Hierarchy;
+
+    RCP<Hierarchy> H = Op.GetHierarchy();
+    RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > temp = rcp(new Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>(inA));
+    TEUCHOS_TEST_FOR_EXCEPTION(temp==Teuchos::null, Exceptions::RuntimeError, "ReuseTpetraPreconditioner: cast from Tpetra::BlockCrsMatrix to Xpetra::TpetraBlockCrsMatrix failed.");
+    RCP<Matrix> A = rcp(new Xpetra::CrsMatrixWrap<SC,LO,GO,NO>(temp));
+
+    MueLu::ReuseXpetraPreconditioner<SC,LO,GO,NO>(A, H);
+  }
+
 
 
 } //namespace

From fc11704a64c625d81b4897ece49fcc4105e3690c Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 3 Aug 2022 13:35:52 -0600
Subject: [PATCH 078/130] MueLu: Enabling coordinates support with BlockCrs

---
 packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp b/packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp
index 3aedb1b2cf70..eda2f914e8a5 100644
--- a/packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp
+++ b/packages/muelu/src/MueCentral/MueLu_Hierarchy_def.hpp
@@ -1435,8 +1435,9 @@ namespace MueLu {
     }
 
     GetOStream(Runtime1) << "Replacing coordinate map" << std::endl;
+    TEUCHOS_TEST_FOR_EXCEPTION(A->GetFixedBlockSize() % A->GetStorageBlockSize() != 0, Exceptions::RuntimeError, "Hierarchy::ReplaceCoordinateMap: Storage block size does not evenly divide fixed block size");
 
-    size_t blkSize = A->GetFixedBlockSize();
+    size_t blkSize = A->GetFixedBlockSize() / A->GetStorageBlockSize();
 
     RCP<const Map> nodeMap = A->getRowMap();
     if (blkSize > 1) {

From b26978e5d278176db06d51a8eddef17e93a1d958 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 3 Aug 2022 13:51:49 -0600
Subject: [PATCH 079/130] MueLu: Reporting evidently wants global sizes

---
 .../Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp     | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
index 9ff2146db854..eb9d0a49f021 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_def.hpp
@@ -414,8 +414,9 @@ namespace MueLu {
         FCparams=rcp(new ParameterList(pL.sublist("matrixmatrix: kernel params")));
       else
         FCparams= rcp(new ParameterList);
-      // By default, we don't need global constants for TentativeP
-      FCparams->set("compute global constants",FCparams->get("compute global constants",false));
+      // By default, we don't need global constants for TentativeP, but we do want it for the graph
+      // if we're printing statistics, so let's leave it on for now.
+      FCparams->set("compute global constants",FCparams->get("compute global constants",true));
       std::string levelIDs = toString(levelID);
       FCparams->set("Timer Label",std::string("MueLu::TentativeP-")+levelIDs);
       RCP<const Export> dummy_e;

From 46c293599dcddfdb672f621f4c0519c39546e382 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 3 Aug 2022 14:23:28 -0600
Subject: [PATCH 080/130] MueLu: Fixing utilities for Epetra-off builds

---
 .../muelu/src/Utils/MueLu_Utilities_def.hpp   | 110 ++++++++++++++++--
 1 file changed, 101 insertions(+), 9 deletions(-)

diff --git a/packages/muelu/src/Utils/MueLu_Utilities_def.hpp b/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
index 469276531197..87c843de5b86 100644
--- a/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
+++ b/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
@@ -300,6 +300,65 @@ namespace MueLu {
     }
   }
 
+
+  template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
+  RCP<const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(RCP<const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > Op)  {
+    using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+    // Get the underlying Tpetra Mtx
+    RCP<const CrsMatrixWrap> crsOp = rcp_dynamic_cast<const CrsMatrixWrap>(Op);
+    if (crsOp == Teuchos::null)
+      throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
+    const RCP<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > &tmp_ECrsMtx = rcp_dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >(crsOp->getCrsMatrix());
+    if (tmp_ECrsMtx == Teuchos::null)
+        throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
+    return tmp_ECrsMtx->getTpetra_BlockCrsMatrix();
+  }
+
+  template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
+  RCP<      Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2NonConstTpetraBlockCrs(RCP<Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > Op){
+    using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+    RCP<const CrsMatrixWrap> crsOp = rcp_dynamic_cast<const CrsMatrixWrap>(Op);
+    if (crsOp == Teuchos::null)
+      throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
+    const RCP<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > &tmp_ECrsMtx = rcp_dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >(crsOp->getCrsMatrix());
+    if (tmp_ECrsMtx == Teuchos::null)
+      throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
+    return tmp_ECrsMtx->getTpetra_BlockCrsMatrixNonConst();
+  };
+  
+  template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
+  const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op)   {
+    try {
+      using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+      const CrsMatrixWrap& crsOp = dynamic_cast<const CrsMatrixWrap&>(Op);
+      try {
+        const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& tmp_ECrsMtx = dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&>(*crsOp.getCrsMatrix());
+        return *tmp_ECrsMtx.getTpetra_BlockCrsMatrix();
+      } catch (std::bad_cast&) {
+        throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
+      }
+    } catch (std::bad_cast&) {
+      throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
+    }
+  }
+
+  template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
+  Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2NonConstTpetraBlockCrs(Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op) {
+    try {
+      using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+      CrsMatrixWrap& crsOp = dynamic_cast<CrsMatrixWrap&>(Op);
+      try {
+        Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& tmp_ECrsMtx = dynamic_cast<Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&>(*crsOp.getCrsMatrix());
+        return *tmp_ECrsMtx.getTpetra_BlockCrsMatrixNonConst();
+      } catch (std::bad_cast&) {
+        throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
+      }
+    } catch (std::bad_cast&) {
+        throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
+    }    
+  }
+
+
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
   RCP<const Tpetra::RowMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraRow(RCP<const Xpetra::Operator<Scalar, LocalOrdinal, GlobalOrdinal, Node> > Op) {
     RCP<const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > mat = rcp_dynamic_cast<const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >(Op);
@@ -498,12 +557,14 @@ namespace MueLu {
 
 #ifdef HAVE_MUELU_TPETRA
     if (TorE == "tpetra") {
-      try {
+      using Helpers = Xpetra::Helpers<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+      /***************************************************************/
+      if(Helpers::isTpetraCrs(Op)) {
         const Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>& tpetraOp = Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraCrs(Op);
-
+        
         RCP<Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > A;
         Tpetra::RowMatrixTransposer<Scalar, LocalOrdinal, GlobalOrdinal, Node> transposer(rcpFromRef(tpetraOp),label); //more than meets the eye
-
+        
         {
           using Teuchos::ParameterList;
           using Teuchos::rcp;
@@ -513,20 +574,51 @@ namespace MueLu {
           transposeParams->set ("sort", false);
           A = transposer.createTranspose (transposeParams);
         }
-
+        
         RCP<Xpetra::TpetraCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > AA   = rcp(new Xpetra::TpetraCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>(A) );
         RCP<Xpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >       AAA  = rcp_implicit_cast<Xpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >(AA);
         RCP<Xpetra::Matrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> >          AAAA = rcp( new Xpetra::CrsMatrixWrap<Scalar, LocalOrdinal, GlobalOrdinal, Node>(AAA) );
         if (!AAAA->isFillComplete())
           AAAA->fillComplete(Op.getRangeMap(), Op.getDomainMap());
-
+        
         if (Op.IsView("stridedMaps"))
           AAAA->CreateView("stridedMaps", Teuchos::rcpFromRef(Op), true/*doTranspose*/);
-
+        
         return AAAA;
-
-      } catch (std::exception& e) {
-        std::cout << "threw exception '" << e.what() << "'" << std::endl;
+      }
+      else if(Helpers::isTpetraBlockCrs(Op)) {
+        using Matrix = Xpetra::Matrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+        using CrsMatrix = Xpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+        using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+        using BCRS = Tpetra::BlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+        using CRS  = Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+        const BCRS & tpetraOp = Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(Op);
+        
+        std::cout<<"WARNING: Utilities::Transpose(): Using inefficient placeholder algorithm for Transpose"<<std::endl;//CMSCMS
+        RCP<BCRS> At;
+        RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpetraOp);
+        {
+          Tpetra::RowMatrixTransposer<Scalar, LocalOrdinal, GlobalOrdinal, Node> transposer(Acrs,label);
+          
+          using Teuchos::ParameterList;
+          using Teuchos::rcp;
+          RCP<ParameterList> transposeParams = params.is_null () ?
+            rcp (new ParameterList) :
+            rcp (new ParameterList (*params));
+          transposeParams->set ("sort", false);
+          RCP<CRS> Atcrs = transposer.createTranspose(transposeParams);
+          
+          At = Tpetra::convertToBlockCrsMatrix(*Atcrs,Op.GetStorageBlockSize());
+        }
+        RCP<Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > AA   = rcp(new Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>(At));
+        RCP<CrsMatrix>                                                           AAA  = rcp_implicit_cast<CrsMatrix>(AA);
+        RCP<Matrix>                                                              AAAA = rcp( new CrsMatrixWrap(AAA));
+        
+        if (Op.IsView("stridedMaps"))
+          AAAA->CreateView("stridedMaps", Teuchos::rcpFromRef(Op), true/*doTranspose*/);
+        
+        return AAAA;
+      } else {
         throw Exceptions::RuntimeError("Utilities::Transpose failed, perhaps because matrix is not a Crs matrix");
       }
     } //if

From e1b03bb782fab40f1328b6730698f6f54a44050d Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 3 Aug 2022 14:29:37 -0600
Subject: [PATCH 081/130] MueLu: Removing printfs

---
 packages/muelu/src/Utils/MueLu_Utilities_decl.hpp | 4 +++-
 packages/muelu/src/Utils/MueLu_Utilities_def.hpp  | 6 ++++--
 2 files changed, 7 insertions(+), 3 deletions(-)

diff --git a/packages/muelu/src/Utils/MueLu_Utilities_decl.hpp b/packages/muelu/src/Utils/MueLu_Utilities_decl.hpp
index 0d66dbf06f82..e9f08ae11e6a 100644
--- a/packages/muelu/src/Utils/MueLu_Utilities_decl.hpp
+++ b/packages/muelu/src/Utils/MueLu_Utilities_decl.hpp
@@ -913,7 +913,9 @@ namespace MueLu {
               using CRS  = Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
               const BCRS & tpetraOp = Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(Op);
 
-              std::cout<<"WARNING: Utilities::Transpose(): Using inefficient placeholder algorithm for Transpose"<<std::endl;//CMSCMS
+              if(!Op.getRowMap()->getComm()->getRank())
+                std::cout<<"WARNING: Utilities::Transpose(): Using inefficient placeholder algorithm for Transpose"<<std::endl;
+
               RCP<BCRS> At;
               RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpetraOp);
               {
diff --git a/packages/muelu/src/Utils/MueLu_Utilities_def.hpp b/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
index 87c843de5b86..8e72e627ca01 100644
--- a/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
+++ b/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
@@ -324,7 +324,7 @@ namespace MueLu {
     if (tmp_ECrsMtx == Teuchos::null)
       throw Exceptions::BadCast("Cast from Xpetra::CrsMatrix to Xpetra::TpetraBlockCrsMatrix failed");
     return tmp_ECrsMtx->getTpetra_BlockCrsMatrixNonConst();
-  };
+  }
   
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
   const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op)   {
@@ -594,7 +594,9 @@ namespace MueLu {
         using CRS  = Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
         const BCRS & tpetraOp = Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(Op);
         
-        std::cout<<"WARNING: Utilities::Transpose(): Using inefficient placeholder algorithm for Transpose"<<std::endl;//CMSCMS
+        if(!Op.getRowMap()->getComm()->getRank())
+          std::cout<<"WARNING: Utilities::Transpose(): Using inefficient placeholder algorithm for Transpose"<<std::endl;
+
         RCP<BCRS> At;
         RCP<const CRS> Acrs = Tpetra::convertToCrsMatrix(tpetraOp);
         {

From 44da6788e571d635ba45b751911d65cb0147ac7c Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 3 Aug 2022 14:45:39 -0600
Subject: [PATCH 082/130] Xpetra: Removing printfs

---
 .../xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp  | 22 +++++++++++++------
 .../sup/Utils/Xpetra_TripleMatrixMultiply.hpp | 19 +++++++++++-----
 2 files changed, 28 insertions(+), 13 deletions(-)

diff --git a/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp b/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
index c95ae6d91b73..217c590bf912 100644
--- a/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_MatrixMatrix.hpp
@@ -502,8 +502,10 @@ Note: this class is not in the Xpetra_UseShortNames.hpp
         else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B)) {
           // All matrices are BlockCrs (except maybe Ac)
           // FIXME: For the moment we're just going to clobber the innards of Ac, so no reuse. Once we have a reuse kernel,
-          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
-          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          // we'll need to think about refactoring BlockCrs so we can do something smarter here.
+          if(!A.getRowMap()->getComm()->getRank())
+            std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpB  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(B);
           using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
@@ -1060,8 +1062,11 @@ Note: this class is not in the Xpetra_UseShortNames.hpp
         else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B)) {
           // All matrices are BlockCrs (except maybe Ac)
           // FIXME: For the moment we're just going to clobber the innards of Ac, so no reuse. Once we have a reuse kernel,
-          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
-          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          // we'll need to think about refactoring BlockCrs so we can do something smarter here.
+
+          if(!A.getRowMap()->getComm()->getRank())
+            std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpB  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(B);
           using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
@@ -1850,10 +1855,13 @@ Note: this class is not in the Xpetra_UseShortNames.hpp
           Tpetra::MatrixMatrix::Multiply(tpA, transposeA, tpB, transposeB, tpC, haveMultiplyDoFillComplete, label, params);
         }
         else if (helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(B)) {
-// All matrices are BlockCrs (except maybe Ac)
+          // All matrices are BlockCrs (except maybe Ac)
           // FIXME: For the moment we're just going to clobber the innards of Ac, so no reuse. Once we have a reuse kernel,
-          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
-          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          // we'll need to think about refactoring BlockCrs so we can do something smarter here.
+
+          if(!A.getRowMap()->getComm()->getRank())
+            std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpB  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(B);
           using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
diff --git a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
index 87eae0493546..d930088f3908 100644
--- a/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
+++ b/packages/xpetra/sup/Utils/Xpetra_TripleMatrixMultiply.hpp
@@ -144,8 +144,11 @@ namespace Xpetra {
         else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
           // All matrices are BlockCrs (except maybe Ac)
           // FIXME: For the moment we're just going to clobber the innards of Ac, so no reuse. Once we have a reuse kernel,
-          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
-          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          // we'll need to think about refactoring BlockCrs so we can do something smarter here.
+
+          if(!A.getRowMap()->getComm()->getRank())
+            std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(R);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpP  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(P);
@@ -271,8 +274,10 @@ namespace Xpetra {
         else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
           // All matrices are BlockCrs (except maybe Ac)
           // FIXME: For the moment we're just going to clobber the innards of AC, so no reuse. Once we have a reuse kernel,
-          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
-          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          // we'll need to think about refactoring BlockCrs so we can do something smarter here.
+          if(!A.getRowMap()->getComm()->getRank())
+            std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(R);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpP  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(P);
@@ -398,8 +403,10 @@ namespace Xpetra {
         else if (helpers::isTpetraBlockCrs(R) && helpers::isTpetraBlockCrs(A) && helpers::isTpetraBlockCrs(P)) {
           // All matrices are BlockCrs (except maybe Ac)
           // FIXME: For the moment we're just going to clobber the innards of AC, so no reuse. Once we have a reuse kernel,
-          // we'll need to think about refactoring BlockCrs so we can do something smartet here.
-          std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+          // we'll need to think about refactoring BlockCrs so we can do something smarter here.
+          if(!A.getRowMap()->getComm()->getRank())
+            std::cout<<"WARNING: Using inefficient BlockCrs Multiply Placeholder"<<std::endl;          
+
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpR  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(R);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpA  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(A);
           const Tpetra::BlockCrsMatrix<SC,LO,GO,NO> & tpP  = Xpetra::Helpers<SC,LO,GO,NO>::Op2TpetraBlockCrs(P);

From 975e7a15a0508f563acf6d9eaa926dbbba0f3f7b Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Wed, 3 Aug 2022 13:57:34 -0700
Subject: [PATCH 083/130] Fix multiple definition link errors

---
 packages/adelus/example/CMakeLists.txt | 9 +++++++--
 1 file changed, 7 insertions(+), 2 deletions(-)

diff --git a/packages/adelus/example/CMakeLists.txt b/packages/adelus/example/CMakeLists.txt
index fa7b437d4bf0..3fdcc9bfa670 100644
--- a/packages/adelus/example/CMakeLists.txt
+++ b/packages/adelus/example/CMakeLists.txt
@@ -38,6 +38,9 @@ SET(CMAKE_CXX_COMPILER ${Trilinos_CXX_COMPILER} )
 SET(CMAKE_C_COMPILER ${Trilinos_C_COMPILER} )
 SET(CMAKE_Fortran_COMPILER ${Trilinos_Fortran_COMPILER} )
 
+#For older versions of Trilinos
+#SET(CMAKE_CXX_FLAGS  "${Trilinos_CXX_COMPILER_FLAGS} ${CMAKE_CXX_FLAGS} --remove-duplicate-link-files")
+#For Trilinos versions after the merge of PR#10614
 SET(CMAKE_CXX_FLAGS  "${Trilinos_CXX_COMPILER_FLAGS} ${CMAKE_CXX_FLAGS}")
 SET(CMAKE_C_FLAGS  "${Trilinos_C_COMPILER_FLAGS} ${CMAKE_C_FLAGS}")
 SET(CMAKE_Fortran_FLAGS  "${Trilinos_Fortran_COMPILER_FLAGS} ${CMAKE_Fortran_FLAGS}")
@@ -58,5 +61,7 @@ ADD_EXECUTABLE(adelus_driver adelus_driver.cpp)
 
 set_property(TARGET adelus_driver PROPERTY CXX_STANDARD 14)
 
-TARGET_LINK_LIBRARIES(adelus_driver ${Trilinos_LIBRARIES} ${Trilinos_TPL_LIBRARIES} ${Trilinos_EXTRA_LD_FLAGS})
-
+#For older versions of Trilinos
+#TARGET_LINK_LIBRARIES(adelus_driver ${Trilinos_LIBRARIES} ${Trilinos_TPL_LIBRARIES} ${Trilinos_EXTRA_LD_FLAGS})
+#For Trilinos versions after the merge of PR#10614
+TARGET_LINK_LIBRARIES(adelus_driver Trilinos::all_selected_libs)

From 4f004e2858155d680bbd5a671f4fccd7af7f5ab3 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 8 Aug 2022 13:21:06 -0700
Subject: [PATCH 084/130] Change class member order

---
 packages/adelus/src/Adelus_vars.hpp | 17 ++++++++++-------
 1 file changed, 10 insertions(+), 7 deletions(-)

diff --git a/packages/adelus/src/Adelus_vars.hpp b/packages/adelus/src/Adelus_vars.hpp
index 59b069e034e8..47b35a41afda 100644
--- a/packages/adelus/src/Adelus_vars.hpp
+++ b/packages/adelus/src/Adelus_vars.hpp
@@ -60,15 +60,21 @@ class AdelusHandle {
   using memory_space    = MemorySpace;
 
  private:
+
+  int comm_id;       // communicator id
+  MPI_Comm comm;     // communicator that I belong to
+  MPI_Comm row_comm; // row sub-communicator that I belong to
+  MPI_Comm col_comm; // column sub-communicator that I belong to
+
   int myrank;        // process id information
 
+  int nrows_matrix;  // number of rows in the matrix
+  int ncols_matrix;  // number of cols in the matrix
+
   int nprocs_cube;   // num of procs in the allocated cube
   int nprocs_row;    // num of procs to which a row is assigned
   int nprocs_col;    // num of procs to which a col is assigned
 
-  int nrows_matrix;  // number of rows in the matrix
-  int ncols_matrix;  // number of cols in the matrix
-
   int my_first_row;  // proc position in a row
   int my_first_col;  // proc position in a col
   
@@ -84,10 +90,7 @@ class AdelusHandle {
   int myrow;         // process id in the col_comm 
   int mycol;         // process id in the row_comm
 
-  MPI_Comm row_comm; // row sub-communicator that I belong to
-  MPI_Comm col_comm; // column sub-communicator that I belong to
-  MPI_Comm comm;     // communicator that I belong to
-  int comm_id;       // communicator id
+
 
  public:
   AdelusHandle( const int comm_id_,

From aeaeec818f114bb58b24465612cd1a110ec0a7b5 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Mon, 8 Aug 2022 13:22:08 -0700
Subject: [PATCH 085/130] Remove unused variables

---
 packages/adelus/src/Adelus.hpp          | 52 +++++++------------------
 packages/adelus/src/Adelus_solve.hpp    |  6 ++-
 packages/adelus/src/Adelus_x_factor.hpp |  3 +-
 3 files changed, 21 insertions(+), 40 deletions(-)

diff --git a/packages/adelus/src/Adelus.hpp b/packages/adelus/src/Adelus.hpp
index cec8f471ef7e..f3c091935370 100644
--- a/packages/adelus/src/Adelus.hpp
+++ b/packages/adelus/src/Adelus.hpp
@@ -120,11 +120,9 @@ namespace Adelus {
   void FactorSolve( HandleType& ahandle,
                     ZRHSViewType& AA,
                     double* secs ) {
-
-    int rank = ahandle.get_myrank();
 	
 #ifdef PRINT_STATUS
-    printf("FactorSolve (Kokkos View interface) in rank %d\n", rank);
+    printf("FactorSolve (Kokkos View interface) in rank %d\n", ahandle.get_myrank());
 #endif
 
     lusolve_(ahandle, AA, secs);
@@ -146,10 +144,8 @@ namespace Adelus {
                PViewType& permute,
                double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
 #ifdef PRINT_STATUS
-    printf("Factor (Kokkos View interface) in rank %d\n", rank);
+    printf("Factor (Kokkos View interface) in rank %d\n", ahandle.get_myrank());
 #endif
 
     lu_(ahandle, AA, permute, secs);
@@ -174,10 +170,8 @@ namespace Adelus {
               PViewType& permute,
               double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
 #ifdef PRINT_STATUS
-    printf("Solve (Kokkos View interface) in rank %d\n", rank);
+    printf("Solve (Kokkos View interface) in rank %d\n", ahandle.get_myrank());
 #endif
 
     solve_(ahandle, AA, BB, permute, secs);
@@ -200,8 +194,6 @@ namespace Adelus {
                            int* num_rhs,
                            double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
     typedef Kokkos::View<Kokkos::complex<double>**,
@@ -216,7 +208,7 @@ namespace Adelus {
     AA_Internal AA_i(reinterpret_cast<Kokkos::complex<double> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
 
 #ifdef PRINT_STATUS
-    printf("FactorSolve_devPtr (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_devPtr (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     lusolve_(ahandle, AA_i, secs);
@@ -239,8 +231,6 @@ namespace Adelus {
                             int* num_rhs,
                             double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
     typedef Kokkos::View<Kokkos::complex<double>**,
                          Kokkos::LayoutLeft,
@@ -261,7 +251,7 @@ namespace Adelus {
     AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
 
 #ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with CUDA solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_hostPtr with CUDA solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
@@ -271,7 +261,7 @@ namespace Adelus {
     Kokkos::deep_copy( AA_i, AA_i_dev );
 #else//OpenMP
 #ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with host solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_hostPtr with host solve (double complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     lusolve_(ahandle, AA_i, secs);
@@ -296,8 +286,6 @@ namespace Adelus {
                            int* num_rhs,
                            double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
     typedef Kokkos::View<double**,
@@ -312,7 +300,7 @@ namespace Adelus {
     AA_Internal AA_i(reinterpret_cast<double *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
 
 #ifdef PRINT_STATUS
-    printf("FactorSolve_devPtr (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_devPtr (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     lusolve_(ahandle, AA_i, secs);
@@ -335,8 +323,6 @@ namespace Adelus {
                             int* num_rhs,
                             double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
     typedef Kokkos::View<double**,
                          Kokkos::LayoutLeft,
@@ -357,7 +343,7 @@ namespace Adelus {
     AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
 
 #ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with CUDA solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_hostPtr with CUDA solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
@@ -367,7 +353,7 @@ namespace Adelus {
     Kokkos::deep_copy( AA_i, AA_i_dev );
 #else//OpenMP
 #ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with host solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_hostPtr with host solve (double pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     lusolve_(ahandle, AA_i, secs);
@@ -392,8 +378,6 @@ namespace Adelus {
                            int* num_rhs,
                            double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
     typedef Kokkos::View<Kokkos::complex<float>**,
@@ -408,7 +392,7 @@ namespace Adelus {
     AA_Internal AA_i(reinterpret_cast<Kokkos::complex<float> *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
 
 #ifdef PRINT_STATUS
-    printf("FactorSolve_devPtr (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_devPtr (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     lusolve_(ahandle, AA_i, secs);
@@ -431,8 +415,6 @@ namespace Adelus {
                             int* num_rhs,
                             double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
     typedef Kokkos::View<Kokkos::complex<float>**,
                          Kokkos::LayoutLeft,
@@ -453,7 +435,7 @@ namespace Adelus {
     AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
 
 #ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with CUDA solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_hostPtr with CUDA solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
@@ -463,7 +445,7 @@ namespace Adelus {
     Kokkos::deep_copy( AA_i, AA_i_dev );
 #else//OpenMP
 #ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with host solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_hostPtr with host solve (float complex pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     lusolve_(ahandle, AA_i, secs);
@@ -488,8 +470,6 @@ namespace Adelus {
                            int* num_rhs,
                            double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
 #if defined(KOKKOS_ENABLE_CUDA) || defined(KOKKOS_ENABLE_HIP)
     typedef Kokkos::View<float**,
@@ -504,7 +484,7 @@ namespace Adelus {
     AA_Internal AA_i(reinterpret_cast<float *>(AA), my_rows_, my_cols_ + my_rhs_ + 6);
 
 #ifdef PRINT_STATUS
-    printf("FactorSolve_devPtr (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_devPtr (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     lusolve_(ahandle, AA_i, secs);
@@ -527,8 +507,6 @@ namespace Adelus {
                             int* num_rhs,
                             double* secs ) {
 
-    int rank = ahandle.get_myrank();
-
     { // Note: To avoid segmentation fault when FactorSolve is called multiple times with the unmanaged View, it's safest to make sure unmanaged View falls out of scope before freeing its memory.
     typedef Kokkos::View<float**,
                          Kokkos::LayoutLeft,
@@ -549,7 +527,7 @@ namespace Adelus {
     AA_Internal_dev AA_i_dev( "AA_i_dev", my_rows_, my_cols_ + my_rhs_ + 6 );
 
 #ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with CUDA solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_hostPtr with CUDA solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     Kokkos::deep_copy( AA_i_dev, AA_i );
@@ -559,7 +537,7 @@ namespace Adelus {
     Kokkos::deep_copy( AA_i, AA_i_dev );
 #else//OpenMP
 #ifdef PRINT_STATUS
-    printf("FactorSolve_hostPtr with host solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", rank, my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
+    printf("FactorSolve_hostPtr with host solve (float pointer interface) in rank %d -- my_rows %u , my_cols %u, my_rhs %u , matrix_size %u, num_procs_per_row %u, num_rhs %u\n", ahandle.get_myrank(), my_rows_, my_cols_, my_rhs_, *matrix_size, *num_procsr, *num_rhs);
 #endif
 
     lusolve_(ahandle, AA_i, secs);
diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index 9a2ca4d8c92e..c0ce0130bf6b 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -407,10 +407,14 @@ void back_solve_currcol_bcast(HandleType& ahandle, ZViewType& Z, RHSViewType& RH
 #endif
 #endif
 
+#if defined(GET_TIMING) || defined(PRINT_STATUS))
+  int me            = ahandle.get_myrank();
+#ifdef GET_TIMING
   MPI_Comm comm     = ahandle.get_comm();
+#endif
+#endif
   MPI_Comm col_comm = ahandle.get_col_comm();
   MPI_Comm row_comm = ahandle.get_row_comm();
-  int me            = ahandle.get_myrank();
   int myrow         = ahandle.get_myrow();
   int mycol         = ahandle.get_mycol();
   int nprocs_row    = ahandle.get_nprocs_row();
diff --git a/packages/adelus/src/Adelus_x_factor.hpp b/packages/adelus/src/Adelus_x_factor.hpp
index 844c7c935602..57f42f725156 100644
--- a/packages/adelus/src/Adelus_x_factor.hpp
+++ b/packages/adelus/src/Adelus_x_factor.hpp
@@ -83,14 +83,13 @@ void lu_(HandleType& ahandle, ZViewType& Z, PViewType& permute, double *secs)
   int blksz   = ahandle.get_blksz();
   int my_rows = ahandle.get_my_rows();
   int my_cols = ahandle.get_my_cols();
-  int nrhs    = ahandle.get_nrhs();
 
   double run_secs; // time (in secs) during which the prog ran
   double tsecs;    // intermediate storage of timing info
   int totmem = 0;  // Initialize the total memory used
   
 #ifdef PRINT_STATUS
-  printf("Rank %i -- factor_() Begin LU with blksz %d, myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), blksz, ahandle.get_myrow(), ahandle.get_mycol(), ahandle.get_nprocs_row(), ahandle.get_nprocs_col(), ahandle.get_nrows_matrix(), ahandle.get_ncols_matrix(), my_rows, my_cols, ahandle.get_my_rhs(), nrhs, typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
+  printf("Rank %i -- factor_() Begin LU with blksz %d, myrow %d, mycol %d, nprocs_row %d, nprocs_col %d, nrows_matrix %d, ncols_matrix %d, my_rows %d, my_cols %d, my_rhs %d, nrhs %d, value_type %s, execution_space %s, memory_space %s\n", ahandle.get_myrank(), blksz, ahandle.get_myrow(), ahandle.get_mycol(), ahandle.get_nprocs_row(), ahandle.get_nprocs_col(), ahandle.get_nrows_matrix(), ahandle.get_ncols_matrix(), my_rows, my_cols, ahandle.get_my_rhs(), ahandle.get_nrhs(), typeid(value_type).name(), typeid(execution_space).name(), typeid(memory_space).name());
 #endif
 
   // Allocate arrays for factor

From fe2883d681dc95593190da45f2f4e3b707ed7de6 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 9 Aug 2022 10:47:35 -0600
Subject: [PATCH 086/130] MueLu: More BlockCrs fixes

---
 ...eLu_GeometricInterpolationPFactory_def.hpp | 106 +++++++++++++++---
 1 file changed, 90 insertions(+), 16 deletions(-)

diff --git a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
index ec727d2155a3..83e8031c419c 100644
--- a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
+++ b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
@@ -52,6 +52,9 @@
 #include "MueLu_MasterList.hpp"
 #include "MueLu_Monitor.hpp"
 #include "MueLu_Aggregates.hpp"
+#ifdef HAVE_MUELU_TPETRA
+#include "Xpetra_TpetraCrsMatrix.hpp"
+#endif
 
 // Including this one last ensure that the short names of the above headers are defined properly
 #include "MueLu_GeometricInterpolationPFactory_decl.hpp"
@@ -110,8 +113,7 @@ namespace MueLu {
       Input(fineLevel, "Coordinates");
       Input(fineLevel, "coarseCoordinatesFineMap");
       Input(fineLevel, "coarseCoordinatesMap");
-    }
-
+    }     
   }
 
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
@@ -155,6 +157,7 @@ namespace MueLu {
       SubFactoryMonitor sfm(*this, "BuildCoordinates", coarseLevel);
       RCP<const Map> coarseCoordsFineMap = Get< RCP<const Map> >(fineLevel, "coarseCoordinatesFineMap");
       RCP<const Map> coarseCoordsMap = Get< RCP<const Map> >(fineLevel, "coarseCoordinatesMap");
+
       fineCoordinates   = Get< RCP<realvaluedmultivector_type> >(fineLevel, "Coordinates");
       coarseCoordinates = Xpetra::MultiVectorFactory<real_type,LO,GO,Node>::Build(coarseCoordsFineMap,
                                                                                   fineCoordinates->getNumVectors());
@@ -172,6 +175,7 @@ namespace MueLu {
 
     *out << "Fine and coarse coordinates have been loaded from the fine level and set on the coarse level." << std::endl;
 
+
     if(interpolationOrder == 0) {
       SubFactoryMonitor sfm(*this, "BuildConstantP", coarseLevel);
       // Compute the prolongator using piece-wise constant interpolation
@@ -222,8 +226,19 @@ namespace MueLu {
       RCP<MultiVector> fineNullspace   = Get< RCP<MultiVector> > (fineLevel, "Nullspace");
       RCP<MultiVector> coarseNullspace = MultiVectorFactory::Build(P->getDomainMap(),
                                                                    fineNullspace->getNumVectors());
-      P->apply(*fineNullspace, *coarseNullspace, Teuchos::TRANS, Teuchos::ScalarTraits<SC>::one(),
-               Teuchos::ScalarTraits<SC>::zero());
+      
+      using helpers=Xpetra::Helpers<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+      if(helpers::isTpetraBlockCrs(A)) {
+        // FIXME: BlockCrs doesn't currently support transpose apply, so we have to do this the hard way
+        RCP<Matrix> Ptrans = Utilities::Transpose(*P);
+        Ptrans->apply(*fineNullspace, *coarseNullspace, Teuchos::NO_TRANS, Teuchos::ScalarTraits<SC>::one(),
+                 Teuchos::ScalarTraits<SC>::zero());
+      }
+      else {
+        P->apply(*fineNullspace, *coarseNullspace, Teuchos::TRANS, Teuchos::ScalarTraits<SC>::one(),
+                 Teuchos::ScalarTraits<SC>::zero());
+      }
+
       Set(coarseLevel, "Nullspace", coarseNullspace);
     }
 
@@ -257,19 +272,78 @@ namespace MueLu {
 
     *out << "Call prolongator constructor" << std::endl;
 
-    // Create the prolongator matrix and its associated objects
-    RCP<ParameterList> dummyList = rcp(new ParameterList());
-    P = rcp(new CrsMatrixWrap(prolongatorGraph, dummyList));
-    RCP<CrsMatrix> PCrs = rcp_dynamic_cast<CrsMatrixWrap>(P)->getCrsMatrix();
-    PCrs->setAllToScalar(1.0);
-    PCrs->fillComplete();
+    using helpers=Xpetra::Helpers<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+    if(helpers::isTpetraBlockCrs(A)) {
+#ifdef HAVE_MUELU_TPETRA
+      LO one  = Teuchos::ScalarTraits<SC>::one();
+      LO zero = Teuchos::ScalarTraits<SC>::zero();
+      LO NSDim = A->GetStorageBlockSize();
+
+      // Build the exploded Map
+      RCP<const Map> BlockMap = prolongatorGraph->getDomainMap();
+      Teuchos::ArrayView<const GO> block_dofs = BlockMap->getLocalElementList();
+      Teuchos::Array<GO> point_dofs(block_dofs.size()*NSDim);
+      for(LO i=0, ct=0; i<block_dofs.size(); i++) {
+        for(LO j=0; j<NSDim; j++) {
+          point_dofs[ct] = block_dofs[i]*NSDim + j;
+          ct++;
+        }
+      }
+      
+      RCP<const Map> PointMap = MapFactory::Build(BlockMap->lib(),
+                                                  BlockMap->getGlobalNumElements() *NSDim,
+                                                  point_dofs(),
+                                                  BlockMap->getIndexBase(),
+                                                  BlockMap->getComm());
+      strideInfo[0]    = A->GetFixedBlockSize();
+      RCP<const StridedMap> stridedPointMap =  StridedMapFactory::Build(PointMap, strideInfo);
+
+      RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = Xpetra::CrsMatrixFactory<SC,LO,GO,NO>::BuildBlock(prolongatorGraph, PointMap, A->getRangeMap(),NSDim);
+      RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp_dynamic_cast<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> >(P_xpetra);
+      if(P_tpetra.is_null()) throw std::runtime_error("BuildPUncoupled: Matrix factory did not return a Tpetra::BlockCrsMatrix");
+      RCP<CrsMatrixWrap> P_wrap = rcp(new CrsMatrixWrap(P_xpetra));
+
+      // NOTE: Assumes block-diagonal prolongation
+      Teuchos::Array<LO> temp(1);
+      Teuchos::ArrayView<const LO> indices;
+      Teuchos::Array<Scalar> block(NSDim*NSDim, zero);
+      for(LO i=0; i<NSDim; i++)
+        block[i*NSDim+i] = one;
+      for(LO i=0; i<(int)prolongatorGraph->getLocalNumRows(); i++) {
+        prolongatorGraph->getLocalRowView(i,indices);
+        for(LO j=0; j<(LO)indices.size();j++) {
+          temp[0] = indices[j];
+          P_tpetra->replaceLocalValues(i,temp(),block());
+        }
+      }
+
+      P = P_wrap;
+      if (A->IsView("stridedMaps") == true) {
+        P->CreateView("stridedMaps", A->getRowMap("stridedMaps"), stridedPointMap);
+      }
+      else {
+        P->CreateView("stridedMaps", P->getRangeMap(),   PointMap);
+      }
+
+#else
+      throw std::runtime_error("GeometricInteroplationFactory::Build(): BlockCrs requires Tpetra");
+#endif
 
-    // set StridingInformation of P
-    if (A->IsView("stridedMaps") == true) {
-      P->CreateView("stridedMaps", A->getRowMap("stridedMaps"), stridedDomainMap);
-    } else {
-      P->CreateView("stridedMaps", P->getRangeMap(), stridedDomainMap);
     }
+    else {
+      // Create the prolongator matrix and its associated objects
+      RCP<ParameterList> dummyList = rcp(new ParameterList());
+      P = rcp(new CrsMatrixWrap(prolongatorGraph, dummyList));
+      RCP<CrsMatrix> PCrs = rcp_dynamic_cast<CrsMatrixWrap>(P)->getCrsMatrix();
+      PCrs->setAllToScalar(1.0);
+      PCrs->fillComplete();          
+
+      // set StridingInformation of P    
+      if (A->IsView("stridedMaps") == true)
+        P->CreateView("stridedMaps", A->getRowMap("stridedMaps"), stridedDomainMap);
+      else 
+        P->CreateView("stridedMaps", P->getRangeMap(), stridedDomainMap);
+    }      
 
   } // BuildConstantP
 
@@ -293,7 +367,7 @@ namespace MueLu {
 
     // Compute 2^numDimensions using bit logic to avoid round-off errors
     const int numInterpolationPoints = 1 << numDimensions;
-    const int dofsPerNode = A->GetFixedBlockSize();
+    const int dofsPerNode = A->GetFixedBlockSize()/ A->GetStorageBlockSize();;
 
     RCP<ParameterList> dummyList = rcp(new ParameterList());
     P = rcp(new CrsMatrixWrap(prolongatorGraph, dummyList));

From 1a1fa4f126fad771e00e67a5b731935af373015c Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 9 Aug 2022 11:35:03 -0600
Subject: [PATCH 087/130] Ifpack2: Adding some debugging output

---
 packages/ifpack2/src/Ifpack2_BlockRelaxation_def.hpp | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/packages/ifpack2/src/Ifpack2_BlockRelaxation_def.hpp b/packages/ifpack2/src/Ifpack2_BlockRelaxation_def.hpp
index 53bd87de9a5d..78f5085479d0 100644
--- a/packages/ifpack2/src/Ifpack2_BlockRelaxation_def.hpp
+++ b/packages/ifpack2/src/Ifpack2_BlockRelaxation_def.hpp
@@ -1053,6 +1053,11 @@ description () const
   } else {
     out << "INVALID";
   }
+
+  // BlockCrs if we have that
+  if(hasBlockCrsMatrix_)
+    out<<", BlockCrs";
+
   // Print the approximate # rows per part
   int approx_rows_per_part = A_->getLocalNumRows()/Partitioner_->numLocalParts();
   out <<", blocksize: "<<approx_rows_per_part;

From 745f70582e4f6760cffc11f9f755f7342a0bb937 Mon Sep 17 00:00:00 2001
From: Vinh Dang <vqdang@sandia.gov>
Date: Tue, 9 Aug 2022 11:48:49 -0700
Subject: [PATCH 088/130] Remove redundant parenthesis

---
 packages/adelus/src/Adelus_solve.hpp | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/adelus/src/Adelus_solve.hpp b/packages/adelus/src/Adelus_solve.hpp
index c0ce0130bf6b..fe20098ef03e 100644
--- a/packages/adelus/src/Adelus_solve.hpp
+++ b/packages/adelus/src/Adelus_solve.hpp
@@ -407,7 +407,7 @@ void back_solve_currcol_bcast(HandleType& ahandle, ZViewType& Z, RHSViewType& RH
 #endif
 #endif
 
-#if defined(GET_TIMING) || defined(PRINT_STATUS))
+#if defined(GET_TIMING) || defined(PRINT_STATUS)
   int me            = ahandle.get_myrank();
 #ifdef GET_TIMING
   MPI_Comm comm     = ahandle.get_comm();

From eaab4052fe1071202065585eede7b154f27276ac Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 9 Aug 2022 13:43:49 -0600
Subject: [PATCH 089/130] MueLu: Addressing concerns from @jhux2

---
 .../MueLu_AmalgamationFactory_def.hpp         | 23 +++++++++++++------
 .../MueLu_AmalgamationFactory_kokkos_def.hpp  | 23 +++++++++++++------
 .../MueLu_CoalesceDropFactory_def.hpp         | 17 ++++++++++++++
 .../MueLu_CoalesceDropFactory_kokkos_def.hpp  | 18 +++++++++++++++
 4 files changed, 67 insertions(+), 14 deletions(-)

diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
index 56d4fdb216cc..9b4f08644349 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_def.hpp
@@ -75,14 +75,22 @@ namespace MueLu {
 
     RCP<Matrix> A = Get< RCP<Matrix> >(currentLevel, "A");
 
-    /* NOTE: Fullblocksize here represents the number of blocks of whatever storage type is represented by the matrix, specifically
-       the GetFixedBlockSize() which should come from the # PDEs specified on the input deck (or null space dimension on finer levels).
-       So for a point matrix, that's the block size.  
+    /* NOTE: storageblocksize (from GetStorageBlockSize()) is the size of a block in the chosen storage scheme.
+       fullblocksize is the number of storage blocks that must kept together during the amalgamation process.
+
+       Both of these quantities may be different than numPDEs (from GetFixedBlockSize()), but the following must always hold:
+
+       numPDEs = fullblocksize * storageblocksize.
        
-       For a BlockCrsMatrix, that's the number of blocks of the BlockCrs object which make up a logical block for amalgamation.  Here we 
-       divide the GetFixedBlockSize() by the GetStorageBlockSize().  We've only tested fullblocksize=1 in the BlockCrs case, but in theory
-       you could use a larger number here.
-     */
+       If numPDEs==1
+         Matrix is point storage (classical CRS storage).  storageblocksize=1 and fullblocksize=1
+         No other values makes sense.
+
+       If numPDEs>1
+         If matrix uses point storage, then storageblocksize=1  and fullblockssize=numPDEs.
+         If matrix uses block storage, with block size of n, then storageblocksize=n, and fullblocksize=numPDEs/n.  
+         Thus far, only storageblocksize=numPDEs and fullblocksize=1 has been tested.
+    */
 
 
     LO fullblocksize    = 1;   // block dim for fixed size blocks
@@ -113,6 +121,7 @@ namespace MueLu {
         stridedblocksize = fullblocksize;
       }
       // Correct for the storageblocksize
+      // NOTE:  Before this point fullblocksize is actually numPDEs
       TEUCHOS_TEST_FOR_EXCEPTION(fullblocksize % storageblocksize != 0,Exceptions::RuntimeError,"AmalgamationFactory: fullblocksize needs to be a multiple of A->GetStorageBlockSize()");
       fullblocksize /= storageblocksize;
       stridedblocksize /= storageblocksize;
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_kokkos_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_kokkos_def.hpp
index 088a065f8d4a..cc284df2e27b 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_AmalgamationFactory_kokkos_def.hpp
@@ -80,14 +80,22 @@ namespace MueLu {
 
     RCP<Matrix> A = Get< RCP<Matrix> >(currentLevel, "A");
 
-    /* NOTE: Fullblocksize here represents the number of blocks of whatever storage type is represented by the matrix, specifically
-       the GetFixedBlockSize() which should come from the # PDEs specified on the input deck (or null space dimension on finer levels).
-       So for a point matrix, that's the block size.  
+   /* NOTE: storageblocksize (from GetStorageBlockSize()) is the size of a block in the chosen storage scheme.
+       fullblocksize is the number of storage blocks that must kept together during the amalgamation process.
+
+       Both of these quantities may be different than numPDEs (from GetFixedBlockSize()), but the following must always hold:
+
+       numPDEs = fullblocksize * storageblocksize.
        
-       For a BlockCrsMatrix, that's the number of blocks of the BlockCrs object which make up a logical block for amalgamation.  Here we 
-       divide the GetFixedBlockSize() by the GetStorageBlockSize().  We've only tested fullblocksize=1 in the BlockCrs case, but in theory
-       you could use a larger number here.
-     */
+       If numPDEs==1
+         Matrix is point storage (classical CRS storage).  storageblocksize=1 and fullblocksize=1
+         No other values makes sense.
+
+       If numPDEs>1
+         If matrix uses point storage, then storageblocksize=1  and fullblockssize=numPDEs.
+         If matrix uses block storage, with block size of n, then storageblocksize=n, and fullblocksize=numPDEs/n.  
+         Thus far, only storageblocksize=numPDEs and fullblocksize=1 has been tested.
+    */
 
     LO fullblocksize    = 1;   // block dim for fixed size blocks
     GO offset           = 0;   // global offset of dof gids
@@ -117,6 +125,7 @@ namespace MueLu {
         stridedblocksize = fullblocksize;
       }
       // Correct for the storageblocksize
+      // NOTE:  Before this point fullblocksize is actually numPDEs
       TEUCHOS_TEST_FOR_EXCEPTION(fullblocksize % storageblocksize != 0,Exceptions::RuntimeError,"AmalgamationFactory::Build(): fullblocksize needs to be a multiple of A->GetStorageBlockSize()");
       fullblocksize /= storageblocksize;
       stridedblocksize /= storageblocksize;
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
index 3b0f72e8490e..4d5f035069e1 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_def.hpp
@@ -396,6 +396,23 @@ namespace MueLu {
       GO numDropped = 0, numTotal = 0;
       std::string graphType = "unamalgamated"; //for description purposes only
 
+      
+      /* NOTE: storageblocksize (from GetStorageBlockSize()) is the size of a block in the chosen storage scheme.
+       BlockSize is the number of storage blocks that must kept together during the amalgamation process.
+
+       Both of these quantities may be different than numPDEs (from GetFixedBlockSize()), but the following must always hold:
+
+       numPDEs = BlockSize * storageblocksize.
+       
+       If numPDEs==1
+         Matrix is point storage (classical CRS storage).  storageblocksize=1 and BlockSize=1
+         No other values makes sense.
+
+       If numPDEs>1
+         If matrix uses point storage, then storageblocksize=1  and BlockSize=numPDEs.
+         If matrix uses block storage, with block size of n, then storageblocksize=n, and BlockSize=numPDEs/n.  
+         Thus far, only storageblocksize=numPDEs and BlockSize=1 has been tested.
+      */      
       TEUCHOS_TEST_FOR_EXCEPTION(A->GetFixedBlockSize() % A->GetStorageBlockSize() != 0,Exceptions::RuntimeError,"A->GetFixedBlockSize() needs to be a multiple of A->GetStorageBlockSize()");
       const LO BlockSize = A->GetFixedBlockSize() / A->GetStorageBlockSize();
 
diff --git a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_kokkos_def.hpp b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_kokkos_def.hpp
index bed7c17901f1..8f5a42e6d653 100644
--- a/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Graph/MatrixTransformation/MueLu_CoalesceDropFactory_kokkos_def.hpp
@@ -507,6 +507,24 @@ namespace MueLu {
 
     auto A         = Get< RCP<Matrix> >(currentLevel, "A");
 
+
+    /* NOTE: storageblocksize (from GetStorageBlockSize()) is the size of a block in the chosen storage scheme.
+       blkSize is the number of storage blocks that must kept together during the amalgamation process.
+
+       Both of these quantities may be different than numPDEs (from GetFixedBlockSize()), but the following must always hold:
+
+       numPDEs = blkSize * storageblocksize.
+       
+       If numPDEs==1
+         Matrix is point storage (classical CRS storage).  storageblocksize=1 and  blkSize=1
+         No other values makes sense.
+
+       If numPDEs>1
+         If matrix uses point storage, then storageblocksize=1  and blkSize=numPDEs.
+         If matrix uses block storage, with block size of n, then storageblocksize=n, and blkSize=numPDEs/n.  
+         Thus far, only storageblocksize=numPDEs and blkSize=1 has been tested.
+      */      
+ 
     TEUCHOS_TEST_FOR_EXCEPTION(A->GetFixedBlockSize() % A->GetStorageBlockSize() != 0,Exceptions::RuntimeError,"A->GetFixedBlockSize() needs to be a multiple of A->GetStorageBlockSize()");
     LO   blkSize   = A->GetFixedBlockSize() / A->GetStorageBlockSize();
 

From 152b24201a67fc94f83c85bc100243a445701519 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 9 Aug 2022 15:12:00 -0600
Subject: [PATCH 090/130] MueLu: Adding more testing

---
 .../ParameterListInterpreter.cpp              | 73 ++++++++++++++++++-
 1 file changed, 72 insertions(+), 1 deletion(-)

diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
index 42498a63cbf4..bd891198678b 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
@@ -51,9 +51,15 @@
 
 #include <MueLu_ParameterListInterpreter.hpp>
 #include <MueLu_Exceptions.hpp>
+#include <MueLu_Utilities.hpp>
 
 #include <Xpetra_MatrixMatrix.hpp>
 
+#ifdef HAVE_MUELU_TPETRA
+#include "Tpetra_BlockCrsMatrix_Helpers.hpp"
+#endif
+
+
 namespace MueLuTests {
 
   TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, SetParameterList, Scalar, LocalOrdinal, GlobalOrdinal, Node)
@@ -144,9 +150,74 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, BlockCrs, Scalar, Lo
     TEST_EQUALITY(1,1);
   }
 
+
+TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, PointCrs_vs_BlockCrs, Scalar, LocalOrdinal, GlobalOrdinal, Node)
+  {
+#   include <MueLu_UseShortNames.hpp>
+    MUELU_TESTING_SET_OSTREAM;
+    MUELU_TESTING_LIMIT_SCOPE(Scalar,GlobalOrdinal,Node);
+#if defined(HAVE_MUELU_TPETRA)
+    MUELU_TEST_ONLY_FOR(Xpetra::UseTpetra) {
+      Teuchos::ParameterList matrixParams;
+      matrixParams.set("matrixType","Laplace1D");
+      matrixParams.set("nx",(GlobalOrdinal)300);// needs to be even
+      
+      RCP<Matrix> PointA = TestHelpers::TestFactory<SC, LO, GO, NO>::BuildMatrix(matrixParams,Xpetra::UseTpetra);  
+      RCP<Matrix> BlockA;
+      {
+        //using CRS  = Tpetra::CrsMatrix<SC,LO,GO,NO>;
+        //using BCRS = Tpetra::BlockCrsMatrix<SC,LO,GO,NO>;
+        using XCRS = Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>;
+
+        auto tA = MueLu::Utilities<SC,LO,GO,NO>::Op2TpetraCrs(PointA);
+        auto bA = Tpetra::convertToBlockCrsMatrix<SC,LO,GO,NO>(*tA,1);      
+        RCP<XCRS> AA   = rcp(new XCRS(bA));
+        BlockA = rcp(new CrsMatrixWrap(rcp_implicit_cast<CrsMatrix>(AA)));
+      }
+
+      out<<"Point: Matrix Size (block) = "<<PointA->getGlobalNumRows()<<" (point) "<<PointA->getRangeMap()->getGlobalNumElements()<<std::endl;
+      out<<"Block: Matrix Size (block) = "<<BlockA->getGlobalNumRows()<<" (point) "<<BlockA->getRangeMap()->getGlobalNumElements()<<std::endl;
+      RCP<const Teuchos::Comm<int> > comm = TestHelpers::Parameters::getDefaultComm();
+      
+      ArrayRCP<std::string> fileList = TestHelpers::GetFileList(std::string("ParameterList/ParameterListInterpreter/"), std::string(".xml"));
+      
+      for(int i=0; i< fileList.size(); i++) {
+        // Only run files without "BlockCrs" in their name (since those guys hardwired the block size)
+        auto found = fileList[i].find("BlockCrs");
+        if(found != std::string::npos) continue;
+        
+        out << "Processing file: " << fileList[i] << std::endl;
+        
+        // Point Hierarchy
+        ParameterListInterpreter mueluFactory1("ParameterList/ParameterListInterpreter/" + fileList[i],*comm);
+        RCP<Hierarchy> PointH = mueluFactory1.CreateHierarchy();
+        PointH->GetLevel(0)->Set("A", PointA);       
+        mueluFactory1.SetupHierarchy(*PointH);
+
+        // Block Hierachy
+#if 0
+        ParameterListInterpreter mueluFactory2("ParameterList/ParameterListInterpreter/" + fileList[i],*comm);
+        RCP<Hierarchy> BlockH = mueluFactory2.CreateHierarchy();
+        BlockH->GetLevel(0)->Set("A", BlockA);       
+        mueluFactory2.SetupHierarchy(*BlockH);
+#endif
+
+        // Check to see that we get the same matrices in both hierarchies
+
+
+        //TODO: check no unused parameters
+        //TODO: check results of Iterate()
+      }
+    }
+#   endif
+    TEST_EQUALITY(1,1);
+  }
+
+
 #define MUELU_ETI_GROUP(Scalar, LocalOrdinal, GlobalOrdinal, Node) \
   TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(ParameterListInterpreter, SetParameterList, Scalar, LocalOrdinal, GlobalOrdinal, Node) \
-  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(ParameterListInterpreter, BlockCrs, Scalar, LocalOrdinal, GlobalOrdinal, Node)
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(ParameterListInterpreter, BlockCrs, Scalar, LocalOrdinal, GlobalOrdinal, Node) \
+  TEUCHOS_UNIT_TEST_TEMPLATE_4_INSTANT(ParameterListInterpreter, PointCrs_vs_BlockCrs, Scalar, LocalOrdinal, GlobalOrdinal, Node)
 
 #include <MueLu_ETI_4arg.hpp>
 

From a70b4eef35ae6a1fe8c95998ec8c279b4ef8b65b Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 11 Aug 2022 10:51:26 -0600
Subject: [PATCH 091/130] MueLu: Adding comparison test for BlockCrs vs.
 PointCrs

---
 .../ParameterListInterpreter.cpp              | 70 ++++++++++++++++---
 .../ParameterListInterpreter/CMakeLists.txt   |  1 +
 .../ParameterListInterpreter/Comparison1.xml  | 27 +++++++
 3 files changed, 90 insertions(+), 8 deletions(-)
 create mode 100644 packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/Comparison1.xml

diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
index bd891198678b..90639e98e0d9 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter.cpp
@@ -57,6 +57,7 @@
 
 #ifdef HAVE_MUELU_TPETRA
 #include "Tpetra_BlockCrsMatrix_Helpers.hpp"
+#include "TpetraExt_MatrixMatrix.hpp"
 #endif
 
 
@@ -79,6 +80,10 @@ namespace MueLuTests {
       auto found = fileList[i].find("BlockCrs");
       if(found != std::string::npos) continue;
 
+      // Ignore files with "Comparison" in their name
+      found = fileList[i].find("Comparison");
+      if(found != std::string::npos) continue;
+
       out << "Processing file: " << fileList[i] << std::endl;
       ParameterListInterpreter mueluFactory("ParameterList/ParameterListInterpreter/" + fileList[i],*comm);
 
@@ -151,6 +156,31 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, BlockCrs, Scalar, Lo
   }
 
 
+
+#if defined(HAVE_MUELU_TPETRA)
+template<class Matrix,class MT>
+MT compare_matrices(RCP<Matrix> & Ap, RCP<Matrix> &Ab) {
+  using SC = typename Matrix::scalar_type;
+  using LO = typename Matrix::local_ordinal_type;
+  using GO = typename Matrix::global_ordinal_type;
+  using NO = typename Matrix::node_type;
+  using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
+  SC one   = Teuchos::ScalarTraits<SC>::one();
+  SC zero  = Teuchos::ScalarTraits<SC>::zero();
+
+  RCP<const CRS> Ap_t = MueLu::Utilities<SC,LO,GO,NO>::Op2TpetraCrs(Ap);
+  auto Ab_t = MueLu::Utilities<SC,LO,GO,NO>::Op2TpetraBlockCrs(Ab);
+  RCP<CRS> Ab_as_point = Tpetra::convertToCrsMatrix<SC,LO,GO,NO>(*Ab_t);  
+
+  RCP<CRS> diff = rcp(new CRS(Ap_t->getCrsGraph()));
+  diff->setAllToScalar(zero);
+  diff->fillComplete();
+  Tpetra::MatrixMatrix::Add<SC,LO,GO,NO>(*Ap_t,false,one,*Ab_as_point,false,-one,diff);
+  return diff->getFrobeniusNorm();
+}
+#endif
+
+
 TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, PointCrs_vs_BlockCrs, Scalar, LocalOrdinal, GlobalOrdinal, Node)
   {
 #   include <MueLu_UseShortNames.hpp>
@@ -165,8 +195,6 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, PointCrs_vs_BlockCrs
       RCP<Matrix> PointA = TestHelpers::TestFactory<SC, LO, GO, NO>::BuildMatrix(matrixParams,Xpetra::UseTpetra);  
       RCP<Matrix> BlockA;
       {
-        //using CRS  = Tpetra::CrsMatrix<SC,LO,GO,NO>;
-        //using BCRS = Tpetra::BlockCrsMatrix<SC,LO,GO,NO>;
         using XCRS = Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO>;
 
         auto tA = MueLu::Utilities<SC,LO,GO,NO>::Op2TpetraCrs(PointA);
@@ -182,9 +210,9 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, PointCrs_vs_BlockCrs
       ArrayRCP<std::string> fileList = TestHelpers::GetFileList(std::string("ParameterList/ParameterListInterpreter/"), std::string(".xml"));
       
       for(int i=0; i< fileList.size(); i++) {
-        // Only run files without "BlockCrs" in their name (since those guys hardwired the block size)
-        auto found = fileList[i].find("BlockCrs");
-        if(found != std::string::npos) continue;
+        // Only run files with "Comparison" in their name
+        auto found = fileList[i].find("Comparison");
+        if(found == std::string::npos) continue;
         
         out << "Processing file: " << fileList[i] << std::endl;
         
@@ -195,15 +223,41 @@ TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(ParameterListInterpreter, PointCrs_vs_BlockCrs
         mueluFactory1.SetupHierarchy(*PointH);
 
         // Block Hierachy
-#if 0
         ParameterListInterpreter mueluFactory2("ParameterList/ParameterListInterpreter/" + fileList[i],*comm);
         RCP<Hierarchy> BlockH = mueluFactory2.CreateHierarchy();
         BlockH->GetLevel(0)->Set("A", BlockA);       
         mueluFactory2.SetupHierarchy(*BlockH);
-#endif
 
         // Check to see that we get the same matrices in both hierarchies
-
+        TEST_EQUALITY(PointH->GetNumLevels(),BlockH->GetNumLevels());
+
+        for(int j=0; j<PointH->GetNumLevels(); j++) {
+          using CRS=Tpetra::CrsMatrix<SC,LO,GO,NO>;
+          using MT  = typename Teuchos::ScalarTraits<SC>::magnitudeType;
+          MT tol = Teuchos::ScalarTraits<MT>::squareroot(Teuchos::ScalarTraits<MT>::eps());
+         
+          RCP<Level> Plevel = PointH->GetLevel(j);
+          RCP<Level> Blevel = BlockH->GetLevel(j);
+
+          // Compare A
+          RCP<Matrix> Ap = Plevel->Get<RCP<Matrix> >("A");
+          RCP<Matrix> Ab = Blevel->Get<RCP<Matrix> >("A");
+          MT norm = compare_matrices<Matrix,MT>(Ap,Ab);
+          TEUCHOS_TEST_COMPARE(norm,<,tol,out,success);         
+
+          // Compare P, R
+          if(j>0) {
+            RCP<Matrix> Pp = Plevel->Get<RCP<Matrix> >("P");
+            RCP<Matrix> Pb = Blevel->Get<RCP<Matrix> >("P");
+            norm = compare_matrices<Matrix,MT>(Pp,Pb);
+            TEUCHOS_TEST_COMPARE(norm,<,tol,out,success);         
+
+            RCP<Matrix> Rp = Plevel->Get<RCP<Matrix> >("R");
+            RCP<Matrix> Rb = Blevel->Get<RCP<Matrix> >("R");
+            norm = compare_matrices<Matrix,MT>(Rp,Rb);
+            TEUCHOS_TEST_COMPARE(norm,<,tol,out,success);         
+          }
+        }
 
         //TODO: check no unused parameters
         //TODO: check results of Iterate()
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/CMakeLists.txt b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/CMakeLists.txt
index b7b40f9fac60..7023acbef07c 100644
--- a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/CMakeLists.txt
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/CMakeLists.txt
@@ -4,6 +4,7 @@
 # YOU MUST ALSO TOUCH A CMAKE CONFIGURATION FILE WHEN YOU PUSH THE NEW
 # FILE TO FORCE THE RECONFIGURE ON OTHER PEOPLE'S BUILDS.
 
+
 FILE(GLOB xmlFiles RELATIVE ${CMAKE_CURRENT_SOURCE_DIR} *.xml)
 
 TRIBITS_COPY_FILES_TO_BINARY_DIR(ParameterList_ParameterListInterpreter_cp
diff --git a/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/Comparison1.xml b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/Comparison1.xml
new file mode 100644
index 000000000000..5432a0dbdc37
--- /dev/null
+++ b/packages/muelu/test/unit_tests/ParameterList/ParameterListInterpreter/Comparison1.xml
@@ -0,0 +1,27 @@
+<ParameterList name="MueLu">
+
+  <!--
+    For a generic symmetric scalar problem, these are the recommended settings for MueLu.
+  -->
+
+  <!-- ===========  GENERAL ================ -->
+    <Parameter        name="verbosity"                            type="string"   value="high"/>
+
+    <Parameter        name="coarse: max size"                     type="int"      value="50"/>
+
+    <Parameter        name="multigrid algorithm"                  type="string"   value="unsmoothed"/>
+
+    <Parameter        name="max levels"                	          type="int"      value="3"/>
+
+    <Parameter        name="number of equations"                  type="int"      value="1"/>
+
+    <Parameter        name="smoother: type"                       type="string"  value="RELAXATION"/>
+    <Parameter        name="coarse: type"                         type="string"  value="RELAXATION"/>
+
+    <!-- end of default values -->
+
+    <!-- ===========  REPARTITIONING  =========== -->
+    <Parameter        name="repartition: enable"                  type="bool"     value="false"/>
+    <!-- end of default values -->
+
+</ParameterList>

From 1862880aad2f164b7491809edf71b337f1bb8ec9 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 11 Aug 2022 12:48:35 -0600
Subject: [PATCH 092/130] MueLu: Fixing typo

---
 .../MueLu_GeometricInterpolationPFactory_def.hpp                | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
index 83e8031c419c..7ac0fae7247e 100644
--- a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
+++ b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
@@ -300,7 +300,7 @@ namespace MueLu {
 
       RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = Xpetra::CrsMatrixFactory<SC,LO,GO,NO>::BuildBlock(prolongatorGraph, PointMap, A->getRangeMap(),NSDim);
       RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp_dynamic_cast<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> >(P_xpetra);
-      if(P_tpetra.is_null()) throw std::runtime_error("BuildPUncoupled: Matrix factory did not return a Tpetra::BlockCrsMatrix");
+      if(P_tpetra.is_null()) throw std::runtime_error("BuildConstantP Matrix factory did not return a Tpetra::BlockCrsMatrix");
       RCP<CrsMatrixWrap> P_wrap = rcp(new CrsMatrixWrap(P_xpetra));
 
       // NOTE: Assumes block-diagonal prolongation

From 9052ea2cc166f7a3c5b32dd5d616bed94d210036 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 11 Aug 2022 12:49:36 -0600
Subject: [PATCH 093/130] MueLu: Kokkos version of structured

---
 ...metricInterpolationPFactory_kokkos_def.hpp | 95 ++++++++++++++++---
 1 file changed, 83 insertions(+), 12 deletions(-)

diff --git a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_kokkos_def.hpp b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_kokkos_def.hpp
index 5cbcdd71108f..e7c94590f77d 100644
--- a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_kokkos_def.hpp
@@ -53,6 +53,11 @@
 #include "MueLu_Monitor.hpp"
 #include "MueLu_IndexManager_kokkos.hpp"
 
+#ifdef HAVE_MUELU_TPETRA
+#include "Xpetra_TpetraCrsMatrix.hpp"
+#endif
+
+
 // Including this one last ensure that the short names of the above headers are defined properly
 #include "MueLu_GeometricInterpolationPFactory_kokkos_decl.hpp"
 
@@ -236,21 +241,87 @@ namespace MueLu {
       StridedMapFactory::Build(prolongatorGraph->getDomainMap(), strideInfo);
 
     *out << "Call prolongator constructor" << std::endl;
+    using helpers=Xpetra::Helpers<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+    if(helpers::isTpetraBlockCrs(A)) {
+#ifdef HAVE_MUELU_TPETRA
+      LO NSDim = A->GetStorageBlockSize();
+
+      // Build the exploded Map
+      // FIXME: Should look at doing this on device
+      RCP<const Map> BlockMap = prolongatorGraph->getDomainMap();
+      Teuchos::ArrayView<const GO> block_dofs = BlockMap->getLocalElementList();
+      Teuchos::Array<GO> point_dofs(block_dofs.size()*NSDim);
+      for(LO i=0, ct=0; i<block_dofs.size(); i++) {
+        for(LO j=0; j<NSDim; j++) {
+          point_dofs[ct] = block_dofs[i]*NSDim + j;
+          ct++;
+        }
+      }
+      
+      RCP<const Map> PointMap = MapFactory::Build(BlockMap->lib(),
+                                                  BlockMap->getGlobalNumElements() *NSDim,
+                                                  point_dofs(),
+                                                  BlockMap->getIndexBase(),
+                                                  BlockMap->getComm());
+      strideInfo[0]    = A->GetFixedBlockSize();
+      RCP<const StridedMap> stridedPointMap =  StridedMapFactory::Build(PointMap, strideInfo);
+
+     RCP<Xpetra::CrsMatrix<SC,LO,GO,NO> > P_xpetra = Xpetra::CrsMatrixFactory<SC,LO,GO,NO>::BuildBlock(prolongatorGraph, PointMap, A->getRangeMap(),NSDim);
+      RCP<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> > P_tpetra = rcp_dynamic_cast<Xpetra::TpetraBlockCrsMatrix<SC,LO,GO,NO> >(P_xpetra);
+      if(P_tpetra.is_null()) throw std::runtime_error("BuildConstantP: Matrix factory did not return a Tpetra::BlockCrsMatrix");
+      RCP<CrsMatrixWrap> P_wrap = rcp(new CrsMatrixWrap(P_xpetra));
+      
+      const LO stride = strideInfo[0]*strideInfo[0];
+      const LO in_stride = strideInfo[0];
+      typename CrsMatrix::local_graph_type localGraph = prolongatorGraph->getLocalGraphDevice();
+      auto rowptr  = localGraph.row_map;
+      auto indices = localGraph.entries;
+      auto values = P_tpetra->getTpetra_BlockCrsMatrix()->getValuesDeviceNonConst();
+
+      using ISC = typename Tpetra::BlockCrsMatrix<SC,LO,GO,NO>::impl_scalar_type;
+      ISC one = Teuchos::ScalarTraits<ISC>::one();
+
+      const Kokkos::TeamPolicy<execution_space> policy(prolongatorGraph->getLocalNumRows(), 1);
+      
+      Kokkos::parallel_for("MueLu:GeoInterpFact::BuildConstantP::fill", policy,
+                           KOKKOS_LAMBDA(const typename Kokkos::TeamPolicy<execution_space>::member_type &thread) {
+                           auto row = thread.league_rank();
+                           for(LO j = (LO)rowptr[row]; j<(LO) rowptr[row+1]; j++) {
+                             LO block_offset = j*stride;
+                             for(LO k=0; k<in_stride; k++)
+                               values[block_offset + k*(in_stride+1) ] = one;
+                           }
+                         });
+
+      P = P_wrap;
+      if (A->IsView("stridedMaps") == true) {
+        P->CreateView("stridedMaps", A->getRowMap("stridedMaps"), stridedPointMap);
+      }
+      else {
+        P->CreateView("stridedMaps", P->getRangeMap(),   PointMap);
+      }
 
-    // Create the prolongator matrix and its associated objects
-    RCP<ParameterList> dummyList = rcp(new ParameterList());
-    P = rcp(new CrsMatrixWrap(prolongatorGraph, dummyList));
-    RCP<CrsMatrix> PCrs = rcp_dynamic_cast<CrsMatrixWrap>(P)->getCrsMatrix();
-    PCrs->setAllToScalar(1.0);
-    PCrs->fillComplete();
+#else
+      throw std::runtime_error("GeometricInteroplationFactory::BuildConstantP(): BlockCrs requires Tpetra");
+#endif
 
-    // set StridingInformation of P
-    if (A->IsView("stridedMaps") == true) {
-      P->CreateView("stridedMaps", A->getRowMap("stridedMaps"), stridedDomainMap);
-    } else {
-      P->CreateView("stridedMaps", P->getRangeMap(), stridedDomainMap);
     }
-
+    else {
+      // Create the prolongator matrix and its associated objects
+      RCP<ParameterList> dummyList = rcp(new ParameterList());
+      P = rcp(new CrsMatrixWrap(prolongatorGraph, dummyList));
+      RCP<CrsMatrix> PCrs = rcp_dynamic_cast<CrsMatrixWrap>(P)->getCrsMatrix();
+      PCrs->setAllToScalar(1.0);
+      PCrs->fillComplete();
+      
+      // set StridingInformation of P
+      if (A->IsView("stridedMaps") == true) {
+        P->CreateView("stridedMaps", A->getRowMap("stridedMaps"), stridedDomainMap);
+      } else {
+        P->CreateView("stridedMaps", P->getRangeMap(), stridedDomainMap);
+      }
+    }
+      
   } // BuildConstantP
 
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>

From 5c7f317bd75bab77925da9f0ad6f3ae52ef7a6b6 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 15 Aug 2022 11:04:54 -0600
Subject: [PATCH 094/130] MueLu: Because CUDA hates C++ classes

---
 ...Lu_GeometricInterpolationPFactory_kokkos_decl.hpp |  2 +-
 .../MueLu_TentativePFactory_kokkos_decl.hpp          | 12 ++++++++----
 2 files changed, 9 insertions(+), 5 deletions(-)

diff --git a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_kokkos_decl.hpp b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_kokkos_decl.hpp
index 91024e11abe2..b0e5f27a90e2 100644
--- a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_kokkos_decl.hpp
+++ b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_kokkos_decl.hpp
@@ -123,8 +123,8 @@ namespace MueLu{
 
     //@}
 
-  private:
     void BuildConstantP(RCP<Matrix>& P, RCP<const CrsGraph>& prolongatorGraph, RCP<Matrix>& A) const;
+  private:
     void BuildLinearP(RCP<Matrix>& A, RCP<const CrsGraph>& prolongatorGraph,
                       RCP<realvaluedmultivector_type>& fineCoordinates,
                       RCP<realvaluedmultivector_type>& ghostCoordinates,
diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_decl.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_decl.hpp
index 0fe6fa5c5c6e..e387eb1a9677 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_decl.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_decl.hpp
@@ -153,10 +153,17 @@ namespace MueLu {
 
     //@}
 
-  private:
+
+    // NOTE: All of thess should really be private, but CUDA doesn't like that
+    
+    void BuildPuncoupledBlockCrs(Level& coarseLevel, RCP<Matrix> A, RCP<Aggregates_kokkos> aggregates, RCP<AmalgamationInfo_kokkos> amalgInfo, 
+                                 RCP<MultiVector> fineNullspace, RCP<const Map> coarseMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const;
+
 
     bool isGoodMap(const Map& rowMap, const Map& colMap) const;
 
+
+
     void BuildPcoupled  (RCP<Matrix> A, RCP<Aggregates_kokkos> aggregates,
                          RCP<AmalgamationInfo_kokkos> amalgInfo, RCP<MultiVector> fineNullspace,
                          RCP<const Map> coarseMap, RCP<Matrix>& Ptentative,
@@ -167,9 +174,6 @@ namespace MueLu {
                          RCP<const Map> coarseMap, RCP<Matrix>& Ptentative,
                          RCP<MultiVector>& coarseNullspace, const int levelID) const;
 
-    void BuildPuncoupledBlockCrs(Level& coarseLevel, RCP<Matrix> A, RCP<Aggregates_kokkos> aggregates, RCP<AmalgamationInfo_kokkos> amalgInfo, 
-                                 RCP<MultiVector> fineNullspace, RCP<const Map> coarseMap, RCP<Matrix>& Ptentative, RCP<MultiVector>& coarseNullspace, const int levelID) const;
-
     mutable bool bTransferCoordinates_ = false;
 
   };

From 1b3f8caa9c9efec8f4258ba022213327754f2649 Mon Sep 17 00:00:00 2001
From: Sylvain Bernard <srberna@sandia.gov>
Date: Wed, 20 Jul 2022 14:20:45 -0600
Subject: [PATCH 095/130] Change to C++17 standard for new CUDA 11 build

---
 packages/framework/ini-files/config-specs.ini | 61 +++++++++++++++++++
 1 file changed, 61 insertions(+)

diff --git a/packages/framework/ini-files/config-specs.ini b/packages/framework/ini-files/config-specs.ini
index 62b3195de8ca..cda4179d05dc 100644
--- a/packages/framework/ini-files/config-specs.ini
+++ b/packages/framework/ini-files/config-specs.ini
@@ -2351,6 +2351,67 @@ use USE-DEPRECATED|YES
 use PACKAGE-ENABLES|NO-PACKAGE-ENABLES
 use COMMON_SPACK_TPLS
 use SEMS_COMMON_CUDA_11
+
+# TPL ENABLE/DISABLE settings
+opt-set-cmake-var TPL_ENABLE_BLAS BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_BinUtils BOOL FORCE : OFF
+opt-set-cmake-var TPL_ENABLE_Boost BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_CGNS BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_CUDA BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_CUSPARSE BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_DLlib BOOL FORCE : OFF
+opt-set-cmake-var TPL_ENABLE_HDF5 BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_HWLOC BOOL FORCE : OFF
+opt-set-cmake-var TPL_ENABLE_LAPACK BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_METIS BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_Matio BOOL FORCE : OFF
+opt-set-cmake-var TPL_ENABLE_MPI BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_Netcdf BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_ParMETIS BOOL FORCE : OFF
+opt-set-cmake-var TPL_ENABLE_Pthread BOOL FORCE : ON
+opt-set-cmake-var TPL_ENABLE_Scotch BOOL FORCE : OFF
+opt-set-cmake-var TPL_ENABLE_SuperLU BOOL FORCE : OFF
+opt-set-cmake-var TPL_ENABLE_SuperLUDist BOOL FORCE : OFF
+opt-set-cmake-var TPL_ENABLE_Zlib BOOL FORCE : ON
+
+#TPL_*_LIBRARIES
+opt-set-cmake-var TPL_BLAS_LIBRARIES STRING FORCE : -L${BLAS_ROOT|ENV}/lib;-lopenblas;-lgfortran;-lgomp
+opt-set-cmake-var TPL_BLAS_LIBRARY_DIRS STRING FORCE : ${BLAS_ROOT|ENV}/lib
+opt-set-cmake-var TPL_BoostLib_LIBRARIES STRING FORCE : ${BOOST_LIB|ENV}/libboost_program_options.a;${BOOST_LIB|ENV}/libboost_system.a
+opt-set-cmake-var TPL_Boost_LIBRARIES STRING FORCE : ${BOOST_LIB|ENV}/libboost_program_options.a;${BOOST_LIB|ENV}/libboost_system.a
+opt-set-cmake-var TPL_DLlib_LIBRARIES FILEPATH FORCE : "-ldl"
+opt-set-cmake-var TPL_HDF5_LIBRARIES STRING FORCE : ${HDF5_LIB|ENV}/libhdf5_hl.so;${HDF5_LIB|ENV}/libhdf5.a;${ZLIB_LIB|ENV}/libz.a;-ldl
+opt-set-cmake-var TPL_LAPACK_LIBRARIES STRING FORCE : -L${BLAS_ROOT|ENV}/lib;-lopenblas;-lgfortran;-lgomp
+opt-set-cmake-var TPL_LAPACK_LIBRARY_DIRS STRING FORCE : ${BLAS_ROOT|ENV}/lib
+opt-set-cmake-var TPL_METIS_LIBRARIES STRING FORCE : ${METIS_LIB|ENV}/libmetis.so
+opt-set-cmake-var TPL_Netcdf_LIBRARIES STRING FORCE : -L${NETCDF_C_ROOT|ENV}/lib64;${NETCDF_C_ROOT|ENV}/lib/libnetcdf.a;${PARALLEL_NETCDF_ROOT|ENV}/lib/libpnetcdf.a;${TPL_HDF5_LIBRARIES|CMAKE}
+
+#TPL_[INCLUDE|LIBRARY]_DIRS
+opt-set-cmake-var Netcdf_INCLUDE_DIRS STRING FORCE : ${NETCDF_C_INC|ENV}
+opt-set-cmake-var ParMETIS_INCLUDE_DIRS STRING FORCE : ${PARMETIS_INC|ENV}
+opt-set-cmake-var ParMETIS_LIBRARY_DIRS STRING FORCE : ${PARMETIS_LIB|ENV}
+opt-set-cmake-var Scotch_INCLUDE_DIRS STRING FORCE : ${SCOTCH_INC|ENV}
+opt-set-cmake-var Scotch_LIBRARY_DIRS STRING FORCE : ${SCOTCH_LIB|ENV}
+opt-set-cmake-var SuperLU_INCLUDE_DIRS STRING FORCE : ${SUPERLU_INC|ENV}
+opt-set-cmake-var SuperLU_LIBRARY_DIRS STRING FORCE : ${SUPERLU_LIB|ENV}
+
+#CXX Settings
+opt-set-cmake-var CMAKE_CXX_STANDARD STRING FORCE : 17
+opt-set-cmake-var CMAKE_CXX_FLAGS STRING : -fPIC -Wall -Warray-bounds -Wchar-subscripts -Wcomment -Wenum-compare -Wformat -Wuninitialized -Wmaybe-uninitialized -Wmain -Wnarrowing -Wnonnull -Wparentheses -Wreorder -Wreturn-type -Wsign-compare -Wsequence-point -Wtrigraphs -Wunused-function -Wunused-but-set-variable -Wunused-variable -Wwrite-strings
+
+#Package Options
+opt-set-cmake-var EpetraExt_ENABLE_HDF5 BOOL FORCE : OFF
+opt-set-cmake-var Kokkos_ENABLE_CUDA BOOL FORCE : ON
+opt-set-cmake-var Kokkos_ENABLE_CUDA_LAMBDA BOOL FORCE : ON
+opt-set-cmake-var Kokkos_ENABLE_CXX11_DISPATCH_LAMBDA BOOL FORCE : ON
+#opt-set-cmake-var Kokkos_ENABLE_Debug_Bounds_Check BOOL FORCE : ON
+opt-set-cmake-var MPI_EXEC_POST_NUMPROCS_FLAGS STRING FORCE : "-map-by;socket:PE=4"
+opt-set-cmake-var Panzer_FADTYPE STRING FORCE : "Sacado::Fad::DFad<RealType>"
+opt-set-cmake-var Phalanx_KOKKOS_DEVICE_TYPE STRING FORCE : CUDA
+opt-set-cmake-var Sacado_ENABLE_HIERARCHICAL_DFAD BOOL FORCE : ON
+opt-set-cmake-var Tpetra_INST_SERIAL BOOL FORCE : ON
+opt-set-cmake-var Zoltan_ENABLE_Scotch BOOL FORCE : OFF
+
 use RHEL7_SEMS_CUDA_UVM_OFF_DISABLES
 use RHEL7_POST
 

From 843cc71667c1b06aa1d665278e0295f71431216c Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 15 Aug 2022 13:53:21 -0600
Subject: [PATCH 096/130] MueLu: GPU fixes

---
 .../MueLu_TentativePFactory_kokkos_def.hpp                   | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
index 001a1ba6e578..e12983cc10d1 100644
--- a/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
+++ b/packages/muelu/src/Transfers/Smoothed-Aggregation/MueLu_TentativePFactory_kokkos_def.hpp
@@ -1233,6 +1233,11 @@ namespace MueLu {
       BlockGraph->expertStaticFillComplete(coarseBlockMap,rowMap,dummy_i,dummy_e,FCparams);
     }
 
+    // We can't leave the ia/ja pointers floating around, because of host/device view counting, so
+    // we clear them here
+    ia = rows_type();
+    ja = cols_type();
+
     
     // Now let's make a BlockCrs Matrix
     // NOTE: Assumes block size== NSDim

From 36c0b7c3f2af06cbfaf76811e100364e07ef1ac4 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Mon, 15 Aug 2022 13:53:38 -0600
Subject: [PATCH 097/130] MueLu: This can probably get turned back on

---
 packages/muelu/test/unit_tests/CMakeLists.txt | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/packages/muelu/test/unit_tests/CMakeLists.txt b/packages/muelu/test/unit_tests/CMakeLists.txt
index 2379dd5020ef..24ca309cd043 100644
--- a/packages/muelu/test/unit_tests/CMakeLists.txt
+++ b/packages/muelu/test/unit_tests/CMakeLists.txt
@@ -444,8 +444,9 @@ ENDIF()
 
 
 ADD_SUBDIRECTORY(ParameterList/FactoryFactory/)
+ADD_SUBDIRECTORY(ParameterList/ParameterListInterpreter/)
+
 IF (${PACKAGE_NAME}_ENABLE_Epetra)
   ADD_SUBDIRECTORY(ParameterList/MLParameterListInterpreter/)
-  ADD_SUBDIRECTORY(ParameterList/ParameterListInterpreter/)
   ADD_SUBDIRECTORY(ParameterList/CreateSublists/)
 ENDIF()

From 3c68b4bd0bc52071c10bb1856bdacef5c50f8330 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 16 Aug 2022 09:31:07 -0600
Subject: [PATCH 098/130] MueLu: Fixing typing error

---
 .../MueLu_GeometricInterpolationPFactory_def.hpp              | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
index 7ac0fae7247e..ef90a62e6814 100644
--- a/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
+++ b/packages/muelu/src/Transfers/GeneralGeometric/MueLu_GeometricInterpolationPFactory_def.hpp
@@ -275,8 +275,8 @@ namespace MueLu {
     using helpers=Xpetra::Helpers<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
     if(helpers::isTpetraBlockCrs(A)) {
 #ifdef HAVE_MUELU_TPETRA
-      LO one  = Teuchos::ScalarTraits<SC>::one();
-      LO zero = Teuchos::ScalarTraits<SC>::zero();
+      SC one  = Teuchos::ScalarTraits<SC>::one();
+      SC zero = Teuchos::ScalarTraits<SC>::zero();
       LO NSDim = A->GetStorageBlockSize();
 
       // Build the exploded Map

From 9b2d48b90f32bcdffd8c993c70e0496aeadbb9b5 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Tue, 16 Aug 2022 14:07:14 -0600
Subject: [PATCH 099/130] Tpetra: reverting to scratch space

---
 .../core/src/Tpetra_BlockCrsMatrix_def.hpp    | 20 +++++++++++--------
 1 file changed, 12 insertions(+), 8 deletions(-)

diff --git a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
index 8c43bdf6f878..273009a19b0f 100644
--- a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
+++ b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
@@ -2772,19 +2772,23 @@ class GetLocalDiagCopy {
     errorDuringUnpack () = 0;
     {
       using policy_type = Kokkos::TeamPolicy<host_exec>;
-      const auto policy = policy_type (numImportLIDs, 1, 1);
+      const auto policy = policy_type (numImportLIDs, 1, 1)
+        .set_scratch_size (0, Kokkos::PerTeam (sizeof (GO) * maxRowNumEnt +
+                                               sizeof (LO) * maxRowNumEnt +
+                                               numBytesPerValue * maxRowNumScalarEnt));
+      using host_scratch_space = typename host_exec::scratch_memory_space;
+
       using pair_type = Kokkos::pair<size_t, size_t>;
       Kokkos::parallel_for
         ("Tpetra::BlockCrsMatrix::unpackAndCombine: unpack", policy,
          [=] (const typename policy_type::member_type& member) {
           const size_t i = member.league_rank();
-
-          Kokkos::View<GO*, host_exec> gblColInds
-            ("", maxRowNumEnt);
-          Kokkos::View<LO*, host_exec> lclColInds
-            ("", maxRowNumEnt);
-          Kokkos::View<impl_scalar_type*, host_exec> vals
-            ("", maxRowNumScalarEnt);
+          Kokkos::View<GO*, host_scratch_space> gblColInds
+            (member.team_scratch (0), maxRowNumEnt);
+          Kokkos::View<LO*, host_scratch_space> lclColInds
+            (member.team_scratch (0), maxRowNumEnt);
+          Kokkos::View<impl_scalar_type*, host_scratch_space> vals
+            (member.team_scratch (0), maxRowNumScalarEnt);
 
           const size_t offval = offset(i);
           const LO lclRow = importLIDsHost(i);

From 4c7801fe25491e1a25a5f10bc097939d8058fd28 Mon Sep 17 00:00:00 2001
From: "Vinh Quang Dang (-EXP)" <vqdang@kokkos-dev-2.sandia.gov>
Date: Tue, 16 Aug 2022 14:47:21 -0600
Subject: [PATCH 100/130] Fix hanging issue in exchange_pivots

---
 packages/adelus/src/Adelus_perm_mat.hpp | 21 +++++++++++++++------
 1 file changed, 15 insertions(+), 6 deletions(-)

diff --git a/packages/adelus/src/Adelus_perm_mat.hpp b/packages/adelus/src/Adelus_perm_mat.hpp
index 917bfc38ad34..1380f7bfff29 100644
--- a/packages/adelus/src/Adelus_perm_mat.hpp
+++ b/packages/adelus/src/Adelus_perm_mat.hpp
@@ -81,13 +81,22 @@ namespace Adelus {
         pivot_col = k%nprocs_row;
         k_row = k%nprocs_col;
         rank_row = k_row*nprocs_row;
-        if (me == pivot_col) {
-          int j=k/nprocs_row;
-          MPI_Send(lpiv_view.data()+j,1,MPI_INT,rank_row,0,comm);
+        if (rank_row == pivot_col) {//on the same rank
+          if (me == rank_row) {//I am the right process to do
+            int j=k/nprocs_row;
+            int i=k/nprocs_col;
+            permute(i) = lpiv_view(j); 
+          }
         }
-        if (me == rank_row) {
-          int i=k/nprocs_col;
-          MPI_Recv(permute.data()+i,1,MPI_INT,pivot_col,0,comm,&msgstatus);
+        else {//on different ranks
+          if (me == pivot_col) {
+            int j=k/nprocs_row;
+            MPI_Send(lpiv_view.data()+j,1,MPI_INT,rank_row,0,comm);
+          }
+          if (me == rank_row) {
+            int i=k/nprocs_col;
+            MPI_Recv(permute.data()+i,1,MPI_INT,pivot_col,0,comm,&msgstatus);
+          }
         }
       }
     }

From f9fbf239bbb8859b5e6a5cb78b348aa327534beb Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 17 Aug 2022 10:03:21 -0600
Subject: [PATCH 101/130] Tpetra: Adding a hack to the scratch pad

---
 .../tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp   | 13 ++++++++-----
 1 file changed, 8 insertions(+), 5 deletions(-)

diff --git a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
index 273009a19b0f..0505f6182492 100644
--- a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
+++ b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
@@ -2772,23 +2772,26 @@ class GetLocalDiagCopy {
     errorDuringUnpack () = 0;
     {
       using policy_type = Kokkos::TeamPolicy<host_exec>;
-      const auto policy = policy_type (numImportLIDs, 1, 1)
-        .set_scratch_size (0, Kokkos::PerTeam (sizeof (GO) * maxRowNumEnt +
-                                               sizeof (LO) * maxRowNumEnt +
-                                               numBytesPerValue * maxRowNumScalarEnt));
-      using host_scratch_space = typename host_exec::scratch_memory_space;
+      size_t scratch_per_row = sizeof(GO) * maxRowNumEnt + sizeof (LO) * maxRowNumEnt + numBytesPerValue * maxRowNumScalarEnt
+        + 2 * sizeof(GO) // Yeah, this is a fudge factor
 
+      const auto policy = policy_type (numImportLIDs, 1, 1)     
+        .set_scratch_size (0, Kokkos::PerTeam (scratch_size_per_row);
+      using host_scratch_space = typename host_exec::scratch_memory_space;
+      
       using pair_type = Kokkos::pair<size_t, size_t>;
       Kokkos::parallel_for
         ("Tpetra::BlockCrsMatrix::unpackAndCombine: unpack", policy,
          [=] (const typename policy_type::member_type& member) {
           const size_t i = member.league_rank();
+          //          char * view_start_char = scratch_pad.data() + i*scratch_per_row;
           Kokkos::View<GO*, host_scratch_space> gblColInds
             (member.team_scratch (0), maxRowNumEnt);
           Kokkos::View<LO*, host_scratch_space> lclColInds
             (member.team_scratch (0), maxRowNumEnt);
           Kokkos::View<impl_scalar_type*, host_scratch_space> vals
             (member.team_scratch (0), maxRowNumScalarEnt);
+          
 
           const size_t offval = offset(i);
           const LO lclRow = importLIDsHost(i);

From df6ab8006913710dd7fa041deb761a758fa7b871 Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 17 Aug 2022 10:03:31 -0600
Subject: [PATCH 102/130] Tpetra: Adding a hack to the scratch pad

---
 packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp | 1 -
 1 file changed, 1 deletion(-)

diff --git a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
index 0505f6182492..724f5f858aad 100644
--- a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
+++ b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
@@ -2784,7 +2784,6 @@ class GetLocalDiagCopy {
         ("Tpetra::BlockCrsMatrix::unpackAndCombine: unpack", policy,
          [=] (const typename policy_type::member_type& member) {
           const size_t i = member.league_rank();
-          //          char * view_start_char = scratch_pad.data() + i*scratch_per_row;
           Kokkos::View<GO*, host_scratch_space> gblColInds
             (member.team_scratch (0), maxRowNumEnt);
           Kokkos::View<LO*, host_scratch_space> lclColInds

From ca9b57d7ae944c2036beadb97ce1caf48c454a4c Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Wed, 17 Aug 2022 15:59:59 -0600
Subject: [PATCH 103/130] MueLu: Removing most of the warnings

---
 .../muelu/src/Utils/MueLu_Utilities_def.hpp   | 26 +++++++++----------
 1 file changed, 13 insertions(+), 13 deletions(-)

diff --git a/packages/muelu/src/Utils/MueLu_Utilities_def.hpp b/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
index 8e72e627ca01..49a674aaa91e 100644
--- a/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
+++ b/packages/muelu/src/Utils/MueLu_Utilities_def.hpp
@@ -303,9 +303,9 @@ namespace MueLu {
 
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
   RCP<const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(RCP<const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > Op)  {
-    using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+    using XCrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
     // Get the underlying Tpetra Mtx
-    RCP<const CrsMatrixWrap> crsOp = rcp_dynamic_cast<const CrsMatrixWrap>(Op);
+    RCP<const XCrsMatrixWrap> crsOp = rcp_dynamic_cast<const XCrsMatrixWrap>(Op);
     if (crsOp == Teuchos::null)
       throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
     const RCP<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > &tmp_ECrsMtx = rcp_dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >(crsOp->getCrsMatrix());
@@ -316,8 +316,8 @@ namespace MueLu {
 
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
   RCP<      Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >   Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2NonConstTpetraBlockCrs(RCP<Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > Op){
-    using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
-    RCP<const CrsMatrixWrap> crsOp = rcp_dynamic_cast<const CrsMatrixWrap>(Op);
+    using XCrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+    RCP<const XCrsMatrixWrap> crsOp = rcp_dynamic_cast<const XCrsMatrixWrap>(Op);
     if (crsOp == Teuchos::null)
       throw Exceptions::BadCast("Cast from Xpetra::Matrix to Xpetra::CrsMatrixWrap failed");
     const RCP<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> > &tmp_ECrsMtx = rcp_dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node> >(crsOp->getCrsMatrix());
@@ -329,8 +329,8 @@ namespace MueLu {
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
   const Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(const Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op)   {
     try {
-      using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
-      const CrsMatrixWrap& crsOp = dynamic_cast<const CrsMatrixWrap&>(Op);
+      using XCrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+      const XCrsMatrixWrap& crsOp = dynamic_cast<const XCrsMatrixWrap&>(Op);
       try {
         const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& tmp_ECrsMtx = dynamic_cast<const Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&>(*crsOp.getCrsMatrix());
         return *tmp_ECrsMtx.getTpetra_BlockCrsMatrix();
@@ -345,8 +345,8 @@ namespace MueLu {
   template <class Scalar, class LocalOrdinal, class GlobalOrdinal, class Node>
   Tpetra::BlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&        Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2NonConstTpetraBlockCrs(Xpetra::Matrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& Op) {
     try {
-      using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
-      CrsMatrixWrap& crsOp = dynamic_cast<CrsMatrixWrap&>(Op);
+      using XCrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar,LocalOrdinal,GlobalOrdinal,Node>;
+      XCrsMatrixWrap& crsOp = dynamic_cast<XCrsMatrixWrap&>(Op);
       try {
         Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>& tmp_ECrsMtx = dynamic_cast<Xpetra::TpetraBlockCrsMatrix<Scalar,LocalOrdinal,GlobalOrdinal,Node>&>(*crsOp.getCrsMatrix());
         return *tmp_ECrsMtx.getTpetra_BlockCrsMatrixNonConst();
@@ -587,9 +587,9 @@ namespace MueLu {
         return AAAA;
       }
       else if(Helpers::isTpetraBlockCrs(Op)) {
-        using Matrix = Xpetra::Matrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
-        using CrsMatrix = Xpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
-        using CrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+        using XMatrix = Xpetra::Matrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+        using XCrsMatrix = Xpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
+        using XCrsMatrixWrap = Xpetra::CrsMatrixWrap<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
         using BCRS = Tpetra::BlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
         using CRS  = Tpetra::CrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>;
         const BCRS & tpetraOp = Utilities<Scalar, LocalOrdinal, GlobalOrdinal, Node>::Op2TpetraBlockCrs(Op);
@@ -613,8 +613,8 @@ namespace MueLu {
           At = Tpetra::convertToBlockCrsMatrix(*Atcrs,Op.GetStorageBlockSize());
         }
         RCP<Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node> > AA   = rcp(new Xpetra::TpetraBlockCrsMatrix<Scalar, LocalOrdinal, GlobalOrdinal, Node>(At));
-        RCP<CrsMatrix>                                                           AAA  = rcp_implicit_cast<CrsMatrix>(AA);
-        RCP<Matrix>                                                              AAAA = rcp( new CrsMatrixWrap(AAA));
+        RCP<XCrsMatrix>                                                           AAA  = rcp_implicit_cast<XCrsMatrix>(AA);
+        RCP<XMatrix>                                                              AAAA = rcp( new XCrsMatrixWrap(AAA));
         
         if (Op.IsView("stridedMaps"))
           AAAA->CreateView("stridedMaps", Teuchos::rcpFromRef(Op), true/*doTranspose*/);

From 8b5f161ab15b09e462dee7f446f61da65d65bd94 Mon Sep 17 00:00:00 2001
From: iyamazaki <iyamaza@sandia.gov>
Date: Wed, 17 Aug 2022 16:47:34 -0600
Subject: [PATCH 104/130] Amesos2 : fix IR

---
 packages/amesos2/src/Amesos2_Control.cpp      |  2 +-
 .../amesos2/src/Amesos2_SolverCore_def.hpp    | 32 +++++++++++--------
 2 files changed, 20 insertions(+), 14 deletions(-)

diff --git a/packages/amesos2/src/Amesos2_Control.cpp b/packages/amesos2/src/Amesos2_Control.cpp
index b164de92f010..c3e8931fe4ff 100644
--- a/packages/amesos2/src/Amesos2_Control.cpp
+++ b/packages/amesos2/src/Amesos2_Control.cpp
@@ -97,7 +97,7 @@ void Control::setControlParameters(
   if( parameterList->isType<bool>("Iterative refinement") ){
     useIterRefine_ = parameterList->get<bool>("Iterative refinement");
   }
-  if( parameterList->isType<bool>("Number of iterative refinements") ){
+  if( parameterList->isType<int>("Number of iterative refinements") ){
     maxNumIterRefines_ = parameterList->get<int>("Number of iterative refinements");
   }
   if( parameterList->isType<bool>("Verboes for iterative refinement") ){
diff --git a/packages/amesos2/src/Amesos2_SolverCore_def.hpp b/packages/amesos2/src/Amesos2_SolverCore_def.hpp
index ff8b195ffb33..bb31a4d57605 100644
--- a/packages/amesos2/src/Amesos2_SolverCore_def.hpp
+++ b/packages/amesos2/src/Amesos2_SolverCore_def.hpp
@@ -309,6 +309,11 @@ SolverCore<ConcreteSolver,Matrix,Vector>::solve_ir(const Teuchos::Ptr<      Vect
     crsmat = host_crsmat_t("CrsMatrix", nrows, values_view, static_graph);
   }
 
+  //
+  // ** First Solve **
+  static_cast<const solver_type*>(this)->solve_impl(Teuchos::outArg(*X), Teuchos::ptrInArg(*B));
+
+
   // auxiliary scalar Kokkos views
   const int ldx = (this->root_ ? X->getGlobalLength() : 0);
   const int ldb = (this->root_ ? B->getGlobalLength() : 0);
@@ -336,10 +341,6 @@ SolverCore<ConcreteSolver,Matrix,Vector>::solve_ir(const Teuchos::Ptr<      Vect
     do_get(not_initialize_data, Eptr, E_view, lde, CONTIGUOUS_AND_ROOTED, rowIndexBase);
 
 
-  //
-  // first solve
-  static_cast<const solver_type*>(this)->solve_impl(Teuchos::outArg(*X), Teuchos::ptrInArg(*B));
-
   host_magni_view x0norms("x0norms", nrhs);
   host_magni_view bnorms("bnorms", nrhs);
   host_magni_view enorms("enorms", nrhs);
@@ -372,7 +373,7 @@ SolverCore<ConcreteSolver,Matrix,Vector>::solve_ir(const Teuchos::Ptr<      Vect
 
 
   //
-  // iterative refinement
+  // ** Iterative Refinement **
   int numIters = 0;
   int converged = 0; // 0 = has not converged, 1 = converged
   for (numIters = 0; numIters < maxNumIters && converged == 0; ++numIters) {
@@ -409,14 +410,19 @@ SolverCore<ConcreteSolver,Matrix,Vector>::solve_ir(const Teuchos::Ptr<      Vect
     if (this->root_) {
       KokkosBlas::axpy(one, E_view, X_view);
 
-      // compute norm of corrections for "convergence" check
-      converged = 1;
-      for (size_t j = 0; j < nrhs; j++) { 
-        auto e_subview = Kokkos::subview(E_view, Kokkos::ALL(), j);
-        host_vector_t e_1d (const_cast<scalar_type*>(e_subview.data()), e_subview.extent(0));
-        enorms(j) = KokkosBlas::nrm2(e_1d);
-        if (enorms(j) > eps * x0norms(j)) {
-          converged = 0;
+      if (numIters < maxNumIters-1) {
+        // compute norm of corrections for "convergence" check
+        converged = 1;
+        for (size_t j = 0; j < nrhs; j++) { 
+          auto e_subview = Kokkos::subview(E_view, Kokkos::ALL(), j);
+          host_vector_t e_1d (const_cast<scalar_type*>(e_subview.data()), e_subview.extent(0));
+          enorms(j) = KokkosBlas::nrm2(e_1d);
+          if (enorms(j) > eps * x0norms(j)) {
+            converged = 0;
+          }
+        }
+        if (verbose && converged) {
+          std::cout << " converged " << std::endl;
         }
       }
     }

From 0206ef8bdf074d733ebee74cfccfcb45377d8f6c Mon Sep 17 00:00:00 2001
From: iyamazaki <iyamaza@sandia.gov>
Date: Wed, 17 Aug 2022 16:48:31 -0600
Subject: [PATCH 105/130] ShyLU-Basker : apply AMD on D block

---
 .../shylu_node/basker/src/shylubasker_def.hpp | 25 +++++++++++--------
 1 file changed, 14 insertions(+), 11 deletions(-)

diff --git a/packages/shylu/shylu_node/basker/src/shylubasker_def.hpp b/packages/shylu/shylu_node/basker/src/shylubasker_def.hpp
index 10cd77c64f45..402a722c38fd 100644
--- a/packages/shylu/shylu_node/basker/src/shylubasker_def.hpp
+++ b/packages/shylu/shylu_node/basker/src/shylubasker_def.hpp
@@ -925,10 +925,11 @@ namespace BaskerNS
           }
         }
 
-        #ifdef AMD_ON_D
+        #define SHYLU_BASKER_AMD_ON_D
+        #ifdef SHYLU_BASKER_AMD_ON_D
         // --------------------------------------------
         // reset the small D blocks
-        if (btf_top_tabs_offset > 0) {
+        if (btf_top_tabs_offset  > 0) {
           Int d_last = btf_top_tabs_offset;
           Int ncol = btf_tabs(d_last);
 
@@ -942,13 +943,15 @@ namespace BaskerNS
             permute_row(BTF_E, order_blk_amd_d);
           }
 
-          // revert BLK_MWM ordering
-          auto order_blk_mwm_d = Kokkos::subview(order_blk_mwm_inv, 
-                                                 range_type (0, ncol));
-          permute_row(BTF_D, order_blk_mwm_d);
-          if (BTF_E.ncol > 0) {
-            // Apply MWM perm to cols
-            permute_row(BTF_E, order_blk_mwm_d);
+          if (Options.blk_matching != 0) {
+            // revert BLK_MWM ordering
+            auto order_blk_mwm_d = Kokkos::subview(order_blk_mwm_inv, 
+                                                   range_type (0, ncol));
+            permute_row(BTF_D, order_blk_mwm_d);
+            if (BTF_E.ncol > 0) {
+              // Apply MWM perm to cols
+              permute_row(BTF_E, order_blk_mwm_d);
+            }
           }
         }
         #endif
@@ -1100,7 +1103,7 @@ namespace BaskerNS
         numeric_col_iperm_array(i) = i;
       }
 
-      #ifdef AMD_ON_D
+      #ifdef SHYLU_BASKER_AMD_ON_D
       if (btf_top_tabs_offset > 0) {
         Kokkos::Timer mwm_amd_perm_timer;
         Int d_last = btf_top_tabs_offset;
@@ -1116,7 +1119,7 @@ namespace BaskerNS
         }
 
         // ----------------------------------------------------------------------------------------------
-        // recompute MWM and AMD on each block of C
+        // recompute MWM and AMD on each block of D
         INT_1DARRAY blk_nnz;
         INT_1DARRAY blk_work;
         btf_blk_mwm_amd(0, d_last, BTF_D,

From 00ca3870b23ddea877be9f1abbaf1e3bfee833ad Mon Sep 17 00:00:00 2001
From: "Roscoe A. Bartlett" <rabartl@sandia.gov>
Date: Wed, 17 Aug 2022 20:11:55 -0600
Subject: [PATCH 106/130] Improve TrilinosInstallTests to make more clear
 (#10896)

Based on the confusion by a Trilinos developer that creatd issue #10896, I
have improved these installation tests in the following way:

* Made it clear that the doInstall test will fail if there are **any** build
  errors in the project

* Print out the install errors to make it clear why the install failed

* Use CTest test fixtures to skip the find_package(Trilinos) and
  simpleBuildAgainstTrilinos tests if the doInstall test fails
---
 packages/TrilinosInstallTests/CMakeLists.txt | 27 +++++++++++++++++---
 1 file changed, 24 insertions(+), 3 deletions(-)

diff --git a/packages/TrilinosInstallTests/CMakeLists.txt b/packages/TrilinosInstallTests/CMakeLists.txt
index 595a7866ecb5..41e32007d1dd 100644
--- a/packages/TrilinosInstallTests/CMakeLists.txt
+++ b/packages/TrilinosInstallTests/CMakeLists.txt
@@ -66,13 +66,18 @@ tribits_add_advanced_test(doInstall
       -P "${CMAKE_CURRENT_SOURCE_DIR}/remove_dir_if_exists.cmake"
 
   TEST_1
-    MESSAGE "Install whatever Trilinos packages have been enabled"
+    MESSAGE "Install enabled and built Trilinos packages (NOTE: This test will fail if the project has **any** build errors!)"
     CMND "${CMAKE_COMMAND}"
     ARGS --install ${PROJECT_BINARY_DIR}
       --prefix ${PROJECT_BINARY_DIR}/install
     OUTPUT_FILE  doInstall.out
     NO_ECHO_OUTPUT
 
+  TEST_2
+    MESSAGE "Grep doInstall.out file produced above to see any errors"
+    CMND grep ARGS -A 50 "CMake Error" doInstall.out
+    PASS_ANY
+
   ADDED_TEST_NAME_OUT  doInstall_name
   )
   # NOTE: Above works even if Trilinos was configured without setting
@@ -81,6 +86,11 @@ tribits_add_advanced_test(doInstall
   # the source dir and the build dir will still be sticking around in the
   # below example build.
 
+if (doInstall_name)
+  set_tests_properties(${doInstall_name}
+    PROPERTIES  FIXTURES_SETUP  doInstall_passed)
+endif()
+
 
 tribits_add_advanced_test(find_package_Trilinos
   OVERALL_NUM_MPI_PROCS 1
@@ -104,8 +114,10 @@ tribits_add_advanced_test(find_package_Trilinos
 
 if (find_package_Trilinos_name)
   set_tests_properties(${find_package_Trilinos_name}
-    PROPERTIES DEPENDS ${doInstall_name} )
+    PROPERTIES  FIXTURES_REQUIRED  doInstall_passed)
 endif()
+# NOTE: Above, only attempt to run the find_package() test if the install
+# command passed or it is guaranteed to fail.
 
 
 tribits_add_advanced_test(simpleBuildAgainstTrilinos
@@ -144,8 +156,17 @@ tribits_add_advanced_test(simpleBuildAgainstTrilinos
 
 if (simpleBuildAgainstTrilinos_name)
   set_tests_properties(${simpleBuildAgainstTrilinos_name}
-    PROPERTIES DEPENDS ${doInstall_name} )
+    PROPERTIES  FIXTURES_REQUIRED  doInstall_passed)
 endif()
+# NOTE: Above, only attempt to build and test the simpleBuildAgainstTrilinos
+# project if the install command passed or it is guaranteed to fail.  Also
+# note that we could have blocked this based on the find_package() test but
+# that runs find_package(Trilinos) for all of Trilinos while the
+# simpleBuildAgainstTrilinos/CMakeLists.txt file only calls
+# find_package(Trilinos COMPONENTS Tpetra) so it could pass when the full
+# find_package(Trilinos) call fails.  Therefore, it makes sense to run the
+# this test for simpleBuildAgainstTrilinos even if the test for the full
+# find_package(Trilinos) command fails.
 
 
 tribits_package_postprocess()

From be3d51629736d1726a93c58d13c06f867fbeed63 Mon Sep 17 00:00:00 2001
From: rstumin <rstumin@sandia.gov>
Date: Thu, 18 Aug 2022 15:05:54 -0600
Subject: [PATCH 107/130] Add averaging option to Schwarz DD schemes

---
 .../src/Ifpack2_AdditiveSchwarz_decl.hpp      |   7 +
 .../src/Ifpack2_AdditiveSchwarz_def.hpp       |  32 ++-
 packages/muelu/test/scaling/CMakeLists.txt    |  10 +-
 .../test/scaling/blkSmooEquivOlapSchwarz.xml  |  50 +++++
 .../test/scaling/oLapSchwarzEquivBlkSmoo.xml  |  42 ++++
 .../muelu/test/scaling/regularOverLap.dat     | 188 ++++++++++++++++++
 6 files changed, 327 insertions(+), 2 deletions(-)
 create mode 100644 packages/muelu/test/scaling/blkSmooEquivOlapSchwarz.xml
 create mode 100644 packages/muelu/test/scaling/oLapSchwarzEquivBlkSmoo.xml
 create mode 100644 packages/muelu/test/scaling/regularOverLap.dat

diff --git a/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_decl.hpp b/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_decl.hpp
index 8c0a135e5451..310469f44008 100644
--- a/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_decl.hpp
+++ b/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_decl.hpp
@@ -809,7 +809,12 @@ class AdditiveSchwarz :
   mutable Teuchos::RCP<const Teuchos::ParameterList> validParams_;
 
   //! Combine mode for off-process elements (only if overlap is used)
+  //! To average values in overlap region, set CombineMode_
+  //! to ADD and AvgOverlap_ to true (can be done via
+  //! param list by setting "schwarz: combine mode" to "AVG")
+  //! Don't average with CG as preconditioner is nonsymmetric.
   Tpetra::CombineMode CombineMode_ = Tpetra::ZERO;
+  bool AvgOverlap_ = false;
   //! If \c true, reorder the local matrix.
   bool UseReordering_ = false;
   //! Record reordering for output purposes.
@@ -851,6 +856,8 @@ class AdditiveSchwarz :
   mutable std::unique_ptr<MV> overlapping_B_;
   //! Cached local (possibly) overlapping output (multi)vector.
   mutable std::unique_ptr<MV> overlapping_Y_;
+  //! Cached local (possibly) vector that indicates how many copies of a dof exist due to overlap
+  mutable std::unique_ptr<MV> num_overlap_copies_;
   //! Cached residual (multi)vector.
   mutable std::unique_ptr<MV> R_;
   //! Cached intermediate result (multi)vector.
diff --git a/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp b/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp
index c7d00563a275..5531e4352cc2 100644
--- a/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp
+++ b/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp
@@ -425,6 +425,19 @@ apply (const Tpetra::MultiVector<scalar_type,local_ordinal_type,global_ordinal_t
     if (C_.get () == nullptr || C_->getNumVectors () != numVectors) {
       C_.reset (new MV (Y.getMap (), numVectors, false));
     }
+    // If taking averages in overlap region, we need to compute
+    // the number of procs who have a copy of each overlap dof
+    Teuchos::ArrayRCP<double>  dataNumOverlapCopies;
+    if (IsOverlapping_ && AvgOverlap_) {
+      if (num_overlap_copies_.get()  == nullptr) {
+        num_overlap_copies_.reset (new MV (Y.getMap (), 1, false));
+        RCP<MV> onesVec( new MV(OverlappingMatrix_->getRowMap(), 1, false) );
+        onesVec->putScalar(Teuchos::ScalarTraits<scalar_type>::one());
+        rcp_dynamic_cast<OverlappingRowMatrix<row_matrix_type>> (OverlappingMatrix_)->exportMultiVector (*onesVec, *(num_overlap_copies_.get ()), CombineMode_);
+      }
+      dataNumOverlapCopies = num_overlap_copies_.get ()->getDataNonConst(0);
+    }
+
     MV* R = R_.get ();
     MV* C = C_.get ();
 
@@ -550,6 +563,14 @@ apply (const Tpetra::MultiVector<scalar_type,local_ordinal_type,global_ordinal_t
            << "OverlappingMatrix_ is null when it shouldn't be.  "
            "Please report this bug to the Ifpack2 developers.");
         OverlappingMatrix_->exportMultiVector (*OverlappingY, *C, CombineMode_);
+
+        // average solution in overlap regions if requested via "schwarz: combine mode" "AVG"
+        if (AvgOverlap_) {
+          Teuchos::ArrayRCP<double>  dataC = C->getDataNonConst(0);
+          for (int i = 0; i < (int) C->getMap()->getLocalNumElements(); i++) {
+            dataC[i] = dataC[i]/dataNumOverlapCopies[i];
+          }
+        }
       }
       else {
         // mfh 16 Apr 2014: Make a view of Y with the same Map as
@@ -785,7 +806,15 @@ setParameterList (const Teuchos::RCP<Teuchos::ParameterList>& plist)
       using vs2e_type = StringToIntegralParameterEntryValidator<CombineMode>;
       RCP<const vs2e_type> vs2e = rcp_dynamic_cast<const vs2e_type> (v, true);
 
-      const ParameterEntry& inputEntry = plist->getEntry (cmParamName);
+      ParameterEntry& inputEntry = plist->getEntry (cmParamName);
+      // As AVG is only a Schwarz option and does not exist in Tpetra's
+      // version of CombineMode, we use a separate boolean local to
+      // Schwarz in conjunction with CombineMode_ == ADD to handle
+      // averaging. Here, we change input entry to ADD and set the boolean.
+      if (strncmp(Teuchos::getValue<std::string>(inputEntry).c_str(),"AVG",3) == 0) {
+        inputEntry.template setValue<std::string>("ADD");
+        AvgOverlap_ = true;
+      }
       CombineMode_ = vs2e->getIntegralValue (inputEntry, cmParamName);
     }
   }
@@ -802,6 +831,7 @@ setParameterList (const Teuchos::RCP<Teuchos::ParameterList>& plist)
               if (plist->sublist("subdomain solver parameters").get<std::string>("partitioner: type") == "user") { 
                  if (CombineMode_ == Tpetra::ADD)  plist->sublist("subdomain solver parameters").set("partitioner: combine mode","ADD");
                  if (CombineMode_ == Tpetra::ZERO) plist->sublist("subdomain solver parameters").set("partitioner: combine mode","ZERO");
+                 AvgOverlap_ = false;     // averaging already taken care of by  the partitioner: nonsymmetric overlap combine option
               }
             }
           }   
diff --git a/packages/muelu/test/scaling/CMakeLists.txt b/packages/muelu/test/scaling/CMakeLists.txt
index 67b36efd4e5f..546969f6af01 100644
--- a/packages/muelu/test/scaling/CMakeLists.txt
+++ b/packages/muelu/test/scaling/CMakeLists.txt
@@ -63,7 +63,7 @@ IF (${PACKAGE_NAME}_HAVE_TPETRA_SOLVER_STACK OR ${PACKAGE_NAME}_HAVE_EPETRA_SOLV
   )
 
   TRIBITS_COPY_FILES_TO_BINARY_DIR(Driver_cp
-    SOURCE_FILES scaling.xml scaling.yaml scaling-complex.xml scaling-withglobalconstants.xml scaling-complex-withglobalconstants.xml circ_nsp_dependency.xml isorropia.xml iso_poisson.xml conchas_milestone_zoltan.xml conchas_milestone_zoltan2.xml conchas_milestone_zoltan2_complex.xml sa_with_ilu.xml sa_with_Ifpack2_line_detection.xml rap.xml smoother.xml smoother_complex.xml tripleMatrixProduct.xml scaling-ml.xml elasticity3D.xml amgx.json amgx.xml scaling-with-rerun.xml scaling_distance2_agg.xml smooVec.mm smooVecCoalesce.xml pairwise.xml sa_enforce_constraints.xml recurMG.xml anisotropic.xml  comp_rotations.xml generalBlkSmoothing.xml GblkMap.dat GblkAmat.dat GblkRhs.dat Gblks.dat
+    SOURCE_FILES scaling.xml scaling.yaml scaling-complex.xml scaling-withglobalconstants.xml scaling-complex-withglobalconstants.xml circ_nsp_dependency.xml isorropia.xml iso_poisson.xml conchas_milestone_zoltan.xml conchas_milestone_zoltan2.xml conchas_milestone_zoltan2_complex.xml sa_with_ilu.xml sa_with_Ifpack2_line_detection.xml rap.xml smoother.xml smoother_complex.xml tripleMatrixProduct.xml scaling-ml.xml elasticity3D.xml amgx.json amgx.xml scaling-with-rerun.xml scaling_distance2_agg.xml smooVec.mm smooVecCoalesce.xml pairwise.xml sa_enforce_constraints.xml recurMG.xml anisotropic.xml  comp_rotations.xml generalBlkSmoothing.xml GblkMap.dat GblkAmat.dat GblkRhs.dat Gblks.dat blkSmooEquivOlapSchwarz.xml oLapSchwarzEquivBlkSmoo.xml regularOverLap.dat
     CATEGORIES BASIC PERFORMANCE
    )
 
@@ -289,6 +289,14 @@ IF (${PACKAGE_NAME}_HAVE_TPETRA_SOLVER_STACK)
     COMM mpi # HAVE_MPI required
   )
 
+  TRIBITS_ADD_TEST(
+    Driver
+    NAME "SchwarzSmoothingWithAverages"
+    ARGS "--linAlgebra=Tpetra --xml=oLapSchwarzEquivBlkSmoo.xml --belosType=\"Fixed\ Point\" --rowmap=GblkMap.dat --matrix=GblkAmat.dat --rhs=GblkRhs.dat --tol=.1"
+    NUM_MPI_PROCS 4
+    COMM mpi # HAVE_MPI required
+  )
+
 ENDIF()
 
 IF (${PACKAGE_NAME}_HAVE_TPETRA_SOLVER_STACK)
diff --git a/packages/muelu/test/scaling/blkSmooEquivOlapSchwarz.xml b/packages/muelu/test/scaling/blkSmooEquivOlapSchwarz.xml
new file mode 100644
index 000000000000..c9a3911fbc9d
--- /dev/null
+++ b/packages/muelu/test/scaling/blkSmooEquivOlapSchwarz.xml
@@ -0,0 +1,50 @@
+<!-- Running
+         mpirun -np 4 MueLu_Driver.exe __linAlgebra=Tpetra __xml=blkSmooEquivOlapSchwarz.xml __belosType=\"Fixed\ Point\" __rowmap=GblkMap.dat __matrix=GblkAmat.dat __rhs=GblkRhs.dat __tol=.1 __userBlks=regularOverLap.dat
+ and     mpirun -np 4 MueLu_Driver.exe __linAlgebra=Tpetra __xml=oLapSchwarzEquivBlkSmoo.xml __belosType=\"Fixed\ Point\" __rowmap=GblkMap.dat __matrix=GblkAmat.dat __rhs=GblkRhs.dat __tol=.1
+
+    should give identical convergence histories as both do overlapping block Jacobi with the same blocks. Here, __ should be replaced by double-hyphen (double-hyphen not allowed in xml comments).
+-->
+<ParameterList name="MueLu">
+  <Parameter        name="verbosity"                            type="string"   value="high"/>
+
+  <Parameter        name="number of equations"                  type="int"      value="1"/>
+
+  <Parameter        name="max levels"                           type="int"      value="1"/>
+  <Parameter        name="coarse: max size"                     type="int"      value="1"/>
+
+  <Parameter        name="multigrid algorithm"                  type="string"   value="sa"/>
+
+  <!-- ===========  AGGREGATION  =========== -->
+  <Parameter        name="aggregation: type"                    type="string"   value="uncoupled"/>
+  <Parameter        name="aggregation: drop scheme"             type="string"   value="distance laplacian"/>
+
+  <!-- ===========  SMOOTHING  =========== -->
+  <Parameter name="coarse: type" type="string" value="SCHWARZ"/>
+  <ParameterList    name="coarse: params">
+    <Parameter name="schwarz: overlap level"            type="int"    value="1"/>
+    <Parameter name="schwarz: combine mode"             type="string" value="ADD"/>
+    <Parameter name="schwarz: use reordering"           type="bool"   value="false"/>
+    <ParameterList name="schwarz: reordering list">
+      <Parameter name="order_method"                    type="string"  value="rcm"/>
+    </ParameterList>
+
+    <Parameter name="subdomain solver name"             type="string" value="BLOCK_RELAXATION"/>
+    <ParameterList name="subdomain solver parameters">
+      <Parameter name= "relaxation: type"                type="string" value="Jacobi"/>
+      <Parameter name= "relaxation: sweeps"                type="int" value="1"/>
+      <Parameter name= "relaxation: zero starting solution"                type="bool" value="false"/>
+      <Parameter name= "partitioner: type"                type="string" value="user"/>
+      <Parameter name= "partitioner: nonsymmetric overlap combine"  type="bool" value="true"/>
+      <Parameter name= "relaxation: damping factor"                type="double" value="1.0"/>
+    </ParameterList>
+  </ParameterList>
+
+  <!-- ===========  REPARTITIONING  =========== -->
+  <Parameter        name="repartition: enable"                  type="bool"     value="true"/>
+  <Parameter        name="repartition: partitioner"             type="string"   value="zoltan"/>
+  <Parameter        name="repartition: start level"             type="int"      value="2"/>
+  <Parameter        name="repartition: min rows per proc"       type="int"      value="800"/>
+  <Parameter        name="repartition: max imbalance"           type="double"   value="1.1"/>
+  <Parameter        name="repartition: remap parts"             type="bool"     value="false"/>
+
+</ParameterList>
diff --git a/packages/muelu/test/scaling/oLapSchwarzEquivBlkSmoo.xml b/packages/muelu/test/scaling/oLapSchwarzEquivBlkSmoo.xml
new file mode 100644
index 000000000000..caa33197936f
--- /dev/null
+++ b/packages/muelu/test/scaling/oLapSchwarzEquivBlkSmoo.xml
@@ -0,0 +1,42 @@
+<!-- Running
+         mpirun -np 4 MueLu_Driver.exe __linAlgebra=Tpetra __xml=blkSmooEquivOlapSchwarz.xml __belosType=\"Fixed\ Point\" __rowmap=GblkMap.dat __matrix=GblkAmat.dat __rhs=GblkRhs.dat __tol=.1 __userBlks=regularOverLap.dat
+ and     mpirun -np 4 MueLu_Driver.exe __linAlgebra=Tpetra __xml=oLapSchwarzEquivBlkSmoo.xml __belosType=\"Fixed\ Point\" __rowmap=GblkMap.dat __matrix=GblkAmat.dat __rhs=GblkRhs.dat __tol=.1
+
+    should give identical convergence histories as both do overlapping block Jacobi with the same blocks. Here, __ should be replaced by double-hyphen (double-hyphen not allowed in xml comments).
+-->
+<ParameterList name="MueLu">
+  <Parameter        name="verbosity"                            type="string"   value="high"/>
+
+  <Parameter        name="number of equations"                  type="int"      value="1"/>
+
+  <Parameter        name="max levels"                           type="int"      value="1"/>
+  <Parameter        name="coarse: max size"                     type="int"      value="1"/>
+
+  <Parameter        name="multigrid algorithm"                  type="string"   value="sa"/>
+
+  <!-- ===========  AGGREGATION  =========== -->
+  <Parameter        name="aggregation: type"                    type="string"   value="uncoupled"/>
+  <Parameter        name="aggregation: drop scheme"             type="string"   value="distance laplacian"/>
+
+  <!-- ===========  SMOOTHING  =========== -->
+  <Parameter name="coarse: type" type="string" value="SCHWARZ"/>
+  <ParameterList    name="coarse: params">
+    <Parameter name="subdomain solver name"             type="string" value="AMESOS2"/>
+    <Parameter name="schwarz: overlap level"            type="int"    value="1"/>
+    <Parameter name="schwarz: combine mode"             type="string" value="AVG"/>
+    <Parameter name="schwarz: use reordering"           type="bool"   value="false"/>
+    <ParameterList name="schwarz: reordering list">
+      <Parameter name="order_method"                    type="string"  value="rcm"/>
+    </ParameterList>
+
+  </ParameterList>
+
+  <!-- ===========  REPARTITIONING  =========== -->
+  <Parameter        name="repartition: enable"                  type="bool"     value="true"/>
+  <Parameter        name="repartition: partitioner"             type="string"   value="zoltan"/>
+  <Parameter        name="repartition: start level"             type="int"      value="2"/>
+  <Parameter        name="repartition: min rows per proc"       type="int"      value="800"/>
+  <Parameter        name="repartition: max imbalance"           type="double"   value="1.1"/>
+  <Parameter        name="repartition: remap parts"             type="bool"     value="false"/>
+
+</ParameterList>
diff --git a/packages/muelu/test/scaling/regularOverLap.dat b/packages/muelu/test/scaling/regularOverLap.dat
new file mode 100644
index 000000000000..20768d39b94f
--- /dev/null
+++ b/packages/muelu/test/scaling/regularOverLap.dat
@@ -0,0 +1,188 @@
+%%MatrixMarket matrix coordinate real general
+4 137 186
+1 1 1.0
+1 5 1.0
+1 6 1.0
+1 7 1.0
+1 8 1.0
+1 9 1.0
+1 10 1.0
+1 25 1.0
+1 26 1.0
+1 27 1.0
+1 28 1.0
+1 29 1.0
+1 30 1.0
+1 46 1.0
+1 47 1.0
+1 51 1.0
+1 52 1.0
+1 56 1.0
+1 58 1.0
+1 59 1.0
+1 63 1.0
+1 64 1.0
+1 69 1.0
+1 71 1.0
+1 72 1.0
+1 81 1.0
+1 88 1.0
+1 89 1.0
+1 92 1.0
+1 98 1.0
+1 99 1.0
+1 103 1.0
+1 104 1.0
+1 105 1.0
+1 107 1.0
+1 109 1.0
+1 113 1.0
+1 114 1.0
+1 115 1.0
+1 118 1.0
+1 119 1.0
+1 123 1.0
+1 125 1.0
+1 126 1.0
+1 130 1.0
+1 132 1.0
+2 2 1.0
+2 9 1.0
+2 10 1.0
+2 11 1.0
+2 12 1.0
+2 13 1.0
+2 14 1.0
+2 35 1.0
+2 36 1.0
+2 37 1.0
+2 38 1.0
+2 39 1.0
+2 40 1.0
+2 41 1.0
+2 48 1.0
+2 49 1.0
+2 52 1.0
+2 54 1.0
+2 55 1.0
+2 56 1.0
+2 57 1.0
+2 62 1.0
+2 63 1.0
+2 65 1.0
+2 68 1.0
+2 76 1.0
+2 77 1.0
+2 79 1.0
+2 80 1.0
+2 81 1.0
+2 86 1.0
+2 93 1.0
+2 96 1.0
+2 99 1.0
+2 102 1.0
+2 104 1.0
+2 105 1.0
+2 106 1.0
+2 108 1.0
+2 118 1.0
+2 127 1.0
+2 128 1.0
+2 131 1.0
+2 132 1.0
+2 134 1.0
+2 137 1.0
+3 4 1.0
+3 15 1.0
+3 16 1.0
+3 17 1.0
+3 18 1.0
+3 19 1.0
+3 20 1.0
+3 29 1.0
+3 30 1.0
+3 31 1.0
+3 32 1.0
+3 33 1.0
+3 34 1.0
+3 47 1.0
+3 49 1.0
+3 50 1.0
+3 51 1.0
+3 53 1.0
+3 58 1.0
+3 63 1.0
+3 64 1.0
+3 66 1.0
+3 70 1.0
+3 74 1.0
+3 77 1.0
+3 79 1.0
+3 82 1.0
+3 83 1.0
+3 87 1.0
+3 88 1.0
+3 90 1.0
+3 91 1.0
+3 94 1.0
+3 95 1.0
+3 97 1.0
+3 104 1.0
+3 107 1.0
+3 110 1.0
+3 111 1.0
+3 112 1.0
+3 114 1.0
+3 117 1.0
+3 121 1.0
+3 122 1.0
+3 125 1.0
+3 126 1.0
+3 130 1.0
+3 132 1.0
+3 135 1.0
+4 3 1.0
+4 19 1.0
+4 20 1.0
+4 21 1.0
+4 22 1.0
+4 23 1.0
+4 24 1.0
+4 39 1.0
+4 40 1.0
+4 41 1.0
+4 42 1.0
+4 43 1.0
+4 44 1.0
+4 45 1.0
+4 49 1.0
+4 53 1.0
+4 60 1.0
+4 61 1.0
+4 62 1.0
+4 67 1.0
+4 73 1.0
+4 75 1.0
+4 76 1.0
+4 77 1.0
+4 78 1.0
+4 79 1.0
+4 84 1.0
+4 85 1.0
+4 97 1.0
+4 100 1.0
+4 101 1.0
+4 102 1.0
+4 108 1.0
+4 110 1.0
+4 111 1.0
+4 116 1.0
+4 117 1.0
+4 120 1.0
+4 124 1.0
+4 127 1.0
+4 129 1.0
+4 131 1.0
+4 133 1.0
+4 136 1.0
+4 137 1.0

From 4ef7bd25fa50663aef959b81ac0f361a84ea163b Mon Sep 17 00:00:00 2001
From: rstumin <rstumin@sandia.gov>
Date: Thu, 18 Aug 2022 15:26:47 -0600
Subject: [PATCH 108/130] added the wrong test previously. Fixed it to actually
 test the new code.

---
 packages/muelu/test/scaling/CMakeLists.txt | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/muelu/test/scaling/CMakeLists.txt b/packages/muelu/test/scaling/CMakeLists.txt
index 546969f6af01..e1bc0da041a9 100644
--- a/packages/muelu/test/scaling/CMakeLists.txt
+++ b/packages/muelu/test/scaling/CMakeLists.txt
@@ -292,7 +292,7 @@ IF (${PACKAGE_NAME}_HAVE_TPETRA_SOLVER_STACK)
   TRIBITS_ADD_TEST(
     Driver
     NAME "SchwarzSmoothingWithAverages"
-    ARGS "--linAlgebra=Tpetra --xml=oLapSchwarzEquivBlkSmoo.xml --belosType=\"Fixed\ Point\" --rowmap=GblkMap.dat --matrix=GblkAmat.dat --rhs=GblkRhs.dat --tol=.1"
+    ARGS "--linAlgebra=Tpetra --xml=blkSmooEquivOlapSchwarz.xml --belosType=\"Fixed\ Point\" --rowmap=GblkMap.dat --matrix=GblkAmat.dat --rhs=GblkRhs.dat --tol=.1 --userBlks=regularOverLap.dat"
     NUM_MPI_PROCS 4
     COMM mpi # HAVE_MPI required
   )

From e7134fa8fb1fe70722cf9f140b3cadb2ba7354fa Mon Sep 17 00:00:00 2001
From: rstumin <rstumin@sandia.gov>
Date: Thu, 18 Aug 2022 15:31:21 -0600
Subject: [PATCH 109/130] Actually, I had the right test before so I am putting
 it back. Now we actually have both tests: the one that uses averages and
 block relaxation and the one that uses schwarz and averages

---
 packages/muelu/test/scaling/CMakeLists.txt | 10 +++++++++-
 1 file changed, 9 insertions(+), 1 deletion(-)

diff --git a/packages/muelu/test/scaling/CMakeLists.txt b/packages/muelu/test/scaling/CMakeLists.txt
index e1bc0da041a9..e6f49b53bfab 100644
--- a/packages/muelu/test/scaling/CMakeLists.txt
+++ b/packages/muelu/test/scaling/CMakeLists.txt
@@ -291,12 +291,20 @@ IF (${PACKAGE_NAME}_HAVE_TPETRA_SOLVER_STACK)
 
   TRIBITS_ADD_TEST(
     Driver
-    NAME "SchwarzSmoothingWithAverages"
+    NAME "BlockSmoothingWithAverages"
     ARGS "--linAlgebra=Tpetra --xml=blkSmooEquivOlapSchwarz.xml --belosType=\"Fixed\ Point\" --rowmap=GblkMap.dat --matrix=GblkAmat.dat --rhs=GblkRhs.dat --tol=.1 --userBlks=regularOverLap.dat"
     NUM_MPI_PROCS 4
     COMM mpi # HAVE_MPI required
   )
 
+  TRIBITS_ADD_TEST(
+    Driver
+    NAME "SchwarzSmoothingWithAverages"
+    ARGS "--linAlgebra=Tpetra --xml=oLapSchwarzEquivBlkSmoo.xml --belosType=\"Fixed\ Point\" --rowmap=GblkMap.dat --matrix=GblkAmat.dat --rhs=GblkRhs.dat --tol=.1"
+    NUM_MPI_PROCS 4
+    COMM mpi # HAVE_MPI required
+  )
+
 ENDIF()
 
 IF (${PACKAGE_NAME}_HAVE_TPETRA_SOLVER_STACK)

From 75ae4a64bcc9ffffac215792854b50b03b900f64 Mon Sep 17 00:00:00 2001
From: Christian Glusa <caglusa@sandia.gov>
Date: Fri, 19 Aug 2022 08:59:13 -0600
Subject: [PATCH 110/130] Testing on Geminga: Do not disable Kokkos in Epetra
 build

Kokkos is a required MueLu dependency.
---
 .../ctest_linux_nightly_serial_debug_muelu_epetra_geminga.cmake  | 1 -
 1 file changed, 1 deletion(-)

diff --git a/cmake/ctest/drivers/geminga/ctest_linux_nightly_serial_debug_muelu_epetra_geminga.cmake b/cmake/ctest/drivers/geminga/ctest_linux_nightly_serial_debug_muelu_epetra_geminga.cmake
index 145721094165..c7d80e890e5d 100644
--- a/cmake/ctest/drivers/geminga/ctest_linux_nightly_serial_debug_muelu_epetra_geminga.cmake
+++ b/cmake/ctest/drivers/geminga/ctest_linux_nightly_serial_debug_muelu_epetra_geminga.cmake
@@ -76,7 +76,6 @@ SET(Trilinos_PACKAGES MueLu Xpetra)
 
 SET(EXTRA_CONFIGURE_OPTIONS
   "-DTrilinos_ENABLE_DEPENDENCY_UNIT_TESTS=OFF"
-  "-DTrilinos_ENABLE_Kokkos=OFF"
   "-DTrilinos_ENABLE_Tpetra=OFF"
   "-DTrilinos_ENABLE_ML=OFF"
   "-DTPL_ENABLE_SuperLU=ON"

From 5cb77ed936eaf0d7d43f2c2c617c28558d13c1d8 Mon Sep 17 00:00:00 2001
From: Graham Harper <grahambenharper@gmail.com>
Date: Wed, 17 Aug 2022 18:00:14 -0600
Subject: [PATCH 111/130] MueLu: Add Aggregates_kokkos.ComputeNodesInAggregate

---
 .../Graph/Containers/MueLu_Aggregates_def.hpp |  8 +--
 .../MueLu_Aggregates_kokkos_decl.hpp          |  7 +++
 .../MueLu_Aggregates_kokkos_def.hpp           | 52 +++++++++++++++++++
 .../unit_tests_kokkos/Aggregates_kokkos.cpp   | 14 +++++
 4 files changed, 77 insertions(+), 4 deletions(-)

diff --git a/packages/muelu/src/Graph/Containers/MueLu_Aggregates_def.hpp b/packages/muelu/src/Graph/Containers/MueLu_Aggregates_def.hpp
index 4ad46301f9df..7e5daf357256 100644
--- a/packages/muelu/src/Graph/Containers/MueLu_Aggregates_def.hpp
+++ b/packages/muelu/src/Graph/Containers/MueLu_Aggregates_def.hpp
@@ -191,12 +191,12 @@ namespace MueLu {
     for(LO i=0; i<numNodes; i++) {
       LO aggregate = vertex2AggId[i];
       if(aggregate !=INVALID) {
-	aggNodes[aggCurr[aggregate]] = i;
-	aggCurr[aggregate]++;
+        aggNodes[aggCurr[aggregate]] = i;
+        aggCurr[aggregate]++;
       }
       else {
-	unaggregated[currNumUnaggregated] = i;
-	currNumUnaggregated++;
+        unaggregated[currNumUnaggregated] = i;
+        currNumUnaggregated++;
       }
     }
     unaggregated.resize(currNumUnaggregated);
diff --git a/packages/muelu/src/Graph/Containers/MueLu_Aggregates_kokkos_decl.hpp b/packages/muelu/src/Graph/Containers/MueLu_Aggregates_kokkos_decl.hpp
index d1c5424b35ef..15cc165dfa0b 100644
--- a/packages/muelu/src/Graph/Containers/MueLu_Aggregates_kokkos_decl.hpp
+++ b/packages/muelu/src/Graph/Containers/MueLu_Aggregates_kokkos_decl.hpp
@@ -116,6 +116,7 @@ namespace MueLu {
     using node_type           = Kokkos::Compat::KokkosDeviceWrapperNode<DeviceType>;
     using device_type         = DeviceType;
     using range_type          = Kokkos::RangePolicy<local_ordinal_type, execution_space>;
+    using LO_view             = Kokkos::View<local_ordinal_type*, device_type>;
 
     using aggregates_sizes_type = Kokkos::View<LocalOrdinal*, device_type>;
 
@@ -259,6 +260,12 @@ namespace MueLu {
 
     local_graph_type GetGraph() const;
 
+    /*! @brief Generates a compressed list of nodes in each aggregate, where
+      the entries in aggNodes[aggPtr[i]] up to aggNodes[aggPtr[i+1]-1] contain the nodes in aggregate i.
+      unaggregated contains the list of nodes which are, for whatever reason, not aggregated (e.g. Dirichlet)
+     */
+    void ComputeNodesInAggregate(LO_view & aggPtr, LO_view & aggNodes, LO_view & unaggregated) const;
+
     //! @name Overridden from Teuchos::Describable
     //@{
 
diff --git a/packages/muelu/src/Graph/Containers/MueLu_Aggregates_kokkos_def.hpp b/packages/muelu/src/Graph/Containers/MueLu_Aggregates_kokkos_def.hpp
index 80827cb480e8..f8cba41cfaee 100644
--- a/packages/muelu/src/Graph/Containers/MueLu_Aggregates_kokkos_def.hpp
+++ b/packages/muelu/src/Graph/Containers/MueLu_Aggregates_kokkos_def.hpp
@@ -180,6 +180,58 @@ namespace MueLu {
 
     return graph_;
   }
+  
+  template <class LocalOrdinal, class GlobalOrdinal, class DeviceType>
+  void 
+  Aggregates_kokkos<LocalOrdinal, GlobalOrdinal, Kokkos::Compat::KokkosDeviceWrapperNode<DeviceType> >::ComputeNodesInAggregate(LO_view & aggPtr, LO_view & aggNodes, LO_view & unaggregated) const {
+    LO numAggs  = GetNumAggregates();
+    LO numNodes = vertex2AggId_->getLocalLength();
+    auto vertex2AggId = vertex2AggId_->getDeviceLocalView(Xpetra::Access::ReadOnly);
+    typename aggregates_sizes_type::const_type aggSizes = ComputeAggregateSizes(true);
+    LO INVALID = Teuchos::OrdinalTraits<LO>::invalid();
+
+    aggPtr = LO_view("aggPtr",numAggs+1);
+    aggNodes = LO_view("aggNodes",numNodes);
+    LO_view aggCurr("agg curr",numAggs+1);
+
+    // Construct the "rowptr" and the counter
+    Kokkos::parallel_scan("MueLu:Aggregates:ComputeNodesInAggregate:scan", range_type(0,numAggs+1),
+      KOKKOS_LAMBDA(const LO aggIdx, LO& aggOffset, bool final_pass) {
+        LO count = 0;
+        if(aggIdx < numAggs)
+          count = aggSizes(aggIdx);
+        if(final_pass) {
+          aggPtr(aggIdx) = aggOffset;
+          aggCurr(aggIdx) = aggOffset;
+          if(aggIdx==numAggs)
+            aggCurr(numAggs) = 0; // use this for counting unaggregated nodes
+        }
+        aggOffset += count;
+      });
+
+    // Preallocate unaggregated to the correct size
+    LO numUnaggregated = 0;
+    Kokkos::parallel_reduce("MueLu:Aggregates:ComputeNodesInAggregate:unaggregatedSize", range_type(0,numNodes),
+      KOKKOS_LAMBDA(const LO nodeIdx, LO & count) { 
+        if(vertex2AggId(nodeIdx,0)==INVALID) 
+          count++;
+      }, numUnaggregated);
+    unaggregated = LO_view("unaggregated",numUnaggregated);
+
+    // Stick the nodes in each aggregate's spot
+    Kokkos::parallel_for("MueLu:Aggregates:ComputeNodesInAggregate:for", range_type(0,numNodes),
+      KOKKOS_LAMBDA(const LO nodeIdx) {
+        LO aggIdx = vertex2AggId(nodeIdx,0);
+        if(aggIdx != INVALID) {
+          // atomic postincrement aggCurr(aggIdx) each time
+          aggNodes(Kokkos::atomic_fetch_add(&aggCurr(aggIdx),1)) = nodeIdx;
+        } else {
+          // same, but using last entry of aggCurr for unaggregated nodes
+          unaggregated(Kokkos::atomic_fetch_add(&aggCurr(numAggs),1)) = nodeIdx;
+        }
+      });
+    
+  }
 
   template <class LocalOrdinal, class GlobalOrdinal, class DeviceType>
   std::string Aggregates_kokkos<LocalOrdinal, GlobalOrdinal, Kokkos::Compat::KokkosDeviceWrapperNode<DeviceType> >::description() const {
diff --git a/packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp b/packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp
index 2d8deec90d7a..c6888f4ea020 100644
--- a/packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp
+++ b/packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp
@@ -611,6 +611,20 @@ namespace MueLuTests {
                             }, numBadAggregates);
     TEST_EQUALITY(numBadAggregates, 0);
 
+    // Check ComputeNodesInAggregate
+    typename Aggregates_kokkos::LO_view aggPtr, aggNodes, unaggregated;
+    aggregates->ComputeNodesInAggregate(aggPtr, aggNodes, unaggregated);
+    TEST_EQUALITY(aggPtr.extent(0), numAggs+1);
+    // TEST_EQUALITY(unaggregated.extent(0), 0); // 1 unaggregated node in the MPI_4 case
+    
+    // test aggPtr(i)+aggSizes(i)=aggPtr(i+1)
+    typename Aggregates_kokkos::LO_view::HostMirror aggPtr_h = Kokkos::create_mirror_view(aggPtr);
+    typename Aggregates_kokkos::aggregates_sizes_type::HostMirror aggSizes_h = Kokkos::create_mirror_view(aggSizes);
+    Kokkos::deep_copy(aggPtr_h, aggPtr);
+    Kokkos::deep_copy(aggSizes_h, aggSizes);
+    for(LO i=0; i<aggSizes_h.extent(0); ++i)
+      TEST_EQUALITY(aggPtr_h(i)+aggSizes_h(i), aggPtr_h(i+1));
+
   } //UncoupledPhase3
 
   TEUCHOS_UNIT_TEST_TEMPLATE_4_DECL(Aggregates_kokkos, AllowDroppingToCreateAdditionalDirichletRows, Scalar, LocalOrdinal, GlobalOrdinal, Node)

From 6b804ef1bef4d485c2f2089e72b7fbe30368c69d Mon Sep 17 00:00:00 2001
From: iyamazaki <ic.yamazaki@gmail.com>
Date: Fri, 19 Aug 2022 16:31:47 -0600
Subject: [PATCH 112/130] Amesos2 : trying to fix MKL header including issues

---
 .../src/Amesos2_PardisoMKL_TypeMap.hpp        | 22 ++++++++-----------
 1 file changed, 9 insertions(+), 13 deletions(-)

diff --git a/packages/amesos2/src/Amesos2_PardisoMKL_TypeMap.hpp b/packages/amesos2/src/Amesos2_PardisoMKL_TypeMap.hpp
index bb023bfb996a..7ea99656f9dc 100644
--- a/packages/amesos2/src/Amesos2_PardisoMKL_TypeMap.hpp
+++ b/packages/amesos2/src/Amesos2_PardisoMKL_TypeMap.hpp
@@ -60,27 +60,27 @@
 #include <complex>
 #endif
 
+#include <mkl_types.h>
+#include <mkl_dss.h>
+
 #include <Teuchos_as.hpp>
 #ifdef HAVE_TEUCHOS_COMPLEX
 #include <Teuchos_SerializationTraits.hpp>
 #endif
 
 #include "Amesos2_TypeMap.hpp"
-#ifdef _MKL_TYPES_H_
-  #undef _MKL_TYPES_H_
-  #define PARDISOMKL_PREVIOUS_MKL_TYPES_H
-#endif
 
 namespace Amesos2{
   namespace PMKL {
-    //Update JDB 6.25.15
-    //MKL has changed _INTEGER_t to deprecated
-    //MKL has changed _INTEGER_t to define from typedef 
+    #undef _MKL_TYPES_H_
     #include <mkl_types.h>
-  #ifdef __MKL_DSS_H
+
     #undef __MKL_DSS_H
-  #endif
     #include <mkl_dss.h>
+
+    //Update JDB 6.25.15
+    //MKL has changed _INTEGER_t to deprecated
+    //MKL has changed _INTEGER_t to define from typedef 
     #undef _INTEGER_t
     typedef MKL_INT _INTEGER_t;
   } // end namespace PMKL
@@ -286,8 +286,4 @@ namespace Amesos2 {
 
 } // end namespace Amesos
 
-#ifndef PARDISOMKL_PREVIOUS_MKL_TYPES_H
-  // first time including mkl_types.h
-  #undef _MKL_TYPES_H_
-#endif
 #endif  // AMESOS2_PARDISOMKL_TYPEMAP_HPP

From 498f79080d353cac8610d887d8f61fc499b1fba3 Mon Sep 17 00:00:00 2001
From: Graham Harper <grahambenharper@gmail.com>
Date: Fri, 19 Aug 2022 17:51:29 -0600
Subject: [PATCH 113/130] MueLu: Fix signed vs unsigned comparison in
 Aggregates_kokkos.cpp

---
 packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp b/packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp
index c6888f4ea020..a9bb67efc595 100644
--- a/packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp
+++ b/packages/muelu/test/unit_tests_kokkos/Aggregates_kokkos.cpp
@@ -614,15 +614,15 @@ namespace MueLuTests {
     // Check ComputeNodesInAggregate
     typename Aggregates_kokkos::LO_view aggPtr, aggNodes, unaggregated;
     aggregates->ComputeNodesInAggregate(aggPtr, aggNodes, unaggregated);
-    TEST_EQUALITY(aggPtr.extent(0), numAggs+1);
-    // TEST_EQUALITY(unaggregated.extent(0), 0); // 1 unaggregated node in the MPI_4 case
+    TEST_EQUALITY(aggPtr.extent_int(0), numAggs+1);
+    // TEST_EQUALITY(unaggregated.extent_int(0), 0); // 1 unaggregated node in the MPI_4 case
     
     // test aggPtr(i)+aggSizes(i)=aggPtr(i+1)
     typename Aggregates_kokkos::LO_view::HostMirror aggPtr_h = Kokkos::create_mirror_view(aggPtr);
     typename Aggregates_kokkos::aggregates_sizes_type::HostMirror aggSizes_h = Kokkos::create_mirror_view(aggSizes);
     Kokkos::deep_copy(aggPtr_h, aggPtr);
     Kokkos::deep_copy(aggSizes_h, aggSizes);
-    for(LO i=0; i<aggSizes_h.extent(0); ++i)
+    for(LO i=0; i<aggSizes_h.extent_int(0); ++i)
       TEST_EQUALITY(aggPtr_h(i)+aggSizes_h(i), aggPtr_h(i+1));
 
   } //UncoupledPhase3

From b3eb83985a3e03f3c282519cd40bbc0041142085 Mon Sep 17 00:00:00 2001
From: rstumin <rstumin@sandia.gov>
Date: Sun, 21 Aug 2022 15:48:33 -0600
Subject: [PATCH 114/130] changed a double to a scalar_type to compile for
 complex arith

---
 packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp b/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp
index 5531e4352cc2..4c1987d2ba3d 100644
--- a/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp
+++ b/packages/ifpack2/src/Ifpack2_AdditiveSchwarz_def.hpp
@@ -427,7 +427,7 @@ apply (const Tpetra::MultiVector<scalar_type,local_ordinal_type,global_ordinal_t
     }
     // If taking averages in overlap region, we need to compute
     // the number of procs who have a copy of each overlap dof
-    Teuchos::ArrayRCP<double>  dataNumOverlapCopies;
+    Teuchos::ArrayRCP<scalar_type>  dataNumOverlapCopies;
     if (IsOverlapping_ && AvgOverlap_) {
       if (num_overlap_copies_.get()  == nullptr) {
         num_overlap_copies_.reset (new MV (Y.getMap (), 1, false));
@@ -566,7 +566,7 @@ apply (const Tpetra::MultiVector<scalar_type,local_ordinal_type,global_ordinal_t
 
         // average solution in overlap regions if requested via "schwarz: combine mode" "AVG"
         if (AvgOverlap_) {
-          Teuchos::ArrayRCP<double>  dataC = C->getDataNonConst(0);
+          Teuchos::ArrayRCP<scalar_type>  dataC = C->getDataNonConst(0);
           for (int i = 0; i < (int) C->getMap()->getLocalNumElements(); i++) {
             dataC[i] = dataC[i]/dataNumOverlapCopies[i];
           }

From 2c21f07de1588f24290008ed36a813e191b17951 Mon Sep 17 00:00:00 2001
From: Roger Pawlowski <rppawlo@sandia.gov>
Date: Mon, 22 Aug 2022 08:24:10 -0600
Subject: [PATCH 115/130] Phalanx: remove cuda compiler warnings and add test
 for new use case for vov

---
 .../phalanx/src/Phalanx_KokkosViewOfViews.hpp |   9 +-
 packages/phalanx/test/Kokkos/CMakeLists.txt   |   7 ++
 .../test/Kokkos/tKokkosClassOnDevice.cpp      | 108 ++++++++++++++++++
 3 files changed, 122 insertions(+), 2 deletions(-)
 create mode 100644 packages/phalanx/test/Kokkos/tKokkosClassOnDevice.cpp

diff --git a/packages/phalanx/src/Phalanx_KokkosViewOfViews.hpp b/packages/phalanx/src/Phalanx_KokkosViewOfViews.hpp
index c4f2c52d27bd..c8d9206599ed 100644
--- a/packages/phalanx/src/Phalanx_KokkosViewOfViews.hpp
+++ b/packages/phalanx/src/Phalanx_KokkosViewOfViews.hpp
@@ -323,12 +323,17 @@ namespace PHX {
         check_use_count_(true)
     {}
 
+    // Making this a kokkos function eliminates cuda compiler warnings
+    // in objects that contain ViewOfViews3 that are copied to device.
+    KOKKOS_INLINE_FUNCTION
     ~ViewOfViews3()
     {
       // Make sure there is not another object pointing to device view
       // since the host view will delete the inner views on exit.
-      if ( check_use_count_ && (view_device_.impl_track().use_count() != use_count_) )
-        Kokkos::abort("\n ERROR - PHX::ViewOfViews - please free all instances of device ViewOfView \n before deleting the host ViewOfView!\n\n");
+      KOKKOS_IF_ON_HOST((
+        if ( check_use_count_ && (view_device_.impl_track().use_count() != use_count_) )
+          Kokkos::abort("\n ERROR - PHX::ViewOfViews - please free all instances of device ViewOfView \n before deleting the host ViewOfView!\n\n");
+      ))
     }
 
     /// Enable safety check in dtor for external references.
diff --git a/packages/phalanx/test/Kokkos/CMakeLists.txt b/packages/phalanx/test/Kokkos/CMakeLists.txt
index 998ca7181de5..ddf102ec3d20 100644
--- a/packages/phalanx/test/Kokkos/CMakeLists.txt
+++ b/packages/phalanx/test/Kokkos/CMakeLists.txt
@@ -41,3 +41,10 @@ TRIBITS_ADD_EXECUTABLE_AND_TEST(
   TESTONLYLIBS phalanx_unit_test_main phalanx_test_utilities
   NUM_MPI_PROCS 1
   )
+
+TRIBITS_ADD_EXECUTABLE_AND_TEST(
+  tKokkosClassOnDevice
+  SOURCES tKokkosClassOnDevice.cpp
+  TESTONLYLIBS phalanx_unit_test_main phalanx_test_utilities
+  NUM_MPI_PROCS 1
+  )
diff --git a/packages/phalanx/test/Kokkos/tKokkosClassOnDevice.cpp b/packages/phalanx/test/Kokkos/tKokkosClassOnDevice.cpp
new file mode 100644
index 000000000000..80cd182e2aa3
--- /dev/null
+++ b/packages/phalanx/test/Kokkos/tKokkosClassOnDevice.cpp
@@ -0,0 +1,108 @@
+#include "Kokkos_Core.hpp"
+#include "Kokkos_View.hpp"
+
+#include "Teuchos_Assert.hpp"
+#include "Teuchos_UnitTestHarness.hpp"
+#include "Phalanx_KokkosViewOfViews.hpp"
+
+template<typename T,int dim>
+class Vector {
+  T values_[dim];
+public:
+
+  template<typename INDEX_I>
+  KOKKOS_INLINE_FUNCTION
+  T& operator[](const INDEX_I& index){return values_[index];}
+
+  template<typename INDEX_I>
+  KOKKOS_INLINE_FUNCTION
+  const T& operator[](const INDEX_I& index)const{return values_[index];}
+
+  template<typename INDEX_I>
+  KOKKOS_INLINE_FUNCTION
+  volatile T& operator[](const INDEX_I& index)volatile{return values_[index];}
+
+  template<typename INDEX_I>
+  KOKKOS_INLINE_FUNCTION
+  const volatile T& operator[](const INDEX_I& index)const volatile{return values_[index];}
+};
+
+class MyClass {
+  Kokkos::View<double*> a_;
+  double b_[3];
+  Kokkos::View<double*> c_;
+  Vector<double,3> d_;
+  // To test for cuda warnings when MyClass is lambda captured to
+  // device
+  PHX::ViewOfViews3<1,Kokkos::View<double*>> e_;
+
+public:
+  MyClass() :
+    a_("a",3),
+    c_("c",3)
+  {
+    Kokkos::deep_copy(a_,1.0);
+    b_[0] = 1.0;
+    b_[1] = 2.0;
+    b_[2] = 3.0;
+    Kokkos::deep_copy(c_,2.0);
+    d_[0] = 1.0;
+    d_[1] = 2.0;
+    d_[2] = 3.0;
+  }
+
+  void KOKKOS_FUNCTION checkInternalMethod1() const
+  { this->callInternalMethod1(); }
+
+  void KOKKOS_FUNCTION
+  callInternalMethod1() const
+  {
+    printf("b_[0]=%f\n",b_[0]);
+    printf("b_[1]=%f\n",b_[1]);
+    printf("b_[2]=%f\n",b_[2]);
+    a_(0)=b_[0];
+    a_(1)=b_[1];
+    a_(2)=b_[2];
+  }
+
+  void KOKKOS_FUNCTION checkInternalMethod2() const
+  { this->callInternalMethod2(); }
+
+  void KOKKOS_FUNCTION
+  callInternalMethod2() const
+  {
+    a_(0)=c_(0);
+    a_(1)=c_(1);
+    a_(2)=c_(2);
+  }
+
+  void KOKKOS_FUNCTION checkInternalMethod3() const
+  { this->callInternalMethod3(); }
+
+  void KOKKOS_FUNCTION
+  callInternalMethod3() const
+  {
+    a_(0)=d_[0];
+    a_(1)=d_[1];
+    a_(2)=d_[2];
+  }
+};
+
+TEUCHOS_UNIT_TEST(KokkosClassOnDevice, One)
+{
+  MyClass my_class;
+
+  Kokkos::parallel_for("test 1",1,KOKKOS_LAMBDA (const int ) {
+      my_class.checkInternalMethod1();
+  });
+
+  Kokkos::parallel_for("test 2",1,KOKKOS_LAMBDA (const int ) {
+      my_class.checkInternalMethod2();
+  });
+
+  Kokkos::parallel_for("test 3",1,KOKKOS_LAMBDA (const int ) {
+      my_class.checkInternalMethod3();
+  });
+  
+  Kokkos::fence();
+}

From edd8623b9b9b8e8c6037a47e0a6e2a663092af67 Mon Sep 17 00:00:00 2001
From: Alan Williams <william@sandia.gov>
Date: Mon, 22 Aug 2022 12:44:54 -0600
Subject: [PATCH 116/130] STK: Snapshot 08-22-22 12:44

---
 .../Akri_DeleteSmallElementsMain.cpp          |    1 +
 packages/krino/krino/CMakeLists.txt           |    2 +-
 .../krino/krino_lib/Akri_AnalyticSurf.cpp     |   30 +-
 .../krino/krino_lib/Akri_AnalyticSurf.hpp     |   19 +-
 .../Akri_AnalyticSurfaceInterfaceGeometry.cpp |   37 +-
 .../Akri_AnalyticSurfaceInterfaceGeometry.hpp |   12 +-
 .../krino/krino_lib/Akri_AuxMetaData.cpp      |   23 +-
 .../krino/krino_lib/Akri_BoundingBox.hpp      |    6 +
 .../krino/krino_lib/Akri_BoundingBoxMesh.cpp  |    8 +-
 .../krino/krino_lib/Akri_BoundingBoxMesh.hpp  |    2 +-
 .../krino/krino_lib/Akri_CDFEM_Support.cpp    |    3 +
 .../krino/krino_lib/Akri_CDFEM_Support.hpp    |   19 +-
 .../krino/krino/krino_lib/Akri_CDMesh.cpp     |  248 ++-
 .../krino/krino/krino_lib/Akri_CDMesh.hpp     |    1 +
 .../krino/krino_lib/Akri_CDMesh_Debug.cpp     |   10 +-
 .../krino/krino_lib/Akri_CDMesh_Utils.cpp     |   63 +-
 .../krino/krino_lib/Akri_CDMesh_Utils.hpp     |    4 +-
 .../krino_lib/Akri_CramersRuleSolver.cpp      |  139 ++
 .../krino_lib/Akri_CramersRuleSolver.hpp      |   56 +
 .../krino_lib/Akri_CurvatureLeastSquares.cpp  |  284 +++
 .../krino_lib/Akri_CurvatureLeastSquares.hpp  |   30 +
 .../krino/krino/krino_lib/Akri_Element.hpp    |    1 +
 .../krino/krino/krino_lib/Akri_IO_Helpers.cpp |   75 +-
 .../krino/krino/krino_lib/Akri_IO_Helpers.hpp |   40 +-
 .../krino/krino/krino_lib/Akri_LevelSet.cpp   |    4 +-
 .../krino/krino/krino_lib/Akri_MeshClone.cpp  |   39 +-
 .../krino/krino/krino_lib/Akri_MeshClone.hpp  |    2 +-
 .../krino/krino_lib/Akri_MeshHelpers.cpp      |  118 +-
 .../krino/krino_lib/Akri_MeshHelpers.hpp      |   13 +
 .../krino/krino_lib/Akri_Phase_Support.cpp    |  114 +-
 .../krino/krino_lib/Akri_Phase_Support.hpp    |    8 +-
 .../krino/krino_lib/Akri_SharpFeature.cpp     |  352 ++++
 .../krino/krino_lib/Akri_SharpFeature.hpp     |   44 +
 packages/krino/krino/krino_lib/Akri_Snap.cpp  |  160 +-
 packages/krino/krino/krino_lib/Akri_Snap.hpp  |    3 +-
 .../Akri_String_Function_Expression.cpp       |   56 +
 .../Akri_String_Function_Expression.hpp       |   31 +
 .../krino/krino/krino_lib/Akri_Surface.hpp    |    1 +
 .../krino/krino_lib/Akri_Transformation.cpp   |    7 +-
 .../krino/krino_lib/Akri_Transformation.hpp   |    2 +-
 .../Akri_VolumePreservingSnappingLimiter.cpp  |  102 +
 .../Akri_VolumePreservingSnappingLimiter.hpp  |   36 +
 .../krino/parser/Akri_Surface_Parser.cpp      |   36 +-
 .../rebalance_utils/Akri_RebalanceUtils.cpp   |    6 +-
 packages/krino/krino/region/Akri_Region.cpp   |    7 +-
 .../krino/unit_tests/Akri_StkMeshBuilder.cpp  |  353 ++++
 .../krino/unit_tests/Akri_StkMeshBuilder.hpp  |   91 +
 .../krino/unit_tests/Akri_StkMeshFixture.hpp  |   62 +
 .../krino/unit_tests/Akri_UnitTestUtils.cpp   |    8 +-
 .../krino/unit_tests/Akri_UnitTestUtils.hpp   |    1 +
 .../unit_tests/Akri_Unit_Analytic_CDMesh.cpp  |    7 +-
 .../krino/unit_tests/Akri_Unit_CDMesh.cpp     |    9 +-
 .../Akri_Unit_CurvatureLeastSquares.cpp       |  164 ++
 .../Akri_Unit_Explicit_Hamilton_Jacobi.cpp    |    8 +-
 .../unit_tests/Akri_Unit_MeshHelpers.cpp      |   34 +-
 .../unit_tests/Akri_Unit_RebalanceUtils.cpp   |   17 +-
 .../Akri_Unit_Single_Element_Fixtures.hpp     |   28 +-
 .../krino/krino/unit_tests/Akri_Unit_Snap.cpp |  555 +++++
 .../krino/krino/unit_tests/Akri_Unit_main.cpp |    2 +-
 .../stk_balance/stk_balance/balanceUtils.cpp  |   67 +-
 .../stk_balance/stk_balance/balanceUtils.hpp  |   55 +-
 .../stk_balance/internal/Balancer.cpp         |   15 +-
 .../stk_balance/internal/SubdomainWriter.cpp  |   10 +-
 .../internal/privateDeclarations.cpp          |   87 +-
 .../stk_balance/m2n/M2NSubdomainWriter.cpp    |   10 +-
 .../stk_balance/setup/DefaultSettings.cpp     |   15 +-
 .../stk_balance/setup/DefaultSettings.hpp     |   24 +-
 .../stk_balance/stk_balance/setup/Parser.cpp  |   61 +-
 .../stk_balance/stk_balance/setup/Parser.hpp  |    8 +-
 .../stk_coupling/OldCommSplitting.cpp         |    3 +
 .../stk_coupling/OldCommSplitting.hpp         |    6 +
 .../stk_coupling/stk_coupling/OldSyncInfo.cpp |    3 +
 .../stk_coupling/stk_coupling/OldSyncInfo.hpp |    7 +-
 .../stk_coupling/stk_coupling/SplitComms.cpp  |   11 +-
 .../stk_coupling/stk_coupling/SplitComms.hpp  |    2 +
 .../stk/stk_expreval/stk_expreval/Parser.cpp  |   19 +
 .../unit_tests/UnitTestEvaluator.cpp          |   20 +
 .../cmake_install_test/run_cmake_stk          |    2 +-
 .../run_cmake_stk_no_stk_mesh                 |    4 +-
 .../mock_apps/mock_aria.cpp                   |    4 +
 .../mock_apps/mock_fuego.cpp                  |    4 +
 .../mock_apps/mock_salinas.cpp                |    5 +
 .../mock_apps/mock_sparc.cpp                  |    4 +
 .../IntegrationTestIncrementalRebalance.cpp   |    6 +-
 .../IntegrationTestUserSupport.cpp            |   41 -
 packages/stk/stk_io/stk_io/IossBridge.cpp     | 1810 +++++++++--------
 packages/stk/stk_io/stk_io/IossBridge.hpp     |   49 +-
 packages/stk/stk_io/stk_io/OutputFile.cpp     |   19 +-
 packages/stk/stk_io/stk_io/OutputFile.hpp     |   14 +-
 packages/stk/stk_io/stk_io/OutputParams.hpp   |   70 +
 .../stk/stk_io/stk_io/ProcessSetsOrBlocks.cpp |   12 +-
 .../stk/stk_io/stk_io/ProcessSetsOrBlocks.hpp |    6 +-
 .../stk/stk_io/stk_io/StkMeshIoBroker.cpp     |   37 +-
 .../stk/stk_io/stk_io/StkMeshIoBroker.hpp     |   16 +
 .../stk/stk_mesh/stk_mesh/base/BulkData.cpp   |  571 ++----
 .../stk/stk_mesh/stk_mesh/base/BulkData.hpp   |   56 +-
 .../stk_mesh/base/CommListUpdater.hpp         |   14 +-
 .../stk_mesh/stk_mesh/base/DeviceField.hpp    |    4 -
 .../stk/stk_mesh/stk_mesh/base/DeviceMesh.cpp |   37 -
 .../stk_mesh/base/EntityCommDatabase.cpp      |    9 +
 .../stk_mesh/base/EntityCommDatabase.hpp      |    7 +-
 .../stk_mesh/base/EntityCommListInfo.hpp      |    2 +-
 .../stk_mesh/base/EntityProcMapping.hpp       |   43 +-
 .../stk_mesh/stk_mesh/base/MeshBuilder.cpp    |    3 +-
 packages/stk/stk_mesh/stk_mesh/base/Types.hpp |    1 -
 .../stk_mesh/baseImpl/AuraGhosting.cpp        |  146 +-
 .../stk_mesh/baseImpl/AuraGhosting.hpp        |    8 +
 .../stk_mesh/baseImpl/DeletedEntityCache.cpp  |   49 +
 .../stk_mesh/baseImpl/DeletedEntityCache.hpp  |   81 +
 ...ityRepository.cpp => EntityKeyMapping.cpp} |   28 +-
 ...ityRepository.hpp => EntityKeyMapping.hpp} |   16 +-
 .../stk_mesh/baseImpl/MeshImplUtils.cpp       |  127 +-
 .../stk_mesh/baseImpl/MeshImplUtils.hpp       |   21 +-
 .../stk_mesh/baseImpl/MeshModification.cpp    |  497 ++++-
 .../stk_mesh/baseImpl/MeshModification.hpp    |   41 +-
 .../stk_mesh/stk_mesh/baseImpl/Visitors.hpp   |   85 +-
 .../elementGraph/ElemElemGraphImpl.hpp        |   29 +-
 .../ElemGraphShellConnections.cpp             |    8 +-
 .../baseImpl/elementGraph/GraphEdgeData.cpp   |  297 ++-
 .../baseImpl/elementGraph/GraphEdgeData.hpp   |   24 +-
 .../stk_mesh/NgpMeshUpdate.cpp                |   86 +-
 .../stk_unit_test_utils/BulkDataTester.hpp    |    8 +-
 .../UnitTestCommandLineParsing.cpp            |  393 ++--
 .../UnitTestDiagnosticsComputation.cpp        |  204 +-
 .../UnitTestGeometricMethodsWithSelector.cpp  |    6 +-
 .../stk_balance/UnitTestM2NFileOutput.cpp     |    3 +-
 .../UnitTestRebalanceFileOutput.cpp           |    3 +-
 .../stk_balance/UnitTestSearchTolerance.cpp   |    3 +-
 .../stk_coupling/UnitTestOldCommSplitting.cpp |    3 +
 .../stk_coupling/UnitTestOldSyncInfo.cpp      |    3 +
 .../stk_io/UnitTestReadWriteAssemblies.cpp    |   12 +-
 .../stk_unit_tests/stk_mesh/CMakeLists.txt    |    1 +
 .../stk_mesh/UnitTestBucketRepository.cpp     |    8 +-
 .../stk_mesh/UnitTestBulkData.cpp             |   30 +-
 .../stk_mesh/UnitTestDeleteEntities.cpp       |    3 +-
 .../stk_mesh/UnitTestDeletedEntityCache.cpp   |  150 ++
 .../stk_mesh/UnitTestEntity.cpp               |    2 -
 .../stk_mesh/UnitTestEntityCommDatabase.cpp   |   15 +-
 .../stk_mesh/UnitTestEntityProcMapping.cpp    |   49 +-
 .../stk_mesh/UnitTestMetaData.cpp             |    5 +-
 .../stk_util/parallel/UnitTestCommSparse.cpp  |   23 +-
 .../parallel/UnitTestCouplingVersions.cpp     |   14 +-
 .../parallel/UnitTestParallelReduceBool.cpp   |   66 +
 .../stk_unit_tests/stk_util/schedulerTest.cpp |   17 +
 .../stk_util/util/UnitTestScheduler.cpp       |    4 +-
 .../stk_util/stk_util/environment/CPUTime.cpp |   14 +-
 .../stk/stk_util/stk_util/environment/Env.cpp |    1 -
 .../stk_util/stk_util/parallel/CommSparse.cpp |  180 +-
 .../stk_util/stk_util/parallel/CommSparse.hpp |  131 +-
 .../stk_util/parallel/CouplingVersions.cpp    |   32 +-
 .../stk_util/parallel/CouplingVersions.hpp    |   11 +-
 .../DataExchangeUnknownPatternNonBlocking.cpp |    2 +-
 .../stk_util/parallel/MPITagManager.cpp       |   12 +-
 .../stk_util/parallel/ManagedBufferBase.hpp   |    8 +-
 .../stk_util/parallel/ParallelReduceBool.hpp  |   16 +-
 .../stk_util/registry/ProductRegistry.cpp     |    2 +-
 .../stk_util/stk_util/util/StkNgpVector.hpp   |    4 -
 .../stk/stk_util/stk_util/util/VecSet.hpp     |    5 +-
 158 files changed, 6967 insertions(+), 2885 deletions(-)
 create mode 100644 packages/krino/krino/krino_lib/Akri_CramersRuleSolver.cpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_CramersRuleSolver.hpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_CurvatureLeastSquares.cpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_CurvatureLeastSquares.hpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_SharpFeature.cpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_SharpFeature.hpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_String_Function_Expression.cpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_String_Function_Expression.hpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_VolumePreservingSnappingLimiter.cpp
 create mode 100644 packages/krino/krino/krino_lib/Akri_VolumePreservingSnappingLimiter.hpp
 create mode 100644 packages/krino/krino/unit_tests/Akri_StkMeshBuilder.cpp
 create mode 100644 packages/krino/krino/unit_tests/Akri_StkMeshBuilder.hpp
 create mode 100644 packages/krino/krino/unit_tests/Akri_StkMeshFixture.hpp
 create mode 100644 packages/krino/krino/unit_tests/Akri_Unit_CurvatureLeastSquares.cpp
 create mode 100644 packages/krino/krino/unit_tests/Akri_Unit_Snap.cpp
 create mode 100644 packages/stk/stk_mesh/stk_mesh/baseImpl/DeletedEntityCache.cpp
 create mode 100644 packages/stk/stk_mesh/stk_mesh/baseImpl/DeletedEntityCache.hpp
 rename packages/stk/stk_mesh/stk_mesh/baseImpl/{EntityRepository.cpp => EntityKeyMapping.cpp} (92%)
 rename packages/stk/stk_mesh/stk_mesh/baseImpl/{EntityRepository.hpp => EntityKeyMapping.hpp} (93%)
 create mode 100644 packages/stk/stk_unit_tests/stk_mesh/UnitTestDeletedEntityCache.cpp
 create mode 100644 packages/stk/stk_unit_tests/stk_util/parallel/UnitTestParallelReduceBool.cpp

diff --git a/packages/krino/delete_small_elements/Akri_DeleteSmallElementsMain.cpp b/packages/krino/delete_small_elements/Akri_DeleteSmallElementsMain.cpp
index 34aec55776d8..1b07ed4ee21e 100644
--- a/packages/krino/delete_small_elements/Akri_DeleteSmallElementsMain.cpp
+++ b/packages/krino/delete_small_elements/Akri_DeleteSmallElementsMain.cpp
@@ -108,6 +108,7 @@ static bool delete_small_elements(const DeleteSmallElementsInputData& inputData,
 {
   std::shared_ptr<stk::mesh::BulkData> bulk = stk::mesh::MeshBuilder(comm).create();
   stk::mesh::MetaData& meta = bulk->mesh_meta_data();
+  meta.use_simple_fields();
 
   stk::io::fill_mesh_with_auto_decomp(inputData.meshIn, *bulk);
 
diff --git a/packages/krino/krino/CMakeLists.txt b/packages/krino/krino/CMakeLists.txt
index 075eaee8f8f8..ae0b8379575d 100644
--- a/packages/krino/krino/CMakeLists.txt
+++ b/packages/krino/krino/CMakeLists.txt
@@ -4,7 +4,7 @@ add_subdirectory(adaptivity_interface)
 add_subdirectory(region)
 add_subdirectory(rebalance_utils)
 add_subdirectory(parser)
-tribits_add_test_directories(unit_tests)
+add_subdirectory(unit_tests)
 
 SET(SOURCES_MAIN Apps_krino.cpp)
 
diff --git a/packages/krino/krino/krino_lib/Akri_AnalyticSurf.cpp b/packages/krino/krino/krino_lib/Akri_AnalyticSurf.cpp
index 374396fb7bbf..c5523279a44b 100644
--- a/packages/krino/krino/krino_lib/Akri_AnalyticSurf.cpp
+++ b/packages/krino/krino/krino_lib/Akri_AnalyticSurf.cpp
@@ -270,9 +270,7 @@ Plane::point_signed_distance(const Vector3d &x) const
 BoundingBox
 Plane::get_bounding_box()
 {
-  //bounding box is entire domain
-  return BoundingBox(Vector3d(-std::numeric_limits<double>::max(), -std::numeric_limits<double>::max(), -std::numeric_limits<double>::max()),
-      Vector3d(std::numeric_limits<double>::max(), std::numeric_limits<double>::max(), std::numeric_limits<double>::max()));
+  return BoundingBox::ENTIRE_DOMAIN;
 }
 
 Random::Random(const unsigned long seed)
@@ -292,32 +290,20 @@ Random::point_signed_distance(const Vector3d &x) const
 BoundingBox
 Random::get_bounding_box()
 {
-  //bounding box is entire domain
-  return BoundingBox(Vector3d(-std::numeric_limits<double>::max(), -std::numeric_limits<double>::max(), -std::numeric_limits<double>::max()),
-      Vector3d(std::numeric_limits<double>::max(), std::numeric_limits<double>::max(), std::numeric_limits<double>::max()));
+  return BoundingBox::ENTIRE_DOMAIN;
 }
 
-Analytic_Isosurface::Analytic_Isosurface()
-    : SurfaceThatDoesntTakeAdvantageOfNarrowBandAndThereforeHasCorrectSign()
-{
-}
-
-BoundingBox
-Analytic_Isosurface::get_bounding_box()
+LevelSet_String_Function::LevelSet_String_Function(const std::string & expression)
+    : SurfaceThatDoesntTakeAdvantageOfNarrowBandAndThereforeHasCorrectSign(),
+      myExpression(expression),
+      myBoundingBox(BoundingBox::ENTIRE_DOMAIN)
 {
-  return BoundingBox(
-      Vector3d(-1.,-1.,-1.),
-      Vector3d(1.,1.,1.)
-      );
 }
 
 double
-Analytic_Isosurface::point_signed_distance(const Vector3d &coord) const
+LevelSet_String_Function::point_signed_distance(const Vector3d &coord) const
 {
-  const double x = coord[0];
-  const double y = coord[1];
-  const double z = coord[2];
-  return 2.*y*(y*y-3.*x*x)*(1.-z*z) + std::pow(x*x+y*y,2) - (9.*z*z-1.)*(1.-z*z);
+  return myExpression.evaluate(coord);
 }
 
 } // namespace krino
diff --git a/packages/krino/krino/krino_lib/Akri_AnalyticSurf.hpp b/packages/krino/krino/krino_lib/Akri_AnalyticSurf.hpp
index 18f70a5bb0e1..efb7753341b0 100644
--- a/packages/krino/krino/krino_lib/Akri_AnalyticSurf.hpp
+++ b/packages/krino/krino/krino_lib/Akri_AnalyticSurf.hpp
@@ -17,6 +17,7 @@
 #include <stk_util/diag/Timer.hpp>
 
 #include <Akri_Vec.hpp>
+#include <Akri_String_Function_Expression.hpp>
 
 namespace stk { namespace mesh { class BulkData; } }
 namespace stk { namespace mesh { class Entity; } }
@@ -168,17 +169,23 @@ class Random : public SurfaceThatDoesntTakeAdvantageOfNarrowBandAndThereforeHasC
   void my_srand(unsigned int seed) const {iseed = seed;}
 };
 
-class Analytic_Isosurface: public SurfaceThatDoesntTakeAdvantageOfNarrowBandAndThereforeHasCorrectSign {
+class LevelSet_String_Function: public SurfaceThatDoesntTakeAdvantageOfNarrowBandAndThereforeHasCorrectSign {
 public:
-  Analytic_Isosurface();
+  LevelSet_String_Function(const std::string & expression);
 
-  virtual ~Analytic_Isosurface() {}
+  virtual ~LevelSet_String_Function() {}
 
-  virtual Surface_Type type() const override { return SPHERE; }
-  virtual size_t storage_size() const override { return sizeof(Analytic_Isosurface); }
+  virtual Surface_Type type() const override { return STRING_FUNCTION; }
+  virtual size_t storage_size() const override { return sizeof(LevelSet_String_Function); }
 
   virtual double point_signed_distance(const Vector3d &x) const override;
-  virtual BoundingBox get_bounding_box() override;
+  virtual BoundingBox get_bounding_box() override { return myBoundingBox; }
+
+  void set_bounding_box(const BoundingBox & bbox) { myBoundingBox = bbox; }
+
+private:
+  String_Function_Expression myExpression;
+  BoundingBox myBoundingBox;
 };
 
 } // namespace krino
diff --git a/packages/krino/krino/krino_lib/Akri_AnalyticSurfaceInterfaceGeometry.cpp b/packages/krino/krino/krino_lib/Akri_AnalyticSurfaceInterfaceGeometry.cpp
index cd5019569038..5958df5bfb71 100644
--- a/packages/krino/krino/krino_lib/Akri_AnalyticSurfaceInterfaceGeometry.cpp
+++ b/packages/krino/krino/krino_lib/Akri_AnalyticSurfaceInterfaceGeometry.cpp
@@ -35,11 +35,12 @@ static std::function<double(const double)> build_edge_distance_function(const Su
   return distanceFunction;
 }
 
-static double find_crossing_position(const Surface & surface, const Segment3d & edge)
+static double find_crossing_position(const Surface & surface, const Segment3d & edge, const double edgeTol)
 {
   const double phi0 = surface.point_signed_distance(edge.GetNode(0));
   const double phi1 = surface.point_signed_distance(edge.GetNode(1));
-  const auto result = find_root(build_edge_distance_function(surface, edge), 0., 1., phi0, phi1);
+  const int maxIters = 100;
+  const auto result = find_root(build_edge_distance_function(surface, edge), 0., 1., phi0, phi1, maxIters, edgeTol);
   ThrowRequire(result.first);
   return result.second;
 }
@@ -69,9 +70,11 @@ static Vector3d get_centroid(const std::vector<Vector3d> & elemNodesCoords)
 
 SurfaceElementCutter::SurfaceElementCutter(const stk::mesh::BulkData & mesh,
   stk::mesh::Entity element,
-  const Surface & surface)
+  const Surface & surface,
+  const double edgeTol)
 : myMasterElem(MasterElementDeterminer::getMasterElement(mesh.bucket(element).topology())),
-  mySurface(surface)
+  mySurface(surface),
+  myEdgeCrossingTol(edgeTol)
 {
   const FieldRef coordsField(mesh.mesh_meta_data().coordinate_field());
   fill_element_node_coordinates(mesh, element, coordsField, myElementNodeCoords);
@@ -95,7 +98,7 @@ bool SurfaceElementCutter::have_crossing(const InterfaceID interface, const Segm
 double SurfaceElementCutter::interface_crossing_position(const InterfaceID interface, const Segment3d & edge) const
 {
   const Segment3d globalEdge(parametric_to_global_coordinates(edge.GetNode(0)), parametric_to_global_coordinates(edge.GetNode(1)));
-  return find_crossing_position(mySurface, globalEdge);
+  return find_crossing_position(mySurface, globalEdge, myEdgeCrossingTol);
 }
 
 int SurfaceElementCutter::sign_at_position(const InterfaceID interface, const Vector3d & paramCoords) const
@@ -116,6 +119,7 @@ Vector3d SurfaceElementCutter::parametric_to_global_coordinates(const Vector3d &
 static void append_surface_edge_intersection_points(const stk::mesh::BulkData & mesh,
     const std::vector<stk::mesh::Entity> & elementsToIntersect,
     const Surface & surface,
+    const double edgeCrossingTol,
     const IntersectionPointFilter & intersectionPointFilter,
     std::vector<IntersectionPoint> & intersectionPoints)
 {
@@ -150,7 +154,7 @@ static void append_surface_edge_intersection_points(const stk::mesh::BulkData &
         if (haveCrossing)
         {
           const InterfaceID interface(0,0);
-          const double location = find_crossing_position(surface, Segment3d(node0Coords, node1Coords));
+          const double location = find_crossing_position(surface, Segment3d(node0Coords, node1Coords), edgeCrossingTol);
           interface.fill_sorted_domains(intersectionPointSortedDomains);
           const std::vector<stk::mesh::Entity> intersectionPointNodes{node0,node1};
           if (intersectionPointFilter(intersectionPointNodes, intersectionPointSortedDomains))
@@ -284,6 +288,21 @@ static void set_domains_for_element_if_it_will_be_uncut_after_snapping(const stk
   }
 }
 
+AnalyticSurfaceInterfaceGeometry::AnalyticSurfaceInterfaceGeometry(const Surface_Identifier surfaceIdentifier,
+    const Surface & surface,
+    const stk::mesh::Part & activePart,
+    const CDFEM_Support & cdfemSupport,
+    const Phase_Support & phaseSupport)
+  : mySurface(surface),
+    myActivePart(activePart),
+    myCdfemSupport(cdfemSupport),
+    myPhaseSupport(phaseSupport),
+    mySurfaceIdentifiers({surfaceIdentifier}),
+    myEdgeCrossingTol(0.1*cdfemSupport.get_snapper().get_edge_tolerance())
+{
+  ThrowRequireMsg(myEdgeCrossingTol > 0., "Invalid minimum edge crossing tolerance " << myEdgeCrossingTol);
+}
+
 void AnalyticSurfaceInterfaceGeometry::store_phase_for_elements_that_will_be_uncut_after_snapping(const stk::mesh::BulkData & mesh,
       const std::vector<IntersectionPoint> & intersectionPoints,
       const std::vector<SnapInfo> & snapInfos,
@@ -306,7 +325,7 @@ std::vector<IntersectionPoint> AnalyticSurfaceInterfaceGeometry::get_edge_inters
 
   const IntersectionPointFilter intersectionPointFilter = keep_all_intersection_points_filter();
   std::vector<IntersectionPoint> intersectionPoints;
-  append_surface_edge_intersection_points(mesh, myElementsToIntersect, mySurface, intersectionPointFilter, intersectionPoints);
+  append_surface_edge_intersection_points(mesh, myElementsToIntersect, mySurface, myEdgeCrossingTol, intersectionPointFilter, intersectionPoints);
   return intersectionPoints;
 }
 
@@ -317,7 +336,7 @@ void AnalyticSurfaceInterfaceGeometry::append_element_intersection_points(const
   std::vector<IntersectionPoint> & intersectionPoints) const
 {
   prepare_to_process_elements(mesh, elementsToIntersect, nodesToCapturedDomains);
-  append_surface_edge_intersection_points(mesh, myElementsToIntersect, mySurface, intersectionPointFilter, intersectionPoints);
+  append_surface_edge_intersection_points(mesh, myElementsToIntersect, mySurface, myEdgeCrossingTol, intersectionPointFilter, intersectionPoints);
 }
 
 std::unique_ptr<ElementCutter> AnalyticSurfaceInterfaceGeometry::build_element_cutter(const stk::mesh::BulkData & mesh,
@@ -325,7 +344,7 @@ std::unique_ptr<ElementCutter> AnalyticSurfaceInterfaceGeometry::build_element_c
   const std::function<bool(const std::array<unsigned,4> &)> & intersectingPlanesDiagonalPicker) const
 {
   std::unique_ptr<ElementCutter> cutter;
-  cutter.reset( new SurfaceElementCutter(mesh, element, mySurface) );
+  cutter.reset( new SurfaceElementCutter(mesh, element, mySurface, myEdgeCrossingTol) );
   return cutter;
 }
 
diff --git a/packages/krino/krino/krino_lib/Akri_AnalyticSurfaceInterfaceGeometry.hpp b/packages/krino/krino/krino_lib/Akri_AnalyticSurfaceInterfaceGeometry.hpp
index 37ee0aeee07a..e07d512e8bc5 100644
--- a/packages/krino/krino/krino_lib/Akri_AnalyticSurfaceInterfaceGeometry.hpp
+++ b/packages/krino/krino/krino_lib/Akri_AnalyticSurfaceInterfaceGeometry.hpp
@@ -27,7 +27,8 @@ class SurfaceElementCutter : public ElementCutter
 public:
   SurfaceElementCutter(const stk::mesh::BulkData & mesh,
     stk::mesh::Entity element,
-    const Surface & surface);
+    const Surface & surface,
+    const double edgeTol);
   virtual ~SurfaceElementCutter() {}
 
   virtual bool might_have_interior_or_face_intersections() const override { return false; }
@@ -55,6 +56,7 @@ class SurfaceElementCutter : public ElementCutter
   const MasterElement & myMasterElem;
   std::vector<Vector3d> myElementNodeCoords;
   const Surface & mySurface;
+  double myEdgeCrossingTol;
   int myElementSign{0};
 };
 
@@ -65,12 +67,7 @@ class AnalyticSurfaceInterfaceGeometry : public InterfaceGeometry {
     const Surface & surface,
     const stk::mesh::Part & activePart,
     const CDFEM_Support & cdfemSupport,
-    const Phase_Support & phaseSupport)
-  : mySurface(surface),
-    myActivePart(activePart),
-    myCdfemSupport(cdfemSupport),
-    myPhaseSupport(phaseSupport),
-    mySurfaceIdentifiers({surfaceIdentifier}) {}
+    const Phase_Support & phaseSupport);
 
   virtual ~AnalyticSurfaceInterfaceGeometry() {}
 
@@ -113,6 +110,7 @@ class AnalyticSurfaceInterfaceGeometry : public InterfaceGeometry {
   const CDFEM_Support & myCdfemSupport;
   const Phase_Support & myPhaseSupport;
   std::vector<Surface_Identifier> mySurfaceIdentifiers;
+  double myEdgeCrossingTol;
   mutable ElementToDomainMap myUncutElementPhases;
   mutable std::vector<stk::mesh::Entity> myElementsToIntersect;
 };
diff --git a/packages/krino/krino/krino_lib/Akri_AuxMetaData.cpp b/packages/krino/krino/krino_lib/Akri_AuxMetaData.cpp
index 80ee7b1c14d7..1c2430c3beab 100644
--- a/packages/krino/krino/krino_lib/Akri_AuxMetaData.cpp
+++ b/packages/krino/krino/krino_lib/Akri_AuxMetaData.cpp
@@ -297,15 +297,15 @@ AuxMetaData::declare_field(
   stk::mesh::FieldBase * field = NULL;
   const std::type_info & value_type = field_type.type_info();
   if (value_type == typeid(int))
-    field = &my_meta.declare_field< stk::mesh::Field<int, stk::mesh::SimpleArrayTag> >(entity_rank, fld_name, num_states);
+    field = &my_meta.declare_field<int>(entity_rank, fld_name, num_states);
   else if (value_type == typeid(double))
-    field = &my_meta.declare_field< stk::mesh::Field<double, stk::mesh::SimpleArrayTag> >(entity_rank, fld_name, num_states);
+    field = &my_meta.declare_field<double>(entity_rank, fld_name, num_states);
   else if (value_type == typeid(unsigned))
-    field = &my_meta.declare_field< stk::mesh::Field<unsigned, stk::mesh::SimpleArrayTag> >(entity_rank, fld_name, num_states);
+    field = &my_meta.declare_field<unsigned>(entity_rank, fld_name, num_states);
   else if (value_type == typeid(int64_t))
-    field = &my_meta.declare_field< stk::mesh::Field<int64_t, stk::mesh::SimpleArrayTag> >(entity_rank, fld_name, num_states);
+    field = &my_meta.declare_field<int64_t>(entity_rank, fld_name, num_states);
   else if (value_type == typeid(uint64_t))
-    field = &my_meta.declare_field< stk::mesh::Field<uint64_t, stk::mesh::SimpleArrayTag> >(entity_rank, fld_name, num_states);
+    field = &my_meta.declare_field<uint64_t>(entity_rank, fld_name, num_states);
   else {
     ThrowRequireMsg(false, "Unhandled primitive type " << value_type.name());
   }
@@ -332,22 +332,23 @@ AuxMetaData::register_field(
     return FieldRef(fmwk_register_field(fld_name, field_type.name(), field_type.type_info(), field_type.dimension(), entity_rank, num_states, dimension, part, value_type_init));
   }
 
-  const unsigned field_length = field_type.dimension()*dimension;
   if (field_type.name() == FieldType::VECTOR_2D.name())
   {
-    auto & field = my_meta.declare_field< stk::mesh::Field<double, stk::mesh::Cartesian2d> >(entity_rank, fld_name, num_states);
-    stk::mesh::put_field_on_mesh(field, part, field_length, nullptr);
+    auto & field = my_meta.declare_field<double>(entity_rank, fld_name, num_states);
+    stk::mesh::put_field_on_mesh(field, part, field_type.dimension(), dimension, nullptr);
+    stk::io::set_field_output_type(field, "Vector_2D");
     return FieldRef(field);
   }
   else if (field_type.name() == FieldType::VECTOR_3D.name())
   {
-    auto & field = my_meta.declare_field< stk::mesh::Field<double, stk::mesh::Cartesian3d> >(entity_rank, fld_name, num_states);
-    stk::mesh::put_field_on_mesh(field, part, field_length, nullptr);
+    auto & field = my_meta.declare_field<double>(entity_rank, fld_name, num_states);
+    stk::mesh::put_field_on_mesh(field, part, field_type.dimension(), dimension, nullptr);
+    stk::io::set_field_output_type(field, "Vector_3D");
     return FieldRef(field);
   }
 
   FieldRef field = declare_field(fld_name, field_type, entity_rank, num_states);
-  stk::mesh::put_field_on_mesh(field.field(), part, field_length, value_type_init);
+  stk::mesh::put_field_on_mesh(field.field(), part, field_type.dimension(), dimension, value_type_init);
   return field;
 }
 
diff --git a/packages/krino/krino/krino_lib/Akri_BoundingBox.hpp b/packages/krino/krino/krino_lib/Akri_BoundingBox.hpp
index e64ce337df88..016fbdad8576 100644
--- a/packages/krino/krino/krino_lib/Akri_BoundingBox.hpp
+++ b/packages/krino/krino/krino_lib/Akri_BoundingBox.hpp
@@ -30,6 +30,8 @@ class BoundingBox_T {
   VecType max;
 
 public:
+  static const BoundingBox_T<REAL,DIM> ENTIRE_DOMAIN;
+
   static void gather_bboxes( const BoundingBox_T<REAL,DIM> & local_bbox,
       std::vector< BoundingBox_T<REAL,DIM> > & all_bboxes );
 
@@ -205,6 +207,10 @@ BoundingBox_T<REAL,DIM>::scale( const Real & scale_factor )
   max += extension;
 }
 
+template<class REAL, int DIM>
+const BoundingBox_T<REAL,DIM> BoundingBox_T<REAL,DIM>::ENTIRE_DOMAIN(VecType(-std::numeric_limits<REAL>::max(), -std::numeric_limits<REAL>::max(), -std::numeric_limits<REAL>::max()),
+      VecType(std::numeric_limits<REAL>::max(), std::numeric_limits<REAL>::max(), std::numeric_limits<REAL>::max()));
+
 typedef BoundingBox_T<float,3> BoundingBox;
 
 } // namespace krino
diff --git a/packages/krino/krino/krino_lib/Akri_BoundingBoxMesh.cpp b/packages/krino/krino/krino_lib/Akri_BoundingBoxMesh.cpp
index 32bd6e2b02b6..f968754d331c 100644
--- a/packages/krino/krino/krino_lib/Akri_BoundingBoxMesh.cpp
+++ b/packages/krino/krino/krino_lib/Akri_BoundingBoxMesh.cpp
@@ -18,6 +18,7 @@
 #include <stk_mesh/base/FieldTraits.hpp>
 #include <stk_mesh/base/GetEntities.hpp>
 #include <stk_mesh/base/SkinBoundary.hpp>
+#include <stk_mesh/base/MeshBuilder.hpp>
 
 #include <stk_io/IossBridge.hpp>
 #include <stk_tools/mesh_tools/FixNodeSharingViaSearch.hpp>
@@ -32,7 +33,10 @@ BoundingBoxMesh::BoundingBoxMesh(stk::topology element_topology, const std::vect
       element_topology == stk::topology::TETRAHEDRON_4 ||
       element_topology == stk::topology::HEXAHEDRON_8);
 
-  m_meta = std::make_unique<stk::mesh::MetaData>(element_topology.dimension(), entity_rank_names);
+  m_meta = stk::mesh::MeshBuilder().set_spatial_dimension(element_topology.dimension())
+                                   .set_entity_rank_names(entity_rank_names)
+                                   .create_meta_data();
+
   AuxMetaData & aux_meta = AuxMetaData::create(*m_meta);
   stk::mesh::Part & block_part = m_meta->declare_part_with_topology( "block_1", element_topology );
   stk::io::put_io_part_attribute(block_part);
@@ -114,7 +118,7 @@ void
 BoundingBoxMesh::populate_mesh(stk::ParallelMachine pm, const stk::mesh::BulkData::AutomaticAuraOption auto_aura_option)
 { /* %TRACE[ON]% */ Trace trace__("krino::BoundingBoxMesh::populate_mesh()"); /* %TRACE% */
   ThrowRequireMsg(m_mesh_bbox.valid(), "Must call set_domain() before populate_mesh()");
-  m_mesh = std::make_unique<stk::mesh::BulkData>(*m_meta, pm, auto_aura_option);
+  m_mesh = stk::mesh::MeshBuilder(pm).set_aura_option(auto_aura_option).create(m_meta);
   if (CUBIC_BOUNDING_BOX_MESH == myMeshStructureType)
     populate_cell_based_mesh();
   else if (TRIANGULAR_LATTICE_BOUNDING_BOX_MESH == myMeshStructureType || FLAT_WALLED_TRIANGULAR_LATTICE_BOUNDING_BOX_MESH == myMeshStructureType)
diff --git a/packages/krino/krino/krino_lib/Akri_BoundingBoxMesh.hpp b/packages/krino/krino/krino_lib/Akri_BoundingBoxMesh.hpp
index 45572ed5ea79..2a1521dda3ef 100644
--- a/packages/krino/krino/krino_lib/Akri_BoundingBoxMesh.hpp
+++ b/packages/krino/krino/krino_lib/Akri_BoundingBoxMesh.hpp
@@ -116,7 +116,7 @@ class BoundingBoxMesh {
   void set_is_cell_edge_function_for_BCC_mesh() const;
   void set_is_cell_edge_function_for_cell_based_mesh() const;
 private:
-  std::unique_ptr<stk::mesh::MetaData> m_meta;
+  std::shared_ptr<stk::mesh::MetaData> m_meta;
   std::unique_ptr<stk::mesh::BulkData> m_mesh;
   std::unique_ptr<CartesianCoordinateMapping> my_coord_mapping;
   stk::mesh::PartVector m_elem_parts;
diff --git a/packages/krino/krino/krino_lib/Akri_CDFEM_Support.cpp b/packages/krino/krino/krino_lib/Akri_CDFEM_Support.cpp
index b8c6201fc0b8..4ddd8e91dd41 100644
--- a/packages/krino/krino/krino_lib/Akri_CDFEM_Support.cpp
+++ b/packages/krino/krino/krino_lib/Akri_CDFEM_Support.cpp
@@ -60,6 +60,9 @@ CDFEM_Support::CDFEM_Support(stk::mesh::MetaData & meta)
     my_cdfem_snapper(),
     my_cdfem_dof_edge_tol(0.0),
     my_internal_face_stabilization_multiplier(0.0),
+    mySnappingSharpFeatureAngleInDegrees(0.),
+    myLengthScaleTypeForInterfaceCFL(LOCAL_LENGTH_SCALE),
+    myConstantLengthScaleForInterfaceCFL(0.),
     my_flag_use_hierarchical_dofs(false),
     my_flag_constrain_CDFEM_to_XFEM_space(false),
     my_flag_use_nonconformal_element_size(true),
diff --git a/packages/krino/krino/krino_lib/Akri_CDFEM_Support.hpp b/packages/krino/krino/krino_lib/Akri_CDFEM_Support.hpp
index 9a357f6d3d83..0892174ad98d 100644
--- a/packages/krino/krino/krino_lib/Akri_CDFEM_Support.hpp
+++ b/packages/krino/krino/krino_lib/Akri_CDFEM_Support.hpp
@@ -55,6 +55,14 @@ enum Simplex_Generation_Method
   MAX_SIMPLEX_GENERATION_METHOD
 };
 
+enum Interface_CFL_Length_Scale
+{
+  CONSTANT_LENGTH_SCALE=0,
+  LOCAL_LENGTH_SCALE,
+  L1_NORM_LENGTH_SCALE,
+  MAX_LENGTH_SCALE_TYPE
+};
+
 class CDFEM_Support {
 public:
 
@@ -82,6 +90,8 @@ class CDFEM_Support {
   void set_global_ids_are_NOT_parallel_consistent() { myGlobalIDsAreParallelConsistent = false; }
   void activate_interface_refinement(int minimum_level, int maximum_level);
   void activate_nonconformal_adaptivity(const int num_levels);
+  void set_snapping_sharp_feature_angle_in_degrees(const double snappingSharpFeatureAngleInDegrees) { mySnappingSharpFeatureAngleInDegrees = snappingSharpFeatureAngleInDegrees; }
+  double get_snapping_sharp_feature_angle_in_degrees() const { return mySnappingSharpFeatureAngleInDegrees; }
 
   void create_parts();
 
@@ -175,10 +185,14 @@ class CDFEM_Support {
   void set_use_hierarchical_dofs(bool flag) { my_flag_use_hierarchical_dofs = flag; }
   bool get_constrain_CDFEM_to_XFEM_space() const { return my_flag_constrain_CDFEM_to_XFEM_space; }
   void set_constrain_CDFEM_to_XFEM_space(bool flag) { my_flag_constrain_CDFEM_to_XFEM_space = flag; }
+
+  void set_constant_length_scale_for_interface_CFL(double lengthScale) { myConstantLengthScaleForInterfaceCFL = lengthScale; }
+  double get_constant_length_scale_for_interface_CFL() const { return myConstantLengthScaleForInterfaceCFL; }
+  void set_length_scale_type_for_interface_CFL(Interface_CFL_Length_Scale lengthScaleType) { myLengthScaleTypeForInterfaceCFL = lengthScaleType; }
+  Interface_CFL_Length_Scale get_length_scale_type_for_interface_CFL() const { return myLengthScaleTypeForInterfaceCFL; }
   bool get_use_velocity_to_evaluate_interface_CFL() const { return myFlagUseVelocityToEvaluateInterfaceCFL; }
   void set_use_velocity_to_evaluate_interface_CFL(bool flag) { myFlagUseVelocityToEvaluateInterfaceCFL = flag; }
 
-
   void force_ale_prolongation_for_field(const std::string & field_name);
 
 private:
@@ -225,6 +239,9 @@ class CDFEM_Support {
   CDFEM_Snapper my_cdfem_snapper;
   double my_cdfem_dof_edge_tol;
   double my_internal_face_stabilization_multiplier;
+  double mySnappingSharpFeatureAngleInDegrees;
+  Interface_CFL_Length_Scale myLengthScaleTypeForInterfaceCFL;
+  double myConstantLengthScaleForInterfaceCFL;
   bool my_flag_use_hierarchical_dofs;
   bool my_flag_constrain_CDFEM_to_XFEM_space;
   bool my_flag_use_nonconformal_element_size;
diff --git a/packages/krino/krino/krino_lib/Akri_CDMesh.cpp b/packages/krino/krino/krino_lib/Akri_CDMesh.cpp
index 9d1be73a6c4c..af2b5193d980 100644
--- a/packages/krino/krino/krino_lib/Akri_CDMesh.cpp
+++ b/packages/krino/krino/krino_lib/Akri_CDMesh.cpp
@@ -291,7 +291,12 @@ void CDMesh::snap_and_update_fields_and_captured_domains(const InterfaceGeometry
     stk::mesh::field_copy(my_cdfem_support.get_coords_field(), cdfemSnapField);
 
   const stk::mesh::Selector parentElementSelector = get_parent_element_selector(get_active_part(), my_cdfem_support, my_phase_support);
-  nodesToCapturedDomains = snap_as_much_as_possible_while_maintaining_quality(stk_bulk(), parentElementSelector, snapFields, interfaceGeometry, my_cdfem_support.get_global_ids_are_parallel_consistent());
+  nodesToCapturedDomains = snap_as_much_as_possible_while_maintaining_quality(stk_bulk(),
+      parentElementSelector,
+      snapFields,
+      interfaceGeometry,
+      my_cdfem_support.get_global_ids_are_parallel_consistent(),
+      my_cdfem_support.get_snapping_sharp_feature_angle_in_degrees());
 
   if (cdfemSnapField.valid())
     stk::mesh::field_axpby(+1.0, my_cdfem_support.get_coords_field(), -1.0, cdfemSnapField);
@@ -386,6 +391,13 @@ CDMesh::decompose_mesh(stk::mesh::BulkData & mesh,
   return status;
 }
 
+static void rebuild_mesh_sidesets(stk::mesh::BulkData & mesh)
+{
+  for (auto && part : mesh.mesh_meta_data().get_parts())
+    if (part->primary_entity_rank() == mesh.mesh_meta_data().side_rank())
+      stk::mesh::reconstruct_sideset(mesh, *part);
+}
+
 bool
 CDMesh::modify_mesh()
 {/* %TRACE[ON]% */ Trace trace__("krino::Mesh::modify_mesh()"); /* %TRACE% */
@@ -631,10 +643,16 @@ CDMesh::rebuild_from_restart_mesh(stk::mesh::BulkData & mesh)
 
   // rebuild conformal side parts
   the_new_mesh->stk_bulk().modification_begin();
+  update_node_activation(the_new_mesh->stk_bulk(), the_new_mesh->aux_meta().active_part()); // we should be able to skip this step if there are no higher order elements
   the_new_mesh->update_element_side_parts();
   the_new_mesh->stk_bulk().modification_end();
 
   delete_extraneous_inactive_sides(mesh, the_new_mesh->get_parent_part(), the_new_mesh->get_active_part());
+
+  rebuild_mesh_sidesets(mesh);
+
+  ParallelThrowAssert(mesh.parallel(), check_face_and_edge_ownership(mesh));
+  ParallelThrowAssert(mesh.parallel(), check_face_and_edge_relations(mesh));
 }
 
 static bool is_child_elem(const stk::mesh::BulkData & mesh, const stk::mesh::Part & childEdgeNodePart, stk::mesh::Entity elem)
@@ -735,6 +753,19 @@ CDMesh::find_or_build_subelement_edge_node(const stk::mesh::Entity node, const M
   return build_subelement_edge_node(node, ownerMeshElem, idToSubElementNode);
 }
 
+void
+CDMesh::find_or_build_midside_nodes(const stk::topology & elemTopo, const Mesh_Element & ownerMeshElem, const stk::mesh::Entity * elemNodes, const NodeVec & subelemNodes )
+{
+  if (elemTopo.num_nodes() > elemTopo.base().num_nodes())
+  {
+    for (unsigned iEdge=0; iEdge<elemTopo.num_edges(); ++iEdge)
+    {
+      const unsigned * edgeLNN = get_edge_node_ordinals(elemTopo, iEdge);
+      create_midside_node(&ownerMeshElem, subelemNodes[edgeLNN[0]], subelemNodes[edgeLNN[1]], elemNodes[edgeLNN[2]]);
+    }
+  }
+}
+
 const SubElementNode *
 CDMesh::build_subelement_edge_node(const stk::mesh::Entity node, const Mesh_Element & ownerMeshElem, std::map<stk::mesh::EntityId, const SubElementNode*> & idToSubElementNode )
 {
@@ -747,8 +778,7 @@ CDMesh::build_subelement_edge_node(const stk::mesh::Entity node, const Mesh_Elem
 
   const double position = compute_child_position(mesh, node, immediateParent0->entity(), immediateParent1->entity());
 
-  std::unique_ptr<SubElementEdgeNode> newNode = std::make_unique<SubElementEdgeNode>(&ownerMeshElem, position, immediateParent0, immediateParent1);
-  SubElementNode * edgeNode = add_managed_node(std::move(newNode));
+  const SubElementNode * edgeNode = create_edge_node(&ownerMeshElem, immediateParent0, immediateParent1, position);
   edgeNode->set_entity(stk_bulk(), node);
 
   idToSubElementNode[mesh.identifier(node)] = edgeNode;
@@ -771,8 +801,8 @@ CDMesh::restore_subelements()
   for(const auto & b_ptr : buckets)
   {
     const stk::topology & topo = b_ptr->topology();
-    const unsigned num_nodes = topo.num_nodes();
-    subelem_nodes.reserve(num_nodes);
+    const unsigned num_base_nodes = topo.base().num_nodes();
+    subelem_nodes.reserve(num_base_nodes);
     for(const auto & elem : *b_ptr)
     {
       const stk::mesh::Entity parent = get_parent_element(elem);
@@ -784,30 +814,54 @@ CDMesh::restore_subelements()
       subelem_nodes.clear();
       // TODO: May need to create subelement edge nodes somehow
       const auto * elem_nodes = mesh.begin_nodes(elem);
-      ThrowAssert(mesh.num_nodes(elem) == num_nodes);
-      for(unsigned i=0; i < num_nodes; ++i)
+      for(unsigned i=0; i < num_base_nodes; ++i)
       {
         const SubElementNode * node = find_or_build_subelement_edge_node(elem_nodes[i], *parentMeshElem, idToSubElementNode);
         subelem_nodes.push_back(node);
       }
+      find_or_build_midside_nodes(topo, *parentMeshElem, elem_nodes, subelem_nodes);
 
       std::unique_ptr<SubElement> subelem;
       switch(topo)
       {
       case stk::topology::TRIANGLE_3_2D:
+      case stk::topology::TRIANGLE_6_2D:
         subelem = std::make_unique<SubElement_Tri_3>(subelem_nodes, std::vector<int>{-1, -1, -1}, parentMeshElem);
         break;
       case stk::topology::TETRAHEDRON_4:
+      case stk::topology::TETRAHEDRON_10:
         subelem = std::make_unique<SubElement_Tet_4>(subelem_nodes, std::vector<int>{-1, -1, -1, -1}, parentMeshElem);
         break;
       default:
-        ThrowRuntimeError("At present only Tri3 and Tet4 topologies are supported for restart of CDFEM problems.");
+        ThrowRuntimeError("At present only Tri3, Tri6, Tet4 and Tet10 topologies are supported for restart of CDFEM problems.");
+      }
+
+      if (topo == stk::topology::TRIANGLE_6_2D || topo == stk::topology::TETRAHEDRON_10)
+      {
+        subelem->build_quadratic_subelements(*this);
+        std::vector<SubElement *> highOrderSubElems;
+        subelem->get_subelements( highOrderSubElems );
+        ThrowRequire(highOrderSubElems.size() == 1);
+        highOrderSubElems[0]->set_entity(stk_bulk(), elem);
       }
-      ThrowAssert(subelem);
-      subelem->set_entity(stk_bulk(), elem);
+      else
+      {
+        subelem->set_entity(stk_bulk(), elem);
+      }
+
       const_cast<Mesh_Element *>(parentMeshElem)->add_subelement(std::move(subelem));
     }
   }
+
+  std::vector<SubElement *> subelems;
+  for (auto && element : elements)
+  {
+    element->get_subelements( subelems );
+    if (subelems.size() > 1)
+    {
+      element->set_have_interface();
+    }
+  }
 }
 
 void
@@ -1049,6 +1103,8 @@ CDMesh::stash_nodal_field_data(const CDMesh & new_mesh) const
       for(auto&& node_part_ptr : node_parts)
       {
         // This is designed to catch side with block_2 + block_1_air, block_1_air + block_1_solid, etc.
+        // These are included so that we can prolongate a node on the block_1_air + block_1_solid + block_2
+        // from a node on that same part ownership.  (This is needed in cases where block_2 has other vars).
         if (node_part_ptr->primary_entity_rank() == stk::topology::ELEMENT_RANK &&
             !my_phase_support.is_nonconformal(node_part_ptr) &&
             stk::io::is_part_io_part(*node_part_ptr))
@@ -1083,9 +1139,12 @@ CDMesh::stash_nodal_field_data(const CDMesh & new_mesh) const
       const stk::mesh::PartVector & side_parts = bucket_ptr->supersets();
       for(auto&& side_part_ptr : side_parts)
       {
-        // This is designed to catch side with block_2 + block_1_air, block_1_air + block_1_solid, etc.
+        // This is designed to catch sides like block_1_air + block_1_solid, etc and not block_2 + block_1_air.
+        // If we include the nondecomposed blocks like block_2, this could result in prolongation of a node
+        // on the interface (block_1_air + block_1_solid) from a node on the boundary of the undecomposed block
+        // (block_1_air + block_2).
         if (side_part_ptr->primary_entity_rank() == stk::topology::ELEMENT_RANK &&
-            !my_phase_support.is_nonconformal(side_part_ptr) &&
+            my_phase_support.is_conformal(side_part_ptr) &&
             stk::io::is_part_io_part(*side_part_ptr))
         {
           ++num_conformal_parts;
@@ -1344,6 +1403,7 @@ CDMesh::find_prolongation_node(const SubElementNode & dst_node) const
         krinolog << node->entityId() << " ";
       }
       krinolog << stk::diag::dendl;
+      krinolog << "  with required fields " << print_fields(stk_meta(), required_fields) << stk::diag::dendl;
     }
   }
 
@@ -1356,6 +1416,7 @@ CDMesh::find_prolongation_node(const SubElementNode & dst_node) const
       return nullptr;
     }
     // Search for facet failed.  Now try nodes.  This will handle triple points.  Something better that handles an actual edge search might be better in 3d.
+    if (krinolog.shouldPrint(LOG_DEBUG)) krinolog << "Prolongation facet search failed for " << dst_node.entityId() << " with required fields " << print_fields(stk_meta(), required_fields) << stk::diag::dendl;
     const ProlongationNodeData * closest_node = nullptr;
     double closest_dist2 = std::numeric_limits<double>::max();
     for (auto && entry : my_prolong_node_map)
@@ -2941,17 +3002,92 @@ CDMesh::get_parent_nodes_and_weights(stk::mesh::Entity child, stk::mesh::Entity
 
 //--------------------------------------------------------------------------------
 
-std::function<double(stk::mesh::Entity)> build_get_element_volume_function(const CDMesh & cdmesh)
+std::function<double(stk::mesh::Entity)> build_get_local_length_scale_for_side_function(const CDMesh & cdmesh)
 {
-  auto get_element_size =
-      [&cdmesh](stk::mesh::Entity elem)
+  const stk::mesh::Selector elementSelector = selectUnion(cdmesh.get_phase_support().get_conformal_parts()) & cdmesh.get_active_part() & cdmesh.get_locally_owned_part();
+
+  auto get_length_scale_for_side =
+      [&cdmesh,elementSelector](stk::mesh::Entity side)
+      {
+        const stk::mesh::BulkData & mesh = cdmesh.stk_bulk();
+        double minElemVolume = 0.;
+        for (auto elem : StkMeshEntities{mesh.begin_elements(side), mesh.end_elements(side)})
+        {
+          if (elementSelector(mesh.bucket(elem)))
+          {
+            stk::mesh::Entity volumeElement = cdmesh.get_cdfem_support().use_nonconformal_element_size() ? cdmesh.get_parent_element(elem) : elem;
+            ThrowRequire(cdmesh.stk_bulk().is_valid(volumeElement));
+            const double elemVol = ElementObj::volume( mesh, volumeElement, cdmesh.get_coords_field() );
+            if (minElemVolume == 0. || elemVol < minElemVolume)
+              minElemVolume = elemVol;
+          }
+        }
+        double lengthScale = 0.;
+        if (minElemVolume > 0.)
+        {
+          const double invDim = 1.0 / mesh.mesh_meta_data().spatial_dimension();
+          lengthScale = std::pow(minElemVolume, invDim);
+        }
+
+        return lengthScale;
+      };
+  return get_length_scale_for_side;
+}
+
+std::function<double(stk::mesh::Entity)> build_get_constant_length_scale_for_side_function(const double lengthScale)
+{
+  auto get_length_scale_for_side =
+      [lengthScale](stk::mesh::Entity side)
       {
-        stk::mesh::Entity volumeElement = cdmesh.get_cdfem_support().use_nonconformal_element_size() ? cdmesh.get_parent_element(elem) : elem;
-        ThrowRequire(cdmesh.stk_bulk().is_valid(volumeElement));
-        const double elemVolume = ElementObj::volume( cdmesh.stk_bulk(), volumeElement, cdmesh.get_coords_field() );
-        return elemVolume;
+        return lengthScale;
       };
-  return get_element_size;
+  return get_length_scale_for_side;
+}
+
+std::vector<stk::mesh::Entity> get_unique_owned_volume_elements_using_sides(const CDMesh & cdmesh, const stk::mesh::Selector & interfaceSideSelector)
+{
+  // Not exactly cheap
+  const stk::mesh::BulkData & mesh = cdmesh.stk_bulk();
+  const stk::mesh::Selector elementSelector = selectUnion(cdmesh.get_phase_support().get_conformal_parts()) & cdmesh.get_active_part() & cdmesh.get_locally_owned_part();
+
+  std::vector<stk::mesh::Entity> volumeElements;
+  for( auto&& bucket : mesh.get_buckets(mesh.mesh_meta_data().side_rank(), interfaceSideSelector) )
+  {
+    for (auto && side : *bucket)
+    {
+      for (auto elem : StkMeshEntities{mesh.begin_elements(side), mesh.end_elements(side)})
+      {
+        if (elementSelector(mesh.bucket(elem)))
+        {
+          stk::mesh::Entity volumeElement = cdmesh.get_cdfem_support().use_nonconformal_element_size() ? cdmesh.get_parent_element(elem) : elem;
+          volumeElements.push_back(volumeElement);
+        }
+      }
+    }
+  }
+  stk::util::sort_and_unique(volumeElements);
+  return volumeElements;
+}
+
+double compute_L1_norm_of_side_length_scales(const CDMesh & cdmesh, const stk::mesh::Selector & interfaceSideSelector)
+{
+  const std::vector<stk::mesh::Entity> elementsInNorm = get_unique_owned_volume_elements_using_sides(cdmesh, interfaceSideSelector);
+
+  const double invDim = 1.0 / cdmesh.spatial_dim();
+
+  double sumLengths = 0.;
+  for (auto elem : elementsInNorm)
+  {
+    const double elemVolume = ElementObj::volume( cdmesh.stk_bulk(), elem, cdmesh.get_coords_field() );
+    sumLengths += std::pow(elemVolume, invDim);
+  }
+
+  const double sumCount = elementsInNorm.size();
+
+  const std::array<double,2> localSum{sumLengths, sumCount};
+  std::array<double,2> globalSum;
+  stk::all_reduce_sum(cdmesh.stk_bulk().parallel(), localSum.data(), globalSum.data(), localSum.size());
+  return globalSum[0]/globalSum[1];
 }
 
 Vector3d get_side_average_of_vector(const stk::mesh::BulkData& mesh,
@@ -2998,59 +3134,19 @@ std::function<Vector3d(stk::mesh::Entity)> build_get_side_displacement_from_velo
   return get_element_size;
 }
 
-Vector3d get_side_normal(const stk::mesh::BulkData& mesh,
-    const FieldRef coordsField,
-    stk::mesh::Entity side)
-{
-  const auto * sideNodes = mesh.begin_nodes(side);
-  const stk::topology sideTopology = mesh.bucket(side).topology();
-  if (sideTopology == stk::topology::TRIANGLE_3 || sideTopology == stk::topology::TRIANGLE_6)
-  {
-    const Vector3d v0(field_data<double>(coordsField, sideNodes[0]));
-    const Vector3d v1(field_data<double>(coordsField, sideNodes[1]));
-    const Vector3d v2(field_data<double>(coordsField, sideNodes[2]));
-    return Cross(v1-v0,v2-v0).unit_vector();
-  }
-  else if (sideTopology == stk::topology::LINE_2 || sideTopology == stk::topology::LINE_3)
-  {
-    const Vector3d v0(field_data<double>(coordsField, sideNodes[0]), 2);
-    const Vector3d v1(field_data<double>(coordsField, sideNodes[1]), 2);
-    return crossZ(v1-v0).unit_vector();
-  }
-  ThrowRequireMsg(false, "Unsupported topology " << sideTopology);
-
-  return Vector3d::ZERO;
-}
-
 double get_side_cdfem_cfl(const stk::mesh::BulkData& mesh,
     const FieldRef coordsField,
-    const stk::mesh::Selector & elementSelector,
     const std::function<Vector3d(stk::mesh::Entity)> & get_side_displacement,
-    const std::function<double(stk::mesh::Entity)> & get_element_volume,
+    const std::function<double(stk::mesh::Entity)> & get_length_scale_for_side,
     stk::mesh::Entity side)
 {
   const Vector3d sideCDFEMDisplacement = get_side_displacement(side);
   const Vector3d sideNormal = get_side_normal(mesh, coordsField, side);
   const double sideNormalDisplacement = Dot(sideCDFEMDisplacement, sideNormal);
 
-  double minElemVolume = 0.;
-  for (auto elem : StkMeshEntities{mesh.begin_elements(side), mesh.end_elements(side)})
-  {
-    if (elementSelector(mesh.bucket(elem)))
-    {
-      const double elemVol = get_element_volume(elem);
-      if (minElemVolume == 0. || elemVol < minElemVolume)
-        minElemVolume = elemVol;
-    }
-  }
-  double sideCFL = 0.;
-  if (minElemVolume > 0.)
-  {
-    const double invDim = 1.0 / mesh.mesh_meta_data().spatial_dimension();
-    const double lengthScale = std::pow(minElemVolume, invDim);
-    sideCFL = sideNormalDisplacement / lengthScale;
-  }
-  return sideCFL;
+  const double sideLengthScale = get_length_scale_for_side(side);
+
+  return (sideLengthScale == 0.) ? 0. : sideNormalDisplacement/sideLengthScale;
 }
 
 double CDMesh::compute_cdfem_cfl(const std::function<Vector3d(stk::mesh::Entity)> & get_side_displacement) const
@@ -3058,16 +3154,30 @@ double CDMesh::compute_cdfem_cfl(const std::function<Vector3d(stk::mesh::Entity)
   stk::diag::TimeBlock timer__(my_timer_compute_CFL);
 
   const stk::mesh::Selector interfaceSideSelector = my_phase_support.get_all_conformal_surfaces_selector();
-  const stk::mesh::Selector elementSelector = selectUnion(my_phase_support.get_conformal_parts()) & get_active_part() & get_locally_owned_part();
 
-  auto get_element_volume = build_get_element_volume_function(*this);
+  std::function<double(stk::mesh::Entity)> get_length_scale_for_side;
+  if (my_cdfem_support.get_length_scale_type_for_interface_CFL() == CONSTANT_LENGTH_SCALE)
+  {
+    get_length_scale_for_side = build_get_constant_length_scale_for_side_function(my_cdfem_support.get_constant_length_scale_for_interface_CFL());
+  }
+  else if (my_cdfem_support.get_length_scale_type_for_interface_CFL() == LOCAL_LENGTH_SCALE)
+  {
+    get_length_scale_for_side = build_get_local_length_scale_for_side_function(*this);
+  }
+  else
+  {
+    ThrowRequire(my_cdfem_support.get_length_scale_type_for_interface_CFL() == L1_NORM_LENGTH_SCALE);
+    const double lengthScaleNorm = compute_L1_norm_of_side_length_scales(*this, interfaceSideSelector);
+    krinolog << "Using L1 Norm length scale " << lengthScaleNorm << " to compute Interface CFL." << stk::diag::dendl;
+    get_length_scale_for_side = build_get_constant_length_scale_for_side_function(lengthScaleNorm);
+  }
 
   double cfl = 0.;
   for( auto&& bucket : stk_bulk().get_buckets(stk_bulk().mesh_meta_data().side_rank(), interfaceSideSelector) )
   {
     for (auto && side : *bucket)
     {
-      const double sideCFL = get_side_cdfem_cfl(stk_bulk(), get_coords_field(), elementSelector, get_side_displacement, get_element_volume, side);
+      const double sideCFL = get_side_cdfem_cfl(stk_bulk(), get_coords_field(), get_side_displacement, get_length_scale_for_side, side);
       if (sideCFL > 0.)
         cfl = std::max(cfl, sideCFL);
     }
@@ -3242,7 +3352,9 @@ CDMesh::create_element_and_side_entities(std::vector<SideRequest> & side_request
     {
       std::vector<const SubElement *> conformal_subelems;
       elem->get_subelements(conformal_subelems);
-      num_local_subelems += conformal_subelems.size();
+      for (auto && subelem : conformal_subelems)
+        if (0 == subelem->entityId())
+          ++num_local_subelems;
     }
   }
 
diff --git a/packages/krino/krino/krino_lib/Akri_CDMesh.hpp b/packages/krino/krino/krino_lib/Akri_CDMesh.hpp
index 7a702be5cd7f..bb285b19dc75 100644
--- a/packages/krino/krino/krino_lib/Akri_CDMesh.hpp
+++ b/packages/krino/krino/krino_lib/Akri_CDMesh.hpp
@@ -281,6 +281,7 @@ class CDMesh {
   const SubElementNode * build_subelement_edge_node(const stk::mesh::Entity node, const Mesh_Element & ownerMeshElem, std::map<stk::mesh::EntityId, const SubElementNode*> & idToSubElementNode);
   const SubElementNode * find_or_build_subelement_edge_node_with_id(const stk::mesh::EntityId nodeId, const Mesh_Element & ownerMeshElem, std::map<stk::mesh::EntityId, const SubElementNode*> & idToSubElementNode);
   const SubElementNode * find_or_build_subelement_edge_node(const stk::mesh::Entity node, const Mesh_Element & ownerMeshElem, std::map<stk::mesh::EntityId, const SubElementNode*> & idToSubElementNode);
+  void find_or_build_midside_nodes(const stk::topology & elemTopo, const Mesh_Element & ownerMeshElem, const stk::mesh::Entity * elemNodes, const NodeVec & subelemNodes);
 
   stk::mesh::MetaData& my_meta;
   AuxMetaData& my_aux_meta;
diff --git a/packages/krino/krino/krino_lib/Akri_CDMesh_Debug.cpp b/packages/krino/krino/krino_lib/Akri_CDMesh_Debug.cpp
index eccd3249c341..46368b0288a2 100644
--- a/packages/krino/krino/krino_lib/Akri_CDMesh_Debug.cpp
+++ b/packages/krino/krino/krino_lib/Akri_CDMesh_Debug.cpp
@@ -128,6 +128,12 @@ debug_elem_parts_and_relations(const stk::mesh::BulkData & mesh, const Mesh_Elem
   }
 }
 
+static double filter_negative_zero(const double val)
+{
+  if (val == 0.) return 0.;
+  return val;
+}
+
 void
 debug_nodal_parts_and_fields(const stk::mesh::BulkData & mesh, const SubElementNode * node)
 {
@@ -176,13 +182,13 @@ debug_nodal_parts_and_fields(const stk::mesh::BulkData & mesh, const SubElementN
     {
       if (1 == field_length)
       {
-        krinolog << "  Field: field_name=" << field.name() << ", field_state=" << field.state() << ", value=" << *data << "\n";
+        krinolog << "  Field: field_name=" << field.name() << ", field_state=" << field.state() << ", value=" << filter_negative_zero(*data) << "\n";
       }
       else
       {
         for (unsigned i=0; i<field_length; ++i)
         {
-          krinolog << "  Field: field_name=" << field.name() << ", field_state=" << field.state() << ", value[" <<i << "]=" << data[i] << "\n";
+          krinolog << "  Field: field_name=" << field.name() << ", field_state=" << field.state() << ", value[" <<i << "]=" << filter_negative_zero(data[i]) << "\n";
         }
       }
     }
diff --git a/packages/krino/krino/krino_lib/Akri_CDMesh_Utils.cpp b/packages/krino/krino/krino_lib/Akri_CDMesh_Utils.cpp
index 08575912c340..b6054e8c140b 100644
--- a/packages/krino/krino/krino_lib/Akri_CDMesh_Utils.cpp
+++ b/packages/krino/krino/krino_lib/Akri_CDMesh_Utils.cpp
@@ -40,34 +40,37 @@ static stk::mesh::Part * get_nonconformal_part(const Phase_Support & phaseSuppor
   return const_cast<stk::mesh::Part *>(phaseSupport.find_nonconformal_part(*part));
 }
 
-static bool is_part_to_check(const Phase_Support & phaseSupport, const AuxMetaData & auxMeta, const stk::mesh::Part & part)
+bool is_part_to_check_for_snapping_compatibility(const Phase_Support & phaseSupport, const AuxMetaData & auxMeta, const stk::mesh::EntityRank targetRank, const stk::mesh::Part & part)
 {
   const stk::mesh::Part & exposedBoundaryPart = auxMeta.exposed_boundary_part();
-  return part.primary_entity_rank() != stk::topology::INVALID_RANK &&
-    (&part == &exposedBoundaryPart || stk::io::is_part_io_part(part)) &&
+  return part.primary_entity_rank() == targetRank &&
+    (&part == &exposedBoundaryPart || stk::io::is_part_io_part(part) || phaseSupport.is_nonconformal(&part)) &&
     part.name().compare(0,7,"refine_") != 0 &&
     !phaseSupport.is_interface(&part);
 }
 
-static stk::mesh::PartVector get_nonconformal_parts_to_check(const AuxMetaData & auxMeta, const Phase_Support & phaseSupport, const stk::mesh::PartVector & inputParts)
+static stk::mesh::PartVector get_nonconformal_parts_to_check(const stk::mesh::BulkData & mesh, const AuxMetaData & auxMeta, const Phase_Support & phaseSupport, const stk::mesh::EntityRank targetRank, const std::vector<stk::mesh::Entity> & targetEntities)
 {
   stk::mesh::PartVector partsToCheck;
-  partsToCheck.reserve(inputParts.size());
-  for (auto && part : inputParts)
-    if (is_part_to_check(phaseSupport, auxMeta, *part))
-      partsToCheck.push_back(get_nonconformal_part(phaseSupport, part));
+  for (auto && targetEntity : targetEntities)
+    for (auto && part : mesh.bucket(targetEntity).supersets())
+      if (is_part_to_check_for_snapping_compatibility(phaseSupport, auxMeta, targetRank, *part))
+        partsToCheck.push_back(get_nonconformal_part(phaseSupport, part));
   stk::util::sort_and_unique(partsToCheck, stk::mesh::PartLess());
   return partsToCheck;
 }
 
 bool
-parts_are_compatible_for_snapping_when_ignoring_phase(const stk::mesh::BulkData & mesh, const AuxMetaData & auxMeta, const Phase_Support & phaseSupport, stk::mesh::Entity possibleSnapNode, stk::mesh::Entity fixedNode)
+parts_are_compatible_for_snapping_when_ignoring_phase(const stk::mesh::BulkData & mesh,
+    const AuxMetaData & auxMeta,
+    const Phase_Support & phaseSupport,
+    const stk::mesh::Entity possibleSnapNode,
+    const stk::mesh::EntityRank targetRank,
+    const stk::mesh::PartVector & nonconformalPartsToCheck)
 {
-  const stk::mesh::PartVector & possibleSnapNodeParts = mesh.bucket(possibleSnapNode).supersets();
-  const stk::mesh::PartVector nonconformalPartsToCheck = get_nonconformal_parts_to_check(auxMeta, phaseSupport, mesh.bucket(fixedNode).supersets());
-  for (auto && possibleSnapNodePart : possibleSnapNodeParts)
+  for (auto && possibleSnapNodePart : mesh.bucket(possibleSnapNode).supersets())
   {
-    if (is_part_to_check(phaseSupport, auxMeta, *possibleSnapNodePart))
+    if (is_part_to_check_for_snapping_compatibility(phaseSupport, auxMeta, targetRank, *possibleSnapNodePart))
     {
       stk::mesh::Part * nonconformalPart = get_nonconformal_part(phaseSupport, possibleSnapNodePart);
       if (!stk::mesh::contain(nonconformalPartsToCheck, *nonconformalPart))
@@ -77,6 +80,40 @@ parts_are_compatible_for_snapping_when_ignoring_phase(const stk::mesh::BulkData
   return true;
 }
 
+static stk::topology get_simplex_element_topology(const stk::mesh::BulkData & mesh)
+{
+  return ((mesh.mesh_meta_data().spatial_dimension() == 2) ? stk::topology::TRIANGLE_3_2D : stk::topology::TETRAHEDRON_4);
+}
+
+static void fill_topology_entities(const stk::mesh::BulkData & mesh, const stk::topology & topology, const std::vector<stk::mesh::Entity> & nodes, std::vector<stk::mesh::Entity> & topologyEntities)
+{
+  topologyEntities.clear();
+  if (nodes.size() <= topology.num_nodes())
+  {
+    stk::mesh::get_entities_through_relations(mesh, nodes, topology.rank(), topologyEntities);
+  }
+}
+
+std::vector<bool> which_intersection_point_nodes_are_compatible_for_snapping(const stk::mesh::BulkData & mesh, const AuxMetaData & auxMeta, const Phase_Support & phaseSupport, const std::vector<stk::mesh::Entity> & intersectionPointNodes)
+{
+  std::vector<bool> areIntersectionPointsCompatibleForSnapping(intersectionPointNodes.size(),true);
+  std::vector<stk::mesh::Entity> topologyEntities;
+  stk::topology elemTopology = get_simplex_element_topology(mesh);
+  std::array<stk::topology,2> sideAndElementTopology{{elemTopology.side_topology(), elemTopology}};
+  for (stk::topology topo : sideAndElementTopology)
+  {
+    fill_topology_entities(mesh, topo, intersectionPointNodes, topologyEntities);
+    const stk::mesh::PartVector nonconformalPartsToCheck = get_nonconformal_parts_to_check(mesh, auxMeta, phaseSupport, topo.rank(), topologyEntities);
+    for(size_t iNode=0; iNode<intersectionPointNodes.size(); ++iNode)
+    {
+      areIntersectionPointsCompatibleForSnapping[iNode] =
+          areIntersectionPointsCompatibleForSnapping[iNode] &&
+          parts_are_compatible_for_snapping_when_ignoring_phase(mesh, auxMeta, phaseSupport, intersectionPointNodes[iNode], topo.rank(), nonconformalPartsToCheck);
+    }
+  }
+  return areIntersectionPointsCompatibleForSnapping;
+}
+
 bool phase_matches_interface(const bool oneLSPerPhase, const std::vector<Surface_Identifier> & surfaceIDs, const PhaseTag & phase, const InterfaceID interface)
 {
   if(surfaceIDs.size() > 1 && oneLSPerPhase)
diff --git a/packages/krino/krino/krino_lib/Akri_CDMesh_Utils.hpp b/packages/krino/krino/krino_lib/Akri_CDMesh_Utils.hpp
index d04d40168f2f..2dfb18d8462f 100644
--- a/packages/krino/krino/krino_lib/Akri_CDMesh_Utils.hpp
+++ b/packages/krino/krino/krino_lib/Akri_CDMesh_Utils.hpp
@@ -19,8 +19,10 @@ class AuxMetaData;
 class Phase_Support;
 class Surface_Identifier;
 
+bool is_part_to_check_for_snapping_compatibility(const Phase_Support & phaseSupport, const AuxMetaData & auxMeta, const stk::mesh::EntityRank targetRank, const stk::mesh::Part & part);
 bool parts_are_compatible_for_snapping(const stk::mesh::BulkData & mesh, stk::mesh::Entity possible_snap_node, stk::mesh::Entity fixed_node);
-bool parts_are_compatible_for_snapping_when_ignoring_phase(const stk::mesh::BulkData & mesh, const AuxMetaData & auxMeta, const Phase_Support & phaseSupport, stk::mesh::Entity possible_snap_node, stk::mesh::Entity fixed_node);
+std::vector<bool> which_intersection_point_nodes_are_compatible_for_snapping(const stk::mesh::BulkData & mesh, const AuxMetaData & auxMeta, const Phase_Support & phaseSupport, const std::vector<stk::mesh::Entity> & intersectionPointNodes);
+bool parts_are_compatible_for_snapping_when_ignoring_phase(const stk::mesh::BulkData & mesh, const AuxMetaData & auxMeta, const Phase_Support & phaseSupport, const stk::mesh::Entity possibleSnapNode, const stk::mesh::EntityRank targetRank, const std::vector<stk::mesh::Entity> & targetEntities);
 bool phase_matches_interface(const bool oneLSPerPhase, const std::vector<Surface_Identifier> & surfaceIDs, const PhaseTag & phase, const InterfaceID interface);
 bool determine_phase_from_parts(PhaseTag & phase, const stk::mesh::PartVector & parts, const Phase_Support & phaseSupport);
 PhaseTag determine_phase_for_entity(const stk::mesh::BulkData & mesh, stk::mesh::Entity entity, const Phase_Support & phaseSupport);
diff --git a/packages/krino/krino/krino_lib/Akri_CramersRuleSolver.cpp b/packages/krino/krino/krino_lib/Akri_CramersRuleSolver.cpp
new file mode 100644
index 000000000000..b4d9651048c1
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_CramersRuleSolver.cpp
@@ -0,0 +1,139 @@
+// Copyright 2002 - 2008, 2010, 2011 National Technology Engineering
+// Solutions of Sandia, LLC (NTESS). Under the terms of Contract
+// DE-NA0003525 with NTESS, the U.S. Government retains certain rights
+// in this software.
+//
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+#include "Akri_CramersRuleSolver.hpp"
+#include <array>
+#include <stk_util/util/ReportHandler.hpp>
+
+
+namespace krino {
+namespace CramersRuleSolver {
+
+std::array<double,3> solve3x3(
+        double a11, double a12, double a13,
+        double a21, double a22, double a23,
+        double a31, double a32, double a33,
+        double k1,  double k2,  double k3 )
+{
+    double det = compute_determinant3x3( a11, a12, a13, a21, a22, a23, a31, a32, a33 );
+
+    ThrowRequireMsg(det != 0.0, "Bad determinant.  Are the points really unique?");
+
+    std::array<double,3> answer;
+
+    answer[0] = compute_determinant3x3( k1,  a12, a13,  k2, a22, a23,  k3, a32, a33 )/det;
+    answer[1] = compute_determinant3x3( a11,  k1, a13, a21,  k2, a23, a31,  k3, a33 )/det;
+    answer[2] = compute_determinant3x3( a11, a12,  k1, a21, a22,  k2, a31, a32,  k3 )/det;
+    return( answer );
+}
+
+std::array<double,3> solve3x3(const std::array<std::array<double,3>,3> &A, std::array<double,3> & b)
+{
+    return solve3x3(A[0][0], A[0][1], A[0][2], A[1][0], A[1][1], A[1][2], A[2][0], A[2][1], A[2][2], b[0], b[1], b[2]);
+}
+
+std::array<double,5> solve5x5(
+        double a11, double a12, double a13, double a14, double a15,
+        double a21, double a22, double a23, double a24, double a25,
+        double a31, double a32, double a33, double a34, double a35,
+        double a41, double a42, double a43, double a44, double a45,
+        double a51, double a52, double a53, double a54, double a55,
+        double k1,  double k2,  double k3,  double k4,  double k5 )
+{
+    const double det = compute_determinant5x5(
+        a11, a12, a13, a14, a15,
+        a21, a22, a23, a24, a25,
+        a31, a32, a33, a34, a35,
+        a41, a42, a43, a44, a45,
+        a51, a52, a53, a54, a55 );
+
+    ThrowRequireMsg(det != 0.0, "Bad determinant.  Are the points really unique?");
+
+    std::array<double,5> answer;
+    answer[0] = compute_determinant5x5(
+        k1, a12, a13, a14, a15,
+        k2, a22, a23, a24, a25,
+        k3, a32, a33, a34, a35,
+        k4, a42, a43, a44, a45,
+        k5, a52, a53, a54, a55)/det;
+    answer[1] = compute_determinant5x5(
+        a11, k1, a13, a14, a15,
+        a21, k2, a23, a24, a25,
+        a31, k3, a33, a34, a35,
+        a41, k4, a43, a44, a45,
+        a51, k5, a53, a54, a55)/det;
+    answer[2] = compute_determinant5x5(
+        a11, a12, k1, a14, a15,
+        a21, a22, k2, a24, a25,
+        a31, a32, k3, a34, a35,
+        a41, a42, k4, a44, a45,
+        a51, a52, k5, a54, a55)/det;
+    answer[3] = compute_determinant5x5(
+        a11, a12, a13, k1, a15,
+        a21, a22, a23, k2, a25,
+        a31, a32, a33, k3, a35,
+        a41, a42, a43, k4, a45,
+        a51, a52, a53, k5, a55)/det;
+    answer[4] = compute_determinant5x5(
+        a11, a12, a13, a14, k1,
+        a21, a22, a23, a24, k2,
+        a31, a32, a33, a34, k3,
+        a41, a42, a43, a44, k4,
+        a51, a52, a53, a54, k5)/det;
+    return( answer );
+}
+
+std::array<double,5> solve5x5(const std::array<std::array<double,5>,5> &A, std::array<double,5> & b)
+{
+    return solve5x5(
+        A[0][0], A[0][1], A[0][2], A[0][3], A[0][4],
+        A[1][0], A[1][1], A[1][2], A[1][3], A[1][4],
+        A[2][0], A[2][1], A[2][2], A[2][3], A[2][4],
+        A[3][0], A[3][1], A[3][2], A[3][3], A[3][4],
+        A[4][0], A[4][1], A[4][2], A[4][3], A[4][4],
+        b[0], b[1], b[2], b[3], b[4]);
+}
+
+
+double compute_determinant3x3(
+        double a11, double a12, double a13,
+        double a21, double a22, double a23,
+        double a31, double a32, double a33 )
+{
+    return( a11*a22*a33 + a12*a23*a31 + a13*a21*a32 -
+            a13*a22*a31 - a12*a21*a33 - a11*a23*a32 );
+}
+
+double compute_determinant4x4(
+        double a11, double a12, double a13, double a14,
+        double a21, double a22, double a23, double a24,
+        double a31, double a32, double a33, double a34,
+        double a41, double a42, double a43, double a44 )
+{
+    return( a11*compute_determinant3x3(a22, a23, a24, a32, a33, a34, a42, a43, a44) -
+            a12*compute_determinant3x3(a21, a23, a24, a31, a33, a34, a41, a43, a44) +
+            a13*compute_determinant3x3(a21, a22, a24, a31, a32, a34, a41, a42, a44) -
+            a14*compute_determinant3x3(a21, a22, a23, a31, a32, a33, a41, a42, a43));
+}
+
+double compute_determinant5x5(
+        double a11, double a12, double a13, double a14, double a15,
+        double a21, double a22, double a23, double a24, double a25,
+        double a31, double a32, double a33, double a34, double a35,
+        double a41, double a42, double a43, double a44, double a45,
+        double a51, double a52, double a53, double a54, double a55 )
+{
+    return( a11*compute_determinant4x4(a22, a23, a24, a25, a32, a33, a34, a35, a42, a43, a44, a45, a52, a53, a54, a55 ) -
+            a12*compute_determinant4x4(a21, a23, a24, a25, a31, a33, a34, a35, a41, a43, a44, a45, a51, a53, a54, a55 ) +
+            a13*compute_determinant4x4(a21, a22, a24, a25, a31, a32, a34, a35, a41, a42, a44, a45, a51, a52, a54, a55 ) -
+            a14*compute_determinant4x4(a21, a22, a23, a25, a31, a32, a33, a35, a41, a42, a43, a45, a51, a52, a53, a55 ) +
+            a15*compute_determinant4x4(a21, a22, a23, a24, a31, a32, a33, a34, a41, a42, a43, a44, a51, a52, a53, a54 ));
+}
+
+} // namespace CramersRuleSolver
+} // namespace krino
diff --git a/packages/krino/krino/krino_lib/Akri_CramersRuleSolver.hpp b/packages/krino/krino/krino_lib/Akri_CramersRuleSolver.hpp
new file mode 100644
index 000000000000..8d8634566f7b
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_CramersRuleSolver.hpp
@@ -0,0 +1,56 @@
+// Copyright 2002 - 2008, 2010, 2011 National Technology Engineering
+// Solutions of Sandia, LLC (NTESS). Under the terms of Contract
+// DE-NA0003525 with NTESS, the U.S. Government retains certain rights
+// in this software.
+//
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+#ifndef KRINO_KRINO_KRINO_LIB_AKRI_CRAMERSRULESOLVER_HPP_
+#define KRINO_KRINO_KRINO_LIB_AKRI_CRAMERSRULESOLVER_HPP_
+#include <array>
+
+
+namespace krino {
+namespace CramersRuleSolver {
+
+std::array<double,3> solve3x3(
+        double a11, double a12, double a13,
+        double a21, double a22, double a23,
+        double a31, double a32, double a33,
+        double k1,  double k2,  double k3 );
+
+std::array<double,3> solve3x3(const std::array<std::array<double,3>,3> &A, std::array<double,3> & b);
+
+std::array<double,5> solve5x5(
+        double a11, double a12, double a13, double a14, double a15,
+        double a21, double a22, double a23, double a24, double a25,
+        double a31, double a32, double a33, double a34, double a35,
+        double a41, double a42, double a43, double a44, double a45,
+        double a51, double a52, double a53, double a54, double a55,
+        double k1,  double k2,  double k3,  double k4,  double k5 );
+
+std::array<double,5> solve5x5(const std::array<std::array<double,5>,5> &A, std::array<double,5> & b);
+
+double compute_determinant3x3(
+        double a11, double a12, double a13,
+        double a21, double a22, double a23,
+        double a31, double a32, double a33 );
+
+double compute_determinant4x4(
+        double a11, double a12, double a13, double a14,
+        double a21, double a22, double a23, double a24,
+        double a31, double a32, double a33, double a34,
+        double a41, double a42, double a43, double a44 );
+
+double compute_determinant5x5(
+        double a11, double a12, double a13, double a14, double a15,
+        double a21, double a22, double a23, double a24, double a25,
+        double a31, double a32, double a33, double a34, double a35,
+        double a41, double a42, double a43, double a44, double a45,
+        double a51, double a52, double a53, double a54, double a55 );
+
+} // namespace CramersRuleSolver
+} // namespace krino
+
+#endif /* KRINO_KRINO_KRINO_LIB_AKRI_CRAMERSRULESOLVER_HPP_ */
diff --git a/packages/krino/krino/krino_lib/Akri_CurvatureLeastSquares.cpp b/packages/krino/krino/krino_lib/Akri_CurvatureLeastSquares.cpp
new file mode 100644
index 000000000000..21046c6cc4bf
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_CurvatureLeastSquares.cpp
@@ -0,0 +1,284 @@
+// Copyright 2002 - 2008, 2010, 2011 National Technology Engineering
+// Solutions of Sandia, LLC (NTESS). Under the terms of Contract
+// DE-NA0003525 with NTESS, the U.S. Government retains certain rights
+// in this software.
+//
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+#include <vector>
+
+#include <stk_util/util/SortAndUnique.hpp>
+#include "Akri_CramersRuleSolver.hpp"
+#include "Akri_Vec.hpp"
+
+namespace krino {
+
+static std::vector<int> get_unique_halo_nodes(const std::vector<std::array<int,2>> & haloSegments)
+{
+  std::vector<int> uniqueHaloNodes;
+  for (auto && haloSegment : haloSegments)
+  {
+    uniqueHaloNodes.push_back(haloSegment[0]);
+    uniqueHaloNodes.push_back(haloSegment[1]);
+  }
+
+  stk::util::sort_and_unique(uniqueHaloNodes);
+
+  return uniqueHaloNodes;
+}
+
+void set_rotation_matrix_for_rotating_normal_to_zDir(std::array<std::array<double,3>,3> & m, const Vector3d & normalDir)
+{
+  const Vector3d normal = normalDir.unit_vector();
+  static const Vector3d zDir(0.,0.,1.);
+  const double c = Dot(zDir, normal);
+  Vector3d v = Cross(normal, zDir);
+  const double s = v.length();
+  if (s > 0.) v *= (1./s);
+
+  const double c1 = 1.-c;
+
+  m[0][0] = c + v[0]*v[0]*c1;
+  m[0][1] = v[0]*v[1]*c1 - v[2]*s;
+  m[0][2] = v[0]*v[2]*c1 + v[1]*s;
+  m[1][0] = v[1]*v[0]*c1 + v[2]*s;
+  m[1][1] = c + v[1]*v[1]*(1.-c);
+  m[1][2] = v[1]*v[2]*c1 - v[0]*s;
+  m[2][0] = v[2]*v[0]*c1 - v[1]*s;
+  m[2][1] = v[2]*v[1]*c1 + v[0]*s;
+  m[2][2] = c + v[2]*v[2]*c1;
+}
+
+Vector3d compute_patch_normal(const std::vector<Vector3d> & haloNodeLocs, const std::vector<std::array<int,2>> & haloSegments)
+{
+  Vector3d patchNormal = Vector3d::ZERO;
+  for (auto && haloSegment : haloSegments)
+  {
+    const stk::math::Vector3d & xc0 = haloNodeLocs[haloSegment[0]];
+    const stk::math::Vector3d & xc1 = haloNodeLocs[haloSegment[1]];
+    const stk::math::Vector3d wtNormal = Cross(xc0, xc1) / (xc0.length_squared()*xc1.length_squared());
+    patchNormal += wtNormal;
+  }
+
+  return patchNormal.unit_vector();
+}
+
+static void fill_matrix_and_rhs_for_curvature_least_squares(const std::vector<Vector3d> & rotatedUniqueHaloNodeLocs, std::array<std::array<double,3>,3> & A, std::array<double,3> & b)
+{
+  if (rotatedUniqueHaloNodeLocs.size() == 3)
+  {
+    for (int i=0; i<3; ++i)
+    {
+      A[i][0] = rotatedUniqueHaloNodeLocs[i][0]*rotatedUniqueHaloNodeLocs[i][0];
+      A[i][1] = rotatedUniqueHaloNodeLocs[i][0]*rotatedUniqueHaloNodeLocs[i][1];
+      A[i][2] = rotatedUniqueHaloNodeLocs[i][1]*rotatedUniqueHaloNodeLocs[i][1];
+      b[i] = rotatedUniqueHaloNodeLocs[i][2];
+    }
+  }
+  else
+  {
+    ThrowRequireMsg(rotatedUniqueHaloNodeLocs.size() == 4, "Unexpected vector size in fill_matrix_and_rhs_for_curvature_least_squares.");
+    std::array<std::array<double,3>,4> Apts;
+    for (int i=0; i<4; ++i)
+    {
+      Apts[i][0] = rotatedUniqueHaloNodeLocs[i][0]*rotatedUniqueHaloNodeLocs[i][0];
+      Apts[i][1] = rotatedUniqueHaloNodeLocs[i][0]*rotatedUniqueHaloNodeLocs[i][1];
+      Apts[i][2] = rotatedUniqueHaloNodeLocs[i][1]*rotatedUniqueHaloNodeLocs[i][1];
+    }
+
+    for (int i=0; i<3; ++i)
+    {
+      b[i] = 0.;
+      for (int k=0; k<4; ++k)
+        b[i] += Apts[k][i] * rotatedUniqueHaloNodeLocs[k][2];
+
+      for (int j=0; j<3; ++j)
+      {
+        A[i][j] = 0.;
+        for (int k=0; k<4; ++k)
+          A[i][j] += Apts[k][j]*Apts[k][i];
+      }
+    }
+  }
+}
+
+static void fill_matrix_and_rhs_for_curvature_normal_least_squares(const std::vector<Vector3d> & rotatedUniqueHaloNodeLocs, std::array<std::array<double,5>,5> & A, std::array<double,5> & b)
+{
+  if (rotatedUniqueHaloNodeLocs.size() == 5)
+  {
+    for (int i=0; i<5; ++i)
+    {
+      A[i][0] = rotatedUniqueHaloNodeLocs[i][0]*rotatedUniqueHaloNodeLocs[i][0];
+      A[i][1] = rotatedUniqueHaloNodeLocs[i][0]*rotatedUniqueHaloNodeLocs[i][1];
+      A[i][2] = rotatedUniqueHaloNodeLocs[i][1]*rotatedUniqueHaloNodeLocs[i][1];
+      A[i][3] = rotatedUniqueHaloNodeLocs[i][0];
+      A[i][4] = rotatedUniqueHaloNodeLocs[i][1];
+      b[i] = rotatedUniqueHaloNodeLocs[i][2];
+    }
+  }
+  else
+  {
+    std::vector<std::array<double,5>> Apts;
+    Apts.resize(rotatedUniqueHaloNodeLocs.size());
+    for (unsigned i=0; i<Apts.size(); ++i)
+    {
+      Apts[i][0] = rotatedUniqueHaloNodeLocs[i][0]*rotatedUniqueHaloNodeLocs[i][0];
+      Apts[i][1] = rotatedUniqueHaloNodeLocs[i][0]*rotatedUniqueHaloNodeLocs[i][1];
+      Apts[i][2] = rotatedUniqueHaloNodeLocs[i][1]*rotatedUniqueHaloNodeLocs[i][1];
+      Apts[i][3] = rotatedUniqueHaloNodeLocs[i][0];
+      Apts[i][4] = rotatedUniqueHaloNodeLocs[i][1];
+    }
+
+    for (unsigned i=0; i<5; ++i)
+    {
+      b[i] = 0.;
+      for (unsigned k=0; k<Apts.size(); ++k)
+        b[i] += Apts[k][i] * rotatedUniqueHaloNodeLocs[k][2];
+
+      for (unsigned j=0; j<5; ++j)
+      {
+        A[i][j] = 0.;
+        for (unsigned k=0; k<Apts.size(); ++k)
+          A[i][j] += Apts[k][j]*Apts[k][i];
+      }
+    }
+  }
+}
+
+static Vector3d compute_least_squares_curvature_times_normal(const std::vector<Vector3d> & rotatedUniqueHaloNodeLocs)
+{
+  if (rotatedUniqueHaloNodeLocs.size() == 3 || rotatedUniqueHaloNodeLocs.size() == 4)
+  {
+    std::array<std::array<double,3>,3> A;
+    std::array<double,3> b;
+    fill_matrix_and_rhs_for_curvature_least_squares(rotatedUniqueHaloNodeLocs, A, b);
+
+    const std::array<double,3> soln = CramersRuleSolver::solve3x3(A,b);
+
+    return Vector3d(0., 0., -2.*soln[0]-2.*soln[2]);
+  }
+  else if (rotatedUniqueHaloNodeLocs.size() >= 5)
+  {
+    std::array<std::array<double,5>,5> A;
+    std::array<double,5> b;
+    fill_matrix_and_rhs_for_curvature_normal_least_squares(rotatedUniqueHaloNodeLocs, A, b);
+
+    const std::array<double,5> soln = CramersRuleSolver::solve5x5(A,b);
+
+    Vector3d normal(-soln[3],-soln[4],1.);
+    const double mag = normal.unitize();
+
+    const double curvature =
+        ((normal[0]*normal[0] - 1.) * 2.*soln[0] +
+          normal[0]*normal[1] * 2.*soln[1] +
+         (normal[1]*normal[1] - 1.) * 2.*soln[2]) / mag;
+
+    return curvature*normal;
+  }
+
+  return Vector3d::ZERO;
+}
+
+static Vector3d compute_least_squares_normal(const std::vector<Vector3d> & rotatedUniqueHaloNodeLocs)
+{
+  ThrowRequire(rotatedUniqueHaloNodeLocs.size() >= 5);
+
+  std::array<std::array<double,5>,5> A;
+  std::array<double,5> b;
+  fill_matrix_and_rhs_for_curvature_normal_least_squares(rotatedUniqueHaloNodeLocs, A, b);
+
+  const std::array<double,5> soln = CramersRuleSolver::solve5x5(A,b);
+
+  Vector3d normal(-soln[3],-soln[4],1.);
+  normal.unitize();
+
+  return normal;
+}
+
+Vector3d rotate_3d_vector(const std::array<std::array<double,3>,3> & m, const Vector3d & v)
+{
+  return Vector3d(
+    (m[0][0] * v[0] + m[0][1] * v[1] + m[0][2] * v[2]),
+    (m[1][0] * v[0] + m[1][1] * v[1] + m[1][2] * v[2]),
+    (m[2][0] * v[0] + m[2][1] * v[1] + m[2][2] * v[2]));
+}
+
+Vector3d reverse_rotate_3d_vector(const std::array<std::array<double,3>,3> & m, const Vector3d & v)
+{
+  return Vector3d(
+    (m[0][0] * v[0] + m[1][0] * v[1] + m[2][0] * v[2]),
+    (m[0][1] * v[0] + m[1][1] * v[1] + m[2][1] * v[2]),
+    (m[0][2] * v[0] + m[1][2] * v[1] + m[2][2] * v[2]));
+}
+
+static std::vector<Vector3d> get_rotated_neighbor_node_locations(const std::vector<Vector3d> & neighborNodeLocs, const std::array<std::array<double,3>,3> & m)
+{
+  std::vector<Vector3d> rotatedUniqueHaloNodeLocs;
+  rotatedUniqueHaloNodeLocs.reserve(neighborNodeLocs.size());
+  for (auto && loc : neighborNodeLocs)
+    rotatedUniqueHaloNodeLocs.push_back(rotate_3d_vector(m, loc));
+  return rotatedUniqueHaloNodeLocs;
+}
+
+static std::vector<Vector3d> get_rotated_unique_halo_node_locations(const std::vector<Vector3d> & haloNodeLocs, std::vector<int> uniqueHaloNodes, const std::array<std::array<double,3>,3> & m)
+{
+  std::vector<Vector3d> rotatedUniqueHaloNodeLocs;
+  rotatedUniqueHaloNodeLocs.reserve(uniqueHaloNodes.size());
+  for (int haloNode : uniqueHaloNodes)
+    rotatedUniqueHaloNodeLocs.push_back(rotate_3d_vector(m, haloNodeLocs[haloNode]));
+  return rotatedUniqueHaloNodeLocs;
+}
+
+Vector3d compute_least_squares_curvature_times_normal(const std::vector<Vector3d> & haloNodeLocs, const std::vector<std::array<int,2>> & haloSegments)
+{
+  if (haloSegments.size() < 3)
+    return Vector3d::ZERO;
+
+  const Vector3d patchNormal = compute_patch_normal(haloNodeLocs, haloSegments);
+
+  std::vector<int> uniqueHaloNodes = get_unique_halo_nodes(haloSegments);
+
+  std::array<std::array<double,3>,3> m;
+  set_rotation_matrix_for_rotating_normal_to_zDir(m, patchNormal);
+
+  const std::vector<Vector3d> rotatedUniqueHaloNodeLocs = get_rotated_unique_halo_node_locations(haloNodeLocs, uniqueHaloNodes, m);
+
+  const Vector3d rotatedCurvatureNormal = compute_least_squares_curvature_times_normal(rotatedUniqueHaloNodeLocs);
+
+  return reverse_rotate_3d_vector(m, rotatedCurvatureNormal);
+}
+
+Vector3d compute_least_squares_curvature_times_normal(const Vector3d & approximateNormal, const std::vector<Vector3d> & neighborNodeLocs)
+{
+  if (neighborNodeLocs.size() < 3)
+    return Vector3d::ZERO;
+
+  std::array<std::array<double,3>,3> m;
+  set_rotation_matrix_for_rotating_normal_to_zDir(m, approximateNormal);
+
+  const std::vector<Vector3d> rotatedNbrNodeLocs = get_rotated_neighbor_node_locations(neighborNodeLocs, m);
+
+  const Vector3d rotatedCurvatureNormal = compute_least_squares_curvature_times_normal(rotatedNbrNodeLocs);
+
+  return reverse_rotate_3d_vector(m, rotatedCurvatureNormal);
+}
+
+Vector3d compute_least_squares_normal(const Vector3d & approximateNormal, const std::vector<Vector3d> & neighborNodeLocs)
+{
+  if (neighborNodeLocs.size() < 5)
+    return approximateNormal;
+
+  std::array<std::array<double,3>,3> m;
+  set_rotation_matrix_for_rotating_normal_to_zDir(m, approximateNormal);
+
+  const std::vector<Vector3d> rotatedNbrNodeLocs = get_rotated_neighbor_node_locations(neighborNodeLocs, m);
+
+  const Vector3d rotatedCurvatureNormal = compute_least_squares_normal(rotatedNbrNodeLocs);
+
+  return reverse_rotate_3d_vector(m, rotatedCurvatureNormal).unit_vector();
+}
+
+}
+
+
diff --git a/packages/krino/krino/krino_lib/Akri_CurvatureLeastSquares.hpp b/packages/krino/krino/krino_lib/Akri_CurvatureLeastSquares.hpp
new file mode 100644
index 000000000000..932542f593e5
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_CurvatureLeastSquares.hpp
@@ -0,0 +1,30 @@
+// Copyright 2002 - 2008, 2010, 2011 National Technology Engineering
+// Solutions of Sandia, LLC (NTESS). Under the terms of Contract
+// DE-NA0003525 with NTESS, the U.S. Government retains certain rights
+// in this software.
+//
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+#ifndef KRINO_KRINO_KRINO_LIB_AKRI_CURVATURELEASTSQUARES_HPP_
+#define KRINO_KRINO_KRINO_LIB_AKRI_CURVATURELEASTSQUARES_HPP_
+#include <array>
+#include <vector>
+#include "Akri_Vec.hpp"
+
+namespace krino {
+
+class Quaternion;
+
+void set_rotation_matrix_for_rotating_normal_to_zDir(std::array<std::array<double,3>,3> & m, const Vector3d & normalDir);
+Vector3d rotate_3d_vector(const std::array<std::array<double,3>,3> & m, const Vector3d & v);
+Vector3d reverse_rotate_3d_vector(const std::array<std::array<double,3>,3> & m, const Vector3d & v);
+
+Vector3d compute_patch_normal(const std::vector<Vector3d> & haloNodeLocs, const std::vector<std::array<int,2>> & haloSegments);
+Vector3d compute_least_squares_curvature_times_normal(const std::vector<Vector3d> & haloNodeLocs, const std::vector<std::array<int,2>> & haloSegments);
+Vector3d compute_least_squares_curvature_times_normal(const Vector3d & approximateNormal, const std::vector<Vector3d> & neighborNodeLocs);
+Vector3d compute_least_squares_normal(const Vector3d & approximateNormal, const std::vector<Vector3d> & neighborNodeLocs);
+
+}
+
+#endif /* KRINO_KRINO_KRINO_LIB_AKRI_CURVATURELEASTSQUARES_HPP_ */
diff --git a/packages/krino/krino/krino_lib/Akri_Element.hpp b/packages/krino/krino/krino_lib/Akri_Element.hpp
index 55afc1bb7dad..1f564a9118b2 100644
--- a/packages/krino/krino/krino_lib/Akri_Element.hpp
+++ b/packages/krino/krino/krino_lib/Akri_Element.hpp
@@ -174,6 +174,7 @@ class Mesh_Element : public ElementObj {
   int get_interface_index(const InterfaceID interface) const;
   const std::vector<InterfaceID> & get_sorted_cutting_interfaces() const { return myCuttingInterfaces; }
   virtual void determine_decomposed_elem_phase(const std::vector<Surface_Identifier> & surfaceIDs) override;
+  void set_have_interface() { my_have_interface = true; }
 
   bool triangulate(const CDMesh & mesh, const InterfaceGeometry & interfaceGeometry); //return value indicates if any changes were made
   void create_cutter(const CDMesh & mesh, const InterfaceGeometry & interfaceGeometry);
diff --git a/packages/krino/krino/krino_lib/Akri_IO_Helpers.cpp b/packages/krino/krino/krino_lib/Akri_IO_Helpers.cpp
index 4b51faad2f62..a5c54a658ab7 100644
--- a/packages/krino/krino/krino_lib/Akri_IO_Helpers.cpp
+++ b/packages/krino/krino/krino_lib/Akri_IO_Helpers.cpp
@@ -8,11 +8,8 @@
 
 #include <Akri_IO_Helpers.hpp>
 
-#include <Ioss_Utils.h>
 #include <Ioss_Region.h>
 #include <Ioss_ElementBlock.h>
-#include <Ioss_SideSet.h>
-#include <Ioss_SideBlock.h>
 #include <stk_io/IossBridge.hpp>
 #include <stk_mesh/base/MetaData.hpp>
 #include <stk_mesh/base/BulkData.hpp>
@@ -39,48 +36,44 @@ Block_Surface_Connectivity::Block_Surface_Connectivity(const stk::mesh::MetaData
   }
 }
 
-Block_Surface_Connectivity::Block_Surface_Connectivity(const stk::mesh::MetaData & meta, const Ioss::Region & io_region)
+void Block_Surface_Connectivity::dump_surface_connectivity(const stk::mesh::MetaData & meta)
 {
-  /* %TRACE[ON]% */
-  Trace trace__("Block_Surface_Connectivity::Block_Surface_Connectivity(const Ioss::Region & reg)"); /* %TRACE% */
+  const std::vector<const stk::mesh::Part *> surfacesInMap = meta.get_surfaces_in_surface_to_block_map();
+  for(auto && surface : surfacesInMap)
+  {
+    krinolog << "Surface " << surface->name() << " touches blocks ";
+    for (auto && touchingBlock : meta.get_blocks_touching_surface(surface))
+      krinolog << touchingBlock->name() << " ";
+    krinolog << stk::diag::dendl;
+  }
+}
 
-  std::vector<std::string> side_block_names;
-  std::vector<stk::mesh::PartOrdinal> side_block_ordinals;
+std::set<stk::mesh::PartOrdinal> Block_Surface_Connectivity::get_surfaces_touching_block(const stk::mesh::PartOrdinal & blockOrdinal) const
+{
+  auto it = block_to_surface_map.find(blockOrdinal);
+  if(it != block_to_surface_map.end())
+    return it->second;
 
-  for(auto sideset : io_region.get_sidesets())
-  {
-    side_block_names.clear();
-    sideset->block_membership(side_block_names);
-    side_block_ordinals.clear();
-    for (auto && block_name : side_block_names)
-    {
-      const stk::mesh::Part * side_block_part = meta.get_part(block_name);
-      ThrowRequire(nullptr != side_block_part);
-      side_block_ordinals.push_back(side_block_part->mesh_meta_data_ordinal());
-    }
-    const stk::mesh::Part * side_part = meta.get_part(sideset->name());
-    ThrowRequire(nullptr != side_part);
-    add_surface(side_part->mesh_meta_data_ordinal(), std::set<stk::mesh::PartOrdinal>(side_block_ordinals.begin(), side_block_ordinals.end()));
+  std::set<stk::mesh::PartOrdinal> emptySurfaces;
+  return emptySurfaces;
+}
 
-    if (!sideset->get_side_blocks().empty())
-    {
-      for (auto&& side_subset : sideset->get_side_blocks())
-      {
-        // Fmwk only creates subset if more than 1 sideblock, but stk always creates them, so just check.
-        const stk::mesh::Part * side_subset_part = meta.get_part(side_subset->name());
-        if (nullptr == side_subset_part) continue;
-        side_block_names.clear();
-        side_subset->block_membership(side_block_names);
-        side_block_ordinals.clear();
-        for (auto && block_name : side_block_names)
-        {
-          const stk::mesh::Part * side_block_part = meta.get_part(block_name);
-          ThrowRequire(nullptr != side_block_part);
-          side_block_ordinals.push_back(side_block_part->mesh_meta_data_ordinal());
-        }
-        add_surface(side_subset_part->mesh_meta_data_ordinal(), std::set<stk::mesh::PartOrdinal>(side_block_ordinals.begin(), side_block_ordinals.end()));
-      }
-    }
+std::set<stk::mesh::PartOrdinal> Block_Surface_Connectivity::get_blocks_touching_surface(const stk::mesh::PartOrdinal & surfaceOrdinal) const
+{
+  auto it = surface_to_block_map.find(surfaceOrdinal);
+  if(it != surface_to_block_map.end())
+    return it->second;
+
+  std::set<stk::mesh::PartOrdinal> emptyBlocks;
+  return emptyBlocks;
+}
+
+void Block_Surface_Connectivity::add_surface(const stk::mesh::PartOrdinal & surf_ordinal, const std::set<stk::mesh::PartOrdinal> touching_blocks)
+{
+  surface_to_block_map[surf_ordinal].insert(touching_blocks.begin(), touching_blocks.end());
+  for(auto && block : touching_blocks)
+  {
+    block_to_surface_map[block].insert(surf_ordinal);
   }
 }
 
diff --git a/packages/krino/krino/krino_lib/Akri_IO_Helpers.hpp b/packages/krino/krino/krino_lib/Akri_IO_Helpers.hpp
index 2ec5005ffd08..0af0bdb1d083 100644
--- a/packages/krino/krino/krino_lib/Akri_IO_Helpers.hpp
+++ b/packages/krino/krino/krino_lib/Akri_IO_Helpers.hpp
@@ -8,53 +8,27 @@
 
 #ifndef Akri_IO_Helpers_h
 #define Akri_IO_Helpers_h
-//
-#include <stk_mesh/base/Part.hpp>
-#include <stk_mesh/base/Selector.hpp>
-
-#include <Akri_PhaseTag.hpp>
 
+#include <stk_mesh/base/Part.hpp>
 #include <map>
 
-namespace stk { namespace mesh { class BulkData; } }
 namespace stk { namespace mesh { class MetaData; } }
-namespace stk { namespace diag { class Timer; } }
 namespace Ioss { class Region; }
 
 namespace krino {
 
-class AuxMetaData;
-
 class Block_Surface_Connectivity
 {
 public:
   Block_Surface_Connectivity() {}
   Block_Surface_Connectivity(const stk::mesh::MetaData & meta);
-  Block_Surface_Connectivity(const stk::mesh::MetaData & meta, const Ioss::Region & io_region);
-  void get_surfaces_touching_block(const stk::mesh::PartOrdinal & block_ordinal,
-      std::set<stk::mesh::PartOrdinal> & surface_ordinals) const
-  {
-    auto it = block_to_surface_map.find(block_ordinal);
-    if(it == block_to_surface_map.end()) return;
-    surface_ordinals.insert(it->second.begin(), it->second.end());
-  }
-  void get_blocks_touching_surface(const stk::mesh::PartOrdinal & surface_ordinal,
-      std::set<stk::mesh::PartOrdinal> & block_ordinals) const
-  {
-    block_ordinals.clear();
-    auto it = surface_to_block_map.find(surface_ordinal);
-    if(it == surface_to_block_map.end()) return;
-    block_ordinals.insert(it->second.begin(), it->second.end());
-  }
 
-  void add_surface(const stk::mesh::PartOrdinal & surf_ordinal, const std::set<stk::mesh::PartOrdinal> touching_blocks)
-  {
-    surface_to_block_map[surf_ordinal].insert(touching_blocks.begin(), touching_blocks.end());
-    for(auto && block : touching_blocks)
-    {
-      block_to_surface_map[block].insert(surf_ordinal);
-    }
-  }
+  std::set<stk::mesh::PartOrdinal> get_surfaces_touching_block(const stk::mesh::PartOrdinal & blockOrdinal) const;
+  std::set<stk::mesh::PartOrdinal> get_blocks_touching_surface(const stk::mesh::PartOrdinal & surfaceOrdinal) const;
+  void add_surface(const stk::mesh::PartOrdinal & surf_ordinal, const std::set<stk::mesh::PartOrdinal> touching_blocks);
+
+  static void dump_surface_connectivity(const stk::mesh::MetaData & meta);
+
 private:
   std::map< stk::mesh::PartOrdinal, std::set<stk::mesh::PartOrdinal> > block_to_surface_map;
   std::map< stk::mesh::PartOrdinal, std::set<stk::mesh::PartOrdinal> > surface_to_block_map;
diff --git a/packages/krino/krino/krino_lib/Akri_LevelSet.cpp b/packages/krino/krino/krino_lib/Akri_LevelSet.cpp
index 93bfea805dc5..97e3860cdb78 100644
--- a/packages/krino/krino/krino_lib/Akri_LevelSet.cpp
+++ b/packages/krino/krino/krino_lib/Akri_LevelSet.cpp
@@ -204,7 +204,7 @@ void LevelSet::register_fields(void)
     const bool cdfem_is_active = krino::CDFEM_Support::is_active(meta());
     if (cdfem_is_active)
     {
-      Phase_Support phase_support = Phase_Support::get(meta());
+      Phase_Support & phase_support = Phase_Support::get(meta());
       for (auto partPtr : meta().get_mesh_parts())
       {
         if (partPtr->primary_entity_rank() == stk::topology::ELEMENT_RANK &&
@@ -1372,7 +1372,7 @@ LevelSet::simple_remove_wall_features() const
 void
 LevelSet::set_surface_parts_vector()
 {
-  Phase_Support my_phase_support = Phase_Support::get(meta());
+  Phase_Support & my_phase_support = Phase_Support::get(meta());
 
   std::vector<stk::mesh::Part *> conformal_parts =  my_phase_support.get_conformal_parts();
 
diff --git a/packages/krino/krino/krino_lib/Akri_MeshClone.cpp b/packages/krino/krino/krino_lib/Akri_MeshClone.cpp
index b1cfdc570951..833aeb72b12b 100644
--- a/packages/krino/krino/krino_lib/Akri_MeshClone.cpp
+++ b/packages/krino/krino/krino_lib/Akri_MeshClone.cpp
@@ -10,6 +10,8 @@
 #include <stk_mesh/base/FieldBase.hpp>
 #include <stk_mesh/base/GetEntities.hpp>
 #include <stk_mesh/base/GetBuckets.hpp>
+#include <stk_mesh/base/MeshBuilder.hpp>
+#include <stk_tools/mesh_clone/ReplaceBulkData.hpp>
 #include <stk_util/parallel/ParallelReduce.hpp>
 #include <stk_io/IossBridge.hpp>
 
@@ -83,16 +85,13 @@ MeshClone::MeshClone( stk::mesh::BulkData & orig_mesh, stk::diag::Timer parent_t
 {
   stk::diag::TimeBlock timer__(my_timer);
   const stk::mesh::MetaData & in_meta = my_orig_mesh->mesh_meta_data();
-  my_meta = std::make_unique<stk::mesh::MetaData>();
+  my_meta = stk::mesh::MeshBuilder().create_meta_data();
   clone_meta_data_parts_and_fields(in_meta, *my_meta);
 
-  my_mesh = std::make_unique<stk::mesh::BulkData>(*my_meta,
-      my_orig_mesh->parallel(),
-      stk::mesh::BulkData::NO_AUTO_AURA
-#ifdef SIERRA_MIGRATION
-      ,my_orig_mesh->add_fmwk_data()
-#endif
-      );
+  my_mesh = stk::mesh::MeshBuilder(my_orig_mesh->parallel())
+                       .set_aura_option(stk::mesh::BulkData::NO_AUTO_AURA)
+                       .set_add_fmwk_data(my_orig_mesh->add_fmwk_data())
+                       .create(my_meta);
 
   my_meta->commit();
 
@@ -134,26 +133,8 @@ void MeshClone::clone_mesh(const stk::mesh::BulkData & in_mesh, stk::mesh::BulkD
 { /* %TRACE[ON]% */ Trace trace__("krino::MeshClone::clone_mesh(const stk::mesh::BulkData & in_mesh, stk::mesh::BulkData & out_mesh, const bool full_overwrite)"); /* %TRACE% */
   if (full_overwrite)
   {
-    // Ugly, but legal and effective.
-    stk::mesh::MetaData & out_meta = out_mesh.mesh_meta_data();
-    out_mesh.~BulkData();
-
-    const stk::mesh::BulkData::AutomaticAuraOption aura_option =
-      in_mesh.is_automatic_aura_on() ?
-      stk::mesh::BulkData::AUTO_AURA :
-      stk::mesh::BulkData::NO_AUTO_AURA;
-
-    new (&out_mesh) stk::mesh::BulkData(out_meta,
-      in_mesh.parallel(),
-      aura_option
-#ifdef SIERRA_MIGRATION
-      ,in_mesh.add_fmwk_data()
-#endif
-      );
-
-    out_mesh.modification_begin();
-    clone_bulk_data_entities(in_mesh, out_mesh, false);
-    out_mesh.modification_end();
+//    std::function<void(stk::mesh::BulkData& outMesh_)> op = [](stk::mesh::BulkData& outMesh_) {};
+    stk::tools::replace_bulk_data(in_mesh, out_mesh/*, op*/);
   }
   else
   {
@@ -172,9 +153,9 @@ void MeshClone::clone_mesh(const stk::mesh::BulkData & in_mesh, stk::mesh::BulkD
     out_mesh.modification_begin();
     clone_bulk_data_entities(in_mesh, out_mesh, true);
     out_mesh.modification_end();
+    copy_field_data(in_mesh, out_mesh);
   }
 
-  copy_field_data(in_mesh, out_mesh);
 }
 
 
diff --git a/packages/krino/krino/krino_lib/Akri_MeshClone.hpp b/packages/krino/krino/krino_lib/Akri_MeshClone.hpp
index d73789a38c97..ac7f4bc7cd37 100644
--- a/packages/krino/krino/krino_lib/Akri_MeshClone.hpp
+++ b/packages/krino/krino/krino_lib/Akri_MeshClone.hpp
@@ -54,7 +54,7 @@ class MeshClone {
   static stk::mesh::Entity get_entity_on_other_mesh(const stk::mesh::BulkData & mesh, stk::mesh::Entity entity, const stk::mesh::BulkData & other_mesh);
 
   stk::mesh::BulkData* my_orig_mesh;
-  std::unique_ptr<stk::mesh::MetaData> my_meta;
+  std::shared_ptr<stk::mesh::MetaData> my_meta;
   std::unique_ptr<stk::mesh::BulkData> my_mesh;
 
   mutable stk::diag::Timer my_timer;
diff --git a/packages/krino/krino/krino_lib/Akri_MeshHelpers.cpp b/packages/krino/krino/krino_lib/Akri_MeshHelpers.cpp
index 30fe6f7a21ff..1758a920449d 100644
--- a/packages/krino/krino/krino_lib/Akri_MeshHelpers.cpp
+++ b/packages/krino/krino/krino_lib/Akri_MeshHelpers.cpp
@@ -56,6 +56,30 @@ void resize_container(CONTAINER & container, size_t size)
   resizer.resize(size);
 }
 
+Vector3d get_side_normal(const stk::mesh::BulkData& mesh,
+    const FieldRef coordsField,
+    stk::mesh::Entity side)
+{
+  const auto * sideNodes = mesh.begin_nodes(side);
+  const stk::topology sideTopology = mesh.bucket(side).topology();
+  if (sideTopology == stk::topology::TRIANGLE_3 || sideTopology == stk::topology::TRIANGLE_6)
+  {
+    const Vector3d v0(field_data<double>(coordsField, sideNodes[0]));
+    const Vector3d v1(field_data<double>(coordsField, sideNodes[1]));
+    const Vector3d v2(field_data<double>(coordsField, sideNodes[2]));
+    return Cross(v1-v0,v2-v0).unit_vector();
+  }
+  else if (sideTopology == stk::topology::LINE_2 || sideTopology == stk::topology::LINE_3)
+  {
+    const Vector3d v0(field_data<double>(coordsField, sideNodes[0]), 2);
+    const Vector3d v1(field_data<double>(coordsField, sideNodes[1]), 2);
+    return crossZ(v1-v0).unit_vector();
+  }
+  ThrowRequireMsg(false, "Unsupported topology " << sideTopology);
+
+  return Vector3d::ZERO;
+}
+
 void fill_procs_owning_or_sharing_or_ghosting_node(const stk::mesh::BulkData& bulkData, stk::mesh::Entity node, std::vector<int> & procsOwningSharingOrGhostingNode)
 {
     ThrowAssert(bulkData.parallel_owner_rank(node)==bulkData.parallel_rank());
@@ -111,16 +135,24 @@ static std::array<krino::Vector3d,3> gather_tri_coordinates(const stk::mesh::Bul
   return elementNodeCoords;
 }
 
-static double compute_tri_volume(const std::array<krino::Vector3d,3> & elementNodeCoords)
+double compute_tri_volume(const std::array<krino::Vector3d,3> & elementNodeCoords)
 {
   return 0.5*(Cross(elementNodeCoords[1]-elementNodeCoords[0], elementNodeCoords[2]-elementNodeCoords[0]).length());
 }
 
-static double compute_tet_volume(const std::array<krino::Vector3d,4> & elementNodeCoords)
+double compute_tet_volume(const std::array<krino::Vector3d,4> & elementNodeCoords)
 {
   return Dot(elementNodeCoords[3]-elementNodeCoords[0],Cross(elementNodeCoords[1]-elementNodeCoords[0], elementNodeCoords[2]-elementNodeCoords[0]))/6.0;
 }
 
+double compute_tri_or_tet_volume(const std::vector<krino::Vector3d> & elementNodeCoords)
+{
+  ThrowAssert(elementNodeCoords.size() == 4 || elementNodeCoords.size() == 3);
+  if (elementNodeCoords.size() == 4)
+    return compute_tet_volume({{elementNodeCoords[0],elementNodeCoords[1],elementNodeCoords[2],elementNodeCoords[3]}});
+  return compute_tri_volume({{elementNodeCoords[0],elementNodeCoords[1],elementNodeCoords[2]}});
+}
+
 static double compute_tri_or_tet_volume(const stk::mesh::BulkData & mesh, stk::mesh::Entity element, const FieldRef coordsField)
 {
   stk::topology elemTopology = mesh.bucket(element).topology();
@@ -609,6 +641,41 @@ debug_entity(const stk::mesh::BulkData & mesh, stk::mesh::Entity entity)
   return debug_entity(mesh, entity, false);
 }
 
+static void
+debug_entity_1line(std::ostream & output, const stk::mesh::BulkData & mesh, stk::mesh::Entity entity)
+{
+  if (!mesh.is_valid(entity))
+  {
+    output << "Invalid entity: " << mesh.entity_key(entity) << std::endl;
+    return;
+  }
+  output << mesh.entity_key(entity);
+  output << ",  Connectivity: ";
+  const stk::mesh::EntityRank end_rank = static_cast<stk::mesh::EntityRank>(mesh.mesh_meta_data().entity_rank_count());
+  for (stk::mesh::EntityRank r = stk::topology::BEGIN_RANK; r < end_rank; ++r) {
+    unsigned num_rels = mesh.num_connectivity(entity, r);
+    stk::mesh::Entity const *rel_entities = mesh.begin(entity, r);
+    stk::mesh::ConnectivityOrdinal const *rel_ordinals = mesh.begin_ordinals(entity, r);
+    for (unsigned i = 0; i < num_rels; ++i) {
+      output << " " << mesh.entity_key(rel_entities[i])
+         << " @" << rel_ordinals[i] << " ";
+    }
+  }
+  output << ",  Parts: ";
+  for(auto&& part : mesh.bucket(entity).supersets())
+  {
+    output << part->name() << " ";
+  }
+}
+
+std::string
+debug_entity_1line(const stk::mesh::BulkData & mesh, stk::mesh::Entity entity)
+{
+  std::ostringstream out;
+  debug_entity_1line(out, mesh, entity);
+  return out.str();
+}
+
 //--------------------------------------------------------------------------------
 
 std::vector<unsigned>
@@ -1100,6 +1167,14 @@ attach_sides_to_elements(stk::mesh::BulkData & mesh)
   mesh.modification_end();
 }
 
+static bool is_entity_attached_to_element(const stk::mesh::BulkData & mesh, const stk::mesh::EntityRank entityRank, const stk::mesh::Entity entity, const stk::mesh::Entity element)
+{
+  for (auto && elemEntity : StkMeshEntities{mesh.begin(element, entityRank), mesh.end(element, entityRank)})
+    if (elemEntity == entity)
+      return true;
+  return false;
+}
+
 void
 attach_entity_to_elements(stk::mesh::BulkData & mesh, stk::mesh::Entity entity)
 {
@@ -1134,18 +1209,8 @@ attach_entity_to_elements(stk::mesh::BulkData & mesh, stk::mesh::Entity entity)
     {
       continue;
     }
-    bool already_attached = false;
-    const unsigned num_elem_entities = mesh.num_connectivity(elem, entity_rank);
-    const stk::mesh::Entity* elem_entities = mesh.begin(elem, entity_rank);
-    for (unsigned it_s=0; it_s<num_elem_entities; ++it_s)
-    {
-      if (elem_entities[it_s] == entity)
-      {
-        already_attached = true;
-        break;
-      }
-    }
-    if (!already_attached)
+    const bool alreadyAttached = is_entity_attached_to_element(mesh, entity_rank, entity, elem);
+    if (!alreadyAttached)
     {
       std::pair<stk::mesh::ConnectivityOrdinal, stk::mesh::Permutation> relationship(stk::mesh::INVALID_CONNECTIVITY_ORDINAL, stk::mesh::INVALID_PERMUTATION);
       if (!have_coincident_shell)
@@ -1174,17 +1239,18 @@ attach_entity_to_elements(stk::mesh::BulkData & mesh, stk::mesh::Entity entity)
       }
 
       mesh.declare_relation( elem, entity, relationship.first, relationship.second, scratch1, scratch2, scratch3 );
-      const bool successfully_attached = (find_entity_by_ordinal(mesh, elem, entity_rank, relationship.first) == entity);
-      if (!successfully_attached)
+      const bool successfullyAttached = (find_entity_by_ordinal(mesh, elem, entity_rank, relationship.first) == entity);
+      if (!successfullyAttached)
       {
-        krinolog << "Could not attach " << debug_entity(mesh,entity) << " to element " << debug_entity(mesh,elem) << stk::diag::dendl;
-        krinolog << "Existing attached entities:" << stk::diag::dendl;
-        for (unsigned it_s=0; it_s<num_elem_entities; ++it_s)
-        {
-          krinolog << debug_entity(mesh,elem_entities[it_s]) << stk::diag::dendl;
-        }
+        krinolog << "Could not attach " << debug_entity_1line(mesh,entity) << "\n";
+        krinolog << "  to element " << debug_entity_1line(mesh,elem) << stk::diag::dendl;
+      }
+      else if (krinolog.shouldPrint(LOG_DEBUG))
+      {
+        krinolog << "Attached " << debug_entity_1line(mesh,entity) << "\n";
+        krinolog << "  to element " << debug_entity_1line(mesh,elem) << stk::diag::dendl;
       }
-      ThrowRequire(successfully_attached);
+      ThrowRequire(successfullyAttached);
     }
   }
 }
@@ -1461,7 +1527,7 @@ get_edge_node_parent_ids(const stk::mesh::BulkData & mesh,
   if (parent_id_field.type_is<unsigned>())
   {
     const auto * stored_parent_ids = field_data<unsigned>(parent_id_field, edge_node_entity);
-    ThrowAssertMsg(stored_parent_ids, "No SubElementNode found for node " << mesh.identifier(edge_node_entity)
+    ThrowRequireMsg(stored_parent_ids, "No SubElementNode found for node " << mesh.identifier(edge_node_entity)
         << ", but it does not have the parent_ids field suggesting it is a mesh node.");
     parent_ids[0] = stored_parent_ids[0];
     parent_ids[1] = stored_parent_ids[1];
@@ -1469,7 +1535,7 @@ get_edge_node_parent_ids(const stk::mesh::BulkData & mesh,
   else if (parent_id_field.type_is<uint64_t>())
   {
     const auto * stored_parent_ids = field_data<uint64_t>(parent_id_field, edge_node_entity);
-    ThrowAssertMsg(stored_parent_ids, "No SubElementNode found for node " << mesh.identifier(edge_node_entity)
+    ThrowRequireMsg(stored_parent_ids, "No SubElementNode found for node " << mesh.identifier(edge_node_entity)
         << ", but it does not have the parent_ids field suggesting it is a mesh node.");
     parent_ids[0] = stored_parent_ids[0];
     parent_ids[1] = stored_parent_ids[1];
@@ -1492,7 +1558,7 @@ void get_parent_nodes_from_child(const stk::mesh::BulkData & mesh,
     auto parent_ids = get_edge_node_parent_ids(mesh, parent_id_field, child);
     const stk::mesh::Entity parent0 = mesh.get_entity(stk::topology::NODE_RANK, parent_ids[0]);
     const stk::mesh::Entity parent1 = mesh.get_entity(stk::topology::NODE_RANK, parent_ids[1]);
-    ThrowAssert(mesh.is_valid(parent0) && mesh.is_valid(parent1));
+    ThrowRequire(mesh.is_valid(parent0) && mesh.is_valid(parent1));
     get_parent_nodes_from_child(mesh, parent0, parent_id_field, parent_nodes);
     get_parent_nodes_from_child(mesh, parent1, parent_id_field, parent_nodes);
   }
diff --git a/packages/krino/krino/krino_lib/Akri_MeshHelpers.hpp b/packages/krino/krino/krino_lib/Akri_MeshHelpers.hpp
index ccbb8a339e68..8f14d1210195 100644
--- a/packages/krino/krino/krino_lib/Akri_MeshHelpers.hpp
+++ b/packages/krino/krino/krino_lib/Akri_MeshHelpers.hpp
@@ -44,6 +44,10 @@ struct StkMeshEntities
     value_type operator[](int i) const { return *(mBegin + i); }
 };
 
+double compute_tri_volume(const std::array<krino::Vector3d,3> & elementNodeCoords);
+double compute_tet_volume(const std::array<krino::Vector3d,4> & elementNodeCoords);
+double compute_tri_or_tet_volume(const std::vector<krino::Vector3d> & elementNodeCoords);
+Vector3d get_side_normal(const stk::mesh::BulkData& mesh, const FieldRef coordsField, stk::mesh::Entity side);
 void fill_element_node_coordinates(const stk::mesh::BulkData & mesh, stk::mesh::Entity element, const FieldRef coordsField, std::vector<Vector3d> & elementNodeCoords);
 void fill_procs_owning_or_sharing_or_ghosting_node(const stk::mesh::BulkData& bulkData, stk::mesh::Entity node, std::vector<int> & procsOwningSharingOrGhostingNode);
 double compute_maximum_element_size(stk::mesh::BulkData& mesh);
@@ -79,6 +83,14 @@ stk::mesh::PartVector get_common_io_parts(const stk::mesh::BulkData & mesh, cons
 stk::mesh::PartVector get_removable_parts(const stk::mesh::BulkData & mesh, const stk::mesh::Bucket & bucket);
 stk::mesh::PartVector get_removable_parts(const stk::mesh::BulkData & mesh, const stk::mesh::Entity entity);
 
+template <typename NODECONTAINER>
+void fill_node_locations(const int dim, const FieldRef coordsField, const NODECONTAINER & nodes, std::vector<stk::math::Vector3d> & nodeLocations)
+{
+  nodeLocations.clear();
+  for (auto node : nodes)
+    nodeLocations.emplace_back(field_data<double>(coordsField, node), dim);
+}
+
 void
 store_edge_node_parent_ids(const stk::mesh::BulkData & mesh,
     const FieldRef & parent_id_field,
@@ -104,6 +116,7 @@ const unsigned * get_edge_node_ordinals(stk::topology topology, unsigned edge_or
 
 std::string debug_entity(const stk::mesh::BulkData & mesh, stk::mesh::Entity entity);
 std::string debug_entity(const stk::mesh::BulkData & mesh, stk::mesh::Entity entity, const bool includeFields);
+std::string debug_entity_1line(const stk::mesh::BulkData & mesh, stk::mesh::Entity entity);
 
 struct SideRequest
 {
diff --git a/packages/krino/krino/krino_lib/Akri_Phase_Support.cpp b/packages/krino/krino/krino_lib/Akri_Phase_Support.cpp
index 8b46db9b7303..1c6224baefc4 100644
--- a/packages/krino/krino/krino_lib/Akri_Phase_Support.cpp
+++ b/packages/krino/krino/krino_lib/Akri_Phase_Support.cpp
@@ -73,9 +73,7 @@ std::string build_part_name(const krino::Phase_Support & ps,
 
   std::string parent_part_name = parent_part->name();
   std::string io_part_name = part.name();
-  std::set<stk::mesh::PartOrdinal> touching_block_ordinals;
-  ps.get_input_blocks_touching_surface(ps.get_input_block_surface_connectivity(), part.mesh_meta_data_ordinal(), touching_block_ordinals);
-  
+  const std::set<stk::mesh::PartOrdinal> touching_block_ordinals = ps.get_input_block_surface_connectivity().get_blocks_touching_surface(part.mesh_meta_data_ordinal());
 
   ThrowRequireMsg(touching_block_ordinals.size() > 0, 
       "krino::Akri_Phase_Support: Side block must be touching at least 1 block");
@@ -262,12 +260,12 @@ Phase_Support::addPhasePart(stk::mesh::Part & io_part, PhasePartSet & phase_part
 }
 
 void
-Phase_Support::create_nonconformal_parts(const PartSet & decomposed_ioparts)
+Phase_Support::create_nonconformal_parts(const PartSet & decomposedIoParts)
 {
   const std::string nonconformal_part_suffix = "_nonconformal";
-  for(PartSet::const_iterator it = decomposed_ioparts.begin(); it != decomposed_ioparts.end(); ++it)
+  for(auto && decomposedIoPart : decomposedIoParts)
   {
-    const stk::mesh::Part & iopart = aux_meta().get_part((*it)->name());
+    const stk::mesh::Part & iopart = aux_meta().get_part(decomposedIoPart->name());
 
     std::string nonconformal_part_name = build_part_name(*this, iopart, PhaseTag(), nonconformal_part_suffix);
 
@@ -350,8 +348,7 @@ Phase_Support::get_blocks_and_touching_surfaces(const stk::mesh::MetaData & mesh
   for (auto && block_ptr : input_blocks)
   {
     blocks_and_touching_sides.insert(block_ptr);
-    std::set<stk::mesh::PartOrdinal> touching_surface_ordinals;
-    get_input_surfaces_touching_block(input_block_surface_info, block_ptr->mesh_meta_data_ordinal(), touching_surface_ordinals);
+    const std::set<stk::mesh::PartOrdinal> touching_surface_ordinals = input_block_surface_info.get_surfaces_touching_block(block_ptr->mesh_meta_data_ordinal());
     for (auto && surf_ordinal : touching_surface_ordinals)
     {
       stk::mesh::Part & surf_part = mesh_meta.get_part(surf_ordinal);
@@ -387,8 +384,6 @@ void
 Phase_Support::subset_and_alias_surface_phase_parts(const PhaseVec& ls_phases,
     const PartSet& decomposed_ioparts)
 {
-  std::set<stk::mesh::PartOrdinal> touching_block_ordinals;
-
   for (auto && io_part : decomposed_ioparts)
   {
     if (!(io_part->subsets().empty()))
@@ -403,10 +398,8 @@ Phase_Support::subset_and_alias_surface_phase_parts(const PhaseVec& ls_phases,
         stk::mesh::Part * nonconformal_iopart = const_cast<stk::mesh::Part *>(find_nonconformal_part(*io_part));
         ThrowRequire(NULL != nonconformal_iopart);
 
-        for (stk::mesh::PartVector::const_iterator subset = io_part->subsets().begin();
-            subset != io_part->subsets().end(); ++subset)
+        for (auto && io_part_subset : io_part->subsets())
         {
-          stk::mesh::Part * io_part_subset = *subset;
           ThrowRequire(NULL != io_part_subset);
 
           addPhasePart(*io_part_subset, my_phase_parts, ls_phase_entry);
@@ -422,7 +415,7 @@ Phase_Support::subset_and_alias_surface_phase_parts(const PhaseVec& ls_phases,
           if(krinolog.shouldPrint(LOG_PARTS)) krinolog << "Adding " << nonconformal_iopart_subset->name() << " as subset of " << nonconformal_iopart->name() << stk::diag::dendl;
           meta().declare_part_subset(*nonconformal_iopart, *nonconformal_iopart_subset);
 
-          get_input_blocks_touching_surface(my_input_block_surface_connectivity, io_part_subset->mesh_meta_data_ordinal(), touching_block_ordinals);
+          const std::set<stk::mesh::PartOrdinal> touching_block_ordinals = my_input_block_surface_connectivity.get_blocks_touching_surface(io_part_subset->mesh_meta_data_ordinal());
           for (auto && touching_block_ordinal : touching_block_ordinals)
           {
             const std::string conformal_part_alias = conformal_iopart->name() + "_" + meta().get_part(touching_block_ordinal).name();
@@ -435,49 +428,80 @@ Phase_Support::subset_and_alias_surface_phase_parts(const PhaseVec& ls_phases,
   }
 }
 
+void
+Phase_Support::update_touching_parts_for_phase_part(const stk::mesh::Part & origPart, const stk::mesh::Part & phasePart, const PhaseTag & phase)
+{
+  const std::set<stk::mesh::PartOrdinal> & origTouchingBlockOrdinals = my_input_block_surface_connectivity.get_blocks_touching_surface(origPart.mesh_meta_data_ordinal());
+
+  std::vector<const stk::mesh::Part*> phaseTouchingBlocks = meta().get_blocks_touching_surface(&phasePart);
+
+  for (auto && origTouchingBlockOrdinal : origTouchingBlockOrdinals)
+  {
+    stk::mesh::Part & origTouchingBlock = meta().get_part(origTouchingBlockOrdinal);
+    const stk::mesh::Part * phaseTouchingBlock = (phase.empty()) ? find_nonconformal_part(origTouchingBlock) : find_conformal_io_part(origTouchingBlock, phase);
+    ThrowRequire(phaseTouchingBlock);
+
+    if (std::find(phaseTouchingBlocks.begin(), phaseTouchingBlocks.end(), phaseTouchingBlock) == phaseTouchingBlocks.end())
+      phaseTouchingBlocks.push_back(phaseTouchingBlock);
+  }
+
+  if(krinolog.shouldPrint(LOG_PARTS))
+  {
+    const std::string conformingType = (phase.empty()) ? "Nonconforming" : "Conforming";
+    krinolog << conformingType << " surface " << phasePart.name() << " touches blocks ";
+    for (auto && phaseTouchingBlock : phaseTouchingBlocks)
+      krinolog << phaseTouchingBlock->name() << " ";
+    krinolog << "\n";
+  }
+
+  meta().set_surface_to_block_mapping(&phasePart, phaseTouchingBlocks);
+}
+
 void
 Phase_Support::build_decomposed_block_surface_connectivity()
 {
+  std::set<std::pair<unsigned, unsigned>> nonconformingAndOriginalPartOrdinalPairs;
+
   for (auto && part : meta().get_mesh_parts())
   {
     if (part->primary_entity_rank() != meta().side_rank()) continue;
     const PhasePartTag * phase_part = find_conformal_phase_part(*part);
     if (nullptr == phase_part) continue;
-    stk::mesh::Part & orig_part = meta().get_part(phase_part->get_original_part_ordinal());
-    if (orig_part == meta().universal_part()) continue;
+    stk::mesh::Part & origPart = meta().get_part(phase_part->get_original_part_ordinal());
+    if (origPart == meta().universal_part()) continue;
 
     if (phase_part->is_interface())
     {
-      const stk::mesh::Part * conformal_touching_block = find_conformal_io_part(orig_part, phase_part->get_touching_phase());
+      const stk::mesh::Part * conformal_touching_block = find_conformal_io_part(origPart, phase_part->get_touching_phase());
       ThrowRequire(conformal_touching_block);
-      if(krinolog.shouldPrint(LOG_PARTS)) krinolog << "Surface " << part->name() << " touches block " << conformal_touching_block->name() << "\n";
+      if(krinolog.shouldPrint(LOG_PARTS)) krinolog << "Interface surface " << part->name() << " touches block " << conformal_touching_block->name() << "\n";
       std::vector<const stk::mesh::Part*> touching_blocks = meta().get_blocks_touching_surface(part);
       if (std::find(touching_blocks.begin(), touching_blocks.end(), conformal_touching_block) == touching_blocks.end())
-      {
         touching_blocks.push_back(conformal_touching_block);
-      }
+
       meta().set_surface_to_block_mapping(part, touching_blocks);
     }
     else
     {
-      std::set<stk::mesh::PartOrdinal> touching_block_ordinals;
-      get_input_blocks_touching_surface(my_input_block_surface_connectivity, orig_part.mesh_meta_data_ordinal(), touching_block_ordinals);
+      update_touching_parts_for_phase_part(origPart, *part, phase_part->get_phase());
 
-      for (auto && touching_block_ordinal : touching_block_ordinals)
-      {
-        stk::mesh::Part & touching_block = meta().get_part(touching_block_ordinal);
-        const stk::mesh::Part * conformal_touching_block = find_conformal_io_part(touching_block, phase_part->get_phase());
-        ThrowRequire(conformal_touching_block);
-        if(krinolog.shouldPrint(LOG_PARTS)) krinolog << "Surface " << part->name() << " touches block " << conformal_touching_block->name() << "\n";
-        std::vector<const stk::mesh::Part*> touching_blocks = meta().get_blocks_touching_surface(part);
-        if (std::find(touching_blocks.begin(), touching_blocks.end(), conformal_touching_block) == touching_blocks.end())
-        {
-          touching_blocks.push_back(conformal_touching_block);
-        }
-        meta().set_surface_to_block_mapping(part, touching_blocks);
-      }
+      // store off nonconforming and original parts for second pass below
+      nonconformingAndOriginalPartOrdinalPairs.emplace(phase_part->get_nonconformal_part_ordinal(), phase_part->get_original_part_ordinal());
     }
   }
+
+  const PhaseTag emptyPhaseToIndicateNoncoformingPart;
+  for (auto && nonconformingAndOriginalPartOrdinalPair : nonconformingAndOriginalPartOrdinalPairs)
+  {
+    const stk::mesh::Part & nonconformingPart = meta().get_part(nonconformingAndOriginalPartOrdinalPair.first);
+    const stk::mesh::Part & origPart = meta().get_part(nonconformingAndOriginalPartOrdinalPair.second);
+    update_touching_parts_for_phase_part(origPart, nonconformingPart, emptyPhaseToIndicateNoncoformingPart);
+  }
+
+  if(krinolog.shouldPrint(LOG_PARTS))
+  {
+    Block_Surface_Connectivity::dump_surface_connectivity(meta());
+  }
 }
 
 void
@@ -599,7 +623,7 @@ Phase_Support::decompose_blocks(std::vector<std::tuple<stk::mesh::PartVector,
     auto & ls_set = ls_sets[i];
     stk::mesh::PartVector & blocks_to_decompose = std::get<0>(ls_set);
     PhaseVec & ls_phases = std::get<2>(ls_set);
-    if(std::get<2>(ls_set).empty()) continue;
+    if(ls_phases.empty()) continue;
     part_set_vec[i] = get_blocks_and_touching_surfaces(meta(), blocks_to_decompose, my_input_block_surface_connectivity);
 
     create_nonconformal_parts(part_set_vec[i]);
@@ -881,21 +905,6 @@ Phase_Support::get_blocks_touching_surface(const std::string & surface_name, std
   }
 }
 //--------------------------------------------------------------------------------
-void
-Phase_Support::get_input_surfaces_touching_block(const Block_Surface_Connectivity & input_block_surface_connectivity,
-    const stk::mesh::PartOrdinal block_ordinal, std::set<stk::mesh::PartOrdinal> & surface_ordinals)
-{
-  input_block_surface_connectivity.get_surfaces_touching_block(block_ordinal, surface_ordinals);
-}
-
-//--------------------------------------------------------------------------------
-void
-Phase_Support::get_input_blocks_touching_surface(const Block_Surface_Connectivity & input_block_surface_connectivity,
-    const stk::mesh::PartOrdinal surfaceOrdinal, std::set<stk::mesh::PartOrdinal> & blockOrdinals) const
-{
-  input_block_surface_connectivity.get_blocks_touching_surface(surfaceOrdinal, blockOrdinals);
-}
-//--------------------------------------------------------------------------------
 const stk::mesh::Part *
 Phase_Support::find_conformal_io_part(const stk::mesh::Part & io_part, const PhaseTag & phase) const
 {
@@ -1006,8 +1015,7 @@ void Phase_Support::register_blocks_for_level_set(const Surface_Identifier level
     lsUsedByParts_[levelSetIdentifier].insert(block_ptr);
 
     // Now get surfaces touching this block
-    std::set<stk::mesh::PartOrdinal> surfaceOrdinals;
-    get_input_surfaces_touching_block(my_input_block_surface_connectivity, block_ptr->mesh_meta_data_ordinal(), surfaceOrdinals);
+    const std::set<stk::mesh::PartOrdinal> surfaceOrdinals = my_input_block_surface_connectivity.get_surfaces_touching_block(block_ptr->mesh_meta_data_ordinal());
     for (auto && surfaceOrdinal : surfaceOrdinals)
     {
       // For each surface, add IO Part/Level Set pairing to maps
diff --git a/packages/krino/krino/krino_lib/Akri_Phase_Support.hpp b/packages/krino/krino/krino_lib/Akri_Phase_Support.hpp
index a0f55b452646..a28b0aead806 100644
--- a/packages/krino/krino/krino_lib/Akri_Phase_Support.hpp
+++ b/packages/krino/krino/krino_lib/Akri_Phase_Support.hpp
@@ -56,6 +56,9 @@ struct LS_Field
 
 class Phase_Support {
 public:
+  Phase_Support (const Phase_Support&) = delete;
+  Phase_Support& operator= (const Phase_Support&) = delete;
+
   typedef std::set<stk::mesh::Part*,stk::mesh::PartLess> PartSet;
 
   static bool exists_and_has_phases_defined(const stk::mesh::MetaData & meta);
@@ -69,10 +72,6 @@ class Phase_Support {
   static void check_isovariable_field_existence_on_decomposed_blocks(const stk::mesh::MetaData & meta, const std::vector<LS_Field> & lsFields, const bool conformal_parts_require_field);
 
   void get_blocks_touching_surface(const std::string & surface_name, std::vector<std::string> & block_names);
-  static void get_input_surfaces_touching_block(const Block_Surface_Connectivity & input_block_surface_info,
-      const stk::mesh::PartOrdinal block_ordinal, std::set<stk::mesh::PartOrdinal> & surface_ordinals);
-  void get_input_blocks_touching_surface(const Block_Surface_Connectivity & input_block_surface_info,
-      const stk::mesh::PartOrdinal surfaceOrdinal, std::set<stk::mesh::PartOrdinal> & blockOrdinals) const;
 
   void check_phase_parts() const;
 
@@ -131,6 +130,7 @@ class Phase_Support {
   const AuxMetaData & aux_meta() const { ThrowAssertMsg(myAuxMeta, "AuxMetaData not yet set on Phase_Support"); return *myAuxMeta; }
   AuxMetaData & aux_meta() { ThrowAssertMsg(myAuxMeta, "AuxMetaData not yet set on Phase_Support"); return *myAuxMeta; }
 
+  void update_touching_parts_for_phase_part(const stk::mesh::Part & origPart, const stk::mesh::Part & phasePart, const PhaseTag & phase);
   const PhasePartTag * find_conformal_phase_part(const stk::mesh::Part & conformal_part) const;
   void create_nonconformal_parts(const PartSet & decomposed_ioparts);
   void addPhasePart(stk::mesh::Part & io_part, PhasePartSet & phase_parts, const NamedPhase & ls_phase);
diff --git a/packages/krino/krino/krino_lib/Akri_SharpFeature.cpp b/packages/krino/krino/krino_lib/Akri_SharpFeature.cpp
new file mode 100644
index 000000000000..fd41503ed1ae
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_SharpFeature.cpp
@@ -0,0 +1,352 @@
+#include "Akri_SharpFeature.hpp"
+
+#include <array>
+#include <type_traits>
+
+#include <stk_mesh/base/BulkData.hpp>
+#include <stk_mesh/base/Entity.hpp>
+#include <stk_mesh/base/MetaData.hpp>
+#include <Akri_DiagWriter.hpp>
+#include <Akri_MeshHelpers.hpp>
+#include "Akri_AuxMetaData.hpp"
+#include "Akri_CDMesh_Utils.hpp"
+#include "Akri_Phase_Support.hpp"
+
+namespace krino {
+
+uint64_t edge_from_edge_node_offsets(stk::mesh::Entity::entity_value_type edgeNodeOffset0, stk::mesh::Entity::entity_value_type edgeNodeOffset1)
+{
+  static_assert(std::is_same<stk::mesh::Entity::entity_value_type, uint32_t>::value, "stk::mesh::Entity must be 32 bit.");
+  return (static_cast<uint64_t>(edgeNodeOffset1) << 32) + edgeNodeOffset0;
+}
+
+uint64_t edge_from_edge_nodes(const stk::mesh::BulkData & mesh, stk::mesh::Entity edgeNode0, stk::mesh::Entity edgeNode1)
+{
+  return (mesh.identifier(edgeNode0) < mesh.identifier(edgeNode1)) ?
+      edge_from_edge_node_offsets(edgeNode0.local_offset(), edgeNode1.local_offset()) :
+      edge_from_edge_node_offsets(edgeNode1.local_offset(), edgeNode0.local_offset());
+}
+
+std::array<stk::mesh::Entity,2> get_edge_nodes(uint64_t edge)
+{
+  static_assert(std::is_same<stk::mesh::Entity::entity_value_type, uint32_t>::value, "stk::mesh::Entity must be 32 bit.");
+  return std::array<stk::mesh::Entity, 2>{stk::mesh::Entity(edge & 0xFFFFFFFF), stk::mesh::Entity(edge >> 32)};
+}
+
+std::array<uint64_t,6> get_tet_edges(const stk::mesh::BulkData & mesh, const stk::mesh::Entity element)
+{
+  StkMeshEntities elementNodes{mesh.begin_nodes(element), mesh.end_nodes(element)};
+  return { edge_from_edge_nodes(mesh, elementNodes[0],elementNodes[1]),
+           edge_from_edge_nodes(mesh, elementNodes[1],elementNodes[2]),
+           edge_from_edge_nodes(mesh, elementNodes[2],elementNodes[0]),
+           edge_from_edge_nodes(mesh, elementNodes[3],elementNodes[0]),
+           edge_from_edge_nodes(mesh, elementNodes[3],elementNodes[1]),
+           edge_from_edge_nodes(mesh, elementNodes[3],elementNodes[2]) };
+}
+
+std::array<uint64_t,3> get_tri_edges(const stk::mesh::BulkData & mesh, const stk::mesh::Entity element)
+{
+  StkMeshEntities elementNodes{mesh.begin_nodes(element), mesh.end_nodes(element)};
+  return { edge_from_edge_nodes(mesh, elementNodes[0],elementNodes[1]),
+           edge_from_edge_nodes(mesh, elementNodes[1],elementNodes[2]),
+           edge_from_edge_nodes(mesh, elementNodes[2],elementNodes[0]) };
+}
+
+uint64_t get_segment_edge(const stk::mesh::BulkData & mesh, const stk::mesh::Entity element)
+{
+  StkMeshEntities elementNodes{mesh.begin_nodes(element), mesh.end_nodes(element)};
+  return edge_from_edge_nodes(mesh, elementNodes[0],elementNodes[1]);
+}
+
+void fill_element_edges(const stk::mesh::BulkData & mesh, const unsigned dim, const stk::mesh::Entity element, std::vector<uint64_t> & elementEdges)
+{
+  if (dim == 2)
+  {
+    const std::array<uint64_t,3> triEdges = get_tri_edges(mesh, element);
+    elementEdges.assign(triEdges.begin(), triEdges.end());
+    return;
+  }
+
+  const std::array<uint64_t,6> tetEdges = get_tet_edges(mesh, element);
+  elementEdges.assign(tetEdges.begin(), tetEdges.end());
+}
+
+void fill_face_edges(const stk::mesh::BulkData & mesh, const stk::mesh::Entity face, std::vector<uint64_t> & sideEdges)
+{
+  const std::array<uint64_t,3> triEdges = get_tri_edges(mesh, face);
+  sideEdges.assign(triEdges.begin(), triEdges.end());
+}
+
+int get_edge_owner(const stk::mesh::BulkData & mesh, const uint64_t edge)
+{
+  const std::array<stk::mesh::Entity,2> & edgeNodes = get_edge_nodes(edge);
+  return std::min(mesh.parallel_owner_rank(edgeNodes[0]), mesh.parallel_owner_rank(edgeNodes[1]));
+}
+
+std::vector<uint64_t> get_owned_edges(const stk::mesh::BulkData & mesh, const stk::mesh::Selector & elementSelector)
+{
+  std::vector<uint64_t> edges;
+  std::vector<uint64_t> elementEdges;
+  const unsigned dim = mesh.mesh_meta_data().spatial_dimension();
+  for(const auto & bucketPtr : mesh.get_buckets(stk::topology::ELEMENT_RANK, elementSelector))
+  {
+    for(const auto & elem : *bucketPtr)
+    {
+      fill_element_edges(mesh, dim, elem, elementEdges);
+      for (auto edge : elementEdges)
+        if (get_edge_owner(mesh, edge) == mesh.parallel_rank())
+          edges.push_back(edge);
+    }
+  }
+
+  stk::util::sort_and_unique(edges);
+
+  return edges;
+}
+
+static bool does_entity_have_selected_element(const stk::mesh::BulkData & mesh, const stk::mesh::Entity entity, const stk::mesh::Selector & elementSelector)
+{
+  for (auto && elem : StkMeshEntities{mesh.begin_elements(entity), mesh.end_elements(entity)})
+    if (elementSelector(mesh.bucket(elem)))
+      return true;
+  return false;
+}
+
+static stk::mesh::Selector
+build_side_selector(const stk::mesh::BulkData & mesh)
+{
+  const AuxMetaData & auxMeta = AuxMetaData::get(mesh.mesh_meta_data());
+  const Phase_Support & phaseSupport = Phase_Support::get(mesh.mesh_meta_data());
+  const stk::mesh::EntityRank sideRank = mesh.mesh_meta_data().side_rank();
+
+  stk::mesh::PartVector sideParts;
+  for (auto && part : mesh.mesh_meta_data().get_parts())
+    if (is_part_to_check_for_snapping_compatibility(phaseSupport, auxMeta, sideRank, *part))
+      sideParts.push_back(part);
+
+  return stk::mesh::selectUnion(sideParts);
+}
+
+bool edge_has_owned_node(const stk::mesh::BulkData & mesh, const uint64_t edge)
+{
+  const std::array<stk::mesh::Entity,2> & edgeNodes = get_edge_nodes(edge);
+  return mesh.parallel_rank() == mesh.parallel_owner_rank(edgeNodes[0]) || mesh.parallel_rank() == mesh.parallel_owner_rank(edgeNodes[1]);
+}
+
+std::vector<uint64_t> get_edges_with_owned_nodes_of_selected_faces(const stk::mesh::BulkData & mesh, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector)
+{
+  std::vector<uint64_t> edges;
+  std::vector<uint64_t> sideEdges;
+  for(const auto & bucketPtr : mesh.buckets(stk::topology::FACE_RANK))
+  {
+    if (sideSelector(*bucketPtr))
+    {
+      for(const auto & side : *bucketPtr)
+      {
+        if (does_entity_have_selected_element(mesh, side, elementSelector))
+        {
+          fill_face_edges(mesh, side, sideEdges);
+          for (auto edge : sideEdges)
+            if (edge_has_owned_node(mesh, edge))
+              edges.push_back(edge);
+        }
+      }
+    }
+  }
+
+  stk::util::sort_and_unique(edges);
+
+  return edges;
+}
+
+std::vector<stk::mesh::Entity> get_owned_nodes_of_edges_with_selected_sides(const stk::mesh::BulkData & mesh, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector)
+{
+  std::vector<stk::mesh::Entity> edgeNodes;
+  for(const auto & bucketPtr : mesh.buckets(stk::topology::NODE_RANK))
+    if (bucketPtr->owned() && sideSelector(*bucketPtr))
+      for(const auto & node : *bucketPtr)
+        if (does_entity_have_selected_element(mesh, node, elementSelector))
+          edgeNodes.push_back(node);
+  return edgeNodes;
+}
+
+bool is_intersection_point_node_compatible_for_snapping_based_on_sharp_features(const SharpFeatureInfo & sharpFeatureInfo, const stk::mesh::Entity intPtNode, const std::vector<stk::mesh::Entity> & intPtNodes)
+{
+  const SharpFeatureConstraint * constraint = sharpFeatureInfo.get_constraint(intPtNode);
+
+  if (constraint == nullptr) return true;
+  if (intPtNodes.size() != 2 || constraint->is_pinned()) return false;
+
+  const std::array<stk::mesh::Entity,2> sharpEdgeNodes = constraint->get_sharp_edge_nodes();
+  for (auto && sharpEdgeNode : sharpEdgeNodes)
+    if (intPtNodes[0] == sharpEdgeNode || intPtNodes[1] == sharpEdgeNode)
+      return true;
+  return false;
+}
+
+void SharpFeatureInfo::find_sharp_features(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const double cosFeatureAngle)
+{
+  const stk::mesh::Selector sideSelector = build_side_selector(mesh);
+
+  if (mesh.mesh_meta_data().spatial_dimension() == 2)
+    find_sharp_features_2D(mesh, coordsField, elementSelector, sideSelector, cosFeatureAngle);
+  find_sharp_features_3D(mesh, coordsField, elementSelector, sideSelector, cosFeatureAngle);
+
+  if (krinolog.shouldPrint(LOG_DEBUG))
+  {
+    for (auto && entry : myNodeToConstrainedNeighbors)
+    {
+      stk::mesh::Entity node = entry.first;
+      const SharpFeatureConstraint & constraint = entry.second;
+      krinolog << "Node " << mesh.identifier(node) << " is ";
+      if (constraint.is_pinned())
+      {
+        krinolog << "pinned." << stk::diag::dendl;
+      }
+      else
+      {
+        const std::array<stk::mesh::Entity,2> sharpEdgeNbrs = constraint.get_sharp_edge_nodes();
+        krinolog << "constrained to move along edge between nodes " << mesh.identifier(sharpEdgeNbrs[0]) << " and " << mesh.identifier(sharpEdgeNbrs[1]) << "." << std::endl;
+      }
+    }
+  }
+}
+
+void SharpFeatureInfo::find_sharp_features_3D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, const double cosFeatureAngle)
+{
+  std::map<stk::mesh::Entity,std::vector<stk::mesh::Entity>> nodeToSharpEdgeNeighbors;
+  const int parallelRank = mesh.parallel_rank();
+
+  const std::vector<uint64_t> edgesWithOwnedNodes = get_edges_with_owned_nodes_of_selected_faces(mesh, elementSelector, sideSelector);
+  for (auto edge : edgesWithOwnedNodes)
+  {
+    if (edge_has_sharp_feature_3D(mesh, coordsField, elementSelector, sideSelector, cosFeatureAngle, edge))
+    {
+      const std::array<stk::mesh::Entity,2> & edgeNodes = get_edge_nodes(edge);
+      if (parallelRank == mesh.parallel_owner_rank(edgeNodes[0]))
+        nodeToSharpEdgeNeighbors[edgeNodes[0]].push_back(edgeNodes[1]);
+      if (parallelRank == mesh.parallel_owner_rank(edgeNodes[1]))
+        nodeToSharpEdgeNeighbors[edgeNodes[1]].push_back(edgeNodes[0]);
+    }
+  }
+
+  for (auto && entry : nodeToSharpEdgeNeighbors)
+    if (entry.second.size() == 2)
+      myNodeToConstrainedNeighbors.insert({entry.first, SharpFeatureConstraint::edge_constraint(entry.second[0], entry.second[1])});
+    else if (entry.second.size() > 2)
+      myNodeToConstrainedNeighbors.insert({entry.first, SharpFeatureConstraint::pinned_constraint()});
+}
+
+void SharpFeatureInfo::find_sharp_features_2D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, const double cosFeatureAngle)
+{
+  std::map<stk::mesh::Entity,std::vector<stk::mesh::Entity>> nodeToSharpEdgeNeighbors;
+
+  const std::vector<stk::mesh::Entity> ownedSideNodes = get_owned_nodes_of_edges_with_selected_sides(mesh, elementSelector, sideSelector);
+  for (auto node : ownedSideNodes)
+    if (node_has_sharp_feature_2D(mesh, coordsField, elementSelector, sideSelector, cosFeatureAngle, node))
+      myNodeToConstrainedNeighbors.insert({node, SharpFeatureConstraint::pinned_constraint()});
+}
+
+void filter_sides_based_on_attached_element_and_side_parts(const stk::mesh::BulkData & mesh, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, std::vector<stk::mesh::Entity> & sides)
+{
+  size_t numRetainedSides = 0;
+  for (auto && side : sides)
+    if (sideSelector(mesh.bucket(side)) && does_entity_have_selected_element(mesh, side, elementSelector))
+      sides[numRetainedSides++] = side;
+  sides.resize(numRetainedSides);
+}
+
+bool SharpFeatureInfo::angle_is_sharp_between_any_two_sides_2D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const double cosFeatureAngle, const stk::mesh::Entity node, const std::vector<stk::mesh::Entity> & sidesOfEdge)
+{
+  if (sidesOfEdge.size() > 1)
+  {
+    const Vector3d nodeCoords(field_data<double>(coordsField, node),2);
+
+    std::vector<Vector3d> sideVec;
+    sideVec.reserve(sidesOfEdge.size());
+    for (auto && side : sidesOfEdge)
+    {
+      StkMeshEntities sideNodes{mesh.begin_nodes(side), mesh.end_nodes(side)};
+      ThrowAssertMsg(sideNodes[0] == node || sideNodes[1] == node, "Did not find side node for segment.");
+      const stk::mesh::Entity sideNode = (sideNodes[1] == node) ? sideNodes[0] : sideNodes[1];
+      const Vector3d coordsOfSideNode(field_data<double>(coordsField, sideNode),2);
+      sideVec.push_back((coordsOfSideNode - nodeCoords).unit_vector());
+    }
+
+    for (size_t i=0; i<sideVec.size(); ++i)
+      for (size_t j=i+1; j<sideVec.size(); ++j)
+        if (Dot(sideVec[i], sideVec[j]) > cosFeatureAngle)
+          return true;
+  }
+  return false;
+}
+
+double cosine_of_dihedral_angle_3D(const Vector3d & edgeVec, const Vector3d & faceTangent0, const Vector3d & faceTangent1)
+{
+  // https://en.wikipedia.org/wiki/Dihedral_angle
+  const Vector3d crossEdgeFace0 = Cross(edgeVec, faceTangent0);
+  const Vector3d crossEdgeFace1 = Cross(edgeVec, faceTangent1);
+
+  return Dot(crossEdgeFace0,crossEdgeFace1) / (crossEdgeFace0.length()*crossEdgeFace1.length());
+}
+
+stk::mesh::Entity get_face_node_not_on_edge(const stk::mesh::BulkData & mesh, const std::array<stk::mesh::Entity,2> & edgeNodes, const stk::mesh::Entity sideOfEdge)
+{
+  StkMeshEntities faceNodes{mesh.begin_nodes(sideOfEdge), mesh.end_nodes(sideOfEdge)};
+  for (auto && faceNode : faceNodes)
+    if (faceNode != edgeNodes[0] && faceNode != edgeNodes[1])
+      return faceNode;
+  ThrowRuntimeError("Did not find face node not on edge.");
+}
+
+bool SharpFeatureInfo::angle_is_sharp_between_any_two_sides_3D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const double cosFeatureAngle, const std::array<stk::mesh::Entity,2> & edgeNodes, const std::vector<stk::mesh::Entity> & sidesOfEdge)
+{
+  if (sidesOfEdge.size() > 1)
+  {
+    const Vector3d edgeNodeCoords0(field_data<double>(coordsField, edgeNodes[0]));
+    const Vector3d edgeNodeCoords1(field_data<double>(coordsField, edgeNodes[1]));
+    const Vector3d edgeVec = edgeNodeCoords1 - edgeNodeCoords0;
+
+    std::vector<Vector3d> faceTangent;
+    faceTangent.reserve(sidesOfEdge.size());
+    for (auto && side : sidesOfEdge)
+    {
+      const Vector3d coordsOfNonEdgeNodeOfSide(field_data<double>(coordsField, get_face_node_not_on_edge(mesh, edgeNodes, side)));
+      faceTangent.push_back(coordsOfNonEdgeNodeOfSide - edgeNodeCoords0);
+    }
+
+    for (size_t i=0; i<faceTangent.size(); ++i)
+      for (size_t j=i+1; j<faceTangent.size(); ++j)
+        if (cosine_of_dihedral_angle_3D(edgeVec, faceTangent[i], faceTangent[j]) > cosFeatureAngle)
+          return true;
+  }
+  return false;
+}
+
+bool SharpFeatureInfo::edge_has_sharp_feature_3D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, const double cosFeatureAngle, const uint64_t edge)
+{
+  const std::array<stk::mesh::Entity,2> & edgeNodes = get_edge_nodes(edge);
+  std::vector<stk::mesh::Entity> sidesOfEdge;
+  stk::mesh::get_entities_through_relations(mesh, {edgeNodes[0], edgeNodes[1]}, stk::topology::FACE_RANK, sidesOfEdge);
+  if (sidesOfEdge.size() > 1)
+    filter_sides_based_on_attached_element_and_side_parts(mesh, elementSelector, sideSelector, sidesOfEdge);
+  return angle_is_sharp_between_any_two_sides_3D(mesh, coordsField, cosFeatureAngle, edgeNodes, sidesOfEdge);
+}
+
+bool SharpFeatureInfo::node_has_sharp_feature_2D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, const double cosFeatureAngle, const stk::mesh::Entity node)
+{
+  std::vector<stk::mesh::Entity> sidesOfEdge(mesh.begin_edges(node), mesh.end_edges(node));
+  if (sidesOfEdge.size() > 1)
+    filter_sides_based_on_attached_element_and_side_parts(mesh, elementSelector, sideSelector, sidesOfEdge);
+  return angle_is_sharp_between_any_two_sides_2D(mesh, coordsField, cosFeatureAngle, node, sidesOfEdge);
+}
+
+const SharpFeatureConstraint * SharpFeatureInfo::get_constraint(const stk::mesh::Entity node) const
+{
+  const auto iter = myNodeToConstrainedNeighbors.find(node);
+  if (iter != myNodeToConstrainedNeighbors.end())
+    return &(iter->second);
+  return nullptr;
+}
+
+}
diff --git a/packages/krino/krino/krino_lib/Akri_SharpFeature.hpp b/packages/krino/krino/krino_lib/Akri_SharpFeature.hpp
new file mode 100644
index 000000000000..948c44ccb7ef
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_SharpFeature.hpp
@@ -0,0 +1,44 @@
+#ifndef KRINO_KRINO_KRINO_LIB_AKRI_SHARPFEATURE_HPP_
+#define KRINO_KRINO_KRINO_LIB_AKRI_SHARPFEATURE_HPP_
+#include <map>
+#include <stk_mesh/base/BulkData.hpp>
+#include <stk_mesh/base/Entity.hpp>
+#include <stk_util/util/ReportHandler.hpp>
+#include "Akri_FieldRef.hpp"
+
+namespace krino {
+
+class SharpFeatureConstraint
+{
+public:
+  bool is_pinned() const { return myConstrainedEdgeNeighbors[0] == invalid_entity() && myConstrainedEdgeNeighbors[1] == invalid_entity(); }
+  bool is_constrained_on_edge() const { return myConstrainedEdgeNeighbors[0] != invalid_entity() && myConstrainedEdgeNeighbors[1] != invalid_entity(); }
+  const std::array<stk::mesh::Entity,2> & get_sharp_edge_nodes() const { ThrowAssert(is_constrained_on_edge()); return myConstrainedEdgeNeighbors; }
+  static SharpFeatureConstraint edge_constraint(const stk::mesh::Entity entity0, const stk::mesh::Entity entity1) { return SharpFeatureConstraint{entity0, entity1}; }
+  static SharpFeatureConstraint pinned_constraint() { return SharpFeatureConstraint(invalid_entity(),invalid_entity()); }
+private:
+  static stk::mesh::Entity invalid_entity() { static const stk::mesh::Entity invalidEntity; return invalidEntity; }
+  SharpFeatureConstraint(const stk::mesh::Entity entity0, const stk::mesh::Entity entity1) : myConstrainedEdgeNeighbors{entity0, entity1} {}
+  std::array<stk::mesh::Entity,2> myConstrainedEdgeNeighbors;
+};
+
+class SharpFeatureInfo
+{
+public:
+  void find_sharp_features(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const double cosFeatureAngle);
+  const SharpFeatureConstraint * get_constraint(const stk::mesh::Entity node) const;
+private:
+  void find_sharp_features_2D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, const double cosFeatureAngle);
+  void find_sharp_features_3D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, const double cosFeatureAngle);
+  static bool edge_has_sharp_feature_3D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, const double cosFeatureAngle, const uint64_t edge);
+  static bool node_has_sharp_feature_2D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const stk::mesh::Selector & elementSelector, const stk::mesh::Selector & sideSelector, const double cosFeatureAngle, const stk::mesh::Entity node );
+  static bool angle_is_sharp_between_any_two_sides_3D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const double cosFeatureAngle, const std::array<stk::mesh::Entity,2> & edgeNodes, const std::vector<stk::mesh::Entity> & sidesOfEdge);
+  static bool angle_is_sharp_between_any_two_sides_2D(const stk::mesh::BulkData & mesh, const FieldRef coordsField, const double cosFeatureAngle, const stk::mesh::Entity node, const std::vector<stk::mesh::Entity> & sidesOfEdge);
+  std::map<stk::mesh::Entity,SharpFeatureConstraint> myNodeToConstrainedNeighbors;
+};
+
+bool is_intersection_point_node_compatible_for_snapping_based_on_sharp_features(const SharpFeatureInfo & sharpFeatureInfo, const stk::mesh::Entity intPtNode, const std::vector<stk::mesh::Entity> & intPtNodes);
+
+}
+
+#endif /* KRINO_KRINO_KRINO_LIB_AKRI_SHARPFEATURE_HPP_ */
diff --git a/packages/krino/krino/krino_lib/Akri_Snap.cpp b/packages/krino/krino/krino_lib/Akri_Snap.cpp
index cfe55cba430f..0a5f402ef34b 100644
--- a/packages/krino/krino/krino_lib/Akri_Snap.cpp
+++ b/packages/krino/krino/krino_lib/Akri_Snap.cpp
@@ -17,6 +17,7 @@
 #include <Akri_MeshHelpers.hpp>
 #include <Akri_Phase_Support.hpp>
 #include <Akri_QualityMetric.hpp>
+#include <Akri_SharpFeature.hpp>
 #include <Akri_SnapIndependentSetFinder.hpp>
 #include <Akri_SnapInfo.hpp>
 #include <stk_mesh/base/BulkData.hpp>
@@ -26,18 +27,13 @@
 namespace krino
 {
 
-static void fill_node_locations(const int dim, const FieldRef coordsField, const std::vector<stk::mesh::Entity> & nodes, std::vector<stk::math::Vector3d> & nodeLocations)
-{
-  nodeLocations.clear();
-  for (auto node : nodes)
-    nodeLocations.emplace_back(field_data<double>(coordsField, node), dim);
-}
-
-static stk::math::Vector3d compute_intersection_point_location(const int dim, const FieldRef coordsField, const IntersectionPoint & intersectionPoint)
+static stk::math::Vector3d compute_intersection_point_location(
+    const int dim,
+    const FieldRef coordsField,
+    const std::vector<stk::mesh::Entity> & intPtNodes,
+    const std::vector<double> & intPtWeights)
 {
-  const auto & intPtNodes = intersectionPoint.get_nodes();
-  const auto & intPtWeights = intersectionPoint.get_weights();
-  stk::math::Vector3d snapLocation{stk::math::Vector3d::ZERO};
+  stk::math::Vector3d snapLocation = stk::math::Vector3d::ZERO;
   for (size_t i=0; i<intPtNodes.size(); ++i)
   {
     const stk::math::Vector3d nodeLocation(field_data<double>(coordsField, intPtNodes[i]), dim);
@@ -46,6 +42,11 @@ static stk::math::Vector3d compute_intersection_point_location(const int dim, co
   return snapLocation;
 }
 
+static stk::math::Vector3d compute_intersection_point_location(const int dim, const FieldRef coordsField, const IntersectionPoint & intersectionPoint)
+{
+  return compute_intersection_point_location(dim, coordsField, intersectionPoint.get_nodes(), intersectionPoint.get_weights());
+}
+
 static void fill_global_ids_of_elements_using_node(const stk::mesh::BulkData & mesh,
     const stk::mesh::Selector & elementSelector,
     stk::mesh::Entity node,
@@ -159,14 +160,6 @@ static double estimate_quality_of_cutting_intersection_points(const stk::mesh::B
   return qualityAfterCut;
 }
 
-static bool parts_are_compatible_for_snapping(const stk::mesh::BulkData & mesh, const AuxMetaData & auxMeta, const Phase_Support & phaseSupport, stk::mesh::Entity node, const std::vector<stk::mesh::Entity> & interpNodes)
-{
-  for (auto && interpNode : interpNodes)
-    if (interpNode != node && !parts_are_compatible_for_snapping_when_ignoring_phase(mesh, auxMeta, phaseSupport, node, interpNode))
-      return false;
-  return true;
-}
-
 static double get_node_intersection_point_weight(const IntersectionPoint & intersectionPoint, stk::mesh::Entity node)
 {
   const std::vector<stk::mesh::Entity> & nodes = intersectionPoint.get_nodes();
@@ -224,15 +217,16 @@ static void sort_intersection_points_for_cutting(const stk::mesh::BulkData & mes
 static void fill_sorted_intersection_point_indices_for_node_for_domains(const stk::mesh::BulkData & mesh,
     const FieldRef coordsField,
     const std::vector<IntersectionPoint> & intersectionPoints,
-    const std::vector<size_t> & candidatesIntersectionPointIndices,
+    const std::vector<std::pair<size_t,bool>> & nodeIntersectionPointIndicesAndWhichSnapsAllowed,
     const stk::mesh::Entity node,
     const std::vector<int> & domains,
     const bool globalIDsAreParallelConsistent,
     std::vector<size_t> & sortedIntersectionPointIndices)
 {
   sortedIntersectionPointIndices.clear();
-  for (auto && intPtIndex : candidatesIntersectionPointIndices)
+  for (auto && intPtIndexAndIsSnapAllowed : nodeIntersectionPointIndicesAndWhichSnapsAllowed)
   {
+    const size_t intPtIndex = intPtIndexAndIsSnapAllowed.first;
     if (first_sorted_vector_of_domains_contains_all_domains_in_second_vector(domains, intersectionPoints[intPtIndex].get_sorted_domains()))
       sortedIntersectionPointIndices.push_back(intPtIndex);
   }
@@ -257,22 +251,63 @@ static std::set<stk::mesh::Entity> get_intersected_elements(const stk::mesh::Bul
   return intersectedElements;
 }
 
-static std::map<stk::mesh::Entity, std::vector<size_t>> get_node_to_intersection_point_indices(const stk::mesh::BulkData & mesh,
+static std::vector<bool> which_intersection_point_nodes_are_compatible_for_snapping_based_on_parts_and_sharp_features(const stk::mesh::BulkData & mesh,
+    const AuxMetaData & auxMeta,
+    const Phase_Support & phaseSupport,
+    const SharpFeatureInfo * sharpFeatureInfo,
+    const std::vector<stk::mesh::Entity> & intPtNodes)
+{
+  std::vector<bool> whichSnapsAreAllowed = which_intersection_point_nodes_are_compatible_for_snapping(mesh, auxMeta, phaseSupport, intPtNodes);
+  if (nullptr != sharpFeatureInfo)
+  {
+    for (size_t iNode=0; iNode<intPtNodes.size(); ++iNode)
+    {
+      if (whichSnapsAreAllowed[iNode])
+      {
+        whichSnapsAreAllowed[iNode] = is_intersection_point_node_compatible_for_snapping_based_on_sharp_features(*sharpFeatureInfo, intPtNodes[iNode], intPtNodes);
+        if (false == whichSnapsAreAllowed[iNode])
+        {
+          krinolog << "Blocked snap of node " << mesh.identifier(intPtNodes[iNode]) << " to int pt with nodes ";
+          for (auto && intPtNode : intPtNodes)
+            krinolog << mesh.identifier(intPtNode) << " ";
+          krinolog << stk::diag::dendl;
+        }
+      }
+    }
+  }
+
+  return whichSnapsAreAllowed;
+}
+
+typedef std::map<stk::mesh::Entity, std::vector<std::pair<size_t,bool>>> mapFromEntityToIntPtIndexAndSnapAllowed;
+
+static mapFromEntityToIntPtIndexAndSnapAllowed get_node_to_intersection_point_indices_and_which_snaps_allowed(const stk::mesh::BulkData & mesh,
+    const SharpFeatureInfo * sharpFeatureInfo,
     const std::vector<IntersectionPoint> & intersectionPoints)
 {
-  std::map<stk::mesh::Entity, std::vector<size_t>> nodeToInsersectionPointIndices;
+  const AuxMetaData & auxMeta = AuxMetaData::get(mesh.mesh_meta_data());
+  const Phase_Support & phaseSupport = Phase_Support::get(mesh.mesh_meta_data());
+
+  mapFromEntityToIntPtIndexAndSnapAllowed nodeToIntPtIndicesAndWhichSnapsAllowed;
   for (size_t intersectionPointIndex=0; intersectionPointIndex<intersectionPoints.size(); ++intersectionPointIndex)
-    for (auto && node : intersectionPoints[intersectionPointIndex].get_nodes())
+  {
+    const auto & intPtNodes = intersectionPoints[intersectionPointIndex].get_nodes();
+    const std::vector<bool> whichSnapsAreAllowed = which_intersection_point_nodes_are_compatible_for_snapping_based_on_parts_and_sharp_features(mesh, auxMeta, phaseSupport, sharpFeatureInfo, intPtNodes);
+    for (size_t iNode=0; iNode<intPtNodes.size(); ++iNode)
+    {
+      stk::mesh::Entity node = intPtNodes[iNode];
       if (mesh.bucket(node).owned())
-        nodeToInsersectionPointIndices[node].push_back(intersectionPointIndex);
-  return nodeToInsersectionPointIndices;
+        nodeToIntPtIndicesAndWhichSnapsAllowed[node].emplace_back(intersectionPointIndex,whichSnapsAreAllowed[iNode]);
+    }
+  }
+  return nodeToIntPtIndicesAndWhichSnapsAllowed;
 }
 
 std::map<std::vector<int>, std::map<stk::mesh::EntityId,double>> determine_quality_per_node_per_domain(const stk::mesh::BulkData & mesh,
     const stk::mesh::Selector & elementSelector,
     const FieldRef coordsField,
     const std::vector<IntersectionPoint> & intersectionPoints,
-    const std::map<stk::mesh::Entity, std::vector<size_t>> & nodeToInsersectionPointIndices,
+    const mapFromEntityToIntPtIndexAndSnapAllowed & nodeToIntPtIndicesAndWhichSnapsAllowed,
     const QualityMetric &qualityMetric,
     const bool globalIDsAreParallelConsistent)
 {
@@ -283,18 +318,18 @@ std::map<std::vector<int>, std::map<stk::mesh::EntityId,double>> determine_quali
   std::vector<stk::math::Vector3d> elemNodeCoords;
 
   std::map<std::vector<int>, std::map<stk::mesh::EntityId,double>> domainsToNodesToQuality;
-  for (auto entry : nodeToInsersectionPointIndices)
+  for (auto entry : nodeToIntPtIndicesAndWhichSnapsAllowed)
   {
     stk::mesh::Entity node = entry.first;
-    const auto nodeIntersectionPointIndices = entry.second;
+    const auto nodeIntersectionPointIndicesAndWhichSnapsAllowed = entry.second;
 
     std::set<std::vector<int>> nodeIntPtDomains;
-    for (auto && intPtIndex : nodeIntersectionPointIndices)
-      nodeIntPtDomains.insert(intersectionPoints[intPtIndex].get_sorted_domains());
+    for (auto && intPtIndexAndIsSnapAllowed : nodeIntersectionPointIndicesAndWhichSnapsAllowed)
+      nodeIntPtDomains.insert(intersectionPoints[intPtIndexAndIsSnapAllowed.first].get_sorted_domains());
 
     for (auto && intPtDomains : nodeIntPtDomains)
     {
-      fill_sorted_intersection_point_indices_for_node_for_domains(mesh, coordsField, intersectionPoints, nodeIntersectionPointIndices, node, intPtDomains, globalIDsAreParallelConsistent, sortedIntersectionPointIndices);
+      fill_sorted_intersection_point_indices_for_node_for_domains(mesh, coordsField, intersectionPoints, nodeIntersectionPointIndicesAndWhichSnapsAllowed, node, intPtDomains, globalIDsAreParallelConsistent, sortedIntersectionPointIndices);
       const std::set<stk::mesh::Entity> intersectedElements = get_intersected_elements(mesh, elementSelector, intersectionPoints, sortedIntersectionPointIndices);
 
       double qualityAfterCut = qualityMetric.get_best_value_for_metric();
@@ -320,13 +355,11 @@ append_snap_infos_from_intersection_points(const stk::mesh::BulkData & mesh,
     const stk::mesh::Selector & elementSelector,
     const NodeToCapturedDomainsMap & nodesToCapturedDomains,
     const std::vector<IntersectionPoint> & intersectionPoints,
-    const std::map<stk::mesh::Entity, std::vector<size_t>> & nodeToInsersectionPointIndices,
+    const mapFromEntityToIntPtIndexAndSnapAllowed & nodeToIntPtIndicesAndWhichSnapsAllowed,
     const QualityMetric &qualityMetric,
     const bool globalIDsAreParallelConsistent,
     std::vector<SnapInfo> & snapInfos)
 {
-  const AuxMetaData & auxMeta = AuxMetaData::get(mesh.mesh_meta_data());
-  const Phase_Support phaseSupport = Phase_Support::get(mesh.mesh_meta_data());
   const FieldRef coordsField(mesh.mesh_meta_data().coordinate_field());
   const int dim = mesh.mesh_meta_data().spatial_dimension();
   std::vector<int> procsThatNeedToKnowAboutThisInfo;
@@ -334,24 +367,26 @@ append_snap_infos_from_intersection_points(const stk::mesh::BulkData & mesh,
 
   int owner = mesh.parallel_rank();
 
-  const auto domainsToNodesToQuality = determine_quality_per_node_per_domain(mesh, elementSelector, coordsField, intersectionPoints, nodeToInsersectionPointIndices, qualityMetric, globalIDsAreParallelConsistent);
+  const auto domainsToNodesToQuality = determine_quality_per_node_per_domain(mesh, elementSelector, coordsField, intersectionPoints, nodeToIntPtIndicesAndWhichSnapsAllowed, qualityMetric, globalIDsAreParallelConsistent);
 
-  for (auto entry : nodeToInsersectionPointIndices)
+  for (auto entry : nodeToIntPtIndicesAndWhichSnapsAllowed)
   {
     stk::mesh::Entity node = entry.first;
-    const auto nodeIntersectionPointIndices = entry.second;
+    const auto nodeIntersectionPointIndicesAndWhichSnapsAllowed = entry.second;
 
     if (mesh.bucket(node).owned())
     {
       const stk::math::Vector3d nodeLocation(field_data<double>(coordsField, node), dim);
 
-      for (auto && intPtIndex : nodeIntersectionPointIndices)
+      for (auto && intPtIndexAndIsSnapAllowed : nodeIntersectionPointIndicesAndWhichSnapsAllowed)
       {
+        const size_t intPtIndex = intPtIndexAndIsSnapAllowed.first;
+        const bool isSnapAllowed = intPtIndexAndIsSnapAllowed.second;
         const IntersectionPoint & intersectionPoint = intersectionPoints[intPtIndex];
+
         const auto & intPtNodes = intersectionPoint.get_nodes();
 
-        if (domains_already_snapped_to_node_are_also_at_intersection_point(nodesToCapturedDomains, node, intersectionPoint.get_sorted_domains()) &&
-            parts_are_compatible_for_snapping(mesh, auxMeta, phaseSupport, node, intPtNodes))
+        if (isSnapAllowed && domains_already_snapped_to_node_are_also_at_intersection_point(nodesToCapturedDomains, node, intersectionPoint.get_sorted_domains()))
         {
           const stk::math::Vector3d snapLocation = compute_intersection_point_location(dim, coordsField, intersectionPoint);
           const double cutQualityEstimate = domainsToNodesToQuality.at(intersectionPoint.get_sorted_domains()).at(mesh.identifier(node));
@@ -382,6 +417,7 @@ append_snap_infos_from_intersection_points(const stk::mesh::BulkData & mesh,
 
 std::vector<SnapInfo>
 build_snap_infos_from_intersection_points(const stk::mesh::BulkData & mesh,
+    const SharpFeatureInfo * sharpFeatureInfo,
     const stk::mesh::Selector & elementSelector,
     const NodeToCapturedDomainsMap & nodesToCapturedDomains,
     const std::vector<IntersectionPoint> & intersectionPoints,
@@ -390,8 +426,8 @@ build_snap_infos_from_intersection_points(const stk::mesh::BulkData & mesh,
 {
   std::vector<SnapInfo> snapInfos;
 
-  const auto nodeToInsersectionPointIndices = get_node_to_intersection_point_indices(mesh, intersectionPoints);
-  append_snap_infos_from_intersection_points(mesh, elementSelector, nodesToCapturedDomains, intersectionPoints, nodeToInsersectionPointIndices, qualityMetric, globalIDsAreParallelConsistent, snapInfos);
+  const auto nodeToIntPtIndicesAndWhichSnapsAllowed = get_node_to_intersection_point_indices_and_which_snaps_allowed(mesh, sharpFeatureInfo, intersectionPoints);
+  append_snap_infos_from_intersection_points(mesh, elementSelector, nodesToCapturedDomains, intersectionPoints, nodeToIntPtIndicesAndWhichSnapsAllowed, qualityMetric, globalIDsAreParallelConsistent, snapInfos);
 
   return snapInfos;
 }
@@ -649,23 +685,33 @@ static void prune_snap_infos_modified_by_snap_iteration(const stk::mesh::BulkDat
   snapInfos.erase(snapInfos.begin()+newNumSnapInfos, snapInfos.end());
 }
 
-static std::map<stk::mesh::Entity, std::vector<size_t>> get_node_to_intersection_point_indices_for_nodes_that_need_new_snap_infos(const stk::mesh::BulkData & mesh,
+static mapFromEntityToIntPtIndexAndSnapAllowed get_node_to_intersection_point_indices_and_which_snaps_allowed_for_nodes_that_need_new_snap_infos(const stk::mesh::BulkData & mesh,
+    const SharpFeatureInfo * sharpFeatureInfo,
     const std::vector<IntersectionPoint> & intersectionPoints,
     const std::vector<stk::mesh::EntityId> & sortedIdsOfNodesThatNeedNewSnapInfos)
 {
-  std::map<stk::mesh::Entity, std::vector<size_t>> nodeToInsersectionPointIndices;
+  const AuxMetaData & auxMeta = AuxMetaData::get(mesh.mesh_meta_data());
+  const Phase_Support & phaseSupport = Phase_Support::get(mesh.mesh_meta_data());
+
+  mapFromEntityToIntPtIndexAndSnapAllowed nodeToIntPtIndicesAndWhichSnapsAllowed;
   for (size_t intPtIndex=0; intPtIndex<intersectionPoints.size(); ++intPtIndex)
   {
     const IntersectionPoint & intPt = intersectionPoints[intPtIndex];
-    for (auto && intPtNode : intPt.get_nodes())
+    const auto & intPtNodes = intPt.get_nodes();
+    const std::vector<bool> whichSnapsAreAllowed = which_intersection_point_nodes_are_compatible_for_snapping_based_on_parts_and_sharp_features(mesh, auxMeta, phaseSupport, sharpFeatureInfo, intPtNodes);
+    for (size_t iNode=0; iNode<intPtNodes.size(); ++iNode)
+    {
+      stk::mesh::Entity intPtNode = intPtNodes[iNode];
       if (mesh.bucket(intPtNode).owned() && std::binary_search(sortedIdsOfNodesThatNeedNewSnapInfos.begin(), sortedIdsOfNodesThatNeedNewSnapInfos.end(), mesh.identifier(intPtNode)))
-        nodeToInsersectionPointIndices[intPtNode].push_back(intPtIndex);
+        nodeToIntPtIndicesAndWhichSnapsAllowed[intPtNode].emplace_back(intPtIndex,whichSnapsAreAllowed[iNode]);
+    }
   }
-  return nodeToInsersectionPointIndices;
+  return nodeToIntPtIndicesAndWhichSnapsAllowed;
 }
 
 void update_intersection_points_and_snap_infos_after_snap_iteration(const stk::mesh::BulkData & mesh,
     const InterfaceGeometry & geometry,
+    const SharpFeatureInfo * sharpFeatureInfo,
     const std::vector<stk::mesh::Entity> & iterationSortedSnapNodes,
     const NodeToCapturedDomainsMap & nodesToCapturedDomains,
     const stk::mesh::Selector & elementSelector,
@@ -680,27 +726,35 @@ void update_intersection_points_and_snap_infos_after_snap_iteration(const stk::m
 
   prune_snap_infos_modified_by_snap_iteration(mesh, oldToNewIntPts, sortedIdsOfNodesThatNeedNewSnapInfos, snapInfos);
 
-  const auto nodeToInsersectionPointIndices = get_node_to_intersection_point_indices_for_nodes_that_need_new_snap_infos(mesh, intersectionPoints, sortedIdsOfNodesThatNeedNewSnapInfos);
+  const auto nodeToIntPtIndicesAndWhichSnapsAllowed = get_node_to_intersection_point_indices_and_which_snaps_allowed_for_nodes_that_need_new_snap_infos(mesh, sharpFeatureInfo, intersectionPoints, sortedIdsOfNodesThatNeedNewSnapInfos);
 
-  append_snap_infos_from_intersection_points(mesh, elementSelector, nodesToCapturedDomains, intersectionPoints, nodeToInsersectionPointIndices, qualityMetric, globalIDsAreParallelConsistent, snapInfos);
+  append_snap_infos_from_intersection_points(mesh, elementSelector, nodesToCapturedDomains, intersectionPoints, nodeToIntPtIndicesAndWhichSnapsAllowed, qualityMetric, globalIDsAreParallelConsistent, snapInfos);
 }
 
 NodeToCapturedDomainsMap snap_as_much_as_possible_while_maintaining_quality(const stk::mesh::BulkData & mesh,
     const stk::mesh::Selector & elementSelector,
     const FieldSet & interpolationFields,
     const InterfaceGeometry & geometry,
-    const bool globalIDsAreParallelConsistent)
+    const bool globalIDsAreParallelConsistent,
+    const double snappingSharpFeatureAngleInDegrees)
 {/* %TRACE[ON]% */ Trace trace__("krino::snap_as_much_as_possible_while_maintaining_quality()"); /* %TRACE% */
 
     const ScaledJacobianQualityMetric qualityMetric;
     size_t iteration{0};
     NodeToCapturedDomainsMap nodesToCapturedDomains;
     stk::ParallelMachine comm = mesh.parallel();
+    std::unique_ptr<SharpFeatureInfo> sharpFeatureInfo;
+    if (snappingSharpFeatureAngleInDegrees > 0.)
+    {
+      sharpFeatureInfo = std::make_unique<SharpFeatureInfo>();
+      const FieldRef coordsField(mesh.mesh_meta_data().coordinate_field());
+      sharpFeatureInfo->find_sharp_features(mesh, coordsField, elementSelector, std::cos(snappingSharpFeatureAngleInDegrees*M_PI/180.));
+    }
 
     std::vector<IntersectionPoint> intersectionPoints;
     geometry.store_phase_for_uncut_elements(mesh);
     intersectionPoints = build_all_intersection_points(mesh, geometry, nodesToCapturedDomains);
-    std::vector<SnapInfo> snapInfos = build_snap_infos_from_intersection_points(mesh, elementSelector, nodesToCapturedDomains, intersectionPoints, qualityMetric, globalIDsAreParallelConsistent);
+    std::vector<SnapInfo> snapInfos = build_snap_infos_from_intersection_points(mesh, sharpFeatureInfo.get(), elementSelector, nodesToCapturedDomains, intersectionPoints, qualityMetric, globalIDsAreParallelConsistent);
 
     while (true)
     {
@@ -721,7 +775,7 @@ NodeToCapturedDomainsMap snap_as_much_as_possible_while_maintaining_quality(cons
 
       const std::vector<stk::mesh::Entity> iterationSortedSnapNodes = get_sorted_nodes_modified_in_current_snapping_iteration(mesh, independentSnapInfos);
 
-      update_intersection_points_and_snap_infos_after_snap_iteration(mesh, geometry, iterationSortedSnapNodes, nodesToCapturedDomains, elementSelector, qualityMetric, globalIDsAreParallelConsistent, intersectionPoints, snapInfos);
+      update_intersection_points_and_snap_infos_after_snap_iteration(mesh, geometry, sharpFeatureInfo.get(), iterationSortedSnapNodes, nodesToCapturedDomains, elementSelector, qualityMetric, globalIDsAreParallelConsistent, intersectionPoints, snapInfos);
     }
 
     krinolog << "After snapping quality is " << determine_quality(mesh, elementSelector, qualityMetric) << stk::diag::dendl;
diff --git a/packages/krino/krino/krino_lib/Akri_Snap.hpp b/packages/krino/krino/krino_lib/Akri_Snap.hpp
index f56bc31ecd38..9273b4d6e475 100644
--- a/packages/krino/krino/krino_lib/Akri_Snap.hpp
+++ b/packages/krino/krino/krino_lib/Akri_Snap.hpp
@@ -22,7 +22,8 @@ NodeToCapturedDomainsMap snap_as_much_as_possible_while_maintaining_quality(cons
     const stk::mesh::Selector & elementSelector,
     const FieldSet & interpolationFields,
     const InterfaceGeometry & geometry,
-    const bool globalIDsAreParallelConsistent);
+    const bool globalIDsAreParallelConsistent,
+    const double snappingSharpFeatureAngleInDegrees);
 
 double determine_quality(const stk::mesh::BulkData & mesh,
     const stk::mesh::Selector & elementSelector,
diff --git a/packages/krino/krino/krino_lib/Akri_String_Function_Expression.cpp b/packages/krino/krino/krino_lib/Akri_String_Function_Expression.cpp
new file mode 100644
index 000000000000..a843075bacb4
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_String_Function_Expression.cpp
@@ -0,0 +1,56 @@
+// Copyright 2002 - 2008, 2010, 2011 National Technology Engineering
+// Solutions of Sandia, LLC (NTESS). Under the terms of Contract
+// DE-NA0003525 with NTESS, the U.S. Government retains certain rights
+// in this software.
+//
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+#include <Akri_String_Function_Expression.hpp>
+#include <stk_expreval/Eval.hpp>
+#include <stk_util/environment/RuntimeDoomed.hpp>
+
+namespace krino {
+
+String_Function_Expression::String_Function_Expression(const std::string & expression)
+: myEvaluator(*this)
+{
+  parse(expression);
+}
+
+void String_Function_Expression::parse(const std::string & expression)
+{
+  try {
+    myEvaluator.parse(expression);
+  }
+  catch (std::runtime_error &x) {
+    stk::RuntimeDoomedSymmetric() << "In expression '" << expression << "':" << std::endl << x.what() << std::endl;
+  }
+}
+
+void String_Function_Expression::resolve(stk::expreval::VariableMap::iterator & varIt)
+{
+  std::string name = (*varIt).first;
+
+  if (!(name).compare("x"))
+    (*varIt).second->bind(myQueryCoords[0]);
+  else if (!(name).compare("y"))
+    (*varIt).second->bind(myQueryCoords[1]);
+  else if (!(name).compare("z"))
+    (*varIt).second->bind(myQueryCoords[2]);
+  else
+  {
+    std::ostringstream msg;
+    msg << "  Unable to resolve symbol: " << name;
+    throw std::runtime_error(msg.str());
+  }
+}
+
+double
+String_Function_Expression::evaluate(const Vector3d &coord) const
+{
+  myQueryCoords = coord;
+  return myEvaluator.evaluate();
+}
+
+}
diff --git a/packages/krino/krino/krino_lib/Akri_String_Function_Expression.hpp b/packages/krino/krino/krino_lib/Akri_String_Function_Expression.hpp
new file mode 100644
index 000000000000..0fb916b8842d
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_String_Function_Expression.hpp
@@ -0,0 +1,31 @@
+// Copyright 2002 - 2008, 2010, 2011 National Technology Engineering
+// Solutions of Sandia, LLC (NTESS). Under the terms of Contract
+// DE-NA0003525 with NTESS, the U.S. Government retains certain rights
+// in this software.
+//
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+#ifndef KRINO_KRINO_KRINO_LIB_AKRI_STRING_FUNCTION_EXPRESSION_HPP_
+#define KRINO_KRINO_KRINO_LIB_AKRI_STRING_FUNCTION_EXPRESSION_HPP_
+
+#include <stk_expreval/Eval.hpp>
+#include "Akri_Vec.hpp"
+
+namespace krino {
+
+class String_Function_Expression : public stk::expreval::VariableMap::Resolver
+{
+public:
+  String_Function_Expression(const std::string & expression);
+  void resolve(stk::expreval::VariableMap::iterator & varIt) override;
+  double evaluate(const Vector3d &coords) const;
+private:
+  void parse(const std::string & expression);
+  stk::expreval::Eval myEvaluator;
+  mutable Vector3d myQueryCoords;
+};
+
+}
+
+#endif /* KRINO_KRINO_KRINO_LIB_AKRI_STRING_FUNCTION_EXPRESSION_HPP_ */
diff --git a/packages/krino/krino/krino_lib/Akri_Surface.hpp b/packages/krino/krino/krino_lib/Akri_Surface.hpp
index 78019bafe845..99b0f5a28ed4 100644
--- a/packages/krino/krino/krino_lib/Akri_Surface.hpp
+++ b/packages/krino/krino/krino_lib/Akri_Surface.hpp
@@ -27,6 +27,7 @@ enum Surface_Type
   COMPOSITE_SURFACE,
   PLANE,
   RANDOM,
+  STRING_FUNCTION,
   FACETED_SURFACE,
   // Never, ever, ever add an entry after MAX_SURFACE_TYPE.  Never.
   MAX_SURFACE_TYPE
diff --git a/packages/krino/krino/krino_lib/Akri_Transformation.cpp b/packages/krino/krino/krino_lib/Akri_Transformation.cpp
index d7c563f2a588..a6792173e442 100644
--- a/packages/krino/krino/krino_lib/Akri_Transformation.cpp
+++ b/packages/krino/krino/krino_lib/Akri_Transformation.cpp
@@ -84,15 +84,10 @@ Transformation::initialize()
 void
 Transformation::update( const double time ) const
 {
-  if (time == my_last_update)
+  if (my_last_update > 0. && time == my_last_update)
   {
     return;
   }
-  if (my_last_update < 0.0)
-  {
-    my_last_update = time;
-    return;
-  }
 
   const double dt = time - my_last_update;
   const Vector3d update_rotation_angle = dt*my_rotational_velocity;
diff --git a/packages/krino/krino/krino_lib/Akri_Transformation.hpp b/packages/krino/krino/krino_lib/Akri_Transformation.hpp
index 602d3510af9a..a0337f4a2fe4 100644
--- a/packages/krino/krino/krino_lib/Akri_Transformation.hpp
+++ b/packages/krino/krino/krino_lib/Akri_Transformation.hpp
@@ -30,7 +30,7 @@ class Transformation {
 public:
   Transformation()
     : my_translational_velocity(Vector3d::ZERO), my_rotational_velocity(Vector3d::ZERO),
-      my_reference_point(Vector3d::ZERO), my_last_update(-1.0), my_update_orientation(), my_update_offset(Vector3d::ZERO) {}
+      my_reference_point(Vector3d::ZERO), my_last_update(0.0), my_update_orientation(), my_update_offset(Vector3d::ZERO) {}
   virtual ~Transformation() {}
 
   void set_translational_velocity(const Vector3d & v) { my_translational_velocity = v; }
diff --git a/packages/krino/krino/krino_lib/Akri_VolumePreservingSnappingLimiter.cpp b/packages/krino/krino/krino_lib/Akri_VolumePreservingSnappingLimiter.cpp
new file mode 100644
index 000000000000..7158d09d99a8
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_VolumePreservingSnappingLimiter.cpp
@@ -0,0 +1,102 @@
+#include <Akri_VolumePreservingSnappingLimiter.hpp>
+#include <stk_mesh/base/BulkData.hpp>
+#include <stk_mesh/base/MetaData.hpp>
+#include <Akri_FieldRef.hpp>
+#include <Akri_MeshHelpers.hpp>
+#include <Akri_Vec.hpp>
+#include <Akri_AuxMetaData.hpp>
+#include <Akri_DiagWriter.hpp>
+
+namespace krino {
+
+static void replace_coordinates_of_node_with_new_location(const StkMeshEntities & elemNodes, const stk::mesh::Entity node, const Vector3d & newNodeLoc, std::vector<Vector3d> & elemNodeCoords)
+{
+  for (size_t n=0; n<elemNodes.size(); ++n)
+  {
+    if (elemNodes[n] == node)
+    {
+      elemNodeCoords[n] = newNodeLoc;
+      return;
+    }
+  }
+  ThrowRequireMsg(false, "Did not find the expected node in replace_coordinates_of_node_with_new_location");
+}
+
+static double compute_relative_volume_change(const stk::mesh::BulkData & mesh,
+    const FieldRef coordsField,
+    const VolumePreservingSnappingLimiter::ElementToBlockConverter & elementToBlockConverter,
+    const stk::mesh::Part & blockPart,
+    const stk::mesh::Entity node,
+    const Vector3d & newNodeLoc,
+    std::vector<Vector3d> & elemNodeCoordsWorkspace)
+{
+  const int dim = mesh.mesh_meta_data().spatial_dimension();
+
+  StkMeshEntities nodeElements{mesh.begin_elements(node), mesh.end_elements(node)};
+
+  double volumeBefore = 0.;
+  double volumeAfter = 0.;
+  unsigned numElements = 0.;
+  for (auto elem : nodeElements)
+  {
+    if (elementToBlockConverter(mesh, elem) == &blockPart)
+    {
+      ++numElements;
+      StkMeshEntities elemNodes{mesh.begin_nodes(elem), mesh.end_nodes(elem)};
+      fill_node_locations(dim, coordsField, elemNodes, elemNodeCoordsWorkspace);
+
+      volumeBefore += compute_tri_or_tet_volume(elemNodeCoordsWorkspace);
+      replace_coordinates_of_node_with_new_location(elemNodes, node, newNodeLoc, elemNodeCoordsWorkspace);
+      volumeAfter += compute_tri_or_tet_volume(elemNodeCoordsWorkspace);
+    }
+  }
+
+  if (0 == numElements)
+    return 0.;
+
+  const double elemAverageVol = std::max(volumeBefore,volumeAfter)/numElements;
+  return std::abs(volumeAfter-volumeBefore)/elemAverageVol;
+}
+
+VolumePreservingSnappingLimiter::VolumePreservingSnappingLimiter(
+    const stk::mesh::BulkData & mesh,
+    const FieldRef coordsField,
+    const ElementToBlockConverter & elementToBlockConverter,
+    const double volumeConservationTol)
+  : myMesh(mesh),
+    myAuxMeta(AuxMetaData::get(mesh.mesh_meta_data())),
+    myElementToBlockConverter(elementToBlockConverter),
+    myCoordsField(coordsField),
+    myVolumeConservationTol(volumeConservationTol)
+{
+}
+
+std::set<stk::mesh::Part*> VolumePreservingSnappingLimiter::get_blocks_to_consider(const stk::mesh::Entity node) const
+{
+  std::set<stk::mesh::Part*> blocksToConsider;
+  for (auto && elem : StkMeshEntities{myMesh.begin_elements(node), myMesh.end_elements(node)})
+  {
+    stk::mesh::Part * blockPart = myElementToBlockConverter(myMesh, elem);
+    if (nullptr != blockPart)
+      blocksToConsider.insert(blockPart);
+  }
+  return blocksToConsider;
+}
+
+bool VolumePreservingSnappingLimiter::is_snap_allowed(const stk::mesh::Entity node, const Vector3d & snapLocation) const
+{
+  const std::set<stk::mesh::Part*> blocksToConsider = get_blocks_to_consider(node);
+  if (blocksToConsider.size() == 1 && !myMesh.bucket(node).member(myAuxMeta.exposed_boundary_part()))
+    return true;
+
+  std::vector<stk::math::Vector3d> elemNodeCoords;
+  for (auto && blockPart : blocksToConsider)
+  {
+    const double volChange = compute_relative_volume_change(myMesh, myCoordsField,  myElementToBlockConverter, *blockPart, node, snapLocation, elemNodeCoords);
+    if (volChange > myVolumeConservationTol)
+      return false;
+  }
+  return true;
+}
+
+}
diff --git a/packages/krino/krino/krino_lib/Akri_VolumePreservingSnappingLimiter.hpp b/packages/krino/krino/krino_lib/Akri_VolumePreservingSnappingLimiter.hpp
new file mode 100644
index 000000000000..8b1d373e66ed
--- /dev/null
+++ b/packages/krino/krino/krino_lib/Akri_VolumePreservingSnappingLimiter.hpp
@@ -0,0 +1,36 @@
+#ifndef KRINO_KRINO_KRINO_LIB_AKRI_VOLUMEPRESERVINGSNAPPINGLIMITER_HPP_
+#define KRINO_KRINO_KRINO_LIB_AKRI_VOLUMEPRESERVINGSNAPPINGLIMITER_HPP_
+#include <stk_mesh/base/BulkData.hpp>
+#include <stk_mesh/base/Part.hpp>
+#include <Akri_FieldRef.hpp>
+#include <Akri_Vec.hpp>
+
+namespace krino {
+
+class AuxMetaData;
+
+class VolumePreservingSnappingLimiter
+{
+public:
+  typedef std::function<stk::mesh::Part*(const stk::mesh::BulkData &, const stk::mesh::Entity)> ElementToBlockConverter;
+
+  VolumePreservingSnappingLimiter(
+    const stk::mesh::BulkData & mesh,
+    const FieldRef coordsField,
+    const ElementToBlockConverter & elementToBlockConverter,
+    const double volumeConservationTol);
+  bool is_snap_allowed(const stk::mesh::Entity node, const Vector3d & snapLocation) const;
+private:
+  std::set<stk::mesh::Part*> get_blocks_to_consider(const stk::mesh::Entity node) const;
+  const stk::mesh::BulkData & myMesh;
+  const AuxMetaData & myAuxMeta;
+  ElementToBlockConverter myElementToBlockConverter;
+  FieldRef myCoordsField;
+  double myVolumeConservationTol;
+};
+
+}
+
+
+
+#endif /* KRINO_KRINO_KRINO_LIB_AKRI_VOLUMEPRESERVINGSNAPPINGLIMITER_HPP_ */
diff --git a/packages/krino/krino/parser/Akri_Surface_Parser.cpp b/packages/krino/krino/parser/Akri_Surface_Parser.cpp
index 2d4e3b288f60..b48be642ede5 100644
--- a/packages/krino/krino/parser/Akri_Surface_Parser.cpp
+++ b/packages/krino/krino/parser/Akri_Surface_Parser.cpp
@@ -295,6 +295,34 @@ parse_mesh_surface(const Parser::Node & ic_node, const stk::mesh::MetaData & met
   return new MeshSurface(meta, *coords, surface_selector, sign);
 }
 
+LevelSet_String_Function *
+parse_string_function(const Parser::Node & ic_node)
+{
+  std::string expression;
+  if (!ic_node.get_if_present("expression", expression))
+  {
+    stk::RuntimeDoomedAdHoc() << "Missing expression for string_function.\n";
+  }
+
+  LevelSet_String_Function * surf = new LevelSet_String_Function(expression);
+
+  std::vector<double> bounds;
+  if (ic_node.get_if_present("bounding_box", bounds))
+  {
+    if (bounds.size() == 6)
+    {
+      const BoundingBox surfBbox( Vector3d(bounds[0],bounds[1],bounds[2]), Vector3d(bounds[3],bounds[4],bounds[5]) );
+      surf->set_bounding_box(surfBbox);
+    }
+    else
+    {
+      stk::RuntimeDoomedAdHoc() << "bounding_box for string_function must be a vector of length 6 (for both 2D or 3D) (xmin,ymin,zmin, xmax,ymax,zmax).\n";
+    }
+  }
+
+  return surf;
+}
+
 }
 
 Surface *
@@ -308,10 +336,6 @@ Surface_Parser::parse(const Parser::Node & parserNode, const stk::mesh::MetaData
     {
       return new Random(0);
     }
-    else if (ic_type == "analytic_isosurface")
-    {
-      return new Analytic_Isosurface();
-    }
     return nullptr;
   }
 
@@ -331,6 +355,10 @@ Surface_Parser::parse(const Parser::Node & parserNode, const stk::mesh::MetaData
   {
     return parse_cylinder(parserNode);
   }
+  else if ( parserNode.get_null_if_present("string_function") )
+  {
+    return parse_string_function(parserNode);
+  }
   else if ( parserNode.get_null_if_present("facets") )
   {
     return parse_facets(parserNode, parentTimer);
diff --git a/packages/krino/krino/rebalance_utils/Akri_RebalanceUtils.cpp b/packages/krino/krino/rebalance_utils/Akri_RebalanceUtils.cpp
index 54d9b87504f3..c2a869e8e29f 100644
--- a/packages/krino/krino/rebalance_utils/Akri_RebalanceUtils.cpp
+++ b/packages/krino/krino/rebalance_utils/Akri_RebalanceUtils.cpp
@@ -30,7 +30,7 @@ class MultipleCriteriaSettings : public stk::balance::GraphCreationSettings
         m_critFields(critFields),
         m_defaultWeight(default_weight)
   {
-    method = "rcb";
+    m_method = "rcb";
     setUseNodeBalancer(true);
     setNodeBalancerTargetLoadBalance(getImbalanceTolerance());
     setNodeBalancerMaxIterations(max_num_nodal_rebal_iters);
@@ -46,8 +46,8 @@ class MultipleCriteriaSettings : public stk::balance::GraphCreationSettings
   virtual bool includeSearchResultsInGraph() const override { return false; }
   virtual int getGraphVertexWeight(stk::topology type) const override { return 1; }
   virtual double getImbalanceTolerance() const override { return 1.05; }
-  virtual void setDecompMethod(const std::string & input_method) override { method = input_method; }
-  virtual std::string getDecompMethod() const override { return method; }
+  virtual void setDecompMethod(const std::string & input_method) override { m_method = input_method; }
+  virtual std::string getDecompMethod() const override { return m_method; }
   virtual int getNumCriteria() const override { return m_critFields.size(); }
   virtual bool isMultiCriteriaRebalance() const override { return true; }
   virtual bool shouldFixMechanisms() const override { return false; }
diff --git a/packages/krino/krino/region/Akri_Region.cpp b/packages/krino/krino/region/Akri_Region.cpp
index ae4b9bf3eb3f..99f5a7883752 100644
--- a/packages/krino/krino/region/Akri_Region.cpp
+++ b/packages/krino/krino/region/Akri_Region.cpp
@@ -21,6 +21,7 @@
 #include <stk_mesh/base/GetEntities.hpp>
 #include <stk_mesh/base/Selector.hpp>
 #include <stk_mesh/base/SkinBoundary.hpp>
+#include <stk_mesh/base/MeshBuilder.hpp>
 #include <Akri_LevelSet.hpp>
 #include <Akri_CreateInterfaceGeometry.hpp>
 #include <Akri_MeshHelpers.hpp>
@@ -58,6 +59,7 @@ Region::Region(Simulation & owning_simulation, const std::string & regionName)
 { /* %TRACE[ON]% */ Trace trace__("krino::Region::Region()"); /* %TRACE% */
   my_simulation.add_region(this);
   myIOBroker = std::make_unique<stk::io::StkMeshIoBroker>(stk::EnvData::parallel_comm());
+  myIOBroker->use_simple_fields();
 
   std::vector<std::string> entity_rank_names = stk::mesh::entity_rank_names();
   entity_rank_names.push_back("FAMILY_TREE");
@@ -156,8 +158,9 @@ void Region::commit()
   }
   else
   {
-    auto shared_bulk = std::make_shared<stk::mesh::BulkData>(meta,stk::EnvData::parallel_comm(),auto_aura_option);
+    std::shared_ptr<stk::mesh::BulkData> shared_bulk = stk::mesh::MeshBuilder(stk::EnvData::parallel_comm()).set_aura_option(auto_aura_option).create(std::shared_ptr<stk::mesh::MetaData>(&meta,[](auto ptrWeWontDelete){}));
     my_bulk = shared_bulk.get();
+    my_bulk->mesh_meta_data().use_simple_fields();
     stk_IO().set_bulk_data( shared_bulk );
     stk_IO().populate_bulk_data();
   }
@@ -630,7 +633,7 @@ Region::associate_input_mesh(const std::string & model_name, bool assert_32bit_i
     entity_rank_names.push_back("FAMILY_TREE");
     my_generated_mesh = std::make_unique<BoundingBoxMesh>(generated_mesh_element_type,entity_rank_names);
     my_meta = &my_generated_mesh->meta_data();
-    stk::mesh::Field<double, stk::mesh::Cartesian> & coords_field = my_meta->declare_field<stk::mesh::Field<double, stk::mesh::Cartesian>>(stk::topology::NODE_RANK, "coordinates", 1);
+    stk::mesh::Field<double> & coords_field = my_meta->declare_field<double>(stk::topology::NODE_RANK, "coordinates", 1);
     stk::mesh::put_field_on_mesh(coords_field, my_meta->universal_part(), generated_mesh_element_type.dimension(), nullptr);
   }
   else
diff --git a/packages/krino/krino/unit_tests/Akri_StkMeshBuilder.cpp b/packages/krino/krino/unit_tests/Akri_StkMeshBuilder.cpp
new file mode 100644
index 000000000000..48df04185151
--- /dev/null
+++ b/packages/krino/krino/unit_tests/Akri_StkMeshBuilder.cpp
@@ -0,0 +1,353 @@
+#include "Akri_StkMeshBuilder.hpp"
+#include <Akri_AuxMetaData.hpp>
+#include <Akri_Phase_Support.hpp>
+#include <stk_util/util/ReportHandler.hpp>
+#include <stk_util/util/SortAndUnique.hpp>
+#include <stk_math/StkVector.hpp>
+#include <stk_mesh/base/FieldBase.hpp>
+#include <stk_mesh/base/MetaData.hpp>
+#include <stk_io/IossBridge.hpp>
+#include "../../../stk/stk_mesh/stk_mesh/base/SkinBoundary.hpp"
+
+namespace krino
+{
+
+template <int DIM>
+StkMeshBuilder<DIM>::StkMeshBuilder(stk::mesh::BulkData & mesh, const stk::ParallelMachine comm)
+: mMesh(mesh), mAuxMeta(AuxMetaData::create(mesh.mesh_meta_data())), mPhaseSupport(Phase_Support::get(mesh.mesh_meta_data())), mComm(comm)
+{
+  declare_coordinates();
+  mMesh.mesh_meta_data().use_simple_fields();
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::declare_coordinates()
+{
+  stk::mesh::Field<double> & coordsField = mMesh.mesh_meta_data().template declare_field<double>(
+      stk::topology::NODE_RANK, "coordinates", 1u);
+  stk::mesh::put_field_on_entire_mesh(coordsField, DIM);
+  stk::io::set_field_role(coordsField, Ioss::Field::MESH);
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::create_block_parts(const std::vector<unsigned> &elementBlockIDs)
+{
+  stk::topology simplexTopology = ((DIM == 2) ? stk::topology::TRIANGLE_3_2D : stk::topology::TETRAHEDRON_4);
+
+  for (unsigned blockId : elementBlockIDs)
+  {
+    const std::string blockName = "block_"+std::to_string(blockId);
+    stk::mesh::Part &part = mMesh.mesh_meta_data().declare_part_with_topology(blockName, simplexTopology);
+    mMesh.mesh_meta_data().set_part_id(part, blockId);
+    stk::io::put_io_part_attribute(part);
+  }
+}
+
+std::string get_surface_name(const unsigned sidesetId)
+{
+  const std::string surfaceName = "surface_"+std::to_string(sidesetId);
+  return surfaceName;
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::create_sideset_parts(const std::vector<unsigned> &sidesetIds)
+{
+    for (unsigned sidesetId : sidesetIds)
+    {
+      stk::mesh::Part &sidesetPart = mMesh.mesh_meta_data().declare_part(get_surface_name(sidesetId), mMesh.mesh_meta_data().side_rank());
+      mMesh.mesh_meta_data().set_part_id(sidesetPart, sidesetId);
+      stk::io::put_io_part_attribute(sidesetPart);
+    }
+}
+
+std::vector<stk::mesh::PartVector> convert_vector_of_vector_of_sideset_ids_to_parts(const stk::mesh::MetaData & meta, const std::vector<std::vector<unsigned>>& vectorOfVectorsOfSidesetIds)
+{
+    std::vector<stk::mesh::PartVector> addParts {vectorOfVectorsOfSidesetIds.size()};
+    for(size_t i {0}; i < vectorOfVectorsOfSidesetIds.size(); ++i)
+    {
+        addParts[i].reserve(vectorOfVectorsOfSidesetIds[i].size());
+        for(const size_t sidesetId : vectorOfVectorsOfSidesetIds[i])
+            addParts[i].push_back(meta.get_part(get_surface_name(sidesetId)));
+    }
+    return addParts;
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::add_sides_to_sidesets(const std::vector<stk::mesh::Entity> &sides, const std::vector<std::vector<unsigned>> &sidesetIdsPerSide)
+{
+    ThrowRequireWithSierraHelpMsg(sides.size() == sidesetIdsPerSide.size());
+    const std::vector<stk::mesh::PartVector> addParts = convert_vector_of_vector_of_sideset_ids_to_parts(mMesh.mesh_meta_data(), sidesetIdsPerSide);
+    const std::vector<stk::mesh::PartVector> remParts(sidesetIdsPerSide.size(), stk::mesh::PartVector{});
+    mMesh.batch_change_entity_parts(sides, addParts, remParts);
+}
+
+template <int DIM>
+stk::mesh::Entity StkMeshBuilder<DIM>::get_side_with_nodes(const std::vector<stk::mesh::Entity> &nodesOfSide) const
+{
+  std::vector<stk::mesh::Entity> sidesWithNodes;
+
+  stk::mesh::get_entities_through_relations(mMesh, nodesOfSide, mMesh.mesh_meta_data().side_rank(), sidesWithNodes);
+  ThrowRequireMsg(sidesWithNodes.size() == 1, "Expected to find one side with nodes, but found " << sidesWithNodes.size());
+  return sidesWithNodes[0];
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::set_node_coordinates(const stk::mesh::Entity node, const stk::math::Vector3d &newLoc)
+{
+    double* node_coords = (double*)stk::mesh::field_data(*mMesh.mesh_meta_data().coordinate_field(), node);
+    node_coords[0] = newLoc[0];
+    node_coords[1] = newLoc[1];
+    if (mMesh.mesh_meta_data().spatial_dimension() == 3) node_coords[2] = newLoc[2];
+}
+
+template <int DIM>
+stk::mesh::Entity StkMeshBuilder<DIM>::create_node(const stk::math::Vector3d &loc, const std::vector<int> &sharingProcs, stk::mesh::EntityId nodeId)
+{
+    stk::mesh::Entity node = mMesh.declare_node(nodeId);
+
+    int proc = mMesh.parallel_rank();
+    for(int sharingProc : sharingProcs)
+    {
+        if ( sharingProc != proc)
+            mMesh.add_node_sharing(node, sharingProc);
+    }
+
+    set_node_coordinates(node, loc);
+    return node;
+}
+
+stk::mesh::Part * get_block_part(const stk::mesh::MetaData &meta, const unsigned blockId)
+{
+    stk::mesh::Part *blockPart{nullptr};
+    for (stk::mesh::Part * part : meta.get_parts())
+    {
+        if (part->primary_entity_rank() == stk::topology::ELEM_RANK && (unsigned)part->id() == blockId)
+        {
+            blockPart = part;
+            break;
+        }
+    }
+    ThrowRequireMsg(blockPart!=nullptr, "Can't find a block with id " << blockId);
+    return blockPart;
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::create_boundary_sides()
+{
+    stk::mesh::create_exposed_block_boundary_sides(mMesh, mMesh.mesh_meta_data().universal_part(), {&mAuxMeta.exposed_boundary_part()});
+}
+
+template <int DIM>
+bool StkMeshBuilder<DIM>::check_boundary_sides() const
+{
+  return stk::mesh::check_exposed_block_boundary_sides(mMesh, mMesh.mesh_meta_data().universal_part(), mAuxMeta.exposed_boundary_part());
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::create_block_boundary_sides()
+{
+  stk::mesh::create_exposed_block_boundary_sides(mMesh, mMesh.mesh_meta_data().universal_part(), {&mAuxMeta.block_boundary_part()});
+}
+
+template <int DIM>
+bool StkMeshBuilder<DIM>::check_block_boundary_sides() const
+{
+  return stk::mesh::check_interior_block_boundary_sides(mMesh, mMesh.mesh_meta_data().universal_part(), mAuxMeta.block_boundary_part());
+}
+
+template <int DIM>
+stk::mesh::Entity StkMeshBuilder<DIM>::create_element(const std::vector<stk::mesh::Entity> &nodes, stk::mesh::EntityId elementId, unsigned blockId)
+{
+    const stk::mesh::Part *blockPart = get_block_part(mMesh.mesh_meta_data(), blockId);
+    stk::mesh::Entity element = mMesh.declare_element(elementId, stk::mesh::ConstPartVector{blockPart});
+    unsigned idx = 0;
+    for (auto nd : nodes)
+        mMesh.declare_relation(element, stk::mesh::Entity(nd), idx++);
+    return element;
+}
+
+template <int DIM>
+std::vector<stk::mesh::Entity>
+StkMeshBuilder<DIM>::create_parallel_nodes(const std::vector<stk::math::Vec<double,DIM>>& nodeLocs,
+    const std::map<unsigned,std::vector<int>> &nodeIndicesWithSharingProcs,
+    const std::vector<stk::mesh::EntityId> & assignedGlobalNodeIdsforAllNodes)
+{
+    std::vector<stk::mesh::Entity> nodesWhichAreValidIfTheyExistOnProc(nodeLocs.size(), stk::mesh::Entity());
+    int curProc = stk::parallel_machine_rank(mComm);
+    for(auto &nodeIndexWithSharingProcs : nodeIndicesWithSharingProcs)
+    {
+        unsigned nodeIndex = nodeIndexWithSharingProcs.first;
+        stk::mesh::EntityId nodeGlobalId = assignedGlobalNodeIdsforAllNodes[nodeIndex];
+        const std::vector<int> &sharingProcs = nodeIndexWithSharingProcs.second;
+
+        if (std::find(sharingProcs.begin(), sharingProcs.end(), curProc) != sharingProcs.end() )
+            nodesWhichAreValidIfTheyExistOnProc[nodeIndex] = create_node(stk::math::Vector3d{nodeLocs[nodeIndex].data(),DIM},
+                sharingProcs,
+                nodeGlobalId);
+    }
+    return nodesWhichAreValidIfTheyExistOnProc;
+}
+
+std::vector<stk::mesh::EntityId> get_ids_available_for_rank(stk::mesh::BulkData & mesh, stk::mesh::EntityRank rank, size_t numRequested)
+{
+    stk::mesh::EntityIdVector requestedIds;
+    mesh.generate_new_ids(rank, numRequested, requestedIds);
+    std::vector<stk::mesh::EntityId> idsToReturn(requestedIds.begin(), requestedIds.end());
+    std::reverse(idsToReturn.begin(), idsToReturn.end());
+    return idsToReturn;
+}
+
+template <int DIM>
+std::vector<stk::mesh::Entity>
+StkMeshBuilder<DIM>::create_parallel_elements(const std::vector<std::array<unsigned, NPE>> &elementConn,
+    const std::vector<unsigned> &elementBlockIDs,
+    const std::vector<int> &elementProcOwners,
+    const std::vector<stk::mesh::Entity>& nodesWhichAreValidIfTheyExistOnProc)
+{
+    const int proc = stk::parallel_machine_rank(mComm);
+
+    size_t numOwnedElements = 0;
+    for (int elemProc : elementProcOwners)
+      if (elemProc == proc) ++numOwnedElements;
+
+    std::vector<stk::mesh::EntityId> elementIds = get_ids_available_for_rank(mMesh, stk::topology::ELEM_RANK, numOwnedElements);
+
+    std::vector<stk::mesh::Entity> ownedElems;
+    for (size_t iElem=0; iElem<elementConn.size(); ++iElem)
+    {
+        if (elementProcOwners[iElem] == proc)
+        {
+            ThrowRequireWithSierraHelpMsg((size_t)NPE == elementConn[iElem].size());
+
+            stk::mesh::EntityId elementId = elementIds.back();
+            elementIds.pop_back();
+
+            std::vector<stk::mesh::Entity> oneElementConnWithLocalIds(NPE);
+            for(unsigned i = 0; i < NPE; i++)
+              oneElementConnWithLocalIds[i] = nodesWhichAreValidIfTheyExistOnProc[elementConn[iElem][i]];
+
+            stk::mesh::Entity elem = create_element(oneElementConnWithLocalIds, elementId, elementBlockIDs[iElem]);
+            ownedElems.push_back(elem);
+        }
+    }
+
+    return ownedElems;
+}
+
+template <int DIM>
+std::map<unsigned,std::vector<int>>
+StkMeshBuilder<DIM>::build_node_sharing_procs(const std::vector<std::array<unsigned, NPE>> &elementConn,
+    const std::vector<int> &elementProcOwners) const
+{
+  std::map<unsigned,std::vector<int>> nodeIndicesWithSharingProcs;
+  for (size_t iElem=0; iElem<elementConn.size(); ++iElem)
+      for (auto && node : elementConn[iElem])
+          nodeIndicesWithSharingProcs[node].push_back(elementProcOwners[iElem]);
+
+  for (auto && entry : nodeIndicesWithSharingProcs)
+  {
+      auto & procs = entry.second;
+      stk::util::sort_and_unique(procs);
+  }
+  return nodeIndicesWithSharingProcs;
+}
+
+template <int DIM>
+std::map<unsigned,std::vector<int>>
+StkMeshBuilder<DIM>::build_node_sharing_procs_for_all_nodes_on_all_procs(const unsigned numNodes, const unsigned numProcs) const
+{
+  std::map<unsigned,std::vector<int>> nodeIndicesWithSharingProcs;
+  for (unsigned iNode{0}; iNode<numNodes; ++iNode)
+    for (unsigned proc=0; proc<numProcs; ++proc)
+      nodeIndicesWithSharingProcs[iNode].push_back(proc);
+  return nodeIndicesWithSharingProcs;
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::build_mesh(const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+    const std::vector<std::vector<std::array<unsigned, NPE>>> &elementConnPerProc,
+    const unsigned blockId)
+{
+    ThrowRequireWithSierraHelpMsg(elementConnPerProc.size() == (size_t)stk::parallel_machine_size(mComm));
+    std::vector<std::array<unsigned, NPE>> elementConn;
+    std::vector<unsigned> elementBlockIDs;
+    std::vector<int> elementProcOwners;
+    for (unsigned proc=0; proc<elementConnPerProc.size(); ++proc)
+    {
+      for (auto && elemConn : elementConnPerProc[proc])
+      {
+        elementConn.push_back(elemConn);
+        elementBlockIDs.push_back(blockId);
+        elementProcOwners.push_back(proc);
+      }
+    }
+
+    build_mesh_with_all_needed_block_ids(nodeLocs, elementConn, elementBlockIDs, {blockId}, elementProcOwners);
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::build_mesh(const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+    const std::vector<std::array<unsigned, NPE>> &elementConn,
+    const std::vector<unsigned> &elementBlockIDs,
+    const std::vector<int> &specifiedElementProcOwners)
+{
+    std::vector<unsigned> allBlockIDs = elementBlockIDs;
+    stk::util::sort_and_unique(allBlockIDs);
+
+    build_mesh_with_all_needed_block_ids(nodeLocs, elementConn, elementBlockIDs, allBlockIDs, specifiedElementProcOwners);
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::build_mesh_nodes_and_elements(
+    const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+    const std::vector<std::array<unsigned, NPE>> &elementConn,
+    const std::vector<unsigned> &elementBlockIDs,
+    const std::vector<int> &specifiedElementProcOwners
+)
+{
+    create_block_parts(elementBlockIDs);
+
+    const size_t numGlobalElems = elementConn.size();
+    std::vector<int> elementProcOwners = specifiedElementProcOwners;
+    if (elementProcOwners.empty()) // Put all elements on proc 0 if called with empty specifiedElementProcOwners
+      elementProcOwners.assign(numGlobalElems, 0);
+
+    ThrowRequireWithSierraHelpMsg(elementBlockIDs.size() == numGlobalElems);
+    ThrowRequireWithSierraHelpMsg(elementProcOwners.size() == numGlobalElems);
+
+    mAssignedGlobalNodeIdsforAllNodes.resize(nodeLocs.size());
+    for (unsigned iNode=0; iNode<mAssignedGlobalNodeIdsforAllNodes.size(); ++iNode)
+      mAssignedGlobalNodeIdsforAllNodes[iNode] = iNode+101;
+
+    const std::map<unsigned,std::vector<int>> nodeIndicesWithSharingProcs =
+        (0 == numGlobalElems) ?
+        build_node_sharing_procs_for_all_nodes_on_all_procs(nodeLocs.size(), stk::parallel_machine_size(mComm)) :
+        build_node_sharing_procs(elementConn, elementProcOwners);
+
+    mMesh.modification_begin();
+    const auto nodeHandlesWhichAreValidForNodesThatExistOnProc = create_parallel_nodes(nodeLocs, nodeIndicesWithSharingProcs, mAssignedGlobalNodeIdsforAllNodes);
+    mOwnedElems = create_parallel_elements(elementConn, elementBlockIDs, elementProcOwners, nodeHandlesWhichAreValidForNodesThatExistOnProc);
+    mMesh.modification_end();
+
+    create_boundary_sides();
+    create_block_boundary_sides();
+}
+
+template <int DIM>
+void StkMeshBuilder<DIM>::build_mesh_with_all_needed_block_ids
+(
+    const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+    const std::vector<std::array<unsigned, NPE>> &elementConn,
+    const std::vector<unsigned> &elementBlockIDs,
+    const std::vector<unsigned> &allBlocksIncludingThoseThatDontHaveElements,
+    const std::vector<int> &specifiedElementProcOwners
+)
+{
+    build_mesh_nodes_and_elements(nodeLocs, elementConn, elementBlockIDs, specifiedElementProcOwners);
+}
+
+// Explicit template instantiation
+template class StkMeshBuilder<2>;
+template class StkMeshBuilder<3>;
+
+}
diff --git a/packages/krino/krino/unit_tests/Akri_StkMeshBuilder.hpp b/packages/krino/krino/unit_tests/Akri_StkMeshBuilder.hpp
new file mode 100644
index 000000000000..530ef55b30f8
--- /dev/null
+++ b/packages/krino/krino/unit_tests/Akri_StkMeshBuilder.hpp
@@ -0,0 +1,91 @@
+#ifndef KRINO_KRINO_UNIT_TESTS_AKRI_STKMESHBUILDER_HPP_
+#define KRINO_KRINO_UNIT_TESTS_AKRI_STKMESHBUILDER_HPP_
+#include <stk_math/StkVector.hpp>
+#include <stk_mesh/base/BulkData.hpp>
+#include <stk_util/parallel/Parallel.hpp>
+
+namespace krino {
+
+class AuxMetaData;
+class Phase_Support;
+
+template<int DIM>
+class StkMeshBuilder
+{
+public:
+    static constexpr int NPE = DIM+1;
+
+    StkMeshBuilder(stk::mesh::BulkData & mesh, const stk::ParallelMachine comm);
+
+    void build_mesh(const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+        const std::vector<std::vector<std::array<unsigned,NPE>>> &elemConnPerProc,
+        const unsigned blockId=1u);
+
+    void build_mesh(const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+        const std::vector<std::array<unsigned, NPE>> &elementConn,
+        const std::vector<unsigned> &elementBlockIDs,
+        const std::vector<int> &specifiedElementProcOwners = {});
+
+    void build_mesh_with_all_needed_block_ids(const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+        const std::vector<std::array<unsigned, NPE>> &elementConn,
+        const std::vector<unsigned> &elementBlockIDs,
+        const std::vector<unsigned> &allBlocksIncludingThoseThatDontHaveElements,
+        const std::vector<int> &specifiedElementProcOwners);
+
+    void build_mesh_nodes_and_elements(
+        const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+        const std::vector<std::array<unsigned, NPE>> &elementConn,
+        const std::vector<unsigned> &elementBlockIDs,
+        const std::vector<int> &specifiedElementProcOwners);
+
+    const std::vector<stk::mesh::Entity> & get_owned_elements() const { return mOwnedElems; }
+    const std::vector<stk::mesh::EntityId> & get_assigned_node_global_ids() const { return mAssignedGlobalNodeIdsforAllNodes; }
+
+    bool check_boundary_sides() const;
+    bool check_block_boundary_sides() const;
+
+    AuxMetaData & get_aux_meta() { return mAuxMeta; }
+    const AuxMetaData & get_aux_meta() const { return mAuxMeta; }
+
+    Phase_Support & get_phase_support() { return mPhaseSupport; }
+    const Phase_Support & get_phase_support() const { return mPhaseSupport; }
+
+    void create_sideset_parts(const std::vector<unsigned> &sidesetIds);
+    void add_sides_to_sidesets(const std::vector<stk::mesh::Entity> &sides, const std::vector<std::vector<unsigned>> &sidesetIdsPerSide);
+    stk::mesh::Entity get_side_with_nodes(const std::vector<stk::mesh::Entity> &nodesOfSide) const;
+    void create_block_parts(const std::vector<unsigned> &elementBlockIDs);
+
+private:
+    stk::mesh::BulkData & mMesh;
+    AuxMetaData & mAuxMeta;
+    Phase_Support & mPhaseSupport;
+    const stk::ParallelMachine mComm;
+    std::vector<stk::mesh::EntityId> mAssignedGlobalNodeIdsforAllNodes;
+    std::vector<stk::mesh::Entity> mOwnedElems;
+
+    void declare_coordinates();
+
+    void create_boundary_sides();
+    void create_block_boundary_sides();
+
+    void set_node_coordinates(const stk::mesh::Entity node, const stk::math::Vector3d &newLoc);
+    stk::mesh::Entity create_node(const stk::math::Vector3d &loc, const std::vector<int> &sharingProcs, stk::mesh::EntityId nodeId);
+    stk::mesh::Entity create_element(const std::vector<stk::mesh::Entity> &nodes, stk::mesh::EntityId elementId, unsigned blockId);
+
+    std::vector<stk::mesh::Entity> create_parallel_nodes(const std::vector<stk::math::Vec<double,DIM>>& nodeLocs,
+        const std::map<unsigned,std::vector<int>> &nodeIndicesWithSharingProcs,
+        const std::vector<stk::mesh::EntityId> & assignedGlobalNodeIdsforAllNodes);
+
+    std::vector<stk::mesh::Entity> create_parallel_elements(const std::vector<std::array<unsigned, NPE>> &elementConn,
+        const std::vector<unsigned> &elementBlockIDs,
+        const std::vector<int> &elementProcOwners,
+        const std::vector<stk::mesh::Entity>& nodesWhichAreValidIfTheyExistOnProc);
+
+    std::map<unsigned,std::vector<int>> build_node_sharing_procs(const std::vector<std::array<unsigned, NPE>> &elementConn,
+        const std::vector<int> &elementProcOwners) const;
+    std::map<unsigned,std::vector<int>> build_node_sharing_procs_for_all_nodes_on_all_procs(const unsigned numNodes, const unsigned numProcs) const;
+};
+
+}
+
+#endif /* KRINO_KRINO_UNIT_TESTS_AKRI_STKMESHBUILDER_HPP_ */
diff --git a/packages/krino/krino/unit_tests/Akri_StkMeshFixture.hpp b/packages/krino/krino/unit_tests/Akri_StkMeshFixture.hpp
new file mode 100644
index 000000000000..3403920ce406
--- /dev/null
+++ b/packages/krino/krino/unit_tests/Akri_StkMeshFixture.hpp
@@ -0,0 +1,62 @@
+#ifndef KRINO_KRINO_UNIT_TESTS_AKRI_STKMESHFIXTURE_HPP_
+#define KRINO_KRINO_UNIT_TESTS_AKRI_STKMESHFIXTURE_HPP_
+
+#include <gtest/gtest.h>
+#include <stk_math/StkVector.hpp>
+#include <stk_util/parallel/Parallel.hpp>
+#include <array>
+#include <vector>
+#include <Akri_StkMeshBuilder.hpp>
+#include <stk_mesh/base/MeshBuilder.hpp>
+#include <stk_mesh/base/MetaData.hpp>
+
+namespace krino
+{
+
+template<int DIM>
+class StkMeshFixture : public ::testing::Test
+{
+protected:
+    static constexpr int NPE = DIM+1;
+    static constexpr unsigned theBlockId = 1;
+    const stk::ParallelMachine mComm = MPI_COMM_WORLD;
+    const int mProc{stk::parallel_machine_rank(mComm)};
+    std::unique_ptr<stk::mesh::BulkData> mMeshPtr{stk::mesh::MeshBuilder(mComm).set_spatial_dimension(DIM).create()};
+    stk::mesh::BulkData & mMesh{*mMeshPtr};
+    StkMeshBuilder<DIM> mBuilder{mMesh, mComm};
+
+    const std::vector<stk::mesh::EntityId> & get_assigned_node_global_ids() const { return mBuilder.get_assigned_node_global_ids(); }
+    stk::mesh::Entity get_assigned_node_for_index(const size_t nodeIndex) const { return mMesh.get_entity(stk::topology::NODE_RANK, get_assigned_node_global_ids()[nodeIndex]); }
+    const std::vector<stk::mesh::Entity> & get_owned_elements() const { return mBuilder.get_owned_elements(); }
+
+    template <typename MeshSpecType>
+    void build_full_np1_mesh(const MeshSpecType &meshSpec)
+    {
+        build_mesh(meshSpec.mNodeLocs, {meshSpec.mAllTetConn});
+    }
+
+    void build_mesh(const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+                    const std::vector<std::vector<std::array<unsigned,NPE>>> &elemConnPerProc)
+    {
+      mMesh.mesh_meta_data().use_simple_fields();
+      mBuilder.build_mesh(nodeLocs, elemConnPerProc, theBlockId);
+    }
+
+    void build_mesh(const std::vector<stk::math::Vec<double,DIM>> &nodeLocs,
+                    const std::vector<std::array<unsigned, NPE>> &elementConn,
+                    const std::vector<unsigned> &elementBlockIDs,
+                    const std::vector<int> &specifiedElementProcOwners = {})
+    {
+      mMesh.mesh_meta_data().use_simple_fields();
+      mBuilder.create_block_parts(elementBlockIDs);
+      mBuilder.build_mesh(nodeLocs, elementConn, elementBlockIDs, specifiedElementProcOwners);
+    }
+};
+
+typedef StkMeshFixture<3> StkMeshTetFixture;
+typedef StkMeshFixture<2> StkMeshTriFixture;
+
+}
+
+
+#endif /* KRINO_KRINO_UNIT_TESTS_AKRI_STKMESHFIXTURE_HPP_ */
diff --git a/packages/krino/krino/unit_tests/Akri_UnitTestUtils.cpp b/packages/krino/krino/unit_tests/Akri_UnitTestUtils.cpp
index fbb85740d585..ab4dd88ee740 100644
--- a/packages/krino/krino/unit_tests/Akri_UnitTestUtils.cpp
+++ b/packages/krino/krino/unit_tests/Akri_UnitTestUtils.cpp
@@ -6,14 +6,20 @@
 // Use of this source code is governed by a BSD-style
 // license that can be found in the LICENSE file.
 
+#include <Akri_UnitTestUtils.hpp>
 #include <Akri_Vec.hpp>
 #include <gtest/gtest.h>
 
 namespace krino {
 
-void expect_eq(const Vector3d & gold, const Vector3d & result, const double relativeTol=1.e-6)
+void expect_eq(const Vector3d & gold, const Vector3d & result, const double relativeTol)
 {
   const double absoluteTol = relativeTol * (gold.length() + result.length());
+  expect_eq_absolute(gold, result, absoluteTol);
+}
+
+void expect_eq_absolute(const Vector3d & gold, const Vector3d & result, const double absoluteTol)
+{
   for (int i=0; i<3; ++i)
     EXPECT_NEAR(gold[i], result[i], absoluteTol) <<"gold: " << gold << " actual:" << result;
 }
diff --git a/packages/krino/krino/unit_tests/Akri_UnitTestUtils.hpp b/packages/krino/krino/unit_tests/Akri_UnitTestUtils.hpp
index ebb0e3b7dbe0..429b57ba7d27 100644
--- a/packages/krino/krino/unit_tests/Akri_UnitTestUtils.hpp
+++ b/packages/krino/krino/unit_tests/Akri_UnitTestUtils.hpp
@@ -13,6 +13,7 @@
 namespace krino {
 
 void expect_eq(const Vector3d & gold, const Vector3d & result, const double relativeTol=1.e-6);
+void expect_eq_absolute(const Vector3d & gold, const Vector3d & result, const double absoluteTol=1.e-6);
 
 }
 
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_Analytic_CDMesh.cpp b/packages/krino/krino/unit_tests/Akri_Unit_Analytic_CDMesh.cpp
index eded15aa0c89..34543003a2a0 100644
--- a/packages/krino/krino/unit_tests/Akri_Unit_Analytic_CDMesh.cpp
+++ b/packages/krino/krino/unit_tests/Akri_Unit_Analytic_CDMesh.cpp
@@ -82,7 +82,12 @@ class AnalyticDecompositionFixture : public ::testing::Test
   {
     NodeToCapturedDomainsMap nodesToCapturedDomains;
     if (cdfemSupport.get_cdfem_edge_degeneracy_handling() == SNAP_TO_INTERFACE_WHEN_QUALITY_ALLOWS_THEN_SNAP_TO_NODE)
-      nodesToCapturedDomains = snap_as_much_as_possible_while_maintaining_quality(krino_mesh->stk_bulk(), krino_mesh->get_active_part(), cdfemSupport.get_interpolation_fields(), interfaceGeometry, cdfemSupport.get_global_ids_are_parallel_consistent());
+      nodesToCapturedDomains = snap_as_much_as_possible_while_maintaining_quality(krino_mesh->stk_bulk(),
+          krino_mesh->get_active_part(),
+          cdfemSupport.get_interpolation_fields(),
+          interfaceGeometry,
+          cdfemSupport.get_global_ids_are_parallel_consistent(),
+          cdfemSupport.get_snapping_sharp_feature_angle_in_degrees());
     interfaceGeometry.prepare_to_process_elements(krino_mesh->stk_bulk(), nodesToCapturedDomains);
 
     if(!krino_mesh->my_old_mesh)
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_CDMesh.cpp b/packages/krino/krino/unit_tests/Akri_Unit_CDMesh.cpp
index 184e973dfbb9..664754051685 100644
--- a/packages/krino/krino/unit_tests/Akri_Unit_CDMesh.cpp
+++ b/packages/krino/krino/unit_tests/Akri_Unit_CDMesh.cpp
@@ -587,7 +587,14 @@ class CompleteDecompositionFixture : public ::testing::Test
     NodeToCapturedDomainsMap nodesToSnappedDomains;
     std::unique_ptr<InterfaceGeometry> interfaceGeometry = create_levelset_geometry(krino_mesh->get_active_part(), cdfemSupport, Phase_Support::get(fixture.meta_data()), ls_policy.ls_fields());
     if (cdfemSupport.get_cdfem_edge_degeneracy_handling() == SNAP_TO_INTERFACE_WHEN_QUALITY_ALLOWS_THEN_SNAP_TO_NODE)
-      nodesToSnappedDomains = snap_as_much_as_possible_while_maintaining_quality(krino_mesh->stk_bulk(), krino_mesh->get_active_part(), cdfemSupport.get_interpolation_fields(), *interfaceGeometry, cdfemSupport.get_global_ids_are_parallel_consistent());
+    {
+      nodesToSnappedDomains = snap_as_much_as_possible_while_maintaining_quality(krino_mesh->stk_bulk(),
+          krino_mesh->get_active_part(),
+          cdfemSupport.get_interpolation_fields(),
+          *interfaceGeometry,
+          cdfemSupport.get_global_ids_are_parallel_consistent(),
+          cdfemSupport.get_snapping_sharp_feature_angle_in_degrees());
+    }
     interfaceGeometry->prepare_to_process_elements(krino_mesh->stk_bulk(), nodesToSnappedDomains);
 
     if(!krino_mesh->my_old_mesh)
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_CurvatureLeastSquares.cpp b/packages/krino/krino/unit_tests/Akri_Unit_CurvatureLeastSquares.cpp
new file mode 100644
index 000000000000..594a523442fe
--- /dev/null
+++ b/packages/krino/krino/unit_tests/Akri_Unit_CurvatureLeastSquares.cpp
@@ -0,0 +1,164 @@
+// Copyright 2002 - 2008, 2010, 2011 National Technology Engineering
+// Solutions of Sandia, LLC (NTESS). Under the terms of Contract
+// DE-NA0003525 with NTESS, the U.S. Government retains certain rights
+// in this software.
+//
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+#include <gtest/gtest.h>
+
+#include <Akri_Vec.hpp>
+#include <Akri_CurvatureLeastSquares.hpp>
+#include "Akri_UnitTestUtils.hpp"
+
+namespace krino
+{
+
+class NodePatchInterface
+{
+public:
+  virtual const std::vector<Vector3d>  & get_halo_node_locations() const = 0;
+  virtual const std::vector<std::array<int,2>>& get_halo_segments() const = 0;
+};
+
+void test_rotation(const Vector3d & normal)
+{
+  static const Vector3d zDir(0.,0.,1.);
+
+  std::array<std::array<double,3>,3> rotationMatrix;
+  set_rotation_matrix_for_rotating_normal_to_zDir(rotationMatrix, normal);
+
+  const Vector3d rotatedNormal = rotate_3d_vector(rotationMatrix, normal);
+
+  expect_eq(zDir, rotatedNormal);
+
+  const Vector3d reverseRotatedZdir = reverse_rotate_3d_vector(rotationMatrix, zDir);
+
+  expect_eq(normal, reverseRotatedZdir);
+}
+
+TEST(CurvatureLeastSquares, rotationTest)
+{
+  test_rotation(Vector3d(0.,0.,1.));
+  test_rotation(Vector3d(1.,0.,0.));
+  test_rotation(Vector3d(0.,1.,0.));
+
+  const double cos45 = std::sqrt(2.)/2.;
+  test_rotation(Vector3d(cos45, cos45, 0.));
+  test_rotation(Vector3d(cos45, 0., cos45));
+  test_rotation(Vector3d(0., cos45, cos45));
+}
+
+class PolygonalPatchOnSphere : public NodePatchInterface
+{
+public:
+  PolygonalPatchOnSphere(const Vector3d & normalDir, const double halfCurvature, const int numHaloPts)
+  {
+    const double radius = 2.0/halfCurvature;
+
+    std::array<std::array<double,3>,3> rotationMatrix;
+    set_rotation_matrix_for_rotating_normal_to_zDir(rotationMatrix, normalDir);
+
+    const Vector3d unrotatedNodeLoc(0.,0.,radius);
+    myNodeLoc = reverse_rotate_3d_vector(rotationMatrix, unrotatedNodeLoc);
+
+    const double phi = 15.*M_PI/180.;
+    myHaloNodeLocs.reserve(numHaloPts);
+    myHaloSegments.reserve(numHaloPts);
+    const double dTheta = 2.*M_PI/numHaloPts;
+    for (int i=0; i<numHaloPts; ++i)
+    {
+      const Vector3d unrotatedPtLoc(radius*std::cos(i*dTheta)*std::sin(phi),radius*std::sin(i*dTheta)*std::sin(phi),radius*std::cos(phi));
+      myHaloNodeLocs.push_back(reverse_rotate_3d_vector(rotationMatrix, unrotatedPtLoc) - myNodeLoc);
+      myHaloSegments.push_back({{i,(i+1)%numHaloPts}});
+    }
+  }
+  virtual const std::vector<Vector3d> & get_halo_node_locations() const override { return myHaloNodeLocs; }
+  virtual const std::vector<std::array<int,2>> & get_halo_segments() const override { return myHaloSegments; }
+
+private:
+  Vector3d myNodeLoc;
+  std::vector<Vector3d> myHaloNodeLocs;
+  std::vector<std::array<int,2>> myHaloSegments;
+};
+
+class PolygonalPatchOnPlane : public NodePatchInterface
+{
+public:
+  PolygonalPatchOnPlane(const Vector3d & normalDir, const int numHaloPts)
+  {
+    std::array<std::array<double,3>,3> rotationMatrix;
+    set_rotation_matrix_for_rotating_normal_to_zDir(rotationMatrix, normalDir);
+
+    myHaloNodeLocs.reserve(numHaloPts);
+    myHaloSegments.reserve(numHaloPts);
+    const double dTheta = 2.*M_PI/numHaloPts;
+    for (int i=0; i<numHaloPts; ++i)
+    {
+      const Vector3d unrotatedPtLoc(std::cos(i*dTheta),std::sin(i*dTheta),0.);
+      myHaloNodeLocs.push_back(reverse_rotate_3d_vector(rotationMatrix, unrotatedPtLoc));
+      myHaloSegments.push_back({{i,(i+1)%numHaloPts}});
+    }
+  }
+  virtual const std::vector<Vector3d> & get_halo_node_locations() const override { return myHaloNodeLocs; }
+  virtual const std::vector<std::array<int,2>> & get_halo_segments() const override { return myHaloSegments; }
+
+private:
+  std::vector<Vector3d> myHaloNodeLocs;
+  std::vector<std::array<int,2>> myHaloSegments;
+};
+
+void test_flat_triangle_patch_with_normal_gives_zero_normalCurvature(const Vector3d & normal)
+{
+  PolygonalPatchOnPlane patch(normal, 3);
+
+  const Vector3d normalCurvature = compute_least_squares_curvature_times_normal(patch.get_halo_node_locations(), patch.get_halo_segments());
+  expect_eq_absolute(Vector3d::ZERO, normalCurvature, 1.e-6);
+}
+
+TEST(CurvatureLeastSquares, Flat3TrianglePatches_zeroNormalCurvature)
+{
+  test_flat_triangle_patch_with_normal_gives_zero_normalCurvature(Vector3d(0.,0.,1.));
+  test_flat_triangle_patch_with_normal_gives_zero_normalCurvature(Vector3d(1.,0.,0.));
+  test_flat_triangle_patch_with_normal_gives_zero_normalCurvature(Vector3d(0.,1.,0.));
+
+  const double cos45 = std::sqrt(2.)/2.;
+  test_flat_triangle_patch_with_normal_gives_zero_normalCurvature(Vector3d(cos45, cos45, 0.));
+  test_flat_triangle_patch_with_normal_gives_zero_normalCurvature(Vector3d(cos45, 0., cos45));
+}
+
+void test_normalCurvature_for_curved_patch(const Vector3d & normalDir, const double curvature, const int numHaloNodes)
+{
+  const Vector3d normal = normalDir.unit_vector();
+  PolygonalPatchOnSphere patch(normal, curvature, numHaloNodes);
+  const Vector3d goldNormalCurvature = curvature*normal;
+
+  const Vector3d normalCurvature = compute_least_squares_curvature_times_normal(patch.get_halo_node_locations(), patch.get_halo_segments());
+  expect_eq(goldNormalCurvature, normalCurvature, 1.e-2);
+}
+
+void test_normalCurvature_for_curved_patches(const int numHaloNodes)
+{
+  const double curvature = 0.1;
+  test_normalCurvature_for_curved_patch(Vector3d(0.,0.,1.), curvature, numHaloNodes);
+  test_normalCurvature_for_curved_patch(Vector3d(1.,0.,0.), curvature, numHaloNodes);
+  test_normalCurvature_for_curved_patch(Vector3d(0.,1.,0.), curvature, numHaloNodes);
+
+  const double cos45 = std::sqrt(2.)/2.;
+  test_normalCurvature_for_curved_patch(Vector3d(cos45, cos45, 0.), curvature, numHaloNodes);
+  test_normalCurvature_for_curved_patch(Vector3d(cos45, 0., cos45), curvature, numHaloNodes);
+}
+
+TEST(CurvatureLeastSquares, CurvedPatchesOfVariousSizes_correctNormalCurvature)
+{
+  // curvature only fit
+  test_normalCurvature_for_curved_patches(3);
+  test_normalCurvature_for_curved_patches(4);
+
+  // curvature and normal fit
+  test_normalCurvature_for_curved_patches(5);
+  test_normalCurvature_for_curved_patches(7);
+}
+
+} // namespace krino
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_Explicit_Hamilton_Jacobi.cpp b/packages/krino/krino/unit_tests/Akri_Unit_Explicit_Hamilton_Jacobi.cpp
index 33e73c71a2e4..02e0c482180c 100644
--- a/packages/krino/krino/unit_tests/Akri_Unit_Explicit_Hamilton_Jacobi.cpp
+++ b/packages/krino/krino/unit_tests/Akri_Unit_Explicit_Hamilton_Jacobi.cpp
@@ -46,18 +46,18 @@ stk::mesh::BulkData & read_mesh(stk::io::StkMeshIoBroker & stkIo)
 
 void declare_fields(stk::mesh::MetaData & meta, ProblemFields & fields)
 {
-  fields.levelSetField = &meta.declare_field<stk::mesh::Field<double>>(stk::topology::NODE_RANK, "LevelSet", 2);
+  fields.levelSetField = &meta.declare_field<double>(stk::topology::NODE_RANK, "LevelSet", 2);
   stk::mesh::put_field_on_mesh(*fields.levelSetField, meta.universal_part(), nullptr);
-  fields.RHS = &meta.declare_field<stk::mesh::Field<double>>(stk::topology::NODE_RANK, "RHS", 1);
+  fields.RHS = &meta.declare_field<double>(stk::topology::NODE_RANK, "RHS", 1);
   stk::mesh::put_field_on_mesh(*fields.RHS, meta.universal_part(), nullptr);
-  fields.RHSNorm = &meta.declare_field<stk::mesh::Field<double>>(stk::topology::NODE_RANK, "RHSNorm", 1);
+  fields.RHSNorm = &meta.declare_field<double>(stk::topology::NODE_RANK, "RHSNorm", 1);
   stk::mesh::put_field_on_mesh(*fields.RHSNorm, meta.universal_part(), nullptr);
   auto constCoordsField = static_cast<const stk::mesh::Field<double>*>(meta.coordinate_field());
   fields.coordsField = const_cast<stk::mesh::Field<double>*>(constCoordsField);
 
   if (true)
   {
-    fields.speedField = &meta.declare_field<stk::mesh::Field<double>>(stk::topology::ELEMENT_RANK, "Speed", 1);
+    fields.speedField = &meta.declare_field<double>(stk::topology::ELEMENT_RANK, "Speed", 1);
     stk::mesh::put_field_on_mesh(*fields.speedField, meta.universal_part(), nullptr);
   }
 }
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_MeshHelpers.cpp b/packages/krino/krino/unit_tests/Akri_Unit_MeshHelpers.cpp
index a7a04758b117..2b5de30e7b6c 100644
--- a/packages/krino/krino/unit_tests/Akri_Unit_MeshHelpers.cpp
+++ b/packages/krino/krino/unit_tests/Akri_Unit_MeshHelpers.cpp
@@ -8,6 +8,8 @@
 
 #include <gtest/gtest.h>
 
+#include <memory>
+#include <stk_mesh/base/MeshBuilder.hpp>
 #include <stk_mesh/base/BulkData.hpp>
 #include <stk_mesh/base/MetaData.hpp>
 #include <stk_mesh/base/Entity.hpp>
@@ -104,6 +106,13 @@ void test_and_cleanup_internal_side(stk::mesh::BulkData & mesh, const stk::mesh:
 }
 }
 
+auto create_2D_mesh(const stk::ParallelMachine & pm)
+{
+  std::unique_ptr<stk::mesh::BulkData> bulk = stk::mesh::MeshBuilder(pm).set_spatial_dimension(2).create();
+  bulk->mesh_meta_data().use_simple_fields();
+  return bulk;
+}
+
 TEST(MeshHelpers, DeclareElementSide)
 {
   stk::ParallelMachine pm = MPI_COMM_WORLD;
@@ -118,9 +127,10 @@ TEST(MeshHelpers, DeclareElementSide)
    *    1---2---3
    */
 
-  unsigned spatialDim = 2;
-  stk::mesh::MetaData meta(spatialDim);
-  stk::mesh::BulkData mesh(meta, pm);
+
+  auto meshPtr = create_2D_mesh(pm);
+  stk::mesh::BulkData& mesh = *meshPtr;
+  stk::mesh::MetaData& meta = mesh.mesh_meta_data();
 
   stk::mesh::Part& block_1 = meta.declare_part_with_topology("block_1", stk::topology::QUAD_4_2D);
   stk::mesh::Part& block_2 = meta.declare_part_with_topology("block_2", stk::topology::QUAD_4_2D);
@@ -205,9 +215,9 @@ TEST(MeshHelpers, FullyCoincidentVolumeElements)
   // ranks 0 and 1 will have any elements. We test larger number of processors to ensure that
   // we get a parallel-consistent result to avoid potential parallel hangs in the full app.
 
-  unsigned spatialDim = 2;
-  stk::mesh::MetaData meta(spatialDim);
-  stk::mesh::BulkData mesh(meta, pm);
+  auto meshPtr = create_2D_mesh(pm);
+  stk::mesh::BulkData& mesh = *meshPtr;
+  stk::mesh::MetaData& meta = mesh.mesh_meta_data();
 
   stk::mesh::Part& block_1 = meta.declare_part_with_topology("block_1", stk::topology::QUAD_4_2D);
   stk::mesh::Part& active_part = meta.declare_part("active");
@@ -231,9 +241,9 @@ TEST(MeshHelpers, PartiallyCoincidentActiveVolumeElements)
 
   // This test will create a two element mesh (quad4 elements) on 1 or 2 processors.
 
-  unsigned spatialDim = 2;
-  stk::mesh::MetaData meta(spatialDim);
-  stk::mesh::BulkData mesh(meta, pm);
+  auto meshPtr = create_2D_mesh(pm);
+  stk::mesh::BulkData& mesh = *meshPtr;
+  stk::mesh::MetaData& meta = mesh.mesh_meta_data();
 
   stk::mesh::Part& block_1 = meta.declare_part_with_topology("block_1", stk::topology::QUAD_4_2D);
   stk::mesh::Part& active_part = meta.declare_part("active");
@@ -257,9 +267,9 @@ TEST(MeshHelpers, NotCoincidentActiveDegenerateVolumeElements)
 
   // This test will create a two element mesh (quad4 elements) on 1 or 2 processors.
 
-  unsigned spatialDim = 2;
-  stk::mesh::MetaData meta(spatialDim);
-  stk::mesh::BulkData mesh(meta, pm);
+  auto meshPtr = create_2D_mesh(pm);
+  stk::mesh::BulkData& mesh = *meshPtr;
+  stk::mesh::MetaData& meta = mesh.mesh_meta_data();
 
   stk::mesh::Part& block_1 = meta.declare_part_with_topology("block_1", stk::topology::QUAD_4_2D);
   stk::mesh::Part& active_part = meta.declare_part("active");
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_RebalanceUtils.cpp b/packages/krino/krino/unit_tests/Akri_Unit_RebalanceUtils.cpp
index 76e36e1822de..c489a261b2c9 100644
--- a/packages/krino/krino/unit_tests/Akri_Unit_RebalanceUtils.cpp
+++ b/packages/krino/krino/unit_tests/Akri_Unit_RebalanceUtils.cpp
@@ -50,10 +50,8 @@ void create_block_and_register_fields(SimpleStkFixture & fixture)
   auto & meta = fixture.meta_data();
   meta.declare_part_with_topology("block_1", stk::topology::TRIANGLE_3_2D);
 
-  meta.declare_field<stk::mesh::Field<double, stk::mesh::Cartesian2d> >
-      (stk::topology::NODE_RANK, "coordinates");
-  auto & load_field =
-      meta.declare_field<stk::mesh::Field<double>>(stk::topology::ELEMENT_RANK, "element_weights");
+  meta.declare_field<double>(stk::topology::NODE_RANK, "coordinates");
+  auto & load_field = meta.declare_field<double>(stk::topology::ELEMENT_RANK, "element_weights");
   stk::mesh::put_field_on_mesh(load_field, meta.universal_part(), nullptr);
 
   fixture.commit();
@@ -359,16 +357,13 @@ TEST(Rebalance, MultipleWeightFields)
   stk::mesh::Part & block_1 = meta.declare_part_with_topology("block_1", stk::topology::QUAD_4_2D);
   stk::mesh::Part & block_2 = meta.declare_part_with_topology("block_2", stk::topology::QUAD_4_2D);
 
-  auto & coords_field = meta.declare_field<stk::mesh::Field<double, stk::mesh::Cartesian2d>>(
-      stk::topology::NODE_RANK, "coordinates");
-  stk::mesh::put_field_on_mesh(coords_field, meta.universal_part(), nullptr);
+  auto & coords_field = meta.declare_field<double>(stk::topology::NODE_RANK, "coordinates");
+  stk::mesh::put_field_on_mesh(coords_field, meta.universal_part(), 2, nullptr);
 
-  auto & weights_field_1 = meta.declare_field<stk::mesh::Field<double>>(
-      stk::topology::ELEMENT_RANK, "element_weights_1");
+  auto & weights_field_1 = meta.declare_field<double>(stk::topology::ELEMENT_RANK, "element_weights_1");
   stk::mesh::put_field_on_mesh(weights_field_1, block_1, nullptr);
 
-  auto & weights_field_2 = meta.declare_field<stk::mesh::Field<double>>(
-      stk::topology::ELEMENT_RANK, "element_weights_2");
+  auto & weights_field_2 = meta.declare_field<double>(stk::topology::ELEMENT_RANK, "element_weights_2");
   stk::mesh::put_field_on_mesh(weights_field_2, block_2, nullptr);
 
   meta.commit();
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_Single_Element_Fixtures.hpp b/packages/krino/krino/unit_tests/Akri_Unit_Single_Element_Fixtures.hpp
index f3d969b484ba..fb0e9fa223af 100644
--- a/packages/krino/krino/unit_tests/Akri_Unit_Single_Element_Fixtures.hpp
+++ b/packages/krino/krino/unit_tests/Akri_Unit_Single_Element_Fixtures.hpp
@@ -9,6 +9,7 @@
 #ifndef AKRI_UNIT_SINGLE_ELEMENT_FIXTURES_H_
 #define AKRI_UNIT_SINGLE_ELEMENT_FIXTURES_H_
 
+#include <stk_mesh/base/MeshBuilder.hpp>
 #include <stk_mesh/base/BulkData.hpp>   // for BulkData
 #include <stk_mesh/base/MetaData.hpp>   // for MetaData
 
@@ -27,22 +28,25 @@ inline std::vector<std::string> entity_rank_names_with_ft()
 class SimpleStkFixture
 {
 public:
-  SimpleStkFixture(unsigned dimension, MPI_Comm comm = MPI_COMM_WORLD)
-    : meta(dimension, entity_rank_names_with_ft()),
-      bulk(meta, comm)
-  {
-    meta.set_mesh_bulk_data(&bulk);
-    AuxMetaData::create(meta);
+  SimpleStkFixture(unsigned dimension, MPI_Comm comm = MPI_COMM_WORLD) {
+    bulk = stk::mesh::MeshBuilder(comm)
+               .set_spatial_dimension(dimension)
+               .set_entity_rank_names(entity_rank_names_with_ft())
+               .create();
+    
+    meta = bulk->mesh_meta_data_ptr();
+    meta->use_simple_fields();
+    AuxMetaData::create(*meta);
   }
-  void commit() { meta.commit(); }
-  void write_results(const std::string & filename) { write_results(filename, bulk); }
+  void commit() { meta->commit(); }
+  void write_results(const std::string & filename) { write_results(filename, *bulk); }
   static void write_results(const std::string & filename, stk::mesh::BulkData & mesh, const bool use64bitIds = true);
-  stk::mesh::MetaData & meta_data() { return meta; }
-  stk::mesh::BulkData & bulk_data() { return bulk; }
+  stk::mesh::MetaData & meta_data() { return *meta; }
+  stk::mesh::BulkData & bulk_data() { return *bulk; }
 
 private:
-  stk::mesh::MetaData meta;
-  stk::mesh::BulkData bulk;
+  std::shared_ptr<stk::mesh::MetaData> meta;
+  std::unique_ptr<stk::mesh::BulkData> bulk;
 };
 
 class SimpleStkFixture2d : public SimpleStkFixture
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_Snap.cpp b/packages/krino/krino/unit_tests/Akri_Unit_Snap.cpp
new file mode 100644
index 000000000000..402653829453
--- /dev/null
+++ b/packages/krino/krino/unit_tests/Akri_Unit_Snap.cpp
@@ -0,0 +1,555 @@
+#include <type_traits>
+
+#include <Akri_StkMeshFixture.hpp>
+#include <stk_mesh/base/Relation.hpp>
+#include <stk_mesh/base/MetaData.hpp>
+#include <Akri_Snap.hpp>
+#include <stk_mesh/base/SkinBoundary.hpp>
+#include <Akri_CDMesh_Utils.hpp>
+#include <Akri_DiagWriter.hpp>
+#include <Akri_MeshHelpers.hpp>
+#include <stk_mesh/base/GetEntities.hpp>
+#include <Akri_SharpFeature.hpp>
+#include <stk_util/util/ReportHandler.hpp>
+#include <Akri_VolumePreservingSnappingLimiter.hpp>
+
+namespace krino {
+
+struct RegularTri
+{
+    RegularTri() = default;
+    static constexpr int DIM = 2;
+    std::vector<stk::math::Vector2d> nodeLocs
+    {{
+        { 0.000,  0.000 },
+        { 1.000,  0.000 },
+        { 0.500,  std::sqrt(3.)/2. },
+    }};
+
+    std::array<unsigned,3> TriConn{{0, 1, 2}};
+    std::vector<std::array<unsigned, 3>> allElementConn{TriConn};
+};
+
+struct Tri306090
+{
+    Tri306090() = default;
+    static constexpr int DIM = 2;
+    std::vector<stk::math::Vector2d> nodeLocs
+    {{
+        { 0.000,  0.000 },
+        { 0.500,  0.000 },
+        { 0.000,  std::sqrt(3.)/2. },
+    }};
+
+    std::array<unsigned,3> TriConn{{0, 1, 2}};
+    std::vector<std::array<unsigned, 3>> allElementConn{TriConn};
+};
+
+struct TwoTri306090
+{
+    TwoTri306090() = default;
+    static constexpr int DIM = 2;
+    std::vector<stk::math::Vector2d> nodeLocs
+    {{
+        { 0.000,  0.000 },
+        { 0.500,  0.000 },
+        { 0.000,  std::sqrt(3.)/2. },
+        {-0.500,  0.000 }
+    }};
+
+    std::array<unsigned,3> Tri1Conn{{0, 1, 2}};
+    std::array<unsigned,3> Tri2Conn{{0, 2, 3}};
+    std::vector<std::array<unsigned, 3>> allElementConn{Tri1Conn, Tri2Conn};
+};
+
+struct RegularTet
+{
+    RegularTet() = default;
+    static constexpr int DIM = 3;
+    std::vector<stk::math::Vector3d> nodeLocs
+    {{
+        { 0.5,  0.0, -0.5/std::sqrt(2.) },
+        {-0.5,  0.0, -0.5/std::sqrt(2.) },
+        { 0.0, -0.5,  0.5/std::sqrt(2.) },
+        { 0.0,  0.5,  0.5/std::sqrt(2.) },
+    }};
+
+    std::array<unsigned,4> TetConn{{0, 1, 2, 3}};
+    std::vector<std::array<unsigned, 4>> allElementConn{TetConn};
+};
+
+struct RightTet
+{
+    RightTet() = default;
+    static constexpr int DIM = 3;
+    std::vector<stk::math::Vector3d> nodeLocs
+    {{
+        { 0.0, 0.0, 0.0 },
+        { 1.0, 0.0, 0.0 },
+        { 0.0, 1.0, 0.0 },
+        { 0.0, 0.0, 1.0 },
+    }};
+
+    std::array<unsigned,4> TetConn{{0, 1, 2, 3}};
+    std::vector<std::array<unsigned, 4>> allElementConn{TetConn};
+};
+
+struct FourRightTets
+{
+    FourRightTets() = default;
+    static constexpr int DIM = 3;
+    std::vector<stk::math::Vector3d> nodeLocs
+    {{
+        { 0.0, 0.0, 0.0 },
+        { 1.0, 0.0, 0.0 },
+        { 0.0, 1.0, 0.0 },
+        {-1.0, 0.0, 0.0 },
+        { 0.0,-1.0, 0.0 },
+        { 0.0, 0.0, 1.0 },
+    }};
+
+    std::array<unsigned,4> Tet1Conn{{0, 1, 2, 5}};
+    std::array<unsigned,4> Tet2Conn{{0, 2, 3, 5}};
+    std::array<unsigned,4> Tet3Conn{{0, 3, 4, 5}};
+    std::array<unsigned,4> Tet4Conn{{0, 4, 1, 5}};
+    std::vector<std::array<unsigned, 4>> allElementConn{Tet1Conn, Tet2Conn, Tet3Conn, Tet4Conn};
+};
+
+struct TwoRightTets
+{
+    TwoRightTets() = default;
+    static constexpr int DIM = 3;
+    std::vector<stk::math::Vector3d> nodeLocs
+    {{
+        { 0.0, 0.0, 0.0 },
+        { 1.0, 0.0, 0.0 },
+        { 0.0, 1.0, 0.0 },
+        {-1.0, 0.0, 0.0 },
+        { 0.0, 0.0, 1.0 },
+    }};
+
+    std::array<unsigned,4> Tet1Conn{{0, 1, 2, 4}};
+    std::array<unsigned,4> Tet2Conn{{0, 2, 3, 4}};
+    std::vector<std::array<unsigned, 4>> allElementConn{Tet1Conn, Tet2Conn};
+};
+
+struct TwoRightTris
+{
+    TwoRightTris() = default;
+    static constexpr int DIM = 2;
+    std::vector<stk::math::Vector2d> nodeLocs
+    {{
+        { 0.0, 0.0 },
+        { 1.0, 0.0 },
+        { 0.0, 1.0 },
+        {-1.0, 0.0 },
+    }};
+
+    std::array<unsigned,3> Tri1Conn{{0, 1, 2}};
+    std::array<unsigned,3> Tri2Conn{{0, 2, 3}};
+    std::vector<std::array<unsigned, 3>> allElementConn{Tri1Conn, Tri2Conn};
+};
+
+class RegularTriWithSides : public StkMeshTriFixture
+{
+protected:
+  void create_sides_and_build_mesh(const std::vector<unsigned> &sidesetIds)
+  {
+    mBuilder.create_sideset_parts(sidesetIds);
+
+    RegularTri meshSpec;
+    build_mesh(meshSpec.nodeLocs, {meshSpec.allElementConn});
+  }
+
+  stk::mesh::Entity get_side_1() const { return mBuilder.get_side_with_nodes({get_assigned_node_for_index(0), get_assigned_node_for_index(1)}); }
+  stk::mesh::Entity get_side_2() const { return mBuilder.get_side_with_nodes({get_assigned_node_for_index(0), get_assigned_node_for_index(2)}); }
+
+  void expect_which_snaps_are_allowed(const std::vector<bool> & goldWhichSnapsAreAllowed, const std::vector<unsigned> & intersectionNodeIndices)
+  {
+    std::vector<stk::mesh::Entity> intersectionNodes;
+    for (auto intersectionNodeIndex : intersectionNodeIndices)
+      intersectionNodes.push_back(get_assigned_node_for_index(intersectionNodeIndex));
+
+    const std::vector<bool> whichSnapsAreAllowed = which_intersection_point_nodes_are_compatible_for_snapping(mMesh, mBuilder.get_aux_meta(), mBuilder.get_phase_support(), intersectionNodes);
+    EXPECT_EQ(goldWhichSnapsAreAllowed, whichSnapsAreAllowed);
+  }
+};
+
+TEST_F(RegularTriWithSides, triMeshWithNoSidesets_attemptSnapToIntPointOnSide_snapsAllowed)
+{
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    create_sides_and_build_mesh({});
+
+    expect_which_snaps_are_allowed({true,true}, {1,2});
+  }
+}
+
+TEST_F(RegularTriWithSides, triMeshWithOneSidesetOnOneSide_attemptSnapToIntPointOnThirdSide_oneSnapAllowed)
+{
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    const unsigned sideset1Id = 1;
+    create_sides_and_build_mesh({sideset1Id});
+
+    mBuilder.add_sides_to_sidesets({get_side_1()}, {{sideset1Id}});
+
+    expect_which_snaps_are_allowed({false,true}, {1,2});
+  }
+}
+
+TEST_F(RegularTriWithSides, triMeshWithTwoSidesetOnTwoSides_attemptSnapToIntPointOnThirdSide_noSnapAllowed)
+{
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    const unsigned sideset1Id = 1;
+    const unsigned sideset2Id = 2;
+    create_sides_and_build_mesh({sideset1Id, sideset2Id});
+
+    mBuilder.add_sides_to_sidesets({get_side_1(), get_side_2()}, {{sideset1Id},{sideset2Id}});
+
+    expect_which_snaps_are_allowed({false,false}, {1,2});
+  }
+}
+
+TEST_F(RegularTriWithSides, triMeshWithOneSidesetOnTwoSides_attemptSnapToIntPointOnThirdSide_noSnapAllowed)
+{
+  // This is the sideset keyhole problem.
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    const unsigned sideset1Id = 1;
+    create_sides_and_build_mesh({sideset1Id});
+
+    mBuilder.add_sides_to_sidesets({get_side_1(), get_side_2()}, {{sideset1Id},{sideset1Id}});
+
+    expect_which_snaps_are_allowed({false,false}, {1,2});
+  }
+}
+
+TEST_F(RegularTriWithSides, triMeshWithOneSidesetOnTwoSides_attemptSnapToIntPointOnVolume_noSnapAllowed)
+{
+  // This is a volume intersection point version of the keyhole problem.
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    const unsigned sideset1Id = 1;
+    create_sides_and_build_mesh({sideset1Id});
+
+    mBuilder.add_sides_to_sidesets({get_side_1(), get_side_2()}, {{sideset1Id},{sideset1Id}});
+
+    expect_which_snaps_are_allowed({false,false,false}, {0,1,2});
+  }
+}
+
+template <typename MESHSPEC>
+class SharpFeatureFixture : public StkMeshFixture<MESHSPEC::DIM>
+{
+protected:
+  using StkMeshFixture<MESHSPEC::DIM>::mMesh;
+
+  void find_sharp_features()
+  {
+    mySharpFeatureInfo.find_sharp_features(mMesh, mMesh.mesh_meta_data().coordinate_field(), mMesh.mesh_meta_data().universal_part(), myCosFeatureAngle);
+  }
+
+  void build_mesh_and_find_sharp_features()
+  {
+    this->build_mesh(meshSpec.nodeLocs, {meshSpec.allElementConn});
+    find_sharp_features();
+  }
+
+  void test_is_node_pinned(const stk::mesh::Entity node, const bool goldIsNodePinned)
+  {
+    const SharpFeatureConstraint * constraint = mySharpFeatureInfo.get_constraint(node);
+    if (goldIsNodePinned)
+    {
+      EXPECT_TRUE(constraint != nullptr && constraint->is_pinned());
+    }
+    else
+    {
+      EXPECT_TRUE(constraint == nullptr || !constraint->is_pinned());
+    }
+  }
+
+  bool is_node_in_assigned_nodes_for_indices(const stk::mesh::BulkData & mesh, const stk::mesh::Entity node, const std::vector<unsigned> & nodeIndices)
+  {
+    for (auto nodeIndex : nodeIndices)
+      if (this->get_assigned_node_for_index(nodeIndex) == node)
+        return true;
+    return false;
+  }
+
+  void test_are_nodes_pinned(const std::vector<unsigned> & goldPinnedNodeIndices)
+  {
+    std::vector<stk::mesh::Entity> ownedNodes;
+    stk::mesh::get_selected_entities( mMesh.mesh_meta_data().locally_owned_part(), mMesh.buckets( stk::topology::NODE_RANK ), ownedNodes );
+
+    for (auto && node : ownedNodes)
+    {
+      const bool goldIsNodePinned = is_node_in_assigned_nodes_for_indices(mMesh, node, goldPinnedNodeIndices);
+      test_is_node_pinned(node, goldIsNodePinned);
+    }
+  }
+
+  void test_is_node_constrained_on_edge(const unsigned sharpEdgeNodeIndex, const std::array<unsigned,2> & goldSharpEdgeNodeNbrIndices)
+  {
+    stk::mesh::Entity sharpEdgeNode = this->get_assigned_node_for_index(sharpEdgeNodeIndex);
+    if (mMesh.is_valid(sharpEdgeNode) && mMesh.parallel_owner_rank(sharpEdgeNode) == mMesh.parallel_rank())
+    {
+      const SharpFeatureConstraint * constraint = mySharpFeatureInfo.get_constraint(sharpEdgeNode);
+      ASSERT_TRUE(constraint != nullptr && constraint->is_constrained_on_edge());
+      const std::array<stk::mesh::Entity,2> sharpEdgeNodes = constraint->get_sharp_edge_nodes();
+      for (auto goldSharpEdgeNodeNbrIndex : goldSharpEdgeNodeNbrIndices)
+      {
+        stk::mesh::Entity goldSharpEdgeNodeNbr = this->get_assigned_node_for_index(goldSharpEdgeNodeNbrIndex);
+        EXPECT_TRUE(sharpEdgeNodes[0] == goldSharpEdgeNodeNbr || sharpEdgeNodes[1] == goldSharpEdgeNodeNbr);
+      }
+    }
+  }
+
+  void test_are_all_nodes_pinned()
+  {
+    std::vector<stk::mesh::Entity> ownedNodes;
+    stk::mesh::get_selected_entities( mMesh.mesh_meta_data().locally_owned_part(), mMesh.buckets( stk::topology::NODE_RANK ), ownedNodes );
+
+    for (auto && node : ownedNodes)
+      test_is_node_pinned(node, true);
+  }
+
+  MESHSPEC meshSpec;
+  double myCosFeatureAngle{std::cos(M_PI/180.*135.0)};
+  SharpFeatureInfo mySharpFeatureInfo;
+};
+
+typedef SharpFeatureFixture<RegularTet> SharpFeatureRegularTetFixture;
+
+TEST_F(SharpFeatureRegularTetFixture, meshWithAllNodesOnCorners_allNodesArePinned)
+{
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    build_mesh_and_find_sharp_features();
+
+    test_are_all_nodes_pinned();
+  }
+}
+
+typedef SharpFeatureFixture<RightTet> SharpFeatureRightTetFixture;
+
+TEST_F(SharpFeatureRightTetFixture, meshWithAllNodesOnCorners_allNodesArePinned)
+{
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    build_mesh_and_find_sharp_features();
+
+    test_are_all_nodes_pinned();
+  }
+}
+
+typedef SharpFeatureFixture<RegularTri> SharpFeatureRegularTriFixture;
+
+TEST_F(SharpFeatureRegularTriFixture, meshWithAllNodesOnCorners_allNodesArePinned)
+{
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    build_mesh_and_find_sharp_features();
+
+    test_are_all_nodes_pinned();
+  }
+}
+
+typedef SharpFeatureFixture<Tri306090> SharpFeatureTri306090Fixture;
+
+TEST_F(SharpFeatureTri306090Fixture, meshWithAllNodesOnCorners_allNodesArePinned)
+{
+  if(stk::parallel_machine_size(mComm) == 1)
+  {
+    build_mesh_and_find_sharp_features();
+
+    test_are_all_nodes_pinned();
+  }
+}
+
+typedef SharpFeatureFixture<TwoTri306090> SharpFeatureTwoTri306090Fixture;
+
+TEST_F(SharpFeatureTwoTri306090Fixture, meshWithCornerNodesAndUnconstrainedNode_constraintsAreCorrect)
+{
+  if(stk::parallel_machine_size(mComm) <= 2)
+  {
+    if(stk::parallel_machine_size(mComm) == 1)
+      this->build_mesh(meshSpec.nodeLocs, {meshSpec.allElementConn});
+    else if(stk::parallel_machine_size(mComm) == 2)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,1}, {0,1});
+
+    find_sharp_features();
+
+    const std::vector<unsigned> goldPinnedNodeIndices{1,2,3};
+    test_are_nodes_pinned(goldPinnedNodeIndices);
+  }
+}
+
+typedef SharpFeatureFixture<FourRightTets> SharpFeatureFourRightTetsFixture;
+
+TEST_F(SharpFeatureFourRightTetsFixture, meshWithCornerNodesAndUnconstrainedNode_constraintsAreCorrect)
+{
+  if(stk::parallel_machine_size(mComm) <= 4)
+  {
+    if(stk::parallel_machine_size(mComm) == 1)
+      this->build_mesh(meshSpec.nodeLocs, {meshSpec.allElementConn});
+    else if(stk::parallel_machine_size(mComm) == 2)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,1,1,1}, {0,0,1,1});
+    else if(stk::parallel_machine_size(mComm) == 3)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,1,1,1}, {0,1,2,2});
+    else if(stk::parallel_machine_size(mComm) == 4)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,1,1,1}, {0,1,2,3});
+
+    find_sharp_features();
+
+    const std::vector<unsigned> goldPinnedNodeIndices{1,2,3,4,5};
+    test_are_nodes_pinned(goldPinnedNodeIndices);
+  }
+}
+
+typedef SharpFeatureFixture<TwoRightTets> SharpFeatureTwoRightTetsFixture;
+
+TEST_F(SharpFeatureTwoRightTetsFixture, meshWithCornerNodesAndEdgeNode_constraintsAreCorrect)
+{
+  if(stk::parallel_machine_size(mComm) <= 2)
+  {
+    if(stk::parallel_machine_size(mComm) == 1)
+      this->build_mesh(meshSpec.nodeLocs, {meshSpec.allElementConn});
+    else if(stk::parallel_machine_size(mComm) == 2)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,1}, {0,1});
+
+    find_sharp_features();
+
+    const std::vector<unsigned> goldPinnedNodeIndices{1,2,3,4};
+    test_are_nodes_pinned(goldPinnedNodeIndices);
+
+    test_is_node_constrained_on_edge(0, {{1,3}});
+  }
+}
+
+template <typename MESHSPEC>
+class VolumePreservingSnappingLimiterFixture : public StkMeshFixture<MESHSPEC::DIM>
+{
+protected:
+  using StkMeshFixture<MESHSPEC::DIM>::mMesh;
+
+  Vector3d compute_snap_location(const std::vector<unsigned> & snapNodeIndices, const std::vector<double> & snapNodeWeights)
+  {
+    stk::math::Vector3d snapLocation = stk::math::Vector3d::ZERO;
+    for (size_t i=0; i<snapNodeIndices.size(); ++i)
+    {
+      stk::mesh::Entity snapNode = this->get_assigned_node_for_index(snapNodeIndices[i]);
+      const stk::math::Vector3d nodeLocation(field_data<double>(*mMesh.mesh_meta_data().coordinate_field(), snapNode), mMesh.mesh_meta_data().spatial_dimension());
+      snapLocation += snapNodeWeights[i] * nodeLocation;
+    }
+    return snapLocation;
+  }
+
+  void test_is_snap_allowed_based_on_volume_change(const bool goldIsSnapAllowed, const unsigned nodeIndex, const std::vector<unsigned> & snapNodeIndices, const std::vector<double> & snapNodeWeights)
+  {
+    stk::mesh::Entity node = this->get_assigned_node_for_index(nodeIndex);
+    if (mMesh.is_valid(node) && mMesh.parallel_owner_rank(node) == mMesh.parallel_rank())
+    {
+      EXPECT_EQ(goldIsSnapAllowed, myVolumePreservingSnappingLimiter->is_snap_allowed(node, compute_snap_location(snapNodeIndices, snapNodeWeights)));
+    }
+  }
+
+  VolumePreservingSnappingLimiter::ElementToBlockConverter build_element_to_block_converter()
+  {
+    auto converter = [](const stk::mesh::BulkData & mesh, const stk::mesh::Entity elem)
+    {
+      for (auto && part : mesh.bucket(elem).supersets())
+        if (part->primary_entity_rank() == stk::topology::ELEMENT_RANK && !stk::mesh::is_auto_declared_part(*part))
+          return part;
+      stk::mesh::Part * blockPart = nullptr;
+      return blockPart;
+    };
+    return converter;
+  }
+
+  void setup_volume_preserving_snapping_limiter()
+  {
+    myVolumePreservingSnappingLimiter = std::make_unique<VolumePreservingSnappingLimiter>(mMesh, *mMesh.mesh_meta_data().coordinate_field(), build_element_to_block_converter(), myVolumeConservationTol);
+  }
+
+  MESHSPEC meshSpec;
+  double myVolumeConservationTol{0.05};
+  std::unique_ptr<VolumePreservingSnappingLimiter> myVolumePreservingSnappingLimiter;
+};
+
+typedef VolumePreservingSnappingLimiterFixture<TwoRightTets> VolumePreservingSnappingLimiterTwoRightTetsFixture;
+
+TEST_F(VolumePreservingSnappingLimiterTwoRightTetsFixture, meshWithOneBlockWithCornerNodesAndEdgeNode_constraintsAreCorrect)
+{
+  if(stk::parallel_machine_size(mComm) <= 2)
+  {
+    if(stk::parallel_machine_size(mComm) == 1)
+      this->build_mesh(meshSpec.nodeLocs, {meshSpec.allElementConn});
+    else if(stk::parallel_machine_size(mComm) == 2)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,1}, {0,1});
+
+    setup_volume_preserving_snapping_limiter();
+
+    test_is_snap_allowed_based_on_volume_change(true, 1, {1,2}, {0.99,0.01});
+    test_is_snap_allowed_based_on_volume_change(false, 1, {1,2}, {0.5,0.5});
+
+    test_is_snap_allowed_based_on_volume_change(true, 0, {0,1}, {0.5,0.5});
+    test_is_snap_allowed_based_on_volume_change(true, 0, {0,3}, {0.5,0.5});
+  }
+}
+
+TEST_F(VolumePreservingSnappingLimiterTwoRightTetsFixture, meshWithTwoBlockWithCornerNodesAndEdgeNode_constraintsAreCorrect)
+{
+  if(stk::parallel_machine_size(mComm) <= 2)
+  {
+    if(stk::parallel_machine_size(mComm) == 1)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,2}, {0,0});
+    else if(stk::parallel_machine_size(mComm) == 2)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,2}, {0,1});
+
+    setup_volume_preserving_snapping_limiter();
+
+    test_is_snap_allowed_based_on_volume_change(false, 0, {0,1}, {0.5,0.5});
+    test_is_snap_allowed_based_on_volume_change(false, 0, {0,3}, {0.5,0.5});
+  }
+}
+
+typedef VolumePreservingSnappingLimiterFixture<TwoRightTris> VolumePreservingSnappingLimiterTwoRightTrisFixture;
+
+TEST_F(VolumePreservingSnappingLimiterTwoRightTrisFixture, meshWithOneBlockWithCornerNodesAndEdgeNode_constraintsAreCorrect)
+{
+  if(stk::parallel_machine_size(mComm) <= 2)
+  {
+    if(stk::parallel_machine_size(mComm) == 1)
+      this->build_mesh(meshSpec.nodeLocs, {meshSpec.allElementConn});
+    else if(stk::parallel_machine_size(mComm) == 2)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,1}, {0,1});
+
+    setup_volume_preserving_snapping_limiter();
+
+    test_is_snap_allowed_based_on_volume_change(true, 1, {1,2}, {0.99,0.01});
+    test_is_snap_allowed_based_on_volume_change(false, 1, {1,2}, {0.5,0.5});
+
+    test_is_snap_allowed_based_on_volume_change(true, 0, {0,1}, {0.5,0.5});
+    test_is_snap_allowed_based_on_volume_change(true, 0, {0,3}, {0.5,0.5});
+  }
+}
+
+TEST_F(VolumePreservingSnappingLimiterTwoRightTrisFixture, meshWithTwoBlockWithCornerNodesAndEdgeNode_constraintsAreCorrect)
+{
+  if(stk::parallel_machine_size(mComm) <= 2)
+  {
+    if(stk::parallel_machine_size(mComm) == 1)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,2}, {0,0});
+    else if(stk::parallel_machine_size(mComm) == 2)
+      this->build_mesh(meshSpec.nodeLocs, meshSpec.allElementConn, {1,2}, {0,1});
+
+    setup_volume_preserving_snapping_limiter();
+
+    test_is_snap_allowed_based_on_volume_change(false, 0, {0,1}, {0.5,0.5});
+    test_is_snap_allowed_based_on_volume_change(false, 0, {0,3}, {0.5,0.5});
+  }
+}
+
+}
diff --git a/packages/krino/krino/unit_tests/Akri_Unit_main.cpp b/packages/krino/krino/unit_tests/Akri_Unit_main.cpp
index fef305ede6b5..75f831ae3fde 100644
--- a/packages/krino/krino/unit_tests/Akri_Unit_main.cpp
+++ b/packages/krino/krino/unit_tests/Akri_Unit_main.cpp
@@ -26,7 +26,7 @@ int main(int argc, char **argv) {
 
   Kokkos::ScopeGuard guard(argc, argv);
 
-  stk::unit_test_util::create_parallel_output(sierra::Env::parallel_rank());
+  stk::unit_test_util::simple_fields::create_parallel_output(sierra::Env::parallel_rank());
 
   return RUN_ALL_TESTS();
 }
diff --git a/packages/stk/stk_balance/stk_balance/balanceUtils.cpp b/packages/stk/stk_balance/stk_balance/balanceUtils.cpp
index abb3f316e0ba..60a3ab5918c8 100644
--- a/packages/stk/stk_balance/stk_balance/balanceUtils.cpp
+++ b/packages/stk/stk_balance/stk_balance/balanceUtils.cpp
@@ -1,6 +1,7 @@
 #include "balanceUtils.hpp"
 #include "mpi.h"
 #include "search_tolerance/FaceSearchTolerance.hpp"
+#include "stk_balance/search_tolerance_algs/SecondShortestEdgeFaceSearchTolerance.hpp"
 #include "stk_mesh/base/Field.hpp"  // for field_data
 #include "stk_mesh/base/FieldBase.hpp"  // for field_data
 #include "stk_util/diag/StringUtil.hpp"
@@ -20,6 +21,7 @@ BalanceSettings::BalanceSettings()
   : m_numInputProcessors(0),
     m_numOutputProcessors(0),
     m_isRebalancing(false),
+    m_shouldFixCoincidentElements(true),
     m_initialDecompMethod("RIB"),
     m_useNestedDecomp(false),
     m_shouldPrintDiagnostics(false),
@@ -74,6 +76,18 @@ VertexWeightMethod BalanceSettings::getVertexWeightMethod() const
   return m_vertexWeightMethod;
 }
 
+bool
+BalanceSettings::shouldFixCoincidentElements() const
+{
+  return m_shouldFixCoincidentElements;
+}
+
+void
+BalanceSettings::setShouldFixCoincidentElements(bool fixCoincidentElements)
+{
+  m_shouldFixCoincidentElements = fixCoincidentElements;
+}
+
 bool BalanceSettings::includeSearchResultsInGraph() const
 {
   return false;
@@ -345,6 +359,39 @@ std::string BalanceSettings::get_log_filename() const
 
 //////////////////////////////////////
 
+GraphCreationSettings::GraphCreationSettings()
+  : m_method(DefaultSettings::decompMethod),
+    m_ToleranceForFaceSearch(DefaultSettings::faceSearchAbsTol),
+    m_ToleranceForParticleSearch(DefaultSettings::particleSearchTol),
+    m_vertexWeightMultiplierForVertexInSearch(DefaultSettings::faceSearchVertexMultiplier),
+    m_edgeWeightForSearch(DefaultSettings::faceSearchEdgeWeight),
+    m_UseConstantToleranceForFaceSearch(false),
+    m_shouldFixSpiders(DefaultSettings::fixSpiders),
+    m_shouldFixMechanisms(DefaultSettings::fixMechanisms),
+    m_spiderBeamConnectivityCountField(nullptr),
+    m_spiderVolumeConnectivityCountField(nullptr),
+    m_outputSubdomainField(nullptr),
+    m_includeSearchResultInGraph(DefaultSettings::useContactSearch),
+    m_useNodeBalancer(false),
+    m_nodeBalancerTargetLoadBalance(1.0),
+    m_nodeBalancerMaxIterations(5)
+{
+  setToleranceFunctionForFaceSearch(
+      std::make_shared<stk::balance::SecondShortestEdgeFaceSearchTolerance>(DefaultSettings::faceSearchRelTol)
+  );
+}
+
+GraphCreationSettings::GraphCreationSettings(double faceSearchTol, double particleSearchTol, double edgeWeightSearch,
+                                             const std::string& decompMethod, double multiplierVWSearch)
+  : GraphCreationSettings()
+{
+  m_method = decompMethod;
+  m_ToleranceForFaceSearch = faceSearchTol;
+  m_ToleranceForParticleSearch = particleSearchTol;
+  m_vertexWeightMultiplierForVertexInSearch = multiplierVWSearch;
+  m_edgeWeightForSearch = edgeWeightSearch;
+}
+
 size_t GraphCreationSettings::getNumNodesRequiredForConnection(stk::topology element1Topology, stk::topology element2Topology) const
 {
   const int noConnection = 1000;
@@ -367,7 +414,7 @@ size_t GraphCreationSettings::getNumNodesRequiredForConnection(stk::topology ele
 
 double GraphCreationSettings::getGraphEdgeWeightForSearch() const
 {
-  return edgeWeightForSearch;
+  return m_edgeWeightForSearch;
 }
 
 double GraphCreationSettings::getGraphEdgeWeight(stk::topology element1Topology, stk::topology element2Topology) const
@@ -476,7 +523,7 @@ void GraphCreationSettings::setIncludeSearchResultsInGraph(bool doContactSearch)
 
 double GraphCreationSettings::getToleranceForParticleSearch() const
 {
-  return mToleranceForParticleSearch;
+  return m_ToleranceForParticleSearch;
 }
 
 void GraphCreationSettings::setToleranceFunctionForFaceSearch(std::shared_ptr<stk::balance::FaceSearchTolerance> faceSearchTolerance)
@@ -496,7 +543,7 @@ double GraphCreationSettings::getToleranceForFaceSearch(const stk::mesh::BulkDat
                                                         const unsigned numFaceNodes) const
 {
   if (m_UseConstantToleranceForFaceSearch) {
-    return mToleranceForFaceSearch;
+    return m_ToleranceForFaceSearch;
   }
   else {
     return m_faceSearchToleranceFunction->compute(mesh, coordField, faceNodes, numFaceNodes);
@@ -510,35 +557,35 @@ bool GraphCreationSettings::getEdgesForParticlesUsingSearch() const
 
 double GraphCreationSettings::getVertexWeightMultiplierForVertexInSearch() const
 {
-  return vertexWeightMultiplierForVertexInSearch;
+  return m_vertexWeightMultiplierForVertexInSearch;
 }
 
 std::string GraphCreationSettings::getDecompMethod() const
 {
-  return method;
+  return m_method;
 }
 
 void GraphCreationSettings::setDecompMethod(const std::string& input_method)
 {
-  method = input_method;
+  m_method = input_method;
 }
 
 void GraphCreationSettings::setToleranceForFaceSearch(double tol)
 {
   m_UseConstantToleranceForFaceSearch = true;
-  mToleranceForFaceSearch = tol;
+  m_ToleranceForFaceSearch = tol;
 }
 void GraphCreationSettings::setToleranceForParticleSearch(double tol)
 {
-  mToleranceForParticleSearch = tol;
+  m_ToleranceForParticleSearch = tol;
 }
 void GraphCreationSettings::setEdgeWeightForSearch(double w)
 {
-  edgeWeightForSearch = w;
+  m_edgeWeightForSearch = w;
 }
 void GraphCreationSettings::setVertexWeightMultiplierForVertexInSearch(double w)
 {
-  vertexWeightMultiplierForVertexInSearch = w;
+  m_vertexWeightMultiplierForVertexInSearch = w;
 }
 int GraphCreationSettings::getConnectionTableIndex(stk::topology elementTopology) const
 {
diff --git a/packages/stk/stk_balance/stk_balance/balanceUtils.hpp b/packages/stk/stk_balance/stk_balance/balanceUtils.hpp
index 0ce8ff6f87d4..e67359b5e6f0 100644
--- a/packages/stk/stk_balance/stk_balance/balanceUtils.hpp
+++ b/packages/stk/stk_balance/stk_balance/balanceUtils.hpp
@@ -115,6 +115,9 @@ class BalanceSettings
   virtual void setVertexWeightMethod(VertexWeightMethod method);
   virtual VertexWeightMethod getVertexWeightMethod() const;
 
+  virtual bool shouldFixCoincidentElements() const;
+  virtual void setShouldFixCoincidentElements(bool fixCoincidentElements);
+
   // Graph based options only
   virtual bool includeSearchResultsInGraph() const;
   virtual void setIncludeSearchResultsInGraph(bool doContactSearch);
@@ -208,6 +211,7 @@ class BalanceSettings
   unsigned m_numInputProcessors;
   unsigned m_numOutputProcessors;
   bool m_isRebalancing;
+  bool m_shouldFixCoincidentElements;
   std::string m_initialDecompMethod;
   std::string m_inputFilename;
   std::string m_outputFilename;
@@ -230,33 +234,9 @@ class BasicGeometricSettings : public BalanceSettings
 class GraphCreationSettings : public BalanceSettings
 {
 public:
-  GraphCreationSettings()
-    : mToleranceForFaceSearch(DefaultSettings::faceSearchAbsTol),
-      mToleranceForParticleSearch(DefaultSettings::particleSearchTol),
-      edgeWeightForSearch(DefaultSettings::faceSearchEdgeWeight),
-      method(DefaultSettings::decompMethod),
-      vertexWeightMultiplierForVertexInSearch(DefaultSettings::faceSearchVertexMultiplier),
-      m_UseConstantToleranceForFaceSearch(true),
-      m_shouldFixSpiders(DefaultSettings::fixSpiders),
-      m_shouldFixMechanisms(DefaultSettings::fixMechanisms),
-      m_spiderBeamConnectivityCountField(nullptr),
-      m_spiderVolumeConnectivityCountField(nullptr),
-      m_outputSubdomainField(nullptr),
-      m_includeSearchResultInGraph(DefaultSettings::useContactSearch),
-      m_useNodeBalancer(false),
-      m_nodeBalancerTargetLoadBalance(1.0),
-      m_nodeBalancerMaxIterations(5)
-  {}
-
-  GraphCreationSettings(double faceSearchTol, double particleSearchTol, double edgeWeightSearch, const std::string& decompMethod, double multiplierVWSearch)
-    : GraphCreationSettings()
-  {
-    mToleranceForFaceSearch = faceSearchTol;
-    mToleranceForParticleSearch = particleSearchTol;
-    edgeWeightForSearch = edgeWeightSearch;
-    method = decompMethod;
-    vertexWeightMultiplierForVertexInSearch = multiplierVWSearch;
-  }
+  GraphCreationSettings();
+  GraphCreationSettings(double faceSearchTol, double particleSearchTol, double edgeWeightSearch,
+                        const std::string& decompMethod, double multiplierVWSearch);
 
   virtual ~GraphCreationSettings() = default;
 
@@ -311,11 +291,12 @@ class GraphCreationSettings : public BalanceSettings
 protected:
   int getConnectionTableIndex(stk::topology elementTopology) const;
   int getEdgeWeightTableIndex(stk::topology elementTopology) const;
-  double mToleranceForFaceSearch;
-  double mToleranceForParticleSearch;
-  double edgeWeightForSearch;
-  std::string method;
-  double vertexWeightMultiplierForVertexInSearch;
+
+  std::string m_method;
+  double m_ToleranceForFaceSearch;
+  double m_ToleranceForParticleSearch;
+  double m_vertexWeightMultiplierForVertexInSearch;
+  double m_edgeWeightForSearch;
   bool m_UseConstantToleranceForFaceSearch;
   bool m_shouldFixSpiders;
   bool m_shouldFixMechanisms;
@@ -335,8 +316,8 @@ class GraphCreationSettingsWithCustomTolerances : public GraphCreationSettings
   GraphCreationSettingsWithCustomTolerances()
     : GraphCreationSettings()
   {
-    mToleranceForFaceSearch = 0.1;
-    mToleranceForParticleSearch = 1.0;
+    m_ToleranceForFaceSearch = 0.1;
+    m_ToleranceForParticleSearch = 1.0;
   }
 
   virtual bool getEdgesForParticlesUsingSearch() const { return true; }
@@ -384,7 +365,7 @@ class FieldVertexWeightSettings : public GraphCreationSettings
       m_weightField(weightField),
       m_defaultWeight(defaultWeight)
   {
-    method = "parmetis";
+    m_method = "parmetis";
     m_includeSearchResultInGraph = false;
   }
   virtual ~FieldVertexWeightSettings() = default;
@@ -393,8 +374,8 @@ class FieldVertexWeightSettings : public GraphCreationSettings
   virtual bool areVertexWeightsProvidedViaFields() const { return true; }
   virtual int getGraphVertexWeight(stk::topology type) const { return 1; }
   virtual double getImbalanceTolerance() const { return 1.05; }
-  virtual void setDecompMethod(const std::string& input_method) { method = input_method;}
-  virtual std::string getDecompMethod() const { return method; }
+  virtual void setDecompMethod(const std::string& input_method) { m_method = input_method;}
+  virtual std::string getDecompMethod() const { return m_method; }
 
   virtual double getGraphVertexWeight(stk::mesh::Entity entity, int criteria_index = 0) const
   {
diff --git a/packages/stk/stk_balance/stk_balance/internal/Balancer.cpp b/packages/stk/stk_balance/stk_balance/internal/Balancer.cpp
index ad756b03d2ff..9614c78bbd74 100644
--- a/packages/stk/stk_balance/stk_balance/internal/Balancer.cpp
+++ b/packages/stk/stk_balance/stk_balance/internal/Balancer.cpp
@@ -77,8 +77,10 @@ bool loadBalance(const BalanceSettings& balanceSettings, stk::mesh::BulkData& st
   DecompositionChangeList changeList(stkMeshBulkData, decomp);
   balanceSettings.modifyDecomposition(changeList);
 
-  internal::logMessage(stkMeshBulkData.parallel(), "Moving coincident elements to the same processor");
-  keep_coincident_elements_together(stkMeshBulkData, changeList);
+  if (balanceSettings.shouldFixCoincidentElements()) {
+    internal::logMessage(stkMeshBulkData.parallel(), "Moving coincident elements to the same processor");
+    keep_coincident_elements_together(stkMeshBulkData, changeList);
+  }
 
   if (balanceSettings.shouldFixSpiders()) {
     internal::logMessage(stkMeshBulkData.parallel(), "Fixing spider elements");
@@ -88,19 +90,18 @@ bool loadBalance(const BalanceSettings& balanceSettings, stk::mesh::BulkData& st
   const size_t num_global_entity_migrations = changeList.get_num_global_entity_migrations();
   const size_t max_global_entity_migrations = changeList.get_max_global_entity_migrations();
 
-  if (num_global_entity_migrations > 0)
-  {
+  if (num_global_entity_migrations > 0) {
     internal::logMessage(stkMeshBulkData.parallel(), "Moving elements to new processors");
     internal::rebalance(changeList);
 
-    if (balanceSettings.shouldFixMechanisms())
-    {
+    if (balanceSettings.shouldFixMechanisms()) {
       internal::logMessage(stkMeshBulkData.parallel(), "Fixing mechanisms found during decomposition");
       stk::balance::internal::detectAndFixMechanisms(balanceSettings, stkMeshBulkData);
     }
 
-    if (balanceSettings.shouldPrintMetrics())
+    if (balanceSettings.shouldPrintMetrics()) {
       internal::print_rebalance_metrics(num_global_entity_migrations, max_global_entity_migrations, stkMeshBulkData);
+    }
   }
 
   internal::compute_balance_diagnostics(stkMeshBulkData, balanceSettings);
diff --git a/packages/stk/stk_balance/stk_balance/internal/SubdomainWriter.cpp b/packages/stk/stk_balance/stk_balance/internal/SubdomainWriter.cpp
index 858d3b604ce1..ff50d05dcf4e 100644
--- a/packages/stk/stk_balance/stk_balance/internal/SubdomainWriter.cpp
+++ b/packages/stk/stk_balance/stk_balance/internal/SubdomainWriter.cpp
@@ -62,8 +62,8 @@ SubdomainWriter::setup_output_file(const std::string& fileName, unsigned subdoma
 {
   Ioss::DatabaseIO *dbo = stk::io::create_database_for_subdomain(fileName, subdomain, numSubdomains);
   m_outRegion = new Ioss::Region(dbo, fileName);
-
-  stk::io::add_properties_for_subdomain(*m_bulk, *m_outRegion, subdomain, numSubdomains, globalNumNodes, globalNumElems);
+  stk::io::OutputParams params(*m_outRegion, *m_bulk);
+  stk::io::add_properties_for_subdomain(params, subdomain, numSubdomains, globalNumNodes, globalNumElems);
 
   int dbIntSize = m_inputBroker.check_integer_size_requirements_serial();
   if (dbIntSize > 4) {
@@ -114,7 +114,8 @@ SubdomainWriter::write_mesh()
 {
   add_qa_records();
   add_info_records();
-  stk::io::write_file_for_subdomain(*m_outRegion, *m_bulk, m_nodeSharingInfo);
+  stk::io::OutputParams params(*m_outRegion, *m_bulk);
+  stk::io::write_file_for_subdomain(params, m_nodeSharingInfo);
   add_global_variables();
 }
 
@@ -143,7 +144,8 @@ SubdomainWriter::write_global_variables(int step)
 void
 SubdomainWriter::write_transient_data(double time)
 {
-  const int step = stk::io::write_transient_data_for_subdomain(*m_outRegion, *m_bulk, time);
+  stk::io::OutputParams params(*m_outRegion, *m_bulk);
+  const int step = stk::io::write_transient_data_for_subdomain(params, time);
 
   write_global_variables(step);
 }
diff --git a/packages/stk/stk_balance/stk_balance/internal/privateDeclarations.cpp b/packages/stk/stk_balance/stk_balance/internal/privateDeclarations.cpp
index ce37c90f902c..13ffaca54e70 100644
--- a/packages/stk/stk_balance/stk_balance/internal/privateDeclarations.cpp
+++ b/packages/stk/stk_balance/stk_balance/internal/privateDeclarations.cpp
@@ -1511,6 +1511,89 @@ void compute_relative_node_interface_size_diagnostic(RelativeNodeInterfaceSizeDi
                                         : 0.0);
 }
 
+double getTypicalElemsPerNode(stk::topology type)
+{
+  switch(type)
+  {
+  case stk::topology::PARTICLE:
+    return 1;
+  case stk::topology::LINE_2_1D:
+    return 1;
+  case stk::topology::LINE_3_1D:
+    return 1.0/2.0;
+  case stk::topology::BEAM_2:
+    return 1;
+  case stk::topology::BEAM_3:
+    return 1.0/2.0;
+  case stk::topology::SHELL_LINE_2:
+    return 1;
+  case stk::topology::SHELL_LINE_3:
+    return 1.0/2.0;
+  case stk::topology::SPRING_2:
+    return 1;
+  case stk::topology::SPRING_3:
+    return 1.0/2.0;
+  case stk::topology::TRI_3_2D:
+    return 2;
+  case stk::topology::TRI_4_2D:
+    return 2.0/3.0;
+  case stk::topology::TRI_6_2D:
+    return 2.0/4.0;
+  case stk::topology::SHELL_TRI_3:
+    return 2;
+  case stk::topology::SHELL_TRI_4:
+    return 2.0/3.0;
+  case stk::topology::SHELL_TRI_6:
+    return 2.0/4.0;
+  case stk::topology::QUAD_4_2D:
+    return 1;
+  case stk::topology::QUAD_8_2D:
+    return 1.0/3.0;
+  case stk::topology::QUAD_9_2D:
+    return 1.0/4.0;
+  case stk::topology::SHELL_QUAD_4:
+    return 1;
+  case stk::topology::SHELL_QUAD_8:
+    return 1.0/3.0;
+  case stk::topology::SHELL_QUAD_9:
+    return 1.0/4.0;
+  case stk::topology::TET_4:
+    return 6;
+  case stk::topology::TET_8:
+    return 6.0/13.0;
+  case stk::topology::TET_10:
+    return 6.0/8.0;
+  case stk::topology::TET_11:
+    return 6.0/14.0;
+  case stk::topology::PYRAMID_5:
+    return 6.0/2.0;
+  case stk::topology::PYRAMID_13:
+    return 6.0/13.0;
+  case stk::topology::PYRAMID_14:
+    return 6.0/19.0;
+  case stk::topology::WEDGE_6:
+    return 2;
+  case stk::topology::WEDGE_12:
+    return 2.0/4.0;
+  case stk::topology::WEDGE_15:
+    return 2.0/5.0;
+  case stk::topology::WEDGE_18:
+    return 2.0/8.0;
+  case stk::topology::HEXAHEDRON_8:
+    return 1;
+  case stk::topology::HEXAHEDRON_20:
+    return 1.0/4.0;
+  case stk::topology::HEXAHEDRON_27:
+    return 1.0/8.0;
+  default:
+    if ( type.is_superelement( ))
+    {
+      return 1.0/100.0;
+    }
+    throw("Invalid Element Type In WeightsOfElement");
+  }
+}
+
 double get_connected_node_weight(const stk::mesh::BulkData & bulk, std::vector<stk::mesh::Entity> & connectedNodesBuffer,
                                  const stk::mesh::Entity node)
 {
@@ -1544,7 +1627,9 @@ void spread_weight_across_connected_elements(const stk::mesh::BulkData & bulk, c
     const stk::mesh::Entity element = elements[elemIndex];
     if (bulk.bucket(element).owned()) {
       double * elemWeight = stk::mesh::field_data(elementWeights, element);
-      *elemWeight += nodeWeight / numElements;
+      const unsigned numNodes = bulk.num_nodes(element);
+      const double typicalElemsPerNode = getTypicalElemsPerNode(bulk.bucket(element).topology());
+      *elemWeight += nodeWeight / (numNodes * typicalElemsPerNode);
     }
   }
 }
diff --git a/packages/stk/stk_balance/stk_balance/m2n/M2NSubdomainWriter.cpp b/packages/stk/stk_balance/stk_balance/m2n/M2NSubdomainWriter.cpp
index 0524e908e674..9985dcd901fc 100644
--- a/packages/stk/stk_balance/stk_balance/m2n/M2NSubdomainWriter.cpp
+++ b/packages/stk/stk_balance/stk_balance/m2n/M2NSubdomainWriter.cpp
@@ -63,8 +63,8 @@ SubdomainWriter::setup_output_file(const std::string& fileName, unsigned subdoma
 {
   Ioss::DatabaseIO *dbo = stk::io::create_database_for_subdomain(fileName, subdomain, numSubdomains);
   m_outRegion = new Ioss::Region(dbo, fileName);
-
-  stk::io::add_properties_for_subdomain(*m_bulk, *m_outRegion, subdomain, numSubdomains, globalNumNodes, globalNumElems);
+  stk::io::OutputParams params(*m_outRegion, *m_bulk);
+  stk::io::add_properties_for_subdomain(params, subdomain, numSubdomains, globalNumNodes, globalNumElems);
 
   int dbIntSize = m_inputBroker.check_integer_size_requirements_serial();
   if (dbIntSize > 4) {
@@ -115,7 +115,8 @@ SubdomainWriter::write_mesh()
 {
   add_qa_records();
   add_info_records();
-  stk::io::write_file_for_subdomain(*m_outRegion, *m_bulk, m_nodeSharingInfo);
+  stk::io::OutputParams params(*m_outRegion, *m_bulk);
+  stk::io::write_file_for_subdomain(params, m_nodeSharingInfo);
   add_global_variables();
 }
 
@@ -144,7 +145,8 @@ SubdomainWriter::write_global_variables(int step)
 void
 SubdomainWriter::write_transient_data(double time)
 {
-  const int step = stk::io::write_transient_data_for_subdomain(*m_outRegion, *m_bulk, time);
+  stk::io::OutputParams params(*m_outRegion, *m_bulk);
+  const int step = stk::io::write_transient_data_for_subdomain(params, time);
 
   write_global_variables(step);
 }
diff --git a/packages/stk/stk_balance/stk_balance/setup/DefaultSettings.cpp b/packages/stk/stk_balance/stk_balance/setup/DefaultSettings.cpp
index 32138ef01a65..1df78175be38 100644
--- a/packages/stk/stk_balance/stk_balance/setup/DefaultSettings.cpp
+++ b/packages/stk/stk_balance/stk_balance/setup/DefaultSettings.cpp
@@ -63,10 +63,10 @@ std::string vertex_weight_method_name(VertexWeightMethod method) {
 // this entire file can be deleted.
 
 constexpr const char * DefaultSettings::logFile;
+constexpr const char * DefaultSettings::outputDirectory;
 constexpr const char * DefaultSettings::decompMethod;
 
 constexpr bool DefaultSettings::useContactSearch;
-constexpr bool DefaultSettings::fixSpiders;
 constexpr bool DefaultSettings::fixMechanisms;
 
 constexpr double DefaultSettings::faceSearchRelTol;
@@ -74,13 +74,24 @@ constexpr double DefaultSettings::faceSearchAbsTol;
 
 constexpr double DefaultSettings::particleSearchTol;
 
+constexpr VertexWeightMethod DefaultSettings::vertexWeightMethod;
+constexpr double DefaultSettings::graphEdgeWeightMultiplier;
 constexpr double DefaultSettings::faceSearchVertexMultiplier;
 constexpr double DefaultSettings::faceSearchEdgeWeight;
+constexpr bool DefaultSettings::fixSpiders;
 
+constexpr VertexWeightMethod DefaultSettings::sdVertexWeightMethod;
+constexpr double DefaultSettings::sdGraphEdgeWeightMultiplier;
+constexpr double DefaultSettings::sdFaceSearchVertexMultiplier;
+constexpr double DefaultSettings::sdFaceSearchEdgeWeight;
+constexpr bool DefaultSettings::sdFixSpiders;
+
+constexpr VertexWeightMethod DefaultSettings::smVertexWeightMethod;
+constexpr double DefaultSettings::smGraphEdgeWeightMultiplier;
 constexpr double DefaultSettings::smFaceSearchVertexMultiplier;
 constexpr double DefaultSettings::smFaceSearchEdgeWeight;
+constexpr bool DefaultSettings::smFixSpiders;
 
 constexpr const char * DefaultSettings::vertexWeightBlockMultiplier;
-
 }
 }
diff --git a/packages/stk/stk_balance/stk_balance/setup/DefaultSettings.hpp b/packages/stk/stk_balance/stk_balance/setup/DefaultSettings.hpp
index 60cade9bb1c3..166aff0399ae 100644
--- a/packages/stk/stk_balance/stk_balance/setup/DefaultSettings.hpp
+++ b/packages/stk/stk_balance/stk_balance/setup/DefaultSettings.hpp
@@ -54,25 +54,33 @@ struct DefaultSettings {
   static constexpr const char * decompMethod {"parmetis"};
 
   static constexpr bool useContactSearch {true};
-  static constexpr bool fixSpiders {false};
-  static constexpr bool fixMechanisms {true};
+  static constexpr bool fixMechanisms {false};
 
   static constexpr double faceSearchRelTol {0.15};
   static constexpr double faceSearchAbsTol {0.0001};
 
   static constexpr double particleSearchTol {3.0};
 
-  static constexpr double faceSearchVertexMultiplier {5.0};
-  static constexpr double faceSearchEdgeWeight {15.0};
+  static constexpr VertexWeightMethod vertexWeightMethod {VertexWeightMethod::CONSTANT};
+  static constexpr double graphEdgeWeightMultiplier {1.0};
+  static constexpr double faceSearchVertexMultiplier {1.0};
+  static constexpr double faceSearchEdgeWeight {1.0};
+  static constexpr bool fixSpiders {false};
 
-  static constexpr double smFaceSearchVertexMultiplier {10.0};
-  static constexpr double smFaceSearchEdgeWeight {3.0};
+  static constexpr VertexWeightMethod sdVertexWeightMethod {VertexWeightMethod::CONNECTIVITY};
+  static constexpr double sdGraphEdgeWeightMultiplier {10.0};
+  static constexpr double sdFaceSearchVertexMultiplier {2.0};
+  static constexpr double sdFaceSearchEdgeWeight {1.0};
+  static constexpr bool sdFixSpiders {true};
 
-  static constexpr double graphEdgeWeightMultiplier {1.0};
+  static constexpr VertexWeightMethod smVertexWeightMethod {VertexWeightMethod::CONSTANT};
+  static constexpr double smGraphEdgeWeightMultiplier {1.0};
+  static constexpr double smFaceSearchVertexMultiplier {3.0};
+  static constexpr double smFaceSearchEdgeWeight {1.0};
+  static constexpr bool smFixSpiders {false};
 
   static constexpr const char * vertexWeightBlockMultiplier {""};
 
-  static constexpr VertexWeightMethod vertexWeightMethod {VertexWeightMethod::TOPOLOGY};
 };
 
 } }
diff --git a/packages/stk/stk_balance/stk_balance/setup/Parser.cpp b/packages/stk/stk_balance/stk_balance/setup/Parser.cpp
index c83e5cbc8feb..5b33cb57496a 100644
--- a/packages/stk/stk_balance/stk_balance/setup/Parser.cpp
+++ b/packages/stk/stk_balance/stk_balance/setup/Parser.cpp
@@ -84,14 +84,11 @@ std::string Examples::get_long_examples()
   examples += tab + "To decompose for 512 processors and put the decomposition into a directory named 'temp1':\n";
   examples += tab + tab + "> mpirun -n 512 " + m_execName + " mesh.g temp1\n";
   examples += "\n";
-  examples += tab + "To decompose for 16 processors and use the default relative contact search tolerance:\n";
-  examples += tab + tab + "> mpirun -n 16 " + m_execName + " mesh.g " + stk::dash_it(m_optionNames.faceSearchRelTol) + "\n";
-  examples += "\n";
   examples += tab + "To decompose for 16 processors and use a relative contact search tolerance of 0.05:\n";
   examples += tab + tab + "> mpirun -n 16 " + m_execName + " mesh.g " + stk::dash_it(m_optionNames.faceSearchRelTol) + "=0.05\n";
   examples += "\n";
-  examples += tab + "To decompose for 16 processors with the RCB decomposition method:\n";
-  examples += tab + tab + "> mpirun -n 16 " + m_execName + " mesh.g " + stk::dash_it(m_optionNames.decompMethod) + "=rcb\n";
+  examples += tab + "To decompose for 16 processors with the RIB decomposition method:\n";
+  examples += tab + tab + "> mpirun -n 16 " + m_execName + " mesh.g " + stk::dash_it(m_optionNames.decompMethod) + "=rib\n";
   examples += "\n";
   examples += tab + "To rebalance a 16 processor mesh into 64 processors:\n";
   examples += tab + tab + "> mpirun -n 16 " + m_execName + " mesh.g " + stk::dash_it(m_optionNames.rebalanceTo) + "=64\n";
@@ -156,20 +153,24 @@ void Parser::add_options_to_parser()
   smStream << "Use settings suitable for solving Solid Mechanics problems. "
            << "This flag implies:" << std::endl
            << "    " << stk::dash_it(m_optionNames.faceSearchRelTol) << "=" << DefaultSettings::faceSearchRelTol << std::endl
-           << "    " << stk::dash_it(m_optionNames.fixSpiders) << "=" << ((DefaultSettings::fixSpiders) ? "on" : "off") << std::endl
+           << "    " << stk::dash_it(m_optionNames.fixSpiders) << "=" << ((DefaultSettings::smFixSpiders) ? "on" : "off") << std::endl
            << "    " << stk::dash_it(m_optionNames.fixMechanisms) << "=" << ((DefaultSettings::fixMechanisms) ? "on" : "off") << std::endl
-           << "    Face search graph vertex weight multiplier = " << DefaultSettings::smFaceSearchVertexMultiplier << std::endl
-           << "    Face search graph edge weight = " << DefaultSettings::smFaceSearchEdgeWeight;
+           << "    " << stk::dash_it(m_optionNames.vertexWeightMethod) << "=" << vertex_weight_method_name(DefaultSettings::smVertexWeightMethod) << std::endl
+           << "    " << stk::dash_it(m_optionNames.edgeWeightMultiplier) << "=" << DefaultSettings::smGraphEdgeWeightMultiplier << std::endl
+           << "    " << stk::dash_it(m_optionNames.contactSearchVertexWeightMultiplier) << "=" << DefaultSettings::smFaceSearchVertexMultiplier << std::endl
+           << "    " << stk::dash_it(m_optionNames.contactSearchEdgeWeight) << "=" << DefaultSettings::smFaceSearchEdgeWeight << std::endl;
   stk::CommandLineOption smDefaults{m_optionNames.smDefaults, "", smStream.str()};
 
   std::ostringstream sdStream;
   sdStream << "Use settings suitable for solving Structural Dynamics problems. "
            << "This flag implies:" << std::endl
-           << "    " << stk::dash_it(m_optionNames.faceSearchAbsTol) << "=" << DefaultSettings::faceSearchAbsTol << std::endl
-           << "    " << stk::dash_it(m_optionNames.fixSpiders) << "=on" << std::endl
+           << "    " << stk::dash_it(m_optionNames.faceSearchRelTol) << "=" << DefaultSettings::faceSearchRelTol << std::endl
+           << "    " << stk::dash_it(m_optionNames.fixSpiders) << "=" << ((DefaultSettings::sdFixSpiders) ? "on" : "off") << std::endl
            << "    " << stk::dash_it(m_optionNames.fixMechanisms) << "=" << ((DefaultSettings::fixMechanisms) ? "on" : "off") << std::endl
-           << "    Face search graph vertex weight multiplier = " << DefaultSettings::faceSearchVertexMultiplier << std::endl
-           << "    Face search graph edge weight = " << DefaultSettings::faceSearchEdgeWeight;
+           << "    " << stk::dash_it(m_optionNames.vertexWeightMethod) << "=" << vertex_weight_method_name(DefaultSettings::sdVertexWeightMethod) << std::endl
+           << "    " << stk::dash_it(m_optionNames.edgeWeightMultiplier) << "=" << DefaultSettings::sdGraphEdgeWeightMultiplier << std::endl
+           << "    " << stk::dash_it(m_optionNames.contactSearchVertexWeightMultiplier) << "=" << DefaultSettings::sdFaceSearchVertexMultiplier << std::endl
+           << "    " << stk::dash_it(m_optionNames.contactSearchEdgeWeight) << "=" << DefaultSettings::sdFaceSearchEdgeWeight << std::endl;
   stk::CommandLineOption sdDefaults{m_optionNames.sdDefaults, "", sdStream.str()};
 
   stk::CommandLineOption faceSearchAbsTol{m_optionNames.faceSearchAbsTol, "",
@@ -177,7 +178,8 @@ void Parser::add_options_to_parser()
                            "Optionally provide a numeric tolerance value."};
   stk::CommandLineOption faceSearchRelTol{m_optionNames.faceSearchRelTol, "",
                            "Use a tolerance relative to the face size for face contact search. "
-                           "Optionally provide a numeric tolerance value."};
+                           "Optionally provide a numeric tolerance value.  This is the global "
+                           "default.  Values less than 0.5 are recommended."};
   stk::CommandLineOption contactSearch{m_optionNames.contactSearch, "",
                            "Use proximity search for contact [on|off]"};
   stk::CommandLineOption fixSpiders{m_optionNames.fixSpiders, "",
@@ -202,16 +204,18 @@ void Parser::add_options_to_parser()
                            "of processors must be an integer multiple of the input processors."};
 
   stk::CommandLineOption vertexWeightMethod{m_optionNames.vertexWeightMethod, "",
-                           "(Experimental) Method used to calculate vertex weights given to the partitioner. "
+                           "Method used to calculate vertex weights given to the partitioner. "
                            "[constant|topology|connectivity]"};
   stk::CommandLineOption contactSearchEdgeWeight{m_optionNames.contactSearchEdgeWeight, "",
-                           "(Experimental) Graph edge weight to use between elements that are determined to be "
+                           "Graph edge weight to use between elements that are determined to be "
                            "in contact."};
   stk::CommandLineOption contactSearchVertexWeightMultiplier{m_optionNames.contactSearchVertexWeightMultiplier, "",
-                           "(Experimental) Scale factor to be applied to graph vertex weights for elements that "
+                           "Scale factor to be applied to graph vertex weights for elements that "
                            "are determined to be in contact."};
   stk::CommandLineOption edgeWeightMultiplier{m_optionNames.edgeWeightMultiplier, "",
-                           "(Experimental) Scale factor to be applied to all graph edge weights."};
+                           "Scale factor to be applied to all graph edge weights.  This will be "
+                           "automatically set to 1.0 for constant vertex weights, 1.0 for topology "
+                           "vertex weights, and 10.0 for connectivity vertex weights."};
 
 
   m_commandLineParser.add_required_positional<std::string>(infile);
@@ -231,9 +235,9 @@ void Parser::add_options_to_parser()
   m_commandLineParser.add_flag(useNested);
 
   m_commandLineParser.add_optional(vertexWeightMethod, vertex_weight_method_name(DefaultSettings::vertexWeightMethod));
-  m_commandLineParser.add_optional<double>(contactSearchEdgeWeight);
-  m_commandLineParser.add_optional<double>(contactSearchVertexWeightMultiplier);
-  m_commandLineParser.add_optional<double>(edgeWeightMultiplier);
+  m_commandLineParser.add_optional<double>(contactSearchEdgeWeight, DefaultSettings::faceSearchEdgeWeight);
+  m_commandLineParser.add_optional<double>(contactSearchVertexWeightMultiplier, DefaultSettings::faceSearchVertexMultiplier);
+  m_commandLineParser.add_optional<double>(edgeWeightMultiplier, DefaultSettings::graphEdgeWeightMultiplier);
 
   m_commandLineParser.disallow_unrecognized();
 }
@@ -298,15 +302,19 @@ void Parser::set_app_type_defaults(BalanceSettings& settings) const
   ThrowRequireMsg( !(useSM && useSD), "Can't set default settings for multiple apps at the same time");
 
   if (useSM) {
-    settings.setEdgeWeightForSearch(DefaultSettings::smFaceSearchEdgeWeight);
+    settings.setVertexWeightMethod(DefaultSettings::smVertexWeightMethod);
+    settings.setGraphEdgeWeightMultiplier(DefaultSettings::smGraphEdgeWeightMultiplier);
     settings.setVertexWeightMultiplierForVertexInSearch(DefaultSettings::smFaceSearchVertexMultiplier);
-    settings.setToleranceFunctionForFaceSearch(
-        std::make_shared<stk::balance::SecondShortestEdgeFaceSearchTolerance>(DefaultSettings::faceSearchRelTol)
-    );
+    settings.setEdgeWeightForSearch(DefaultSettings::smFaceSearchEdgeWeight);
+    settings.setShouldFixSpiders(DefaultSettings::smFixSpiders);
   }
 
   if (useSD) {
-    settings.setShouldFixSpiders(true);
+    settings.setVertexWeightMethod(DefaultSettings::sdVertexWeightMethod);
+    settings.setGraphEdgeWeightMultiplier(DefaultSettings::sdGraphEdgeWeightMultiplier);
+    settings.setVertexWeightMultiplierForVertexInSearch(DefaultSettings::sdFaceSearchVertexMultiplier);
+    settings.setEdgeWeightForSearch(DefaultSettings::sdFaceSearchEdgeWeight);
+    settings.setShouldFixSpiders(DefaultSettings::sdFixSpiders);
   }
 }
 
@@ -424,12 +432,15 @@ void Parser::set_vertex_weight_method(BalanceSettings &settings) const
     // FIXME: case-insensitive comparison?  Need this for decomp method too?
     if (vertexWeightMethodName == vertex_weight_method_name(VertexWeightMethod::CONSTANT)) {
       settings.setVertexWeightMethod(VertexWeightMethod::CONSTANT);
+      settings.setGraphEdgeWeightMultiplier(1.0);
     }
     else if (vertexWeightMethodName == vertex_weight_method_name(VertexWeightMethod::TOPOLOGY)) {
       settings.setVertexWeightMethod(VertexWeightMethod::TOPOLOGY);
+      settings.setGraphEdgeWeightMultiplier(1.0);
     }
     else if (vertexWeightMethodName == vertex_weight_method_name(VertexWeightMethod::CONNECTIVITY)) {
       settings.setVertexWeightMethod(VertexWeightMethod::CONNECTIVITY);
+      settings.setGraphEdgeWeightMultiplier(10.0);
     }
     else {
       ThrowErrorMsg("Unrecognized vertex weight method: " << vertexWeightMethodName);
diff --git a/packages/stk/stk_balance/stk_balance/setup/Parser.hpp b/packages/stk/stk_balance/stk_balance/setup/Parser.hpp
index 1b816b36f1f5..799125753df5 100644
--- a/packages/stk/stk_balance/stk_balance/setup/Parser.hpp
+++ b/packages/stk/stk_balance/stk_balance/setup/Parser.hpp
@@ -64,10 +64,10 @@ struct OptionNames
   const std::string vertexWeightBlockMultiplier = "block-weights";
   const std::string useNestedDecomp = "use-nested-decomp";
 
-  const std::string vertexWeightMethod = "EXP-vertex-weight-method";
-  const std::string contactSearchEdgeWeight = "EXP-contact-search-edge-weight";
-  const std::string contactSearchVertexWeightMultiplier = "EXP-contact-search-vertex-weight-mult";
-  const std::string edgeWeightMultiplier = "EXP-edge-weight-mult";
+  const std::string vertexWeightMethod = "vertex-weight-method";
+  const std::string contactSearchEdgeWeight = "contact-search-edge-weight";
+  const std::string contactSearchVertexWeightMultiplier = "contact-search-vertex-weight-mult";
+  const std::string edgeWeightMultiplier = "edge-weight-mult";
 };
 
 class Examples
diff --git a/packages/stk/stk_coupling/stk_coupling/OldCommSplitting.cpp b/packages/stk/stk_coupling/stk_coupling/OldCommSplitting.cpp
index 96741d47b90f..5a62835f4ad6 100644
--- a/packages/stk/stk_coupling/stk_coupling/OldCommSplitting.cpp
+++ b/packages/stk/stk_coupling/stk_coupling/OldCommSplitting.cpp
@@ -22,6 +22,7 @@
 #include <limits>
 #include <cctype>
 
+#ifndef STK_HIDE_DEPRECATED_CODE  // delete October 2022
 namespace stk
 {
 namespace coupling
@@ -111,3 +112,5 @@ std::pair<int, int> calc_my_root_and_other_root_ranks(MPI_Comm global, MPI_Comm
 
 }
 }
+
+#endif
\ No newline at end of file
diff --git a/packages/stk/stk_coupling/stk_coupling/OldCommSplitting.hpp b/packages/stk/stk_coupling/stk_coupling/OldCommSplitting.hpp
index 2c3dda186d6c..25a408983a8f 100644
--- a/packages/stk/stk_coupling/stk_coupling/OldCommSplitting.hpp
+++ b/packages/stk/stk_coupling/stk_coupling/OldCommSplitting.hpp
@@ -15,19 +15,25 @@
 #include <vector>
 #include <utility>
 #include <map>
+#include "stk_util/stk_config.h"
 
+#ifndef STK_HIDE_DEPRECATED_CODE  // delete October 2022
 namespace stk
 {
 namespace coupling
 {
 
+STK_DEPRECATED
 std::pair<int, int> calc_my_root_and_other_root_ranks(MPI_Comm global, MPI_Comm local);
 
+STK_DEPRECATED_MSG("prefer stk::couping::are_comms_unequal")
 bool has_split_comm(MPI_Comm global, MPI_Comm local);
 
+STK_DEPRECATED
 MPI_Comm split_comm(MPI_Comm parentCommunicator, int color);
 
 }
 }
 
+#endif
 #endif /* STK_COUPLING_OLD_COMM_SPLITTING_HPP */
diff --git a/packages/stk/stk_coupling/stk_coupling/OldSyncInfo.cpp b/packages/stk/stk_coupling/stk_coupling/OldSyncInfo.cpp
index 81e1a1c31352..0a110e61ab04 100644
--- a/packages/stk/stk_coupling/stk_coupling/OldSyncInfo.cpp
+++ b/packages/stk/stk_coupling/stk_coupling/OldSyncInfo.cpp
@@ -11,6 +11,8 @@
 #include <stk_coupling/OldCommSplitting.hpp>
 #include <stk_util/parallel/CommSparse.hpp>
 
+#ifndef STK_HIDE_DEPRECATED_CODE  // remove October 2022
+
 namespace stk
 {
 namespace coupling
@@ -97,3 +99,4 @@ OldSyncInfo::exchange(stk::ParallelMachine global, stk::ParallelMachine local)
 
 }
 }
+#endif
\ No newline at end of file
diff --git a/packages/stk/stk_coupling/stk_coupling/OldSyncInfo.hpp b/packages/stk/stk_coupling/stk_coupling/OldSyncInfo.hpp
index 207dc9f528c0..cc361c16b84b 100644
--- a/packages/stk/stk_coupling/stk_coupling/OldSyncInfo.hpp
+++ b/packages/stk/stk_coupling/stk_coupling/OldSyncInfo.hpp
@@ -14,13 +14,16 @@
 #include <stk_util/parallel/Parallel.hpp>
 #include <stk_util/parallel/ParallelComm.hpp> // for CommBuffer
 #include <stk_coupling/Constants.hpp>
+#include <stk_util/stk_config.h>
 
+#ifndef STK_HIDE_DEPRECATED_CODE
 namespace stk
 {
 namespace coupling
 {
 
-class OldSyncInfo
+
+class STK_DEPRECATED OldSyncInfo
 {
 public:
   OldSyncInfo()
@@ -137,4 +140,6 @@ inline bool OldSyncInfo::has_value<std::string>(const std::string & parameterNam
 } // namespace coupling
 } // namespace stk
 
+#endif  /* STK_HIDE_DEPRECATED_CODE */
+
 #endif /* STK_COUPLING_OLDSYNCINFO_HPP */
diff --git a/packages/stk/stk_coupling/stk_coupling/SplitComms.cpp b/packages/stk/stk_coupling/stk_coupling/SplitComms.cpp
index b7ee2301dde3..0fd53de528b5 100644
--- a/packages/stk/stk_coupling/stk_coupling/SplitComms.cpp
+++ b/packages/stk/stk_coupling/stk_coupling/SplitComms.cpp
@@ -239,6 +239,15 @@ void SplitCommsImpl::free_comms_impl()
   m_haveFreedComms = true;
 }
 
+}
+
+bool are_comms_unequal(MPI_Comm global, MPI_Comm local)
+{
+  int result = 0;
+  MPI_Comm_compare(global, local, &result);
+  return result == MPI_UNEQUAL;
+}
+
+
 }
 }
-}
\ No newline at end of file
diff --git a/packages/stk/stk_coupling/stk_coupling/SplitComms.hpp b/packages/stk/stk_coupling/stk_coupling/SplitComms.hpp
index 24fb42cc2965..a01f3c337c02 100644
--- a/packages/stk/stk_coupling/stk_coupling/SplitComms.hpp
+++ b/packages/stk/stk_coupling/stk_coupling/SplitComms.hpp
@@ -129,6 +129,8 @@ class SplitComms
     std::shared_ptr<impl::SplitCommsImpl> m_impl;
 };
 
+bool are_comms_unequal(MPI_Comm global, MPI_Comm local);
+
 }
 }
 
diff --git a/packages/stk/stk_expreval/stk_expreval/Parser.cpp b/packages/stk/stk_expreval/stk_expreval/Parser.cpp
index 2ec9843e4372..21c181c6455c 100644
--- a/packages/stk/stk_expreval/stk_expreval/Parser.cpp
+++ b/packages/stk/stk_expreval/stk_expreval/Parser.cpp
@@ -404,6 +404,21 @@ parseFactor(Eval & eval,
   return factor;
 }
 
+bool isRelation(Node* node)
+{
+  switch (node->m_opcode) {
+    case OPCODE_EQUAL:
+    case OPCODE_NOT_EQUAL:
+    case OPCODE_LESS:
+    case OPCODE_GREATER:
+    case OPCODE_LESS_EQUAL:
+    case OPCODE_GREATER_EQUAL:
+      return true;
+    default:
+      return false;
+  }
+}
+
 Node *
 parseRelation(Eval & eval,
               LexemVector::const_iterator from,
@@ -445,6 +460,10 @@ parseRelation(Eval & eval,
   relation->m_left = parseExpression(eval, from, relation_it);
   relation->m_right = parseExpression(eval, relation_it + 1, to);
 
+  if (isRelation(relation->m_left) || isRelation(relation->m_right)) {
+    throw std::runtime_error("stk::expreval::parseRelation: stk_expreval does not support chained comparisons");
+  }
+
   return relation;
 }
 
diff --git a/packages/stk/stk_expreval/unit_tests/UnitTestEvaluator.cpp b/packages/stk/stk_expreval/unit_tests/UnitTestEvaluator.cpp
index e390d73589b7..ce3186277d64 100644
--- a/packages/stk/stk_expreval/unit_tests/UnitTestEvaluator.cpp
+++ b/packages/stk/stk_expreval/unit_tests/UnitTestEvaluator.cpp
@@ -947,6 +947,26 @@ TEST(UnitTestEvaluator, Ngp_testOpcode_GREATER_EQUAL)
   EXPECT_DOUBLE_EQ(device_evaluate("2>=(1+2)"),    0);
 }
 
+TEST(UnitTestEvaluator, noChainedComparisons)
+{
+  EXPECT_ANY_THROW(evaluate("1 < 2 < 3"));
+  EXPECT_ANY_THROW(evaluate("3 > 4 > 5"));
+  EXPECT_ANY_THROW(evaluate("0 < 4 <= 2"));
+  EXPECT_ANY_THROW(evaluate("6 > 3 >= 1"));
+  EXPECT_ANY_THROW(evaluate("1 <= 2 < 3"));
+  EXPECT_ANY_THROW(evaluate("3 >= 4 > 5"));
+  EXPECT_ANY_THROW(evaluate("1 < x < 3", {{"x", 2}}));
+  EXPECT_ANY_THROW(evaluate("1 < (2 < 3)"));
+  EXPECT_ANY_THROW(evaluate("(1 < 2) < 3"));
+  EXPECT_ANY_THROW(evaluate("(3 > 1) > 0"));
+  EXPECT_ANY_THROW(evaluate("(2 <= 5) < 0"));
+  EXPECT_ANY_THROW(evaluate("(7 >= 3) > 1"));
+  EXPECT_ANY_THROW(evaluate("1 == 1 == 1"));
+  EXPECT_ANY_THROW(evaluate("(2 == 2) == 2"));
+  EXPECT_ANY_THROW(evaluate("2 != 1 != 6"));
+  EXPECT_ANY_THROW(evaluate("(3 != 4) != 8"));
+}
+
 TEST(UnitTestEvaluator, testOpcode_UNARY_NOT)
 {
   EXPECT_DOUBLE_EQ(evaluate("!0"),        1);
diff --git a/packages/stk/stk_integration_tests/cmake_install_test/run_cmake_stk b/packages/stk/stk_integration_tests/cmake_install_test/run_cmake_stk
index a1c03e945cec..80c2c1e26ff9 100755
--- a/packages/stk/stk_integration_tests/cmake_install_test/run_cmake_stk
+++ b/packages/stk/stk_integration_tests/cmake_install_test/run_cmake_stk
@@ -56,7 +56,7 @@ cmake \
 -DTrilinos_ENABLE_CXX11=ON \
 -DCMAKE_BUILD_TYPE=${build_type^^} \
 -DTrilinos_ENABLE_EXPLICIT_INSTANTIATION:BOOL=ON \
--DTrilinos_ENABLE_TESTS:BOOL=OFF \
+-DTrilinos_ENABLE_TESTS:BOOL=ON \
 -DTrilinos_ENABLE_ALL_OPTIONAL_PACKAGES=OFF \
 -DTrilinos_ALLOW_NO_PACKAGES:BOOL=OFF \
 -DTrilinos_ASSERT_MISSING_PACKAGES=OFF \
diff --git a/packages/stk/stk_integration_tests/cmake_install_test/run_cmake_stk_no_stk_mesh b/packages/stk/stk_integration_tests/cmake_install_test/run_cmake_stk_no_stk_mesh
index 654835782c45..816469e7c410 100755
--- a/packages/stk/stk_integration_tests/cmake_install_test/run_cmake_stk_no_stk_mesh
+++ b/packages/stk/stk_integration_tests/cmake_install_test/run_cmake_stk_no_stk_mesh
@@ -31,10 +31,12 @@ cmake \
 -DSTK_ENABLE_TESTS:BOOL=ON \
 -DTrilinos_ENABLE_STK:BOOL=ON \
 -DTrilinos_ENABLE_STKMesh:BOOL=OFF \
+-DTrilinos_ENABLE_STKUtil:BOOL=ON \
+-DTrilinos_ENABLE_STKMath:BOOL=ON \
+-DTrilinos_ENABLE_STKSimd:BOOL=ON \
 -DTrilinos_ENABLE_STKCoupling:BOOL=ON \
 -DTrilinos_ENABLE_STKTransfer:BOOL=ON \
 -DTrilinos_ENABLE_STKSearch:BOOL=ON \
--DTrilinos_ENABLE_STKUtil:BOOL=ON \
 -DTrilinos_ENABLE_STKUnit_tests:BOOL=ON \
 -DTrilinos_ENABLE_STKDoc_tests:BOOL=ON \
 -DTrilinos_ENABLE_Gtest:BOOL=ON \
diff --git a/packages/stk/stk_integration_tests/mock_apps/mock_aria.cpp b/packages/stk/stk_integration_tests/mock_apps/mock_aria.cpp
index 04694138e10b..33e6ddf354d5 100644
--- a/packages/stk/stk_integration_tests/mock_apps/mock_aria.cpp
+++ b/packages/stk/stk_integration_tests/mock_apps/mock_aria.cpp
@@ -8,6 +8,7 @@
 #include <stk_util/command_line/CommandLineParserUtils.hpp>
 #include <stk_util/util/ReportHandler.hpp>
 #include <stk_util/Version.hpp>
+#include <stk_util/parallel/CouplingVersions_impl.hpp>
 #include <stk_util/parallel/CouplingVersions.hpp>
 #include "MockUtils.hpp"
 #include "StkMesh.hpp"
@@ -67,6 +68,9 @@ class MockAria
 
     int defaultColor = stk::coupling::string_to_color(m_appName);
     int color = stk::get_command_line_option(argc, argv, "app-color", defaultColor);
+    int coupling_version_override = stk::get_command_line_option(argc, argv, "stk_coupling_version", STK_MAX_COUPLING_VERSION);
+    stk::util::impl::set_coupling_version(coupling_version_override);
+    stk::util::impl::set_error_on_reset(false);
     std::string defaultSyncMode = "Send";
     std::string syncModeString = stk::get_command_line_option<std::string>(argc, argv, "sync-mode", defaultSyncMode);
     m_syncMode = stk::coupling::string_to_sync_mode(syncModeString);
diff --git a/packages/stk/stk_integration_tests/mock_apps/mock_fuego.cpp b/packages/stk/stk_integration_tests/mock_apps/mock_fuego.cpp
index 56e3d6d84f32..7882ee661d3a 100644
--- a/packages/stk/stk_integration_tests/mock_apps/mock_fuego.cpp
+++ b/packages/stk/stk_integration_tests/mock_apps/mock_fuego.cpp
@@ -9,6 +9,7 @@
 #include <stk_util/util/ReportHandler.hpp>
 #include <stk_util/Version.hpp>
 #include <stk_util/parallel/CouplingVersions.hpp>
+#include <stk_util/parallel/CouplingVersions_impl.hpp>
 #include "MockUtils.hpp"
 #include "StkMesh.hpp"
 #include <iostream>
@@ -53,6 +54,9 @@ class MockFuego
     }
     int defaultColor = stk::coupling::string_to_color(m_appName);
     int color = stk::get_command_line_option(argc, argv, "app-color", defaultColor);
+    int coupling_version_override = stk::get_command_line_option(argc, argv, "stk_coupling_version", STK_MAX_COUPLING_VERSION);
+    stk::util::impl::set_coupling_version(coupling_version_override);
+    stk::util::impl::set_error_on_reset(false);
 
     m_splitComms = stk::coupling::SplitComms(commWorld, color);
     MPI_Comm splitComm = m_splitComms.get_split_comm();
diff --git a/packages/stk/stk_integration_tests/mock_apps/mock_salinas.cpp b/packages/stk/stk_integration_tests/mock_apps/mock_salinas.cpp
index 82547f10d744..9af0a8fc2e1f 100644
--- a/packages/stk/stk_integration_tests/mock_apps/mock_salinas.cpp
+++ b/packages/stk/stk_integration_tests/mock_apps/mock_salinas.cpp
@@ -10,6 +10,7 @@
 #include <stk_util/util/ReportHandler.hpp>
 #include <stk_util/Version.hpp>
 #include <stk_util/parallel/CouplingVersions.hpp>
+#include <stk_util/parallel/CouplingVersions_impl.hpp>
 #include "MockUtils.hpp"
 #include "StkMesh.hpp"
 #include "StkRecvAdapter.hpp"
@@ -59,6 +60,10 @@ class MockSalinas
 
     int defaultColor = stk::coupling::string_to_color(m_appName);
     int color = stk::get_command_line_option(argc, argv, "app-color", defaultColor);
+    int coupling_version_override = stk::get_command_line_option(argc, argv, "stk_coupling_version", STK_MAX_COUPLING_VERSION);
+    stk::util::impl::set_coupling_version(coupling_version_override);
+    stk::util::impl::set_error_on_reset(false);
+
     m_splitComms = stk::coupling::SplitComms(commWorld, color);
     const std::vector<int>& otherColors = m_splitComms.get_other_colors();
     if (otherColors.size() != 1) {
diff --git a/packages/stk/stk_integration_tests/mock_apps/mock_sparc.cpp b/packages/stk/stk_integration_tests/mock_apps/mock_sparc.cpp
index b30738e9f2ab..31dd1e851be3 100644
--- a/packages/stk/stk_integration_tests/mock_apps/mock_sparc.cpp
+++ b/packages/stk/stk_integration_tests/mock_apps/mock_sparc.cpp
@@ -9,6 +9,7 @@
 #include <stk_util/command_line/CommandLineParserUtils.hpp>
 #include <stk_util/util/ReportHandler.hpp>
 #include <stk_util/Version.hpp>
+#include <stk_util/parallel/CouplingVersions_impl.hpp>
 #include <stk_util/parallel/CouplingVersions.hpp>
 #include "MockUtils.hpp"
 #include "SparcMesh.hpp"
@@ -54,6 +55,9 @@ class MockSparc
 
     int defaultColor = stk::coupling::string_to_color(m_appName);
     int color = stk::get_command_line_option(argc, argv, "app-color", defaultColor);
+    int coupling_version_override = stk::get_command_line_option(argc, argv, "stk_coupling_version", STK_MAX_COUPLING_VERSION);
+    stk::util::impl::set_coupling_version(coupling_version_override);
+    stk::util::impl::set_error_on_reset(false);
     m_splitComms = stk::coupling::SplitComms(commWorld, color);
     MPI_Comm splitComm = m_splitComms.get_split_comm();
     int myAppRank = stk::parallel_machine_rank(splitComm);
diff --git a/packages/stk/stk_integration_tests/stk_balance/IntegrationTestIncrementalRebalance.cpp b/packages/stk/stk_integration_tests/stk_balance/IntegrationTestIncrementalRebalance.cpp
index effdd96d18fe..3bd670ff81bc 100644
--- a/packages/stk/stk_integration_tests/stk_balance/IntegrationTestIncrementalRebalance.cpp
+++ b/packages/stk/stk_integration_tests/stk_balance/IntegrationTestIncrementalRebalance.cpp
@@ -41,7 +41,7 @@ class FieldVertexWeightSettingsWithSearchForParticles : public stk::balance::Gra
       m_defaultWeight(defaultWeight),
       m_incrementalRebalance(incrementalRebalance)
   {
-    method = "parmetis";
+    m_method = "parmetis";
   }
   virtual ~FieldVertexWeightSettingsWithSearchForParticles() = default;
 
@@ -56,8 +56,8 @@ class FieldVertexWeightSettingsWithSearchForParticles : public stk::balance::Gra
   virtual double getToleranceForFaceSearch() const { return 0.005; }
   virtual int getGraphVertexWeight(stk::topology type) const { return 1; }
   virtual double getImbalanceTolerance() const { return 1.05; }
-  virtual void setDecompMethod(const std::string& input_method) { method = input_method;}
-  virtual std::string getDecompMethod() const { return method; }
+  virtual void setDecompMethod(const std::string& input_method) { m_method = input_method;}
+  virtual std::string getDecompMethod() const { return m_method; }
   virtual bool incrementalRebalance() const { return m_incrementalRebalance; }
 
   virtual double getGraphVertexWeight(stk::mesh::Entity entity, int criteria_index = 0) const
diff --git a/packages/stk/stk_integration_tests/stk_balance/IntegrationTestUserSupport.cpp b/packages/stk/stk_integration_tests/stk_balance/IntegrationTestUserSupport.cpp
index 077edcacd97c..1112843d8090 100644
--- a/packages/stk/stk_integration_tests/stk_balance/IntegrationTestUserSupport.cpp
+++ b/packages/stk/stk_integration_tests/stk_balance/IntegrationTestUserSupport.cpp
@@ -508,45 +508,4 @@ TEST(Stkbalance, changeOptions)
   delete balanceOptions;
 }
 
-class ToleranceTester : public stk::unit_test_util::simple_fields::MeshFixture
-{
-public:
-  ToleranceTester()
-    : balanceRunner(get_comm()),
-      meshFile("gapped_plates.g")
-  {
-    balanceRunner.set_filename(meshFile);
-    balanceRunner.set_output_dir(".");
-    balanceRunner.set_app_type_defaults("sm");
-  }
-
-protected:
-  stk::integration_test_utils::StkBalanceRunner balanceRunner;
-  const std::string meshFile;
-};
-
-TEST_F(ToleranceTester, smDefaults)
-{
-  if (get_parallel_size() > 4) return;
-
-  if (get_parallel_size() > 1)
-  {
-    balanceRunner.run_end_to_end();
-  }
-
-  setup_mesh(meshFile, stk::mesh::BulkData::NO_AUTO_AURA);
-  for(unsigned i=1; i<101; i++)
-  {
-    stk::mesh::EntityId lowerId = i;
-    stk::mesh::EntityId upperId = i+700;
-    stk::mesh::Entity lower = get_bulk().get_entity(stk::topology::ELEM_RANK, lowerId);
-    stk::mesh::Entity upper = get_bulk().get_entity(stk::topology::ELEM_RANK, upperId);
-    if(get_bulk().is_valid(lower))
-    {
-      EXPECT_TRUE(get_bulk().is_valid(upper)) << "Elements not on same proc: " << lowerId << ", " << upperId;
-    }
-  }
-}
-
-
 }
diff --git a/packages/stk/stk_io/stk_io/IossBridge.cpp b/packages/stk/stk_io/stk_io/IossBridge.cpp
index eda99307a09a..5552e41b1aaa 100644
--- a/packages/stk/stk_io/stk_io/IossBridge.cpp
+++ b/packages/stk/stk_io/stk_io/IossBridge.cpp
@@ -43,6 +43,7 @@
 #include <iostream>                                 // for operator<<, basic...
 #include <memory>                                   // for allocator_traits<...
 #include <stdexcept>                                // for runtime_error
+#include <unordered_map>
 #include <stk_mesh/base/BulkData.hpp>               // for BulkData
 #include <stk_mesh/base/Comm.hpp>                   // for comm_mesh_counts
 #include <stk_mesh/base/CoordinateSystems.hpp>      // for Cartesian, FullTe...
@@ -54,6 +55,7 @@
 #include <stk_mesh/base/Types.hpp>                  // for PartVector, Entit...
 #include <stk_util/diag/StringUtil.hpp>             // for make_lower, to_st...
 #include <stk_util/environment/RuntimeWarning.hpp>  // for RuntimeWarning
+#include <stk_util/parallel/ParallelReduce.hpp>     // for all_reduce_sum
 #include <stk_util/util/SortAndUnique.hpp>          // for sort_and_unique
 #include <stk_util/util/tokenize.hpp>               // for tokenize
 #include <typeinfo>                                 // for type_info
@@ -107,7 +109,7 @@ namespace stk { namespace mesh { class Bucket; } }
 namespace stk {
   namespace io {
     bool is_field_on_part(const stk::mesh::FieldBase *field,
-                          const stk::mesh::EntityRank part_type,
+                          const stk::mesh::EntityRank partType,
                           const stk::mesh::Part &part);
 
     stk::mesh::EntityRank get_entity_rank(const Ioss::GroupingEntity *entity,
@@ -200,53 +202,53 @@ namespace {
   const stk::mesh::FieldBase *declare_stk_field(stk::mesh::MetaData &meta,
                                                 stk::mesh::EntityRank type,
                                                 stk::mesh::Part &part,
-                                                const Ioss::Field &io_field,
-                                                bool use_cartesian_for_scalar)
+                                                const Ioss::Field &ioField,
+                                                bool useCartesianForScalar)
   {
-    Ioss::Field::BasicType ioFieldType = io_field.get_type();
+    Ioss::Field::BasicType ioFieldType = ioField.get_type();
     const bool ioFieldTypeIsRecognized = (ioFieldType == Ioss::Field::INTEGER) || (ioFieldType == Ioss::Field::INT64)
                                       || (ioFieldType == Ioss::Field::REAL)    || (ioFieldType == Ioss::Field::COMPLEX);
-    ThrowRequireMsg(ioFieldTypeIsRecognized, "Unrecognized field type for IO field '"<<io_field.get_name()<<"'");
+    ThrowRequireMsg(ioFieldTypeIsRecognized, "Unrecognized field type for IO field '"<<ioField.get_name()<<"'");
 
-    return stk::io::impl::declare_stk_field_internal(meta, type, part, io_field, use_cartesian_for_scalar);
+    return stk::io::impl::declare_stk_field_internal(meta, type, part, ioField, useCartesianForScalar);
   }
 
   template <typename T>
   void internal_field_data_from_ioss(const stk::mesh::BulkData& mesh,
-                                     const Ioss::Field &io_field,
+                                     const Ioss::Field &ioField,
                                      const stk::mesh::FieldBase *field,
                                      std::vector<stk::mesh::Entity> &entities,
-                                     Ioss::GroupingEntity *io_entity)
+                                     Ioss::GroupingEntity *ioEntity)
   {
-    size_t iossNumFieldComponents = io_field.transformed_storage()->component_count();
+    size_t iossNumFieldComponents = ioField.transformed_storage()->component_count();
 
-    std::vector<T> io_field_data;
-    size_t io_entity_count = io_entity->get_field_data(io_field.get_name(), io_field_data);
-    assert(io_field_data.size() == entities.size() * iossNumFieldComponents);
+    std::vector<T> ioFieldData;
+    size_t ioEntityCount = ioEntity->get_field_data(ioField.get_name(), ioFieldData);
+    assert(ioFieldData.size() == entities.size() * iossNumFieldComponents);
 
-    size_t entity_count = entities.size();
+    size_t entityCount = entities.size();
 
-    if (io_entity_count != entity_count) {
+    if (ioEntityCount != entityCount) {
       std::ostringstream errmsg;
       errmsg << "ERROR: Field count mismatch for IO field '"
-             << io_field.get_name()
-             << "' on " << io_entity->type_string() << " " << io_entity->name()
-             << ". The IO system has " << io_entity_count
-             << " entries, but the stk:mesh system has " << entity_count
+             << ioField.get_name()
+             << "' on " << ioEntity->type_string() << " " << ioEntity->name()
+             << ". The IO system has " << ioEntityCount
+             << " entries, but the stk:mesh system has " << entityCount
              << " entries. The two counts must match.";
       throw std::runtime_error(errmsg.str());
     }
 
     field->sync_to_host();
     field->modify_on_host();
-    for (size_t i=0; i < entity_count; ++i) {
+    for (size_t i=0; i < entityCount; ++i) {
       if (mesh.is_valid(entities[i])) {
-        T *fld_data = static_cast<T*>(stk::mesh::field_data(*field, entities[i]));
-        if (fld_data !=nullptr) {
+        T *fldData = static_cast<T*>(stk::mesh::field_data(*field, entities[i]));
+        if (fldData !=nullptr) {
           const size_t stkNumFieldComponents = stk::mesh::field_scalars_per_entity(*field, entities[i]);
           const size_t len = std::min(stkNumFieldComponents, iossNumFieldComponents);
           for(size_t j=0; j<len; ++j) {
-            fld_data[j] = io_field_data[i*iossNumFieldComponents+j];
+            fldData[j] = ioFieldData[i*iossNumFieldComponents+j];
           }
         }
       }
@@ -255,41 +257,41 @@ namespace {
 
   template <typename T>
   void internal_subsetted_field_data_from_ioss(const stk::mesh::BulkData& mesh,
-                                               const Ioss::Field &io_field,
+                                               const Ioss::Field &ioField,
                                                const stk::mesh::FieldBase *field,
                                                std::vector<stk::mesh::Entity> &entities,
-                                               Ioss::GroupingEntity *io_entity,
-                                               const stk::mesh::Part *stk_part)
+                                               Ioss::GroupingEntity *ioEntity,
+                                               const stk::mesh::Part *stkPart)
   {
-    size_t field_component_count = io_field.transformed_storage()->component_count();
-    std::vector<T> io_field_data;
-    size_t io_entity_count = io_entity->get_field_data(io_field.get_name(), io_field_data);
-    assert(io_field_data.size() == entities.size() * field_component_count);
-    size_t entity_count = entities.size();
-    if (io_entity_count != entity_count) {
+    size_t field_componentCount = ioField.transformed_storage()->component_count();
+    std::vector<T> ioFieldData;
+    size_t ioEntityCount = ioEntity->get_field_data(ioField.get_name(), ioFieldData);
+    assert(ioFieldData.size() == entities.size() * field_componentCount);
+    size_t entityCount = entities.size();
+    if (ioEntityCount != entityCount) {
       std::ostringstream errmsg;
       errmsg << "ERROR: Field count mismatch for IO field '"
-             << io_field.get_name()
-             << "' on " << io_entity->type_string() << " " << io_entity->name()
-             << ". The IO system has " << io_entity_count
-             << " entries, but the stk:mesh system has " << entity_count
+             << ioField.get_name()
+             << "' on " << ioEntity->type_string() << " " << ioEntity->name()
+             << ". The IO system has " << ioEntityCount
+             << " entries, but the stk:mesh system has " << entityCount
              << " entries. The two counts must match.";
       throw std::runtime_error(errmsg.str());
     }
 
-    stk::mesh::MetaData &meta = stk::mesh::MetaData::get(*stk_part);
-    stk::mesh::Selector selector = (meta.globally_shared_part() | meta.locally_owned_part()) & *stk_part;
+    stk::mesh::MetaData &meta = stk::mesh::MetaData::get(*stkPart);
+    stk::mesh::Selector selector = (meta.globally_shared_part() | meta.locally_owned_part()) & *stkPart;
 
     field->sync_to_host();
     field->modify_on_host();
-    for (size_t i=0; i < entity_count; ++i) {
+    for (size_t i=0; i < entityCount; ++i) {
       if (mesh.is_valid(entities[i])) {
         const stk::mesh::Bucket &bucket = mesh.bucket(entities[i]);
         if (selector(bucket)) {
-          T *fld_data = static_cast<T*>(stk::mesh::field_data(*field, entities[i]));
-          if (fld_data !=nullptr) {
-            for(size_t j=0; j<field_component_count; ++j) {
-              fld_data[j] = io_field_data[i*field_component_count+j];
+          T *fldData = static_cast<T*>(stk::mesh::field_data(*field, entities[i]));
+          if (fldData !=nullptr) {
+            for(size_t j=0; j<field_componentCount; ++j) {
+              fldData[j] = ioFieldData[i*field_componentCount+j];
             }
           }
         }
@@ -299,41 +301,41 @@ namespace {
 
   template <typename T>
   void internal_field_data_to_ioss(const stk::mesh::BulkData& mesh,
-                                   const Ioss::Field &io_field,
+                                   const Ioss::Field &ioField,
                                    const stk::mesh::FieldBase *field,
                                    std::vector<stk::mesh::Entity> &entities,
-                                   Ioss::GroupingEntity *io_entity)
+                                   Ioss::GroupingEntity *ioEntity)
   {
-    size_t iossFieldLength = io_field.transformed_storage()->component_count();
-    size_t entity_count = entities.size();
+    size_t iossFieldLength = ioField.transformed_storage()->component_count();
+    size_t entityCount = entities.size();
 
-    std::vector<T> io_field_data(entity_count*iossFieldLength);
+    std::vector<T> ioFieldData(entityCount*iossFieldLength);
 
     field->sync_to_host();
-    for (size_t i=0; i < entity_count; ++i) {
+    for (size_t i=0; i < entityCount; ++i) {
       if (mesh.is_valid(entities[i]) && mesh.entity_rank(entities[i]) == field->entity_rank()) {
-        const T *fld_data = static_cast<T*>(stk::mesh::field_data(*field, entities[i]));
-        if (fld_data != nullptr) {
+        const T *fldData = static_cast<T*>(stk::mesh::field_data(*field, entities[i]));
+        if (fldData != nullptr) {
           size_t stkFieldLength = stk::mesh::field_scalars_per_entity(*field, entities[i]);
-          ThrowRequireMsg((iossFieldLength >= stkFieldLength), "Field "<<field->name()<<" scalars-per-entity="<<stkFieldLength<<" doesn't match Ioss iossFieldLength(="<<iossFieldLength<<") for io_entity "<<io_entity->name());
+          ThrowRequireMsg((iossFieldLength >= stkFieldLength), "Field "<<field->name()<<" scalars-per-entity="<<stkFieldLength<<" doesn't match Ioss iossFieldLength(="<<iossFieldLength<<") for io_entity "<<ioEntity->name());
           size_t length = std::min(iossFieldLength, stkFieldLength);
           for(size_t j=0; j<length; ++j) {
-            io_field_data[i*iossFieldLength+j] = fld_data[j];
+            ioFieldData[i*iossFieldLength+j] = fldData[j];
           }
         }
       }
     }
 
-    size_t io_entity_count = io_entity->put_field_data(io_field.get_name(), io_field_data);
-    assert(io_field_data.size() == entities.size() * iossFieldLength);
+    size_t ioEntityCount = ioEntity->put_field_data(ioField.get_name(), ioFieldData);
+    assert(ioFieldData.size() == entities.size() * iossFieldLength);
 
-    if (io_entity_count != entity_count) {
+    if (ioEntityCount != entityCount) {
       std::ostringstream errmsg;
       errmsg << "ERROR: Field count mismatch for IO field '"
-             << io_field.get_name()
-             << "' on " << io_entity->type_string() << " " << io_entity->name()
-             << ". The IO system has " << io_entity_count
-             << " entries, but the stk:mesh system has " << entity_count
+             << ioField.get_name()
+             << "' on " << ioEntity->type_string() << " " << ioEntity->name()
+             << ". The IO system has " << ioEntityCount
+             << " entries, but the stk:mesh system has " << entityCount
              << " entries. The two counts must match.";
       throw std::runtime_error(errmsg.str());
     }
@@ -349,10 +351,9 @@ namespace {
     while (I != fields.end()) {
       const stk::mesh::FieldBase *f = *I ; ++I ;
 
-      bool valid_part_field = stk::io::is_valid_part_field(f, rank, part, Ioss::Field::TRANSIENT);
-      bool valid_part_field_by_bucket = false; //stk::io::is_valid_part_field_by_bucket(f, rank, part, Ioss::Field::TRANSIENT);
+      bool validPartField = stk::io::is_valid_part_field(f, rank, part, Ioss::Field::TRANSIENT);
 
-      if (valid_part_field || valid_part_field_by_bucket) {
+      if (validPartField) {
         return true;
       }
     }
@@ -362,9 +363,9 @@ namespace {
   void add_canonical_name_property(Ioss::GroupingEntity* ge, stk::mesh::Part& part)
   {
     if(stk::io::has_alternate_part_name(part)) {
-      std::string canon_name = stk::io::get_alternate_part_name(part);
-      if(canon_name != ge->name()) {
-        ge->property_add(Ioss::Property("db_name", canon_name));
+      std::string canonName = stk::io::get_alternate_part_name(part);
+      if(canonName != ge->name()) {
+        ge->property_add(Ioss::Property("db_name", canonName));
       }
     }
   }
@@ -374,9 +375,9 @@ namespace {
     std::string topoString("original_topology_type");
 
     if(stk::io::has_original_topology_type(part)) {
-      std::string orig_topo = stk::io::get_original_topology_type(part);
-      if(!ge->property_exists(topoString) || (orig_topo != ge->get_property(topoString).get_string())) {
-        ge->property_add(Ioss::Property(topoString, orig_topo));
+      std::string origTopology = stk::io::get_original_topology_type(part);
+      if(!ge->property_exists(topoString) || (origTopology != ge->get_property(topoString).get_string())) {
+        ge->property_add(Ioss::Property(topoString, origTopology));
       }
     }
   }
@@ -389,12 +390,12 @@ namespace {
 
       const std::vector<stk::io::FieldAndName>& additionalFields = params.get_additional_attribute_fields();
 
-      Ioss::Region & io_region = params.io_region();
+      Ioss::Region & ioRegion = params.io_region();
       stk::mesh::MetaData & meta = stk::mesh::MetaData::get(part);
-      Ioss::ElementBlock* io_block = io_region.get_element_block(stk::io::getPartName(part));
+      Ioss::ElementBlock* ioBlock = ioRegion.get_element_block(stk::io::getPartName(part));
 
       for(const stk::io::FieldAndName& attribute : additionalFields) {
-          if(attribute.apply_to_entity(io_block)) {
+          if(attribute.apply_to_entity(ioBlock)) {
               const stk::mesh::FieldBase *stkField = attribute.field();
 
               ThrowRequireMsg(stkField->entity_rank() == rank, "Input attribute field: " + stkField->name() + " is not ELEM_RANK");
@@ -402,19 +403,18 @@ namespace {
               relevantParts.push_back(&part);
               stk::io::superset_mesh_parts(part, relevantParts);
               relevantParts.push_back(&meta.universal_part());
-//                relevantParts.push_back(&region->mesh_meta_data().active_part());
 
               if(stkField->defined_on_any(relevantParts)) {
                   const std::string dbName = attribute.db_name();
-                  if(!io_block->field_exists(dbName)) {
-                      int eb_size = io_block->get_property("entity_count").get_int();
+                  if(!ioBlock->field_exists(dbName)) {
+                      int ebSize = ioBlock->get_property("entity_count").get_int();
 
                       const stk::mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*stkField, rank, relevantParts);
                       ThrowRequireMsg(res.num_scalars_per_entity() != 0,
                                       "Could not find a restriction for field: " + stkField->name() + " on part: " + part.name());
                       stk::io::FieldType fieldType;
                       stk::io::get_io_field_type(stkField, res, &fieldType);
-                      io_block->field_add(Ioss::Field(dbName, fieldType.type, fieldType.name, Ioss::Field::ATTRIBUTE, eb_size));
+                      ioBlock->field_add(Ioss::Field(dbName, fieldType.type, fieldType.name, Ioss::Field::ATTRIBUTE, ebSize));
                   }
               }
           }
@@ -429,8 +429,8 @@ namespace {
 
       const std::vector<stk::io::FieldAndName>& additionalFields = params.get_additional_attribute_fields();
 
-      Ioss::Region & io_region = params.io_region();
-      Ioss::ElementBlock* ioBlock = io_region.get_element_block(stk::io::getPartName(part));
+      Ioss::Region & ioRegion = params.io_region();
+      Ioss::ElementBlock* ioBlock = ioRegion.get_element_block(stk::io::getPartName(part));
 
       for(const stk::io::FieldAndName& attribute : additionalFields) {
           if(attribute.apply_to_entity(ioBlock)) {
@@ -447,13 +447,13 @@ namespace {
       }
   }
 
-  bool contain(const stk::mesh::BulkData& stkmesh, stk::mesh::Entity elem, const stk::mesh::Part* parent_block)
+  bool contain(const stk::mesh::BulkData& stkmesh, stk::mesh::Entity elem, const stk::mesh::Part* parentBlock)
   {
     const stk::mesh::PartVector& parts = stkmesh.bucket(elem).supersets();
 
-    unsigned int part_id = parent_block->mesh_meta_data_ordinal();
+    unsigned int partId = parentBlock->mesh_meta_data_ordinal();
     auto i = parts.begin();
-    for(; i != parts.end() && (*i)->mesh_meta_data_ordinal() != part_id; ++i)
+    for(; i != parts.end() && (*i)->mesh_meta_data_ordinal() != partId; ++i)
       ;
 
     return (i != parts.end());
@@ -504,13 +504,13 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                                                        bool use_cartesian_for_scalar)
 {
     std::string name = io_field.get_name();
-    stk::mesh::FieldBase *field_ptr = meta.get_field(type, name);
+    stk::mesh::FieldBase *fieldPtr = meta.get_field(type, name);
     // If the field has already been declared, don't redeclare it.
-    if (field_ptr != nullptr && stk::io::is_field_on_part(field_ptr, type, part)) {
-      return field_ptr;
+    if (fieldPtr != nullptr && stk::io::is_field_on_part(fieldPtr, type, part)) {
+      return fieldPtr;
     }
 
-    stk::topology::rank_t entity_rank = static_cast<stk::topology::rank_t>(type);
+    stk::topology::rank_t entityRank = static_cast<stk::topology::rank_t>(type);
 
     if (meta.is_using_simple_fields()) {
       const Ioss::VariableType* varType = io_field.transformed_storage();
@@ -526,7 +526,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       }
       std::string field_type = varType->name();
 
-      stk::mesh::Field<double> & field = meta.declare_field<double>(entity_rank, name);
+      stk::mesh::Field<double> & field = meta.declare_field<double>(entityRank, name);
       stk::mesh::put_field_on_mesh(field, part, numComponents, numCopies, nullptr);
 
       const int oldVarTypeSize = has_field_output_type(field) ? get_field_output_type(field)->component_count() : 0;
@@ -536,57 +536,57 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         set_field_output_type(field, varType);
       }
 
-      field_ptr = &field;
+      fieldPtr = &field;
     }
     else {
 
       const Ioss::VariableType* varType = io_field.transformed_storage();
-      size_t num_components = varType->component_count();
+      size_t numComponents = varType->component_count();
 
       const Ioss::CompositeVariableType* compVarType = dynamic_cast<const Ioss::CompositeVariableType*>(varType);
       if (compVarType != nullptr) {
         varType = compVarType->GetBaseType();
       }
-      std::string field_type = varType->name();
+      std::string fieldType = varType->name();
 
-      if (field_type == "scalar" || num_components == 1) {
+      if (fieldType == "scalar" || numComponents == 1) {
         if (!use_cartesian_for_scalar) {
-          stk::mesh::Field<double> & field = meta.declare_field<stk::mesh::Field<double>>(entity_rank, name);
+          stk::mesh::Field<double> & field = meta.declare_field<stk::mesh::Field<double>>(entityRank, name);
           stk::mesh::put_field_on_mesh(field, part, nullptr);
-          field_ptr = &field;
+          fieldPtr = &field;
         } else {
           stk::mesh::Field<double, stk::mesh::Cartesian> & field =
-              meta.declare_field<stk::mesh::Field<double, stk::mesh::Cartesian>>(entity_rank, name);
+              meta.declare_field<stk::mesh::Field<double, stk::mesh::Cartesian>>(entityRank, name);
           stk::mesh::put_field_on_mesh(field, part, 1, nullptr);
-          field_ptr = &field;
+          fieldPtr = &field;
         }
       }
-      else if (stk::string_starts_with(sierra::make_lower(field_type), "real[")) {
-        stk::mesh::Field<double> & field = meta.declare_field<stk::mesh::Field<double>>(entity_rank, name);
-        stk::mesh::put_field_on_mesh(field, part, num_components, nullptr);
-        field_ptr = &field;
+      else if (stk::string_starts_with(sierra::make_lower(fieldType), "real[")) {
+        stk::mesh::Field<double> & field = meta.declare_field<stk::mesh::Field<double>>(entityRank, name);
+        stk::mesh::put_field_on_mesh(field, part, numComponents, nullptr);
+        fieldPtr = &field;
       }
-      else if ((field_type == "vector_2d") || (field_type == "vector_3d")) {
-        field_ptr = add_stk_field<stk::mesh::Cartesian>(meta, name, entity_rank, part, num_components);
+      else if ((fieldType == "vector_2d") || (fieldType == "vector_3d")) {
+        fieldPtr = add_stk_field<stk::mesh::Cartesian>(meta, name, entityRank, part, numComponents);
       }
-      else if (field_type == "sym_tensor_33") {
-        field_ptr = add_stk_field<stk::mesh::SymmetricTensor>(meta, name, entity_rank, part, num_components);
+      else if (fieldType == "sym_tensor_33") {
+        fieldPtr = add_stk_field<stk::mesh::SymmetricTensor>(meta, name, entityRank, part, numComponents);
       }
-      else if (field_type == "full_tensor_36") {
-        field_ptr = add_stk_field<stk::mesh::FullTensor>(meta, name, entity_rank, part, num_components);
+      else if (fieldType == "full_tensor_36") {
+        fieldPtr = add_stk_field<stk::mesh::FullTensor>(meta, name, entityRank, part, numComponents);
       }
-      else if ((field_type == "matrix_22") || (field_type == "matrix_33")) {
-        field_ptr = add_stk_field<stk::mesh::Matrix>(meta, name, entity_rank, part, num_components);
+      else if ((fieldType == "matrix_22") || (fieldType == "matrix_33")) {
+        fieldPtr = add_stk_field<stk::mesh::Matrix>(meta, name, entityRank, part, numComponents);
       }
       else {
-        field_ptr = add_stk_field<shards::ArrayDimension>(meta, name, entity_rank, part, num_components);
+        fieldPtr = add_stk_field<shards::ArrayDimension>(meta, name, entityRank, part, numComponents);
       }
     }
 
-    if (field_ptr != nullptr) {
-      stk::io::set_field_role(*field_ptr, io_field.get_role());
+    if (fieldPtr != nullptr) {
+      stk::io::set_field_role(*fieldPtr, io_field.get_role());
     }
-    return field_ptr;
+    return fieldPtr;
 }
 
 } //namespace impl
@@ -781,9 +781,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         return part.name();
     }
 
-    stk::mesh::Part *getPart(const stk::mesh::MetaData& meta_data, const std::string& name)
+    stk::mesh::Part *getPart(const stk::mesh::MetaData& metaData, const std::string& name)
     {
-      const mesh::PartVector & parts = meta_data.get_parts();
+      const mesh::PartVector & parts = metaData.get_parts();
       for (unsigned ii=0; ii < parts.size(); ++ii)
         {
           stk::mesh::Part *pp = parts[ii];
@@ -794,7 +794,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       return 0;
     }
 
-    Ioss::GroupingEntity* get_grouping_entity(const Ioss::Region& region, stk::mesh::Part& part)
+    Ioss::GroupingEntity* get_grouping_entity(const Ioss::Region& region, const stk::mesh::Part& part)
     {
       if(!stk::io::is_part_io_part(part)) { return nullptr; }
 
@@ -841,7 +841,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       return types;
     }
 
-    std::vector<Ioss::EntityType> get_ioss_entity_types(stk::mesh::Part& part)
+    std::vector<Ioss::EntityType> get_ioss_entity_types(const stk::mesh::Part& part)
     {
       return get_ioss_entity_types(part.mesh_meta_data(), part.primary_entity_rank());
     }
@@ -851,20 +851,20 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       return entity->get_database()->int_byte_size_api();
     }
 
-    void initialize_spatial_dimension(stk::mesh::MetaData & meta, size_t spatial_dimension,
-                                      const std::vector<std::string> &entity_rank_names)
+    void initialize_spatial_dimension(stk::mesh::MetaData & meta, size_t spatialDimension,
+                                      const std::vector<std::string> &entityRankNames)
     {
       if (!meta.is_initialized() ) {
-        meta.initialize(spatial_dimension, entity_rank_names);
+        meta.initialize(spatialDimension, entityRankNames);
       }
     }
 
     bool is_field_on_part(const stk::mesh::FieldBase *field,
-                          const stk::mesh::EntityRank part_type,
+                          const stk::mesh::EntityRank partType,
                           const stk::mesh::Part &part)
     {
       const stk::mesh::MetaData &meta = stk::mesh::MetaData::get(part);
-      const stk::mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*field, part_type, part);
+      const stk::mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*field, partType, part);
       if (res.num_scalars_per_entity() > 0) {
         // The field exists on the current 'part'.  Now check (for
         // node types only) whether the 'part' is *either* the
@@ -880,12 +880,12 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         // exist on.  There may be a problem if we start using element
         // sets ..., but wait until we get to that point; current code
         // works with current entity set.
-        if (part_type != stk::topology::NODE_RANK || part == meta.universal_part()) {
+        if (partType != stk::topology::NODE_RANK || part == meta.universal_part()) {
           return true;
         }
 
-        const stk::mesh::FieldBase::Restriction &res_universe = stk::mesh::find_restriction(*field, part_type, meta.universal_part());
-        if (res_universe.num_scalars_per_entity() <= 0) {
+        const stk::mesh::FieldBase::Restriction &universalRes = stk::mesh::find_restriction(*field, partType, meta.universal_part());
+        if (universalRes.num_scalars_per_entity() <= 0) {
           // Field exists on current part, but not on the universal
           // set (and this part is not the universal part)
           return true;
@@ -895,9 +895,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     }
 
     bool is_valid_part_field(const stk::mesh::FieldBase *field,
-                             const stk::mesh::EntityRank part_type,
+                             const stk::mesh::EntityRank partType,
                              const stk::mesh::Part &part,
-                             const Ioss::Field::RoleType filter_role)
+                             const Ioss::Field::RoleType filterRole)
     {
       const Ioss::Field::RoleType *role = stk::io::get_field_role(*field);
 
@@ -905,10 +905,10 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         return false;
       }
 
-      if (role != nullptr && *role != filter_role)
+      if (role != nullptr && *role != filterRole)
         return false;
 
-      return is_field_on_part(field, part_type, part);
+      return is_field_on_part(field, partType, part);
     }
 
     void assign_generic_field_type(const stk::mesh::FieldRestriction &res, FieldType *result)
@@ -1266,9 +1266,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
              !is_part_assembly_io_part(part);
     }
 
-    stk::topology get_start_topology(const Ioss::ElementTopology* topology, unsigned mesh_spatial_dimension)
+    stk::topology get_start_topology(const Ioss::ElementTopology* topology, unsigned meshSpatialDimension)
     {
-        if (topology->is_element() && topology->spatial_dimension() == (int)mesh_spatial_dimension)
+        if (topology->is_element() && topology->spatial_dimension() == (int)meshSpatialDimension)
         {
             return stk::topology::BEGIN_ELEMENT_RANK;
         }
@@ -1276,10 +1276,10 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     }
 
     stk::topology map_ioss_topology_to_stk(const Ioss::ElementTopology *topology,
-                                           unsigned mesh_spatial_dimension)
+                                           unsigned meshSpatialDimension)
     {
-      stk::topology begin_topo = get_start_topology(topology, mesh_spatial_dimension);
-      for (stk::topology topo=begin_topo; topo < stk::topology::END_TOPOLOGY; ++topo) {
+      stk::topology beginTopo = get_start_topology(topology, meshSpatialDimension);
+      for (stk::topology topo=beginTopo; topo < stk::topology::END_TOPOLOGY; ++topo) {
         if (topology->is_alias(topo.name()))
         {
            bool bothAreElements = topology->is_element() && topo.rank()==stk::topology::ELEM_RANK;
@@ -1301,8 +1301,8 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
     std::string map_stk_topology_to_ioss(stk::topology topo)
     {
-      Ioss::ElementTopology *ioss_topo = Ioss::ElementTopology::factory(topo.name(), true);
-      return ioss_topo != nullptr ? ioss_topo->name() : "invalid";
+      Ioss::ElementTopology *iossTopo = Ioss::ElementTopology::factory(topo.name(), true);
+      return iossTopo != nullptr ? iossTopo->name() : "invalid";
     }
 
     template<typename ENTITY>
@@ -1341,7 +1341,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       }
     }
 
-    void internal_part_processing(Ioss::GroupingEntity *entity, stk::mesh::MetaData &meta)
+    void internal_part_processing(Ioss::GroupingEntity *entity, stk::mesh::MetaData &meta, TopologyErrorHandler handler)
     {
       if (include_entity(entity)) {
         stk::mesh::Part & part = declare_stk_part(entity, meta);
@@ -1352,7 +1352,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       }
     }
 
-    void internal_part_processing(Ioss::EntityBlock *entity, stk::mesh::MetaData &meta)
+    void internal_part_processing(Ioss::EntityBlock *entity, stk::mesh::MetaData &meta, TopologyErrorHandler handler)
     {
       if (include_entity(entity)) {
         mesh::EntityRank type = get_entity_rank(entity, meta);
@@ -1389,9 +1389,11 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
           set_original_topology_type_from_ioss(entity, *part);
         }
 
-        stk::topology stk_topology = map_ioss_topology_to_stk(topology, meta.spatial_dimension());
-        if (stk_topology != stk::topology::INVALID_TOPOLOGY) {
-          stk::mesh::set_topology(*part, stk_topology);
+        stk::topology stkTopology = map_ioss_topology_to_stk(topology, meta.spatial_dimension());
+        if (stkTopology != stk::topology::INVALID_TOPOLOGY) {
+          stk::mesh::set_topology(*part, stkTopology);
+        } else {
+          handler(*part);
         }
         stk::io::define_io_fields(entity, Ioss::Field::ATTRIBUTE, *part, type);
       }
@@ -1407,21 +1409,21 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                                   const stk::mesh::FieldBase::Restriction &res,
                                   Ioss::GroupingEntity *entity,
                                   FieldAndName &namedField,
-                                  const Ioss::Field::RoleType filter_role)
+                                  const Ioss::Field::RoleType filterRole)
     {
-        FieldType field_type;
-        get_io_field_type(f, res, &field_type);
-        if ((field_type.type != Ioss::Field::INVALID) && namedField.apply_to_entity(entity)) {
-          size_t entity_size = entity->get_property("entity_count").get_int();
+        FieldType fieldType;
+        get_io_field_type(f, res, &fieldType);
+        if ((fieldType.type != Ioss::Field::INVALID) && namedField.apply_to_entity(entity)) {
+          size_t entitySize = entity->get_property("entity_count").get_int();
           std::string name = namedField.db_name();
-          std::string storage = field_type.name;
+          std::string storage = fieldType.name;
 
           if (namedField.get_use_alias()) {
               Ioss::VariableType::get_field_type_mapping(f->name(), &storage);
           }
 
-          entity->field_add(Ioss::Field(name, field_type.type, storage,
-                                        field_type.copies, filter_role, entity_size));
+          entity->field_add(Ioss::Field(name, fieldType.type, storage,
+                                        fieldType.copies, filterRole, entitySize));
           if (entity->type() == Ioss::NODEBLOCK) {
             namedField.m_forceNodeblockOutput = true;
           }
@@ -1429,10 +1431,10 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     }
 
     bool is_valid_nodeset_field(const stk::mesh::Part &part,
-                                       const stk::mesh::EntityRank part_type,
+                                       const stk::mesh::EntityRank partType,
                                        Ioss::GroupingEntity *entity,
                                        FieldAndName &namedField,
-                                       const Ioss::Field::RoleType filter_role)
+                                       const Ioss::Field::RoleType filterRole)
     {
         bool isValid = false;
 
@@ -1440,13 +1442,13 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         const Ioss::Field::RoleType *role = stk::io::get_field_role(*f);
 
         bool isNodeset = (entity != nullptr) && (entity->type() == Ioss::NODESET);
-        bool hasMatchingFieldRole = (role != nullptr) ? (*role == filter_role) : false;
-        bool hasMatchingEntityRank = f->entity_rank() == part_type;
+        bool hasMatchingFieldRole = (role != nullptr) ? (*role == filterRole) : false;
+        bool hasMatchingEntityRank = f->entity_rank() == partType;
         bool isNodesetField = namedField.is_nodeset_variable();
 
         if(isNodeset && hasMatchingFieldRole && hasMatchingEntityRank && isNodesetField) {
 
-              if(namedField.apply_to_entity(entity) /*sideblockPart->primary_entity_rank() == meta.side_rank()*/) {
+              if(namedField.apply_to_entity(entity)) {
                   const stk::mesh::EntityRank nodeRank = stk::topology::NODE_RANK;
 
                   const std::vector<stk::mesh::FieldBase::Restriction> & restrictions = f->restrictions();
@@ -1460,25 +1462,24 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     }
 
     void ioss_add_field_to_derived_nodeset(const stk::mesh::Part &part,
-                                           const stk::mesh::EntityRank part_type,
+                                           const stk::mesh::EntityRank partType,
                                            Ioss::GroupingEntity *entity,
                                            FieldAndName &namedField,
-                                           const Ioss::Field::RoleType filter_role)
+                                           const Ioss::Field::RoleType filterRole)
     {
-        const bool isValid = is_valid_nodeset_field(part, part_type, entity, namedField, filter_role);
+        const bool isValid = is_valid_nodeset_field(part, partType, entity, namedField, filterRole);
 
         if(isValid) {
             const stk::mesh::FieldBase *f = namedField.field();
-            const stk::mesh::FieldBase::Restriction *res = nullptr; //find_restriction_by_bucket(meta, *f, part, nodeRank);
+            const stk::mesh::FieldBase::Restriction *res = nullptr;
 
             const std::vector<stk::mesh::FieldBase::Restriction> & restrictions = f->restrictions();
-            if (restrictions.size() > 0 && f->entity_rank() == stk::topology::NODE_RANK)
-            {
+            if (restrictions.size() > 0 && f->entity_rank() == stk::topology::NODE_RANK) {
                 res = &restrictions[0];
             }
 
             if(res != nullptr) {
-                ioss_add_field_to_entity(f, *res, entity, namedField, filter_role);
+                ioss_add_field_to_entity(f, *res, entity, namedField, filterRole);
             }
         }
     }
@@ -1512,27 +1513,27 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     }
 
     void ioss_add_fields_for_subpart(const stk::mesh::Part &part,
-                                     const stk::mesh::EntityRank part_type,
+                                     const stk::mesh::EntityRank partType,
                                      Ioss::GroupingEntity *entity,
                                      FieldAndName &namedField,
-                                     const Ioss::Field::RoleType filter_role)
+                                     const Ioss::Field::RoleType filterRole)
     {
-        stk::mesh::EntityRank part_rank = part_primary_entity_rank(part);
+        stk::mesh::EntityRank partRank = part_primary_entity_rank(part);
         stk::mesh::PartVector blocks = part.subsets();
         const stk::mesh::FieldBase *f = namedField.field();
         sort_by_descending_field_size(blocks, *f);
 
         for (size_t j = 0; j < blocks.size(); j++) {
-            mesh::Part & side_block_part = *blocks[j];
-            bool validSubsetPartField = stk::io::is_valid_part_field(f, part_type, side_block_part, filter_role);
+            mesh::Part & sideBlockPart = *blocks[j];
+            bool validSubsetPartField = stk::io::is_valid_part_field(f, partType, sideBlockPart, filterRole);
             Ioss::GroupingEntity* subEntity = entity;
 
             if (validSubsetPartField) {
-                const stk::mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*f, part_type, side_block_part);
-                if (part_rank < stk::topology::ELEM_RANK) {
+                const stk::mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*f, partType, sideBlockPart);
+                if (partRank < stk::topology::ELEM_RANK) {
                     Ioss::Region* region = entity->get_database()->get_region();
                     if (nullptr != region) {
-                        Ioss::GroupingEntity* tempEntity = region->get_entity(side_block_part.name());
+                        Ioss::GroupingEntity* tempEntity = region->get_entity(sideBlockPart.name());
                         if (nullptr != tempEntity) {
                           const bool isEntityNodeRankOrSideSetBlock =
                             (tempEntity->type() == Ioss::NODESET ||
@@ -1541,58 +1542,64 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                           if (isEntityNodeRankOrSideSetBlock) {
                             subEntity = tempEntity;
                           }
+
+                          if(tempEntity->type() == Ioss::SIDEBLOCK && entity->type() == Ioss::SIDEBLOCK && tempEntity != entity) {
+                            subEntity = nullptr;
+                          }
                         }
                     }
                 }
 
-                bool validIossField = namedField.is_nodeset_variable() ? (subEntity->type() == Ioss::NODESET) : true;
-                if((subEntity != nullptr) && validIossField) {
-                    if (subEntity != entity && subEntity->type() == Ioss::SIDEBLOCK) {
+                bool validIossField = (subEntity == nullptr) ? false :
+                                      (namedField.is_nodeset_variable() ? (subEntity->type() == Ioss::NODESET) : true);
+
+                if(validIossField) {
+                  if(subEntity->type() == Ioss::SIDEBLOCK && subEntity != entity) {
                       const bool shouldAddFieldToParent =
-                          field_should_be_added(namedField.db_name(),
-                                    res.num_scalars_per_entity(), entity);
+                          field_should_be_added(namedField.db_name(), res.num_scalars_per_entity(), entity);
                       if (shouldAddFieldToParent) {
-                        ioss_add_field_to_entity(f, res, entity, namedField, filter_role);
+                        ioss_add_field_to_entity(f, res, entity, namedField, filterRole);
                       }
                     }
-                    ioss_add_field_to_entity(f, res, subEntity, namedField, filter_role);
+
+                    ioss_add_field_to_entity(f, res, subEntity, namedField, filterRole);
                 }
             }
         }
     }
 
     void ioss_add_fields(const stk::mesh::Part &part,
-                         const stk::mesh::EntityRank part_type,
+                         const stk::mesh::EntityRank partType,
                          Ioss::GroupingEntity *entity,
                          std::vector<FieldAndName> &namedFields,
-                         const Ioss::Field::RoleType filter_role)
+                         const Ioss::Field::RoleType filterRole)
     {
-        stk::mesh::EntityRank part_rank = part_primary_entity_rank(part);
+        stk::mesh::EntityRank partRank = part_primary_entity_rank(part);
         const stk::mesh::PartVector &blocks = part.subsets();
-        bool check_subparts = (part_rank == stk::topology::NODE_RANK ||
-                               part_rank == stk::topology::EDGE_RANK ||
-                               part_rank == stk::topology::FACE_RANK) &&
+        bool checkSubparts =  (partRank == stk::topology::NODE_RANK ||
+                               partRank == stk::topology::EDGE_RANK ||
+                               partRank == stk::topology::FACE_RANK) &&
                               (blocks.size() > 0);
         for (size_t i=0; i<namedFields.size(); i++) {
             const stk::mesh::FieldBase *f = namedFields[i].field();
 
-            if (stk::io::is_valid_part_field(f, part_type, part, filter_role)) {
-                const stk::mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*f, part_type, part);
-                ioss_add_field_to_entity(f, res, entity, namedFields[i], filter_role);
-            } else if (part_rank == namedFields[i].type()) {
-                ioss_add_field_to_derived_nodeset(part, part_type, entity, namedFields[i], filter_role);
+            if (stk::io::is_valid_part_field(f, partType, part, filterRole)) {
+                const stk::mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*f, partType, part);
+                ioss_add_field_to_entity(f, res, entity, namedFields[i], filterRole);
+            } else if (partRank == namedFields[i].type()) {
+                ioss_add_field_to_derived_nodeset(part, partType, entity, namedFields[i], filterRole);
             }
 
             // If this is a sideset, check the subset parts for the field also...
-            if (check_subparts) {
-                ioss_add_fields_for_subpart(part, part_type, entity, namedFields[i], filter_role);
+            if (checkSubparts) {
+                ioss_add_fields_for_subpart(part, partType, entity, namedFields[i], filterRole);
             }
         }
     }
 
     void getNamedFields(const stk::mesh::MetaData &meta,
-                        Ioss::GroupingEntity *io_entity,
-                        const Ioss::Field::RoleType filter_role,
+                        Ioss::GroupingEntity *ioEntity,
+                        const Ioss::Field::RoleType filterRole,
                         std::vector<FieldAndName> &namedFields)
     {
       const std::vector<stk::mesh::FieldBase*> &fields = meta.get_fields();
@@ -1600,29 +1607,29 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       std::vector<stk::mesh::FieldBase *>::const_iterator fieldIterator = fields.begin();
       for(;fieldIterator != fields.end();++fieldIterator) {
           const Ioss::Field::RoleType *role = stk::io::get_field_role(**fieldIterator);
-          if (role && *role == filter_role) {
+          if (role != nullptr && *role == filterRole) {
               namedFields.emplace_back(*fieldIterator, (*fieldIterator)->name());
           }
       }
     }
 
     void ioss_add_fields(const stk::mesh::Part &part,
-                         const stk::mesh::EntityRank part_type,
+                         const stk::mesh::EntityRank partType,
                          Ioss::GroupingEntity *entity,
-                         const Ioss::Field::RoleType filter_role)
+                         const Ioss::Field::RoleType filterRole)
     {
       std::vector<FieldAndName> namedFields;
-      stk::io::getNamedFields(mesh::MetaData::get(part), entity, filter_role, namedFields);
+      stk::io::getNamedFields(mesh::MetaData::get(part), entity, filterRole, namedFields);
 
-      ioss_add_fields(part, part_type, entity, namedFields, filter_role);
+      ioss_add_fields(part, partType, entity, namedFields, filterRole);
     }
 
     void ioss_add_fields(const stk::mesh::Part &part,
-                         const stk::mesh::EntityRank part_type,
+                         const stk::mesh::EntityRank partType,
                          Ioss::GroupingEntity *entity,
                          std::vector<FieldAndName> &namedFields)
     {
-      ioss_add_fields(part, part_type, entity, namedFields, Ioss::Field::Field::TRANSIENT);
+      ioss_add_fields(part, partType, entity, namedFields, Ioss::Field::Field::TRANSIENT);
     }
 
 
@@ -1638,13 +1645,13 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     void define_io_fields(Ioss::GroupingEntity *entity,
                           Ioss::Field::RoleType role,
                           stk::mesh::Part &part,
-                          stk::mesh::EntityRank part_type)
+                          stk::mesh::EntityRank partType)
     {
       stk::mesh::MetaData &meta = mesh::MetaData::get(part);
 
-      bool use_cartesian_for_scalar = false;
+      bool useCartesianForScalar = false;
       if (role == Ioss::Field::ATTRIBUTE)
-        use_cartesian_for_scalar = true;
+        useCartesianForScalar = true;
 
       Ioss::NameList names;
       entity->field_describe(role, &names);
@@ -1660,8 +1667,8 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
         // \todo IMPLEMENT Need to determine whether these are
         // multi-state fields or constant, or interpolated, or ...
-        Ioss::Field io_field = entity->get_field(*I);
-        declare_stk_field(meta, part_type, part, io_field, use_cartesian_for_scalar);
+        Ioss::Field ioField = entity->get_field(*I);
+        declare_stk_field(meta, partType, part, ioField, useCartesianForScalar);
       }
     }
 
@@ -1685,94 +1692,94 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       delete_selector_property(region.get_nodesets());
       delete_selector_property(region.get_commsets());
 
-      const Ioss::SideSetContainer& side_sets = region.get_sidesets();
-      for(Ioss::SideSetContainer::const_iterator it = side_sets.begin();
-          it != side_sets.end(); ++it) {
+      const Ioss::SideSetContainer& sideSets = region.get_sidesets();
+      for(Ioss::SideSetContainer::const_iterator it = sideSets.begin();
+          it != sideSets.end(); ++it) {
         Ioss::SideSet *sset = *it;
         delete_selector_property(*it);
         delete_selector_property(sset->get_side_blocks());
       }
     }
 
-    void delete_selector_property(Ioss::GroupingEntity *io_entity)
+    void delete_selector_property(Ioss::GroupingEntity *ioEntity)
     {
       // If the Ioss::GroupingEntity has a property named 'selector' of
       // type 'pointer', delete the pointer and remove the property.
-      if (io_entity->property_exists(s_internal_selector_name)) {
-        mesh::Selector *select = reinterpret_cast<mesh::Selector*>(io_entity->get_property(s_internal_selector_name).get_pointer());
+      if (ioEntity->property_exists(s_internalSelectorName)) {
+        mesh::Selector *select = reinterpret_cast<mesh::Selector*>(ioEntity->get_property(s_internalSelectorName).get_pointer());
         delete select;
-        io_entity->property_erase(s_internal_selector_name);
+        ioEntity->property_erase(s_internalSelectorName);
       }
     }
 
     template <typename INT>
-    void get_entity_list(Ioss::GroupingEntity *io_entity,
-                         stk::mesh::EntityRank part_type,
+    void get_entity_list(Ioss::GroupingEntity *ioEntity,
+                         stk::mesh::EntityRank partType,
                          const stk::mesh::BulkData &bulk,
                          std::vector<stk::mesh::Entity> &entities)
     {
-      if (io_entity->type() == Ioss::SIDEBLOCK) {
-	std::vector<INT> elem_side ;
-	io_entity->get_field_data("element_side", elem_side);
-	size_t side_count = elem_side.size() / 2;
-	for(size_t is=0; is<side_count; ++is)
-	  entities.push_back(stk::mesh::get_side_entity_for_elem_id_side_pair_of_rank(bulk, elem_side[is*2], elem_side[is*2+1]-1, part_type));
+      if (ioEntity->type() == Ioss::SIDEBLOCK) {
+        std::vector<INT> elemSide ;
+        ioEntity->get_field_data("element_side", elemSide);
+        size_t sideCount = elemSide.size() / 2;
+        for(size_t is=0; is<sideCount; ++is)
+          entities.push_back(stk::mesh::get_side_entity_for_elem_id_side_pair_of_rank(bulk, elemSide[is*2], elemSide[is*2+1]-1, partType));
       }
       else {
-	std::vector<INT> ids ;
-	io_entity->get_field_data("ids", ids);
+        std::vector<INT> ids ;
+        ioEntity->get_field_data("ids", ids);
 
-	size_t count = ids.size();
-	entities.reserve(count);
+        size_t count = ids.size();
+        entities.reserve(count);
 
-	for(size_t i=0; i<count; ++i) {
-	  entities.push_back(bulk.get_entity( part_type, ids[i] ));
-	}
+        for(size_t i=0; i<count; ++i) {
+          entities.push_back(bulk.get_entity( partType, ids[i] ));
+        }
       }
     }
 
-    void get_input_entity_list(Ioss::GroupingEntity *io_entity,
-                         stk::mesh::EntityRank part_type,
+    void get_input_entity_list(Ioss::GroupingEntity *ioEntity,
+                         stk::mesh::EntityRank partType,
                          const stk::mesh::BulkData &bulk,
                          std::vector<stk::mesh::Entity> &entities)
     {
-      ThrowRequireMsg(io_entity->get_database()->is_input(), "Database is output type");
-      if (db_api_int_size(io_entity) == 4) {
-          get_entity_list<int>(io_entity, part_type, bulk, entities);
+      ThrowRequireMsg(ioEntity->get_database()->is_input(), "Database is output type");
+      if (db_api_int_size(ioEntity) == 4) {
+          get_entity_list<int>(ioEntity, partType, bulk, entities);
       } else {
-          get_entity_list<int64_t>(io_entity, part_type, bulk, entities);
+          get_entity_list<int64_t>(ioEntity, partType, bulk, entities);
       }
     }
 
-    void get_output_entity_list(Ioss::GroupingEntity *io_entity,
-                                stk::mesh::EntityRank part_type,
+    void get_output_entity_list(Ioss::GroupingEntity *ioEntity,
+                                stk::mesh::EntityRank partType,
                                 OutputParams &params,
                                 std::vector<stk::mesh::Entity> &entities)
     {
       const stk::mesh::BulkData &bulk = params.bulk_data();
-      ThrowRequireMsg(!io_entity->get_database()->is_input(), "Database is input type");
-      assert(io_entity->property_exists(s_internal_selector_name));
+      ThrowRequireMsg(!ioEntity->get_database()->is_input(), "Database is input type");
+      assert(ioEntity->property_exists(s_internalSelectorName));
 
-      mesh::Selector *select = reinterpret_cast<mesh::Selector*>(io_entity->get_property(s_internal_selector_name).get_pointer());
+      mesh::Selector *select = reinterpret_cast<mesh::Selector*>(ioEntity->get_property(s_internalSelectorName).get_pointer());
 
-      if(io_entity->type() == Ioss::NODEBLOCK) {
+      if(ioEntity->type() == Ioss::NODEBLOCK) {
           get_selected_nodes(params, *select, entities);
       } else {
           const bool sortById = true;
-          stk::mesh::get_entities(bulk, part_type, *select, entities, sortById);
+          stk::mesh::get_entities(bulk, partType, *select, entities, sortById);
       }
     }
 
-    const std::string get_suffix_for_field_at_state(enum stk::mesh::FieldState field_state, std::vector<std::string>* multiStateSuffixes)
+    const std::string get_suffix_for_field_at_state(enum stk::mesh::FieldState fieldState, std::vector<std::string>* multiStateSuffixes)
     {
       if(nullptr != multiStateSuffixes) {
-          ThrowRequireMsg((multiStateSuffixes->size() >= field_state),
-                          "Invalid field state index '" << field_state << "'");
-          return (*multiStateSuffixes)[field_state];
+          ThrowRequireMsg((multiStateSuffixes->size() >= fieldState),
+                          "Invalid field state index '" << fieldState << "'");
+          return (*multiStateSuffixes)[fieldState];
       }
 
       std::string suffix = "";
-      switch(field_state)
+      switch(fieldState)
         {
         case stk::mesh::StateN:
           suffix = ".N";
@@ -1792,106 +1799,106 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         case stk::mesh::StateNP1:
           break;
         default:
-          ThrowRequireMsg(false, "Internal Error: Unsupported stk::mesh::FieldState: " << field_state << ".\n");
+          ThrowRequireMsg(false, "Internal Error: Unsupported stk::mesh::FieldState: " << fieldState << ".\n");
         }
       return suffix;
     }
 
-    std::string get_stated_field_name(const std::string &field_base_name, stk::mesh::FieldState state_identifier,
+    std::string get_stated_field_name(const std::string &fieldBaseName, stk::mesh::FieldState stateIdentifier,
                                       std::vector<std::string>* multiStateSuffixes)
     {
-      std::string field_name_with_suffix = field_base_name + get_suffix_for_field_at_state(state_identifier, multiStateSuffixes);
+      std::string field_name_with_suffix = fieldBaseName + get_suffix_for_field_at_state(stateIdentifier, multiStateSuffixes);
       return field_name_with_suffix;
     }
 
-    bool field_state_exists_on_io_entity(const std::string& db_name, const stk::mesh::FieldBase* field, stk::mesh::FieldState state_identifier,
-                                         Ioss::GroupingEntity *io_entity, std::vector<std::string>* multiStateSuffixes)
+    bool field_state_exists_on_io_entity(const std::string& dbName, const stk::mesh::FieldBase* field, stk::mesh::FieldState stateIdentifier,
+                                         Ioss::GroupingEntity *ioEntity, std::vector<std::string>* multiStateSuffixes)
     {
-        std::string field_name_with_suffix = get_stated_field_name(db_name, state_identifier, multiStateSuffixes);
-        return io_entity->field_exists(field_name_with_suffix);
+        std::string fieldNameWithSuffix = get_stated_field_name(dbName, stateIdentifier, multiStateSuffixes);
+        return ioEntity->field_exists(fieldNameWithSuffix);
     }
 
-    bool all_field_states_exist_on_io_entity(const std::string& db_name, const stk::mesh::FieldBase* field, Ioss::GroupingEntity *io_entity,
-                                             std::vector<stk::mesh::FieldState> &missing_states, std::vector<std::string>* inputMultiStateSuffixes)
+    bool all_field_states_exist_on_io_entity(const std::string& dbName, const stk::mesh::FieldBase* field, Ioss::GroupingEntity *ioEntity,
+                                             std::vector<stk::mesh::FieldState> &missingStates, std::vector<std::string>* inputMultiStateSuffixes)
     {
-        bool all_states_exist = true;
-        size_t state_count = field->number_of_states();
+        bool allStatesExist = true;
+        size_t stateCount = field->number_of_states();
 
-        std::vector<std::string>* multiStateSuffixes = state_count > 2 ? inputMultiStateSuffixes : nullptr;
+        std::vector<std::string>* multiStateSuffixes = stateCount > 2 ? inputMultiStateSuffixes : nullptr;
 
         if(nullptr != multiStateSuffixes) {
-            ThrowRequire(multiStateSuffixes->size() >= state_count);
+            ThrowRequire(multiStateSuffixes->size() >= stateCount);
         }
 
-        for(size_t state = 0; state < state_count - 1; state++) {
-            stk::mesh::FieldState state_identifier = static_cast<stk::mesh::FieldState>(state);
-            if (!field_state_exists_on_io_entity(db_name, field, state_identifier, io_entity, multiStateSuffixes)) {
-                all_states_exist = false;
-                missing_states.push_back(state_identifier);
+        for(size_t state = 0; state < stateCount - 1; state++) {
+            stk::mesh::FieldState stateIdentifier = static_cast<stk::mesh::FieldState>(state);
+            if (!field_state_exists_on_io_entity(dbName, field, stateIdentifier, ioEntity, multiStateSuffixes)) {
+                allStatesExist = false;
+                missingStates.push_back(stateIdentifier);
             }
         }
 
-        return all_states_exist;
+        return allStatesExist;
     }
 
     void multistate_field_data_from_ioss(const stk::mesh::BulkData& mesh,
                                          const stk::mesh::FieldBase *field,
-                                         std::vector<stk::mesh::Entity> &entity_list,
-                                         Ioss::GroupingEntity *io_entity,
+                                         std::vector<stk::mesh::Entity> &entityList,
+                                         Ioss::GroupingEntity *ioEntity,
                                          const std::string &name,
-                                         const size_t state_count,
-                                         bool ignore_missing_fields,
+                                         const size_t stateCount,
+                                         bool ignoreMissingFields,
                                          std::vector<std::string>* inputMultiStateSuffixes)
     {
-        std::vector<std::string>* multiStateSuffixes = state_count > 2 ? inputMultiStateSuffixes : nullptr;
+        std::vector<std::string>* multiStateSuffixes = stateCount > 2 ? inputMultiStateSuffixes : nullptr;
 
         if(nullptr != multiStateSuffixes) {
-            ThrowRequire(multiStateSuffixes->size() >= state_count);
+            ThrowRequire(multiStateSuffixes->size() >= stateCount);
         }
 
-        for(size_t state = 0; state < state_count - 1; state++)
+        for(size_t state = 0; state < stateCount - 1; state++)
         {
-            stk::mesh::FieldState state_identifier = static_cast<stk::mesh::FieldState>(state);
-            bool field_exists = field_state_exists_on_io_entity(name, field, state_identifier, io_entity, multiStateSuffixes);
-            if (!field_exists && !ignore_missing_fields) {
-                STKIORequire(field_exists);
+            stk::mesh::FieldState stateIdentifier = static_cast<stk::mesh::FieldState>(state);
+            bool fieldExists = field_state_exists_on_io_entity(name, field, stateIdentifier, ioEntity, multiStateSuffixes);
+            if (!fieldExists && !ignoreMissingFields) {
+                STKIORequire(fieldExists);
             }
-            if (field_exists) {
-                stk::mesh::FieldBase *stated_field = field->field_state(state_identifier);
-                std::string field_name_with_suffix = get_stated_field_name(name, state_identifier, multiStateSuffixes);
-                stk::io::field_data_from_ioss(mesh, stated_field, entity_list, io_entity, field_name_with_suffix);
+            if (fieldExists) {
+                stk::mesh::FieldBase *statedField = field->field_state(stateIdentifier);
+                std::string fieldNameWithSuffix = get_stated_field_name(name, stateIdentifier, multiStateSuffixes);
+                stk::io::field_data_from_ioss(mesh, statedField, entityList, ioEntity, fieldNameWithSuffix);
             }
         }
     }
 
     void subsetted_multistate_field_data_from_ioss(const stk::mesh::BulkData& mesh,
                                                    const stk::mesh::FieldBase *field,
-                                                   std::vector<stk::mesh::Entity> &entity_list,
-                                                   Ioss::GroupingEntity *io_entity,
-                                                   const stk::mesh::Part *stk_part,
+                                                   std::vector<stk::mesh::Entity> &entityList,
+                                                   Ioss::GroupingEntity *ioEntity,
+                                                   const stk::mesh::Part *stkPart,
                                                    const std::string &name,
-                                                   const size_t state_count,
-                                                   bool ignore_missing_fields,
+                                                   const size_t stateCount,
+                                                   bool ignoreMissingFields,
                                                    std::vector<std::string>* inputMultiStateSuffixes)
     {
-        std::vector<std::string>* multiStateSuffixes = state_count > 2 ? inputMultiStateSuffixes : nullptr;
+        std::vector<std::string>* multiStateSuffixes = stateCount > 2 ? inputMultiStateSuffixes : nullptr;
 
         if(nullptr != multiStateSuffixes) {
-            ThrowRequire(multiStateSuffixes->size() >= state_count);
+            ThrowRequire(multiStateSuffixes->size() >= stateCount);
         }
 
-        for(size_t state = 0; state < state_count - 1; state++)
+        for(size_t state = 0; state < stateCount - 1; state++)
         {
-            stk::mesh::FieldState state_identifier = static_cast<stk::mesh::FieldState>(state);
-            bool field_exists = field_state_exists_on_io_entity(name, field, state_identifier, io_entity, multiStateSuffixes);
-            if (!field_exists && !ignore_missing_fields) {
-                STKIORequire(field_exists);
+            stk::mesh::FieldState stateIdentifier = static_cast<stk::mesh::FieldState>(state);
+            bool fieldExists = field_state_exists_on_io_entity(name, field, stateIdentifier, ioEntity, multiStateSuffixes);
+            if (!fieldExists && !ignoreMissingFields) {
+                STKIORequire(fieldExists);
             }
-            if (field_exists) {
-                stk::mesh::FieldBase *stated_field = field->field_state(state_identifier);
-                std::string field_name_with_suffix = get_stated_field_name(name, state_identifier, multiStateSuffixes);
-                stk::io::subsetted_field_data_from_ioss(mesh, stated_field, entity_list,
-                                                      io_entity, stk_part, field_name_with_suffix);
+            if (fieldExists) {
+                stk::mesh::FieldBase *statedField = field->field_state(stateIdentifier);
+                std::string fieldNameWithSuffix = get_stated_field_name(name, stateIdentifier, multiStateSuffixes);
+                stk::io::subsetted_field_data_from_ioss(mesh, statedField, entityList,
+                                                      ioEntity, stkPart, fieldNameWithSuffix);
             }
         }
     }
@@ -1899,41 +1906,41 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     void field_data_from_ioss(const stk::mesh::BulkData& mesh,
                               const stk::mesh::FieldBase *field,
                               std::vector<stk::mesh::Entity> &entities,
-                              Ioss::GroupingEntity *io_entity,
-                              const std::string &io_fld_name)
+                              Ioss::GroupingEntity *ioEntity,
+                              const std::string &ioFieldName)
     {
         /// \todo REFACTOR Need some additional compatibility checks between
         /// Ioss field and stk::mesh::Field; better error messages...
 
-        if (field != nullptr && io_entity->field_exists(io_fld_name)) {
-            const Ioss::Field &io_field = io_entity->get_fieldref(io_fld_name);
+        if (field != nullptr && ioEntity->field_exists(ioFieldName)) {
+            const Ioss::Field &ioField = ioEntity->get_fieldref(ioFieldName);
             if (field->type_is<double>()) {
-                internal_field_data_from_ioss<double>(mesh, io_field, field, entities, io_entity);
+                internal_field_data_from_ioss<double>(mesh, ioField, field, entities, ioEntity);
             } else if (field->type_is<int>()) {
                 // Make sure the IO field type matches the STK field type.
                 // By default, all IO fields are created of type 'double'
-                if (db_api_int_size(io_entity) == 4) {
-                    io_field.check_type(Ioss::Field::INTEGER);
-                    internal_field_data_from_ioss<int>(mesh, io_field, field, entities, io_entity);
+                if (db_api_int_size(ioEntity) == 4) {
+                    ioField.check_type(Ioss::Field::INTEGER);
+                    internal_field_data_from_ioss<int>(mesh, ioField, field, entities, ioEntity);
                 } else {
-                    io_field.check_type(Ioss::Field::INT64);
-                    internal_field_data_from_ioss<int64_t>(mesh, io_field, field, entities, io_entity);
+                    ioField.check_type(Ioss::Field::INT64);
+                    internal_field_data_from_ioss<int64_t>(mesh, ioField, field, entities, ioEntity);
                 }
             } else if (field->type_is<int64_t>()) {
                 // Make sure the IO field type matches the STK field type.
                 // By default, all IO fields are created of type 'double'
-                io_field.check_type(Ioss::Field::INT64);
-                internal_field_data_from_ioss<int64_t>(mesh, io_field, field, entities, io_entity);
+                ioField.check_type(Ioss::Field::INT64);
+                internal_field_data_from_ioss<int64_t>(mesh, ioField, field, entities, ioEntity);
             } else if (field->type_is<uint32_t>()) {
                 // Make sure the IO field type matches the STK field type.
                 // By default, all IO fields are created of type 'double'
-                io_field.check_type(Ioss::Field::INTEGER);
-                internal_field_data_from_ioss<uint32_t>(mesh, io_field, field, entities, io_entity);
+                ioField.check_type(Ioss::Field::INTEGER);
+                internal_field_data_from_ioss<uint32_t>(mesh, ioField, field, entities, ioEntity);
             } else if (field->type_is<uint64_t>()) {
                 // Make sure the IO field type matches the STK field type.
                 // By default, all IO fields are created of type 'double'
-                io_field.check_type(Ioss::Field::INT64);
-                internal_field_data_from_ioss<uint64_t>(mesh, io_field, field, entities, io_entity);
+                ioField.check_type(Ioss::Field::INT64);
+                internal_field_data_from_ioss<uint64_t>(mesh, ioField, field, entities, ioEntity);
             }
 
         }
@@ -1942,37 +1949,37 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     void subsetted_field_data_from_ioss(const stk::mesh::BulkData& mesh,
                                         const stk::mesh::FieldBase *field,
                                         std::vector<stk::mesh::Entity> &entities,
-                                        Ioss::GroupingEntity *io_entity,
-                                        const stk::mesh::Part *stk_part,
-                                        const std::string &io_fld_name)
+                                        Ioss::GroupingEntity *ioEntity,
+                                        const stk::mesh::Part *stkPart,
+                                        const std::string &ioFieldName)
     {
         /// \todo REFACTOR Need some additional compatibility checks between
         /// Ioss field and stk::mesh::Field; better error messages...
-        if (field != nullptr && io_entity->field_exists(io_fld_name)) {
-            const Ioss::Field &io_field = io_entity->get_fieldref(io_fld_name);
+        if (field != nullptr && ioEntity->field_exists(ioFieldName)) {
+            const Ioss::Field &ioField = ioEntity->get_fieldref(ioFieldName);
             if (field->type_is<double>()) {
-                internal_subsetted_field_data_from_ioss<double>(mesh, io_field, field, entities, io_entity, stk_part);
+                internal_subsetted_field_data_from_ioss<double>(mesh, ioField, field, entities, ioEntity, stkPart);
             } else if (field->type_is<int>()) {
                 // Make sure the IO field type matches the STK field type.
                 // By default, all IO fields are created of type 'double'
-                if (db_api_int_size(io_entity) == 4) {
-                    io_field.check_type(Ioss::Field::INTEGER);
-                    internal_subsetted_field_data_from_ioss<int>(mesh, io_field, field, entities, io_entity, stk_part);
+                if (db_api_int_size(ioEntity) == 4) {
+                    ioField.check_type(Ioss::Field::INTEGER);
+                    internal_subsetted_field_data_from_ioss<int>(mesh, ioField, field, entities, ioEntity, stkPart);
                 } else {
-                    io_field.check_type(Ioss::Field::INT64);
-                    internal_subsetted_field_data_from_ioss<int64_t>(mesh, io_field, field, entities, io_entity,
-                                                                     stk_part);
+                    ioField.check_type(Ioss::Field::INT64);
+                    internal_subsetted_field_data_from_ioss<int64_t>(mesh, ioField, field, entities, ioEntity,
+                                                                     stkPart);
                 }
             } else if (field->type_is<uint32_t>()) {
                 // Make sure the IO field type matches the STK field type.
                 // By default, all IO fields are created of type 'double'
-                if (db_api_int_size(io_entity) == 4) {
-                    io_field.check_type(Ioss::Field::INTEGER);
-                    internal_subsetted_field_data_from_ioss<uint32_t>(mesh, io_field, field, entities, io_entity, stk_part);
+                if (db_api_int_size(ioEntity) == 4) {
+                    ioField.check_type(Ioss::Field::INTEGER);
+                    internal_subsetted_field_data_from_ioss<uint32_t>(mesh, ioField, field, entities, ioEntity, stkPart);
                 } else {
-                    io_field.check_type(Ioss::Field::INT64);
-                    internal_subsetted_field_data_from_ioss<uint64_t>(mesh, io_field, field, entities, io_entity,
-                                                                     stk_part);
+                    ioField.check_type(Ioss::Field::INT64);
+                    internal_subsetted_field_data_from_ioss<uint64_t>(mesh, ioField, field, entities, ioEntity,
+                                                                      stkPart);
                 }
             }
         }
@@ -1981,48 +1988,47 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     void multistate_field_data_to_ioss(const stk::mesh::BulkData& mesh,
                                        const stk::mesh::FieldBase *field,
                                        std::vector<stk::mesh::Entity> &entities,
-                                       Ioss::GroupingEntity *io_entity,
-                                       const std::string &io_fld_name,
-                                       Ioss::Field::RoleType filter_role,
-                                       const size_t state_count)
+                                       Ioss::GroupingEntity *ioEntity,
+                                       const std::string &ioFieldName,
+                                       Ioss::Field::RoleType filterRole,
+                                       const size_t stateCount)
     {
-      for(size_t state = 0; state < state_count - 1; state++)
-        {
-          stk::mesh::FieldState state_identifier = static_cast<stk::mesh::FieldState>(state);
-          std::string field_name_with_suffix = get_stated_field_name(io_fld_name, state_identifier);
-          stk::mesh::FieldBase *stated_field = field->field_state(state_identifier);
-          //STKIORequire(io_entity->field_exists(field_name_with_suffix));
-          stk::io::field_data_to_ioss(mesh, stated_field, entities, io_entity, field_name_with_suffix, filter_role);
-        }
+      for(size_t state = 0; state < stateCount - 1; state++)
+      {
+        stk::mesh::FieldState stateIdentifier = static_cast<stk::mesh::FieldState>(state);
+        std::string fieldNameWithSuffix = get_stated_field_name(ioFieldName, stateIdentifier);
+        stk::mesh::FieldBase *statedField = field->field_state(stateIdentifier);
+        stk::io::field_data_to_ioss(mesh, statedField, entities, ioEntity, fieldNameWithSuffix, filterRole);
+      }
     }
 
     void field_data_to_ioss(const stk::mesh::BulkData& mesh,
                             const stk::mesh::FieldBase *field,
                             std::vector<stk::mesh::Entity> &entities,
-                            Ioss::GroupingEntity *io_entity,
-                            const std::string &io_fld_name,
-                            Ioss::Field::RoleType filter_role)
+                            Ioss::GroupingEntity *ioEntity,
+                            const std::string &ioFieldName,
+                            Ioss::Field::RoleType filterRole)
     {
       /// \todo REFACTOR Need some additional compatibility checks between
       /// Ioss field and stk::mesh::Field; better error messages...
 
-      if (field != nullptr && io_entity->field_exists(io_fld_name)) {
-        const Ioss::Field &io_field = io_entity->get_fieldref(io_fld_name);
-        if (io_field.get_role() == filter_role) {
+      if (field != nullptr && ioEntity->field_exists(ioFieldName)) {
+        const Ioss::Field &ioField = ioEntity->get_fieldref(ioFieldName);
+        if (ioField.get_role() == filterRole) {
           if (field->type_is<double>()) {
-            internal_field_data_to_ioss<double>(mesh, io_field, field, entities, io_entity);
+            internal_field_data_to_ioss<double>(mesh, ioField, field, entities, ioEntity);
           } else if (field->type_is<int>()) {
-            io_field.check_type(Ioss::Field::INTEGER);
-            internal_field_data_to_ioss<int>(mesh, io_field, field, entities, io_entity);
+            ioField.check_type(Ioss::Field::INTEGER);
+            internal_field_data_to_ioss<int>(mesh, ioField, field, entities, ioEntity);
           } else if (field->type_is<int64_t>()) {
-            io_field.check_type(Ioss::Field::INT64);
-            internal_field_data_to_ioss<int64_t>(mesh, io_field, field, entities, io_entity);
+            ioField.check_type(Ioss::Field::INT64);
+            internal_field_data_to_ioss<int64_t>(mesh, ioField, field, entities, ioEntity);
           } else if (field->type_is<uint32_t>()) {
-            io_field.check_type(Ioss::Field::INT32);
-            internal_field_data_to_ioss<uint32_t>(mesh, io_field, field, entities, io_entity);
+            ioField.check_type(Ioss::Field::INT32);
+            internal_field_data_to_ioss<uint32_t>(mesh, ioField, field, entities, ioEntity);
           } else if (field->type_is<uint64_t>()) {
-            io_field.check_type(Ioss::Field::INT64);
-            internal_field_data_to_ioss<uint64_t>(mesh, io_field, field, entities, io_entity);
+            ioField.check_type(Ioss::Field::INT64);
+            internal_field_data_to_ioss<uint64_t>(mesh, ioField, field, entities, ioEntity);
           }
         }
       }
@@ -2048,14 +2054,13 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
     namespace {
 
-    stk::mesh::EntityRank get_output_rank(const stk::io::OutputParams& params)
+    stk::mesh::EntityRank get_output_rank(stk::io::OutputParams& params)
     {
       return params.has_skin_mesh_selector() ? params.bulk_data().mesh_meta_data().side_rank() : stk::topology::ELEMENT_RANK;
     }
 
     //----------------------------------------------------------------------
-    void define_node_block(stk::io::OutputParams &params,
-                           stk::mesh::Part &part)
+    void define_node_block(stk::io::OutputParams &params, stk::mesh::Part &part)
     {
       //--------------------------------
       // Set the spatial dimension:
@@ -2065,23 +2070,23 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       //it from the coordinate-field's restriction onto the universal part.
       //This is because some codes (sierra framework) don't put the coordinate
       //field on the universal part. (framework puts it on active and inactive parts)
-      const int spatial_dim = meta.spatial_dimension();
+      const int spatialDim = meta.spatial_dimension();
       stk::mesh::EntityRank rank = get_output_rank(params);
       //--------------------------------
       // Create the special universal node block:
-      mesh::Selector shared_selector = params.has_shared_selector() ? *(params.get_shared_selector())
-                                                                    : meta.globally_shared_part();
+      mesh::Selector sharedSelector = params.has_shared_selector() ? *(params.get_shared_selector())
+                                                                   : meta.globally_shared_part();
 
-      mesh::Selector all_selector = meta.globally_shared_part() | meta.locally_owned_part();
-      if (params.get_subset_selector(    )) all_selector &= *params.get_subset_selector();
-      if (params.get_output_selector(rank)) all_selector &= *params.get_output_selector(rank);
+      mesh::Selector allSelector = meta.globally_shared_part() | meta.locally_owned_part();
+      if (params.get_subset_selector(    )) allSelector &= *params.get_subset_selector();
+      if (params.get_output_selector(rank)) allSelector &= *params.get_output_selector(rank);
 
-      mesh::Selector own_selector = meta.locally_owned_part();
-      if (params.get_subset_selector(    )) own_selector &= *params.get_subset_selector();
-      if (params.get_output_selector(rank)) own_selector &= *params.get_output_selector(rank);
+      mesh::Selector ownSelector = meta.locally_owned_part();
+      if (params.get_subset_selector(    )) ownSelector &= *params.get_subset_selector();
+      if (params.get_output_selector(rank)) ownSelector &= *params.get_output_selector(rank);
 
-      int64_t all_nodes = count_selected_nodes(params, all_selector);
-      int64_t own_nodes = count_selected_nodes(params, own_selector);
+      int64_t allNodes = count_selected_nodes(params, allSelector);
+      int64_t ownNodes = count_selected_nodes(params, ownSelector);
 
       const std::string name("nodeblock_1");
 
@@ -2089,17 +2094,17 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       if(nb == nullptr)
       {
           nb = new Ioss::NodeBlock(params.io_region().get_database(),
-                                   name, all_nodes, spatial_dim);
+                                   name, allNodes, spatialDim);
           params.io_region().add( nb );
       }
 
       delete_selector_property(nb);
-      mesh::Selector *node_select = new mesh::Selector(all_selector);
-      nb->property_add(Ioss::Property(s_internal_selector_name, node_select));
+      mesh::Selector *nodeSelect = new mesh::Selector(allSelector);
+      nb->property_add(Ioss::Property(s_internalSelectorName, nodeSelect));
       nb->property_add(Ioss::Property(base_stk_part_name, getPartName(part)));
 
       // Add locally-owned property...
-      nb->property_add(Ioss::Property("locally_owned_count", own_nodes));
+      nb->property_add(Ioss::Property("locally_owned_count", ownNodes));
       // Add the attribute fields.
       ioss_add_fields(part, part_primary_entity_rank(part), nb, Ioss::Field::ATTRIBUTE);
     }
@@ -2111,39 +2116,39 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     {
       mesh::EntityRank rank = get_output_rank(params);
       mesh::MetaData & meta = mesh::MetaData::get(part);
-      Ioss::Region & io_region = params.io_region();
+      Ioss::Region & ioRegion = params.io_region();
 
-      mesh::Selector shared_selector = params.has_shared_selector() ? *(params.get_shared_selector())
-                                                                    : meta.globally_shared_part();
+      mesh::Selector sharedSelector = params.has_shared_selector() ? *(params.get_shared_selector())
+                                                                   : meta.globally_shared_part();
 
-      mesh::Selector all_selector = (meta.globally_shared_part() | meta.locally_owned_part()) & part;
-      if (params.get_subset_selector(    )) all_selector &= *params.get_subset_selector();
-      if (params.get_output_selector(rank)) all_selector &= *params.get_output_selector(rank);
+      mesh::Selector allSelector = (meta.globally_shared_part() | meta.locally_owned_part()) & part;
+      if (params.get_subset_selector(    )) allSelector &= *params.get_subset_selector();
+      if (params.get_output_selector(rank)) allSelector &= *params.get_output_selector(rank);
 
-      mesh::Selector own_selector = meta.locally_owned_part() & part;
-      if (params.get_subset_selector(    )) own_selector &= *params.get_subset_selector();
-      if (params.get_output_selector(rank)) own_selector &= *params.get_output_selector(rank);
+      mesh::Selector ownSelector = meta.locally_owned_part() & part;
+      if (params.get_subset_selector(    )) ownSelector &= *params.get_subset_selector();
+      if (params.get_output_selector(rank)) ownSelector &= *params.get_output_selector(rank);
 
-      int64_t all_nodes = count_selected_nodes(params, all_selector);
-      int64_t own_nodes = count_selected_nodes(params, own_selector);
+      int64_t allNodes = count_selected_nodes(params, allSelector);
+      int64_t ownNodes = count_selected_nodes(params, ownSelector);
 
-      Ioss::NodeSet *ns = io_region.get_nodeset(name);
+      Ioss::NodeSet *ns = ioRegion.get_nodeset(name);
       if(ns == nullptr)
       {
-          ns = new Ioss::NodeSet( io_region.get_database(), name, all_nodes);
-          io_region.add(ns);
+          ns = new Ioss::NodeSet( ioRegion.get_database(), name, allNodes);
+          ioRegion.add(ns);
 
-          bool use_generic_canonical_name = io_region.get_database()->get_use_generic_canonical_name();
+          bool use_generic_canonical_name = ioRegion.get_database()->get_use_generic_canonical_name();
           if(use_generic_canonical_name) {
             add_canonical_name_property(ns, part);
           }
       }
 
-      ns->property_add(Ioss::Property("locally_owned_count", own_nodes));
+      ns->property_add(Ioss::Property("locally_owned_count", ownNodes));
 
       delete_selector_property(ns);
-      mesh::Selector *select = new mesh::Selector(all_selector);
-      ns->property_add(Ioss::Property(s_internal_selector_name, select));
+      mesh::Selector *select = new mesh::Selector(allSelector);
+      ns->property_add(Ioss::Property(s_internalSelectorName, select));
       ns->property_add(Ioss::Property(base_stk_part_name, getPartName(part)));
 
       if(!isDerivedNodeset) {
@@ -2163,17 +2168,17 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                              stk::mesh::Selector selector,
                              stk::mesh::Part &part,
                              Ioss::SideSet *sset,
-                             int spatial_dimension,
-                             bool create_nodeset)
+                             int spatialDimension,
+                             bool createNodeset)
       {
         stk::mesh::EntityRank type = part.primary_entity_rank();
         const stk::mesh::EntityRank siderank = stk::mesh::MetaData::get(part).side_rank();
         const stk::mesh::EntityRank edgerank = stk::topology::EDGE_RANK;
         STKIORequire(type == siderank || type == edgerank);
 
-        stk::topology side_topology = part.topology();
-        std::string io_topo = map_stk_topology_to_ioss(side_topology);
-        std::string element_topo_name = "unknown";
+        stk::topology sideTopology = part.topology();
+        std::string ioTopo = map_stk_topology_to_ioss(sideTopology);
+        std::string elementTopoName = "unknown";
 
         const stk::mesh::BulkData &bulk = params.bulk_data();
 
@@ -2181,8 +2186,8 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         // Try to decode from part name...
         std::vector<std::string> tokens;
         stk::util::tokenize(getPartName(part), "_", tokens);
-        const Ioss::ElementTopology *element_topo = nullptr;
-        stk::topology stk_element_topology = stk::topology::INVALID_TOPOLOGY;
+        const Ioss::ElementTopology *elementTopo = nullptr;
+        stk::topology stkElementTopology = stk::topology::INVALID_TOPOLOGY;
         if (tokens.size() >= 4) {
           // If the sideset has a "canonical" name as in "surface_{id}",
           // Then the sideblock name will be of the form:
@@ -2194,123 +2199,123 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
           //  * "{sideset_name}_block_id_sidetopo"
 
           // Check the last token and see if it is an integer...
-          bool all_dig = tokens.back().find_first_not_of("0123456789") == std::string::npos;
-          if (all_dig) {
-            element_topo = Ioss::ElementTopology::factory(tokens[1], true);
+          bool allDigits = tokens.back().find_first_not_of("0123456789") == std::string::npos;
+          if (allDigits) {
+            elementTopo = Ioss::ElementTopology::factory(tokens[1], true);
           } else {
-            element_topo = Ioss::ElementTopology::factory(tokens[tokens.size() - 2], true);
+            elementTopo = Ioss::ElementTopology::factory(tokens[tokens.size() - 2], true);
           }
 
-          if (element_topo != nullptr) {
-            element_topo_name = element_topo->name();
-            stk_element_topology = map_ioss_topology_to_stk(element_topo, bulk.mesh_meta_data().spatial_dimension());
+          if (elementTopo != nullptr) {
+            elementTopoName = elementTopo->name();
+            stkElementTopology = map_ioss_topology_to_stk(elementTopo, bulk.mesh_meta_data().spatial_dimension());
           }
         }
 
         const stk::mesh::Part *parentElementBlock = get_parent_element_block(bulk, params.io_region(), part.name());
 
-        size_t side_count = get_number_sides_in_sideset(params, part, stk_element_topology, parentElementBlock);
+        size_t sideCount = get_number_sides_in_sideset(params, part, stkElementTopology, parentElementBlock);
 
         std::string name = getPartName(part);
-        Ioss::SideBlock *side_block = sset->get_side_block(name);
-        if(side_block == nullptr)
+        Ioss::SideBlock *sideBlock = sset->get_side_block(name);
+        if(sideBlock == nullptr)
         {
-            side_block = new Ioss::SideBlock(sset->get_database(), name, io_topo, element_topo_name, side_count);
-            sset->add(side_block);
+            sideBlock = new Ioss::SideBlock(sset->get_database(), name, ioTopo, elementTopoName, sideCount);
+            sset->add(sideBlock);
         }
 
         const mesh::FieldBase *df = get_distribution_factor_field(part);
         if (df != nullptr) {
-          int nodes_per_side = side_topology.num_nodes();
-          std::string storage_type = "Real[";
-          storage_type += sierra::to_string(nodes_per_side);
-          storage_type += "]";
-          side_block->field_add(Ioss::Field(s_distribution_factors, Ioss::Field::REAL, storage_type,
-                                            Ioss::Field::MESH, side_count));
+          int nodesPerSide = sideTopology.num_nodes();
+          std::string storageType = "Real[";
+          storageType += sierra::to_string(nodesPerSide);
+          storageType += "]";
+          sideBlock->field_add(Ioss::Field(s_distributionFactors, Ioss::Field::REAL, storageType,
+                                            Ioss::Field::MESH, sideCount));
         }
 
         selector &= bulk.mesh_meta_data().locally_owned_part();
-        delete_selector_property(side_block);
+        delete_selector_property(sideBlock);
         mesh::Selector *select = new mesh::Selector(selector);
-        side_block->property_add(Ioss::Property(s_internal_selector_name, select));
-        side_block->property_add(Ioss::Property(base_stk_part_name, getPartName(part)));
+        sideBlock->property_add(Ioss::Property(s_internalSelectorName, select));
+        sideBlock->property_add(Ioss::Property(base_stk_part_name, getPartName(part)));
 
         // Add the attribute fields.
-        ioss_add_fields(part, part_primary_entity_rank(part), side_block, Ioss::Field::ATTRIBUTE);
+        ioss_add_fields(part, part_primary_entity_rank(part), sideBlock, Ioss::Field::ATTRIBUTE);
 
-        if(create_nodeset) {
-            std::string nodes_name = getPartName(part) + s_entity_nodes_suffix;
+        if(createNodeset) {
+            std::string nodes_name = getPartName(part) + s_entityNodesSuffix;
             bool isDerivedNodeset = true;
             define_node_set(params, part, nodes_name, isDerivedNodeset);
         }
       }
 
       bool should_create_nodeset_from_sideset(stk::mesh::Part &part,
-                                              bool use_nodeset_for_nodal_fields,
-                                              bool check_field_existence)
+                                              bool useNodesetForNodalFields,
+                                              bool checkFieldExistence)
       {
           STKIORequire(part.primary_entity_rank() == stk::topology::FACE_RANK || stk::topology::EDGE_RANK);
 
-          bool create_nodesets = false;
+          bool createNodesets = false;
 
-          if (use_nodeset_for_nodal_fields) {
-              if(check_field_existence) {
-                  bool lower_rank_fields = will_output_lower_rank_fields(part, stk::topology::NODE_RANK);
+          if (useNodesetForNodalFields) {
+              if(checkFieldExistence) {
+                  bool lowerRankFields = will_output_lower_rank_fields(part, stk::topology::NODE_RANK);
 
-                  if (!lower_rank_fields) {
+                  if (!lowerRankFields) {
                       // See if lower rank fields are defined on sideblock parts of this sideset...
                       const stk::mesh::PartVector &blocks = part.subsets();
-                      for (size_t j = 0; j < blocks.size() && !lower_rank_fields; j++) {
+                      for (size_t j = 0; j < blocks.size() && !lowerRankFields; j++) {
                           mesh::Part & side_block_part = *blocks[j];
-                          lower_rank_fields |= will_output_lower_rank_fields(side_block_part, stk::topology::NODE_RANK);
+                          lowerRankFields |= will_output_lower_rank_fields(side_block_part, stk::topology::NODE_RANK);
                       }
                   }
-                  if (lower_rank_fields) {
-                      create_nodesets = true;
+                  if (lowerRankFields) {
+                      createNodesets = true;
                   }
               } else {
-                  create_nodesets = true;
+                  createNodesets = true;
               }
           }
 
           if(has_derived_nodeset_attribute(part)) {
-              create_nodesets = get_derived_nodeset_attribute(part);
+              createNodesets = get_derived_nodeset_attribute(part);
           }
 
-          return create_nodesets;
+          return createNodesets;
       }
 
       void define_side_blocks(stk::io::OutputParams &params,
                               stk::mesh::Part &part,
                               Ioss::SideSet *sset,
                               stk::mesh::EntityRank type,
-                              int spatial_dimension)
+                              int spatialDimension)
       {
         STKIORequire(type == stk::topology::FACE_RANK || stk::topology::EDGE_RANK);
 
-        bool create_nodesets = should_create_nodeset_from_sideset(part,
-                                                                  params.get_use_nodeset_for_sideset_node_fields(),
-                                                                  params.check_field_existence_when_creating_nodesets());
+        bool createNodesets = should_create_nodeset_from_sideset(part,
+                                                                 params.get_use_nodeset_for_sideset_node_fields(),
+                                                                 params.check_field_existence_when_creating_nodesets());
 
         stk::mesh::EntityRank rank = stk::topology::ELEM_RANK;
         const stk::mesh::PartVector &blocks = part.subsets();
         if (blocks.size() > 0) {
           for (size_t j = 0; j < blocks.size(); j++) {
-            mesh::Part & side_block_part = *blocks[j];
-            mesh::Selector selector = side_block_part;
+            mesh::Part & sideBlockPart = *blocks[j];
+            mesh::Selector selector = sideBlockPart;
             if (params.get_subset_selector(    )) selector &= *params.get_subset_selector();
             if (params.get_output_selector(rank)) selector &= *params.get_output_selector(rank);
             define_side_block(params, selector,
-                              side_block_part, sset, spatial_dimension,
-                              create_nodesets);
+                              sideBlockPart, sset, spatialDimension,
+                              createNodesets);
           }
         } else {
           mesh::Selector selector = part;
           if (params.get_subset_selector(    )) selector &= *params.get_subset_selector();
           if (params.get_output_selector(rank)) selector &= *params.get_output_selector(rank);
           define_side_block(params, selector,
-                            part, sset, spatial_dimension,
-                            create_nodesets);
+                            part, sset, spatialDimension,
+                            createNodesets);
         }
       }
 
@@ -2353,7 +2358,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         stk::mesh::PartVector leafParts = get_unique_leaf_parts(meta, assemblyPart.name());
         for (stk::mesh::Part* leafPart : leafParts) {
           if (is_in_subsets_of_parts(*leafPart, leafParts)) {continue;}
-          if (is_valid_for_output(*leafPart, params.get_output_selector(leafPart->primary_entity_rank()))) {
+          if (is_valid_for_output(params, *leafPart)) {
             return true;
           }
         }
@@ -2366,15 +2371,65 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         if (!assembly_has_valid_io_leaf_part(params, part)) {
           return;
         }
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
 
         std::string name = getPartName(part);
-        Ioss::Assembly *assembly = io_region.get_assembly(name);
+        Ioss::Assembly *assembly = ioRegion.get_assembly(name);
         if (assembly == nullptr) {
-          assembly = new Ioss::Assembly(io_region.get_database(), name);
+          assembly = new Ioss::Assembly(ioRegion.get_database(), name);
           set_id_property(params, part, assembly);
-          io_region.add(assembly);
+          ioRegion.add(assembly);
+        }
+      }
+
+      bool is_valid_assembly_member_type(const Ioss::Assembly *assem, const Ioss::GroupingEntity* member)
+      {
+        if(nullptr == member) return false;
+
+        if((member->type() != Ioss::ELEMENTBLOCK) && (member->type() != Ioss::SIDESET) &&
+           (member->type() != Ioss::NODESET)      && (member->type() != Ioss::ASSEMBLY))   {
+          std::string filename = assem->get_database()->get_filename();
+          stk::RuntimeWarning() << "The entity type of '" << member->name() << "' (" << member->type_string() <<
+                                   ") is not a valid assembly member type for "
+                                   "assembly '" << assem->name() << "' (" << assem->contains_string() <<
+                                   ").\n\t In the database file '" << filename << "'.\n";
+          return false;
+        }
+
+        return true;
+      }
+
+      bool is_empty_element_block(stk::io::OutputParams &params, const stk::mesh::Part* leafPart)
+      {
+        bool isEmptyElementBlock = false;
+        const std::unordered_map<unsigned, size_t>& blockSizes = params.get_block_sizes();
+
+        if(leafPart != nullptr && is_part_element_block_io_part(*leafPart)) {
+          auto iter = blockSizes.find(leafPart->mesh_meta_data_ordinal());
+          ThrowRequireMsg(iter != blockSizes.end(), "Could not find element block in block size list: " << leafPart->name());
+          isEmptyElementBlock = (iter->second == 0);
+        }
+
+        return isEmptyElementBlock;
+      }
+
+      bool can_add_to_assembly(stk::io::OutputParams &params, const Ioss::Assembly *assembly,
+                               const Ioss::GroupingEntity* leafEntity, const stk::mesh::Part* leafPart)
+      {
+        bool isNotCurrentMember = (leafEntity != nullptr) && (assembly->get_member(leafEntity->name()) == nullptr);
+        bool isValidMemberType = is_valid_assembly_member_type(assembly, leafEntity);
+        bool isEmptyElementBlock = false;
+
+        bool filterEmptyBlocks = params.get_filter_empty_entity_blocks() ||
+                                 params.get_filter_empty_assembly_entity_blocks();
+
+        if(filterEmptyBlocks) {
+          isEmptyElementBlock = is_empty_element_block(params, leafPart);
         }
+
+        bool isValid = isNotCurrentMember && isValidMemberType && !isEmptyElementBlock;
+
+        return isValid;
       }
 
       void define_assembly_hierarchy(stk::io::OutputParams &params,
@@ -2384,11 +2439,11 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
           return;
         }
         const stk::mesh::MetaData & meta = mesh::MetaData::get(part);
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
 
         std::string name = getPartName(part);
 
-        Ioss::Assembly *assembly = io_region.get_assembly(name);
+        Ioss::Assembly *assembly = ioRegion.get_assembly(name);
         ThrowRequireMsg(assembly != nullptr, "Failed to find assembly "<<name);
 
         if (has_sub_assemblies(meta, part.name())) {
@@ -2397,8 +2452,11 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
             const stk::mesh::Part* subAssemblyPart = meta.get_part(subAssemblyName);
 
             std::string iossSubAssemblyName = getPartName(*subAssemblyPart);
-            const Ioss::Assembly* subAssembly = io_region.get_assembly(iossSubAssemblyName);
-            ThrowRequireMsg(subAssembly != nullptr, "Failed to find subAssembly "<<iossSubAssemblyName);
+            const Ioss::Assembly* subAssembly = ioRegion.get_assembly(iossSubAssemblyName);
+            if(subAssembly == nullptr) {
+              stk::RuntimeWarning() << "Failed to find subAssembly "<<iossSubAssemblyName;
+              continue;
+            }
             if(assembly->get_member(subAssembly->name())==nullptr) {
                 assembly->add(subAssembly);
             }
@@ -2409,19 +2467,20 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
           for(stk::mesh::Part* leafPart : leafParts) {
             if(is_in_subsets_of_parts(*leafPart, leafParts)) {continue;}
             std::string iossLeafPartName = getPartName(*leafPart);
-            const Ioss::GroupingEntity* leafEntity = io_region.get_entity(iossLeafPartName);
+            const Ioss::GroupingEntity* leafEntity = ioRegion.get_entity(iossLeafPartName);
             if (leafEntity == nullptr) {
               stk::RuntimeWarning() << "Failed to find ioss entity: '" << iossLeafPartName << "' in assembly: '" << name
                                     << "'";
             }
-            if ((leafEntity != nullptr) && assembly->get_member(leafEntity->name()) == nullptr) {
+            if (can_add_to_assembly(params, assembly, leafEntity, leafPart)) {
               assembly->add(leafEntity);
             }
           }
         }
 
         if (assembly->member_count() == 0) {
-          io_region.remove(assembly);
+          ioRegion.remove(assembly);
+          delete assembly;
         }
       }
 
@@ -2430,12 +2489,12 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       {
         mesh::MetaData & meta = mesh::MetaData::get(part);
         const stk::mesh::BulkData &bulk = params.bulk_data();
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
 
         stk::topology topo = part.topology();
         if (topo == stk::topology::INVALID_TOPOLOGY) {
           std::ostringstream msg ;
-          msg << " INTERNAL_ERROR when defining output for region '"<<io_region.name()<<"': Part " << part.name()
+          msg << " INTERNAL_ERROR when defining output for region '"<<ioRegion.name()<<"': Part " << part.name()
               << " returned INVALID from get_topology(). Please contact sierra-help@sandia.gov";
           throw std::runtime_error( msg.str() );
         }
@@ -2447,28 +2506,28 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         if (params.get_output_selector(rank)) selector &= *params.get_output_selector(rank);
 
         std::string topologyName = map_stk_topology_to_ioss(topo);
-        const size_t num_faces = stk::mesh::count_entities(bulk, rank, selector);
+        const size_t numFaces = stk::mesh::count_entities(bulk, rank, selector);
 
         // Defer the counting of attributes until after we define the
         // element block so we can count them as we add them as fields to
         // the element block
         std::string name = getPartName(part);
-        Ioss::FaceBlock *fb = io_region.get_face_block(name);
+        Ioss::FaceBlock *fb = ioRegion.get_face_block(name);
         if(fb == nullptr)
         {
-            fb = new Ioss::FaceBlock(io_region.get_database() ,
+            fb = new Ioss::FaceBlock(ioRegion.get_database() ,
                                      name,
                                      topologyName,
-                                     num_faces);
-            io_region.add(fb);
+                                     numFaces);
+            ioRegion.add(fb);
 
-            bool use_generic_canonical_name = io_region.get_database()->get_use_generic_canonical_name();
-            if(use_generic_canonical_name) {
+            bool useGenericCanonicalName = ioRegion.get_database()->get_use_generic_canonical_name();
+            if(useGenericCanonicalName) {
               add_canonical_name_property(fb, part);
             }
 
-            bool use_original_topology = has_original_topology_type(part);
-            if(use_original_topology) {
+            bool useOriginalTopology = has_original_topology_type(part);
+            if(useOriginalTopology) {
                 add_original_topology_property(fb, part);
             }
         }
@@ -2477,7 +2536,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
         delete_selector_property(fb);
         mesh::Selector *select = new mesh::Selector(selector);
-        fb->property_add(Ioss::Property(s_internal_selector_name, select));
+        fb->property_add(Ioss::Property(s_internalSelectorName, select));
         fb->property_add(Ioss::Property(base_stk_part_name, getPartName(part)));
 
         // Add the attribute fields.
@@ -2489,12 +2548,12 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       {
         mesh::MetaData & meta = mesh::MetaData::get(part);
         const stk::mesh::BulkData &bulk = params.bulk_data();
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
 
         stk::topology topo = part.topology();
         if (topo == stk::topology::INVALID_TOPOLOGY) {
           std::ostringstream msg ;
-          msg << " INTERNAL_ERROR when defining output for region '"<<io_region.name()<<"': Part " << part.name()
+          msg << " INTERNAL_ERROR when defining output for region '"<<ioRegion.name()<<"': Part " << part.name()
               << " returned INVALID from get_topology(). Please contact sierra-help@sandia.gov";
           throw std::runtime_error( msg.str() );
         }
@@ -2506,22 +2565,22 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         if (params.get_output_selector(rank)) selector &= *params.get_output_selector(rank);
 
         std::string topologyName = map_stk_topology_to_ioss(topo);
-        const size_t num_edges = stk::mesh::count_entities(bulk, rank, selector);
+        const size_t numEdges = stk::mesh::count_entities(bulk, rank, selector);
 
         // Defer the counting of attributes until after we define the
         // element block so we can count them as we add them as fields to
         // the element block
         std::string name = getPartName(part);
-        Ioss::EdgeBlock *eb = io_region.get_edge_block(name);
+        Ioss::EdgeBlock *eb = ioRegion.get_edge_block(name);
         if(eb == nullptr)
         {
-            eb = new Ioss::EdgeBlock(io_region.get_database() ,
+            eb = new Ioss::EdgeBlock(ioRegion.get_database() ,
                                      name,
                                      topologyName,
-                                     num_edges);
-            io_region.add(eb);
+                                     numEdges);
+            ioRegion.add(eb);
 
-            bool use_generic_canonical_name = io_region.get_database()->get_use_generic_canonical_name();
+            bool use_generic_canonical_name = ioRegion.get_database()->get_use_generic_canonical_name();
             if(use_generic_canonical_name) {
               add_canonical_name_property(eb, part);
             }
@@ -2536,7 +2595,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
         delete_selector_property(eb);
         mesh::Selector *select = new mesh::Selector(selector);
-        eb->property_add(Ioss::Property(s_internal_selector_name, select));
+        eb->property_add(Ioss::Property(s_internalSelectorName, select));
         eb->property_add(Ioss::Property(base_stk_part_name, getPartName(part)));
 
         // Add the attribute fields.
@@ -2546,24 +2605,24 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       void define_element_block(stk::io::OutputParams &params,
                                 stk::mesh::Part &part,
                                 const std::vector<std::vector<int>> &attributeOrdering,
-                                bool order_blocks_by_creation_order)
+                                bool orderBlocksByCreationOrder)
       {
         mesh::MetaData & meta = mesh::MetaData::get(part);
         const stk::mesh::BulkData &bulk = params.bulk_data();
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
 
         stk::mesh::EntityRank rank = get_output_rank(params);
 
         mesh::Selector selector = impl::internal_build_selector(params.get_subset_selector(),
-                                                          params.get_output_selector(rank),
-                                                          nullptr, part, false);
+                                                                params.get_output_selector(rank),
+                                                                nullptr, part, false);
 
-        const size_t num_elems = stk::mesh::count_entities(bulk, rank, selector);
+        const size_t numElems = stk::mesh::count_entities(bulk, rank, selector);
 
         stk::topology topo = part.topology();
         if (topo == stk::topology::INVALID_TOPOLOGY) {
           std::ostringstream msg ;
-          msg << " INTERNAL_ERROR when defining output for region '"<<io_region.name()<<"': Part " << part.name()
+          msg << " INTERNAL_ERROR when defining output for region '"<<ioRegion.name()<<"': Part " << part.name()
               << " returned INVALID from get_topology(). Please contact sierra-help@sandia.gov";
           std::cerr << msg.str()<<std::endl;
         }
@@ -2585,27 +2644,27 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         // element block so we can count them as we add them as fields to
         // the element block
         std::string name = getPartName(part);
-        Ioss::ElementBlock *eb = io_region.get_element_block(name);
+        Ioss::ElementBlock *eb = ioRegion.get_element_block(name);
         if(eb == nullptr)
         {
-            eb = new Ioss::ElementBlock(io_region.get_database() ,
+            eb = new Ioss::ElementBlock(ioRegion.get_database() ,
                                         name,
                                         topologyName,
-                                        num_elems);
-            io_region.add(eb);
+                                        numElems);
+            ioRegion.add(eb);
 
-            bool use_generic_canonical_name = io_region.get_database()->get_use_generic_canonical_name();
-            if(use_generic_canonical_name) {
+            bool useGenericCanonicalName = ioRegion.get_database()->get_use_generic_canonical_name();
+            if(useGenericCanonicalName) {
               add_canonical_name_property(eb, part);
             }
 
-            bool use_original_topology = has_original_topology_type(part);
-            if(use_original_topology && !params.has_skin_mesh_selector()) {
+            bool useOriginalTopology = has_original_topology_type(part);
+            if(useOriginalTopology && !params.has_skin_mesh_selector()) {
                 add_original_topology_property(eb, part);
             }
         }
 
-        if (order_blocks_by_creation_order)
+        if (orderBlocksByCreationOrder)
         {
             int ordinal = part.mesh_meta_data_ordinal();
             eb->property_update("original_block_order", ordinal);
@@ -2615,7 +2674,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
         delete_selector_property(eb);
         mesh::Selector *select = new mesh::Selector(selector);
-        eb->property_add(Ioss::Property(s_internal_selector_name, select));
+        eb->property_add(Ioss::Property(s_internalSelectorName, select));
         eb->property_add(Ioss::Property(base_stk_part_name, getPartName(part)));
 
         // Add the attribute fields.
@@ -2629,27 +2688,27 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         // and output the fields on that nodeset...
         if (params.get_use_nodeset_for_block_node_fields() &&
             will_output_lower_rank_fields(part, stk::topology::NODE_RANK)) {
-          std::string nodes_name = getPartName(part) + s_entity_nodes_suffix;
+          std::string nodesName = getPartName(part) + s_entityNodesSuffix;
           bool isDerivedNodeset = true;
-          define_node_set(params, part, nodes_name, isDerivedNodeset);
+          define_node_set(params, part, nodesName, isDerivedNodeset);
         }
       }
 
       void define_communication_maps(stk::io::OutputParams &params)
       {
         const mesh::BulkData & bulk = params.bulk_data();
-        Ioss::Region & io_region = params.io_region();
+        Ioss::Region & ioRegion = params.io_region();
         mesh::EntityRank rank = get_output_rank(params);
-        const stk::mesh::Selector *subset_selector = params.get_subset_selector();
-        const stk::mesh::Selector *output_selector = params.get_output_selector(rank);
+        const stk::mesh::Selector *subsetSelector = params.get_subset_selector();
+        const stk::mesh::Selector *outputSelector = params.get_output_selector(rank);
 
         if (bulk.parallel_size() > 1) {
           const stk::mesh::MetaData & meta = bulk.mesh_meta_data();
-          const std::string cs_name("node_symm_comm_spec");
+          const std::string csName("node_symm_comm_spec");
 
           mesh::Selector selector = meta.globally_shared_part();
-          if (subset_selector) selector &= *subset_selector;
-          if (output_selector) selector &= *output_selector;
+          if (subsetSelector) selector &= *subsetSelector;
+          if (outputSelector) selector &= *outputSelector;
 
           std::vector<mesh::Entity> entities;
           get_selected_nodes(params, selector, entities);
@@ -2661,31 +2720,30 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
             size+=sharingProcs.size();
           }
 
-          Ioss::DatabaseIO *dbo = io_region.get_database();
-          Ioss::CommSet *io_cs = new Ioss::CommSet(dbo, cs_name, "node", size);
-          io_region.add(io_cs);
+          Ioss::DatabaseIO *dbo = ioRegion.get_database();
+          Ioss::CommSet *ioCs = new Ioss::CommSet(dbo, csName, "node", size);
+          ioRegion.add(ioCs);
 
-          delete_selector_property(io_cs);
+          delete_selector_property(ioCs);
           mesh::Selector *select = new mesh::Selector(selector);
-          io_cs->property_add(Ioss::Property(s_internal_selector_name, select));
+          ioCs->property_add(Ioss::Property(s_internalSelectorName, select));
 
           // Update global node and element count...
-          if (!io_region.property_exists("global_node_count") || !io_region.property_exists("global_element_count")) {
+          if (!ioRegion.property_exists("global_node_count") || !ioRegion.property_exists("global_element_count")) {
             std::vector<size_t> entityCounts;
             stk::mesh::comm_mesh_counts(bulk, entityCounts);
 
-            io_region.property_add(Ioss::Property("global_node_count",    static_cast<int64_t>(entityCounts[stk::topology::NODE_RANK])));
-            io_region.property_add(Ioss::Property("global_element_count", static_cast<int64_t>(entityCounts[stk::topology::ELEMENT_RANK])));
+            ioRegion.property_add(Ioss::Property("global_node_count",    static_cast<int64_t>(entityCounts[stk::topology::NODE_RANK])));
+            ioRegion.property_add(Ioss::Property("global_element_count", static_cast<int64_t>(entityCounts[stk::topology::ELEMENT_RANK])));
           }
         }
       }
 
-      void define_side_set(stk::io::OutputParams &params,
-                           stk::mesh::Part &part)
+      void define_side_set(stk::io::OutputParams &params, stk::mesh::Part &part)
       {
-        const stk::mesh::EntityRank si_rank = mesh::MetaData::get(part).side_rank();
+        const stk::mesh::EntityRank sideRank = mesh::MetaData::get(part).side_rank();
 
-        bool create_sideset = ! params.has_skin_mesh_selector();
+        bool createSideset = ! params.has_skin_mesh_selector();
         if (part.subsets().empty()) {
           // Only define a sideset for this part if its superset part is
           // not a side-containing part..  (i.e., this part is not a subset part
@@ -2693,23 +2751,23 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
           const stk::mesh::PartVector &supersets = part.supersets();
           for (size_t i=0; i < supersets.size(); i++) {
             if (is_part_surface_io_part(*supersets[i])) {
-              create_sideset = false;
+              createSideset = false;
               break;
             }
           }
         }
 
-        if (create_sideset) {
+        if (createSideset) {
           std::string name = getPartName(part);
-          Ioss::Region & io_region = params.io_region();
-          Ioss::SideSet *ss = io_region.get_sideset(name);
+          Ioss::Region & ioRegion = params.io_region();
+          Ioss::SideSet *ss = ioRegion.get_sideset(name);
           if(ss == nullptr)
           {
-              ss = new Ioss::SideSet(io_region.get_database(), name);
-              io_region.add(ss);
+              ss = new Ioss::SideSet(ioRegion.get_database(), name);
+              ioRegion.add(ss);
 
-              bool use_generic_canonical_name = io_region.get_database()->get_use_generic_canonical_name();
-              if(use_generic_canonical_name) {
+              bool useGenericCanonicalName = ioRegion.get_database()->get_use_generic_canonical_name();
+              if(useGenericCanonicalName) {
                 add_canonical_name_property(ss, part);
               }
           }
@@ -2721,14 +2779,14 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
               ss->property_add(Ioss::Property("id", part.id()));
           }
 
-          int spatial_dim = io_region.get_property("spatial_dimension").get_int();
-          define_side_blocks(params, part, ss, si_rank, spatial_dim);
+          int spatialDim = ioRegion.get_property("spatial_dimension").get_int();
+          define_side_blocks(params, part, ss, sideRank, spatialDim);
         }
       }
 
     } // namespace <blank>
 
-    void set_element_block_order(const mesh::PartVector *parts, Ioss::Region & io_region)
+    void set_element_block_order(const mesh::PartVector *parts, Ioss::Region & ioRegion)
     {
         int64_t offset=0;
 
@@ -2738,9 +2796,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
             if (is_part_io_part(*part) && (part->primary_entity_rank() == stk::topology::ELEMENT_RANK)) {
                 if(has_original_block_order(*part)) {
                     int64_t order = get_original_block_order(*part);
-                    Ioss::GroupingEntity *element_block = io_region.get_entity(getPartName(*part));
-                    if (element_block) {
-                        element_block->property_update("original_block_order", order);
+                    Ioss::GroupingEntity *elementBlock = ioRegion.get_entity(getPartName(*part));
+                    if (elementBlock) {
+                        elementBlock->property_update("original_block_order", order);
                         offset = std::max(offset, order);
                     }
                 }
@@ -2753,10 +2811,10 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
             mesh::Part * const part = *i ;
 
             if (is_part_io_part(*part) && (part->primary_entity_rank() == stk::topology::ELEMENT_RANK)) {
-                Ioss::GroupingEntity *element_block = io_region.get_entity(getPartName(*part));
-                if (element_block) {
-                    if (!element_block->property_exists("original_block_order")) {
-                        element_block->property_add(Ioss::Property("original_block_order", offset));
+                Ioss::GroupingEntity *elementBlock = ioRegion.get_entity(getPartName(*part));
+                if (elementBlock) {
+                    if (!elementBlock->property_exists("original_block_order")) {
+                        elementBlock->property_add(Ioss::Property("original_block_order", offset));
                         ++offset;
                     }
                 }
@@ -2819,37 +2877,37 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
     void define_output_db_within_state_define(stk::io::OutputParams &params,
                                               const std::vector<std::vector<int>> &attributeOrdering,
-                                              const Ioss::Region *input_region = nullptr)
+                                              const Ioss::Region *inputRegion = nullptr)
     {
-       Ioss::Region & io_region = params.io_region();
-       const mesh::BulkData &bulk_data = params.bulk_data();
-       const bool sort_stk_parts_by_name = params.get_sort_stk_parts_by_name();
+       Ioss::Region & ioRegion = params.io_region();
+       const mesh::BulkData &bulkData = params.bulk_data();
+       const bool sortStkPartsByName = params.get_sort_stk_parts_by_name();
 
-       const mesh::MetaData & meta_data = bulk_data.mesh_meta_data();
-       define_node_block(params, meta_data.universal_part());
+       const mesh::MetaData & metaData = bulkData.mesh_meta_data();
+       define_node_block(params, metaData.universal_part());
 
        // All parts of the meta data:
        const mesh::PartVector *parts = nullptr;
-       mesh::PartVector all_parts_sorted;
+       mesh::PartVector allPartsSorted;
 
-       const mesh::PartVector & all_parts = meta_data.get_parts();
+       const mesh::PartVector & allParts = metaData.get_parts();
        // sort parts so they go out the same on all processors (srk: this was induced by streaming refine)
-       if (sort_stk_parts_by_name) {
-         all_parts_sorted = all_parts;
-         std::sort(all_parts_sorted.begin(), all_parts_sorted.end(), part_compare_by_name());
-         parts = &all_parts_sorted;
+       if (sortStkPartsByName) {
+         allPartsSorted = allParts;
+         std::sort(allPartsSorted.begin(), allPartsSorted.end(), part_compare_by_name());
+         parts = &allPartsSorted;
        } else {
-         parts = &all_parts;
+         parts = &allParts;
        }
 
-       const bool order_blocks_by_creation_order = (input_region == nullptr) && !sort_stk_parts_by_name;
-       const int spatialDim = meta_data.spatial_dimension();
+       const bool orderBlocksByCreationOrder = (inputRegion == nullptr) && !sortStkPartsByName;
+       const int spatialDim = metaData.spatial_dimension();
 
        for (stk::mesh::Part* const part : *parts) {
          const stk::mesh::EntityRank rank = part->primary_entity_rank();
 
          if (is_part_io_part(*part)) {
-           bool isValidForOutput = is_valid_for_output(*part, params.get_output_selector(rank));
+           bool isValidForOutput = is_valid_for_output(params, *part);
 
            if (is_part_assembly_io_part(*part)) {
              define_assembly(params, *part);
@@ -2861,7 +2919,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
              define_node_set(params, *part, getPartName(*part));
            }
            else if ((rank == stk::topology::ELEMENT_RANK) && isValidForOutput) {
-             define_element_block(params, *part, attributeOrdering, order_blocks_by_creation_order);
+             define_element_block(params, *part, attributeOrdering, orderBlocksByCreationOrder);
            }
            else if (is_part_face_block_io_part(*part)) {
              define_face_block(params, *part);
@@ -2884,18 +2942,18 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
        define_communication_maps(params);
 
-       if (input_region != nullptr)
-         io_region.synchronize_id_and_name(input_region, true);
+       if (inputRegion != nullptr)
+         ioRegion.synchronize_id_and_name(inputRegion, true);
 
-       set_element_block_order(parts, io_region);
+       set_element_block_order(parts, ioRegion);
     }
 
     void define_output_db(stk::io::OutputParams &params,
                           const std::vector<std::vector<int>> &attributeOrdering,
-                          const Ioss::Region *input_region)
+                          const Ioss::Region *inputRegion)
     {
       params.io_region().begin_mode( Ioss::STATE_DEFINE_MODEL );
-      define_output_db_within_state_define(params, attributeOrdering, input_region);
+      define_output_db_within_state_define(params, attributeOrdering, inputRegion);
       params.io_region().end_mode( Ioss::STATE_DEFINE_MODEL );
     }
 
@@ -2906,35 +2964,35 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       void write_side_data_to_ioss( stk::io::OutputParams &params,
                                     Ioss::GroupingEntity & io ,
                                     mesh::Part * const part ,
-                                    const Ioss::ElementTopology *element_topology)
+                                    const Ioss::ElementTopology *elementTopology)
       {
-        std::vector<INT> elem_side_ids;
+        std::vector<INT> elemSideIds;
         stk::mesh::EntityVector sides;
 
-        fill_data_for_side_block(params, io, part, element_topology, elem_side_ids, sides);
-        size_t num_sides = sides.size();
+        fill_data_for_side_block(params, io, part, elementTopology, elemSideIds, sides);
+        size_t numSides = sides.size();
 
-        const size_t num_side_written = io.put_field_data("element_side",elem_side_ids);
+        const size_t numSideWritten = io.put_field_data("element_side",elemSideIds);
 
-        if ( num_sides != num_side_written ) {
+        if ( numSides != numSideWritten ) {
           std::ostringstream msg ;
 
           msg << "stk::io::write_side_data_to_ioss FAILED for " ;
           msg << io.name();
           msg << " in Ioss::GroupingEntity::put_field_data:" ;
-          msg << " num_sides = " << num_sides ;
-          msg << " , num_side_written = " << num_side_written ;
+          msg << " numSides = " << numSides ;
+          msg << " , num_side_written = " << numSideWritten ;
           throw std::runtime_error( msg.str() );
         }
 
         const mesh::FieldBase *df = get_distribution_factor_field(*part);
         if (df != nullptr) {
-          field_data_to_ioss(params.bulk_data(), df, sides, &io, s_distribution_factors, Ioss::Field::MESH);
+          field_data_to_ioss(params.bulk_data(), df, sides, &io, s_distributionFactors, Ioss::Field::MESH);
         }
 
-        const mesh::MetaData & meta_data = mesh::MetaData::get(*part);
+        const mesh::MetaData & metaData = mesh::MetaData::get(*part);
 
-        const std::vector<mesh::FieldBase *> &fields = meta_data.get_fields();
+        const std::vector<mesh::FieldBase *> &fields = metaData.get_fields();
         std::vector<mesh::FieldBase *>::const_iterator I = fields.begin();
         while (I != fields.end()) {
           const mesh::FieldBase *f = *I ; ++I ;
@@ -2962,38 +3020,40 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         stk::mesh::EntityRank rank = get_output_rank(params);
 
         std::vector<mesh::Entity> nodes;
-        size_t num_nodes = get_entities_for_nodeblock(params, part, rank,
+        size_t numNodes = get_entities_for_nodeblock(params, part, rank,
                                                       nodes, true);
 
-        std::vector<INT> node_ids; node_ids.reserve(num_nodes);
-        for(size_t i=0; i<num_nodes; ++i) {
+        std::vector<INT> nodeIds;
+        nodeIds.reserve(numNodes);
+        for(size_t i=0; i<numNodes; ++i) {
           const mesh::Entity node = nodes[i] ;
-          node_ids.push_back(bulk.identifier(node));
+          nodeIds.push_back(bulk.identifier(node));
         }
 
-        size_t num_ids_written = nb.put_field_data("ids", node_ids);
-        if ( num_nodes != num_ids_written) {
+        size_t numIdsWritten = nb.put_field_data("ids", nodeIds);
+        if ( numNodes != numIdsWritten) {
           std::ostringstream msg ;
           msg << " FAILED in Ioss::NodeBlock::put_field_data:" ;
-          msg << " num_nodes = " << num_nodes ;
-          msg << " , num_ids_written = " << num_ids_written ;
+          msg << " numNodes = " << numNodes ;
+          msg << " , num_ids_written = " << numIdsWritten ;
           throw std::runtime_error( msg.str() );
         }
 
         if (nb.get_database()->needs_shared_node_information()) {
-          std::vector<int> owning_processor; owning_processor.reserve(num_nodes);
-          for(size_t i=0; i<num_nodes; ++i) {
-            owning_processor.push_back(bulk.parallel_owner_rank(nodes[i]));
+          std::vector<int> owningProcessor;
+          owningProcessor.reserve(numNodes);
+          for(size_t i=0; i<numNodes; ++i) {
+            owningProcessor.push_back(bulk.parallel_owner_rank(nodes[i]));
           }
-          nb.put_field_data("owning_processor", owning_processor);
+          nb.put_field_data("owning_processor", owningProcessor);
         }
 
-        const stk::mesh::MetaData & meta_data = bulk.mesh_meta_data();
-        const mesh::FieldBase *coord_field = meta_data.coordinate_field();
-        assert(coord_field != nullptr);
-        field_data_to_ioss(bulk, coord_field, nodes, &nb, "mesh_model_coordinates", Ioss::Field::MESH);
+        const stk::mesh::MetaData & metaData = bulk.mesh_meta_data();
+        const mesh::FieldBase *coordField = metaData.coordinate_field();
+        assert(coordField != nullptr);
+        field_data_to_ioss(bulk, coordField, nodes, &nb, "mesh_model_coordinates", Ioss::Field::MESH);
 
-        const std::vector<mesh::FieldBase *> &fields = meta_data.get_fields();
+        const std::vector<mesh::FieldBase *> &fields = metaData.get_fields();
         std::vector<mesh::FieldBase *>::const_iterator I = fields.begin();
         while (I != fields.end()) {
           const mesh::FieldBase *f = *I ; ++I ;
@@ -3005,41 +3065,41 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       }
 
       std::pair<stk::mesh::Entity, unsigned>
-      get_parent_element(stk::io::OutputParams &params, stk::mesh::Entity obj, const stk::mesh::Part* parent_block = nullptr)
+      get_parent_element(stk::io::OutputParams &params, stk::mesh::Entity obj, const stk::mesh::Part* parentBlock = nullptr)
       {
         std::pair<stk::mesh::Entity, unsigned> parent(stk::mesh::Entity(), 0U);
 
         const stk::mesh::BulkData& stkmesh = params.bulk_data();
-        const stk::topology obj_topology = stkmesh.bucket(obj).topology();
+        const stk::topology objTopology = stkmesh.bucket(obj).topology();
         const stk::mesh::Entity* elems = stkmesh.begin_elements(obj);
-        const stk::mesh::ConnectivityOrdinal* elem_ordinals = stkmesh.begin_element_ordinals(obj);
-        const stk::mesh::Permutation* elem_permutations = stkmesh.begin_element_permutations(obj);
+        const stk::mesh::ConnectivityOrdinal* elemOrdinals = stkmesh.begin_element_ordinals(obj);
+        const stk::mesh::Permutation* elemPermutations = stkmesh.begin_element_permutations(obj);
 
         const stk::mesh::Selector* subsetSelector = params.get_subset_selector();
         bool activeOnly = subsetSelector != nullptr;
 
         for(unsigned ielem = 0, e = stkmesh.num_elements(obj); ielem < e; ++ielem) {
           stk::mesh::Entity elem = elems[ielem];
-          unsigned elem_side_ordinal = elem_ordinals[ielem];
+          unsigned elemSideOrdinal = elemOrdinals[ielem];
 
           stk::mesh::Bucket &elemBucket = stkmesh.bucket(elem);
 
           if(stkmesh.bucket(elem).owned() && (!activeOnly || (activeOnly && (*subsetSelector)(elemBucket)))) {
-            if((parent_block == nullptr && obj_topology.is_positive_polarity(elem_permutations[ielem])) ||
-               (parent_block != nullptr && contain(stkmesh, elem, parent_block))) {
+            if((parentBlock == nullptr && objTopology.is_positive_polarity(elemPermutations[ielem])) ||
+               (parentBlock != nullptr && contain(stkmesh, elem, parentBlock))) {
               if(params.has_output_selector(stk::topology::ELEMENT_RANK) && !params.get_is_restart()) {
                 // See if elem is a member of any of the includedMeshBlocks.
                 const stk::mesh::Selector* outputSelector = params.get_output_selector(stk::topology::ELEMENT_RANK);
                 if((*outputSelector)(elemBucket)) {
                   parent.first = elem;
-                  parent.second = elem_side_ordinal;
+                  parent.second = elemSideOrdinal;
                   return parent;
                 }
                 return parent;
               }
               else {
                 parent.first = elem;
-                parent.second = elem_side_ordinal;
+                parent.second = elemSideOrdinal;
               }
               return parent;
             }
@@ -3053,8 +3113,8 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                                          const std::vector<mesh::Entity>& meshObjects)
       {
         const stk::mesh::BulkData& stkmesh = params.bulk_data();
-        bool skin_mesh = params.has_skin_mesh_selector();
-        if(!skin_mesh) return; // This map only supported for skinning the mesh.
+        bool skinMesh = params.has_skin_mesh_selector();
+        if(!skinMesh) return; // This map only supported for skinning the mesh.
 
         size_t entitySize = block->get_property("entity_count").get_int();
         if(!block->field_exists("skin")) {
@@ -3062,36 +3122,36 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         }
 
         size_t count = block->get_field("skin").raw_count();
-        int map_size = block->get_field("skin").get_size();
-        std::vector<INT> elem_face(map_size);
+        int mapSize = block->get_field("skin").get_size();
+        std::vector<INT> elemFace(mapSize);
 
         if(count > 0) {
           // global element id + local face of that element.
 
           size_t i = 0;
-          size_t face_count = meshObjects.size();
-          assert(face_count == count);
-          for(size_t j = 0; j < face_count; j++) {
+          size_t faceCount = meshObjects.size();
+          assert(faceCount == count);
+          for(size_t j = 0; j < faceCount; j++) {
             stk::mesh::Entity face = meshObjects[j];
-            std::pair<stk::mesh::Entity, unsigned> elem_face_pair = get_parent_element(params, face);
-            if(stkmesh.is_valid(elem_face_pair.first)) {
-              elem_face[i++] = stkmesh.identifier(elem_face_pair.first);
-              elem_face[i++] = elem_face_pair.second + 1;
+            std::pair<stk::mesh::Entity, unsigned> elemFacePair = get_parent_element(params, face);
+            if(stkmesh.is_valid(elemFacePair.first)) {
+              elemFace[i++] = stkmesh.identifier(elemFacePair.first);
+              elemFace[i++] = elemFacePair.second + 1;
             }
           }
 
           assert(i == 2 * count);
         }
-        block->put_field_data("skin", elem_face.data(), map_size);
+        block->put_field_data("skin", elemFace.data(), mapSize);
       }
 
       template <typename INT>
       void output_element_block(stk::io::OutputParams &params, Ioss::ElementBlock *block)
       {
         const stk::mesh::BulkData &bulk = params.bulk_data();
-        const stk::mesh::MetaData & meta_data = bulk.mesh_meta_data();
+        const stk::mesh::MetaData & metaData = bulk.mesh_meta_data();
         const std::string& name = block->name();
-        mesh::Part* part = getPart( meta_data, name);
+        mesh::Part* part = getPart( metaData, name);
         assert(part != nullptr);
 
         stk::topology topo = part->topology();
@@ -3102,52 +3162,52 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         std::vector<mesh::Entity> elements;
         stk::mesh::EntityRank type = part_primary_entity_rank(*part);
         if (params.has_skin_mesh_selector()) {
-          type = meta_data.side_rank();
+          type = metaData.side_rank();
         }
-        size_t num_elems = get_entities(params, *part, type, elements, false);
+        size_t numElems = get_entities(params, *part, type, elements, false);
 
-        if (num_elems >  0 && topo == stk::topology::INVALID_TOPOLOGY) {
+        if (numElems >  0 && topo == stk::topology::INVALID_TOPOLOGY) {
           std::ostringstream msg ;
           msg << " INTERNAL_ERROR: Part " << part->name() << " returned INVALID from get_topology()";
           throw std::runtime_error( msg.str() );
         }
 
-        size_t nodes_per_elem = block->get_property("topology_node_count").get_int();
+        size_t nodesPerElem = block->get_property("topology_node_count").get_int();
 
-        std::vector<INT> elem_ids; elem_ids.reserve(num_elems == 0 ? 1 : num_elems);
-        std::vector<INT> connectivity; connectivity.reserve( (num_elems*nodes_per_elem) == 0 ? 1 : (num_elems*nodes_per_elem));
+        std::vector<INT> elemIds;
+        elemIds.reserve(numElems == 0 ? 1 : numElems);
+        std::vector<INT> connectivity;
+        connectivity.reserve( (numElems*nodesPerElem) == 0 ? 1 : (numElems*nodesPerElem));
 
-        for (size_t i = 0; i < num_elems; ++i) {
+        for (size_t i = 0; i < numElems; ++i) {
+          elemIds.push_back(bulk.identifier(elements[i]));
+          stk::mesh::Entity const * elemNodes = bulk.begin_nodes(elements[i]);
 
-          elem_ids.push_back(bulk.identifier(elements[i]));
-
-          stk::mesh::Entity const * elem_nodes = bulk.begin_nodes(elements[i]);
-
-          for (size_t j = 0; j < nodes_per_elem; ++j) {
-            connectivity.push_back(bulk.identifier(elem_nodes[j]));
+          for (size_t j = 0; j < nodesPerElem; ++j) {
+            connectivity.push_back(bulk.identifier(elemNodes[j]));
           }
         }
 
-        const size_t num_ids_written = block->put_field_data("ids", elem_ids);
-        const size_t num_con_written = block->put_field_data("connectivity", connectivity);
+        const size_t numIdsWritten = block->put_field_data("ids", elemIds);
+        const size_t numConWritten = block->put_field_data("connectivity", connectivity);
 
-        if ( num_elems != num_ids_written || num_elems != num_con_written ) {
+        if ( numElems != numIdsWritten || numElems != numConWritten ) {
           std::ostringstream msg ;
           msg << " FAILED in Ioss::ElementBlock::put_field_data:" << std::endl ;
-          msg << "  num_elems = " << num_elems << std::endl ;
-          msg << "  num_ids_written = " << num_ids_written << std::endl ;
-          msg << "  num_connectivity_written = " << num_con_written << std::endl ;
+          msg << "  numElems = " << numElems << std::endl ;
+          msg << "  numIdsWritten = " << numIdsWritten << std::endl ;
+          msg << "  num_connectivity_written = " << numConWritten << std::endl ;
           throw std::runtime_error( msg.str() );
         }
 
-        stk::mesh::EntityRank elem_rank = stk::topology::ELEMENT_RANK;
-        const std::vector<mesh::FieldBase *> &fields = meta_data.get_fields();
+        stk::mesh::EntityRank elemRank = stk::topology::ELEMENT_RANK;
+        const std::vector<mesh::FieldBase *> &fields = metaData.get_fields();
         std::vector<mesh::FieldBase *>::const_iterator I = fields.begin();
         while (I != fields.end()) {
           const mesh::FieldBase *f = *I ; ++I ;
           const Ioss::Field::RoleType *role = stk::io::get_field_role(*f);
           if (role != nullptr && *role == Ioss::Field::ATTRIBUTE) {
-            const mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*f, elem_rank, *part);
+            const mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*f, elemRank, *part);
             if (res.num_scalars_per_entity() > 0) {
               stk::io::field_data_to_ioss(bulk, f, elements, block, f->name(), Ioss::Field::ATTRIBUTE);
             }
@@ -3167,19 +3227,19 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       {
           const stk::mesh::MetaData & metaData = bulk.mesh_meta_data();
           const std::string& name = ns->name();
-          const std::string dfName = s_distribution_factors + "_" + name;
-          stk::mesh::Field<double>* df_field = metaData.get_field<double>(stk::topology::NODE_RANK, dfName);
+          const std::string dfName = s_distributionFactors + "_" + name;
+          stk::mesh::Field<double>* dfField = metaData.get_field<double>(stk::topology::NODE_RANK, dfName);
 
-          if(df_field != nullptr) {
-              const stk::mesh::FieldBase::Restriction& res = stk::mesh::find_restriction(*df_field, stk::topology::NODE_RANK, *part);
+          if(dfField != nullptr) {
+              const stk::mesh::FieldBase::Restriction& res = stk::mesh::find_restriction(*dfField, stk::topology::NODE_RANK, *part);
               if(res.num_scalars_per_entity() > 0) {
-                  stk::io::field_data_to_ioss(bulk, df_field, nodes, ns, s_distribution_factors, Ioss::Field::MESH);
+                  stk::io::field_data_to_ioss(bulk, dfField, nodes, ns, s_distributionFactors, Ioss::Field::MESH);
               }
           } else {
-              assert(ns->field_exists(s_distribution_factors));
-              size_t df_size = ns->get_field(s_distribution_factors).raw_count();
+              assert(ns->field_exists(s_distributionFactors));
+              size_t dfSize = ns->get_field(s_distributionFactors).raw_count();
               std::vector<double> df;
-              df.reserve(df_size);
+              df.reserve(dfSize);
               const auto* const nodeFactorVar = get_distribution_factor_field(*part);
               if((nodeFactorVar != nullptr) && (nodeFactorVar->entity_rank() == stk::topology::NODE_RANK)) {
                   nodeFactorVar->sync_to_host();
@@ -3192,7 +3252,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                       df.push_back(1.0);
                   }
               }
-              ns->put_field_data(s_distribution_factors, df);
+              ns->put_field_data(s_distributionFactors, df);
           }
       }
 
@@ -3200,9 +3260,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       void output_node_set(stk::io::OutputParams &params, Ioss::NodeSet *ns)
       {
         const stk::mesh::BulkData &bulk = params.bulk_data();
-        const stk::mesh::MetaData & meta_data = bulk.mesh_meta_data();
+        const stk::mesh::MetaData & metaData = bulk.mesh_meta_data();
         const std::string& name = ns->name();
-        mesh::Part* part = getPart( meta_data, name);
+        mesh::Part* part = getPart( metaData, name);
 
         // If part is null, then it is possible that this nodeset is a "viz nodeset" which
         // means that it is a nodeset containing the nodes of an element block.
@@ -3210,8 +3270,8 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         // that name.
         if (part == nullptr) {
           if (ns->property_exists(base_stk_part_name)) {
-            std::string base_name = ns->get_property(base_stk_part_name).get_string();
-            part = getPart( meta_data, base_name);
+            std::string baseName = ns->get_property(base_stk_part_name).get_string();
+            part = getPart( metaData, baseName);
           }
           if (part == nullptr) {
             std::ostringstream msg ;
@@ -3224,26 +3284,27 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
         std::vector<stk::mesh::Entity> nodes;
         mesh::EntityRank rank = get_output_rank(params);
-        size_t num_nodes = get_entities_for_nodeblock(params, *part, rank, nodes, true);
+        size_t numNodes = get_entities_for_nodeblock(params, *part, rank, nodes, true);
 
-        std::vector<INT> node_ids; node_ids.reserve(num_nodes);
-        for(size_t i=0; i<num_nodes; ++i) {
+        std::vector<INT> node_ids;
+        node_ids.reserve(numNodes);
+        for(size_t i=0; i<numNodes; ++i) {
           const stk::mesh::Entity node = nodes[i] ;
           node_ids.push_back(bulk.identifier(node));
         }
 
-        size_t num_ids_written = ns->put_field_data("ids", node_ids);
-        if ( num_nodes != num_ids_written ) {
+        size_t numIdsWritten = ns->put_field_data("ids", node_ids);
+        if ( numNodes != numIdsWritten ) {
           std::ostringstream msg ;
           msg << " FAILED in Ioss::NodeSet::output_node_set:"
-              << " num_nodes = " << num_nodes
-              << ", num_ids_written = " << num_ids_written;
+              << " numNodes = " << numNodes
+              << ", numIdsWritten = " << numIdsWritten;
           throw std::runtime_error( msg.str() );
         }
 
         output_nodeset_distribution_factor<INT>(bulk, ns, part, nodes);
 
-        const std::vector<mesh::FieldBase *> &fields = meta_data.get_fields();
+        const std::vector<mesh::FieldBase *> &fields = metaData.get_fields();
         std::vector<mesh::FieldBase *>::const_iterator I = fields.begin();
         while (I != fields.end()) {
           const mesh::FieldBase *f = *I ; ++I ;
@@ -3260,28 +3321,28 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       template <typename INT>
       void output_communication_maps(stk::io::OutputParams &params)
       {
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
         const stk::mesh::BulkData &bulk = params.bulk_data();
         mesh::EntityRank rank = get_output_rank(params);
-        const stk::mesh::Selector *subset_selector = params.get_subset_selector();
-        const stk::mesh::Selector *output_selector = params.get_output_selector(rank);
+        const stk::mesh::Selector *subsetSelector = params.get_subset_selector();
+        const stk::mesh::Selector *outputSelector = params.get_output_selector(rank);
 
         if (bulk.parallel_size() > 1) {
           const stk::mesh::MetaData & meta = bulk.mesh_meta_data();
           mesh::Selector selector = meta.globally_shared_part();
-          if (subset_selector) selector &= *subset_selector;
-          if (output_selector) selector &= *output_selector;
+          if (subsetSelector) selector &= *subsetSelector;
+          if (outputSelector) selector &= *outputSelector;
 
           std::vector<mesh::Entity> entities;
           get_selected_nodes(params, selector, entities);
 
-          const std::string cs_name("node_symm_comm_spec");
-          Ioss::CommSet * io_cs = io_region.get_commset(cs_name);
-          STKIORequire(io_cs != nullptr);
+          const std::string csName("node_symm_comm_spec");
+          Ioss::CommSet * ioCs = ioRegion.get_commset(csName);
+          STKIORequire(ioCs != nullptr);
 
           // Allocate data space to store <id, processor> pair
-          assert(io_cs->field_exists("entity_processor"));
-          size_t size = io_cs->get_field("entity_processor").raw_count();
+          assert(ioCs->field_exists("entity_processor"));
+          size_t size = ioCs->get_field("entity_processor").raw_count();
 
           std::vector<INT> ep;
           ep.reserve(size*2);
@@ -3295,7 +3356,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
             }
           }
           assert(size*2 == ep.size());
-          io_cs->put_field_data("entity_processor", ep);
+          ioCs->put_field_data("entity_processor", ep);
         }
       }
 
@@ -3304,14 +3365,13 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       {
         const stk::mesh::MetaData & meta = params.bulk_data().mesh_meta_data();
 
-        size_t block_count = ss->block_count();
-        for (size_t i=0; i < block_count; i++) {
+        size_t blockCount = ss->block_count();
+        for (size_t i=0; i < blockCount; i++) {
           Ioss::SideBlock *block = ss->get_block(i);
           if (stk::io::include_entity(block)) {
             stk::mesh::Part * part = getPart(meta, block->name());
             const Ioss::ElementTopology *parent_topology = block->parent_element_topology();
-            stk::io::write_side_data_to_ioss<INT>(params, *block, part,
-                                                  parent_topology);
+            stk::io::write_side_data_to_ioss<INT>(params, *block, part, parent_topology);
           }
         }
       }
@@ -3320,9 +3380,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       void output_face_block(stk::io::OutputParams &params, Ioss::FaceBlock *fb)
       {
         const stk::mesh::BulkData &bulk = params.bulk_data();
-        const stk::mesh::MetaData & meta_data = bulk.mesh_meta_data();
+        const stk::mesh::MetaData & metaData = bulk.mesh_meta_data();
         const std::string& name = fb->name();
-        mesh::Part* part = getPart( meta_data, name);
+        mesh::Part* part = getPart( metaData, name);
         assert(part != nullptr);
 
         stk::topology topo = part->topology();
@@ -3334,42 +3394,41 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
         std::vector<mesh::Entity> faces;
         stk::mesh::EntityRank type = part_primary_entity_rank(*part);
-        size_t num_faces = get_entities(params, *part, type, faces, false);
-
-        size_t nodes_per_face = fb->get_property("topology_node_count").get_int();
-
-        std::vector<INT> face_ids; face_ids.reserve(num_faces == 0 ? 1 : num_faces);
-        std::vector<INT> connectivity; connectivity.reserve( (num_faces*nodes_per_face) == 0 ? 1 : (num_faces*nodes_per_face));
+        size_t numFaces = get_entities(params, *part, type, faces, false);
 
-        for (size_t i = 0; i < num_faces; ++i) {
+        size_t nodesPerFace = fb->get_property("topology_node_count").get_int();
 
-          face_ids.push_back(bulk.identifier(faces[i]));
+        std::vector<INT> faceIds;
+        faceIds.reserve(numFaces == 0 ? 1 : numFaces);
+        std::vector<INT> connectivity; connectivity.reserve( (numFaces*nodesPerFace) == 0 ? 1 : (numFaces*nodesPerFace));
 
-          stk::mesh::Entity const * face_nodes = bulk.begin_nodes(faces[i]);
+        for (size_t i = 0; i < numFaces; ++i) {
+          faceIds.push_back(bulk.identifier(faces[i]));
+          stk::mesh::Entity const * faceNodes = bulk.begin_nodes(faces[i]);
 
-          for (size_t j = 0; j < nodes_per_face; ++j) {
-            connectivity.push_back(bulk.identifier(face_nodes[j]));
+          for (size_t j = 0; j < nodesPerFace; ++j) {
+            connectivity.push_back(bulk.identifier(faceNodes[j]));
           }
         }
 
-        const size_t num_ids_written = fb->put_field_data("ids", face_ids);
-        const size_t num_con_written = fb->put_field_data("connectivity", connectivity);
+        const size_t numIdsWritten = fb->put_field_data("ids", faceIds);
+        const size_t numConWritten = fb->put_field_data("connectivity", connectivity);
 
-        if ( num_faces != num_ids_written || num_faces != num_con_written ) {
+        if ( numFaces != numIdsWritten || numFaces != numConWritten ) {
           std::ostringstream msg ;
           msg << " FAILED in Ioss::FaceBlock::put_field_data:" << std::endl ;
-          msg << "  num_faces = " << num_faces << std::endl ;
-          msg << "  num_ids_written = " << num_ids_written << std::endl ;
-          msg << "  num_connectivity_written = " << num_con_written << std::endl ;
+          msg << "  numFaces = " << numFaces << std::endl ;
+          msg << "  numIdsWritten = " << numIdsWritten << std::endl ;
+          msg << "  num_connectivity_written = " << numConWritten << std::endl ;
           throw std::runtime_error( msg.str() );
         }
 
-        stk::mesh::EntityRank face_rank = stk::topology::FACE_RANK;
-        const std::vector<mesh::FieldBase *> &fields = meta_data.get_fields();
+        stk::mesh::EntityRank faceRank = stk::topology::FACE_RANK;
+        const std::vector<mesh::FieldBase *> &fields = metaData.get_fields();
         for(const mesh::FieldBase* f : fields) {
           const Ioss::Field::RoleType *role = stk::io::get_field_role(*f);
           if (role != nullptr && *role == Ioss::Field::ATTRIBUTE) {
-            const mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*f, face_rank, *part);
+            const mesh::FieldBase::Restriction &res = stk::mesh::find_restriction(*f, faceRank, *part);
             if (res.num_scalars_per_entity() > 0) {
               stk::io::field_data_to_ioss(bulk, f, faces, fb, f->name(), Ioss::Field::ATTRIBUTE);
             }
@@ -3381,9 +3440,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
       void output_edge_block(stk::io::OutputParams &params, Ioss::EdgeBlock *eb)
       {
         const stk::mesh::BulkData &bulk = params.bulk_data();
-        const stk::mesh::MetaData & meta_data = bulk.mesh_meta_data();
+        const stk::mesh::MetaData & metaData = bulk.mesh_meta_data();
         const std::string& name = eb->name();
-        mesh::Part* part = getPart( meta_data, name);
+        mesh::Part* part = getPart( metaData, name);
         assert(part != nullptr);
 
         stk::topology topo = part->topology();
@@ -3395,38 +3454,38 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
         std::vector<mesh::Entity> edges;
         stk::mesh::EntityRank type = part_primary_entity_rank(*part);
-        size_t num_edges = get_entities(params, *part, type, edges, false);
+        size_t numEdges = get_entities(params, *part, type, edges, false);
 
-        size_t nodes_per_edge = eb->get_property("topology_node_count").get_int();
+        size_t nodesPerEdge = eb->get_property("topology_node_count").get_int();
 
-        std::vector<INT> edge_ids; edge_ids.reserve(num_edges == 0 ? 1 : num_edges);
-        std::vector<INT> connectivity; connectivity.reserve( (num_edges*nodes_per_edge) == 0 ? 1 : (num_edges*nodes_per_edge));
+        std::vector<INT> edgeIds;
+        edgeIds.reserve(numEdges == 0 ? 1 : numEdges);
+        std::vector<INT> connectivity;
+        connectivity.reserve( (numEdges*nodesPerEdge) == 0 ? 1 : (numEdges*nodesPerEdge));
 
-        for (size_t i = 0; i < num_edges; ++i) {
+        for (size_t i = 0; i < numEdges; ++i) {
+          edgeIds.push_back(bulk.identifier(edges[i]));
+          stk::mesh::Entity const * edgeNodes = bulk.begin_nodes(edges[i]);
 
-          edge_ids.push_back(bulk.identifier(edges[i]));
-
-          stk::mesh::Entity const * edge_nodes = bulk.begin_nodes(edges[i]);
-
-          for (size_t j = 0; j < nodes_per_edge; ++j) {
-            connectivity.push_back(bulk.identifier(edge_nodes[j]));
+          for (size_t j = 0; j < nodesPerEdge; ++j) {
+            connectivity.push_back(bulk.identifier(edgeNodes[j]));
           }
         }
 
-        const size_t num_ids_written = eb->put_field_data("ids", edge_ids);
-        const size_t num_con_written = eb->put_field_data("connectivity", connectivity);
+        const size_t numIdsWritten = eb->put_field_data("ids", edgeIds);
+        const size_t numConWritten = eb->put_field_data("connectivity", connectivity);
 
-        if ( num_edges != num_ids_written || num_edges != num_con_written ) {
+        if ( numEdges != numIdsWritten || numEdges != numConWritten ) {
           std::ostringstream msg ;
           msg << " FAILED in Ioss::EdgeBlock::put_field_data:" << std::endl ;
-          msg << "  num_edges = " << num_edges << std::endl ;
-          msg << "  num_ids_written = " << num_ids_written << std::endl ;
-          msg << "  num_connectivity_written = " << num_con_written << std::endl ;
+          msg << "  numEdges = " << numEdges << std::endl ;
+          msg << "  numIdsWritten = " << numIdsWritten << std::endl ;
+          msg << "  num_connectivity_written = " << numConWritten << std::endl ;
           throw std::runtime_error( msg.str() );
         }
 
         stk::mesh::EntityRank edge_rank = stk::topology::EDGE_RANK;
-        const std::vector<mesh::FieldBase *> &fields = meta_data.get_fields();
+        const std::vector<mesh::FieldBase *> &fields = metaData.get_fields();
         for(const mesh::FieldBase* f : fields) {
           const Ioss::Field::RoleType *role = stk::io::get_field_role(*f);
           if (role != nullptr && *role == Ioss::Field::ATTRIBUTE) {
@@ -3442,11 +3501,11 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     void write_output_db_node_block(stk::io::OutputParams &params)
     {
         const stk::mesh::MetaData & meta = params.bulk_data().mesh_meta_data();
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
 
-        bool ints64bit = db_api_int_size(&io_region) == 8;
+        bool ints64bit = db_api_int_size(&ioRegion) == 8;
 
-        Ioss::NodeBlock & nb = *io_region.get_node_blocks()[0];
+        Ioss::NodeBlock & nb = *ioRegion.get_node_blocks()[0];
 
         if (ints64bit)
           output_node_block<int64_t>(params, nb, meta.universal_part());
@@ -3456,13 +3515,13 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
     void write_output_db_element_blocks(stk::io::OutputParams &params)
     {
-      Ioss::Region &io_region = params.io_region();
-      bool ints64bit = db_api_int_size(&io_region) == 8;
+      Ioss::Region &ioRegion = params.io_region();
+      bool ints64bit = db_api_int_size(&ioRegion) == 8;
 
       //----------------------------------
-      const Ioss::ElementBlockContainer& elem_blocks = io_region.get_element_blocks();
-      for(Ioss::ElementBlockContainer::const_iterator it = elem_blocks.begin();
-          it != elem_blocks.end(); ++it) {
+      const Ioss::ElementBlockContainer& elemBlocks = ioRegion.get_element_blocks();
+      for(Ioss::ElementBlockContainer::const_iterator it = elemBlocks.begin();
+          it != elemBlocks.end(); ++it) {
         if (ints64bit)
           output_element_block<int64_t>(params, *it);
         else
@@ -3473,21 +3532,21 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     template <typename T>
     void write_output_db_for_entitysets_and_comm_map(stk::io::OutputParams &params)
     {
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
 
-        for(Ioss::NodeSet *ns : io_region.get_nodesets()) {
+        for(Ioss::NodeSet *ns : ioRegion.get_nodesets()) {
             output_node_set<T>(params, ns);
         }
 
-        for(Ioss::SideSet *ss : io_region.get_sidesets()) {
+        for(Ioss::SideSet *ss : ioRegion.get_sidesets()) {
             output_side_set<T>(params, ss);
         }
 
-        for(Ioss::EdgeBlock *eb: io_region.get_edge_blocks()) {
+        for(Ioss::EdgeBlock *eb: ioRegion.get_edge_blocks()) {
             output_edge_block<T>(params, eb);
         }
 
-        for(Ioss::FaceBlock *fb: io_region.get_face_blocks()) {
+        for(Ioss::FaceBlock *fb: ioRegion.get_face_blocks()) {
             output_face_block<T>(params, fb);
         }
 
@@ -3496,11 +3555,11 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
     void write_output_db_rest_of_mesh(stk::io::OutputParams &params)
     {
-      Ioss::Region &io_region = params.io_region();
+      Ioss::Region &ioRegion = params.io_region();
 
       write_output_db_element_blocks(params);
 
-      bool ints64bit = db_api_int_size(&io_region) == 8;
+      bool ints64bit = db_api_int_size(&ioRegion) == 8;
 
         if (ints64bit) {
             write_output_db_for_entitysets_and_comm_map<int64_t>(params);
@@ -3511,12 +3570,12 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
     void write_output_db(stk::io::OutputParams &params)
     {
-      Ioss::Region &io_region = params.io_region();
+      Ioss::Region &ioRegion = params.io_region();
 
-      io_region.begin_mode( Ioss::STATE_MODEL );
+      ioRegion.begin_mode( Ioss::STATE_MODEL );
       write_output_db_node_block(params);
       write_output_db_rest_of_mesh(params);
-      io_region.end_mode( Ioss::STATE_MODEL );
+      ioRegion.end_mode( Ioss::STATE_MODEL );
     }
 
     //----------------------------------------------------------------------
@@ -3541,14 +3600,14 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
     }
 
     void set_distribution_factor_field(stk::mesh::Part &p,
-                                       const stk::mesh::FieldBase &df_field)
+                                       const stk::mesh::FieldBase &dfField)
     {
       stk::mesh::MetaData &m = mesh::MetaData::get(p);
       if (const stk::mesh::FieldBase * existingDistFactField = p.attribute<stk::mesh::FieldBase>()) {
         m.remove_attribute(p, existingDistFactField);
       }
 
-      m.declare_attribute_no_delete(p, &df_field);
+      m.declare_attribute_no_delete(p, &dfField);
     }
 
     const Ioss::Field::RoleType* get_field_role(const stk::mesh::FieldBase &f)
@@ -3558,42 +3617,42 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
     void set_field_role(stk::mesh::FieldBase &f, const Ioss::Field::RoleType &role)
     {
-      Ioss::Field::RoleType *my_role = new Ioss::Field::RoleType(role);
+      Ioss::Field::RoleType *myRole = new Ioss::Field::RoleType(role);
       stk::mesh::MetaData &m = mesh::MetaData::get(f);
-      const Ioss::Field::RoleType *check = m.declare_attribute_with_delete(f, my_role);
-      if ( check != my_role ) {
-        if (*check != *my_role) {
+      const Ioss::Field::RoleType *check = m.declare_attribute_with_delete(f, myRole);
+      if ( check != myRole ) {
+        if (*check != *myRole) {
           std::ostringstream msg ;
           msg << " FAILED in IossBridge -- set_field_role:"
               << " The role type for field name= " << f.name()
               << " was already set to " << *check
-              << ", so it is not possible to change it to " << *my_role;
-          delete my_role;
+              << ", so it is not possible to change it to " << *myRole;
+          delete myRole;
           throw std::runtime_error( msg.str() );
         }
-        delete my_role;
+        delete myRole;
       }
     }
 
     namespace {
       void define_input_nodeblock_fields(Ioss::Region &region, stk::mesh::MetaData &meta)
       {
-        const Ioss::NodeBlockContainer& node_blocks = region.get_node_blocks();
-        assert(node_blocks.size() == 1);
+        const Ioss::NodeBlockContainer& nodeBlocks = region.get_node_blocks();
+        assert(nodeBlocks.size() == 1);
 
-        Ioss::NodeBlock *nb = node_blocks[0];
+        Ioss::NodeBlock *nb = nodeBlocks[0];
         stk::io::define_io_fields(nb, Ioss::Field::TRANSIENT,
                                   meta.universal_part(), stk::topology::NODE_RANK);
       }
 
       void define_input_elementblock_fields(Ioss::Region &region, stk::mesh::MetaData &meta)
       {
-        const Ioss::ElementBlockContainer& elem_blocks = region.get_element_blocks();
-        for(size_t i=0; i < elem_blocks.size(); i++) {
-          if (stk::io::include_entity(elem_blocks[i])) {
-            stk::mesh::Part* const part = meta.get_part(elem_blocks[i]->name());
+        const Ioss::ElementBlockContainer& elemBlocks = region.get_element_blocks();
+        for(size_t i=0; i < elemBlocks.size(); i++) {
+          if (stk::io::include_entity(elemBlocks[i])) {
+            stk::mesh::Part* const part = meta.get_part(elemBlocks[i]->name());
             assert(part != nullptr);
-            stk::io::define_io_fields(elem_blocks[i], Ioss::Field::TRANSIENT,
+            stk::io::define_io_fields(elemBlocks[i], Ioss::Field::TRANSIENT,
                                       *part, part_primary_entity_rank(*part));
           }
         }
@@ -3617,9 +3676,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         unsigned sideRank = meta.side_rank();
         if (meta.spatial_dimension() <= sideRank) return;
 
-        const Ioss::SideSetContainer& side_sets = region.get_sidesets();
-        for(Ioss::SideSetContainer::const_iterator it = side_sets.begin();
-            it != side_sets.end(); ++it) {
+        const Ioss::SideSetContainer& sideSets = region.get_sidesets();
+        for(Ioss::SideSetContainer::const_iterator it = sideSets.begin();
+            it != sideSets.end(); ++it) {
           Ioss::SideSet *entity = *it;
           if (stk::io::include_entity(entity)) {
             const Ioss::SideBlockContainer& blocks = entity->get_side_blocks();
@@ -3637,12 +3696,12 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
       void define_input_face_block_fields(Ioss::Region &region, stk::mesh::MetaData &meta)
       {
-        const Ioss::FaceBlockContainer& face_blocks = region.get_face_blocks();
-        for(size_t i=0; i < face_blocks.size(); i++) {
-          if (stk::io::include_entity(face_blocks[i])) {
-            stk::mesh::Part* const part = meta.get_part(face_blocks[i]->name());
+        const Ioss::FaceBlockContainer& faceBlocks = region.get_face_blocks();
+        for(size_t i=0; i < faceBlocks.size(); i++) {
+          if (stk::io::include_entity(faceBlocks[i])) {
+            stk::mesh::Part* const part = meta.get_part(faceBlocks[i]->name());
             assert(part != nullptr);
-            stk::io::define_io_fields(face_blocks[i], Ioss::Field::TRANSIENT,
+            stk::io::define_io_fields(faceBlocks[i], Ioss::Field::TRANSIENT,
                                       *part, part_primary_entity_rank(*part));
           }
         }
@@ -3650,12 +3709,12 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
       void define_input_edge_block_fields(Ioss::Region &region, stk::mesh::MetaData &meta)
       {
-        const Ioss::EdgeBlockContainer& edge_blocks = region.get_edge_blocks();
-        for(size_t i=0; i < edge_blocks.size(); i++) {
-          if (stk::io::include_entity(edge_blocks[i])) {
-            stk::mesh::Part* const part = meta.get_part(edge_blocks[i]->name());
+        const Ioss::EdgeBlockContainer& edgeBlocks = region.get_edge_blocks();
+        for(size_t i=0; i < edgeBlocks.size(); i++) {
+          if (stk::io::include_entity(edgeBlocks[i])) {
+            stk::mesh::Part* const part = meta.get_part(edgeBlocks[i]->name());
             assert(part != nullptr);
-            stk::io::define_io_fields(edge_blocks[i], Ioss::Field::TRANSIENT,
+            stk::io::define_io_fields(edgeBlocks[i], Ioss::Field::TRANSIENT,
                                       *part, part_primary_entity_rank(*part));
           }
         }
@@ -3741,64 +3800,65 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         }
     }
 
-    void put_field_data(stk::mesh::BulkData &bulk,
-                        stk::io::OutputParams& params,
+    void put_field_data(stk::io::OutputParams& params,
                         stk::mesh::Part &part,
-                        stk::mesh::EntityRank part_type,
-                        Ioss::GroupingEntity *io_entity,
-                        Ioss::Field::RoleType filter_role)
+                        stk::mesh::EntityRank partType,
+                        Ioss::GroupingEntity *ioEntity,
+                        Ioss::Field::RoleType filterRole)
     {
       std::vector<stk::mesh::Entity> entities;
-      stk::io::get_output_entity_list(io_entity, part_type, params, entities);
+      stk::io::get_output_entity_list(ioEntity, partType, params, entities);
 
+      const stk::mesh::BulkData &bulk = params.bulk_data();
       stk::mesh::MetaData & meta = stk::mesh::MetaData::get(part);
       const std::vector<stk::mesh::FieldBase*> &fields = meta.get_fields();
 
       std::vector<stk::mesh::FieldBase *>::const_iterator I = fields.begin();
       while (I != fields.end()) {
         const stk::mesh::FieldBase *f = *I; ++I;
-        if (stk::io::is_valid_part_field(f, part_type, part, filter_role)) {
-          stk::io::field_data_to_ioss(bulk, f, entities, io_entity, f->name(), filter_role);
+        if (stk::io::is_valid_part_field(f, partType, part, filterRole)) {
+          stk::io::field_data_to_ioss(bulk, f, entities, ioEntity, f->name(), filterRole);
         }
       }
     }
 
     void put_field_data(stk::mesh::BulkData &bulk,
                         stk::mesh::Part &part,
-                        stk::mesh::EntityRank part_type,
-                        Ioss::GroupingEntity *io_entity,
-                        Ioss::Field::RoleType filter_role)
+                        stk::mesh::EntityRank partType,
+                        Ioss::GroupingEntity *ioEntity,
+                        Ioss::Field::RoleType filterRole)
     {
       stk::io::OutputParams params(bulk);
-      put_field_data(bulk, params, part, part_type, io_entity, filter_role);
+      put_field_data(params, part, partType, ioEntity, filterRole);
     }
 
     struct DefineOutputFunctor
     {
-      void operator()(stk::mesh::BulkData &bulk, stk::io::OutputParams& params, stk::mesh::Part &part, stk::mesh::EntityRank rank, Ioss::GroupingEntity *ge, Ioss::Field::RoleType role)
+      void operator()(stk::io::OutputParams& params, stk::mesh::Part &part, stk::mesh::EntityRank rank, Ioss::GroupingEntity *ge, Ioss::Field::RoleType role)
       {  stk::io::ioss_add_fields(part, rank, ge, role); }
     };
 
     struct ProcessOutputFunctor
     {
-      void operator()(stk::mesh::BulkData &bulk, stk::io::OutputParams& params, stk::mesh::Part &part, stk::mesh::EntityRank rank, Ioss::GroupingEntity *ge, Ioss::Field::RoleType role)
-      {  put_field_data(bulk, params, part, rank, ge, role); }
+      void operator()(stk::io::OutputParams& params, stk::mesh::Part &part, stk::mesh::EntityRank rank, Ioss::GroupingEntity *ge, Ioss::Field::RoleType role)
+      {  put_field_data(params, part, rank, ge, role); }
     };
 
     template <typename T>
-    void process_field_loop(Ioss::Region &region,
-                            stk::mesh::BulkData &bulk, T& callable)
+    void process_field_loop(stk::io::OutputParams& params, T& callable)
     {
-        stk::mesh::MetaData & meta = bulk.mesh_meta_data();
-        stk::io::OutputParams params(region, bulk);
+        Ioss::Region &region = params.io_region();
+        const stk::mesh::BulkData &bulk = params.bulk_data();
+
+        const stk::mesh::MetaData & meta = bulk.mesh_meta_data();
 
         Ioss::NodeBlock *nb = region.get_node_blocks()[0];
-        callable(bulk, params, meta.universal_part(), stk::topology::NODE_RANK,
+        callable(params, meta.universal_part(), stk::topology::NODE_RANK,
                  dynamic_cast<Ioss::GroupingEntity *>(nb), Ioss::Field::TRANSIENT);
 
-        const stk::mesh::PartVector & all_parts = meta.get_parts();
+        const stk::mesh::PartVector & allParts = meta.get_parts();
         for ( stk::mesh::PartVector::const_iterator
-                ip = all_parts.begin(); ip != all_parts.end(); ++ip ) {
+                ip = allParts.begin(); ip != allParts.end(); ++ip ) {
 
           stk::mesh::Part * const part = *ip;
 
@@ -3812,12 +3872,12 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
 
               for (int i=0; i < block_count; i++) {
                 Ioss::SideBlock *fb = sset->get_block(i);
-                callable(bulk, params, *part,
+                callable(params, *part,
                          stk::mesh::EntityRank( part->primary_entity_rank() ),
                          dynamic_cast<Ioss::GroupingEntity *>(fb), Ioss::Field::TRANSIENT);
               }
             } else {
-              callable(bulk, params, *part,
+              callable(params, *part,
                        stk::mesh::EntityRank( part->primary_entity_rank() ),
                        entity, Ioss::Field::TRANSIENT);
             }
@@ -3825,18 +3885,16 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         }
     }
 
-    void process_output_request(Ioss::Region &region,
-                                stk::mesh::BulkData &bulk,
-                                int step)
+    void process_output_request(stk::io::OutputParams& params, int step)
     {
-      region.begin_state(step);
+      params.io_region().begin_state(step);
       ProcessOutputFunctor functor;
-      process_field_loop(region, bulk, functor);
-      region.end_state(step);
+      process_field_loop(params, functor);
+      params.io_region().end_state(step);
     }
 
     template <typename INT>
-    void output_node_sharing_info( Ioss::CommSet* io_cs,  const EntitySharingInfo &nodeSharingInfo)
+    void output_node_sharing_info( Ioss::CommSet* ioCs,  const EntitySharingInfo &nodeSharingInfo)
     {
         std::vector<INT> entity_proc(2*nodeSharingInfo.size());
         int counter = 0;
@@ -3847,28 +3905,28 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
             counter += 2;
         }
         size_t size_field = entity_proc.size()*(sizeof(INT));
-        io_cs->put_field_data("entity_processor", entity_proc.data(), size_field);
+        ioCs->put_field_data("entity_processor", entity_proc.data(), size_field);
     }
 
     void write_node_sharing_info(Ioss::DatabaseIO *dbo, const EntitySharingInfo &nodeSharingInfo)
     {
         bool ints64bit =  db_api_int_size(dbo->get_region()) == 8;
 
-        Ioss::CommSet* io_cs = dbo->get_region()->get_commset("commset_node");
-        if(io_cs)
+        Ioss::CommSet* ioCs = dbo->get_region()->get_commset("commset_node");
+        if(ioCs)
         {
           if (ints64bit)
-            output_node_sharing_info<int64_t>(io_cs, nodeSharingInfo);
+            output_node_sharing_info<int64_t>(ioCs, nodeSharingInfo);
           else
-            output_node_sharing_info<int>(io_cs, nodeSharingInfo);
+            output_node_sharing_info<int>(ioCs, nodeSharingInfo);
         }
     }
 
     Ioss::DatabaseIO *create_database_for_subdomain(const std::string &baseFilename,
-                                                    int index_subdomain,
-                                                    int num_subdomains)
+                                                    int indexSubdomain,
+                                                    int numSubdomains)
     {
-        std::string parallelFilename{construct_filename_for_serial_or_parallel(baseFilename, num_subdomains, index_subdomain)};
+        std::string parallelFilename{construct_filename_for_serial_or_parallel(baseFilename, numSubdomains, indexSubdomain)};
 
         std::string dbtype("exodusII");
         Ioss::DatabaseIO *dbo = Ioss::IOFactory::create(dbtype, parallelFilename, Ioss::WRITE_RESULTS, MPI_COMM_SELF);
@@ -3876,111 +3934,117 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         return dbo;
     }
 
-    void write_mesh_data_for_subdomain(Ioss::Region& out_region, stk::mesh::BulkData& bulkData, const EntitySharingInfo& nodeSharingInfo)
+    void write_mesh_data_for_subdomain(stk::io::OutputParams& params, const EntitySharingInfo& nodeSharingInfo)
     {
-      stk::io::OutputParams params(out_region, bulkData);
-      out_region.begin_mode(Ioss::STATE_DEFINE_MODEL);
+      Ioss::Region &region = params.io_region();
+      region.begin_mode(Ioss::STATE_DEFINE_MODEL);
       stk::io::define_output_db_within_state_define(params, {});
-      Ioss::CommSet *commset = new Ioss::CommSet(out_region.get_database(), "commset_node", "node", nodeSharingInfo.size());
+      Ioss::CommSet *commset = new Ioss::CommSet(region.get_database(), "commset_node", "node", nodeSharingInfo.size());
       commset->property_add(Ioss::Property("id", 1));
-      out_region.add(commset);
-      out_region.end_mode(Ioss::STATE_DEFINE_MODEL);
+      region.add(commset);
+      region.end_mode(Ioss::STATE_DEFINE_MODEL);
 
-      out_region.begin_mode(Ioss::STATE_MODEL);
+      region.begin_mode(Ioss::STATE_MODEL);
       stk::io::write_output_db_node_block(params);
-      write_node_sharing_info(out_region.get_database(), nodeSharingInfo);
+      write_node_sharing_info(region.get_database(), nodeSharingInfo);
       stk::io::write_output_db_rest_of_mesh(params);
-      out_region.end_mode(Ioss::STATE_MODEL);
+      region.end_mode(Ioss::STATE_MODEL);
     }
 
-    int write_transient_data_for_subdomain(Ioss::Region &out_region, stk::mesh::BulkData& bulkData, double timeStep)
+    int write_transient_data_for_subdomain(stk::io::OutputParams& params, double timeStep)
     {
-      if(!out_region.transient_defined()) {
-        out_region.begin_mode(Ioss::STATE_DEFINE_TRANSIENT);
+      Ioss::Region &outRegion = params.io_region();
+
+      if(!outRegion.transient_defined()) {
+        outRegion.begin_mode(Ioss::STATE_DEFINE_TRANSIENT);
         DefineOutputFunctor functor;
-        process_field_loop(out_region, bulkData, functor);
-        out_region.end_mode(Ioss::STATE_DEFINE_TRANSIENT);
+        process_field_loop(params, functor);
+        outRegion.end_mode(Ioss::STATE_DEFINE_TRANSIENT);
       }
 
-      out_region.begin_mode(Ioss::STATE_TRANSIENT);
-      int out_step = out_region.add_state(timeStep);
-      process_output_request(out_region, bulkData, out_step);
-      out_region.end_mode(Ioss::STATE_TRANSIENT);
+      outRegion.begin_mode(Ioss::STATE_TRANSIENT);
+      int out_step = outRegion.add_state(timeStep);
+      process_output_request(params, out_step);
+      outRegion.end_mode(Ioss::STATE_TRANSIENT);
 
       return out_step;
     }
 
-    void write_file_for_subdomain(Ioss::Region &out_region,
-                                  stk::mesh::BulkData& bulkData,
+    void write_file_for_subdomain(stk::io::OutputParams& params,
                                   const EntitySharingInfo &nodeSharingInfo,
                                   int numSteps,
                                   double timeStep)
     {
-        Ioss::DatabaseIO *dbo = out_region.get_database();
+        Ioss::Region &outRegion = params.io_region();
+
+        Ioss::DatabaseIO *dbo = outRegion.get_database();
         ThrowRequire(nullptr != dbo);
 
-        write_mesh_data_for_subdomain(out_region, bulkData, nodeSharingInfo);
+        write_mesh_data_for_subdomain(params, nodeSharingInfo);
 
         if(numSteps > 0) {
-          write_transient_data_for_subdomain(out_region, bulkData, timeStep);
+          write_transient_data_for_subdomain(params, timeStep);
         }
     }
 
-    void add_properties_for_subdomain(stk::mesh::BulkData& bulkData,
-                                      Ioss::Region &out_region,
-                                      int index_subdomain,
-                                      int num_subdomains,
-                                      int global_num_nodes,
-                                      int global_num_elems)
+    void add_properties_for_subdomain(stk::io::OutputParams& params,
+                                      int indexSubdomain,
+                                      int numSubdomains,
+                                      int globalNumNodes,
+                                      int globalNumElems)
     {
-        out_region.property_add(Ioss::Property("processor_count", num_subdomains));
-        out_region.property_add(Ioss::Property("my_processor", index_subdomain));
-        out_region.property_add(Ioss::Property("global_node_count", global_num_nodes));
-        out_region.property_add(Ioss::Property("global_element_count", global_num_elems));
+        Ioss::Region &outRegion = params.io_region();
 
-        if(bulkData.supports_large_ids()) {
-            out_region.property_add(Ioss::Property("INTEGER_SIZE_API" , 8));
-            out_region.property_add(Ioss::Property("INTEGER_SIZE_DB" , 8));
+        outRegion.property_add(Ioss::Property("processor_count", numSubdomains));
+        outRegion.property_add(Ioss::Property("my_processor", indexSubdomain));
+        outRegion.property_add(Ioss::Property("global_node_count", globalNumNodes));
+        outRegion.property_add(Ioss::Property("global_element_count", globalNumElems));
 
-            Ioss::DatabaseIO *dbo = out_region.get_database();
+        if(params.bulk_data().supports_large_ids()) {
+            outRegion.property_add(Ioss::Property("INTEGER_SIZE_API" , 8));
+            outRegion.property_add(Ioss::Property("INTEGER_SIZE_DB" , 8));
+
+            Ioss::DatabaseIO *dbo = outRegion.get_database();
             dbo->set_int_byte_size_api(Ioss::USE_INT64_API);
         }
     }
 
     void write_file_for_subdomain(const std::string &baseFilename,
-                                  int index_subdomain,
-                                  int num_subdomains,
-                                  int global_num_nodes,
-                                  int global_num_elems,
-                                  stk::mesh::BulkData& bulkData,
+                                  int indexSubdomain,
+                                  int numSubdomains,
+                                  int globalNumNodes,
+                                  int globalNumElems,
+                                  stk::io::OutputParams& params,
                                   const EntitySharingInfo &nodeSharingInfo,
                                   int numSteps,
                                   double timeStep)
     {
-        Ioss::DatabaseIO *dbo = create_database_for_subdomain(baseFilename, index_subdomain, num_subdomains);
-
-        Ioss::Region out_region(dbo, "name");
+        Ioss::DatabaseIO *dbo = create_database_for_subdomain(baseFilename, indexSubdomain, numSubdomains);
+        Ioss::Region outRegion(dbo, "name");
 
-        add_properties_for_subdomain(bulkData, out_region, index_subdomain, num_subdomains, global_num_nodes, global_num_elems);
+        ThrowRequireMsg(params.io_region_ptr() == nullptr, "OutputParams argument must have a NULL IORegion");
+        params.set_io_region(&outRegion);
+        add_properties_for_subdomain(params, indexSubdomain, numSubdomains, globalNumNodes, globalNumElems);
 
-        write_file_for_subdomain(out_region, bulkData, nodeSharingInfo, numSteps, timeStep);
+        write_file_for_subdomain(params, nodeSharingInfo, numSteps, timeStep);
 
-        stk::io::delete_selector_property(out_region);
+        stk::io::delete_selector_property(outRegion);
+        params.set_io_region(nullptr);
     }
 
 
     const stk::mesh::Part* get_parent_element_block_by_adjacency(const stk::mesh::BulkData& bulk,
                                                                  const std::string& name,
-                                                                 const stk::mesh::Part* parent_element_block)
+                                                                 const stk::mesh::Part* parentElementBlock)
     {
       const stk::mesh::Part* part = bulk.mesh_meta_data().get_part(name);
       if (part != nullptr) {
-        std::vector<const stk::mesh::Part*> touching_parts = bulk.mesh_meta_data().get_blocks_touching_surface(part);
-        if (touching_parts.size() == 1) {
-          parent_element_block = touching_parts[0];
+        std::vector<const stk::mesh::Part*> touchingParts = bulk.mesh_meta_data().get_blocks_touching_surface(part);
+        if (touchingParts.size() == 1) {
+          parentElementBlock = touchingParts[0];
         }
       }
-      return parent_element_block;
+      return parentElementBlock;
     }
 
 
@@ -3995,9 +4059,9 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         // correct faceblock...
 
         std::string part_name = name + "_context";
-        const stk::mesh::Part* parent_element_block = bulk.mesh_meta_data().get_part(part_name);
+        const stk::mesh::Part* parentElementBlock = bulk.mesh_meta_data().get_part(part_name);
 
-        if(parent_element_block == nullptr) {
+        if(parentElementBlock == nullptr) {
             if(ioRegion.get_database()->get_surface_split_type() == Ioss::SPLIT_BY_ELEMENT_BLOCK) {
                 // If the surfaces were split by element block, then the surface
                 // name will be of the form:  "name_block_id_facetopo_id" "name" is typically "surface".
@@ -4007,37 +4071,46 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                 stk::util::tokenize(name, "_", tokens);
                 if(tokens.size() >= 4) {
                     // Check whether the second-last token is a face topology
-                    const Ioss::ElementTopology* face_topo = Ioss::ElementTopology::factory(tokens[tokens.size() - 2], true);
-                    if(face_topo != nullptr) {
+                    const Ioss::ElementTopology* faceTopo = Ioss::ElementTopology::factory(tokens[tokens.size() - 2], true);
+                    if(faceTopo != nullptr) {
                         // Extract the blockname or "block"_id...
-                        std::string eb_name;
-                        size_t last_token = tokens.size() - 2;
-                        for(size_t tok = 1; tok < last_token; tok++) {
-                            eb_name += tokens[tok];
-                            if(tok < last_token - 1) eb_name += "_";
+                        std::string ebName;
+                        size_t lastToken = tokens.size() - 2;
+                        for(size_t tok = 1; tok < lastToken; tok++) {
+                            ebName += tokens[tok];
+                            if(tok < lastToken - 1) ebName += "_";
                         }
 
-                        stk::mesh::Part* elementBlock = bulk.mesh_meta_data().get_part(eb_name);
+                        stk::mesh::Part* elementBlock = bulk.mesh_meta_data().get_part(ebName);
                         if(elementBlock != nullptr && is_part_io_part(*elementBlock))
-                            parent_element_block = elementBlock;
+                            parentElementBlock = elementBlock;
                     }
                 } else {
-                    parent_element_block = get_parent_element_block_by_adjacency(bulk, name, parent_element_block);
+                    parentElementBlock = get_parent_element_block_by_adjacency(bulk, name, parentElementBlock);
                 }
             }
             else {
-                parent_element_block = get_parent_element_block_by_adjacency(bulk, name, parent_element_block);
+                parentElementBlock = get_parent_element_block_by_adjacency(bulk, name, parentElementBlock);
             }
         }
-        return parent_element_block;
+        return parentElementBlock;
     }
 
-    bool is_valid_for_output(const stk::mesh::Part &part, const stk::mesh::Selector *output_selector)
+    bool is_valid_for_output(stk::io::OutputParams &params, const stk::mesh::Part &part)
     {
+        const stk::mesh::EntityRank rank = part.primary_entity_rank();
+        const stk::mesh::Selector *outputSelector = params.get_output_selector(rank);
+
         bool isIoPart   = stk::io::is_part_io_part(part);
-        bool isSelected = (output_selector == nullptr) || (*output_selector)(part);
+        bool isSelected = (outputSelector == nullptr) || (*outputSelector)(part);
+
+        bool isEmptyElementBlock = false;
 
-        return (isIoPart && isSelected);
+        if(rank == stk::topology::ELEM_RANK && params.get_filter_empty_entity_blocks()) {
+          isEmptyElementBlock = is_empty_element_block(params, &part);
+        }
+
+        return (isIoPart && isSelected && !isEmptyElementBlock);
     }
 
     bool node_is_connected_to_local_element(const stk::mesh::BulkData &bulk, stk::mesh::Entity node, const stk::mesh::Selector *subsetSelector)
@@ -4056,8 +4129,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         return isLocalElement;
     }
 
-    size_t count_selected_nodes(OutputParams &params,
-                                const stk::mesh::Selector &selector)
+    size_t count_selected_nodes(OutputParams &params, const stk::mesh::Selector &selector)
     {
         stk::mesh::EntityVector nodes;
         get_selected_nodes(params, selector, nodes);
@@ -4088,10 +4160,10 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
         bool hasAdaptivity = params.get_has_adaptivity();
 
         bool result = true;
-        bool active_only = subsetSelector != nullptr;
+        bool activeOnly = subsetSelector != nullptr;
         stk::mesh::Bucket &nodeBucket = bulk.bucket(node);
         if (hasAdaptivity) {
-            result = active_only ? (*subsetSelector)(nodeBucket) : true;
+            result = activeOnly ? (*subsetSelector)(nodeBucket) : true;
         }
         if (hasGhosting && result) {
             // Now need to check whether this node is locally owned or is used by
@@ -4106,7 +4178,7 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                 for (unsigned i = 0, e = bulk.num_elements(node); i < e; ++i) {
                     stk::mesh::Entity elem = elements[i];
                     stk::mesh::Bucket &elemBucket = bulk.bucket(elem);
-                    if (elemBucket.owned() && (!active_only || (active_only && (*subsetSelector)(elemBucket)))) {
+                    if (elemBucket.owned() && (!activeOnly || (activeOnly && (*subsetSelector)(elemBucket)))) {
                         result = true;
                         break;
                     }
@@ -4134,18 +4206,18 @@ const stk::mesh::FieldBase *declare_stk_field_internal(stk::mesh::MetaData &meta
                             stk::mesh::EntityVector &nodes)
     {
         const stk::mesh::BulkData &bulk = params.bulk_data();
-        Ioss::Region &io_region = params.io_region();
+        Ioss::Region &ioRegion = params.io_region();
         nodes.clear();
 
-        bool ignore_disconnected_nodes = false;
-        if(io_region.property_exists(stk::io::s_ignore_disconnected_nodes)) {
-            ignore_disconnected_nodes = io_region.get_property(stk::io::s_ignore_disconnected_nodes).get_int();
+        bool ignoreDisconnectedNodes = false;
+        if(ioRegion.property_exists(stk::io::s_ignoreDisconnectedNodes)) {
+            ignoreDisconnectedNodes = ioRegion.get_property(stk::io::s_ignoreDisconnectedNodes).get_int();
         }
 
         const bool sortById = true;
         stk::mesh::get_entities(bulk, stk::topology::NODE_RANK, selector, nodes, sortById);
         filter_nodes_by_ghosting(params, nodes);
-        if(!ignore_disconnected_nodes) {
+        if(!ignoreDisconnectedNodes) {
             return;
         }
 
diff --git a/packages/stk/stk_io/stk_io/IossBridge.hpp b/packages/stk/stk_io/stk_io/IossBridge.hpp
index 853894f4b38e..67d287429874 100644
--- a/packages/stk/stk_io/stk_io/IossBridge.hpp
+++ b/packages/stk/stk_io/stk_io/IossBridge.hpp
@@ -46,6 +46,7 @@
 #include <string>                           // for string, operator<, basic_...
 #include <utility>                          // for pair
 #include <vector>                           // for vector
+#include <functional>
 #include "Ioss_EntityType.h"                // for EntityType, SIDEBLOCK
 #include "Ioss_GroupingEntity.h"            // for GroupingEntity
 #include "SidesetTranslator.hpp"            // for fill_element_and_side_ids
@@ -95,6 +96,8 @@ namespace stk {
  */
 namespace io {
 
+using TopologyErrorHandler = std::function<void(stk::mesh::Part &part)>;
+
 stk::mesh::EntityRank get_entity_rank(const Ioss::GroupingEntity *entity,
                                       const stk::mesh::MetaData &meta);
 
@@ -108,12 +111,12 @@ struct GlobalAnyVariable {
   stk::util::ParameterType::Type m_type;
 };
 
-static const std::string s_internal_selector_name("_stk_io_internal_selector");
-static const std::string s_ignore_disconnected_nodes("ignore_disconnected_nodes");
-static const std::string s_process_all_input_nodes("process_all_input_nodes");
-static const std::string s_sort_stk_parts("sort_stk_parts");
-static const std::string s_entity_nodes_suffix("_n");
-static const std::string s_distribution_factors("distribution_factors");
+static const std::string s_internalSelectorName("_stk_io_internal_selector");
+static const std::string s_ignoreDisconnectedNodes("ignore_disconnected_nodes");
+static const std::string s_processAllInputNodes("process_all_input_nodes");
+static const std::string s_sortStkParts("sort_stk_parts");
+static const std::string s_entityNodesSuffix("_n");
+static const std::string s_distributionFactors("distribution_factors");
 
 typedef std::pair<stk::mesh::EntityId, int> EntityIdToProcPair;
 typedef std::vector<EntityIdToProcPair> EntitySharingInfo;
@@ -136,7 +139,7 @@ typedef std::vector<FieldNameToPart> FieldNameToPartVector;
 
 stk::mesh::Part *getPart(const stk::mesh::MetaData& meta_data, const std::string& name);
 
-bool is_valid_for_output(const stk::mesh::Part &part, const stk::mesh::Selector *output_selector = nullptr);
+bool is_valid_for_output(stk::io::OutputParams &params, const stk::mesh::Part &part);
 void get_selected_nodes(OutputParams &params,
                         const stk::mesh::Selector &selector,
                         stk::mesh::EntityVector &nodes);
@@ -157,9 +160,9 @@ bool node_is_connected_to_local_element(const stk::mesh::BulkData &bulk, stk::me
  */
 bool include_entity(const Ioss::GroupingEntity *entity);
 
-void internal_part_processing(Ioss::GroupingEntity *entity, stk::mesh::MetaData &meta);
+void internal_part_processing(Ioss::GroupingEntity *entity, stk::mesh::MetaData &meta, TopologyErrorHandler handler);
 
-void internal_part_processing(Ioss::EntityBlock *entity, stk::mesh::MetaData &meta);
+void internal_part_processing(Ioss::EntityBlock *entity, stk::mesh::MetaData &meta, TopologyErrorHandler handler);
 
 /** This is the primary function used by an application to define
  *	the stk::mesh which corresponds to the Ioss mesh read from the
@@ -171,12 +174,23 @@ void internal_part_processing(Ioss::EntityBlock *entity, stk::mesh::MetaData &me
  *	stk::io::define_output_db()) which will cause the part to be output to a
  *	results or restart file.
  */
+template <typename T>
+void default_part_processing(const std::vector<T*> &entities, stk::mesh::MetaData &meta, TopologyErrorHandler handler)
+{
+  for(size_t i=0; i < entities.size(); i++) {
+    T* entity = entities[i];
+    internal_part_processing(entity, meta, handler);
+  }
+}
+
 template <typename T>
 void default_part_processing(const std::vector<T*> &entities, stk::mesh::MetaData &meta)
 {
+  TopologyErrorHandler handler = [](stk::mesh::Part &part) { };
+
   for(size_t i=0; i < entities.size(); i++) {
     T* entity = entities[i];
-    internal_part_processing(entity, meta);
+    internal_part_processing(entity, meta, handler);
   }
 }
 
@@ -463,11 +477,11 @@ bool is_part_element_block_io_part(const stk::mesh::Part &part);
 
 bool is_part_surface_io_part(const stk::mesh::Part &part);
 
-Ioss::GroupingEntity* get_grouping_entity(const Ioss::Region& region, stk::mesh::Part& part);
+Ioss::GroupingEntity* get_grouping_entity(const Ioss::Region& region, const stk::mesh::Part& part);
 
 std::vector<Ioss::EntityType> get_ioss_entity_types(const stk::mesh::MetaData& meta, stk::mesh::EntityRank rank);
 
-std::vector<Ioss::EntityType> get_ioss_entity_types(stk::mesh::Part& part);
+std::vector<Ioss::EntityType> get_ioss_entity_types(const stk::mesh::Part& part);
 
 std::string getPartName(const stk::mesh::Part& part);
 
@@ -546,15 +560,14 @@ void initialize_spatial_dimension(mesh::MetaData &meta, size_t spatial_dimension
 
 Ioss::DatabaseIO *create_database_for_subdomain(const std::string &baseFilename, int index_subdomain, int num_subdomains);
 
-void add_properties_for_subdomain(stk::mesh::BulkData& bulkData, Ioss::Region &out_region, int index_subdomain,
+void add_properties_for_subdomain(stk::io::OutputParams& params, int index_subdomain,
                                   int num_subdomains, int global_num_nodes, int global_num_elems);
 
-void write_mesh_data_for_subdomain(Ioss::Region& out_region, stk::mesh::BulkData& bulkData, const EntitySharingInfo& nodeSharingInfo);
+void write_mesh_data_for_subdomain(stk::io::OutputParams& params, const EntitySharingInfo& nodeSharingInfo);
 
-int write_transient_data_for_subdomain(Ioss::Region &out_region, stk::mesh::BulkData& bulkData, double timeStep);
+int write_transient_data_for_subdomain(stk::io::OutputParams& params, double timeStep);
 
-void write_file_for_subdomain(Ioss::Region &out_region,
-                              stk::mesh::BulkData& bulkData,
+void write_file_for_subdomain(stk::io::OutputParams& params,
                               const EntitySharingInfo &nodeSharingInfo,
                               int numSteps = -1,
                               double timeStep = 0.0);
@@ -564,7 +577,7 @@ void write_file_for_subdomain(const std::string &baseFilename,
                               int num_subdomains,
                               int global_num_nodes,
                               int global_num_elems,
-                              stk::mesh::BulkData& bulkData,
+                              stk::io::OutputParams& params,
                               const EntitySharingInfo &nodeSharingInfo,
                               int numSteps = -1,
                               double timeStep = 0.0);
diff --git a/packages/stk/stk_io/stk_io/OutputFile.cpp b/packages/stk/stk_io/stk_io/OutputFile.cpp
index 33cf1a340f8e..fcfee6f454fb 100644
--- a/packages/stk/stk_io/stk_io/OutputFile.cpp
+++ b/packages/stk/stk_io/stk_io/OutputFile.cpp
@@ -135,6 +135,9 @@ void OutputFile::setup_output_params(OutputParams &params) const
     params.set_additional_attribute_fields(m_additionalAttributeFields);
     params.set_is_restart(m_dbPurpose == stk::io::WRITE_RESTART);
     params.set_enable_edge_io(m_enableEdgeIO);
+
+    params.set_filter_empty_entity_blocks(m_filterEmptyEntityBlocks);
+    params.set_filter_empty_assembly_entity_blocks(m_filterEmptyAssemblyEntityBlocks);
 }
 
 void OutputFile::set_input_region(const Ioss::Region *input_region)
@@ -146,7 +149,7 @@ void OutputFile::set_input_region(const Ioss::Region *input_region)
 }
 
 void OutputFile::write_output_mesh(const stk::mesh::BulkData& bulk_data,
-                                         const std::vector<std::vector<int>> &attributeOrdering)
+                                   const std::vector<std::vector<int>> &attributeOrdering)
 {
     if ( m_meshDefined == false )
     {
@@ -556,7 +559,7 @@ void OutputFile::define_output_fields(const stk::mesh::BulkData& bulk_data,
                                 : m_useNodesetForBlockNodesFields;
 
                         if (use_nodeset) {
-                            std::string nodes_name = partName + s_entity_nodes_suffix;
+                            std::string nodes_name = partName + s_entityNodesSuffix;
                             node_entity = region->get_entity(nodes_name);
                         }
                     }
@@ -645,7 +648,7 @@ int OutputFile::write_defined_output_fields(const stk::mesh::BulkData& bulk_data
                             m_useNodesetForBlockNodesFields;
 
                     if (use_nodeset) {
-                        std::string nodes_name = partName + s_entity_nodes_suffix;
+                        std::string nodes_name = partName + s_entityNodesSuffix;
                         node_entity = region->get_entity(nodes_name);
                     }
                 }
@@ -810,6 +813,16 @@ void OutputFile::set_enable_edge_io(bool enableEdgeIO)
     m_enableEdgeIO = enableEdgeIO;
 }
 
+void OutputFile::set_filter_empty_entity_blocks(const bool filterEmptyEntityBlocks)
+{
+  m_filterEmptyEntityBlocks = filterEmptyEntityBlocks;
+}
+
+void OutputFile::set_filter_empty_assembly_entity_blocks(const bool filterEmptyAssemblyEntityBlocks)
+{
+  m_filterEmptyAssemblyEntityBlocks = filterEmptyAssemblyEntityBlocks;
+}
+
 } // namespace impl
 } // namespace io
 } // namespace stk
diff --git a/packages/stk/stk_io/stk_io/OutputFile.hpp b/packages/stk/stk_io/stk_io/OutputFile.hpp
index 5241ba1d9965..b46d87507c52 100644
--- a/packages/stk/stk_io/stk_io/OutputFile.hpp
+++ b/packages/stk/stk_io/stk_io/OutputFile.hpp
@@ -100,7 +100,9 @@ class OutputFile
       m_subsetSelector(nullptr),
       m_sharedSelector(nullptr),
       m_skinMeshSelector(nullptr),
-      m_multiStateSuffixes(nullptr)
+      m_multiStateSuffixes(nullptr),
+      m_filterEmptyEntityBlocks(false),
+      m_filterEmptyAssemblyEntityBlocks(false)
     {
         initialize_output_selectors();
         setup_output_file(filename, communicator, property_manager, type, openFileImmediately);
@@ -128,7 +130,9 @@ class OutputFile
       m_subsetSelector(nullptr),
       m_sharedSelector(nullptr),
       m_skinMeshSelector(nullptr),
-      m_multiStateSuffixes(nullptr)
+      m_multiStateSuffixes(nullptr),
+      m_filterEmptyEntityBlocks(false),
+      m_filterEmptyAssemblyEntityBlocks(false)
     {
         m_region = ioss_output_region;
         m_meshDefined = true;
@@ -216,6 +220,9 @@ class OutputFile
 
     void set_enable_edge_io(bool enableEdgeIO);
 
+    void set_filter_empty_entity_blocks(const bool filterEmptyEntityBlocks);
+    void set_filter_empty_assembly_entity_blocks(const bool filterEmptyAssemblyEntityBlocks);
+
     Ioss::DatabaseIO *get_output_database();
 
     std::vector<stk::mesh::Entity> get_output_entities(const stk::mesh::BulkData& bulk_data, const std::string &name);
@@ -262,6 +269,9 @@ class OutputFile
 
     std::vector<std::string>* m_multiStateSuffixes = nullptr;
 
+    bool m_filterEmptyEntityBlocks;
+    bool m_filterEmptyAssemblyEntityBlocks;
+
     OutputFile(const OutputFile &);
     const OutputFile & operator=(const OutputFile &);
 };
diff --git a/packages/stk/stk_io/stk_io/OutputParams.hpp b/packages/stk/stk_io/stk_io/OutputParams.hpp
index 6a0d158c8595..fc318ebe5ef5 100644
--- a/packages/stk/stk_io/stk_io/OutputParams.hpp
+++ b/packages/stk/stk_io/stk_io/OutputParams.hpp
@@ -45,9 +45,12 @@
 #include <string>                        // for string, operator<, etc
 #include <utility>                       // for pair
 #include <vector>                        // for vector
+#include <unordered_map>
 #include "Ioss_EntityType.h"             // for EntityType
 #include "Ioss_GroupingEntity.h"
 #include "Ioss_Region.h"
+#include "Ioss_Utils.h"
+#include "Ioss_DatabaseIO.h"
 #include "stk_mesh/base/FieldState.hpp"  // for FieldState
 #include "stk_mesh/base/FieldBase.hpp"  // for FieldState
 #include "stk_mesh/base/Part.hpp"        // for Part
@@ -55,6 +58,9 @@
 #include "stk_io/MeshField.hpp"
 #include "stk_io/FieldAndName.hpp"
 
+#include <stk_mesh/base/GetEntities.hpp>            // for count_selected_en...
+#include <stk_util/parallel/ParallelReduce.hpp>     // for all_reduce_sum
+
 namespace Ioss { class ElementTopology; }
 namespace Ioss { class EntityBlock; }
 namespace Ioss { class GroupingEntity; }
@@ -70,6 +76,8 @@ namespace stk { namespace mesh { class Selector; } }
 namespace stk {
 namespace io {
 
+bool is_part_element_block_io_part(const stk::mesh::Part &part);
+
 struct OutputParams
 {
 public:
@@ -78,6 +86,7 @@ struct OutputParams
         m_bulkData(bulk)
     {
         initialize_output_selectors();
+        initialize_block_sizes();
     }
 
     OutputParams(const mesh::BulkData &bulk) :
@@ -85,8 +94,15 @@ struct OutputParams
         m_bulkData(bulk)
     {
         initialize_output_selectors();
+        initialize_block_sizes();
     }
 
+    void set_io_region(Ioss::Region* region) {
+      m_ioRegion = region;
+    }
+    Ioss::Region *io_region_ptr() const {
+        return m_ioRegion;
+    }
     Ioss::Region &io_region() const {
         ThrowRequireMsg(m_ioRegion != nullptr, "Region is null"); return *m_ioRegion;
     }
@@ -206,6 +222,25 @@ struct OutputParams
         m_additionalAttributeFields = additionalAttributeFields;
     }
 
+    void set_filter_empty_entity_blocks(const bool filterEmptyEntityBlocks) {
+      m_filterEmptyEntityBlocks = filterEmptyEntityBlocks;
+    }
+
+    bool get_filter_empty_entity_blocks() const {
+      return m_filterEmptyEntityBlocks;
+    }
+
+    void set_filter_empty_assembly_entity_blocks(const bool filterEmptyAssemblyEntityBlocks) {
+      m_filterEmptyAssemblyEntityBlocks = filterEmptyAssemblyEntityBlocks;
+    }
+
+    bool get_filter_empty_assembly_entity_blocks() const {
+      return m_filterEmptyAssemblyEntityBlocks;
+    }
+
+    const std::unordered_map<unsigned, size_t>& get_block_sizes() const {
+      return m_blockSizes;
+    }
 private:
     OutputParams();
     OutputParams(const OutputParams &);
@@ -217,6 +252,36 @@ struct OutputParams
         }
     }
 
+    void initialize_block_sizes()
+    {
+      const stk::mesh::MetaData & meta = m_bulkData.mesh_meta_data();
+      const mesh::PartVector & parts = meta.get_parts();
+      stk::mesh::ConstPartVector elementParts;
+      elementParts.reserve(parts.size());
+
+      for (const stk::mesh::Part * part : parts) {
+        if (is_part_element_block_io_part(*part)) {
+          elementParts.push_back(part);
+        }
+      }
+
+      size_t length = elementParts.size();
+      std::vector<size_t> localBlockSizes(length, 0);
+      std::vector<size_t> globalBlockSizes(length, 0);
+
+      for(size_t i=0; i<length; ++i) {
+        const stk::mesh::Part *part = elementParts[i];
+        localBlockSizes[i] = stk::mesh::count_entities(m_bulkData, stk::topology::ELEMENT_RANK, *part);
+      }
+
+      stk::all_reduce_sum( m_bulkData.parallel(), localBlockSizes.data(), globalBlockSizes.data(), length);
+
+      for(size_t i=0; i<length; ++i) {
+        const stk::mesh::Part *part = elementParts[i];
+        m_blockSizes[part->mesh_meta_data_ordinal()] = globalBlockSizes[i];
+      }
+    }
+
     bool is_valid_rank(stk::topology::rank_t rank) const {return ((rank >= stk::topology::NODE_RANK) && (rank <= stk::topology::ELEM_RANK)); }
 
     Ioss::Region * m_ioRegion = nullptr;
@@ -235,6 +300,11 @@ struct OutputParams
     bool m_isRestart = false;
     bool m_enableEdgeIO = false;
     std::vector<stk::io::FieldAndName> m_additionalAttributeFields;
+    std::unordered_map<unsigned, size_t> m_blockSizes;
+
+    bool m_filterEmptyEntityBlocks = false;
+    bool m_filterEmptyAssemblyEntityBlocks = false;
+
 };
 
 }//namespace io
diff --git a/packages/stk/stk_io/stk_io/ProcessSetsOrBlocks.cpp b/packages/stk/stk_io/stk_io/ProcessSetsOrBlocks.cpp
index de3146def953..3a2a47cf8d63 100644
--- a/packages/stk/stk_io/stk_io/ProcessSetsOrBlocks.cpp
+++ b/packages/stk/stk_io/stk_io/ProcessSetsOrBlocks.cpp
@@ -77,10 +77,10 @@ void process_nodeblocks(Ioss::Region &region, stk::mesh::MetaData &meta)
 
 
-void process_elementblocks(Ioss::Region &region, stk::mesh::MetaData &meta)
+void process_elementblocks(Ioss::Region &region, stk::mesh::MetaData &meta, TopologyErrorHandler handler)
 {
   const Ioss::ElementBlockContainer& elem_blocks = region.get_element_blocks();
-  stk::io::default_part_processing(elem_blocks, meta);
+  stk::io::default_part_processing(elem_blocks, meta, handler);
 }
 
 void process_nodesets_without_distribution_factors(Ioss::Region &region, stk::mesh::MetaData &meta)
@@ -639,16 +639,16 @@ void process_edge_blocks(Ioss::Region &region, stk::mesh::BulkData &bulk)
     }
 }
 
-void process_face_blocks(Ioss::Region &region, stk::mesh::MetaData &meta)
+void process_face_blocks(Ioss::Region &region, stk::mesh::MetaData &meta, TopologyErrorHandler handler)
 {
   const Ioss::FaceBlockContainer& face_blocks = region.get_face_blocks();
-  stk::io::default_part_processing(face_blocks, meta);
+  stk::io::default_part_processing(face_blocks, meta, handler);
 }
 
-void process_edge_blocks(Ioss::Region &region, stk::mesh::MetaData &meta)
+void process_edge_blocks(Ioss::Region &region, stk::mesh::MetaData &meta, TopologyErrorHandler handler)
 {
   const Ioss::EdgeBlockContainer& edge_blocks = region.get_edge_blocks();
-  stk::io::default_part_processing(edge_blocks, meta);
+  stk::io::default_part_processing(edge_blocks, meta, handler);
 }
 
 void process_assemblies(Ioss::Region &region, stk::mesh::MetaData &meta)
diff --git a/packages/stk/stk_io/stk_io/ProcessSetsOrBlocks.hpp b/packages/stk/stk_io/stk_io/ProcessSetsOrBlocks.hpp
index 5e209ace1d3c..7438af163ad7 100644
--- a/packages/stk/stk_io/stk_io/ProcessSetsOrBlocks.hpp
+++ b/packages/stk/stk_io/stk_io/ProcessSetsOrBlocks.hpp
@@ -189,7 +189,7 @@ void process_nodeblocks(Ioss::Region &region, stk::mesh::BulkData &bulk)
 stk::mesh::Part* get_part_from_alias(const Ioss::Region &region, const stk::mesh::MetaData &meta, const std::string &name);
 stk::mesh::Part* get_part_for_grouping_entity(const Ioss::Region &region, const stk::mesh::MetaData &meta, const Ioss::GroupingEntity *entity);
 
-void process_elementblocks(Ioss::Region &region, stk::mesh::MetaData &meta);
+void process_elementblocks(Ioss::Region &region, stk::mesh::MetaData &meta, TopologyErrorHandler handler);
 template <typename INT>
 void process_elementblocks(Ioss::Region &region, stk::mesh::BulkData &bulk)
 {
@@ -324,9 +324,9 @@ void process_hidden_nodesets(Ioss::Region &io, stk::mesh::BulkData & bulk)
 void process_sidesets(Ioss::Region &region, stk::mesh::BulkData &bulk, const stk::mesh::EntityIdProcMap &elemIdMovedToProc, stk::io::StkMeshIoBroker::SideSetFaceCreationBehavior behavior);
 void process_sidesets(Ioss::Region &region, stk::mesh::MetaData &meta);
 void process_face_blocks(Ioss::Region &region, stk::mesh::BulkData &bulk);
-void process_face_blocks(Ioss::Region &region, stk::mesh::MetaData &meta);
+void process_face_blocks(Ioss::Region &region, stk::mesh::MetaData &meta, TopologyErrorHandler handler);
 void process_edge_blocks(Ioss::Region &region, stk::mesh::BulkData &bulk);
-void process_edge_blocks(Ioss::Region &region, stk::mesh::MetaData &meta);
+void process_edge_blocks(Ioss::Region &region, stk::mesh::MetaData &meta, TopologyErrorHandler handler);
 void process_assemblies(Ioss::Region &region, stk::mesh::MetaData &meta);
 void build_assembly_hierarchies(Ioss::Region &region, stk::mesh::MetaData &meta);
 
diff --git a/packages/stk/stk_io/stk_io/StkMeshIoBroker.cpp b/packages/stk/stk_io/stk_io/StkMeshIoBroker.cpp
index db25b379c93e..62630049852b 100644
--- a/packages/stk/stk_io/stk_io/StkMeshIoBroker.cpp
+++ b/packages/stk/stk_io/stk_io/StkMeshIoBroker.cpp
@@ -212,6 +212,22 @@ stk::mesh::FieldBase const& StkMeshIoBroker::get_coordinate_field() const
     return * coord_field;
 }
 
+bool StkMeshIoBroker::get_filter_empty_input_entity_blocks() const
+{
+  return get_filter_empty_input_entity_blocks(m_activeMeshIndex);
+}
+
+bool StkMeshIoBroker::get_filter_empty_input_entity_blocks(size_t input_file_index) const
+{
+  validate_input_file_index(input_file_index);
+  auto ioss_input_region = m_inputFiles[input_file_index]->get_input_io_region();
+
+  bool retainEmptyBlocks = (ioss_input_region->get_assemblies().size() > 0);
+  const Ioss::PropertyManager &properties = ioss_input_region->get_database()->get_property_manager();
+  Ioss::Utils::check_set_bool_property(properties, "RETAIN_EMPTY_BLOCKS", retainEmptyBlocks);
+  return !retainEmptyBlocks;
+}
+
 size_t StkMeshIoBroker::add_mesh_database(Teuchos::RCP<Ioss::Region> ioss_input_region)
 {
     auto input_file = Teuchos::rcp(new InputFile(ioss_input_region));
@@ -477,11 +493,22 @@ void StkMeshIoBroker::create_input_mesh()
         initialize_spatial_dimension(meta_data(), spatial_dimension, m_rankNames);
     }
 
+    TopologyErrorHandler handler;
+    if(get_filter_empty_input_entity_blocks()) {
+      handler = [](stk::mesh::Part &part) {
+        std::ostringstream msg ;
+        msg << "\n\nERROR: Entity Block " << part.name() << " has invalid topology\n\n";
+        throw std::runtime_error( msg.str() );
+      };
+    } else {
+      handler = [](stk::mesh::Part &part) { };
+    }
+
     process_nodeblocks(*region,    meta_data());
-    process_elementblocks(*region, meta_data());
+    process_elementblocks(*region, meta_data(), handler);
     process_sidesets(*region,      meta_data());
-    process_face_blocks(*region,   meta_data());
-    process_edge_blocks(*region,   meta_data());
+    process_face_blocks(*region,   meta_data(), handler);
+    process_edge_blocks(*region,   meta_data(), handler);
 
     if(m_autoLoadDistributionFactorPerNodeSet) {
         process_nodesets(*region,  meta_data());
@@ -666,8 +693,8 @@ bool StkMeshIoBroker::populate_mesh_elements_and_nodes(bool delay_field_data_all
     Ioss::Region *region = m_inputFiles[m_activeMeshIndex]->get_input_io_region().get();
     bool ints64bit = db_api_int_size(region) == 8;
     bool processAllInputNodes = true;
-    if(region->property_exists(stk::io::s_process_all_input_nodes)) {
-        processAllInputNodes = region->get_property(stk::io::s_process_all_input_nodes).get_int();
+    if(region->property_exists(stk::io::s_processAllInputNodes)) {
+        processAllInputNodes = region->get_property(stk::io::s_processAllInputNodes).get_int();
     }
 
     if (ints64bit) {
diff --git a/packages/stk/stk_io/stk_io/StkMeshIoBroker.hpp b/packages/stk/stk_io/stk_io/StkMeshIoBroker.hpp
index 9c5803b9d6c6..9fef003c599c 100644
--- a/packages/stk/stk_io/stk_io/StkMeshIoBroker.hpp
+++ b/packages/stk/stk_io/stk_io/StkMeshIoBroker.hpp
@@ -165,6 +165,9 @@ namespace stk {
       void set_adaptivity_filter(size_t output_file_index, bool hasAdaptivity);
       void set_skin_mesh_flag(size_t output_file_index, bool skinMesh);
 
+      void set_filter_empty_output_entity_blocks(size_t output_file_index, const bool filterEmptyEntityBlocks);
+      void set_filter_empty_output_assembly_entity_blocks(size_t output_file_index, const bool filterEmptyAssemblyEntityBlocks);
+
       stk::mesh::Selector get_active_selector() const;
       void set_active_selector(stk::mesh::Selector my_selector);
 
@@ -212,6 +215,9 @@ namespace stk {
           m_autoLoadDistributionFactorPerNodeSet = shouldAutoLoad;
       }
 
+      bool get_filter_empty_input_entity_blocks() const;
+      bool get_filter_empty_input_entity_blocks(size_t input_file_index) const;
+
       // Create the Ioss::DatabaseIO associated with the specified filename
       // and type (exodus by default). The routine checks that the
       // file exists and is readable and will throw an exception if not.
@@ -850,6 +856,16 @@ namespace stk {
       m_outputFiles[output_file_index]->is_skin_mesh(skinMesh);
     }
 
+    inline void StkMeshIoBroker::set_filter_empty_output_entity_blocks(size_t output_file_index, const bool filterEmptyEntityBlocks) {
+      validate_output_file_index(output_file_index);
+      m_outputFiles[output_file_index]->set_filter_empty_entity_blocks(filterEmptyEntityBlocks);
+    }
+
+    inline void StkMeshIoBroker::set_filter_empty_output_assembly_entity_blocks(size_t output_file_index, const bool filterEmptyAssemblyEntityBlocks) {
+      validate_output_file_index(output_file_index);
+      m_outputFiles[output_file_index]->set_filter_empty_assembly_entity_blocks(filterEmptyAssemblyEntityBlocks);
+    }
+
     inline stk::mesh::Selector StkMeshIoBroker::get_active_selector() const {
       return m_activeSelector;
     }
diff --git a/packages/stk/stk_mesh/stk_mesh/base/BulkData.cpp b/packages/stk/stk_mesh/stk_mesh/base/BulkData.cpp
index d0f8c1964389..e93a52194082 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/BulkData.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/BulkData.cpp
@@ -80,12 +80,13 @@
 #include <stk_mesh/base/NgpUtils.hpp>
 #include "stk_mesh/base/GetNgpMesh.hpp"
 #include <stk_mesh/baseImpl/ElementTopologyDeletions.hpp>
-#include <stk_mesh/baseImpl/EntityRepository.hpp>  // for EntityRepository, etc
+#include <stk_mesh/baseImpl/EntityKeyMapping.hpp>
 #include <stk_mesh/baseImpl/check_comm_list.hpp>
 #include <stk_mesh/baseImpl/elementGraph/ElemElemGraph.hpp>
 #include <stk_mesh/baseImpl/elementGraph/ElemElemGraphUpdater.hpp>
 #include <stk_mesh/baseImpl/elementGraph/SideConnector.hpp>   // for SideConnector
 #include <stk_mesh/baseImpl/elementGraph/SideSharingUsingGraph.hpp>
+#include <stk_util/parallel/ParallelComm.hpp>
 #include <stk_util/parallel/CommSparse.hpp>  // for CommSparse
 #include <stk_util/parallel/GenerateParallelUniqueIDs.hpp>
 #include <stk_util/parallel/ParallelReduce.hpp>  // for Reduce, all_reduce, etc
@@ -325,6 +326,7 @@ void BulkData::find_and_delete_internal_faces(stk::mesh::EntityRank entityRank,
 }
 
 
+#ifndef STK_HIDE_DEPRECATED_CODE // Delete after August 2022
 //----------------------------------------------------------------------
 BulkData::BulkData(MetaData & mesh_meta_data,
                    ParallelMachine parallel,
@@ -342,19 +344,16 @@ BulkData::BulkData(MetaData & mesh_meta_data,
     m_auraGhosting(std::make_shared<impl::AuraGhosting>()),
     m_entity_comm_map(),
     m_ghosting(),
-    m_meta_raw_ptr_to_be_deprecated( &mesh_meta_data ),
     m_meta_data(&mesh_meta_data, [](MetaData* metadata) {}),
     m_mark_entity(),
     m_add_node_sharing_called(false),
     m_closure_count(),
     m_mesh_indexes(),
-    m_entity_repo(new impl::EntityRepository()),
+    m_entityKeyMapping(new impl::EntityKeyMapping()),
     m_entity_comm_list(),
     m_entitycomm(),
     m_owner(),
-    m_comm_list_updater(m_entity_comm_list, m_entitycomm),
-    m_deleted_entities_current_modification_cycle(),
-    m_ghost_reuse_map(),
+    m_comm_list_updater(m_entity_comm_list, m_entitycomm, m_removedGhosts),
     m_entity_keys(),
 #ifdef SIERRA_MIGRATION
     m_add_fmwk_data(add_fmwk_data),
@@ -370,7 +369,6 @@ BulkData::BulkData(MetaData & mesh_meta_data,
     m_volatile_fast_shared_comm_map_sync_count(0),
     m_all_sharing_procs(mesh_meta_data.entity_rank_count()),
     m_ghost_parts(),
-    m_deleted_entities(),
     m_num_fields(-1), // meta data not necessarily committed yet
     m_keep_fields_updated(true),
     m_local_ids(),
@@ -396,7 +394,7 @@ BulkData::BulkData(MetaData & mesh_meta_data,
      mesh_meta_data.set_mesh_bulk_data(this);
   }
   catch(...) {
-      delete m_entity_repo;
+      delete m_entityKeyMapping;
       throw;
   }
 
@@ -422,6 +420,7 @@ BulkData::BulkData(MetaData & mesh_meta_data,
 
   m_meshModification.set_sync_state_synchronized();
 }
+#endif
 
 //----------------------------------------------------------------------
 BulkData::BulkData(std::shared_ptr<MetaData> mesh_meta_data,
@@ -442,19 +441,16 @@ BulkData::BulkData(std::shared_ptr<MetaData> mesh_meta_data,
     m_auraGhosting((auraGhosting!=nullptr ? auraGhosting : std::make_shared<impl::AuraGhosting>())),
     m_entity_comm_map(),
     m_ghosting(),
-    m_meta_raw_ptr_to_be_deprecated( mesh_meta_data.get() ),
     m_meta_data(mesh_meta_data),
     m_mark_entity(),
     m_add_node_sharing_called(false),
     m_closure_count(),
     m_mesh_indexes(),
-    m_entity_repo(new impl::EntityRepository()),
+    m_entityKeyMapping(new impl::EntityKeyMapping()),
     m_entity_comm_list(),
     m_entitycomm(),
     m_owner(),
-    m_comm_list_updater(m_entity_comm_list, m_entitycomm),
-    m_deleted_entities_current_modification_cycle(),
-    m_ghost_reuse_map(),
+    m_comm_list_updater(m_entity_comm_list, m_entitycomm, m_removedGhosts),
     m_entity_keys(),
 #ifdef SIERRA_MIGRATION
     m_add_fmwk_data(add_fmwk_data),
@@ -470,7 +466,6 @@ BulkData::BulkData(std::shared_ptr<MetaData> mesh_meta_data,
     m_volatile_fast_shared_comm_map_sync_count(0),
     m_all_sharing_procs(mesh_meta_data->entity_rank_count()),
     m_ghost_parts(),
-    m_deleted_entities(),
     m_num_fields(-1), // meta data not necessarily committed yet
     m_keep_fields_updated(true),
     m_local_ids(),
@@ -496,7 +491,7 @@ BulkData::BulkData(std::shared_ptr<MetaData> mesh_meta_data,
      mesh_meta_data->set_mesh_bulk_data(this);
   }
   catch(...) {
-      delete m_entity_repo;
+      delete m_entityKeyMapping;
       throw;
   }
 
@@ -546,7 +541,7 @@ BulkData::~BulkData()
   mesh_meta_data().set_mesh_bulk_data(nullptr);
 
   delete m_elemElemGraph;
-  delete m_entity_repo;
+  delete m_entityKeyMapping;
 
   delete m_ngpMeshBase;
 }
@@ -594,18 +589,7 @@ void BulkData::set_automatic_aura_option(AutomaticAuraOption auraOption, bool ap
 
 void BulkData::update_deleted_entities_container()
 {
-  while(!m_deleted_entities_current_modification_cycle.empty()) {
-    Entity::entity_value_type entity_offset = m_deleted_entities_current_modification_cycle.front();
-    m_deleted_entities_current_modification_cycle.pop_front();
-    m_deleted_entities.push_front(entity_offset);
-  }
-
-  // Reclaim offsets for deleted ghosts that were not regenerated
-  for (auto keyAndOffset : m_ghost_reuse_map) {
-    m_deleted_entities.push_front(keyAndOffset.second);
-  }
-
-  m_ghost_reuse_map.clear();
+  m_meshModification.get_deleted_entity_cache().update_deleted_entities_container();
 }
 
 //----------------------------------------------------------------------
@@ -712,9 +696,12 @@ Entity BulkData::generate_new_entity(unsigned preferred_offset)
   if (preferred_offset != 0) {
     new_local_offset = preferred_offset;
   }
-  else if (!m_deleted_entities.empty()) {
-    new_local_offset = m_deleted_entities.front();
-    m_deleted_entities.pop_front();
+  else {
+    Entity::entity_value_type local_offset = m_meshModification.get_deleted_entity_cache().get_entity_for_reuse();
+    if (local_offset != Entity::InvalidEntity)
+    {
+      new_local_offset = local_offset;
+    }
   }
 
   MeshIndex mesh_index = {nullptr, 0};
@@ -985,23 +972,6 @@ template Entity BulkData::declare_element_side_with_id<stk::mesh::PartVector>(co
 template Entity BulkData::declare_element_side_with_id<stk::mesh::ConstPartVector>(const stk::mesh::EntityId, Entity, const unsigned, const stk::mesh::ConstPartVector&);
 
 
-//----------------------------------------------------------------------
-
-namespace {
-
-// A method for quickly finding an entity within a comm list
-const EntityCommListInfo& find_entity(const BulkData& mesh,
-                               const EntityCommListInfoVector& entities,
-                               const EntityKey& key)
-{
-  EntityCommListInfoVector::const_iterator lb_itr = std::lower_bound(entities.begin(), entities.end(), key);
-  ThrowAssertMsg(lb_itr != entities.end() && lb_itr->key == key,
-                 "proc " << mesh.parallel_rank() << " Cannot find entity-key " << key << " in comm-list" );
-  return *lb_itr;
-}
-
-}
-
 void BulkData::entity_comm_list_insert(Entity node)
 {
   stk::mesh::EntityKey key = entity_key(node);
@@ -1225,7 +1195,7 @@ void BulkData::change_entity_id( EntityId id, Entity entity)
 
 void BulkData::internal_change_entity_key( EntityKey old_key, EntityKey new_key, Entity entity)
 {
-    m_entity_repo->update_entity_key(new_key, old_key, entity);
+    m_entityKeyMapping->update_entity_key(new_key, old_key, entity);
     set_entity_key(entity, new_key);
     m_bucket_repository.set_needs_to_be_sorted(this->bucket(entity), true);
 }
@@ -1298,15 +1268,8 @@ bool BulkData::internal_destroy_entity(Entity entity, bool wasGhost)
     }
   }
 
-  // If this is a ghosted entity, store key->local_offset so that local_offset can be
-  // reused if the entity is recreated in the next aura-regen. This will prevent clients
-  // from having their handles to ghosted entities go invalid when the ghost is refreshed.
-  const stk::mesh::EntityKey key = entity_key(entity);
-  if ( ghost ) {
-    m_ghost_reuse_map[key] = entity.local_offset();
-  }
-
   // Need to invalidate Entity handles in comm-list
+  const stk::mesh::EntityKey key = entity_key(entity);
   stk::mesh::EntityCommListInfoVector::iterator lb_itr =
     std::lower_bound(m_entity_comm_list.begin(), m_entity_comm_list.end(), key);
   if (lb_itr != m_entity_comm_list.end() && lb_itr->key == key) {
@@ -1317,24 +1280,21 @@ bool BulkData::internal_destroy_entity(Entity entity, bool wasGhost)
 
   m_bucket_repository.remove_entity(mesh_index(entity));
 
-  record_entity_deletion(entity);
+  record_entity_deletion(entity, ghost);
 
-  if ( !ghost ) {
-    m_deleted_entities_current_modification_cycle.push_front(entity.local_offset());
-  }
 
   m_check_invalid_rels = true;
   return true ;
 }
 
-void BulkData::record_entity_deletion(Entity entity)
+void BulkData::record_entity_deletion(Entity entity, bool isGhost)
 {
     const EntityKey key = entity_key(entity);
     set_mesh_index(entity, 0, 0);
-    m_entity_repo->destroy_entity(key, entity);
+    m_entityKeyMapping->destroy_entity(key, entity);
     notifier.notify_local_entities_created_or_deleted(key.rank());
     notifier.notify_local_buckets_changed(key.rank());
-    m_meshModification.mark_entity_as_deleted(entity.local_offset());
+    m_meshModification.mark_entity_as_deleted(entity, isGhost);
     m_mark_entity[entity.local_offset()] = NOT_MARKED;
     m_closure_count[entity.local_offset()] = static_cast<uint16_t>(0u);
 }
@@ -1352,7 +1312,7 @@ size_t get_max_num_ids_needed_across_all_procs(const stk::mesh::BulkData& bulkDa
 std::vector<uint64_t> BulkData::internal_get_ids_in_use(stk::topology::rank_t rank, const std::vector<stk::mesh::EntityId>& reserved_ids) const
 {
   std::vector<uint64_t> ids_in_use;
-  ids_in_use.reserve(m_entity_keys.size() + m_deleted_entities_current_modification_cycle.size());
+  ids_in_use.reserve(m_entity_keys.size() + m_meshModification.get_deleted_entity_cache().get_deleted_entities_current_mod_cycle().size());
 
   const BucketVector& bkts = this->buckets(rank);
   for (const Bucket* bptr : bkts) {
@@ -1361,7 +1321,7 @@ std::vector<uint64_t> BulkData::internal_get_ids_in_use(stk::topology::rank_t ra
     }
   }
 
-  for (Entity::entity_value_type local_offset : m_deleted_entities_current_modification_cycle) {
+  for (Entity::entity_value_type local_offset : m_meshModification.get_deleted_entity_cache().get_deleted_entities_current_mod_cycle()) {
     stk::mesh::Entity entity;
     entity.set_local_offset(local_offset);
     if ((entity_rank(entity) == rank) && (is_valid(entity) || state(entity)==Deleted)) {
@@ -1415,7 +1375,7 @@ void BulkData::generate_new_ids(stk::topology::rank_t rank, size_t numIdsNeeded,
   if ( globalNumIdsRequested == 0 ) return;
 
   EntityId globalMaxId = impl::get_global_max_id_in_use(*this, rank,
-                                   m_deleted_entities_current_modification_cycle);
+                                   m_meshModification.get_deleted_entity_cache().get_deleted_entities_current_mod_cycle());
 
   uint64_t maxAllowedId = get_max_allowed_id();
   uint64_t availableIds = maxAllowedId - globalMaxId;
@@ -1465,7 +1425,7 @@ std::pair<Entity, bool> BulkData::internal_create_entity(EntityKey key, size_t p
 {
     m_modSummary.track_declare_entity(key.rank(), key.id(), stk::mesh::PartVector());
 
-    std::pair<entity_iterator ,bool> entityBoolPair = m_entity_repo->internal_create_entity(key);
+    std::pair<entity_iterator ,bool> entityBoolPair = m_entityKeyMapping->internal_create_entity(key);
 
     if(entityBoolPair.second)
     {
@@ -1529,7 +1489,7 @@ void BulkData::declare_entities(stk::topology::rank_t rank, const IDVECTOR& newI
 
         m_modSummary.track_declare_entity(key.rank(), key.id(), stk::mesh::PartVector());
     
-        std::pair<entity_iterator ,bool> entityBoolPair = m_entity_repo->internal_create_entity(key);
+        std::pair<entity_iterator ,bool> entityBoolPair = m_entityKeyMapping->internal_create_entity(key);
     
         ThrowErrorMsgIf( ! entityBoolPair.second,
                 "Generated id " << key.id() << " of rank " << key.rank() << " which was already used.");
@@ -1719,10 +1679,11 @@ bool BulkData::is_communicated_with_proc(Entity entity, int proc) const
 
 void BulkData::comm_procs(Entity entity, std::vector<int> & procs ) const
 {
-  ThrowAssertMsg(is_valid(entity),
-                  "BulkData::comm_procs ERROR, input entity "<<entity_key(entity)<<" not a valid entity. Contact sierra-help@sandia.gov");
-
-  impl::fill_sorted_procs(internal_entity_comm_map(entity), procs);
+  procs.clear();
+  const EntityComm* entityComm = m_entitycomm[entity.local_offset()];
+  if (entityComm != nullptr) {
+    impl::fill_sorted_procs(PairIterEntityComm(entityComm->comm_map.begin(),entityComm->comm_map.end()), procs);
+  }
 }
 
 void BulkData::comm_shared_procs(EntityKey key, std::vector<int> & procs ) const
@@ -2072,12 +2033,12 @@ void BulkData::update_field_data_states()
 
 const_entity_iterator BulkData::begin_entities(EntityRank ent_rank) const
 {
-  return m_entity_repo->begin_rank(ent_rank);
+  return m_entityKeyMapping->begin_rank(ent_rank);
 }
 
 const_entity_iterator BulkData::end_entities(EntityRank ent_rank) const
 {
-  return m_entity_repo->end_rank(ent_rank);
+  return m_entityKeyMapping->end_rank(ent_rank);
 }
 
 Entity BulkData::get_entity( EntityRank ent_rank , EntityId entity_id ) const
@@ -2085,12 +2046,12 @@ Entity BulkData::get_entity( EntityRank ent_rank , EntityId entity_id ) const
   if (!impl::is_good_rank_and_id(mesh_meta_data(), ent_rank, entity_id)) {
       return Entity();
   }
-  return m_entity_repo->get_entity( EntityKey(ent_rank, entity_id));
+  return m_entityKeyMapping->get_entity( EntityKey(ent_rank, entity_id));
 }
 
 Entity BulkData::get_entity( const EntityKey key ) const
 {
-  return m_entity_repo->get_entity(key);
+  return m_entityKeyMapping->get_entity(key);
 }
 
 void BulkData::reorder_buckets_callback(EntityRank rank, const std::vector<unsigned>& reorderedBucketIds)
@@ -2760,7 +2721,7 @@ void BulkData::internal_change_entity_owner( const std::vector<EntityProc> & arg
   // Compute the closure of all the locally changing entities
   for (const EntityProc& entityProc : local_change) {
       store_entity_proc_in_set.proc = entityProc.second;
-      impl::VisitClosureGeneral(*this,entityProc.first,store_entity_proc_in_set,store_entity_proc_in_set);
+      impl::VisitClosureGeneral(*this,entityProc.first,entity_rank(entityProc.first),store_entity_proc_in_set,store_entity_proc_in_set);
   }
 
   // Calculate all the ghosts that are impacted by the set of ownership
@@ -3241,7 +3202,10 @@ void BulkData::internal_verify_inputs_and_change_ghosting(
 
 //----------------------------------------------------------------------
 
-void BulkData::ghost_entities_and_fields(Ghosting & ghosting, const std::set<EntityProc , EntityLess>& sendGhosts, bool isFullRegen)
+void BulkData::ghost_entities_and_fields(Ghosting & ghosting,
+                                         const std::set<EntityProc , EntityLess>& sendGhosts,
+                                         bool isFullRegen,
+                                         const std::vector<EntityProc>& removedSendGhosts)
 {
     //------------------------------------
     // Push newly ghosted entities to the receivers and update the comm list.
@@ -3261,6 +3225,8 @@ void BulkData::ghost_entities_and_fields(Ghosting & ghosting, const std::set<Ent
           // Not already being sent , must send it.
           CommBuffer & buf = commSparse.send_buffer( proc );
           buf.pack<unsigned>( entity_rank(entity) );
+          unsigned flag = 1;
+          buf.pack<unsigned>(flag);
           pack_entity_info(*this, buf , entity );
           pack_field_values(*this, buf , entity );
 
@@ -3274,6 +3240,14 @@ void BulkData::ghost_entities_and_fields(Ghosting & ghosting, const std::set<Ent
         }
       }
 
+      for(const EntityProc& ep : removedSendGhosts) {
+        CommBuffer& buf = commSparse.send_buffer(ep.second);
+        buf.pack<unsigned>(entity_rank(ep.first));
+        unsigned flag = 0;
+        buf.pack<unsigned>(flag);
+        buf.pack<EntityKey>(entity_key(ep.first));
+      }
+
       if (phase == 0) {
         commSparse.allocate_buffers();
       }
@@ -3287,6 +3261,7 @@ void BulkData::ghost_entities_and_fields(Ghosting & ghosting, const std::set<Ent
     OrdinalVector ordinal_scratch, empty, partOrdinals, scratchSpace;
     PartVector parts ;
     std::vector<Relation> relations ;
+    std::vector<EntityProc> removedRecvGhosts;
 
     const MetaData & meta = mesh_meta_data() ;
     const unsigned rank_count = meta.entity_rank_count();
@@ -3305,12 +3280,30 @@ void BulkData::ghost_entities_and_fields(Ghosting & ghosting, const std::set<Ent
           // If not the current entity rank, break the iteration
           // until a subsequent entity rank iteration.
           {
-            unsigned this_rank = ~0u ;
-            buf.peek<unsigned>( this_rank );
+            unsigned rankAndFlag[2] = {~0u,~0u};
+            buf.peek<unsigned>( rankAndFlag, 2 );
 
-            if ( this_rank != rank ) break ;
+            if ( rankAndFlag[1] == 1 && rankAndFlag[0] != rank ) break ;
 
-            buf.unpack<unsigned>( this_rank );
+            if (rankAndFlag[1] == 0) {
+              while(buf.remaining()) {
+                buf.unpack<unsigned>( rankAndFlag[0] );
+                buf.unpack<unsigned>( rankAndFlag[1] );
+  
+                ThrowAssert(rankAndFlag[1] == 0);
+                EntityKey key;
+                buf.unpack<EntityKey>(key);
+                Entity rmEnt = get_entity(key);
+                if (!is_valid(rmEnt)) {
+                  continue;
+                }
+                removedRecvGhosts.push_back(EntityProc(rmEnt,p));
+              }
+              break;
+            }
+
+            buf.unpack<unsigned>( rankAndFlag[0] );
+            buf.unpack<unsigned>( rankAndFlag[1] );
           }
 
           parts.clear();
@@ -3326,10 +3319,11 @@ void BulkData::ghost_entities_and_fields(Ghosting & ghosting, const std::set<Ent
             insert( parts, ghost_part );
           }
 
-          GhostReuseMap::iterator f_itr = m_ghost_reuse_map.find(key);
-          const size_t use_this_offset = f_itr == m_ghost_reuse_map.end() ? 0 : f_itr->second;
+          auto& ghost_reuse_map = m_meshModification.get_deleted_entity_cache().get_ghost_reuse_map();
+          GhostReuseMap::iterator f_itr = ghost_reuse_map.find(key);
+          const size_t use_this_offset = f_itr == ghost_reuse_map.end() ? 0 : f_itr->second;
           if (use_this_offset != 0) {
-            m_ghost_reuse_map.erase(f_itr);
+            ghost_reuse_map.erase(f_itr);
           }
 
           std::pair<Entity ,bool> result = internal_get_or_create_entity_with_notification( key, use_this_offset );
@@ -3391,6 +3385,35 @@ void BulkData::ghost_entities_and_fields(Ghosting & ghosting, const std::set<Ent
       m_entity_comm_list.erase( std::unique( m_entity_comm_list.begin() , m_entity_comm_list.end() ) ,
                                 m_entity_comm_list.end() );
     }
+
+    OrdinalVector addParts, scratchOrdinalVec;
+    OrdinalVector removeParts(1, ghosting_part(ghosting).mesh_meta_data_ordinal());
+    EntityCommListInfoVector& commList = m_entity_comm_list;
+  
+    stk::util::sort_and_unique(removedRecvGhosts, EntityLess(*this));
+    for(unsigned i=0; i<removedRecvGhosts.size(); ++i) {
+      const unsigned reverseIdx = removedRecvGhosts.size() - i - 1;
+      const EntityKey key = entity_key(removedRecvGhosts[reverseIdx].first);
+      const int proc = removedRecvGhosts[reverseIdx].second;
+      const bool removed = entity_comm_map_erase(key, EntityCommInfo(ghosting.ordinal(), proc));
+      if (removed) {
+        EntityCommListInfoVector::iterator itr = std::lower_bound(commList.begin(), commList.end(), key);
+        if (itr != commList.end() && itr->key == key) {
+          const int owner = parallel_owner_rank(itr->entity);
+          if (owner != parallel_rank()) {
+            if ( internal_entity_comm_map(itr->entity).empty() ) {
+              if (is_valid(itr->entity)) {
+                internal_destroy_entity_with_notification(itr->entity, true);
+              }
+            }
+            else {
+              internal_change_entity_parts(itr->entity, addParts, removeParts, scratchOrdinalVec, scratchSpace);
+            }
+          }
+        }
+      }
+    }
+    delete_unneeded_entries_from_the_comm_list();
 }
 
 void BulkData::conditionally_add_entity_to_ghosting_set(const stk::mesh::Ghosting &ghosting, stk::mesh::Entity entity, int toProc, std::set <stk::mesh::EntityProc , stk::mesh::EntityLess > &entitiesWithClosure)
@@ -3498,8 +3521,8 @@ void BulkData::filter_ghosting_remove_receives(const stk::mesh::Ghosting &ghosti
       Entity const *rels_e = end(e, irank);
       for (; rels_i != rels_e; ++rels_i)
       {
-        if (erank > stk::topology::ELEM_RANK) {
-          impl::VisitClosureGeneral(*this, *rels_i, vpb, org);
+        if (irank > stk::topology::ELEM_RANK) {
+          impl::VisitClosureGeneral(*this, *rels_i, irank, vpb, org);
         }
         else {
           if ( is_valid(*rels_i) &&
@@ -3545,7 +3568,7 @@ void BulkData::internal_change_ghosting(
   for ( const EntityProc& entityProc : add_send ) {
       og.proc = entityProc.second;
       sieps.proc = entityProc.second;
-      impl::VisitClosureGeneral(*this,entityProc.first,sieps,og);
+      impl::VisitClosureGeneral(*this,entityProc.first,entity_rank(entityProc.first),sieps,og);
   }
 
   //remove newSendGhosts that are already in comm-list:
@@ -3666,98 +3689,6 @@ int BulkData::determine_new_owner( Entity entity ) const
   return new_owner ;
 }
 
-bool BulkData::pack_entity_modification( const bool packShared , stk::CommSparse & comm )
-{
-  bool flag = false;
-  bool packGhosted = packShared == false;
-
-  const EntityCommListInfoVector & entityCommList = this->internal_comm_list();
-
-  for ( EntityCommListInfoVector::const_iterator
-        i = entityCommList.begin() ; i != entityCommList.end() ; ++i ) {
-    if (i->entity_comm != nullptr) {
-      Entity entity = i->entity;
-      EntityState status = this->is_valid(entity) ? this->state(entity) : Deleted;
-
-      if ( status == Modified || status == Deleted ) {
-        int owned_closure_int = owned_closure(entity) ? 1 : 0;
-  
-        for ( PairIterEntityComm ec(i->entity_comm->comm_map); ! ec.empty() ; ++ec )
-        {
-          if ( ( packGhosted && ec->ghost_id > BulkData::SHARED ) || ( packShared && ec->ghost_id == BulkData::SHARED ) )
-          {
-            comm.send_buffer( ec->proc )
-                .pack<EntityKey>( i->key )
-                .pack<EntityState>( status )
-                .pack<int>(owned_closure_int);
-  
-            const bool promotingGhostToShared =
-              packGhosted && owned_closure_int==1 && !bucket(entity).owned();
-            if (promotingGhostToShared) {
-              comm.send_buffer(parallel_rank())
-                  .pack<EntityKey>( i->key )
-                  .pack<EntityState>( status )
-                  .pack<int>(owned_closure_int);
-            }
-
-            flag = true ;
-          }
-        }
-      }
-    }
-  }
-
-  return flag ;
-}
-
-void BulkData::communicate_entity_modification( const bool shared , std::vector<EntityParallelState > & data )
-{
-  stk::CommSparse comm( this->parallel() );
-  const int p_size = comm.parallel_size();
-
-  // Sizing send buffers:
-  pack_entity_modification(shared , comm);
-
-  const bool needToSendOrRecv = comm.allocate_buffers();
-  if ( needToSendOrRecv )
-  {
-
-    // Packing send buffers:
-    pack_entity_modification(shared , comm);
-
-    comm.communicate();
-
-    const EntityCommListInfoVector & entityCommList = this->internal_comm_list();
-    for ( int procNumber = 0 ; procNumber < p_size ; ++procNumber ) {
-      CommBuffer & buf = comm.recv_buffer( procNumber );
-      EntityKey key;
-      EntityState state;
-      int remote_owned_closure_int;
-      bool remote_owned_closure;
-
-      while ( buf.remaining() ) {
-
-        buf.unpack<EntityKey>( key )
-           .unpack<EntityState>( state )
-           .unpack<int>( remote_owned_closure_int);
-        remote_owned_closure = ((remote_owned_closure_int==1)?true:false);
-
-        // search through entity_comm, should only receive info on entities
-        // that are communicated.
-        EntityCommListInfo info = find_entity(*this, entityCommList, key);
-        int remoteProc = procNumber;
-        if (!shared && remoteProc == parallel_rank()) {
-          remoteProc = parallel_owner_rank(info.entity);
-        }
-        EntityParallelState parallel_state = {remoteProc, state, info, remote_owned_closure, this};
-        data.push_back( parallel_state );
-      }
-    }
-  }
-
-  std::sort( data.begin() , data.end() );
-}
-
 //----------------------------------------------------------------------
 //----------------------------------------------------------------------
 
@@ -3932,34 +3863,6 @@ void BulkData::internal_update_sharing_comm_map_and_fill_list_modified_shared_en
   std::fill(m_mark_entity.begin(), m_mark_entity.end(), BulkData::NOT_MARKED);
 }
 
-
-
-//----------------------------------------------------------------------
-
-void BulkData::internal_establish_new_owner(stk::mesh::Entity entity)
-{
-    const int new_owner = determine_new_owner(entity);
-
-    internal_set_owner(entity, new_owner);
-}
-
-void BulkData::internal_update_parts_for_shared_entity(stk::mesh::Entity entity, const bool is_entity_shared, const bool did_i_just_become_owner)
-{
-    OrdinalVector parts_to_add_entity_to , parts_to_remove_entity_from, scratchOrdinalVec, scratchSpace;
-
-    if ( !is_entity_shared ) {
-      parts_to_remove_entity_from.push_back(mesh_meta_data().globally_shared_part().mesh_meta_data_ordinal());
-    }
-
-    if ( did_i_just_become_owner ) {
-      parts_to_add_entity_to.push_back(mesh_meta_data().locally_owned_part().mesh_meta_data_ordinal());
-    }
-
-    if ( ! parts_to_add_entity_to.empty() || ! parts_to_remove_entity_from.empty() ) {
-      internal_change_entity_parts( entity , parts_to_add_entity_to , parts_to_remove_entity_from, scratchOrdinalVec, scratchSpace );
-    }
-}
-
 void BulkData::filter_upward_ghost_relations(const Entity entity, std::function<void(Entity)> filter)
 {
   EntityRank rank = entity_rank(entity);
@@ -3999,182 +3902,6 @@ EntityVector BulkData::get_upward_send_ghost_relations(const Entity entity)
   return ghosts;
 }
 
-void BulkData::add_entity_to_same_ghosting(Entity entity, Entity connectedGhost) {
-  for(PairIterEntityComm ec(internal_entity_comm_map(connectedGhost)); ! ec.empty(); ++ec) {
-    if (ec->ghost_id > BulkData::AURA) {
-      entity_comm_map_insert(entity, EntityCommInfo(ec->ghost_id, ec->proc));
-      entity_comm_list_insert(entity);
-    }
-  }
-}
-
-void BulkData::internal_resolve_formerly_shared_entities(const EntityVector& entitiesNoLongerShared)
-{
-  for(Entity entity : entitiesNoLongerShared) {
-    EntityVector ghostRelations = get_upward_send_ghost_relations(entity);
-
-    for(Entity ghost : ghostRelations) {
-      add_entity_to_same_ghosting(entity, ghost);
-    }
-  }
-}
-
-//----------------------------------------------------------------------
-// Resolve modifications for ghosted entities:
-// If a ghosted entity is modified or destroyed on the owning
-// process then the ghosted entity must be destroyed.
-//
-// Post condition:
-//  Ghosted entities of modified or deleted entities are destroyed.
-//  Ghosted communication lists are cleared to reflect all deletions.
-
-void BulkData::internal_resolve_ghosted_modify_delete(const stk::mesh::EntityVector& entitiesNoLongerShared)
-{
-  ThrowRequireMsg(parallel_size() > 1, "Do not call this in serial");
-  // Resolve modifications for ghosted entities:
-
-  std::vector<EntityParallelState > remotely_modified_ghosted_entities ;
-  internal_resolve_formerly_shared_entities(entitiesNoLongerShared);
-
-  // Communicate entity modification state for ghost entities
-  const bool communicate_shared = false ;
-  communicate_entity_modification( communicate_shared , remotely_modified_ghosted_entities );
-
-  const size_t ghosting_count = m_ghosting.size();
-  const size_t ghosting_count_minus_shared = ghosting_count - 1;
-
-  std::vector<Entity> promotingToShared;
-
-  // We iterate backwards over remote_mod to ensure that we hit the
-  // higher-ranking entities first. This is important because higher-ranking
-  // entities like element must be deleted before the nodes they have are
-  // deleted.
-  for ( std::vector<EntityParallelState>::reverse_iterator
-        i = remotely_modified_ghosted_entities.rbegin(); i != remotely_modified_ghosted_entities.rend() ; ++i )
-  {
-    Entity entity                 = i->comm_info.entity;
-    const EntityKey key           = i->comm_info.key;
-    const int      remote_proc    = i->from_proc;
-    const bool     local_owner    = parallel_owner_rank(entity) == parallel_rank() ;
-    const bool remotely_destroyed = Deleted == i->state ;
-    const bool remote_proc_is_owner = remote_proc == parallel_owner_rank(entity);
-    const bool isAlreadyDestroyed  = !is_valid(entity);
-
-    if ( local_owner ) { // Sending to 'remote_proc' for ghosting
-
-      if ( remotely_destroyed ) {
-
-        // remove from ghost-send list
-
-        for ( size_t j = ghosting_count_minus_shared ; j>=1 ; --j) {
-          entity_comm_map_erase( key, EntityCommInfo( j , remote_proc ) );
-        }
-      }
-      else {
-        if (!in_ghost(aura_ghosting(), entity) && state(entity)==Unchanged) {
-          set_state(entity, Modified);
-        }
-
-        const bool shouldPromoteToShared = !isAlreadyDestroyed && i->remote_owned_closure==1 && key.rank() < stk::topology::ELEM_RANK;
-        if (shouldPromoteToShared) {
-          entity_comm_map_insert(entity, EntityCommInfo(SHARED, remote_proc));
-          promotingToShared.push_back(entity);
-        }
-      }
-    }
-    else if (remote_proc_is_owner) { // Receiving from 'remote_proc' for ghosting
-
-      const bool hasBeenPromotedToSharedOrOwned = this->owned_closure(entity);
-      bool isAuraGhost = false;
-      bool isCustomGhost = false;
-      PairIterEntityComm pairIterEntityComm = internal_entity_comm_map(entity);
-      if(pairIterEntityComm.empty()) {
-        if(std::binary_search(entitiesNoLongerShared.begin(), entitiesNoLongerShared.end(), entity)) {
-          EntityVector ghosts = get_upward_recv_ghost_relations(entity);
-
-          for(Entity ghost : ghosts) {
-            add_entity_to_same_ghosting(entity, ghost);
-          }
-        }
-      } else {
-        for(unsigned j=0; j<pairIterEntityComm.size(); ++j)
-        {
-          if (pairIterEntityComm[j].ghost_id == AURA)
-          {
-            isAuraGhost = true;
-          }
-          else if (pairIterEntityComm[j].ghost_id > AURA)
-          {
-            isCustomGhost = true;
-          }
-        }
-      }
-
-      if ( isAuraGhost ) {
-        if (!isAlreadyDestroyed && hasBeenPromotedToSharedOrOwned) {
-          entity_comm_map_insert(entity, EntityCommInfo(SHARED, remote_proc));
-          promotingToShared.push_back(entity);
-        }
-        entity_comm_map_erase(key, aura_ghosting());
-      }
-
-      if(!isAlreadyDestroyed)
-      {
-        const bool wasDestroyedByOwner = remotely_destroyed;
-        const bool shouldDestroyGhost = wasDestroyedByOwner || (isAuraGhost && !isCustomGhost && !hasBeenPromotedToSharedOrOwned);
-        const bool shouldRemoveFromGhosting = remotely_destroyed && !isAuraGhost && hasBeenPromotedToSharedOrOwned;
-
-        if (shouldRemoveFromGhosting) {
-            for ( size_t j = ghosting_count_minus_shared ; j >=1 ; --j ) {
-                entity_comm_map_erase( key, *m_ghosting[j] );
-            }
-        }
-
-        if ( shouldDestroyGhost )
-        {
-          const bool was_ghost = true;
-          internal_destroy_entity_with_notification(entity, was_ghost);
-        }
-
-        entity_comm_list_insert(entity);
-      }
-    }
-  } // end loop on remote mod
-
-  // Erase all ghosting communication lists for:
-  // 1) Destroyed entities.
-  // 2) Owned and modified entities.
-
-  for ( EntityCommListInfoVector::const_reverse_iterator
-        i = internal_comm_list().rbegin() ; i != internal_comm_list().rend() ; ++i) {
-
-    Entity entity = i->entity;
-
-    const bool locally_destroyed = !is_valid(entity);
-    const bool locally_owned_and_modified = locally_destroyed ? false :
-      (Modified == state(entity) && (parallel_rank() == parallel_owner_rank(entity)));
-
-    if ( locally_destroyed ) {
-      for ( size_t j = ghosting_count_minus_shared ; j >=1 ; --j ) {
-        entity_comm_map_erase( i->key, *m_ghosting[j] );
-      }
-    }
-    else if ( locally_owned_and_modified ) {
-      entity_comm_map_erase( i->key, aura_ghosting() );
-    }
-  }
-
-  if (!promotingToShared.empty()) {
-    OrdinalVector sharedPart, auraPart, scratchOrdinalVec, scratchSpace;
-    sharedPart.push_back(mesh_meta_data().globally_shared_part().mesh_meta_data_ordinal());
-    auraPart.push_back(mesh_meta_data().aura_part().mesh_meta_data_ordinal());
-    for(Entity entity : promotingToShared) {
-      internal_change_entity_parts(entity, sharedPart /*add*/, auraPart /*remove*/, scratchOrdinalVec, scratchSpace);
-    }
-    add_comm_list_entries_for_entities(promotingToShared);
-  }
-}
-
 void BulkData::resolve_ownership_of_modified_entities( const std::vector<Entity> &shared_modified )
 {
   const BulkData& bulk = *this;
@@ -4985,7 +4712,7 @@ void BulkData::internal_send_part_memberships_from_owner(const std::vector<Entit
 
             remove_parts.clear();
 
-            Entity const entity = find_entity(*this, m_entity_comm_list, key).entity;
+            Entity const entity = impl::find_entity(*this, m_entity_comm_list, key).entity;
 
             const PartVector& current_parts = this->bucket(entity).supersets();
 
@@ -5811,71 +5538,7 @@ bool BulkData::comm_mesh_verify_parallel_consistency(std::ostream & error_log )
   return verified_ok == 1 ;
 }
 
-// Enforce that shared entities must be in the owned closure:
-
-void BulkData::destroy_dependent_ghosts( Entity entity, EntityProcVec& entitiesToRemoveFromSharing )
-{
-  EntityRank entity_rank = this->entity_rank(entity);
-  const EntityRank end_rank = static_cast<EntityRank>(this->mesh_meta_data().entity_rank_count());
-
-  for (EntityRank irank = static_cast<EntityRank>(end_rank - 1); irank > entity_rank; --irank)
-  {
-    int num_rels = this->num_connectivity(entity, irank);
-    const Entity* rels     = this->begin(entity, irank);
-
-    for (int r = num_rels - 1; r >= 0; --r)
-    {
-      Entity e = rels[r];
-
-      bool upwardRelationOfEntityIsInClosure = this->owned_closure(e);
-      ThrowRequireMsg( !upwardRelationOfEntityIsInClosure, this->entity_rank(e) << " with id " << this->identifier(e) << " should not be in closure." );
-
-      // Recursion
-      if (this->is_valid(e) && this->bucket(e).in_aura())
-      {
-          this->destroy_dependent_ghosts( e, entitiesToRemoveFromSharing );
-      }
-    }
-  }
-
-  const bool successfully_destroyed_entity = this->destroy_entity(entity);
-  if (!successfully_destroyed_entity)
-  {
-      std::vector<int> sharing_procs;
-      comm_shared_procs(entity_key(entity), sharing_procs);
-      for(int p : sharing_procs) {
-          entitiesToRemoveFromSharing.emplace_back(entity, p);
-      }
-  }
-}
-
-// Entities with sharing information that are not in the owned closure
-// have been modified such that they are no longer shared.
-// These may no longer be needed or may become ghost entities.
-// There is not enough information so assume they are to be deleted
-// and let these entities be re-ghosted if they are needed.
-
-// Open question: Should an owned and shared entity that does not
-// have an upward relation to an owned entity be destroyed so that
-// ownership transfers to another process?
-
-void BulkData::delete_shared_entities_which_are_no_longer_in_owned_closure(EntityProcVec& entitiesToRemoveFromSharing)
-{
-  for ( EntityCommListInfoVector::const_reverse_iterator
-        i =  internal_comm_list().rbegin() ;
-        i != internal_comm_list().rend() ; ++i)
-  {
-    Entity entity = i->entity;
-    if (is_valid(entity) && !owned_closure(entity)) {
-      if ( in_shared(entity) )
-      {
-        destroy_dependent_ghosts( entity, entitiesToRemoveFromSharing );
-      }
-    }
-  }
-}
-
-void BulkData::remove_entities_from_sharing(const EntityProcVec& entitiesToRemoveFromSharing, stk::mesh::EntityVector & entitiesNoLongerShared)
+void BulkData::remove_entities_from_sharing(const EntityProcVec& entitiesToRemoveFromSharing, EntityVector & entitiesNoLongerShared)
 {
   entitiesNoLongerShared.clear();
   OrdinalVector scratchOrdinalVec, scratchSpace;
@@ -5886,7 +5549,7 @@ void BulkData::remove_entities_from_sharing(const EntityProcVec& entitiesToRemov
           entitiesNoLongerShared.push_back(entityAndProc.first);
           this->internal_change_entity_parts(entityAndProc.first,{},{this->mesh_meta_data().globally_shared_part().mesh_meta_data_ordinal()}, scratchOrdinalVec, scratchSpace);
           this->internal_mark_entity(entityAndProc.first, NOT_SHARED);
-      }
+      }    
   }
   stk::util::sort_and_unique(entitiesNoLongerShared);
 }
@@ -6407,7 +6070,9 @@ void BulkData::mark_entities_as_deleted(stk::mesh::Bucket * bucket)
     for(Entity e : *bucket)
     {
         notifier.notify_entity_deleted(e);
-        record_entity_deletion(e);
+        record_entity_deletion(e, false);  // the only other user of record_entity_deletion adds the
+                                           // entity to the m_deleted_entities_current_modification_cycle if
+                                           // it is not a ghost.  Not sure why this doesn't.
     }
 }
 
diff --git a/packages/stk/stk_mesh/stk_mesh/base/BulkData.hpp b/packages/stk/stk_mesh/stk_mesh/base/BulkData.hpp
index e03ffb431f12..7f648452c677 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/BulkData.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/BulkData.hpp
@@ -80,7 +80,7 @@ namespace stk { namespace mesh { class MetaData; } }
 namespace stk { namespace mesh { class Part; } }
 namespace stk { namespace mesh { class BulkData; } }
 namespace stk { namespace mesh { namespace impl { class AuraGhosting; } } }
-namespace stk { namespace mesh { namespace impl { class EntityRepository; } } }
+namespace stk { namespace mesh { namespace impl { class EntityKeyMapping; } } }
 namespace stk { namespace mesh { class FaceCreator; } }
 namespace stk { namespace mesh { class ElemElemGraph; } }
 namespace stk { namespace mesh { class ElemElemGraphUpdater; } }
@@ -145,7 +145,6 @@ stk::mesh::Entity connect_side_to_element(stk::mesh::BulkData& bulkData, stk::me
                                           stk::mesh::Permutation side_permutation, const stk::mesh::PartVector& parts);
 }
 
-typedef std::unordered_map<EntityKey, Entity::entity_value_type, stk::mesh::HashValueForEntityKey> GhostReuseMap;
 
 struct sharing_info
 {
@@ -175,6 +174,7 @@ class BulkData {
   enum EntitySharing : char { NOT_MARKED=0, POSSIBLY_SHARED=1, IS_SHARED=2, NOT_SHARED };
   enum AutomaticAuraOption { NO_AUTO_AURA, AUTO_AURA };
 
+#ifndef STK_HIDE_DEPRECATED_CODE // Delete after August 2022
   /** \brief  Construct mesh bulk data manager conformal to the given
    *          \ref stk::mesh::MetaData "meta data manager" and will
    *          distribute bulk data over the given parallel machine.
@@ -182,7 +182,7 @@ class BulkData {
    *  - The maximum number of entities per bucket may be supplied.
    *  - The bulk data is in the synchronized or "locked" state.
    */
-  BulkData(   MetaData & mesh_meta_data
+  STK_DEPRECATED BulkData(   MetaData & mesh_meta_data
             , ParallelMachine parallel
             , enum AutomaticAuraOption auto_aura_option = AUTO_AURA
 #ifdef SIERRA_MIGRATION
@@ -191,13 +191,14 @@ class BulkData {
             , FieldDataManager *field_dataManager = nullptr
             , unsigned bucket_capacity = impl::BucketRepository::default_bucket_capacity
             );
+#endif
 
   virtual ~BulkData();
 
   //------------------------------------
   /** \brief  The meta data manager for this bulk data manager. */
-  const MetaData & mesh_meta_data() const { return *m_meta_raw_ptr_to_be_deprecated ; }
-        MetaData & mesh_meta_data()       { return *m_meta_raw_ptr_to_be_deprecated ; }
+  const MetaData & mesh_meta_data() const { return *m_meta_data ; }
+        MetaData & mesh_meta_data()       { return *m_meta_data ; }
 
   std::shared_ptr<MetaData> mesh_meta_data_ptr() {return m_meta_data; }
   const std::shared_ptr<MetaData> mesh_meta_data_ptr() const { return m_meta_data; }
@@ -945,7 +946,8 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
 
   void ghost_entities_and_fields(Ghosting & ghosting,
                                  const std::set<EntityProc , EntityLess>& new_send,
-                                 bool isFullRegen = false);
+                                 bool isFullRegen = false,
+                                 const std::vector<EntityProc>& removedSendGhosts = std::vector<EntityProc>());
 
   void conditionally_add_entity_to_ghosting_set(const stk::mesh::Ghosting &ghosting,
                                                 stk::mesh::Entity entity,
@@ -975,7 +977,7 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
   PairIterEntityComm internal_entity_comm_map(Entity entity, const Ghosting & sub ) const
   {
     if (m_entitycomm[entity.local_offset()] != nullptr) {
-      return ghost_info_range(m_entitycomm[entity.local_offset()]->comm_map, sub);
+      return ghost_info_range(m_entitycomm[entity.local_offset()]->comm_map, sub.ordinal());
     }
     return PairIterEntityComm();
   }
@@ -1103,11 +1105,8 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
   void filter_upward_ghost_relations(const Entity entity, std::function<void(Entity)> filter);
   EntityVector get_upward_send_ghost_relations(const Entity entity);
   EntityVector get_upward_recv_ghost_relations(const Entity entity);
-  void add_entity_to_same_ghosting(Entity entity, Entity connectedGhost);
   void update_comm_list_based_on_changes_in_comm_map();
 
-  void internal_resolve_formerly_shared_entities(const stk::mesh::EntityVector& entitiesNoLongerShared);
-  void internal_resolve_ghosted_modify_delete(const stk::mesh::EntityVector& entitiesNoLongerShared);
   void internal_resolve_shared_part_membership_for_element_death(); // Mod Mark
 
   void remove_unneeded_induced_parts(stk::mesh::Entity entity, const EntityCommInfoVector& entity_comm_info,
@@ -1230,8 +1229,7 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
 
   void check_mesh_consistency();
   bool comm_mesh_verify_parallel_consistency(std::ostream & error_log);
-  void delete_shared_entities_which_are_no_longer_in_owned_closure(EntityProcVec& entitiesToRemoveFromSharing); // Mod Mark
-  virtual void remove_entities_from_sharing(const EntityProcVec& entitiesToRemoveFromSharing, stk::mesh::EntityVector & entitiesNoLongerShared);
+  virtual void remove_entities_from_sharing(const EntityProcVec& entitiesToRemoveFromSharing, EntityVector & entitiesNoLongerShared);
   virtual void check_if_entity_from_other_proc_exists_on_this_proc_and_update_info_if_shared(std::vector<shared_entity_type>& shared_entity_map, int proc_id, const shared_entity_type &sentity);
   void update_owner_global_key_and_sharing_proc(stk::mesh::EntityKey global_key_other_proc,  shared_entity_type& shared_entity_this_proc, int proc_id) const;
   void update_shared_entity_this_proc(EntityKey global_key_other_proc, shared_entity_type& shared_entity_this_proc, int proc_id);
@@ -1289,7 +1287,7 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
   void set_ngp_mesh(NgpMeshBase * ngpMesh) const { m_ngpMeshBase = ngpMesh; }
   NgpMeshBase * get_ngp_mesh() const { return m_ngpMeshBase; }
 
-  void record_entity_deletion(Entity entity);
+  void record_entity_deletion(Entity entity, bool isGhost);
   void break_boundary_relations_and_delete_buckets(const std::vector<impl::RelationEntityToNode> & relationsToDestroy, const stk::mesh::BucketVector & bucketsToDelete);
   void delete_buckets(const stk::mesh::BucketVector & buckets);
   void mark_entities_as_deleted(stk::mesh::Bucket * bucket);
@@ -1311,26 +1309,6 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
 
   void internal_resolve_sharing_and_ghosting_for_sides(bool connectFacesToPreexistingGhosts);
 
-#ifdef __CUDACC__
-public:
-#endif
-  struct EntityParallelState {
-    int                 from_proc;
-    EntityState         state;
-    EntityCommListInfo  comm_info;
-    bool                remote_owned_closure;
-    const BulkData* mesh;
-
-    bool operator<(const EntityParallelState& rhs) const
-    { return EntityLess(*mesh)(comm_info.entity, rhs.comm_info.entity); }
-  };
-#ifdef __CUDACC__
-private:
-#endif
-
-  void communicate_entity_modification( const bool shared , std::vector<EntityParallelState > & data ); // Mod Mark
-  bool pack_entity_modification( const bool packShared , stk::CommSparse & comm );
-
   virtual bool does_entity_need_orphan_protection(stk::mesh::Entity entity) const
   {
       const bool isNode = (stk::topology::NODE_RANK == entity_rank(entity));
@@ -1450,9 +1428,6 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
                                                       ModEndOptimizationFlag opt ); // Mod Mark
 
 
-  void internal_establish_new_owner(stk::mesh::Entity entity);
-  void internal_update_parts_for_shared_entity(stk::mesh::Entity entity, const bool is_entity_shared, const bool did_i_just_become_owner);
-
   inline void internal_check_unpopulated_relations(Entity entity, EntityRank rank) const;
 
   void internal_adjust_closure_count(Entity entity,
@@ -1536,8 +1511,6 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
 
   void reset_add_node_sharing() { m_add_node_sharing_called = false; }
 
-  void destroy_dependent_ghosts( Entity entity, EntityProcVec& entitiesToRemoveFromSharing );
-
   template<typename PARTVECTOR>
   Entity create_and_connect_side(const stk::mesh::EntityId globalSideId,
                                  Entity elem,
@@ -1558,19 +1531,17 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
   static const uint16_t orphaned_node_marking;
   EntityCommDatabase m_entity_comm_map;
   std::vector<Ghosting*> m_ghosting;
-  MetaData *m_meta_raw_ptr_to_be_deprecated;
   std::shared_ptr<MetaData> m_meta_data;
   std::vector<EntitySharing> m_mark_entity; //indexed by Entity
   bool m_add_node_sharing_called;
   std::vector<uint16_t> m_closure_count; //indexed by Entity
   std::vector<MeshIndex> m_mesh_indexes; //indexed by Entity
-  impl::EntityRepository* m_entity_repo;
+  impl::EntityKeyMapping* m_entityKeyMapping;
   EntityCommListInfoVector m_entity_comm_list;
   std::vector<EntityComm*> m_entitycomm;
   std::vector<int> m_owner;
+  std::vector<std::pair<EntityKey,EntityCommInfo>> m_removedGhosts;
   CommListUpdater m_comm_list_updater;
-  std::list<Entity::entity_value_type> m_deleted_entities_current_modification_cycle;
-  GhostReuseMap m_ghost_reuse_map;
   std::vector<EntityKey> m_entity_keys; //indexed by Entity
 
 #ifdef SIERRA_MIGRATION
@@ -1603,7 +1574,6 @@ void get_entities(EntityRank rank, Selector const& selector, EntityVector& outpu
   mutable unsigned m_volatile_fast_shared_comm_map_sync_count;
   std::vector<std::vector<int> > m_all_sharing_procs;
   PartVector m_ghost_parts;
-  std::list<Entity::entity_value_type> m_deleted_entities;
   int m_num_fields;
   bool m_keep_fields_updated;
   std::vector<unsigned> m_local_ids; //indexed by Entity
diff --git a/packages/stk/stk_mesh/stk_mesh/base/CommListUpdater.hpp b/packages/stk/stk_mesh/stk_mesh/base/CommListUpdater.hpp
index 08e334714926..05dfe6ce99f5 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/CommListUpdater.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/CommListUpdater.hpp
@@ -44,12 +44,19 @@ namespace mesh {
 class CommListUpdater  : public CommMapChangeListener {
 public:
     CommListUpdater(EntityCommListInfoVector& comm_list,
-                    std::vector<EntityComm*>& entity_comms)
-    : m_comm_list(comm_list), m_entity_comms(entity_comms)
+                    std::vector<EntityComm*>& entity_comms,
+                    std::vector<std::pair<EntityKey,EntityCommInfo>>& removedGhosts)
+    : m_comm_list(comm_list),
+      m_entity_comms(entity_comms),
+      m_removedGhosts(removedGhosts)
     {}
     virtual ~CommListUpdater(){}
 
-    virtual void removedKey(const EntityKey& key) {
+    void removedGhost(const EntityKey& key, unsigned ghostId, int proc) override {
+      m_removedGhosts.emplace_back(key, EntityCommInfo(ghostId, proc));
+    }
+
+    void removedKey(const EntityKey& key) override {
         EntityCommListInfoVector::iterator iter =
                 std::lower_bound(m_comm_list.begin(), m_comm_list.end(), key);
         if (iter != m_comm_list.end() && iter->key == key) {
@@ -61,6 +68,7 @@ class CommListUpdater  : public CommMapChangeListener {
 private:
   EntityCommListInfoVector& m_comm_list;
   std::vector<EntityComm*>& m_entity_comms;
+  std::vector<std::pair<EntityKey,EntityCommInfo>>& m_removedGhosts;
 };
 
 }
diff --git a/packages/stk/stk_mesh/stk_mesh/base/DeviceField.hpp b/packages/stk/stk_mesh/stk_mesh/base/DeviceField.hpp
index 07368d21f3ba..0d077012ad37 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/DeviceField.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/DeviceField.hpp
@@ -474,12 +474,8 @@ class DeviceField : public NgpFieldBase
 
     newDeviceSelectedBucketOffset = UnsignedViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, hostField->name() + "_bucket_offset"),
                                                      allBuckets.size());
-#ifndef NEW_TRILINOS_INTEGRATION
-    newHostSelectedBucketOffset = Kokkos::create_mirror_view(Kokkos::HostSpace(), newDeviceSelectedBucketOffset, Kokkos::WithoutInitializing);
-#else
     newHostSelectedBucketOffset =
         Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), newDeviceSelectedBucketOffset);
-#endif
 
     for(unsigned i = 0; i < allBuckets.size(); i++) {
       if(selector(*allBuckets[i])) {
diff --git a/packages/stk/stk_mesh/stk_mesh/base/DeviceMesh.cpp b/packages/stk/stk_mesh/stk_mesh/base/DeviceMesh.cpp
index 30bd8e5479ce..328749115bf2 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/DeviceMesh.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/DeviceMesh.cpp
@@ -48,11 +48,7 @@ void DeviceBucket::initialize_bucket_attributes(const stk::mesh::Bucket &bucket)
 void DeviceBucket::allocate(const stk::mesh::Bucket &bucket)
 {
   nodeOffsets = OrdinalViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "NodeOffsets"), bucket.size()+1);
-#ifndef NEW_TRILINOS_INTEGRATION
-  hostNodeOffsets = Kokkos::create_mirror_view(Kokkos::HostSpace(), nodeOffsets, Kokkos::WithoutInitializing);
-#else
   hostNodeOffsets = Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), nodeOffsets);
-#endif
 
   unsigned maxNodesPerEntity = bucketTopology.num_nodes();
   unsigned totalNumNodes = bucketTopology.num_nodes()*bucketCapacity;
@@ -68,33 +64,17 @@ void DeviceBucket::allocate(const stk::mesh::Bucket &bucket)
   const stk::mesh::PartVector& parts = bucket.supersets();
 
   entities = EntityViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "BucketEntities"), bucketCapacity);
-#ifndef NEW_TRILINOS_INTEGRATION
-  hostEntities = Kokkos::create_mirror_view(Kokkos::HostSpace(), entities, Kokkos::WithoutInitializing);
-#else
   hostEntities = Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), entities);
-#endif
 
   nodeConnectivity = BucketConnectivityType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "BucketConnectivity"), totalNumNodes);
-#ifndef NEW_TRILINOS_INTEGRATION
-  hostNodeConnectivity = Kokkos::create_mirror_view(Kokkos::HostSpace(), nodeConnectivity, Kokkos::WithoutInitializing);
-#else
   hostNodeConnectivity = Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), nodeConnectivity);
-#endif
 
   nodeOrdinals = OrdinalViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "NodeOrdinals"),
                                  static_cast<size_t>(maxNodesPerEntity));
-#ifndef NEW_TRILINOS_INTEGRATION
-  hostNodeOrdinals = Kokkos::create_mirror_view(Kokkos::HostSpace(), nodeOrdinals, Kokkos::WithoutInitializing);
-#else
   hostNodeOrdinals = Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), nodeOrdinals);
-#endif
 
   partOrdinals = PartOrdinalViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "PartOrdinals"), parts.size());
-#ifndef NEW_TRILINOS_INTEGRATION
-  hostPartOrdinals = Kokkos::create_mirror_view(Kokkos::HostSpace(), partOrdinals, Kokkos::WithoutInitializing);
-#else
   hostPartOrdinals = Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), partOrdinals);
-#endif
 }
 
 void DeviceBucket::initialize_from_host(const stk::mesh::Bucket &bucket)
@@ -127,11 +107,7 @@ void DeviceBucket::update_from_host(const stk::mesh::Bucket &bucket)
 
   if (bucketSize+1 != hostNodeOffsets.size()) {
     nodeOffsets = OrdinalViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "NodeOffsets"), bucketSize+1);
-#ifndef NEW_TRILINOS_INTEGRATION
-    hostNodeOffsets = Kokkos::create_mirror_view(Kokkos::HostSpace(), nodeOffsets, Kokkos::WithoutInitializing);
-#else
     hostNodeOffsets = Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), nodeOffsets);
-#endif
   }
 
   unsigned totalNumNodes = bucket.topology().num_nodes()*bucketCapacity;
@@ -147,23 +123,14 @@ void DeviceBucket::update_from_host(const stk::mesh::Bucket &bucket)
 
   if (totalNumNodes != hostNodeConnectivity.size()) {
     nodeConnectivity = BucketConnectivityType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "BucketConnectivity"), totalNumNodes);
-#ifndef NEW_TRILINOS_INTEGRATION
-    hostNodeConnectivity =
-        Kokkos::create_mirror_view(Kokkos::HostSpace(), nodeConnectivity, Kokkos::WithoutInitializing);
-#else
     hostNodeConnectivity =
         Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), nodeConnectivity);
-#endif
   }
 
   if (maxNodesPerEntity != hostNodeOrdinals.size()) {
     nodeOrdinals = OrdinalViewType(Kokkos::view_alloc(Kokkos::WithoutInitializing, "NodeOrdinals"),
                                    static_cast<size_t>(maxNodesPerEntity));
-#ifndef NEW_TRILINOS_INTEGRATION
-    hostNodeOrdinals = Kokkos::create_mirror_view(Kokkos::HostSpace(), nodeOrdinals, Kokkos::WithoutInitializing);
-#else
     hostNodeOrdinals = Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), nodeOrdinals);
-#endif
     for (unsigned i = 0; i < maxNodesPerEntity; ++i) {
       hostNodeOrdinals(i) = static_cast<stk::mesh::ConnectivityOrdinal>(i);
     }
@@ -277,11 +244,7 @@ inline void reallocate_views(DEVICE_VIEW & deviceView, HOST_VIEW & hostView, siz
   if (needGrowth || needShrink) {
     const size_t newSize = requiredSize + static_cast<size_t>(resizeFactor*requiredSize);
     deviceView = DEVICE_VIEW(Kokkos::view_alloc(Kokkos::WithoutInitializing, deviceView.label()), newSize);
-#ifndef NEW_TRILINOS_INTEGRATION
-    hostView = Kokkos::create_mirror_view(Kokkos::HostSpace(), deviceView, Kokkos::WithoutInitializing);
-#else
     hostView = Kokkos::create_mirror_view(Kokkos::WithoutInitializing, Kokkos::HostSpace(), deviceView);
-#endif
   }
 }
 
diff --git a/packages/stk/stk_mesh/stk_mesh/base/EntityCommDatabase.cpp b/packages/stk/stk_mesh/stk_mesh/base/EntityCommDatabase.cpp
index 418540387ef3..deee10010760 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/EntityCommDatabase.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/EntityCommDatabase.cpp
@@ -472,6 +472,9 @@ bool EntityCommDatabase::erase( const EntityKey & key, const EntityCommInfo & va
   const bool result = ( (i != comm_map.end()) && (val == *i) ) ;
 
   if ( result ) {
+    if (m_comm_map_change_listener != nullptr) {
+      m_comm_map_change_listener->removedGhost(key, i->ghost_id, i->proc);
+    }
     comm_map.erase( i );
     bool deleted = false;
     if (comm_map.empty()) {
@@ -515,6 +518,12 @@ bool EntityCommDatabase::erase( const EntityKey & key, const Ghosting & ghost )
   const bool result = i != e ;
 
   if ( result ) {
+    if (m_comm_map_change_listener != nullptr) {
+      for(EntityCommInfoVector::iterator it = i; it != e; ++it) {
+        m_comm_map_change_listener->removedGhost(key, it->ghost_id, it->proc);
+      }
+    }
+
     comm_map.erase( i , e );
     bool deleted = false;
     if (comm_map.empty()) {
diff --git a/packages/stk/stk_mesh/stk_mesh/base/EntityCommDatabase.hpp b/packages/stk/stk_mesh/stk_mesh/base/EntityCommDatabase.hpp
index 0c7befed3007..25ca1d63fa84 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/EntityCommDatabase.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/EntityCommDatabase.hpp
@@ -62,6 +62,7 @@ namespace mesh {
 class CommMapChangeListener {
 public:
     virtual ~CommMapChangeListener(){}
+    virtual void removedGhost(const EntityKey& key, unsigned ghostId, int proc) = 0;
     virtual void removedKey(const EntityKey& key) = 0;
 };
 
@@ -128,17 +129,17 @@ PairIterEntityComm shared_comm_info_range(const EntityCommInfoVector& comm_info_
 }
 
 inline
-PairIterEntityComm ghost_info_range(const EntityCommInfoVector& commInfo, const Ghosting & ghosting)
+PairIterEntityComm ghost_info_range(const EntityCommInfoVector& commInfo, unsigned ghostingOrdinal)
 {
   EntityCommInfoVector::const_iterator ghostBegin = commInfo.begin();
   EntityCommInfoVector::const_iterator ghostEnd, end = commInfo.end();
-  while(ghostBegin != end && ghostBegin->ghost_id != ghosting.ordinal()) {
+  while(ghostBegin != end && ghostBegin->ghost_id != ghostingOrdinal) {
     ++ghostBegin;
   } 
   
   if (ghostBegin != end) {
     ghostEnd = ghostBegin+1;
-    while(ghostEnd != end && ghostEnd->ghost_id == ghosting.ordinal()) {
+    while(ghostEnd != end && ghostEnd->ghost_id == ghostingOrdinal) {
       ++ghostEnd;
     } 
     return PairIterEntityComm( ghostBegin , ghostEnd );
diff --git a/packages/stk/stk_mesh/stk_mesh/base/EntityCommListInfo.hpp b/packages/stk/stk_mesh/stk_mesh/base/EntityCommListInfo.hpp
index 6eda60b5cb9e..81eb78ac083c 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/EntityCommListInfo.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/EntityCommListInfo.hpp
@@ -73,7 +73,7 @@ struct IsInvalid
 {
   bool operator()(const EntityCommListInfo& comm) const
   {
-    return comm.key == EntityKey();
+    return comm.key == EntityKey() || comm.entity_comm == nullptr;
   }
 };
 
diff --git a/packages/stk/stk_mesh/stk_mesh/base/EntityProcMapping.hpp b/packages/stk/stk_mesh/stk_mesh/base/EntityProcMapping.hpp
index ad5ffc58a71f..cd2bdde6405a 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/EntityProcMapping.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/EntityProcMapping.hpp
@@ -79,11 +79,23 @@ bool is_valid(Entity entity)
 
 class EntityProcMapping {
 public:
-  EntityProcMapping(unsigned sizeOfEntityIndexSpace)
+  EntityProcMapping(unsigned sizeOfEntityIndexSpace = 1024)
   : entityOffsets(sizeOfEntityIndexSpace, -1),
     entitiesAndProcs()
   {}
 
+  void reset(unsigned sizeOfEntityIndexSpace)
+  {
+    for(int& n : entityOffsets) {
+      if (n != -1) {
+        n = -1;
+      }
+    }
+//    std::fill(entityOffsets.begin(), entityOffsets.end(), -1);
+    entityOffsets.resize(sizeOfEntityIndexSpace, -1);
+    entitiesAndProcs.clear();
+  }
+ 
   void addEntityProc(Entity entity, int proc)
   {
     int offset = entityOffsets[entity.local_offset()];
@@ -178,38 +190,35 @@ class EntityProcMapping {
     return 0;
   }
 
-  template<typename SetType>
-  void fill_set(SetType& entityProcSet)
+  template<class Alg>
+  void visit_entity_procs(const Alg& alg)
   {
-    entityProcSet.clear();
     for(const EntityAndProcs& entProcs : entitiesAndProcs) {
       if (is_valid(entProcs.entity) && entProcs.proc >= 0) {
-        entityProcSet.insert(EntityProc(entProcs.entity, entProcs.proc));
+        alg(entProcs.entity, entProcs.proc);
       }
       else if (is_valid(entProcs.entity)) {
         for(int p : entProcs.procs) {
-          entityProcSet.insert(EntityProc(entProcs.entity, p));
+          alg(entProcs.entity, p);
         }
       }
     }
   }
 
+  template<typename SetType>
+  void fill_set(SetType& entityProcSet)
+  {
+    entityProcSet.clear();
+    visit_entity_procs([&entityProcSet](Entity ent, int proc){entityProcSet.insert(EntityProc(ent,proc));});
+  }
+
   template<typename VecType>
   void fill_vec(VecType& entityProcVec)
   {
-    entityProcVec.clear();
     size_t lengthEstimate = static_cast<size_t>(std::floor(1.2*entitiesAndProcs.size()));
     entityProcVec.reserve(lengthEstimate);
-    for(const EntityAndProcs& entProcs : entitiesAndProcs) {
-      if (is_valid(entProcs.entity) && entProcs.proc >= 0) {
-        entityProcVec.emplace_back(EntityProc(entProcs.entity, entProcs.proc));
-      }
-      else if (is_valid(entProcs.entity)) {
-        for(int p : entProcs.procs) {
-          entityProcVec.emplace_back(EntityProc(entProcs.entity, p));
-        }
-      }
-    }
+    entityProcVec.clear();
+    visit_entity_procs([&entityProcVec](Entity ent, int proc){entityProcVec.push_back(EntityProc(ent,proc));});
   }
 
 private:
diff --git a/packages/stk/stk_mesh/stk_mesh/base/MeshBuilder.cpp b/packages/stk/stk_mesh/stk_mesh/base/MeshBuilder.cpp
index c89e6489af1c..9fd5d03965b6 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/MeshBuilder.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/MeshBuilder.cpp
@@ -47,7 +47,8 @@ MeshBuilder::MeshBuilder()
    m_fieldDataManager(nullptr),
    m_bucketCapacity(impl::BucketRepository::default_bucket_capacity),
    m_spatialDimension(0),
-   m_entityRankNames()
+   m_entityRankNames(),
+   m_upwardConnectivity(true)
 {
 }
 
diff --git a/packages/stk/stk_mesh/stk_mesh/base/Types.hpp b/packages/stk/stk_mesh/stk_mesh/base/Types.hpp
index e4f744e25ff9..9c00a95a1fd0 100644
--- a/packages/stk/stk_mesh/stk_mesh/base/Types.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/base/Types.hpp
@@ -56,7 +56,6 @@ namespace stk { namespace mesh { class Part; } }
 namespace stk { namespace mesh { class Selector; } }
 namespace stk { namespace mesh { class Relation; } }
 namespace stk { namespace mesh { struct Entity; } }
-namespace stk { namespace mesh { namespace impl { class EntityRepository; } } }
 namespace stk { namespace mesh { struct EntityKey; } }
 
 
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/AuraGhosting.cpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/AuraGhosting.cpp
index bb5018e7cb90..aa638c8d99e0 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/AuraGhosting.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/AuraGhosting.cpp
@@ -46,6 +46,9 @@ namespace mesh {
 namespace impl {
 
 AuraGhosting::AuraGhosting()
+: m_entitySharing(),
+  m_sendAura(),
+  m_scratchSpace()
 {
 }
 
@@ -55,12 +58,13 @@ AuraGhosting::~AuraGhosting()
 
 void AuraGhosting::generate_aura(BulkData& bulkData)
 {
-  EntityProcMapping entitySharing(bulkData.get_size_of_entity_index_space());
+  m_entitySharing.reset(bulkData.get_size_of_entity_index_space());
   std::vector<EntityRank> ranks = {stk::topology::NODE_RANK, stk::topology::EDGE_RANK};
   const MetaData& meta = bulkData.mesh_meta_data();
   if (meta.side_rank() > stk::topology::EDGE_RANK) {
     ranks.push_back(meta.side_rank());
   }
+  EntityProcMapping& entitySharing = m_entitySharing;
   std::vector<int> sharingProcs;
   for(EntityRank rank : ranks) {
     impl::for_each_selected_entity_run_no_threads(bulkData, rank, meta.globally_shared_part(),
@@ -73,10 +77,10 @@ void AuraGhosting::generate_aura(BulkData& bulkData)
       });  
   }
 
-  EntityProcMapping sendAuraEntityProcs(bulkData.get_size_of_entity_index_space());
-  fill_send_aura_entities(bulkData, sendAuraEntityProcs, entitySharing);
+  m_sendAura.reset(bulkData.get_size_of_entity_index_space());
+  fill_send_aura_entities(bulkData, m_sendAura, m_entitySharing);
 
-  change_ghosting(bulkData, sendAuraEntityProcs, entitySharing);
+  change_ghosting(bulkData, m_sendAura, m_entitySharing);
 }
 
 void AuraGhosting::remove_aura(BulkData& bulkData)
@@ -90,7 +94,8 @@ void AuraGhosting::fill_send_aura_entities(BulkData& bulkData,
                                            EntityProcMapping& sendAuraEntityProcs,
                                            const EntityProcMapping& entitySharing)
 {
-  const EntityRank end_rank = static_cast<EntityRank>(bulkData.mesh_meta_data().entity_rank_count());
+  const EntityRank endRank = static_cast<EntityRank>(bulkData.mesh_meta_data().entity_rank_count());
+  const EntityRank maxRank = static_cast<EntityRank>(endRank-1);
 
   // Iterate over all shared entities, ensure that upwardly related
   // entities to each shared entity will be ghosted to the sharing proc.
@@ -98,24 +103,22 @@ void AuraGhosting::fill_send_aura_entities(BulkData& bulkData,
 
   std::vector<int> sharingProcs;
   impl::for_each_selected_entity_run_no_threads(bulkData, stk::topology::NODE_RANK, shared,
-    [&sendAuraEntityProcs, &entitySharing, &sharingProcs, &end_rank]
+    [&sendAuraEntityProcs, &entitySharing, &sharingProcs, &endRank, &maxRank]
     (const BulkData& bulk, const MeshIndex& meshIndex) {
       const Bucket& bucket = *meshIndex.bucket;
       const unsigned bucketOrd = meshIndex.bucket_ordinal;
-      const EntityRank nextHigherRank = stk::topology::EDGE_RANK;
 
       bulk.comm_shared_procs(bucket[bucketOrd], sharingProcs);
-      for (const int sharingProc : sharingProcs) {
 
-        for (EntityRank higherRank = nextHigherRank; higherRank < end_rank; ++higherRank) {
-          const unsigned num_rels = bucket.num_connectivity(bucketOrd, higherRank);
-          const Entity* rels     = bucket.begin(bucketOrd, higherRank);
+      static constexpr EntityRank nextHigherRank = stk::topology::EDGE_RANK;
+      for (EntityRank higherRank = nextHigherRank; higherRank < endRank; ++higherRank) {
+        const unsigned num_rels = bucket.num_connectivity(bucketOrd, higherRank);
+        const Entity* rels     = bucket.begin(bucketOrd, higherRank);
 
-          for (unsigned r = 0; r < num_rels; ++r) {
-            stk::mesh::impl::insert_upward_relations(bulk, entitySharing, rels[r], stk::topology::NODE_RANK, sharingProc, sendAuraEntityProcs);
-          }
+        for (unsigned r = 0; r < num_rels; ++r) {
+          stk::mesh::impl::insert_upward_relations(bulk, entitySharing, rels[r], higherRank, maxRank, sharingProcs, sendAuraEntityProcs);
         }
-      }    
+      }
     }    
   ); // for_each_entity_run
 }
@@ -124,42 +127,49 @@ void AuraGhosting::change_ghosting(BulkData& bulkData,
                                    EntityProcMapping& sendAuraEntityProcs,
                                    const EntityProcMapping& entitySharing)
 {
-  std::vector<EntityProc> add_send;
-  sendAuraEntityProcs.fill_vec(add_send);
+  std::vector<EntityProc>& sendAuraGhosts = m_scratchSpace;
+  sendAuraEntityProcs.fill_vec(sendAuraGhosts);
 
   //------------------------------------
   // Add the specified entities and their closure to sendAuraEntityProcs
 
-  impl::StoreInEntityProcMapping siepm(bulkData, sendAuraEntityProcs);
-  EntityProcMapping epm(bulkData.get_size_of_entity_index_space());
-  impl::OnlyGhostsEPM og(bulkData, epm, entitySharing);
-  for ( const EntityProc& entityProc : add_send ) {
-      og.proc = entityProc.second;
-      siepm.proc = entityProc.second;
-      impl::VisitClosureGeneral(bulkData,entityProc.first,siepm,og);
+  impl::StoreInEntityProcMapping storeEntity(bulkData, sendAuraEntityProcs);
+  impl::NotAlreadyShared entityBelongsInAura(bulkData, entitySharing);
+  for ( const EntityProc& entityProc : sendAuraGhosts ) {
+    entityBelongsInAura.proc = entityProc.second;
+    storeEntity.proc = entityProc.second;
+    const EntityRank entityRank = bulkData.entity_rank(entityProc.first);
+    if (entityRank > stk::topology::ELEM_RANK) {
+      VisitClosureGeneral(bulkData, entityProc.first, entityRank, storeEntity, entityBelongsInAura);
+    }
+    else {
+      VisitClosureBelowEntityNoRecurse(bulkData, entityProc.first, entityRank, storeEntity, entityBelongsInAura);
+    }
   }
 
-  sendAuraEntityProcs.fill_vec(add_send);
-
-  // Synchronize the send and receive list.
-  // If the send list contains a not-owned entity
-  // inform the owner and receiver to add that entity
-  // to their ghost send and receive lists.
-
-  std::vector<bool> ghostStatus(bulkData.get_size_of_entity_index_space(), false);
+  std::vector<EntityProc>& nonOwnedSendAuraGhosts = m_scratchSpace;
+  nonOwnedSendAuraGhosts.clear();
+  sendAuraEntityProcs.visit_entity_procs(
+    [&bulkData,&nonOwnedSendAuraGhosts](Entity ent, int p)
+    {
+      if (!bulkData.bucket(ent).owned()) {
+        nonOwnedSendAuraGhosts.emplace_back(ent,p);
+      }
+    });
 
-  stk::mesh::impl::comm_sync_aura_send_recv(bulkData, add_send,
-                                            sendAuraEntityProcs, ghostStatus );
+  impl::comm_sync_nonowned_sends(bulkData, nonOwnedSendAuraGhosts, sendAuraEntityProcs);
 
   //------------------------------------
-  // Remove the ghost entities that will not remain.
-  // If the last reference to the receive ghost entity then delete it.
+  // Remove send-ghost entities from the comm-list that no longer need to be sent.
 
   OrdinalVector addParts;
   OrdinalVector removeParts(1, bulkData.m_ghost_parts[BulkData::AURA]->mesh_meta_data_ordinal());
   OrdinalVector scratchOrdinalVec, scratchSpace;
   bool removed = false ;
 
+  std::vector<EntityProc> removedSendGhosts;
+  const unsigned auraGhostingOrdinal = bulkData.aura_ghosting().ordinal();
+
   std::vector<EntityCommInfo> comm_ghost ;
   for ( EntityCommListInfoVector::reverse_iterator
         i = bulkData.m_entity_comm_list.rbegin() ; i != bulkData.m_entity_comm_list.rend() ; ++i) {
@@ -174,44 +184,30 @@ void AuraGhosting::change_ghosting(BulkData& bulkData,
     }
 
     const bool is_owner = bulkData.parallel_owner_rank(entityComm.entity) == bulkData.parallel_rank() ;
-    const bool remove_recv = ( ! is_owner ) &&
-                             !ghostStatus[entityComm.entity.local_offset()] && bulkData.in_receive_ghost(bulkData.aura_ghosting(), entityComm.entity);
+    if ( is_owner ) {
+      // Is owner, potentially removing ghost-sends
+      // Have to make a copy
 
-    if(bulkData.is_valid(entityComm.entity))
-    {
-      if ( is_owner ) {
-        // Is owner, potentially removing ghost-sends
-        // Have to make a copy
-
-          const PairIterEntityComm ec = ghost_info_range(entityComm.entity_comm->comm_map, bulkData.aura_ghosting());
-          comm_ghost.assign( ec.first , ec.second );
-
-          for ( ; ! comm_ghost.empty() ; comm_ghost.pop_back() ) {
-            const EntityCommInfo tmp = comm_ghost.back();
-
-            if (!sendAuraEntityProcs.find(entityComm.entity, tmp.proc) ) {
-              bulkData.entity_comm_map_erase(entityComm.key, tmp);
-            }
-            else {
-              sendAuraEntityProcs.eraseEntityProc(entityComm.entity, tmp.proc);
-            }
-          }
-      }
-      else if ( remove_recv ) {
-          bulkData.entity_comm_map_erase(entityComm.key, bulkData.aura_ghosting());
-          bulkData.internal_change_entity_parts(entityComm.entity, addParts, removeParts, scratchOrdinalVec, scratchSpace);
-      }
+      const PairIterEntityComm ec = ghost_info_range(entityComm.entity_comm->comm_map, auraGhostingOrdinal);
+      comm_ghost.assign( ec.first , ec.second );
 
-      if ( bulkData.internal_entity_comm_map(entityComm.entity).empty() ) {
-        removed = true ;
-        entityComm.key = EntityKey(); // No longer communicated
-        if ( remove_recv ) {
-          ThrowRequireMsg( bulkData.internal_destroy_entity_with_notification( entityComm.entity, remove_recv ),
-                           "P[" << bulkData.parallel_rank() << "]: FAILED attempt to destroy entity: "
-                           << bulkData.entity_key(entityComm.entity) );
+      for ( ; ! comm_ghost.empty() ; comm_ghost.pop_back() ) {
+        const EntityCommInfo tmp = comm_ghost.back();
+
+        if (!sendAuraEntityProcs.find(entityComm.entity, tmp.proc) ) {
+          bulkData.entity_comm_map_erase(entityComm.key, tmp);
+          removedSendGhosts.push_back(EntityProc(entityComm.entity, tmp.proc));
+        }
+        else {
+          sendAuraEntityProcs.eraseEntityProc(entityComm.entity, tmp.proc);
         }
       }
     }
+
+    if ( bulkData.internal_entity_comm_map(entityComm.entity).empty() ) {
+      removed = true ;
+      entityComm.key = EntityKey(); // No longer communicated
+    }
   }
 
   // if an entry in the comm_list has the EntityKey() value, it is invalid,
@@ -221,12 +217,22 @@ void AuraGhosting::change_ghosting(BulkData& bulkData,
     bulkData.delete_unneeded_entries_from_the_comm_list();
   }
 
+  const std::vector<std::pair<EntityKey,EntityCommInfo>>& allRemovedGhosts = bulkData.m_removedGhosts;
+  for(const std::pair<EntityKey,EntityCommInfo>& rmGhost : allRemovedGhosts) {
+    Entity rmEnt = bulkData.get_entity(rmGhost.first);
+    if (bulkData.is_valid(rmEnt) &&
+        rmGhost.second.ghost_id == auraGhostingOrdinal &&
+        bulkData.parallel_owner_rank(rmEnt) == bulkData.parallel_rank() &&
+        !sendAuraEntityProcs.find(rmEnt, rmGhost.second.proc)) {
+      removedSendGhosts.push_back(EntityProc(rmEnt,rmGhost.second.proc));
+    }
+  }
   EntityLess entityLess(bulkData);
   std::set<EntityProc , EntityLess> finalSendGhosts(entityLess);
   sendAuraEntityProcs.fill_set(finalSendGhosts);
 
   const bool isFullRegen = true;
-  bulkData.ghost_entities_and_fields(bulkData.aura_ghosting(), finalSendGhosts, isFullRegen);
+  bulkData.ghost_entities_and_fields(bulkData.aura_ghosting(), finalSendGhosts, isFullRegen, removedSendGhosts);
 }
 
 }}} // end namepsace stk mesh impl
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/AuraGhosting.hpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/AuraGhosting.hpp
index fe0a80368dce..532c03185cf5 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/AuraGhosting.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/AuraGhosting.hpp
@@ -35,6 +35,10 @@
 #ifndef stk_mesh_impl_AuraGhosting_hpp
 #define stk_mesh_impl_AuraGhosting_hpp
 
+#include <stk_mesh/base/Types.hpp>
+#include <stk_mesh/base/EntityProcMapping.hpp>
+#include <vector>
+
 namespace stk {
 namespace mesh {
 
@@ -60,6 +64,10 @@ class AuraGhosting
     virtual void change_ghosting(BulkData& bulkData,
                                  EntityProcMapping& entityProcMapping,
                                  const EntityProcMapping& entitySharing);
+private:
+  EntityProcMapping m_entitySharing;
+  EntityProcMapping m_sendAura;
+  std::vector<EntityProc> m_scratchSpace;
 };
 
 }}} // end namepsace stk mesh impl
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/DeletedEntityCache.cpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/DeletedEntityCache.cpp
new file mode 100644
index 000000000000..1ea43bb90a61
--- /dev/null
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/DeletedEntityCache.cpp
@@ -0,0 +1,49 @@
+
+#include "MeshModification.hpp"
+#include <stk_mesh/base/BulkData.hpp>
+
+
+namespace stk {
+namespace mesh {
+namespace impl {
+
+void DeletedEntityCache::mark_entity_as_deleted(Entity entity, bool is_ghost)
+{
+  if (is_ghost) 
+  {
+    m_ghost_reuse_map[m_bulkData.entity_key(entity)] = entity.local_offset();
+  } else 
+  {
+    m_deleted_entities_current_modification_cycle.push_back(entity.local_offset());
+  }
+}
+
+Entity::entity_value_type DeletedEntityCache::get_entity_for_reuse()
+{
+  if (!m_deleted_entities.empty())
+  {
+    size_t new_local_offset = m_deleted_entities.back();
+    m_deleted_entities.pop_back();
+    return new_local_offset;
+  } else
+  {
+    return Entity::InvalidEntity;
+  }
+}
+
+void DeletedEntityCache::update_deleted_entities_container()
+{
+  m_deleted_entities.insert(m_deleted_entities.end(), m_deleted_entities_current_modification_cycle.begin(), 
+                                                      m_deleted_entities_current_modification_cycle.end());
+  m_deleted_entities_current_modification_cycle.clear();
+
+  for (auto keyAndOffset : m_ghost_reuse_map) {
+    m_deleted_entities.push_back(keyAndOffset.second);
+  }
+  m_ghost_reuse_map.clear();
+}
+
+
+}
+}
+}
\ No newline at end of file
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/DeletedEntityCache.hpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/DeletedEntityCache.hpp
new file mode 100644
index 000000000000..f516d7fe42f0
--- /dev/null
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/DeletedEntityCache.hpp
@@ -0,0 +1,81 @@
+// Copyright 2002 - 2008, 2010, 2011 National Technology Engineering
+// Solutions of Sandia, LLC (NTESS). Under the terms of Contract
+// DE-NA0003525 with NTESS, the U.S. Government retains certain rights
+// in this software.
+//
+// Redistribution and use in source and binary forms, with or without
+// modification, are permitted provided that the following conditions are
+// met:
+//
+//     * Redistributions of source code must retain the above copyright
+//       notice, this list of conditions and the following disclaimer.
+//
+//     * Redistributions in binary form must reproduce the above
+//       copyright notice, this list of conditions and the following
+//       disclaimer in the documentation and/or other materials provided
+//       with the distribution.
+//
+//     * Neither the name of NTESS nor the names of its contributors
+//       may be used to endorse or promote products derived from this
+//       software without specific prior written permission.
+//
+// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
+// A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
+// OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
+// SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
+// LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
+// DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
+// THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
+// (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+// OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+//
+
+#ifndef stk_mesh_impl_DeletedEntityCache_hpp
+#define stk_mesh_impl_DeletedEntityCache_hpp
+
+#include <stk_mesh/base/Types.hpp>      // for MeshIndex, EntityRank, etc
+#include <stk_mesh/base/Entity.hpp>
+#include "stk_mesh/base/EntityKey.hpp"
+
+namespace stk {
+namespace mesh {
+
+class BulkData;
+typedef std::unordered_map<EntityKey, Entity::entity_value_type, stk::mesh::HashValueForEntityKey> GhostReuseMap;
+
+
+namespace impl {
+
+class DeletedEntityCache
+{
+  public:
+    explicit DeletedEntityCache(BulkData& bulkData) : 
+      m_bulkData(bulkData)
+    {}
+
+    void mark_entity_as_deleted(Entity entity, bool is_ghost);
+
+    const std::vector<Entity::entity_value_type>& get_deleted_entities_current_mod_cycle() const { return m_deleted_entities_current_modification_cycle; }
+
+    GhostReuseMap& get_ghost_reuse_map() { return m_ghost_reuse_map; }
+
+    const GhostReuseMap& get_ghost_reuse_map() const { return m_ghost_reuse_map; }
+
+    Entity::entity_value_type get_entity_for_reuse();
+
+    void update_deleted_entities_container();
+
+  private:
+    BulkData& m_bulkData;
+    std::vector<Entity::entity_value_type> m_deleted_entities_current_modification_cycle;
+    std::vector<Entity::entity_value_type> m_deleted_entities;
+    GhostReuseMap m_ghost_reuse_map;
+};
+
+}
+}
+}
+
+#endif
\ No newline at end of file
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/EntityRepository.cpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/EntityKeyMapping.cpp
similarity index 92%
rename from packages/stk/stk_mesh/stk_mesh/baseImpl/EntityRepository.cpp
rename to packages/stk/stk_mesh/stk_mesh/baseImpl/EntityKeyMapping.cpp
index 55ee17693921..067192738055 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/EntityRepository.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/EntityKeyMapping.cpp
@@ -32,7 +32,7 @@
 // OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
 // 
 
-#include <stk_mesh/baseImpl/EntityRepository.hpp>
+#include <stk_mesh/baseImpl/EntityKeyMapping.hpp>
 #include <stddef.h>                     // for NULL
 #include <sstream>                      // for operator<<, basic_ostream, etc
 #include <vector>
@@ -74,7 +74,7 @@ struct match_EntityKey {
   const EntityKey& m_key;
 };
 
-EntityRepository::EntityRepository()
+EntityKeyMapping::EntityKeyMapping()
  : m_entities(stk::topology::NUM_RANKS),
    m_create_cache(stk::topology::NUM_RANKS),
    m_update_cache(stk::topology::NUM_RANKS),
@@ -84,11 +84,11 @@ EntityRepository::EntityRepository()
 {
 }
 
-EntityRepository::~EntityRepository()
+EntityKeyMapping::~EntityKeyMapping()
 {
 }
 
-void EntityRepository::clear_all_cache()
+void EntityKeyMapping::clear_all_cache()
 {
   EntityRank nRanks = static_cast<EntityRank>(m_create_cache.size());
   for(EntityRank rank=stk::topology::BEGIN_RANK; rank<nRanks; ++rank) {
@@ -96,7 +96,7 @@ void EntityRepository::clear_all_cache()
   }
 }
 
-void EntityRepository::clear_destroyed_entity_cache(EntityRank rank) const
+void EntityKeyMapping::clear_destroyed_entity_cache(EntityRank rank) const
 {
   if (!m_destroy_cache[rank].empty()) {
     std::vector<EntityKey>& destroy = m_destroy_cache[rank];
@@ -135,7 +135,7 @@ void EntityRepository::clear_destroyed_entity_cache(EntityRank rank) const
   }
 }
 
-void EntityRepository::clear_updated_entity_cache(EntityRank rank) const
+void EntityKeyMapping::clear_updated_entity_cache(EntityRank rank) const
 {
   if (!m_update_cache[rank].empty()) {
     std::vector<std::pair<EntityKey,EntityKey> >& update = m_update_cache[rank];
@@ -154,7 +154,7 @@ void EntityRepository::clear_updated_entity_cache(EntityRank rank) const
   }
 }
 
-void EntityRepository::clear_created_entity_cache(EntityRank rank) const
+void EntityKeyMapping::clear_created_entity_cache(EntityRank rank) const
 {
   if (!m_create_cache[rank].empty()) {
     std::sort(m_create_cache[rank].begin(), m_create_cache[rank].end());
@@ -167,7 +167,7 @@ void EntityRepository::clear_created_entity_cache(EntityRank rank) const
   }
 }
 
-void EntityRepository::clear_cache(EntityRank rank) const
+void EntityKeyMapping::clear_cache(EntityRank rank) const
 {
   clear_created_entity_cache(rank);
 
@@ -177,7 +177,7 @@ void EntityRepository::clear_cache(EntityRank rank) const
 }
 
 std::pair<stk::mesh::entity_iterator,bool>
-EntityRepository::add_to_cache(const EntityKey& key)
+EntityKeyMapping::add_to_cache(const EntityKey& key)
 {
     bool inserted_new_entity = false;
     EntityRank rank = key.rank();
@@ -208,7 +208,7 @@ EntityRepository::add_to_cache(const EntityKey& key)
     return std::make_pair(iter, inserted_new_entity);
 }
 
-stk::mesh::entity_iterator EntityRepository::get_from_cache(const EntityKey& key) const
+stk::mesh::entity_iterator EntityKeyMapping::get_from_cache(const EntityKey& key) const
 {
   if (!m_create_cache[key.rank()].empty()) {
     EntityKeyEntityVector& cache = m_create_cache[key.rank()];
@@ -222,7 +222,7 @@ stk::mesh::entity_iterator EntityRepository::get_from_cache(const EntityKey& key
 }
 
 std::pair<stk::mesh::entity_iterator ,bool>
-EntityRepository::internal_create_entity( const EntityKey & key)
+EntityKeyMapping::internal_create_entity( const EntityKey & key)
 {
   if (key.rank() > entity_rank_count()) {
     m_entities.resize(key.rank());
@@ -242,7 +242,7 @@ EntityRepository::internal_create_entity( const EntityKey & key)
   return add_to_cache(key);
 }
 
-Entity EntityRepository::get_entity(const EntityKey &key) const
+Entity EntityKeyMapping::get_entity(const EntityKey &key) const
 {
   EntityRank rank = key.rank();
   if (!m_destroy_cache[rank].empty()) {
@@ -279,7 +279,7 @@ Entity EntityRepository::get_entity(const EntityKey &key) const
   return (iter != entities.end() && (iter->first==key)) ? iter->second : Entity() ;
 }
 
-void EntityRepository::update_entity_key(EntityKey new_key, EntityKey old_key, Entity entity)
+void EntityKeyMapping::update_entity_key(EntityKey new_key, EntityKey old_key, Entity entity)
 {
   EntityRank rank = new_key.rank();
   clear_created_entity_cache(rank);
@@ -292,7 +292,7 @@ void EntityRepository::update_entity_key(EntityKey new_key, EntityKey old_key, E
   m_update_cache[rank].emplace_back(old_key, new_key);
 }
 
-void EntityRepository::destroy_entity(EntityKey key, Entity entity)
+void EntityKeyMapping::destroy_entity(EntityKey key, Entity entity)
 { 
   EntityRank rank = key.rank();
   clear_created_entity_cache(rank);
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/EntityRepository.hpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/EntityKeyMapping.hpp
similarity index 93%
rename from packages/stk/stk_mesh/stk_mesh/baseImpl/EntityRepository.hpp
rename to packages/stk/stk_mesh/stk_mesh/baseImpl/EntityKeyMapping.hpp
index 6c840513e010..791f377f8b18 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/EntityRepository.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/EntityKeyMapping.hpp
@@ -32,8 +32,8 @@
 // OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
 // 
 
-#ifndef stk_mesh_baseImpl_EntityRepository_hpp
-#define stk_mesh_baseImpl_EntityRepository_hpp
+#ifndef stk_mesh_baseImpl_EntityKeyMapping_hpp
+#define stk_mesh_baseImpl_EntityKeyMapping_hpp
 
 #include <stddef.h>                     // for size_t
 #include <map>                          // for map, map<>::value_compare
@@ -47,7 +47,7 @@ namespace stk {
 namespace mesh {
 namespace impl {
 
-class EntityRepository {
+class EntityKeyMapping {
 
 public:
 
@@ -56,9 +56,9 @@ class EntityRepository {
     typedef EntityKeyEntityVector::const_iterator const_iterator;
     typedef EntityKeyEntityVector::iterator iterator;
 
-    EntityRepository();
+    EntityKeyMapping();
 
-    ~EntityRepository();
+    ~EntityKeyMapping();
 
     Entity get_entity( const EntityKey &key ) const;
 
@@ -112,8 +112,8 @@ class EntityRepository {
     mutable unsigned m_maxUpdateCacheSize;
 
     //disable copy constructor and assignment operator
-    EntityRepository(const EntityRepository &);
-    EntityRepository & operator =(const EntityRepository &);
+    EntityKeyMapping(const EntityKeyMapping &);
+    EntityKeyMapping & operator =(const EntityKeyMapping &);
 };
 
 } // namespace impl
@@ -121,5 +121,5 @@ class EntityRepository {
 } // namespace mesh
 } // namespace stk
 
-#endif // stk_mesh_baseImpl_EntityRepository_hpp
+#endif // stk_mesh_baseImpl_EntityKeyMapping_hpp
 
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshImplUtils.cpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshImplUtils.cpp
index 3b5dc54a2c99..d67294fc3e5c 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshImplUtils.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshImplUtils.cpp
@@ -117,6 +117,15 @@ void find_entities_with_larger_ids_these_nodes_have_in_common_and_locally_owned(
     }
 }
 
+const EntityCommListInfo& find_entity(const BulkData& mesh,
+                               const EntityCommListInfoVector& entities,
+                               const EntityKey& key)
+{
+  EntityCommListInfoVector::const_iterator lb_itr = std::lower_bound(entities.begin(), entities.end(), key);
+  ThrowAssertMsg(lb_itr != entities.end() && lb_itr->key == key,
+                 "proc " << mesh.parallel_rank() << " Cannot find entity-key " << key << " in comm-list" );
+  return *lb_itr;
+}
 
 bool do_these_nodes_have_any_shell_elements_in_common(BulkData& mesh, unsigned numNodes, const Entity* nodes)
 {
@@ -1264,43 +1273,61 @@ void comm_sync_aura_send_recv(
   }
 }
 
-void insert_upward_relations(const BulkData& bulk_data, Entity rel_entity,
-                             const EntityRank rank_of_orig_entity,
-                             const int share_proc,
-                             std::vector<EntityProc>& send)
+void comm_sync_nonowned_sends(
+  const BulkData & mesh ,
+  std::vector<EntityProc> & nonOwnedSendGhosts,
+  EntityProcMapping& entityProcMapping)
 {
-  EntityRank rel_entity_rank = bulk_data.entity_rank(rel_entity);
-  ThrowAssert(rel_entity_rank > rank_of_orig_entity);
+  const int parallel_size = mesh.parallel_size();
+  const int parallel_rank = mesh.parallel_rank();
+  stk::CommSparse commSparse( mesh.parallel() );
 
-  // If related entity is higher rank, I own it, and it is not
-  // already shared by proc, ghost it to the sharing processor.
-  if ( bulk_data.bucket(rel_entity).owned() && ! bulk_data.in_shared(rel_entity, share_proc) ) {
+  for (const EntityProc& ep : nonOwnedSendGhosts) {
+    const int owner = mesh.parallel_owner_rank(ep.first);
+    if ( owner != mesh.parallel_rank() ) {
+      commSparse.send_buffer( owner ).skip<EntityKey>(1).skip<int>(1);
+    }
+  }
 
-    send.emplace_back(rel_entity,share_proc);
+  commSparse.allocate_buffers();
 
-    // There may be even higher-ranking entities that need to be ghosted, so we must recurse
-    const EntityRank end_rank = static_cast<EntityRank>(bulk_data.mesh_meta_data().entity_rank_count());
-    for (EntityRank irank = static_cast<EntityRank>(rel_entity_rank + 1); irank < end_rank; ++irank)
-    {
-      const int num_rels = bulk_data.num_connectivity(rel_entity, irank);
-      Entity const* rels     = bulk_data.begin(rel_entity, irank);
+  for (const EntityProc& ep : nonOwnedSendGhosts) {
+    const int owner = mesh.parallel_owner_rank(ep.first);
+    if ( owner != parallel_rank ) {
+      commSparse.send_buffer( owner ).pack<EntityKey>(mesh.entity_key(ep.first)).pack<int>(ep.second);
+      entityProcMapping.eraseEntityProc(ep.first, ep.second);
+    }
+  }
 
-      for (int r = 0; r < num_rels; ++r)
-      {
-        Entity const rel_of_rel_entity = rels[r];
-        if (bulk_data.is_valid(rel_of_rel_entity)) {
-          insert_upward_relations(bulk_data, rel_of_rel_entity, rel_entity_rank, share_proc, send);
-        }
-      }
+  commSparse.communicate();
+
+  for ( int p = 0 ; p < parallel_size ; ++p ) {
+    CommBuffer & buf = commSparse.recv_buffer(p);
+    while ( buf.remaining() ) {
+
+      EntityKey entity_key;
+      int proc = 0;
+
+      buf.unpack(entity_key).unpack(proc);
+
+      Entity const e = mesh.get_entity( entity_key );
+
+      ThrowAssert(parallel_rank != proc);
+      ThrowAssert(mesh.is_valid(e));
+
+      //Receiving a ghosting need for an entity I own, add it.
+      entityProcMapping.addEntityProc(e, proc);
     }
   }
 }
 
-EntityRank get_highest_upward_connected_rank(const BulkData& mesh, Entity entity)
+EntityRank get_highest_upward_connected_rank(const Bucket& bucket,
+                                             unsigned bucketOrdinal,
+                                             EntityRank entityRank,
+                                             EntityRank maxRank)
 {
-  const EntityRank entityRank = mesh.entity_rank(entity);
-  EntityRank highestRank = static_cast<EntityRank>(mesh.mesh_meta_data().entity_rank_count()-1);
-  while(highestRank > entityRank && mesh.num_connectivity(entity, highestRank) == 0) {
+  EntityRank highestRank = maxRank;
+  while(highestRank > entityRank && bucket.num_connectivity(bucketOrdinal, highestRank) == 0) {
     highestRank = static_cast<EntityRank>(highestRank-1);
   }
   return highestRank;
@@ -1308,29 +1335,39 @@ EntityRank get_highest_upward_connected_rank(const BulkData& mesh, Entity entity
 
 void insert_upward_relations(const BulkData& bulk_data,
                              const EntityProcMapping& entitySharing,
-                             Entity rel_entity,
-                             const EntityRank rank_of_orig_entity,
-                             const int share_proc,
+                             const Entity entity,
+                             const EntityRank entityRank,
+                             const EntityRank maxRank,
+                             const std::vector<int>& sharingProcs,
                              EntityProcMapping& send)
 {
   // If related entity is higher rank, I own it, and it is not
   // already shared by proc, ghost it to the sharing processor.
-  const MeshIndex& idx = bulk_data.mesh_index(rel_entity);
+  const MeshIndex& idx = bulk_data.mesh_index(entity);
   const Bucket& bucket = *idx.bucket;
-  if ( bucket.owned() && !entitySharing.find(rel_entity, share_proc) ) {
-
-    send.addEntityProc(rel_entity,share_proc);
-
+  if (bucket.owned()) {
     const unsigned bucketOrd = idx.bucket_ordinal;
-    const EntityRank upwardRank = get_highest_upward_connected_rank(bulk_data, rel_entity);
-    const int numRels = bucket.num_connectivity(bucketOrd, upwardRank);
-    Entity const* rels     = bucket.begin(bucketOrd, upwardRank);
-
-    for (int r = 0; r < numRels; ++r) {
-      Entity const upwardEntity = rels[r];
-      if (bulk_data.is_valid(upwardEntity) && bulk_data.bucket(upwardEntity).owned()) {
-        if (!entitySharing.find(upwardEntity, share_proc)) {
-          send.addEntityProc(upwardEntity, share_proc);
+    const EntityRank upwardRank = get_highest_upward_connected_rank(bucket, bucketOrd, entityRank, maxRank);
+
+    if (upwardRank > entityRank) {
+      const int numRels = bucket.num_connectivity(bucketOrd, upwardRank);
+      const Entity* rels     = bucket.begin(bucketOrd, upwardRank);
+
+      for (int r = 0; r < numRels; ++r) {
+        Entity const upwardEntity = rels[r];
+        if (bulk_data.is_valid(upwardEntity) && bulk_data.bucket(upwardEntity).owned()) {
+          for(int sharingProc : sharingProcs) {
+            if (upwardRank >= stk::topology::ELEM_RANK || !entitySharing.find(upwardEntity, sharingProc)) {
+              send.addEntityProc(upwardEntity, sharingProc);
+            }
+          }
+        }
+      }
+    }
+    else {
+      for(int sharingProc : sharingProcs) {
+        if (entityRank >= stk::topology::ELEM_RANK || !entitySharing.find(entity, sharingProc)) {
+          send.addEntityProc(entity,sharingProc);
         }
       }
     }
@@ -1604,7 +1641,7 @@ bool is_good_rank_and_id(const MetaData& meta,
 
 EntityId get_global_max_id_in_use(const BulkData& mesh,
                                   EntityRank rank,
-                                  const std::list<Entity::entity_value_type>& deletedEntitiesCurModCycle)
+                                  const std::vector<Entity::entity_value_type>& deletedEntitiesCurModCycle)
 {
   EntityId localMax = stk::mesh::get_max_id_on_local_proc(mesh, rank);
 
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshImplUtils.hpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshImplUtils.hpp
index e493ac58311a..b1a709fd430f 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshImplUtils.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshImplUtils.hpp
@@ -89,6 +89,10 @@ void find_entities_these_nodes_have_in_common_and(const BulkData& mesh, EntityRa
     }
 }
 
+const EntityCommListInfo& find_entity(const BulkData& mesh,
+                                      const EntityCommListInfoVector& entities,
+                                      const EntityKey& key);
+
 bool do_these_nodes_have_any_shell_elements_in_common(BulkData& mesh, unsigned numNodes, const Entity* nodes);
 
 void find_locally_owned_elements_these_nodes_have_in_common(const BulkData& mesh, unsigned numNodes, const Entity* nodes, std::vector<Entity>& elems);
@@ -244,16 +248,17 @@ void comm_sync_aura_send_recv(
   EntityProcMapping& entityProcMapping,
   std::vector<bool>& ghostStatus );
 
-void insert_upward_relations(const BulkData& bulk_data, Entity rel_entity,
-                             const EntityRank rank_of_orig_entity,
-                             const int share_proc,
-                             std::vector<EntityProc>& send);
+void comm_sync_nonowned_sends(
+  const BulkData & mesh ,
+  std::vector<EntityProc> & nonOwnedSendGhosts,
+  EntityProcMapping& entityProcMapping);
 
 void insert_upward_relations(const BulkData& bulk_data,
                              const EntityProcMapping& entitySharing,
-                             Entity rel_entity,
-                             const EntityRank rank_of_orig_entity,
-                             const int share_proc,
+                             const Entity entity,
+                             const EntityRank entityRank,
+                             const EntityRank maxRank,
+                             const std::vector<int>& share_proc,
                              EntityProcMapping& send);
 
 void move_unowned_entities_for_owner_to_ghost(
@@ -318,7 +323,7 @@ bool is_good_rank_and_id(const MetaData& meta,
 
 EntityId get_global_max_id_in_use(const BulkData& mesh,
                                   EntityRank rank,
-                                  const std::list<Entity::entity_value_type>& deletedEntitiesCurModCycle);
+                                  const std::vector<Entity::entity_value_type>& deletedEntitiesCurModCycle);
 
 void check_declare_element_side_inputs(const BulkData & mesh,
                                        const Entity elem,
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshModification.cpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshModification.cpp
index b7bb82c7bb7a..1938862ea4b9 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshModification.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshModification.cpp
@@ -1,9 +1,11 @@
 #include "MeshModification.hpp"
+#include <stk_mesh/base/EntityKey.hpp>
 #include <stk_mesh/base/BulkData.hpp>
 #include <stk_mesh/base/MetaData.hpp>
 #include <stk_util/parallel/Parallel.hpp>
+#include <stk_util/parallel/CommSparse.hpp>
 #include <stk_mesh/baseImpl/MeshImplUtils.hpp>
-#include <stk_mesh/baseImpl/EntityRepository.hpp>
+#include <stk_mesh/baseImpl/EntityKeyMapping.hpp>
 
 namespace stk {
 namespace mesh {
@@ -16,7 +18,7 @@ bool MeshModification::modification_begin(const std::string description)
     if (this->synchronized_count() == 0)
     {
         m_bulkData.mesh_meta_data().set_mesh_on_fields(&m_bulkData);
-        m_bulkData.m_entity_repo->update_num_ranks(m_bulkData.mesh_meta_data().entity_rank_count());
+        m_bulkData.m_entityKeyMapping->update_num_ranks(m_bulkData.mesh_meta_data().entity_rank_count());
         const unsigned numRanks = m_bulkData.mesh_meta_data().entity_rank_count(); 
         if (numRanks > m_bulkData.m_selector_to_buckets_maps.size()) {
           m_bulkData.m_selector_to_buckets_maps.resize(numRanks);
@@ -36,6 +38,7 @@ bool MeshModification::modification_begin(const std::string description)
     else
     {
         this->reset_undeleted_entity_states_to_unchanged();
+         m_bulkData.m_removedGhosts.clear();
     }
 
     this->set_sync_state_modifiable();
@@ -55,82 +58,77 @@ bool MeshModification::modification_begin(const std::string description)
 
 bool MeshModification::modification_end(modification_optimization opt)
 {
-    return this->internal_modification_end( opt );
-}
-
-bool MeshModification::resolve_node_sharing()
-{
-    return this->internal_resolve_node_sharing( MOD_END_SORT );
-}
-
-bool MeshModification::modification_end_after_node_sharing_resolution()
-{
-    return this->internal_modification_end_after_node_sharing_resolution( MOD_END_SORT );
-}
-
-bool MeshModification::internal_modification_end(modification_optimization opt)
-{
-    if(this->in_synchronized_state())
-    {
-        return false;
-    }
-
-    ThrowAssertMsg(impl::check_for_connected_nodes(m_bulkData)==0, "BulkData::modification_end ERROR, all entities with rank higher than node are required to have connected nodes.");
-
-    ThrowAssertMsg(m_bulkData.add_fmwk_data() || impl::check_no_shared_elements_or_higher(m_bulkData)==0, "BulkData::modification_end ERROR, Sharing of entities with rank ELEMENT_RANK or higher is not allowed.");
-
-    m_bulkData.m_entity_repo->clear_all_cache();
+  if(this->in_synchronized_state())
+  {
+      return false;
+  }
 
-    if(m_bulkData.parallel_size() > 1)
-    {
-        // Resolve modification or deletion of shared entities
-        // which can cause deletion of ghost entities.
-        stk::mesh::EntityVector entitiesNoLongerShared;
-        internal_resolve_shared_modify_delete(entitiesNoLongerShared);
+  ThrowAssertMsg(impl::check_for_connected_nodes(m_bulkData)==0, "BulkData::modification_end ERROR, all entities with rank higher than node are required to have connected nodes.");
 
-        // Resolve modification or deletion of ghost entities
-        // by destroying ghost entities that have been touched.
-        m_bulkData.internal_resolve_ghosted_modify_delete(entitiesNoLongerShared);
-        m_bulkData.update_comm_list_based_on_changes_in_comm_map();
+  ThrowAssertMsg(m_bulkData.add_fmwk_data() || impl::check_no_shared_elements_or_higher(m_bulkData)==0, "BulkData::modification_end ERROR, Sharing of entities with rank ELEMENT_RANK or higher is not allowed.");
 
-        // Resolve creation of entities: discover sharing and set unique ownership.
-        m_bulkData.internal_resolve_parallel_create();
+  m_bulkData.m_entityKeyMapping->clear_all_cache();
 
-        // Manoj: consider adding check_sharing_comm_maps here which is currently
-        // in BulkDataTester in UnitTestModificationEnd.cpp
+  if(m_bulkData.parallel_size() > 1)
+  {
+      // Resolve modification or deletion of shared entities
+      // which can cause deletion of ghost entities.
+      stk::mesh::EntityVector entitiesNoLongerShared;
+      internal_resolve_shared_modify_delete(entitiesNoLongerShared);
+
+      // Resolve modification or deletion of ghost entities
+      // by destroying ghost entities that have been touched.
+      internal_resolve_ghosted_modify_delete(entitiesNoLongerShared);
+      m_bulkData.update_comm_list_based_on_changes_in_comm_map();
+
+      // Resolve creation of entities: discover sharing and set unique ownership.
+      m_bulkData.internal_resolve_parallel_create();
+
+      // Manoj: consider adding check_sharing_comm_maps here which is currently
+      // in BulkDataTester in UnitTestModificationEnd.cpp
+
+      // Resolve part membership for shared entities.
+      // This occurs after resolving creation so created and shared
+      // entities are resolved along with previously existing shared entities.
+      m_bulkData.internal_resolve_shared_membership(entitiesNoLongerShared);
+
+      // Regenerate the ghosting aura around all shared mesh entities.
+      if(m_bulkData.is_automatic_aura_on())
+      {
+          m_bulkData.internal_regenerate_aura();
+      }
+      else if (m_bulkData.m_turningOffAutoAura) {
+          m_bulkData.internal_remove_aura();
+      }
 
-        // Resolve part membership for shared entities.
-        // This occurs after resolving creation so created and shared
-        // entities are resolved along with previously existing shared entities.
-        m_bulkData.internal_resolve_shared_membership(entitiesNoLongerShared);
+      m_bulkData.internal_resolve_send_ghost_membership();
 
-        // Regenerate the ghosting aura around all shared mesh entities.
-        if(m_bulkData.is_automatic_aura_on())
-        {
-            m_bulkData.internal_regenerate_aura();
-        }
-        else if (m_bulkData.m_turningOffAutoAura) {
-            m_bulkData.internal_remove_aura();
-        }
+      m_bulkData.m_modSummary.write_summary(synchronized_count());
+      m_bulkData.check_mesh_consistency();
+  }
+  else
+  {
+      m_bulkData.m_modSummary.write_summary(synchronized_count());
+      if(!m_bulkData.add_fmwk_data())
+      {
+          std::vector<Entity> shared_modified;
+          m_bulkData.internal_update_sharing_comm_map_and_fill_list_modified_shared_entities(shared_modified);
+      }
+  }
 
-        m_bulkData.internal_resolve_send_ghost_membership();
+  m_bulkData.internal_finish_modification_end(opt);
 
-        m_bulkData.m_modSummary.write_summary(synchronized_count());
-        m_bulkData.check_mesh_consistency();
-    }
-    else
-    {
-        m_bulkData.m_modSummary.write_summary(synchronized_count());
-        if(!m_bulkData.add_fmwk_data())
-        {
-            std::vector<Entity> shared_modified;
-            m_bulkData.internal_update_sharing_comm_map_and_fill_list_modified_shared_entities(shared_modified);
-        }
-    }
+  return true;
+}
 
-    m_bulkData.internal_finish_modification_end(opt);
+bool MeshModification::resolve_node_sharing()
+{
+    return this->internal_resolve_node_sharing( MOD_END_SORT );
+}
 
-    return true;
+bool MeshModification::modification_end_after_node_sharing_resolution()
+{
+    return this->internal_modification_end_after_node_sharing_resolution( MOD_END_SORT );
 }
 
 bool MeshModification::internal_resolve_node_sharing(modification_optimization opt)
@@ -217,6 +215,107 @@ void MeshModification::change_entity_owner( const EntityProcVec & arg_change)
     m_bulkData.internal_modification_end_for_change_entity_owner(mod_optimization);
 }
 
+bool MeshModification::pack_entity_modification( const bool packShared , stk::CommSparse & comm )
+{
+  bool flag = false;
+  bool packGhosted = packShared == false;
+
+  const EntityCommListInfoVector & entityCommList = m_bulkData.internal_comm_list();
+
+  for ( EntityCommListInfoVector::const_iterator
+        i = entityCommList.begin() ; i != entityCommList.end() ; ++i ) {
+    if (i->entity_comm != nullptr) {
+      Entity entity = i->entity;
+      EntityState status = m_bulkData.is_valid(entity) ? m_bulkData.state(entity) : Deleted;
+
+      if ( status == Modified || status == Deleted ) {
+        int owned_closure_int = m_bulkData.owned_closure(entity) ? 1 : 0;
+
+        for ( PairIterEntityComm ec(i->entity_comm->comm_map); ! ec.empty() ; ++ec )
+        {
+          if ( ( packGhosted && ec->ghost_id > BulkData::SHARED ) || ( packShared && ec->ghost_id == BulkData::SHARED ) )
+          {
+            comm.send_buffer( ec->proc )
+                .pack<EntityKey>( i->key )
+                .pack<EntityState>( status )
+                .pack<int>(owned_closure_int);
+  
+            const bool promotingGhostToShared =
+              packGhosted && owned_closure_int==1 && !m_bulkData.bucket(entity).owned();
+            if (promotingGhostToShared) {
+              comm.send_buffer(comm.parallel_rank())
+                  .pack<EntityKey>( i->key )
+                  .pack<EntityState>( status )
+                  .pack<int>(owned_closure_int);
+            }
+
+            flag = true ;
+          }
+        }
+      }    
+    }    
+  }
+
+  return flag ;
+}
+
+void MeshModification::communicate_entity_modification( const bool shared , std::vector<EntityParallelState > & data )
+{
+  stk::CommSparse comm( m_bulkData.parallel() );
+  const int p_size = comm.parallel_size();
+
+  // Sizing send buffers:
+  pack_entity_modification(shared , comm);
+
+  comm.allocate_buffers();
+
+  bool needToSend = false;
+  for (int procNumber=0; procNumber < p_size; ++procNumber)
+  {
+    if (comm.send_buffer(procNumber).capacity() > 0) 
+    {    
+      needToSend = true;
+      break;
+    }    
+  }
+
+  // Packing send buffers:
+  if (needToSend) {
+    pack_entity_modification(shared , comm);
+  }
+
+  comm.communicate();
+
+  const EntityCommListInfoVector & entityCommList = m_bulkData.internal_comm_list();
+  for ( int procNumber = 0 ; procNumber < p_size ; ++procNumber ) {
+    CommBuffer & buf = comm.recv_buffer( procNumber );
+    EntityKey key; 
+    EntityState state;
+    int remote_owned_closure_int;
+    bool remote_owned_closure;
+
+    while ( buf.remaining() ) {
+
+      buf.unpack<EntityKey>( key )
+          .unpack<EntityState>( state )
+          .unpack<int>( remote_owned_closure_int);
+      remote_owned_closure = ((remote_owned_closure_int==1)?true:false);
+
+      // search through entity_comm, should only receive info on entities
+      // that are communicated.
+      EntityCommListInfo info = find_entity(m_bulkData, entityCommList, key);
+      int remoteProc = procNumber;
+      if (!shared && remoteProc == m_bulkData.parallel_rank()) {
+        remoteProc = m_bulkData.parallel_owner_rank(info.entity);
+      }    
+      EntityParallelState parallel_state = {remoteProc, state, info, remote_owned_closure};
+      data.push_back( parallel_state );
+    }    
+  }
+
+  std::sort( data.begin() , data.end() );
+}
+
 // Resolve modifications for shared entities:
 // If not locally destroyed and remotely modified
 // then set to locally modified.
@@ -233,17 +332,17 @@ void MeshModification::internal_resolve_shared_modify_delete(stk::mesh::EntityVe
     ThrowRequireMsg(m_bulkData.parallel_size() > 1, "Do not call this in serial");
 
     stk::mesh::EntityProcVec entitiesToRemoveFromSharing;
-    m_bulkData.delete_shared_entities_which_are_no_longer_in_owned_closure(entitiesToRemoveFromSharing);
+    delete_shared_entities_which_are_no_longer_in_owned_closure(entitiesToRemoveFromSharing);
 
-    std::vector<stk::mesh::BulkData::EntityParallelState> remotely_modified_shared_entities;
+    std::vector<EntityParallelState> remotely_modified_shared_entities;
 
     // Communicate entity modification state for shared entities
     // the resulting vector is sorted by entity and process.
     const bool communicate_shared = true;
-    m_bulkData.communicate_entity_modification(communicate_shared, remotely_modified_shared_entities);
+    communicate_entity_modification(communicate_shared, remotely_modified_shared_entities);
 
     // We iterate backwards to ensure that we hit the higher-ranking entities first.
-    for(std::vector<stk::mesh::BulkData::EntityParallelState>::reverse_iterator
+    for(std::vector<EntityParallelState>::reverse_iterator
     i = remotely_modified_shared_entities.rbegin(); i != remotely_modified_shared_entities.rend();)
     {
 
@@ -298,16 +397,15 @@ void MeshModification::internal_resolve_shared_modify_delete(stk::mesh::EntityVe
         {
             const bool am_i_old_local_owner = m_bulkData.parallel_rank() == owner;
 
-            if(remote_owner_destroyed)
-            {
-                m_bulkData.internal_establish_new_owner(entity);
+            if(remote_owner_destroyed) {
+                internal_establish_new_owner(entity);
             }
 
             const bool am_i_new_local_owner = m_bulkData.parallel_rank() == m_bulkData.parallel_owner_rank(entity);
             const bool did_i_just_become_owner = (!am_i_old_local_owner && am_i_new_local_owner );
 
             const bool is_entity_shared = !m_bulkData.internal_entity_comm_map_shared(key).empty();
-            m_bulkData.internal_update_parts_for_shared_entity(entity, is_entity_shared, did_i_just_become_owner);
+            internal_update_parts_for_shared_entity(entity, is_entity_shared, did_i_just_become_owner);
         }
     } // remote mod loop
 
@@ -324,6 +422,253 @@ void MeshModification::internal_resolve_shared_modify_delete(stk::mesh::EntityVe
     m_bulkData.remove_entities_from_sharing(entitiesToRemoveFromSharing, entitiesNoLongerShared);
 }
 
+void MeshModification::internal_establish_new_owner(stk::mesh::Entity entity)
+{
+  const int new_owner = m_bulkData.determine_new_owner(entity);
+
+  m_bulkData.internal_set_owner(entity, new_owner);
+}
+
+void MeshModification::internal_update_parts_for_shared_entity(stk::mesh::Entity entity, const bool is_entity_shared, const bool did_i_just_become_owner)
+{
+  OrdinalVector parts_to_add_entity_to , parts_to_remove_entity_from, scratchOrdinalVec, scratchSpace;
+
+  if ( !is_entity_shared ) {
+    parts_to_remove_entity_from.push_back(m_bulkData.mesh_meta_data().globally_shared_part().mesh_meta_data_ordinal());
+  }    
+
+  if ( did_i_just_become_owner ) {
+    parts_to_add_entity_to.push_back(m_bulkData.mesh_meta_data().locally_owned_part().mesh_meta_data_ordinal());
+  }    
+
+  if ( ! parts_to_add_entity_to.empty() || ! parts_to_remove_entity_from.empty() ) {
+    m_bulkData.internal_change_entity_parts( entity , parts_to_add_entity_to , parts_to_remove_entity_from, scratchOrdinalVec, scratchSpace );
+  }    
+}
+
+void MeshModification::destroy_dependent_ghosts( Entity entity, EntityProcVec& entitiesToRemoveFromSharing )
+{ 
+  EntityRank entity_rank = m_bulkData.entity_rank(entity);
+  const EntityRank end_rank = static_cast<EntityRank>(m_bulkData.mesh_meta_data().entity_rank_count());
+  for (EntityRank irank = static_cast<EntityRank>(end_rank - 1); irank > entity_rank; --irank)
+  {
+    int num_rels = m_bulkData.num_connectivity(entity, irank);
+    const Entity* rels     = m_bulkData.begin(entity, irank);
+  
+    for (int r = num_rels - 1; r >= 0; --r)
+    { 
+      Entity e = rels[r];
+
+      bool upwardRelationOfEntityIsInClosure = m_bulkData.owned_closure(e);
+      ThrowRequireMsg( !upwardRelationOfEntityIsInClosure, m_bulkData.entity_rank(e) << " with id " << m_bulkData.identifier(e) << " should not be in closure." );
+  
+      // Recursion
+      if (m_bulkData.is_valid(e) && m_bulkData.bucket(e).in_aura())
+      {
+          destroy_dependent_ghosts( e, entitiesToRemoveFromSharing );
+      }
+    }
+  }  
+     
+  const bool successfully_destroyed_entity = m_bulkData.destroy_entity(entity);
+  if (!successfully_destroyed_entity)
+  { 
+      std::vector<int> sharing_procs;
+      m_bulkData.comm_shared_procs(m_bulkData.entity_key(entity), sharing_procs);
+      for(int p : sharing_procs) {
+          entitiesToRemoveFromSharing.emplace_back(entity, p);
+      }
+  }
+}
+
+// Entities with sharing information that are not in the owned closure
+// have been modified such that they are no longer shared.
+// These may no longer be needed or may become ghost entities.
+// There is not enough information so assume they are to be deleted
+// and let these entities be re-ghosted if they are needed.
+
+// Open question: Should an owned and shared entity that does not
+// have an upward relation to an owned entity be destroyed so that
+// ownership transfers to another process?
+
+void MeshModification::delete_shared_entities_which_are_no_longer_in_owned_closure(EntityProcVec& entitiesToRemoveFromSharing)
+{
+  for ( EntityCommListInfoVector::const_reverse_iterator
+        i =  m_bulkData.internal_comm_list().rbegin() ;
+        i != m_bulkData.internal_comm_list().rend() ; ++i) 
+  {
+    Entity entity = i->entity;
+    if (m_bulkData.is_valid(entity) && !m_bulkData.owned_closure(entity)) {
+      if ( m_bulkData.in_shared(entity) )
+      {    
+        destroy_dependent_ghosts( entity, entitiesToRemoveFromSharing );
+      }    
+    }    
+  }
+}
+
+//----------------------------------------------------------------------
+// Resolve modifications for ghosted entities:
+// If a ghosted entity is modified or destroyed on the owning
+// process then the ghosted entity must be destroyed.
+//
+// Post condition:
+//  Ghosted entities of modified or deleted entities are destroyed.
+//  Ghosted communication lists are cleared to reflect all deletions.
+
+void MeshModification::internal_resolve_ghosted_modify_delete(const stk::mesh::EntityVector& entitiesNoLongerShared)
+{
+  ThrowRequireMsg(m_bulkData.parallel_size() > 1, "Do not call this in serial");
+  // Resolve modifications for ghosted entities:
+
+  std::vector<EntityParallelState > remotely_modified_ghosted_entities ;
+  internal_resolve_formerly_shared_entities(entitiesNoLongerShared);
+
+  // Communicate entity modification state for ghost entities
+  const bool communicate_shared = false ;
+  communicate_entity_modification( communicate_shared , remotely_modified_ghosted_entities );
+
+  const size_t ghosting_count = m_bulkData.m_ghosting.size();
+  const size_t ghosting_count_minus_shared = ghosting_count - 1; 
+
+  std::vector<Entity> promotingToShared;
+
+  // We iterate backwards over remote_mod to ensure that we hit the
+  // higher-ranking entities first. This is important because higher-ranking
+  // entities like element must be deleted before the nodes they have are
+  // deleted.
+  for ( std::vector<EntityParallelState>::reverse_iterator
+        i = remotely_modified_ghosted_entities.rbegin(); i != remotely_modified_ghosted_entities.rend() ; ++i )
+  {
+    Entity entity                 = i->comm_info.entity;
+    const EntityKey key           = i->comm_info.key;
+    const int      remote_proc    = i->from_proc;
+    const bool     local_owner    = m_bulkData.parallel_owner_rank(entity) == m_bulkData.parallel_rank() ;
+    const bool remotely_destroyed = Deleted == i->state ;
+    const bool remote_proc_is_owner = remote_proc == m_bulkData.parallel_owner_rank(entity);
+    const bool isAlreadyDestroyed  = !m_bulkData.is_valid(entity);
+
+    if ( local_owner ) { // Sending to 'remote_proc' for ghosting
+
+      if ( remotely_destroyed ) {
+
+        // remove from ghost-send list
+
+        for ( size_t j = ghosting_count_minus_shared ; j>=1 ; --j) {
+          m_bulkData.entity_comm_map_erase( key, EntityCommInfo( j , remote_proc ) ); 
+        }
+      }    
+      else {
+        if (!m_bulkData.in_ghost(m_bulkData.aura_ghosting(), entity) && m_bulkData.state(entity)==Unchanged) {
+          m_bulkData.set_state(entity, Modified);
+        }
+
+        const bool shouldPromoteToShared = !isAlreadyDestroyed && i->remote_owned_closure==1 && key.rank() < stk::topology::ELEM_RANK;
+        if (shouldPromoteToShared) {
+          m_bulkData.entity_comm_map_insert(entity, EntityCommInfo(BulkData::SHARED, remote_proc));
+          promotingToShared.push_back(entity);
+        }
+      }    
+    }    
+    else if (remote_proc_is_owner) { // Receiving from 'remote_proc' for ghosting
+
+      const bool hasBeenPromotedToSharedOrOwned = m_bulkData.owned_closure(entity);
+      bool isAuraGhost = false;
+      bool isCustomGhost = false;
+      PairIterEntityComm pairIterEntityComm = m_bulkData.internal_entity_comm_map(entity);
+      for(unsigned j=0; j<pairIterEntityComm.size(); ++j) {
+        if (pairIterEntityComm[j].ghost_id == BulkData::AURA) {
+          isAuraGhost = true;
+        }
+        else if (pairIterEntityComm[j].ghost_id > BulkData::AURA) {
+          isCustomGhost = true;
+        }
+      }
+
+      if ( isAuraGhost ) {
+        if (!isAlreadyDestroyed && hasBeenPromotedToSharedOrOwned) {
+          m_bulkData.entity_comm_map_insert(entity, EntityCommInfo(BulkData::SHARED, remote_proc));
+          promotingToShared.push_back(entity);
+        }
+        m_bulkData.entity_comm_map_erase(key, m_bulkData.aura_ghosting());
+      }
+
+      if(!isAlreadyDestroyed) {
+        const bool wasDestroyedByOwner = remotely_destroyed;
+        const bool shouldDestroyGhost = wasDestroyedByOwner || (isAuraGhost && !isCustomGhost && !hasBeenPromotedToSharedOrOwned);
+        const bool shouldRemoveFromGhosting = remotely_destroyed && !isAuraGhost && hasBeenPromotedToSharedOrOwned;
+
+        if (shouldRemoveFromGhosting) {
+          for ( size_t j = ghosting_count_minus_shared ; j >=1 ; --j ) {
+            m_bulkData.entity_comm_map_erase( key, *m_bulkData.m_ghosting[j] );
+          }
+        }
+
+        if ( shouldDestroyGhost ) {
+          const bool was_ghost = true;
+          m_bulkData.internal_destroy_entity_with_notification(entity, was_ghost);
+        }
+
+        m_bulkData.entity_comm_list_insert(entity);
+      }
+    }
+  } // end loop on remote mod
+
+  // Erase all ghosting communication lists for:
+  // 1) Destroyed entities.
+  // 2) Owned and modified entities.
+
+  for ( EntityCommListInfoVector::const_reverse_iterator
+        i = m_bulkData.internal_comm_list().rbegin() ; i != m_bulkData.internal_comm_list().rend() ; ++i) {
+
+    Entity entity = i->entity;
+
+    const bool locally_destroyed = !is_valid(entity);
+    const bool locally_owned_and_modified = locally_destroyed ? false :
+      (Modified == m_bulkData.state(entity) && (m_bulkData.parallel_rank() == m_bulkData.parallel_owner_rank(entity)));
+
+    if ( locally_destroyed ) {
+      for ( size_t j = ghosting_count_minus_shared ; j >=1 ; --j ) {
+        m_bulkData.entity_comm_map_erase( i->key, *m_bulkData.m_ghosting[j] );
+      }
+    }
+    else if ( locally_owned_and_modified ) {
+      m_bulkData.entity_comm_map_erase( i->key, m_bulkData.aura_ghosting() );
+    }
+  }
+
+  if (!promotingToShared.empty()) {
+    OrdinalVector sharedPart, auraPart, scratchOrdinalVec, scratchSpace;
+    sharedPart.push_back(m_bulkData.mesh_meta_data().globally_shared_part().mesh_meta_data_ordinal());
+    auraPart.push_back(m_bulkData.mesh_meta_data().aura_part().mesh_meta_data_ordinal());
+    for(Entity entity : promotingToShared) {
+      m_bulkData.internal_change_entity_parts(entity, sharedPart /*add*/, auraPart /*remove*/, scratchOrdinalVec, scratchSpace);
+    }
+    m_bulkData.add_comm_list_entries_for_entities(promotingToShared);
+  }
+}
+
+void MeshModification::add_entity_to_same_ghosting(Entity entity, Entity connectedGhost)
+{
+  for(PairIterEntityComm ec(m_bulkData.internal_entity_comm_map(connectedGhost)); ! ec.empty(); ++ec) {
+    if (ec->ghost_id > BulkData::AURA) {
+      m_bulkData.entity_comm_map_insert(entity, EntityCommInfo(ec->ghost_id, ec->proc));
+      m_bulkData.entity_comm_list_insert(entity);
+    }    
+  }
+}
+
+void MeshModification::internal_resolve_formerly_shared_entities(const EntityVector& entitiesNoLongerShared)
+{
+  for(Entity entity : entitiesNoLongerShared) {
+    EntityVector ghostRelations = m_bulkData.get_upward_send_ghost_relations(entity);
+
+    for(Entity ghost : ghostRelations) {
+      add_entity_to_same_ghosting(entity, ghost);
+    }    
+  }
+}
+
 void MeshModification::ensure_meta_data_is_committed()
 {
   if (!m_bulkData.mesh_meta_data().is_commit())
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshModification.hpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshModification.hpp
index 2d120dd8d4fb..f677db89e866 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshModification.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/MeshModification.hpp
@@ -37,14 +37,29 @@
 
 #include <stk_mesh/base/Types.hpp>      // for MeshIndex, EntityRank, etc
 #include <stk_mesh/base/Entity.hpp>
+#include <stk_mesh/base/EntityLess.hpp>
+#include <stk_mesh/base/EntityCommListInfo.hpp>
+#include "stk_mesh/base/EntityKey.hpp"
+#include "stk_mesh/baseImpl/DeletedEntityCache.hpp"
 
 namespace stk {
+class CommSparse;
 namespace mesh {
 
 class BulkData;
 
 namespace impl {
 
+struct EntityParallelState {
+  int                 from_proc;
+  EntityState         state;
+  EntityCommListInfo  comm_info;
+  bool                remote_owned_closure;
+
+  bool operator<(const EntityParallelState& rhs) const
+  { return comm_info.key < rhs.comm_info.key; }
+};
+
 class MeshModification
 {
 public:
@@ -52,7 +67,7 @@ class MeshModification
     enum modification_optimization {MOD_END_SORT, MOD_END_NO_SORT };
 
     MeshModification(stk::mesh::BulkData& bulkData) : m_bulkData(bulkData), m_entity_states(),
-            m_sync_state(MODIFIABLE), m_sync_count(0), m_did_any_shared_entity_change_parts(false)
+            m_deleted_entity_cache(bulkData), m_sync_state(MODIFIABLE), m_sync_count(0), m_did_any_shared_entity_change_parts(false)
     {
         m_entity_states.push_back(Deleted);
     }
@@ -78,10 +93,12 @@ class MeshModification
     void change_entity_owner( const EntityProcVec & arg_change);
 
     void internal_resolve_shared_modify_delete(stk::mesh::EntityVector & entitiesNoLongerShared);
+    void internal_resolve_ghosted_modify_delete(const stk::mesh::EntityVector& entitiesNoLongerShared);
 
     bool did_any_shared_entity_change_parts () const { return m_did_any_shared_entity_change_parts; }
     void set_shared_entity_changed_parts() { m_did_any_shared_entity_change_parts = true; }
 
+    //TODO: these should be Entity::entity_value_type
     bool is_entity_deleted(size_t entity_index) const { return m_entity_states[entity_index] == Deleted; }
     bool is_entity_modified(size_t entity_index) const { return m_entity_states[entity_index] == Modified; }
     bool is_entity_created(size_t entity_index) const { return m_entity_states[entity_index] == Created; }
@@ -90,23 +107,41 @@ class MeshModification
     stk::mesh::EntityState get_entity_state(size_t entity_index) const { return static_cast<stk::mesh::EntityState>(m_entity_states[entity_index]); }
     void set_entity_state(size_t entity_index, stk::mesh::EntityState state) { m_entity_states[entity_index] = state; }
 
-    void mark_entity_as_deleted(size_t entity_index) {  m_entity_states[entity_index] = Deleted; }
+    void mark_entity_as_deleted(Entity entity, bool is_ghost)
+    {
+        m_entity_states[entity.local_offset()] = Deleted;
+        m_deleted_entity_cache.mark_entity_as_deleted(entity, is_ghost);
+    }
+
     void mark_entity_as_created(size_t entity_index) {  m_entity_states[entity_index] = Created; }
 
     void add_created_entity_state() { m_entity_states.push_back(Created); }
 
+    DeletedEntityCache& get_deleted_entity_cache() { return m_deleted_entity_cache; }
+
+    const DeletedEntityCache& get_deleted_entity_cache() const { return m_deleted_entity_cache; }
 private:
 
+    bool pack_entity_modification( const bool packShared , stk::CommSparse & comm );
+    void communicate_entity_modification( const bool shared , std::vector<EntityParallelState > & data );
     void reset_shared_entity_changed_parts() { m_did_any_shared_entity_change_parts = false; }
+    void internal_establish_new_owner(stk::mesh::Entity entity);
+    void internal_update_parts_for_shared_entity(stk::mesh::Entity entity, const bool is_entity_shared, const bool did_i_just_become_owner);
+    void destroy_dependent_ghosts( Entity entity, EntityProcVec& entitiesToRemoveFromSharing );
+    void delete_shared_entities_which_are_no_longer_in_owned_closure(EntityProcVec& entitiesToRemoveFromSharing);
+    void remove_entities_from_sharing(const EntityProcVec& entitiesToRemoveFromSharing, stk::mesh::EntityVector & entitiesNoLongerShared);
+    void add_entity_to_same_ghosting(Entity entity, Entity connectedGhost);
+    void internal_resolve_formerly_shared_entities(const EntityVector& entitiesNoLongerShared);
     void reset_undeleted_entity_states_to_unchanged();
     void ensure_meta_data_is_committed();
 
-    bool internal_modification_end(modification_optimization opt);
     bool internal_resolve_node_sharing(modification_optimization opt);
     bool internal_modification_end_after_node_sharing_resolution(modification_optimization opt);
 
     stk::mesh::BulkData &m_bulkData;
     std::vector<stk::mesh::EntityState> m_entity_states;
+    DeletedEntityCache m_deleted_entity_cache;
+
     BulkDataSyncState m_sync_state;
     size_t m_sync_count;
     bool m_did_any_shared_entity_change_parts;
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/Visitors.hpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/Visitors.hpp
index f2e0127ed63d..7f4b92c89ab3 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/Visitors.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/Visitors.hpp
@@ -50,36 +50,49 @@ namespace stk {
 namespace mesh {
 namespace impl {
 
+template<class DO_THIS_FOR_ENTITY_IN_CLOSURE, class DESIRED_ENTITY>
+void VisitClosureBelowEntityNoRecurse(
+        const BulkData & mesh,
+        Entity inputEntity,
+        EntityRank inputEntityRank,
+        DO_THIS_FOR_ENTITY_IN_CLOSURE & do_this,
+        DESIRED_ENTITY & desired_entity)
+{
+  for (EntityRank rank = stk::topology::NODE_RANK ; rank < inputEntityRank ; ++rank) {
+      const unsigned num_entities_of_rank = mesh.num_connectivity(inputEntity,rank);
+      if (num_entities_of_rank > 0) {
+        const Entity * entities = mesh.begin(inputEntity,rank);
+
+        for (unsigned i=0 ; i<num_entities_of_rank ; ++i) {
+          if (desired_entity(entities[i])) {
+            do_this(entities[i]);
+          }
+        }
+      }
+  }
+}
+
 template<class DO_THIS_FOR_ENTITY_IN_CLOSURE, class DESIRED_ENTITY>
 void VisitClosureNoRecurse(
         const BulkData & mesh,
         Entity inputEntity,
+        EntityRank inputEntityRank,
         DO_THIS_FOR_ENTITY_IN_CLOSURE & do_this,
         DESIRED_ENTITY & desired_entity)
 {
   if (desired_entity(inputEntity)) {
     do_this(inputEntity);
-    const EntityRank inputEntityRank = mesh.entity_rank(inputEntity);
-    for (EntityRank rank = stk::topology::NODE_RANK ; rank < inputEntityRank ; ++rank) {
-        const unsigned num_entities_of_rank = mesh.num_connectivity(inputEntity,rank);
-        if (num_entities_of_rank > 0) {
-          const Entity * entities = mesh.begin(inputEntity,rank);
-
-          for (unsigned i=0 ; i<num_entities_of_rank ; ++i) {
-            if (desired_entity(entities[i])) {
-              do_this(entities[i]);
-            }
-          }
-        }
-    }
+    VisitClosureBelowEntityNoRecurse(mesh, inputEntity, inputEntityRank, do_this, desired_entity);
   }
 }
 
 inline
-EntityRank get_highest_downward_connected_rank(const BulkData& mesh, Entity entity)
+EntityRank get_highest_downward_connected_rank(const BulkData& mesh,
+                                               Entity entity,
+                                               EntityRank entityRank)
 {
-  EntityRank nextLowerRank = static_cast<EntityRank>(mesh.entity_rank(entity) - 1);
-  while (mesh.num_connectivity(entity, nextLowerRank) == 0 && nextLowerRank > stk::topology::NODE_RANK) {
+  EntityRank nextLowerRank = static_cast<EntityRank>(entityRank - 1);
+  while (nextLowerRank > stk::topology::NODE_RANK && mesh.num_connectivity(entity, nextLowerRank) == 0) {
     nextLowerRank = static_cast<EntityRank>(nextLowerRank-1);
   }
   return nextLowerRank;
@@ -89,21 +102,21 @@ template<class DO_THIS_FOR_ENTITY_IN_CLOSURE, class DESIRED_ENTITY>
 void VisitClosureGeneral(
         const BulkData & mesh,
         Entity inputEntity,
+        EntityRank inputEntityRank,
         DO_THIS_FOR_ENTITY_IN_CLOSURE & do_this,
         DESIRED_ENTITY & desired_entity)
 {
-  const EntityRank inputEntityRank = mesh.entity_rank(inputEntity);
   if (inputEntityRank <= stk::topology::ELEM_RANK) {
-    VisitClosureNoRecurse(mesh, inputEntity, do_this, desired_entity);
+    VisitClosureNoRecurse(mesh, inputEntity, inputEntityRank, do_this, desired_entity);
   }
   else if (desired_entity(inputEntity)) {
     do_this(inputEntity);
-    const EntityRank nextLowerRank = get_highest_downward_connected_rank(mesh, inputEntity);
+    const EntityRank nextLowerRank = get_highest_downward_connected_rank(mesh, inputEntity, inputEntityRank);
     const unsigned num_entities_of_rank = mesh.num_connectivity(inputEntity,nextLowerRank);
     if (num_entities_of_rank > 0) {
       const Entity * entities = mesh.begin(inputEntity,nextLowerRank);
       for (unsigned i=0 ; i<num_entities_of_rank ; ++i) {
-        VisitClosureGeneral(mesh,entities[i],do_this,desired_entity);
+        VisitClosureGeneral(mesh,entities[i],nextLowerRank,do_this,desired_entity);
       }
     }
   }
@@ -143,7 +156,8 @@ void VisitClosureGeneral(
 {
     for (FORWARD_ITERATOR entity_iterator = start ; entity_iterator != finish ; ++entity_iterator)
     {
-        VisitClosureGeneral<DO_THIS_FOR_ENTITY_IN_CLOSURE,DESIRED_ENTITY>(mesh,get_entity(entity_iterator),do_this,desired_entity);
+        Entity entity = get_entity(entity_iterator);
+        VisitClosureGeneral<DO_THIS_FOR_ENTITY_IN_CLOSURE,DESIRED_ENTITY>(mesh,entity,mesh.entity_rank(entity),do_this,desired_entity);
     }
 }
 
@@ -234,7 +248,7 @@ void VisitClosure(
         DO_THIS_FOR_ENTITY_IN_CLOSURE & do_this)
 {
     OnlyVisitOnce ovo(mesh);
-    VisitClosureGeneral(mesh,entity_of_interest,do_this,ovo);
+    VisitClosureGeneral(mesh,entity_of_interest,mesh.entity_rank(entity_of_interest),do_this,ovo);
 }
 
 
@@ -457,19 +471,30 @@ struct OnlyGhosts  {
 };
 
 struct OnlyGhostsEPM  {
-    OnlyGhostsEPM(BulkData & mesh_in, const EntityProcMapping& epm_in, const EntityProcMapping& entityShr)
-    : mesh(mesh_in), myMapping(epm_in), entitySharing(entityShr) {}
+  OnlyGhostsEPM(BulkData & mesh_in, const EntityProcMapping& entityShr)
+  : mesh(mesh_in), entitySharing(entityShr) {}
+  bool operator()(Entity entity) {
+    if (proc != mesh.parallel_owner_rank(entity)) {
+      const bool isSharedWithProc = entitySharing.find(entity, proc);
+      return !isSharedWithProc;
+    }
+    return false;
+  }
+  BulkData & mesh;
+  const EntityProcMapping& entitySharing;
+  int proc;
+};
+
+struct NotAlreadyShared  {
+    NotAlreadyShared(BulkData & mesh_in, const EntityProcMapping& entityShr)
+    : mesh(mesh_in), entitySharing(entityShr) {}
     bool operator()(Entity entity) {
-      if (!myMapping.find(entity, proc)) {
-        if (proc != mesh.parallel_owner_rank(entity)) {
-          const bool isSharedWithProc = entitySharing.find(entity, proc);
-          return !isSharedWithProc;
-        }
+      if (proc != mesh.parallel_owner_rank(entity)) {
+        return !entitySharing.find(entity,proc);
       }
       return false;
     }
     BulkData & mesh;
-    const EntityProcMapping& myMapping;
     const EntityProcMapping& entitySharing;
     int proc;
 };
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/ElemElemGraphImpl.hpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/ElemElemGraphImpl.hpp
index a30762821b93..eb8e3a388d05 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/ElemElemGraphImpl.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/ElemElemGraphImpl.hpp
@@ -277,8 +277,7 @@ struct IdViaSidePair
 
 }//namespace impl
 
-const int max_num_sides_per_elem = 10;
-const double inverse_of_max_num_sides_per_elem = 0.1;
+constexpr int max_num_sides_per_elem = 8;
 
 struct GraphEdge
 {
@@ -289,7 +288,7 @@ struct GraphEdge
     }
 
     GraphEdge() :
-        vertex1(std::numeric_limits<impl::LocalId>::max()), vertex2(std::numeric_limits<impl::LocalId>::max())
+        vertex1(impl::INVALID_LOCAL_ID), vertex2(impl::INVALID_LOCAL_ID)
     {}
 
     GraphEdge(const GraphEdge& rhs)
@@ -326,12 +325,12 @@ struct GraphEdge
 
     impl::LocalId elem1() const
     {
-        return vertex1*inverse_of_max_num_sides_per_elem;
+        return vertex1/max_num_sides_per_elem;
     }
 
     impl::LocalId elem2() const
     {
-        return vertex2*inverse_of_max_num_sides_per_elem;
+        return vertex2/max_num_sides_per_elem;
     }
 
     int get_side(const impl::LocalId& vertex) const
@@ -350,6 +349,11 @@ struct GraphEdge
     impl::LocalId vertex2;
 };
 
+constexpr bool is_valid(const GraphEdge& lhs)
+{
+    return lhs.vertex1 != impl::INVALID_LOCAL_ID;
+}
+
 using CoincidentElementConnection = GraphEdge;
 
 struct GraphEdgeLessByElem1 {
@@ -383,6 +387,17 @@ struct GraphEdgeLessByElem1 {
     }
 };
 
+struct GraphEdgeLessByElem2Only
+{
+    bool operator()(const GraphEdge& a, const GraphEdge& b) const
+    {
+        impl::LocalId a_elem2 = std::abs(a.elem2());
+        impl::LocalId b_elem2 = std::abs(b.elem2());
+
+        return a_elem2 < b_elem2 || (a_elem2 == b_elem2 && a.side2() < b.side2());
+    }  
+};
+
 inline
 bool operator<(const GraphEdge& a, const GraphEdge& b)
 {
@@ -421,7 +436,9 @@ bool operator==(const GraphEdge& a, const GraphEdge& b)
 inline
 std::ostream& operator<<(std::ostream& out, const GraphEdge& graphEdge)
 {
-    out << "(" << graphEdge.vertex1 << " -> " << graphEdge.vertex2 << ")";
+    out << "GraphEdge vertices: (" << graphEdge.vertex1 << " -> " << graphEdge.vertex2 
+        << "), element-side pairs: (" << graphEdge.elem1() << ", " << graphEdge.side1() 
+        << ") -> (" << graphEdge.elem2() << ", " << graphEdge.side2() << ")";
     return out;
 }
 
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/ElemGraphShellConnections.cpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/ElemGraphShellConnections.cpp
index e8578433b975..2f14c6d323e4 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/ElemGraphShellConnections.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/ElemGraphShellConnections.cpp
@@ -120,8 +120,14 @@ void remove_graph_edges_blocked_by_shell(GraphInfo &graphInfo)
         SideConnections sideConnectionsForElement(graphInfo.elementTopologies[localId].num_sides());
         for(int side : sideConnectionsForElement.get_sides_connected_to_shell_and_nonshell(graphInfo, localId))
             fill_non_shell_graph_edges_to_delete(graphInfo, stk::mesh::impl::ElementSidePair(localId, side), edgesToDelete);
+
+        if (edgesToDelete.size() > 0)
+        {
+            std::sort(edgesToDelete.begin(), edgesToDelete.end(), GraphEdgeLessByElem1());
+            graphInfo.graph.delete_sorted_edges(edgesToDelete);
+            edgesToDelete.clear();
+        }
     }
-    graphInfo.graph.delete_sorted_edges(edgesToDelete);
 }
 
 }
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/GraphEdgeData.cpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/GraphEdgeData.cpp
index aa3ea37716bb..aeb9629f53af 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/GraphEdgeData.cpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/GraphEdgeData.cpp
@@ -1,5 +1,6 @@
 #include "GraphEdgeData.hpp"
 #include "ElemElemGraphImpl.hpp"
+#include "stk_mesh/baseImpl/elementGraph/GraphTypes.hpp"
 #include <stk_util/util/SortAndUnique.hpp>
 #include <stk_util/util/ReportHandler.hpp>
 
@@ -10,35 +11,37 @@ namespace mesh
 
 void Graph::set_num_local_elements(size_t n)
 {
-    m_elemOffsets.resize(n+1);
+    m_elemOffsets.resize(n, IndexRange(m_graphEdges.size()+1, m_graphEdges.size()+1));
 }
 
 void Graph::add_new_element()
 {
-    if (m_elemOffsets.empty()) {
-      m_elemOffsets.assign(1, 0);
-    }
-    m_elemOffsets.push_back(m_graphEdges.size());
+    m_elemOffsets.push_back({m_graphEdges.size()+1, m_graphEdges.size()+1});
 }
 
+
 size_t Graph::get_num_elements_in_graph() const
 {
-    return m_elemOffsets.size() - 1;
+    return m_elemOffsets.size();
 }
 
 size_t Graph::get_num_edges() const
 {
-    return m_graphEdges.size();
+    return m_graphEdges.size() - m_numUnusedEntries;    
 }
 
 size_t Graph::get_num_edges_for_element(impl::LocalId elem) const
 {
-    return m_elemOffsets[elem+1] - m_elemOffsets[elem];
+    auto& indices = m_elemOffsets[elem];
+    return indices.second - indices.first;
 }
 
 const GraphEdge & Graph::get_edge_for_element(impl::LocalId elem1, size_t index) const
 {
-    return m_graphEdges[m_elemOffsets[elem1]+index];
+    ThrowAssertMsg(get_num_edges_for_element(elem1) != 0, "Cannot retrieve graph edge for element that has no faces");
+    ThrowAssertMsg(get_num_edges_for_element(elem1) > index, "index out of range");
+
+    return m_graphEdges[m_elemOffsets[elem1].first+index];
 }
 
 void fill_graph_edges_for_elem_side(const GraphEdgesForElement &graphEdgesForElement, int side, std::vector<GraphEdge>& edges)
@@ -61,80 +64,183 @@ std::vector<GraphEdge> Graph::get_edges_for_element_side(impl::LocalId elem, int
 
 GraphEdgesForElement Graph::get_edges_for_element(impl::LocalId elem) const
 {
-    const unsigned begin = m_elemOffsets[elem];
-    const unsigned end = m_elemOffsets[elem+1];
-    return GraphEdgesForElement(&m_graphEdges[begin], &m_graphEdges[end]);
+    const unsigned beginOffset = m_elemOffsets[elem].first;
+    const unsigned endOffset   = m_elemOffsets[elem].second;
+
+    const GraphEdge* beginEdge = m_graphEdges.data() + beginOffset;
+    const GraphEdge* endEdge   = m_graphEdges.data() + endOffset;
+    return GraphEdgesForElement(beginEdge, endEdge);
 }
 
+
 void Graph::set_offsets()
 {
-  const unsigned numOffsets = m_elemOffsets.size();
-  m_elemOffsets.assign(std::max(1u, numOffsets), 0);
+  if (m_graphEdges.size() == 0)
+  {
+    return;
+  }
 
-  impl::LocalId prevElem = impl::INVALID_LOCAL_ID;
-  unsigned edgeCounter = 0;
-  for(const GraphEdge& edge : m_graphEdges) {
-    impl::LocalId elem1 = edge.elem1();
-    if (elem1 != prevElem) {
-      if (prevElem != impl::INVALID_LOCAL_ID) {
-        m_elemOffsets[prevElem] = edgeCounter;
+  impl::LocalId currElem = m_graphEdges[0].elem1();
+  unsigned startIdx = 0;
+  for (unsigned i=0; i < m_graphEdges.size(); ++i)
+  {
+    impl::LocalId nextElem = m_graphEdges[i].elem1();
+    if (nextElem != currElem)
+    {
+      ThrowAssertMsg(currElem >= 0 && size_t(currElem) <= m_elemOffsets.size(), "element out of range");
+      m_elemOffsets[currElem] = IndexRange(startIdx, i);
+      for (impl::LocalId elem=currElem+1; elem < nextElem; elem++)
+      {
+        m_elemOffsets[elem] = IndexRange(0, 0);
       }
-      edgeCounter = 0;
-      prevElem = elem1;
-    }
-    ++edgeCounter;
-  }
 
-  if (prevElem != impl::INVALID_LOCAL_ID) {
-    m_elemOffsets[prevElem] = edgeCounter;
+      currElem = nextElem;
+      startIdx = i;
+    }
   }
 
-  unsigned edgeOffset = 0;
-  size_t numElems = m_elemOffsets.size()-1;
-  for(size_t i=0; i<numElems; ++i) {
-    unsigned count = m_elemOffsets[i];
-    m_elemOffsets[i] = edgeOffset;
-    edgeOffset += count;
-  }
-  m_elemOffsets.back() = edgeOffset;
+  m_elemOffsets[currElem] = IndexRange(startIdx, m_graphEdges.size());
 }
 
+
 using IterType = std::vector<GraphEdge>::iterator;
 
 void Graph::add_sorted_edges(const std::vector<GraphEdge>& graphEdges)
 {
   ThrowAssertMsg(stk::util::is_sorted_and_unique(graphEdges, GraphEdgeLessByElem1()),"Input vector 'graphEdges' is expected to be sorted-and-unique");
-  if (!graphEdges.empty()) {
-    stk::util::insert_keep_sorted(graphEdges, m_graphEdges, GraphEdgeLessByElem1());
-    set_offsets();
+
+  for (auto& edge : graphEdges)
+  {
+    insert_edge(edge);
+  }
+}
+
+
+void Graph::insert_edge(const GraphEdge& graphEdge)
+{
+  auto elem1 = graphEdge.elem1();
+  auto& indices = m_elemOffsets[elem1];
+
+  if (check_for_edge(graphEdge))
+  {
+    return;
+  }
+
+  if (m_graphEdges.size() > 0 && double(m_numUnusedEntries) / m_graphEdges.size() > m_compressionThreshold)
+  {
+    compress_graph();
+  }
+
+  if (get_num_edges_for_element(elem1) == 0)
+  {
+      m_graphEdges.push_back(graphEdge);
+      indices.first  = m_graphEdges.size()-1;
+      indices.second = m_graphEdges.size();
+  } else if (indices.second >= m_graphEdges.size())
+  {
+    m_graphEdges.emplace_back();
+    insert_edge_into_sorted_range_or_next_entry(indices, graphEdge);
+  } else if (is_valid(m_graphEdges[indices.second]))
+  {
+    move_edges_to_end(elem1);
+
+    m_graphEdges.emplace_back();
+    insert_edge_into_sorted_range_or_next_entry(indices, graphEdge);
+  } else if (!is_valid(m_graphEdges[indices.second]))
+  {
+    insert_edge_into_sorted_range_or_next_entry(indices, graphEdge);
+    m_numUnusedEntries--;
+  } else
+  {
+    throw std::runtime_error("unreachable case");
   }
 }
 
+void Graph::insert_edge_into_sorted_range_or_next_entry(IndexRange& indices, const GraphEdge& graphEdge)
+{
+    unsigned idxToInsert = find_sorted_insertion_index(indices, graphEdge);
+
+    for (unsigned i=indices.second; i > idxToInsert; i--)
+    {
+      m_graphEdges[i] = m_graphEdges[i-1];
+    }
+
+    m_graphEdges[idxToInsert] = graphEdge;
+    indices.second++;
+}
+
+
+unsigned Graph::find_sorted_insertion_index(IndexRange indices, const GraphEdge& graphEdge)
+{
+    GraphEdgeLessByElem2Only isLess;
+    for (unsigned i=indices.first; i < indices.second; ++i)
+    {
+      if (isLess(graphEdge, m_graphEdges[i]))
+      {
+          return i;
+      }
+    }
+
+    return indices.second;
+}
+
 void Graph::replace_sorted_edges(std::vector<GraphEdge>& graphEdges)
 {
+  ThrowAssertMsg(stk::util::is_sorted_and_unique(graphEdges, GraphEdgeLessByElem1()),"Input vector 'graphEdges' is expected to be sorted-and-unique");
+
   m_graphEdges.swap(graphEdges);
   set_offsets();
+  m_numUnusedEntries = 0;
 }
 
+
 void Graph::delete_sorted_edges(const std::vector<GraphEdge>& edgesToDelete)
 {
-  for(const GraphEdge& edgeToDelete : edgesToDelete) {
-    impl::LocalId elem1 = edgeToDelete.elem1();
-    for(unsigned offset = m_elemOffsets[elem1]; offset < m_elemOffsets[elem1+1]; ++offset) {
-      GraphEdge& thisEdge = m_graphEdges[offset];
-      if (thisEdge == edgeToDelete) {
-        thisEdge.vertex1 = impl::INVALID_LOCAL_ID;
-      }
+  ThrowAssertMsg(std::is_sorted(edgesToDelete.begin(), edgesToDelete.end(), GraphEdgeLessByElem1()),
+                "Input vector is expected to be sorted");
+
+  int startIdx = 0;
+  while (size_t(startIdx) != edgesToDelete.size())
+  {
+    int endIdx = get_end_of_element_range_for_sorted_edges(edgesToDelete, startIdx);
+    for (int idx=endIdx; idx >= startIdx; idx--)
+    {
+      delete_edge(edgesToDelete[idx]);
     }
+
+    startIdx = endIdx + 1;
   }
+}
+
+unsigned Graph::get_end_of_element_range_for_sorted_edges(const std::vector<GraphEdge>& edges, unsigned startIdx)
+{
+    unsigned currElement = edges[startIdx].elem1();
+    unsigned endIdx = startIdx;
+    while (endIdx < edges.size() && edges[endIdx].elem1() == currElement)
+    {
+      endIdx++;
+    }
+    endIdx--;
 
-  if (!edgesToDelete.empty()) {
-    const unsigned offset = m_elemOffsets[edgesToDelete[0].elem1()];
-    m_graphEdges.erase(std::remove_if(m_graphEdges.begin()+offset, m_graphEdges.end(),
-                                      [](const GraphEdge& edge)
-                                      { return edge.vertex1 == impl::INVALID_LOCAL_ID; }),
-                       m_graphEdges.end());
-    set_offsets();
+    return endIdx;
+}
+
+void Graph::delete_edge(const GraphEdge& edgeToDelete)
+{
+  impl::LocalId elem1 = edgeToDelete.elem1();
+  auto& indices = m_elemOffsets[elem1];
+  for(unsigned offset = indices.first; offset < indices.second; ++offset) {
+    if (m_graphEdges[offset] == edgeToDelete) 
+    {
+      for (unsigned i=offset; i < indices.second-1; ++i)
+      {
+        m_graphEdges[i] = m_graphEdges[i+1];
+      }
+      indices.second--;
+      m_graphEdges[indices.second] = GraphEdge();
+      m_numUnusedEntries++;
+      break;
+    }
   }
 }
 
@@ -142,8 +248,93 @@ void Graph::clear()
 {
     m_graphEdges.clear();
     m_elemOffsets.clear();
+    m_numUnusedEntries = 0;
+}
+
+
+void Graph::move_edges_to_end(impl::LocalId elem)
+{
+  auto& indices = m_elemOffsets[elem];
+  size_t newStartIdx = m_graphEdges.size();
+  for (unsigned i=indices.first; i < indices.second; ++i)
+  {
+    m_graphEdges.push_back(m_graphEdges[i]);
+    m_graphEdges[i] = GraphEdge();
+    m_numUnusedEntries++;
+  }
+
+  m_elemOffsets[elem] = IndexRange(newStartIdx, m_graphEdges.size());
+}
+
+void Graph::compress_graph()
+{
+  if (m_graphEdges.size() == 0 || m_graphEdges.size() == m_numUnusedEntries)
+    return;
+
+  impl::LocalId prevElement = 0;
+  unsigned offset = 0;
+  for (unsigned i=0; i < m_graphEdges.size(); ++i)
+  {
+    if (is_valid(m_graphEdges[i]))
+    {
+      prevElement = m_graphEdges[i].elem1();
+      break;
+    } else
+    {
+      offset++;
+    }
+  }
+
+  {
+    auto& indices = m_elemOffsets[prevElement];
+    indices.first  -= offset;
+    indices.second -= offset;
+  }
+
+  for (unsigned idx=offset; idx < m_graphEdges.size(); ++idx)
+  {
+    if (is_valid(m_graphEdges[idx]))
+    {
+      m_graphEdges[idx - offset] = m_graphEdges[idx];
+      
+      impl::LocalId currElement = m_graphEdges[idx].elem1();
+      if (currElement != prevElement)
+      {
+        auto& indices = m_elemOffsets[currElement];
+        if (indices.first != indices.second)
+        {
+          indices.first  -= offset;
+          indices.second -= offset;
+        } 
+        prevElement = currElement;
+      }
+
+    } else
+    {
+      offset++;
+    }
+  }
+
+  ThrowRequireMsg(is_valid(m_graphEdges[m_graphEdges.size() - offset - 1]), "The count of unused edges is incorrect");
+  m_graphEdges.resize(m_graphEdges.size() - offset);
+  m_numUnusedEntries = 0;
 }
 
+
+bool Graph::check_for_edge(const GraphEdge& edge)
+{
+  auto& indices = m_elemOffsets[edge.elem1()];
+  for (unsigned i=indices.first; i < indices.second; ++i)
+    if (m_graphEdges[i] == edge)
+    {
+      return true;
+    }
+
+  return false;
+}
+
+
+
 impl::ParallelInfo& ParallelInfoForGraphEdges::get_parallel_info_for_graph_edge(const GraphEdge& graphEdge)
 {
     return const_cast<impl::ParallelInfo&>(get_parallel_info_iterator_for_graph_edge(graphEdge)->second);
diff --git a/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/GraphEdgeData.hpp b/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/GraphEdgeData.hpp
index c6640523b300..352dcab6e426 100644
--- a/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/GraphEdgeData.hpp
+++ b/packages/stk/stk_mesh/stk_mesh/baseImpl/elementGraph/GraphEdgeData.hpp
@@ -65,9 +65,31 @@ class Graph
     void clear();
 
 private:
+    using IndexRange = std::pair<unsigned, unsigned>;
+
     void set_offsets();
+
+    void insert_edge(const GraphEdge& graphEdge);
+
+    void insert_edge_into_sorted_range_or_next_entry(IndexRange& indices, const GraphEdge& graphEdge);
+
+    unsigned find_sorted_insertion_index(IndexRange indices, const GraphEdge& graphEdge);
+
+    void move_edges_to_end(impl::LocalId elem);
+
+    void compress_graph();
+
+
+    unsigned get_end_of_element_range_for_sorted_edges(const std::vector<GraphEdge>& edges, unsigned startIdx);
+
+    void delete_edge(const GraphEdge& edgeToDelete);
+
+    bool check_for_edge(const GraphEdge& edge);
+
     std::vector<GraphEdge> m_graphEdges;
-    std::vector<unsigned> m_elemOffsets;
+    std::vector<IndexRange> m_elemOffsets;
+    unsigned m_numUnusedEntries = 0;
+    const double m_compressionThreshold = 0.2;
 };
 
 class ParallelInfoForGraphEdges
diff --git a/packages/stk/stk_performance_tests/stk_mesh/NgpMeshUpdate.cpp b/packages/stk/stk_performance_tests/stk_mesh/NgpMeshUpdate.cpp
index 4597903835f0..716b0d2c5337 100644
--- a/packages/stk/stk_performance_tests/stk_mesh/NgpMeshUpdate.cpp
+++ b/packages/stk/stk_performance_tests/stk_mesh/NgpMeshUpdate.cpp
@@ -41,6 +41,7 @@
 #include <stk_util/environment/perf_util.hpp>
 #include <stk_util/parallel/ParallelReduce.hpp>
 #include <stk_unit_test_utils/MeshFixture.hpp>
+#include <stk_unit_test_utils/getOption.h>
 #include <stk_performance_tests/stk_mesh/timer.hpp>
 
 class NgpMeshChangeElementPartMembership : public stk::unit_test_util::simple_fields::MeshFixture
@@ -48,12 +49,17 @@ class NgpMeshChangeElementPartMembership : public stk::unit_test_util::simple_fi
 public:
   NgpMeshChangeElementPartMembership()
     : stk::unit_test_util::simple_fields::MeshFixture(),
-      newPartName("block2")
+      newPartName("block2"),
+      numElements(1000000)
   { }
 
-  void setup_host_mesh()
+  void setup_host_mesh(stk::mesh::BulkData::AutomaticAuraOption auraOption)
   {
-    setup_mesh("generated:100x100x100", stk::mesh::BulkData::NO_AUTO_AURA);
+#ifdef NDEBUG
+    setup_mesh("generated:400x250x10", auraOption);
+#else
+    setup_mesh("generated:10x10x100", auraOption);
+#endif
     get_meta().declare_part(newPartName);
   }
 
@@ -75,8 +81,10 @@ class NgpMeshChangeElementPartMembership : public stk::unit_test_util::simple_fi
 private:
   stk::mesh::Entity get_element(int cycle)
   {
-    stk::mesh::EntityId elemId = cycle+1;
-    return get_bulk().get_entity(stk::topology::ELEM_RANK, elemId);
+    stk::mesh::EntityId firstLocalElemId = get_parallel_rank()*numElements/2 + 1;
+    stk::mesh::EntityId elemId = firstLocalElemId + cycle;
+    stk::mesh::Entity elem = get_bulk().get_entity(stk::topology::ELEM_RANK, elemId);
+    return elem;
   }
 
   stk::mesh::Part* get_part()
@@ -85,6 +93,7 @@ class NgpMeshChangeElementPartMembership : public stk::unit_test_util::simple_fi
   }
 
   std::string newPartName;
+  unsigned numElements;
 };
 
 class NgpMeshCreateEntity : public stk::unit_test_util::simple_fields::MeshFixture
@@ -131,12 +140,12 @@ class NgpMeshGhosting : public stk::unit_test_util::simple_fields::MeshFixture
   { }
 
 protected:
-  void setup_host_mesh()
+  void setup_host_mesh(stk::mesh::BulkData::AutomaticAuraOption auraOption)
   {
 #ifdef NDEBUG
-    setup_mesh("generated:100x100x100", stk::mesh::BulkData::NO_AUTO_AURA);
+    setup_mesh("generated:400x250x10", auraOption);
 #else
-    setup_mesh("generated:10x10x100", stk::mesh::BulkData::NO_AUTO_AURA);
+    setup_mesh("generated:10x10x100", auraOption);
 #endif
     get_bulk().modification_begin();
     ghosting = &get_bulk().create_ghosting(ghostingName);
@@ -174,7 +183,26 @@ TEST_F( NgpMeshChangeElementPartMembership, Timing )
 
   stk::performance_tests::Timer timer(get_comm());
   timer.start_timing();
-  setup_host_mesh();
+  setup_host_mesh(stk::mesh::BulkData::NO_AUTO_AURA);
+
+  for (int i=0; i<NUM_RUNS; i++) {
+    change_element_part_membership(i);
+  }
+  timer.update_timing();
+  timer.print_timing(NUM_RUNS);
+}
+
+TEST_F( NgpMeshChangeElementPartMembership, TimingWithAura )
+{
+  if (get_parallel_size() != 2) { GTEST_SKIP(); }
+
+  const int NUM_RUNS = 200;
+
+  stk::parallel_machine_barrier(get_comm());
+
+  stk::performance_tests::Timer timer(get_comm());
+  timer.start_timing();
+  setup_host_mesh(stk::mesh::BulkData::AUTO_AURA);
 
   for (int i=0; i<NUM_RUNS; i++) {
     change_element_part_membership(i);
@@ -191,7 +219,7 @@ TEST_F( NgpMeshChangeElementPartMembership, TimingBatch )
 
   stk::performance_tests::Timer timer(get_comm());
   timer.start_timing();
-  setup_host_mesh();
+  setup_host_mesh(stk::mesh::BulkData::NO_AUTO_AURA);
 
   for (int i=0; i<NUM_RUNS; i++) {
     batch_change_element_part_membership(i);
@@ -218,6 +246,40 @@ TEST_F( NgpMeshCreateEntity, Timing )
 }
 
 TEST_F( NgpMeshGhosting, Timing )
+{
+  if (get_parallel_size() != 2) return;
+
+  std::string perfCheck = stk::unit_test_util::simple_fields::get_option("-perf_check", "PERF_CHECK");
+#ifdef NDEBUG
+  const int NUM_OUTER_RUNS = (perfCheck=="NO_PERF_CHECK" ? 1 : 5);
+  const int NUM_INNER_RUNS = (perfCheck=="NO_PERF_CHECK" ? 1 : 100);
+#else
+  const int NUM_OUTER_RUNS = 1;
+  const int NUM_INNER_RUNS = 1;
+#endif
+
+  stk::parallel_machine_barrier(get_comm());
+
+  stk::performance_tests::Timer timer(get_comm());
+  timer.start_timing();
+
+  for(int outer=0; outer<NUM_OUTER_RUNS; ++outer) {
+    setup_host_mesh(stk::mesh::BulkData::NO_AUTO_AURA);
+
+    for (int i=0; i<NUM_INNER_RUNS; i++) {
+      ghost_element(i);
+    }
+
+    const bool lastIteration = outer == (NUM_OUTER_RUNS-1);
+    if (!lastIteration) {
+      reset_mesh();
+    }
+  }
+
+  timer.update_timing();
+  timer.print_timing(NUM_OUTER_RUNS * NUM_INNER_RUNS);
+}
+TEST_F( NgpMeshGhosting, TimingWithAura )
 {
   if (get_parallel_size() != 2) return;
 
@@ -229,11 +291,13 @@ TEST_F( NgpMeshGhosting, Timing )
   const int NUM_INNER_RUNS = 1;
 #endif
 
+  stk::parallel_machine_barrier(get_comm());
+
   stk::performance_tests::Timer timer(get_comm());
   timer.start_timing();
 
   for(int outer=0; outer<NUM_OUTER_RUNS; ++outer) {
-    setup_host_mesh();
+    setup_host_mesh(stk::mesh::BulkData::AUTO_AURA);
 
     for (int i=0; i<NUM_INNER_RUNS; i++) {
       ghost_element(i);
diff --git a/packages/stk/stk_unit_test_utils/stk_unit_test_utils/BulkDataTester.hpp b/packages/stk/stk_unit_test_utils/stk_unit_test_utils/BulkDataTester.hpp
index c80e6133906a..f883ae0bb9c0 100644
--- a/packages/stk/stk_unit_test_utils/stk_unit_test_utils/BulkDataTester.hpp
+++ b/packages/stk/stk_unit_test_utils/stk_unit_test_utils/BulkDataTester.hpp
@@ -230,7 +230,7 @@ class BulkDataTester : public stk::mesh::BulkData
     void my_internal_resolve_ghosted_modify_delete()
     {
         stk::mesh::EntityVector entitiesNoLongerShared;
-        this->internal_resolve_ghosted_modify_delete(entitiesNoLongerShared);
+        this->m_meshModification.internal_resolve_ghosted_modify_delete(entitiesNoLongerShared);
     }
 
     void my_internal_resolve_parallel_create()
@@ -280,12 +280,6 @@ class BulkDataTester : public stk::mesh::BulkData
         set_state(entity,entity_state);
     }
 
-    void my_delete_shared_entities_which_are_no_longer_in_owned_closure()
-    {
-        stk::mesh::EntityProcVec entitiesToRemoveFromSharing;
-        delete_shared_entities_which_are_no_longer_in_owned_closure(entitiesToRemoveFromSharing);
-    }
-
     void my_ghost_entities_and_fields(stk::mesh::Ghosting & ghosting, const std::set<stk::mesh::EntityProc , stk::mesh::EntityLess>& new_send)
     {
         ghost_entities_and_fields(ghosting, new_send);
diff --git a/packages/stk/stk_unit_tests/stk_balance/UnitTestCommandLineParsing.cpp b/packages/stk/stk_unit_tests/stk_balance/UnitTestCommandLineParsing.cpp
index f732dfa5f5b0..e50b486f650d 100644
--- a/packages/stk/stk_unit_tests/stk_balance/UnitTestCommandLineParsing.cpp
+++ b/packages/stk/stk_unit_tests/stk_balance/UnitTestCommandLineParsing.cpp
@@ -138,14 +138,14 @@ TEST_F(BalanceCommandLine, createBalanceSettings_default)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -164,12 +164,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_outputDirectory)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -190,12 +190,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_outputDirectory_fullOptions)
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_TRUE(balanceSettings.includeSearchResultsInGraph());
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -210,12 +210,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_customLogfile)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -230,12 +230,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_shortCustomLogfile)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -250,12 +250,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_coutLogfile)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -266,12 +266,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_printDiagnostics)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            true);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -282,12 +282,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_shortPrintDiagnostics)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            true);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -304,12 +304,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_rebalanceTo)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -326,12 +326,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_useNestedDecomp)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             true);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -342,13 +342,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -360,14 +360,14 @@ TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -379,10 +379,12 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaultsOverrideSpider)
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
   EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -394,11 +396,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaultsOverrideMechanism)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
   EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -411,11 +415,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaultsOverrideSpiders)
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
   EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -426,12 +432,14 @@ TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaultsOverrideMechanisms)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
   EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -448,11 +456,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_defaultAbsoluteTolerance)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
   check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -464,11 +474,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_defaultRelativeTolerance)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -486,11 +498,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_faceSearchAbsoluteTolerance)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
   check_absolute_tolerance_for_face_search(balanceSettings,                      0.001);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -502,11 +516,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_faceSearchRelativeTolerance)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      0.123);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -519,11 +535,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_defaultAbsoluteToler
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -535,11 +553,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_defaultRelativeToler
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -551,11 +571,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_faceSearchAbsoluteTo
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_absolute_tolerance_for_face_search(balanceSettings,                      0.005);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -567,11 +589,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_faceSearchRelativeTo
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      0.123);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -584,11 +608,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults_defaultAbsoluteToler
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
   check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -600,11 +626,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults_defaultRelativeToler
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -616,11 +644,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults_faceSearchAbsoluteTo
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
   check_absolute_tolerance_for_face_search(balanceSettings,                      0.0005);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -632,11 +662,13 @@ TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults_faceSearchRelativeTo
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      0.123);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -644,7 +676,7 @@ TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults_faceSearchRelativeTo
 
 TEST_F(BalanceCommandLine, createBalanceSettings_contactSearchEdgeWeight)
 {
-  const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--EXP-contact-search-edge-weight=20"});
+  const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--contact-search-edge-weight=20"});
 
   const int finalNumProcs = stk::parallel_machine_size(MPI_COMM_WORLD);
 
@@ -655,30 +687,32 @@ TEST_F(BalanceCommandLine, createBalanceSettings_contactSearchEdgeWeight)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                20);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
 TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_contactSearchEdgeWeight)
 {
   const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--sm",
-                                                                                   "--EXP-contact-search-edge-weight=20"});
+                                                                                   "--contact-search-edge-weight=20"});
 
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                20);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -686,25 +720,26 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_contactSearchEdgeWei
 TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults_contactSearchEdgeWeight)
 {
   const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--sd",
-                                                                                   "--EXP-contact-search-edge-weight=20"});
+                                                                                   "--contact-search-edge-weight=20"});
 
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                20);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
 
 TEST_F(BalanceCommandLine, createBalanceSettings_contactSearchVertexWeightMultiplier)
 {
-  const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--EXP-contact-search-vertex-weight-mult=9"});
+  const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--contact-search-vertex-weight-mult=9"});
 
   const int finalNumProcs = stk::parallel_machine_size(MPI_COMM_WORLD);
 
@@ -715,30 +750,32 @@ TEST_F(BalanceCommandLine, createBalanceSettings_contactSearchVertexWeightMultip
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), 9);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
 TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_contactSearchVertexWeightMultiplier)
 {
   const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--sm",
-                                                                                   "--EXP-contact-search-vertex-weight-mult=9"});
+                                                                                   "--contact-search-vertex-weight-mult=9"});
 
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), 9);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -746,25 +783,26 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_contactSearchVertexW
 TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults_contactSearchVertexWeightMultiplier)
 {
   const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--sd",
-                                                                                   "--EXP-contact-search-vertex-weight-mult=9"});
+                                                                                   "--contact-search-vertex-weight-mult=9"});
 
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), 9);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
 
 TEST_F(BalanceCommandLine, createBalanceSettings_edgeWeightMultiplier)
 {
-  const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--EXP-edge-weight-mult=3"});
+  const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--edge-weight-mult=3"});
 
   const int finalNumProcs = stk::parallel_machine_size(MPI_COMM_WORLD);
 
@@ -775,29 +813,29 @@ TEST_F(BalanceCommandLine, createBalanceSettings_edgeWeightMultiplier)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               3);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
 TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_edgeWeightMultiplier)
 {
   const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--sm",
-                                                                                   "--EXP-edge-weight-mult=3"});
+                                                                                   "--edge-weight-mult=3"});
 
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               3);
@@ -808,19 +846,19 @@ TEST_F(BalanceCommandLine, createBalanceSettings_smDefaults_edgeWeightMultiplier
 TEST_F(BalanceCommandLine, createBalanceSettings_sdDefaults_edgeWeightMultiplier)
 {
   const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--sd",
-                                                                                   "--EXP-edge-weight-mult=3"});
+                                                                                   "--edge-weight-mult=3"});
 
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               3);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -853,12 +891,14 @@ TEST_F(BalanceCommandLine, disableSearch_default_caseInsensitive)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       false);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -869,11 +909,13 @@ TEST_F(BalanceCommandLine, disableSearch_smDefaults)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       false);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -885,12 +927,14 @@ TEST_F(BalanceCommandLine, disableSearch_sdDefaults)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       false);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -902,12 +946,14 @@ TEST_F(BalanceCommandLine, enableSearch_default_caseInsensitive)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -926,11 +972,13 @@ TEST_F(BalanceCommandLine, enableSearch_smDefaults)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
@@ -942,12 +990,14 @@ TEST_F(BalanceCommandLine, enableSearch_sdDefaults)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -994,29 +1044,32 @@ TEST_F(BalanceCommandLine, decompMethodParmetis)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
 TEST_F(BalanceCommandLine, vertexWeightMethodConnectivity)
 {
-  const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--EXP-vertex-weight-method=connectivity"});
+  const stk::balance::BalanceSettings& balanceSettings = get_stk_balance_settings({"--vertex-weight-method=connectivity"});
 
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
   EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             VertexWeightMethod::CONNECTIVITY);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               10.);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {});
 }
 
@@ -1028,12 +1081,14 @@ TEST_F(BalanceCommandLine, userSpecifiedBlockMultiplier_default)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {{"block_1", 2.0}});
 }
 
@@ -1045,11 +1100,13 @@ TEST_F(BalanceCommandLine, userSpecifiedBlockMultiplier_smDefaults)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::smFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::smVertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::smFaceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::smFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::smGraphEdgeWeightMultiplier);
   check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {{"block_2", 10.0}, {"block_5", 2.5}});
 }
@@ -1062,12 +1119,14 @@ TEST_F(BalanceCommandLine, userSpecifiedWeights_sdDefaults)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  true);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::sdFixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
-  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
-  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::sdVertexWeightMethod);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::sdFaceSearchEdgeWeight);
+  EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::sdFaceSearchVertexMultiplier);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::sdGraphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {{"block_1", 1.5}, {"block_2", 5.0}});
 }
 
@@ -1079,12 +1138,14 @@ TEST_F(BalanceCommandLine, userSpecifiedBlockMultiplier_badFormatting)
   EXPECT_EQ(balanceSettings.getDecompMethod(),                                   DefaultSettings::decompMethod);
   EXPECT_EQ(balanceSettings.get_use_nested_decomp(),                             false);
   EXPECT_EQ(balanceSettings.includeSearchResultsInGraph(),                       DefaultSettings::useContactSearch);
-  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  false);
-  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               true);
+  EXPECT_EQ(balanceSettings.shouldFixSpiders(),                                  DefaultSettings::fixSpiders);
+  EXPECT_EQ(balanceSettings.shouldFixMechanisms(),                               false);
   EXPECT_EQ(balanceSettings.shouldPrintDiagnostics(),                            false);
+  EXPECT_EQ(balanceSettings.getVertexWeightMethod(),                             (VertexWeightMethod)DefaultSettings::vertexWeightMethod);
   EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightForSearch(),                DefaultSettings::faceSearchEdgeWeight);
   EXPECT_DOUBLE_EQ(balanceSettings.getVertexWeightMultiplierForVertexInSearch(), DefaultSettings::faceSearchVertexMultiplier);
-  check_absolute_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchAbsTol);
+  EXPECT_DOUBLE_EQ(balanceSettings.getGraphEdgeWeightMultiplier(),               DefaultSettings::graphEdgeWeightMultiplier);
+  check_relative_tolerance_for_face_search(balanceSettings,                      DefaultSettings::faceSearchRelTol);
   check_vertex_weight_block_multiplier(balanceSettings, {{"block_1", 1.5}, {"block_2", 3.0}, {"block_3", 1.1}});
 }
 
diff --git a/packages/stk/stk_unit_tests/stk_balance/UnitTestDiagnosticsComputation.cpp b/packages/stk/stk_unit_tests/stk_balance/UnitTestDiagnosticsComputation.cpp
index fb7714ceba5c..c3a0d1e3dc75 100644
--- a/packages/stk/stk_unit_tests/stk_balance/UnitTestDiagnosticsComputation.cpp
+++ b/packages/stk/stk_unit_tests/stk_balance/UnitTestDiagnosticsComputation.cpp
@@ -276,9 +276,9 @@ TEST_F(TestDiagnosticsComputation, ElementCount_Balance_HexMesh_GraphPartitioner
 
   std::vector<unsigned> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {3}; }
-  else if (get_parallel_size() == 2) { expectedValues = {1, 2}; }
+  else if (get_parallel_size() == 2) { expectedValues = {2, 1}; }
   else if (get_parallel_size() == 3) { expectedValues = {1, 1, 1}; }
-  else if (get_parallel_size() == 4) { expectedValues = {0, 1, 1, 1}; }
+  else if (get_parallel_size() == 4) { expectedValues = {1, 1, 0, 1}; }
 
   test_diag_values<stk::balance::ElementCountDiagnostic, unsigned>(expectedValues);
 }
@@ -297,9 +297,9 @@ TEST_F(TestDiagnosticsComputation, ElementCount_Balance_HexPyramidTetMesh_Geomet
 
   std::vector<unsigned> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {6}; }
-  else if (get_parallel_size() == 2) { expectedValues = {1, 5}; }
-  else if (get_parallel_size() == 3) { expectedValues = {1, 2, 3}; }
-  else if (get_parallel_size() == 4) { expectedValues = {1, 0, 4, 1}; }
+  else if (get_parallel_size() == 2) { expectedValues = {3, 3}; }
+  else if (get_parallel_size() == 3) { expectedValues = {1, 3, 2}; }
+  else if (get_parallel_size() == 4) { expectedValues = {1, 2, 2, 1}; }
 
   test_diag_values<stk::balance::ElementCountDiagnostic, unsigned>(expectedValues);
 }
@@ -317,9 +317,9 @@ TEST_F(TestDiagnosticsComputation, ElementCount_Balance_HexPyramidTetMesh_GraphP
 
   std::vector<unsigned> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {6}; }
-  else if (get_parallel_size() == 2) { expectedValues = {1, 5}; }
+  else if (get_parallel_size() == 2) { expectedValues = {3, 3}; }
   else if (get_parallel_size() == 3) { expectedValues = {1, 1, 4}; }
-  else if (get_parallel_size() == 4) { expectedValues = {0, 1, 1, 4}; }
+  else if (get_parallel_size() == 4) { expectedValues = {1, 2, 1, 2}; }
 
   test_diag_values<stk::balance::ElementCountDiagnostic, unsigned>(expectedValues);
 }
@@ -364,9 +364,9 @@ TEST_P(RebalanceNumOutputProcs, ElementCount_Rebalance_HexMesh_GraphPartitioner)
 
   std::vector<unsigned> expectedValues;
   if      (GetParam() == 1) { expectedValues = {3}; }
-  else if (GetParam() == 2) { expectedValues = {1, 2}; }
+  else if (GetParam() == 2) { expectedValues = {2, 1}; }
   else if (GetParam() == 3) { expectedValues = {1, 1, 1}; }
-  else if (GetParam() == 4) { expectedValues = {0, 1, 1, 1}; }
+  else if (GetParam() == 4) { expectedValues = {1, 1, 0, 1}; }
 
   test_diag_values<stk::balance::ElementCountDiagnostic, unsigned>(expectedValues);
 }
@@ -386,9 +386,9 @@ TEST_P(RebalanceNumOutputProcs, ElementCount_Rebalance_HexPyramidTetMesh_Geometr
 
   std::vector<unsigned> expectedValues;
   if      (GetParam() == 1) { expectedValues = {6}; }
-  else if (GetParam() == 2) { expectedValues = {1, 5}; }
-  else if (GetParam() == 3) { expectedValues = {1, 2, 3}; }
-  else if (GetParam() == 4) { expectedValues = {1, 0, 4, 1}; }
+  else if (GetParam() == 2) { expectedValues = {3, 3}; }
+  else if (GetParam() == 3) { expectedValues = {1, 4, 1}; }
+  else if (GetParam() == 4) { expectedValues = {1, 2, 2, 1}; }
 
   test_diag_values<stk::balance::ElementCountDiagnostic, unsigned>(expectedValues);
 }
@@ -408,9 +408,9 @@ TEST_P(RebalanceNumOutputProcs, ElementCount_Rebalance_HexPyramidTetMesh_GraphPa
 
   std::vector<unsigned> expectedValues;
   if      (GetParam() == 1) { expectedValues = {6}; }
-  else if (GetParam() == 2) { expectedValues = {1, 5}; }
+  else if (GetParam() == 2) { expectedValues = {3, 3}; }
   else if (GetParam() == 3) { expectedValues = {1, 1, 4}; }
-  else if (GetParam() == 4) { expectedValues = {0, 1, 1, 4}; }
+  else if (GetParam() == 4) { expectedValues = {1, 2, 1, 2}; }
 
   test_diag_values<stk::balance::ElementCountDiagnostic, unsigned>(expectedValues);
 }
@@ -428,12 +428,11 @@ TEST_F(TestDiagnosticsComputation, TotalElementWeight_Balance_HexMesh_GeometricP
 
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
-  const unsigned hexWeight = balanceSettings.getGraphVertexWeight(stk::topology::HEX_8);
   std::vector<unsigned> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {0}; }
-  else if (get_parallel_size() == 2) { expectedValues = {2*hexWeight, 1*hexWeight}; }
-  else if (get_parallel_size() == 3) { expectedValues = {1*hexWeight, 1*hexWeight, 1*hexWeight}; }
-  else if (get_parallel_size() == 4) { expectedValues = {1*hexWeight, 1*hexWeight, 1*hexWeight, 0}; }
+  else if (get_parallel_size() == 2) { expectedValues = {2, 1}; }
+  else if (get_parallel_size() == 3) { expectedValues = {1, 1, 1}; }
+  else if (get_parallel_size() == 4) { expectedValues = {1, 1, 1, 0}; }
 
   test_diag_multi_values<stk::balance::TotalElementWeightDiagnostic, unsigned>(0, expectedValues);
 }
@@ -449,12 +448,11 @@ TEST_F(TestDiagnosticsComputation, TotalElementWeight_Balance_HexMesh_GraphParti
 
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
-  const unsigned hexWeight = balanceSettings.getGraphVertexWeight(stk::topology::HEX_8);
   std::vector<unsigned> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {0}; }
-  else if (get_parallel_size() == 2) { expectedValues = {1*hexWeight, 2*hexWeight}; }
-  else if (get_parallel_size() == 3) { expectedValues = {1*hexWeight, 1*hexWeight, 1*hexWeight}; }
-  else if (get_parallel_size() == 4) { expectedValues = {0*hexWeight, 1*hexWeight, 1*hexWeight, 1*hexWeight}; }
+  else if (get_parallel_size() == 2) { expectedValues = {2, 1}; }
+  else if (get_parallel_size() == 3) { expectedValues = {1, 1, 1}; }
+  else if (get_parallel_size() == 4) { expectedValues = {1, 1, 0, 1}; }
 
   test_diag_multi_values<stk::balance::TotalElementWeightDiagnostic, unsigned>(0, expectedValues);
 }
@@ -471,14 +469,11 @@ TEST_F(TestDiagnosticsComputation, TotalElementWeight_Balance_HexPyramidTetMesh_
 
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
-  const unsigned hexWeight = balanceSettings.getGraphVertexWeight(stk::topology::HEX_8);
-  const unsigned pyrWeight = balanceSettings.getGraphVertexWeight(stk::topology::PYRAMID_5);
-  const unsigned tetWeight = balanceSettings.getGraphVertexWeight(stk::topology::TET_4);
   std::vector<unsigned> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {0}; }
-  else if (get_parallel_size() == 2) { expectedValues = {1*hexWeight, 1*pyrWeight+4*tetWeight}; }
-  else if (get_parallel_size() == 3) { expectedValues = {1*hexWeight, 1*pyrWeight+1*tetWeight, 3*tetWeight}; }
-  else if (get_parallel_size() == 4) { expectedValues = {1*hexWeight, 0,                       1*pyrWeight+3*tetWeight, 1*tetWeight}; }
+  else if (get_parallel_size() == 2) { expectedValues = {3, 3}; }
+  else if (get_parallel_size() == 3) { expectedValues = {1, 3, 2}; }
+  else if (get_parallel_size() == 4) { expectedValues = {1, 2, 2, 1}; }
 
   test_diag_multi_values<stk::balance::TotalElementWeightDiagnostic, unsigned>(0, expectedValues);
 }
@@ -494,14 +489,11 @@ TEST_F(TestDiagnosticsComputation, TotalElementWeight_Balance_HexPyramidTetMesh_
 
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
-  const unsigned hexWeight = balanceSettings.getGraphVertexWeight(stk::topology::HEX_8);
-  const unsigned pyrWeight = balanceSettings.getGraphVertexWeight(stk::topology::PYRAMID_5);
-  const unsigned tetWeight = balanceSettings.getGraphVertexWeight(stk::topology::TET_4);
   std::vector<unsigned> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {0}; }
-  else if (get_parallel_size() == 2) { expectedValues = {1*hexWeight, 1*pyrWeight+4*tetWeight}; }
-  else if (get_parallel_size() == 3) { expectedValues = {1*hexWeight, 1*tetWeight, 1*pyrWeight+3*tetWeight}; }
-  else if (get_parallel_size() == 4) { expectedValues = {0,           1*hexWeight, 1*tetWeight, 1*pyrWeight+3*tetWeight}; }
+  else if (get_parallel_size() == 2) { expectedValues = {3, 3}; }
+  else if (get_parallel_size() == 3) { expectedValues = {1, 1, 4}; }
+  else if (get_parallel_size() == 4) { expectedValues = {1, 2, 1, 2}; }
 
   test_diag_multi_values<stk::balance::TotalElementWeightDiagnostic, unsigned>(0, expectedValues);
 }
@@ -520,12 +512,11 @@ TEST_P(RebalanceNumOutputProcs, TotalElementWeight_Rebalance_HexMesh_GeometricPa
 
   rebalanceMesh(ioBroker, balanceSettings);
 
-  const unsigned hexWeight = balanceSettings.getGraphVertexWeight(stk::topology::HEX_8);
   std::vector<unsigned> expectedValues;
   if      (GetParam() == 1) { expectedValues = {0}; }
-  else if (GetParam() == 2) { expectedValues = {2*hexWeight, 1*hexWeight}; }
-  else if (GetParam() == 3) { expectedValues = {1*hexWeight, 1*hexWeight, 1*hexWeight}; }
-  else if (GetParam() == 4) { expectedValues = {1*hexWeight, 1*hexWeight, 1*hexWeight, 0}; }
+  else if (GetParam() == 2) { expectedValues = {2, 1}; }
+  else if (GetParam() == 3) { expectedValues = {1, 1, 1}; }
+  else if (GetParam() == 4) { expectedValues = {1, 1, 1, 0}; }
 
   test_diag_multi_values<stk::balance::TotalElementWeightDiagnostic, unsigned>(0, expectedValues);
 }
@@ -543,12 +534,11 @@ TEST_P(RebalanceNumOutputProcs, TotalElementWeight_Rebalance_HexMesh_GraphPartit
 
   rebalanceMesh(ioBroker, balanceSettings);
 
-  const unsigned hexWeight = balanceSettings.getGraphVertexWeight(stk::topology::HEX_8);
   std::vector<unsigned> expectedValues;
   if      (GetParam() == 1) { expectedValues = {0}; }
-  else if (GetParam() == 2) { expectedValues = {1*hexWeight, 2*hexWeight}; }
-  else if (GetParam() == 3) { expectedValues = {1*hexWeight, 1*hexWeight, 1*hexWeight}; }
-  else if (GetParam() == 4) { expectedValues = {0*hexWeight, 1*hexWeight, 1*hexWeight, 1*hexWeight}; }
+  else if (GetParam() == 2) { expectedValues = {2, 1}; }
+  else if (GetParam() == 3) { expectedValues = {1, 1, 1}; }
+  else if (GetParam() == 4) { expectedValues = {1, 1, 0, 1}; }
 
   test_diag_multi_values<stk::balance::TotalElementWeightDiagnostic, unsigned>(0, expectedValues);
 }
@@ -566,14 +556,11 @@ TEST_P(RebalanceNumOutputProcs, TotalElementWeight_Rebalance_HexPyramidTetMesh_G
 
   rebalanceMesh(ioBroker, balanceSettings);
 
-  const unsigned hexWeight = balanceSettings.getGraphVertexWeight(stk::topology::HEX_8);
-  const unsigned pyrWeight = balanceSettings.getGraphVertexWeight(stk::topology::PYRAMID_5);
-  const unsigned tetWeight = balanceSettings.getGraphVertexWeight(stk::topology::TET_4);
   std::vector<unsigned> expectedValues;
   if      (GetParam() == 1) { expectedValues = {0}; }
-  else if (GetParam() == 2) { expectedValues = {1*hexWeight, 1*pyrWeight+4*tetWeight}; }
-  else if (GetParam() == 3) { expectedValues = {1*hexWeight, 1*pyrWeight+1*tetWeight, 3*tetWeight}; }
-  else if (GetParam() == 4) { expectedValues = {1*hexWeight, 0,                       1*pyrWeight+3*tetWeight, 1*tetWeight}; }
+  else if (GetParam() == 2) { expectedValues = {3, 3}; }
+  else if (GetParam() == 3) { expectedValues = {1, 4, 1}; }
+  else if (GetParam() == 4) { expectedValues = {1, 2, 2, 1}; }
 
   test_diag_multi_values<stk::balance::TotalElementWeightDiagnostic, unsigned>(0, expectedValues);
 }
@@ -591,14 +578,11 @@ TEST_P(RebalanceNumOutputProcs, TotalElementWeight_Rebalance_HexPyramidTetMesh_G
 
   rebalanceMesh(ioBroker, balanceSettings);
 
-  const unsigned hexWeight = balanceSettings.getGraphVertexWeight(stk::topology::HEX_8);
-  const unsigned pyrWeight = balanceSettings.getGraphVertexWeight(stk::topology::PYRAMID_5);
-  const unsigned tetWeight = balanceSettings.getGraphVertexWeight(stk::topology::TET_4);
   std::vector<unsigned> expectedValues;
   if      (GetParam() == 1) { expectedValues = {0}; }
-  else if (GetParam() == 2) { expectedValues = {1*hexWeight, 1*pyrWeight+4*tetWeight}; }
-  else if (GetParam() == 3) { expectedValues = {1*hexWeight, 1*tetWeight, 1*pyrWeight+3*tetWeight}; }
-  else if (GetParam() == 4) { expectedValues = {0,           1*hexWeight, 1*tetWeight, 1*pyrWeight+3*tetWeight}; }
+  else if (GetParam() == 2) { expectedValues = {3, 3}; }
+  else if (GetParam() == 3) { expectedValues = {1, 1, 4}; }
+  else if (GetParam() == 4) { expectedValues = {1, 2, 1, 2}; }
 
   test_diag_multi_values<stk::balance::TotalElementWeightDiagnostic, unsigned>(0, expectedValues);
 }
@@ -790,11 +774,13 @@ TEST_F(TestDiagnosticsComputation, NodeInterfaceSize_Balance_HexPyramidTetMesh_G
 
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
+  stk::io::write_mesh("nodeInterfaceSize_balance_hexPyramidTet_geometric.g", get_bulk());
+
   std::vector<double> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {0.0/12.0}; }
-  else if (get_parallel_size() == 2) { expectedValues = { 4.0/8.0, 4.0/8.0}; }
-  else if (get_parallel_size() == 3) { expectedValues = { 4.0/8.0, 6.0/6.0, 4.0/6.0}; }
-  else if (get_parallel_size() == 4) { expectedValues = { 4.0/8.0,     0.0, 6.0/8.0, 6.0/6.0}; }
+  else if (get_parallel_size() == 2) { expectedValues = { 4.0/10.0, 4.0/6.0}; }
+  else if (get_parallel_size() == 3) { expectedValues = { 4.0/8.0,  6.0/6.0, 4.0/5.0}; }
+  else if (get_parallel_size() == 4) { expectedValues = { 4.0/8.0,  6.0/6.0, 4.0/5.0, 4.0/4.0}; }
 
   test_diag_values<stk::balance::RelativeNodeInterfaceSizeDiagnostic, double>(expectedValues);
 }
@@ -810,11 +796,13 @@ TEST_F(TestDiagnosticsComputation, NodeInterfaceSize_Balance_HexPyramidTetMesh_G
 
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
+  stk::io::write_mesh("nodeInterfaceSize_balance_hexPyramidTet_graph.g", get_bulk());
+
   std::vector<double> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {0.0/12.0}; }
-  else if (get_parallel_size() == 2) { expectedValues = {4.0/8.0, 4.0/8.0}; }
-  else if (get_parallel_size() == 3) { expectedValues = {4.0/8.0, 4.0/4.0, 6.0/8.0}; }
-  else if (get_parallel_size() == 4) { expectedValues = {    0.0, 4.0/8.0, 4.0/4.0, 6.0/8.0}; }
+  else if (get_parallel_size() == 2) { expectedValues = {4.0/10.0, 4.0/6.0}; }
+  else if (get_parallel_size() == 3) { expectedValues = {4.0/8.0,  4.0/4.0, 6.0/8.0}; }
+  else if (get_parallel_size() == 4) { expectedValues = {4.0/8.0,  6.0/6.0, 4.0/4.0, 4.0/5.0}; }
 
   test_diag_values<stk::balance::RelativeNodeInterfaceSizeDiagnostic, double>(expectedValues);
 }
@@ -915,9 +903,9 @@ TEST_F(TestDiagnosticsComputation, ConnectivityWeight_Balance_HexMesh_GeometricP
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
   const double cornerNode = 8.0;
-  const double edgeNode = 12.0/2.0;
-  const double centerNode = 18.0/4.0;
-  const double elemWeight = 2*cornerNode + 4*edgeNode + 2*centerNode;
+  const double edgeNode = 12.0;
+  const double centerNode = 18.0;
+  const double elemWeight = (2*cornerNode + 4*edgeNode + 2*centerNode)/8;
   std::vector<double> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {4*elemWeight}; }
   else if (get_parallel_size() == 2) { expectedValues = {2*elemWeight, 2*elemWeight}; }
@@ -939,9 +927,9 @@ TEST_F(TestDiagnosticsComputation, ConnectivityWeight_Balance_HexMesh_GraphParti
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
   const double cornerNode = 8.0;
-  const double edgeNode = 12.0/2.0;
-  const double centerNode = 18.0/4.0;
-  const double elemWeight = 2*cornerNode + 4*edgeNode + 2*centerNode;
+  const double edgeNode = 12.0;
+  const double centerNode = 18.0;
+  const double elemWeight = (2*cornerNode + 4*edgeNode + 2*centerNode)/8;
   std::vector<double> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {4*elemWeight}; }
   else if (get_parallel_size() == 2) { expectedValues = {2*elemWeight, 2*elemWeight}; }
@@ -954,25 +942,28 @@ TEST_F(TestDiagnosticsComputation, ConnectivityWeight_Balance_HexMesh_GraphParti
 std::tuple<double, double, double, double, double, double>
 get_hex_pyramid_tet_element_connectivity_weights()
 {
-  const double node1Weight =  8.0/1.0;
-  const double node2Weight =  8.0/1.0;
-  const double node3Weight =  8.0/1.0;
-  const double node4Weight =  8.0/1.0;
-  const double node5Weight = 10.0/3.0;
-  const double node6Weight =  9.0/2.0;
-  const double node7Weight = 10.0/3.0;
-  const double node8Weight = 12.0/6.0;
-  const double node9Weight =  5.0/2.0;
-  const double node10Weight = 8.0/5.0;
-  const double node11Weight = 5.0/2.0;
-  const double node12Weight = 5.0/2.0;
-  const double elem1Weight = node1Weight + node2Weight + node3Weight + node4Weight +
-                             node5Weight + node6Weight + node7Weight + node8Weight;
-  const double elem2Weight = node5Weight + node6Weight + node7Weight + node8Weight + node10Weight;
-  const double elem3Weight = node5Weight + node9Weight + node8Weight + node10Weight;
-  const double elem4Weight = node8Weight + node9Weight + node12Weight + node10Weight;
-  const double elem5Weight = node8Weight + node12Weight + node10Weight + node11Weight;
-  const double elem6Weight = node7Weight + node8Weight + node10Weight + node11Weight;
+  const double node1Weight =  8.0;
+  const double node2Weight =  8.0;
+  const double node3Weight =  8.0;
+  const double node4Weight =  8.0;
+  const double node5Weight = 10.0;
+  const double node6Weight =  9.0;
+  const double node7Weight = 10.0;
+  const double node8Weight = 12.0;
+  const double node9Weight =  5.0;
+  const double node10Weight = 8.0;
+  const double node11Weight = 5.0;
+  const double node12Weight = 5.0;
+  const double hexElemsPerNode = 1;
+  const double pyrElemsPerNode = 6.0/2.0;
+  const double tetElemsPerNode = 6;
+  const double elem1Weight = (node1Weight + node2Weight + node3Weight + node4Weight +
+                              node5Weight + node6Weight + node7Weight + node8Weight)/8/hexElemsPerNode;
+  const double elem2Weight = (node5Weight + node6Weight + node7Weight + node8Weight + node10Weight)/5/pyrElemsPerNode;
+  const double elem3Weight = (node5Weight + node9Weight + node8Weight + node10Weight)/4/tetElemsPerNode;
+  const double elem4Weight = (node8Weight + node9Weight + node12Weight + node10Weight)/4/tetElemsPerNode;
+  const double elem5Weight = (node8Weight + node12Weight + node10Weight + node11Weight)/4/tetElemsPerNode;
+  const double elem6Weight = (node7Weight + node8Weight + node10Weight + node11Weight)/4/tetElemsPerNode;
 
   return std::make_tuple(elem1Weight, elem2Weight, elem3Weight, elem4Weight, elem5Weight, elem6Weight);
 }
@@ -994,9 +985,9 @@ TEST_F(TestDiagnosticsComputation, ConnectivityWeight_Balance_HexPyramidTetMesh_
 
   std::vector<double> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {e1wt+e2wt+e3wt+e4wt+e5wt+e6wt}; }
-  else if (get_parallel_size() == 2) { expectedValues = {e1wt, e2wt+e3wt+e4wt+e5wt+e6wt}; }
-  else if (get_parallel_size() == 3) { expectedValues = {e1wt, e2wt+e3wt, e4wt+e5wt+e6wt}; }
-  else if (get_parallel_size() == 4) { expectedValues = {e1wt, 0, e2wt+e3wt+e4wt+e5wt, e6wt}; }
+  else if (get_parallel_size() == 2) { expectedValues = {e1wt+e2wt+e3wt, e4wt+e5wt+e6wt}; }
+  else if (get_parallel_size() == 3) { expectedValues = {e1wt, e2wt+e3wt+e6wt, e4wt+e5wt}; }
+  else if (get_parallel_size() == 4) { expectedValues = {e1wt, e2wt+e3wt, e4wt+e5wt, e6wt}; }
 
   test_diag_values<stk::balance::ConnectivityWeightDiagnostic, double>(expectedValues);
 }
@@ -1017,9 +1008,9 @@ TEST_F(TestDiagnosticsComputation, ConnectivityWeight_Balance_HexPyramidTetMesh_
 
   std::vector<double> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {e1wt+e2wt+e3wt+e4wt+e5wt+e6wt}; }
-  else if (get_parallel_size() == 2) { expectedValues = {e1wt, e2wt+e3wt+e4wt+e5wt+e6wt}; }
+  else if (get_parallel_size() == 2) { expectedValues = {e1wt+e2wt+e3wt, e4wt+e5wt+e6wt}; }
   else if (get_parallel_size() == 3) { expectedValues = {e1wt, e6wt, e2wt+e3wt+e4wt+e5wt}; }
-  else if (get_parallel_size() == 4) { expectedValues = {0, e1wt, e6wt, e2wt+e3wt+e4wt+e5wt}; }
+  else if (get_parallel_size() == 4) { expectedValues = {e1wt, e2wt+e3wt, e6wt, e4wt+e5wt}; }
 
   test_diag_values<stk::balance::ConnectivityWeightDiagnostic, double>(expectedValues);
 }
@@ -1037,9 +1028,10 @@ TEST_F(TestDiagnosticsComputation, ConnectivityWeight_Balance_ShellMesh_Geometri
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
   const double cornerNode = 4.0;
-  const double edgeNode = 6.0/2.0;
-  const double centerNode = 9.0/4.0;
-  const double elemWeight = cornerNode + 2*edgeNode + centerNode;
+  const double edgeNode = 6.0;
+  const double centerNode = 9.0;
+  const double quadShellElemsPerNode = 1.0;
+  const double elemWeight = (cornerNode + 2*edgeNode + centerNode)/4/quadShellElemsPerNode;
   std::vector<double> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {4*elemWeight}; }
   else if (get_parallel_size() == 2) { expectedValues = {2*elemWeight, 2*elemWeight}; }
@@ -1061,9 +1053,10 @@ TEST_F(TestDiagnosticsComputation, ConnectivityWeight_Balance_ShellMesh_GraphPar
   stk::balance::balanceStkMesh(balanceSettings, get_bulk());
 
   const double cornerNode = 4.0;
-  const double edgeNode = 6.0/2.0;
-  const double centerNode = 9.0/4.0;
-  const double elemWeight = cornerNode + 2*edgeNode + centerNode;
+  const double edgeNode = 6.0;
+  const double centerNode = 9.0;
+  const double quadShellElemsPerNode = 1.0;
+  const double elemWeight = (cornerNode + 2*edgeNode + centerNode)/4/quadShellElemsPerNode;
   std::vector<double> expectedValues;
   if      (get_parallel_size() == 1) { expectedValues = {4*elemWeight}; }
   else if (get_parallel_size() == 2) { expectedValues = {2*elemWeight, 2*elemWeight}; }
@@ -1076,15 +1069,16 @@ TEST_F(TestDiagnosticsComputation, ConnectivityWeight_Balance_ShellMesh_GraphPar
 std::tuple<double, double, double, double>
 get_beam_element_connectivity_weights()
 {
-  const double node1Weight = 2.0/1.0;
-  const double node2Weight = 3.0/2.0;
-  const double node3Weight = 4.0/3.0;
-  const double node4Weight = 2.0/1.0;
-  const double node5Weight = 2.0/1.0;
-  const double elem1Weight = node1Weight + node2Weight;
-  const double elem2Weight = node2Weight + node3Weight;
-  const double elem3Weight = node3Weight + node4Weight;
-  const double elem4Weight = node3Weight + node5Weight;
+  const double node1Weight = 2.0;
+  const double node2Weight = 3.0;
+  const double node3Weight = 4.0;
+  const double node4Weight = 2.0;
+  const double node5Weight = 2.0;
+  const double beamElemsPerNode = 1.0;
+  const double elem1Weight = (node1Weight + node2Weight)/2/beamElemsPerNode;
+  const double elem2Weight = (node2Weight + node3Weight)/2/beamElemsPerNode;
+  const double elem3Weight = (node3Weight + node4Weight)/2/beamElemsPerNode;
+  const double elem4Weight = (node3Weight + node5Weight)/2/beamElemsPerNode;
 
   return std::make_tuple(elem1Weight, elem2Weight, elem3Weight, elem4Weight);
 }
diff --git a/packages/stk/stk_unit_tests/stk_balance/UnitTestGeometricMethodsWithSelector.cpp b/packages/stk/stk_unit_tests/stk_balance/UnitTestGeometricMethodsWithSelector.cpp
index 0d9a620c1d0b..0d73eecfa441 100644
--- a/packages/stk/stk_unit_tests/stk_balance/UnitTestGeometricMethodsWithSelector.cpp
+++ b/packages/stk/stk_unit_tests/stk_balance/UnitTestGeometricMethodsWithSelector.cpp
@@ -19,13 +19,13 @@ class GeometricBalanceSettingsTester : public stk::balance::GraphCreationSetting
 {
 public:
   GeometricBalanceSettingsTester(const std::string& decompMethod)
-    : method(decompMethod) { }
+    : m_method(decompMethod) { }
   virtual ~GeometricBalanceSettingsTester() = default;
 
-  virtual std::string getDecompMethod() const { return method; }
+  virtual std::string getDecompMethod() const { return m_method; }
 
 private:
-  const std::string& method;
+  const std::string& m_method;
 };
 
 class ZoltanGeometricMethods : public stk::unit_test_util::simple_fields::MeshFixture
diff --git a/packages/stk/stk_unit_tests/stk_balance/UnitTestM2NFileOutput.cpp b/packages/stk/stk_unit_tests/stk_balance/UnitTestM2NFileOutput.cpp
index 5b2c71b0b5c8..22853f16cf43 100644
--- a/packages/stk/stk_unit_tests/stk_balance/UnitTestM2NFileOutput.cpp
+++ b/packages/stk/stk_unit_tests/stk_balance/UnitTestM2NFileOutput.cpp
@@ -98,12 +98,13 @@ TEST_F(M2NFileOutput, CheckSharingInformation)
   int global_num_elems = counts[stk::topology::ELEM_RANK];
 
   const std::string outputFilename = "TemporaryOutputFile.g";
+  stk::io::OutputParams params(get_bulk());
   stk::io::write_file_for_subdomain(outputFilename,
                                     get_bulk().parallel_rank(),
                                     get_bulk().parallel_size(),
                                     global_num_nodes,
                                     global_num_elems,
-                                    get_bulk(),
+                                    params,
                                     nodeSharingInfo);
 
   verify_node_sharing_info(nodeSharingInfo, outputFilename);
diff --git a/packages/stk/stk_unit_tests/stk_balance/UnitTestRebalanceFileOutput.cpp b/packages/stk/stk_unit_tests/stk_balance/UnitTestRebalanceFileOutput.cpp
index 0ba8c811ca0b..765eeb41b022 100644
--- a/packages/stk/stk_unit_tests/stk_balance/UnitTestRebalanceFileOutput.cpp
+++ b/packages/stk/stk_unit_tests/stk_balance/UnitTestRebalanceFileOutput.cpp
@@ -101,12 +101,13 @@ TEST_F(RebalanceFileOutput, CheckSharingInformation)
   int global_num_elems = counts[stk::topology::ELEM_RANK];
 
   const std::string outputFilename = "TemporaryOutputFile.g";
+  stk::io::OutputParams params(get_bulk());
   stk::io::write_file_for_subdomain(outputFilename,
                                     get_bulk().parallel_rank(),
                                     get_bulk().parallel_size(),
                                     global_num_nodes,
                                     global_num_elems,
-                                    get_bulk(),
+                                    params,
                                     nodeSharingInfo);
 
   verify_node_sharing_info(nodeSharingInfo, outputFilename);
diff --git a/packages/stk/stk_unit_tests/stk_balance/UnitTestSearchTolerance.cpp b/packages/stk/stk_unit_tests/stk_balance/UnitTestSearchTolerance.cpp
index 5324580037e5..0f1a82662803 100644
--- a/packages/stk/stk_unit_tests/stk_balance/UnitTestSearchTolerance.cpp
+++ b/packages/stk/stk_unit_tests/stk_balance/UnitTestSearchTolerance.cpp
@@ -4,6 +4,7 @@
 
 #include <stk_balance/balance.hpp>
 #include <stk_balance/balanceUtils.hpp>
+#include <stk_balance/setup/DefaultSettings.hpp>
 #include <stk_balance/internal/privateDeclarations.hpp>
 #include <stk_balance/search_tolerance_algs/SecondShortestEdgeFaceSearchTolerance.hpp>
 
@@ -116,6 +117,7 @@ TEST_F(SearchToleranceTester, constantTolerance)
   if(stk::parallel_machine_size(get_comm()) == 1)
   {
     stk::balance::GraphCreationSettings balanceSettings;
+    balanceSettings.setToleranceForFaceSearch(stk::balance::DefaultSettings::faceSearchAbsTol);
     const unsigned numSelfInteractions = 2;
     EXPECT_EQ(numSelfInteractions, get_num_search_results_with_app_settings(balanceSettings));
   }
@@ -126,7 +128,6 @@ TEST_F(SearchToleranceTester, secondShortestEdgeFaceSearchTolerance)
   if(stk::parallel_machine_size(get_comm()) == 1)
   {
     stk::balance::GraphCreationSettings balanceSettings;
-    balanceSettings.setToleranceFunctionForFaceSearch(std::make_shared<stk::balance::SecondShortestEdgeFaceSearchTolerance>());
     const unsigned numSelfPlusSymmetricInteractions = 4;
     EXPECT_EQ(numSelfPlusSymmetricInteractions, get_num_search_results_with_app_settings(balanceSettings));
   }
diff --git a/packages/stk/stk_unit_tests/stk_coupling/UnitTestOldCommSplitting.cpp b/packages/stk/stk_unit_tests/stk_coupling/UnitTestOldCommSplitting.cpp
index 9aa2299bde61..5937a3e161c6 100644
--- a/packages/stk/stk_unit_tests/stk_coupling/UnitTestOldCommSplitting.cpp
+++ b/packages/stk/stk_unit_tests/stk_coupling/UnitTestOldCommSplitting.cpp
@@ -41,6 +41,7 @@
 #include <algorithm>
 #include <vector>
 
+#ifndef STK_HIDE_DEPRECATED_CODE  // delete October 2022
 namespace {
 
 TEST(UnitTestSplitComm, has_split_comm_false_when_same)
@@ -141,3 +142,5 @@ TEST(UnitTestSplitComm, calc_my_root_and_other_root_ranks_non_contig_comm)
 }
 
 }
+
+#endif
\ No newline at end of file
diff --git a/packages/stk/stk_unit_tests/stk_coupling/UnitTestOldSyncInfo.cpp b/packages/stk/stk_unit_tests/stk_coupling/UnitTestOldSyncInfo.cpp
index 0c42ff759053..61d6b55e8d45 100644
--- a/packages/stk/stk_unit_tests/stk_coupling/UnitTestOldSyncInfo.cpp
+++ b/packages/stk/stk_unit_tests/stk_coupling/UnitTestOldSyncInfo.cpp
@@ -39,6 +39,8 @@
 #include <stk_coupling/OldSyncInfo.hpp>
 #include <stdexcept>
 
+#ifndef STK_HIDE_DEPRECATED_CODE  // delete October 2022
+
 namespace {
 
 TEST(UnitTestOldSyncInfo, get_and_set)
@@ -180,3 +182,4 @@ TEST(UnitTestOldSyncInfo, exchangeAsymmetric)
 }
 
 }
+#endif
\ No newline at end of file
diff --git a/packages/stk/stk_unit_tests/stk_io/UnitTestReadWriteAssemblies.cpp b/packages/stk/stk_unit_tests/stk_io/UnitTestReadWriteAssemblies.cpp
index 9a381067fb74..b7fd9ef7fa3b 100644
--- a/packages/stk/stk_unit_tests/stk_io/UnitTestReadWriteAssemblies.cpp
+++ b/packages/stk/stk_unit_tests/stk_io/UnitTestReadWriteAssemblies.cpp
@@ -127,12 +127,12 @@ TEST_F(Assembly_legacy, readWriteAssembly_simple_emptyblock)
   const std::vector<std::string> partNames {"block_1", "block_2"};
 
   stk::mesh::Part& assemblyPart = create_assembly(assemblyName, 10);
-  stk::mesh::Part& block1Part = create_io_part(partNames[0]);
-  stk::mesh::Part& block2Part = create_io_part(partNames[1]);
+  stk::mesh::Part& block1Part = create_io_part(partNames[0], 1);
+  stk::mesh::Part& block2Part = create_io_part(partNames[1], 2);
   declare_subsets(assemblyPart, {&block1Part, &block2Part});
   stk::io::fill_mesh("generated:2x2x2", get_bulk());
 
-  test_write_then_read_block_assemblies(1);
+  test_write_then_read_block_assemblies(1, stk::mesh::PartVector{&block2Part});
 }
 
 TEST_F(Assembly_legacy, readWriteAssembly_simple_emptysurface)
@@ -638,12 +638,12 @@ TEST_F(Assembly, readWriteAssembly_simple_emptyblock)
   const std::vector<std::string> partNames {"block_1", "block_2"};
 
   stk::mesh::Part& assemblyPart = create_assembly(assemblyName, 10);
-  stk::mesh::Part& block1Part = create_io_part(partNames[0]);
-  stk::mesh::Part& block2Part = create_io_part(partNames[1]);
+  stk::mesh::Part& block1Part = create_io_part(partNames[0], 1);
+  stk::mesh::Part& block2Part = create_io_part(partNames[1], 2);
   declare_subsets(assemblyPart, {&block1Part, &block2Part});
   stk::io::fill_mesh("generated:2x2x2", get_bulk());
 
-  test_write_then_read_block_assemblies(1);
+  test_write_then_read_block_assemblies(1, stk::mesh::PartVector{&block2Part});
 }
 
 TEST_F(Assembly, readWriteAssembly_simple_emptysurface)
diff --git a/packages/stk/stk_unit_tests/stk_mesh/CMakeLists.txt b/packages/stk/stk_unit_tests/stk_mesh/CMakeLists.txt
index 0f54b1fb7b62..68a60f91d76e 100644
--- a/packages/stk/stk_unit_tests/stk_mesh/CMakeLists.txt
+++ b/packages/stk/stk_unit_tests/stk_mesh/CMakeLists.txt
@@ -68,6 +68,7 @@ LIST(REMOVE_ITEM SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/UnitTestCommInfoObserver.c
 LIST(REMOVE_ITEM SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/UnitTestCommunicateFieldData.cpp")
 LIST(REMOVE_ITEM SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/UnitTestCreateEdges.cpp")
 LIST(REMOVE_ITEM SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/UnitTestCreateFaces.cpp")
+LIST(REMOVE_ITEM SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/UnitTestDeletedEntityCache.cpp")
 LIST(REMOVE_ITEM SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/UnitTestDeleteEntities.cpp")
 LIST(REMOVE_ITEM SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/UnitTestDestroyElements.cpp")
 LIST(REMOVE_ITEM SOURCES "${CMAKE_CURRENT_SOURCE_DIR}/UnitTestDistributedIndexWithBulkData.cpp")
diff --git a/packages/stk/stk_unit_tests/stk_mesh/UnitTestBucketRepository.cpp b/packages/stk/stk_unit_tests/stk_mesh/UnitTestBucketRepository.cpp
index 09448493d3f0..27369071e656 100644
--- a/packages/stk/stk_unit_tests/stk_mesh/UnitTestBucketRepository.cpp
+++ b/packages/stk/stk_unit_tests/stk_mesh/UnitTestBucketRepository.cpp
@@ -35,7 +35,7 @@
 #include <gtest/gtest.h>                // for AssertHelper, EXPECT_EQ, etc
 #include <stddef.h>                     // for size_t
 #include <stk_mesh/baseImpl/BucketRepository.hpp>  // for BucketRepository
-#include <stk_mesh/baseImpl/EntityRepository.hpp>  // for EntityRepository
+#include <stk_mesh/baseImpl/EntityKeyMapping.hpp>
 #include <stk_mesh/baseImpl/Partition.hpp>  // for Partition
 #include <stk_util/parallel/Parallel.hpp>  // for ParallelMachine
 #include <stk_unit_test_utils/BulkDataTester.hpp>
@@ -64,7 +64,7 @@ TEST(BucketRepositoryTest, createBuckets)
   stkMeshMetaData.commit();
 
   stk::unit_test_util::BulkDataTester stkMeshBulkData(stkMeshMetaData, comm);
-  stk::mesh::impl::EntityRepository entityRepository;
+  stk::mesh::impl::EntityKeyMapping entityKeyMapping;
 
   stk::mesh::impl::BucketRepository &bucketRepository = stkMeshBulkData.my_get_bucket_repository();
   stk::mesh::impl::Partition* partition = bucketRepository.get_or_create_partition(stk::topology::NODE_RANK, parts);
@@ -74,7 +74,7 @@ TEST(BucketRepositoryTest, createBuckets)
   {
     stk::mesh::EntityId nodeID = i+1;
     stk::mesh::EntityKey nodeKey(stk::topology::NODE_RANK, nodeID);
-    std::pair<stk::mesh::entity_iterator,bool> createResult = entityRepository.internal_create_entity(nodeKey);
+    std::pair<stk::mesh::entity_iterator,bool> createResult = entityKeyMapping.internal_create_entity(nodeKey);
     bool aNewEntityWasCreated = createResult.second;
     EXPECT_TRUE(aNewEntityWasCreated);
     stk::mesh::Entity node = stkMeshBulkData.my_generate_new_entity();
@@ -94,7 +94,7 @@ TEST(BucketRepositoryTest, createBuckets)
 
   stk::mesh::EntityId nodeID = numNodes+1;
   stk::mesh::EntityKey nodeKey(stk::topology::NODE_RANK, nodeID);
-  std::pair<stk::mesh::entity_iterator,bool> createResult = entityRepository.internal_create_entity(nodeKey);
+  std::pair<stk::mesh::entity_iterator,bool> createResult = entityKeyMapping.internal_create_entity(nodeKey);
   bool aNewEntityWasCreated = createResult.second;
   EXPECT_TRUE(aNewEntityWasCreated);
   stk::mesh::Entity node = stkMeshBulkData.my_generate_new_entity();
diff --git a/packages/stk/stk_unit_tests/stk_mesh/UnitTestBulkData.cpp b/packages/stk/stk_unit_tests/stk_mesh/UnitTestBulkData.cpp
index ca388144ff60..66dac7553940 100644
--- a/packages/stk/stk_unit_tests/stk_mesh/UnitTestBulkData.cpp
+++ b/packages/stk/stk_unit_tests/stk_mesh/UnitTestBulkData.cpp
@@ -3119,11 +3119,11 @@ TEST(BulkData, ModificationEnd)
       exodusFileReader.populate_bulk_data();
     }
 
-    int elementToMove = 3;
-    int nodeToCheck = 9;
+    stk::mesh::EntityId elementToDestroy = 3;
+    stk::mesh::EntityId nodeToCheck = 9;
 
     stk::mesh::EntityKey nodeEntityKey(stk::topology::NODE_RANK, nodeToCheck);
-    stk::mesh::EntityKey entityToMoveKey(stk::topology::ELEMENT_RANK, elementToMove);
+    stk::mesh::EntityKey entityToDestroyKey(stk::topology::ELEMENT_RANK, elementToDestroy);
 
     stk::mesh::EntityCommListInfoVector::const_iterator iter = std::lower_bound(stkMeshBulkData->my_internal_comm_list().begin(),
                                                                                 stkMeshBulkData->my_internal_comm_list().end(),
@@ -3135,28 +3135,22 @@ TEST(BulkData, ModificationEnd)
 
     stkMeshBulkData->modification_begin();
 
-    ASSERT_TRUE( stkMeshBulkData->is_valid(stkMeshBulkData->get_entity(entityToMoveKey)));
+    ASSERT_TRUE( stkMeshBulkData->is_valid(stkMeshBulkData->get_entity(entityToDestroyKey)));
 
     if(stkMeshBulkData->parallel_rank() == 1)
     {
-      stkMeshBulkData->destroy_entity(stkMeshBulkData->get_entity(entityToMoveKey));
+      stkMeshBulkData->destroy_entity(stkMeshBulkData->get_entity(entityToDestroyKey));
     }
 
-    // Really testing destroy_entity
-    stkMeshBulkData->my_delete_shared_entities_which_are_no_longer_in_owned_closure();
+    stkMeshBulkData->modification_end();
 
-    iter = std::lower_bound(stkMeshBulkData->my_internal_comm_list().begin(), stkMeshBulkData->my_internal_comm_list().end(), nodeEntityKey);
-
-    ASSERT_TRUE(iter != stkMeshBulkData->my_internal_comm_list().end());
-    EXPECT_EQ(nodeEntityKey, iter->key);
-
-    if(stkMeshBulkData->parallel_rank() == 0)
-    {
-      EXPECT_TRUE(stkMeshBulkData->is_valid(iter->entity));
+    stk::mesh::Entity nodeEntity = stkMeshBulkData->get_entity(nodeEntityKey);
+    if (stkMeshBulkData->parallel_rank() == 0) {
+      EXPECT_TRUE(stkMeshBulkData->is_valid(nodeEntity));
+      EXPECT_FALSE(stkMeshBulkData->in_shared(nodeEntity));
     }
-    else
-    {
-      EXPECT_FALSE(stkMeshBulkData->is_valid(iter->entity));
+    else {
+      EXPECT_FALSE(stkMeshBulkData->is_valid(nodeEntity));
     }
 
     std::vector<size_t> globalCounts;
diff --git a/packages/stk/stk_unit_tests/stk_mesh/UnitTestDeleteEntities.cpp b/packages/stk/stk_unit_tests/stk_mesh/UnitTestDeleteEntities.cpp
index b8ffda2b67c1..4bc7b59a5d99 100644
--- a/packages/stk/stk_unit_tests/stk_mesh/UnitTestDeleteEntities.cpp
+++ b/packages/stk/stk_unit_tests/stk_mesh/UnitTestDeleteEntities.cpp
@@ -5,6 +5,8 @@
 #include <stk_mesh/base/SkinBoundary.hpp>
 #include "stk_mesh/base/FEMHelpers.hpp"
 #include "stk_mesh/base/GetEntities.hpp"
+#include "stk_mesh/base/Types.hpp"
+#include "stk_unit_test_utils/BulkDataTester.hpp"
 
 namespace
 {
@@ -240,5 +242,4 @@ TEST_F(SingleHexMesh, DISABLED_CreateFacesThenCreateAnotherElement_ConnectivityI
     expect_one_face_connected_to_two_elements();
   }
 }
-
 }
diff --git a/packages/stk/stk_unit_tests/stk_mesh/UnitTestDeletedEntityCache.cpp b/packages/stk/stk_unit_tests/stk_mesh/UnitTestDeletedEntityCache.cpp
new file mode 100644
index 000000000000..959275ccb0fc
--- /dev/null
+++ b/packages/stk/stk_unit_tests/stk_mesh/UnitTestDeletedEntityCache.cpp
@@ -0,0 +1,150 @@
+#include "gtest/gtest.h"
+#include "stk_mesh/baseImpl/DeletedEntityCache.hpp"
+#include "stk_unit_test_utils/MeshFixture.hpp"
+#include "stk_unit_test_utils/TextMesh.hpp"
+
+namespace {
+
+class DeletedEntityCacheTester : public stk::unit_test_util::MeshFixture
+{
+  protected:
+    DeletedEntityCacheTester() :
+      MeshFixture(3),
+      cache()
+    {
+      std::string meshDesc =
+        "0,1,HEX_8,1,2,3,4,5,6,7,8\n\
+         0,2,HEX_8,2,9,10,3,6,11,12,7";
+      setup_empty_mesh(stk::mesh::BulkData::NO_AUTO_AURA);
+      stk::unit_test_util::simple_fields::setup_text_mesh(get_bulk(), meshDesc);
+
+      stk::mesh::BucketVector const& buckets = bulkData->get_buckets(stk::topology::NODE_RANK, metaData->universal_part());
+      for (auto& bucket : buckets) 
+      {
+        for (const stk::mesh::Entity& entity : *bucket) 
+        {
+          nodes.push_back(entity);
+          max_local_offset = std::max(entity.local_offset(), max_local_offset);
+        }
+      }
+
+      cache = std::make_shared<stk::mesh::impl::DeletedEntityCache>(*bulkData);
+    }
+
+    std::vector<stk::mesh::Entity::entity_value_type> get_ghost_entity_counts()
+    {
+      auto& ghostReuseMap = cache->get_ghost_reuse_map();
+      std::vector<stk::mesh::Entity::entity_value_type> usedValuesCount(max_local_offset+1, 0);
+      for (auto& keyOffsetPair : ghostReuseMap)
+      {
+        usedValuesCount[keyOffsetPair.second] += 1;
+      }
+
+      return usedValuesCount;
+    }
+
+  std::shared_ptr<stk::mesh::impl::DeletedEntityCache> cache;
+  std::vector<stk::mesh::Entity> nodes;
+  stk::mesh::Entity::entity_value_type max_local_offset = 0;
+
+};
+
+}
+
+TEST_F(DeletedEntityCacheTester, mark_entity_as_deleted_nonghost)
+{
+  if (get_parallel_size() != 1) 
+  {
+    GTEST_SKIP();
+  }
+
+  for (int i=0; i < 3; ++i)
+  {
+    cache->mark_entity_as_deleted(nodes[i], false);
+  }
+
+  auto& ghost_reuse_map = cache->get_ghost_reuse_map();
+  EXPECT_EQ(ghost_reuse_map.size(), 0u);
+
+  auto& deleted_entities = cache->get_deleted_entities_current_mod_cycle();
+  EXPECT_EQ(deleted_entities.size(), 3u);
+  for (int i=0; i < 3; ++i)
+  {
+    EXPECT_EQ(deleted_entities[i], nodes[i].local_offset());
+  }
+}
+
+TEST_F(DeletedEntityCacheTester, mark_entity_as_deleted_ghost)
+{
+  if (get_parallel_size() != 1) 
+  {
+    GTEST_SKIP();
+  }
+
+  for (int i=0; i < 3; ++i)
+  {
+    cache->mark_entity_as_deleted(nodes[i], true);
+  }
+
+  EXPECT_EQ(cache->get_deleted_entities_current_mod_cycle().size(), 0u);
+  EXPECT_EQ(cache->get_ghost_reuse_map().size(), 3u);
+
+  auto usedGhosts = get_ghost_entity_counts();
+  for (size_t i=0; i < nodes.size(); ++i)
+  {
+    size_t expected_val = i < 3 ? 1 : 0;
+    EXPECT_EQ(usedGhosts[nodes[i].local_offset()], expected_val);
+  }
+}
+
+TEST_F(DeletedEntityCacheTester, get_entity_for_reuse_initial)
+{
+  if (get_parallel_size() != 1) 
+  {
+    GTEST_SKIP();
+  }
+
+  EXPECT_EQ(cache->get_entity_for_reuse(), stk::mesh::Entity::InvalidEntity);
+}
+
+TEST_F(DeletedEntityCacheTester, update_deleted_entities_container)
+{
+  if (get_parallel_size() != 1) 
+  {
+    GTEST_SKIP();
+  }
+  
+  std::vector<stk::mesh::Entity::entity_value_type> destroyedEntities;
+  for (int i=0; i < 5; ++i)
+  {
+    bool isGhost = i < 3;
+    cache->mark_entity_as_deleted(nodes[i], isGhost);
+    destroyedEntities.push_back(nodes[i].local_offset());
+  }
+  std::sort(destroyedEntities.begin(), destroyedEntities.end());
+
+  EXPECT_EQ(cache->get_entity_for_reuse(), stk::mesh::Entity::InvalidEntity);
+  cache->update_deleted_entities_container();
+
+  std::vector<stk::mesh::Entity::entity_value_type> reusedEntities;
+  for (int i=0; i < 5; ++i)
+  {
+    reusedEntities.push_back(cache->get_entity_for_reuse());
+  }
+  std::sort(reusedEntities.begin(), reusedEntities.end());
+
+  for (int i=0; i < 5; ++i)
+  {
+    EXPECT_EQ(destroyedEntities[i], reusedEntities[i]);
+  }
+
+  for (int i=0; i < 10; ++i)
+  {
+    EXPECT_EQ(cache->get_entity_for_reuse(), stk::mesh::Entity::InvalidEntity);
+  }
+}
+
+
+
+
+
diff --git a/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntity.cpp b/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntity.cpp
index 76b678f2083e..9981194fe82d 100644
--- a/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntity.cpp
+++ b/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntity.cpp
@@ -45,7 +45,6 @@ namespace stk { namespace mesh { class Bucket; } }
 namespace stk { namespace mesh { class BulkData; } }
 namespace stk { namespace mesh { class MetaData; } }
 namespace stk { namespace mesh { class Part; } }
-namespace stk { namespace mesh { namespace impl { class EntityRepository; } } }
 namespace stk { namespace mesh { namespace impl { class PartRepository; } } }
 namespace stk { namespace mesh { struct Entity; } }
 
@@ -58,7 +57,6 @@ using stk::mesh::EntityKey;
 using stk::mesh::Entity;
 using stk::mesh::Bucket;
 using stk::mesh::impl::PartRepository;
-using stk::mesh::impl::EntityRepository;
 
 namespace {
 
diff --git a/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntityCommDatabase.cpp b/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntityCommDatabase.cpp
index 171def564192..3fded4a5c568 100644
--- a/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntityCommDatabase.cpp
+++ b/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntityCommDatabase.cpp
@@ -46,15 +46,22 @@ TEST(EntityCommDatabase, testCommMapChangeListener)
   stk::mesh::EntityCommDatabase commDB;
   stk::mesh::EntityCommListInfoVector comm_list;
   std::vector<stk::mesh::EntityComm*> entityComms(200);
-  stk::mesh::CommListUpdater comm_list_updater(comm_list, entityComms);
+  std::vector<std::pair<stk::mesh::EntityKey,stk::mesh::EntityCommInfo>> removedGhosts;
+  stk::mesh::CommListUpdater comm_list_updater(comm_list, entityComms, removedGhosts);
   commDB.setCommMapChangeListener(&comm_list_updater);
 
   int owner = 0;
   stk::mesh::EntityKey key(stk::topology::NODE_RANK, 99);
   unsigned ghost_id = 3;
-  int proc = 4;
-  stk::mesh::EntityCommInfo value(ghost_id, proc);
-  commDB.insert(key, value, owner);
+  commDB.insert(key, stk::mesh::EntityCommInfo(ghost_id, 2), owner);
+  commDB.insert(key, stk::mesh::EntityCommInfo(ghost_id, 3), owner);
+  commDB.insert(key, stk::mesh::EntityCommInfo(ghost_id, 4), owner);
+
+  EXPECT_FALSE(commDB.erase(key, stk::mesh::EntityCommInfo(ghost_id, 1)));
+  EXPECT_TRUE(commDB.erase(key, stk::mesh::EntityCommInfo(ghost_id, 3)));
+  EXPECT_EQ(1u, removedGhosts.size());
+  EXPECT_TRUE(commDB.erase(key, stk::mesh::EntityCommInfo(ghost_id, 2)));
+  EXPECT_EQ(2u, removedGhosts.size());
 
   //CommListUpdater only manages removing entries from comm-list,
   //so we must add an entry manually to set up the test.
diff --git a/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntityProcMapping.cpp b/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntityProcMapping.cpp
index a9c0f1c718d2..f3945d51e131 100644
--- a/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntityProcMapping.cpp
+++ b/packages/stk/stk_unit_tests/stk_mesh/UnitTestEntityProcMapping.cpp
@@ -70,14 +70,14 @@ TEST(EntityAndProcs, find_proc_multiple)
 
 TEST(EntityProcMapping, basic)
 {
-  if (stk::parallel_machine_size(MPI_COMM_WORLD) > 4) {
+  if (stk::parallel_machine_size(MPI_COMM_WORLD) > 3) {
     return;
   }
 
   const unsigned spatialDim = 3;
   std::shared_ptr<stk::mesh::BulkData> bulkPtr = build_mesh(spatialDim, MPI_COMM_WORLD);
   stk::mesh::BulkData& bulk = *bulkPtr;
-  stk::io::fill_mesh("generated:4x4x4",bulk);
+  stk::io::fill_mesh("generated:1x2x3",bulk);
 
   if (stk::parallel_machine_rank(MPI_COMM_WORLD) != 0) {
     return;
@@ -127,11 +127,8 @@ TEST(EntityProcMapping, basic)
   EXPECT_EQ(3u, entityProcVec.size());
 }
 
-TEST(EntityProcMapping, add_two_remove_one_then_other_still_found)
+void test_add_two_remove_one_then_other_still_found(stk::mesh::EntityProcMapping& mapping, stk::mesh::Entity entity)
 {
-  stk::mesh::Entity entity(1);
-  const unsigned arbitraryMaxNumEntities = 10;
-  stk::mesh::EntityProcMapping mapping(arbitraryMaxNumEntities);
   mapping.addEntityProc(entity, 0);
   mapping.addEntityProc(entity, 2);
   EXPECT_TRUE(mapping.find(entity,0));
@@ -139,6 +136,31 @@ TEST(EntityProcMapping, add_two_remove_one_then_other_still_found)
 
   mapping.eraseEntityProc(entity,2);
   EXPECT_TRUE(mapping.find(entity,0));
+  EXPECT_FALSE(mapping.find(entity,2));
+}
+
+TEST(EntityProcMapping, add_two_remove_one_then_other_still_found)
+{
+  stk::mesh::Entity entity(1);
+  const unsigned arbitraryMaxNumEntities = 10;
+  stk::mesh::EntityProcMapping mapping(arbitraryMaxNumEntities);
+  test_add_two_remove_one_then_other_still_found(mapping, entity);
+}
+
+TEST(EntityProcMapping, add_two_remove_one_then_other_still_found_with_reset)
+{
+  stk::mesh::Entity entity(1);
+  const unsigned arbitraryMaxNumEntities = 10;
+  stk::mesh::EntityProcMapping mapping(arbitraryMaxNumEntities);
+  test_add_two_remove_one_then_other_still_found(mapping, entity);
+
+  const unsigned largerMaxNumEntities = 128;
+  mapping.reset(largerMaxNumEntities);
+  EXPECT_FALSE(mapping.find(entity,0));
+  EXPECT_FALSE(mapping.find(entity,2));
+  EXPECT_FALSE(mapping.find(entity));
+
+  test_add_two_remove_one_then_other_still_found(mapping, entity);
 }
 
 TEST(EntityProcMapping, erase_nonexisting_then_previous_proc_still_found)
@@ -153,3 +175,18 @@ TEST(EntityProcMapping, erase_nonexisting_then_previous_proc_still_found)
   EXPECT_TRUE(mapping.find(entity,0));
 }
 
+TEST(EntityProcMapping, visitEntityProcs)
+{
+  stk::mesh::Entity entity1(1), entity2(2);
+  const unsigned arbitraryMaxNumEntities = 10;
+  stk::mesh::EntityProcMapping mapping(arbitraryMaxNumEntities);
+  mapping.addEntityProc(entity1, 2);
+  mapping.addEntityProc(entity2, 1);
+  mapping.addEntityProc(entity2, 3);
+
+  std::vector<stk::mesh::EntityProc> gold = {stk::mesh::EntityProc(entity1,2),stk::mesh::EntityProc(entity2,1),stk::mesh::EntityProc(entity2,3)};
+  std::vector<stk::mesh::EntityProc> entityProcs;
+  mapping.visit_entity_procs([&](stk::mesh::Entity entity, int proc){entityProcs.push_back(stk::mesh::EntityProc(entity,proc));});
+  EXPECT_EQ(gold, entityProcs);
+}
+
diff --git a/packages/stk/stk_unit_tests/stk_mesh/UnitTestMetaData.cpp b/packages/stk/stk_unit_tests/stk_mesh/UnitTestMetaData.cpp
index 08e5604aed9d..1bce4f059ad1 100644
--- a/packages/stk/stk_unit_tests/stk_mesh/UnitTestMetaData.cpp
+++ b/packages/stk/stk_unit_tests/stk_mesh/UnitTestMetaData.cpp
@@ -63,8 +63,6 @@ using stk::mesh::Part;
 using stk::mesh::PartVector;
 using stk::mesh::EntityRank;
 using stk::mesh::MeshBuilder;
-using std::cout;
-using std::endl;
 
 namespace {
 
@@ -164,11 +162,10 @@ TEST( UnitTestMetaData, rankHigherThanDefined )
                         );
 }
 
-TEST( UnitTestMetaData, testEntityRepository )
+TEST( UnitTestMetaData, testEntityKeyMapping )
 {
   static const size_t spatial_dimension = 3;
 
-  //Test Entity repository - covering EntityRepository.cpp/hpp
   stk::mesh::MetaData meta ( spatial_dimension );
   meta.use_simple_fields();
   stk::mesh::Part & part = meta.declare_part("another part");
diff --git a/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestCommSparse.cpp b/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestCommSparse.cpp
index 99bb6ad5c834..2a6d49a87d8f 100644
--- a/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestCommSparse.cpp
+++ b/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestCommSparse.cpp
@@ -33,17 +33,18 @@
 // 
 
 #include "gtest/gtest.h"
+#include "stk_util/stk_config.h"               // for STK_HAS_MPI
+#if defined ( STK_HAS_MPI )
+
 #include "stk_util/parallel/CommSparse.hpp"    // for CommSparse, comm_recv_msg_sizes, comm_recv...
 #include "stk_util/parallel/Parallel.hpp"      // for parallel_machine_rank, parallel_machine_size
 #include "stk_util/parallel/ParallelComm.hpp"  // for CommBuffer
-#include "stk_util/stk_config.h"               // for STK_HAS_MPI
 #include "stk_util/util/ReportHandler.hpp"     // for ThrowRequireMsg
 #include <memory>                              // for allocator_traits<>::value_type
 #include <ostream>                             // for basic_ostream::operator<<, operator<<, bas...
 #include <vector>                              // for vector
 
-#if defined ( STK_HAS_MPI )
-
+#ifndef STK_HIDE_DEPRECATED_CODE // delete after August 2022
 TEST(ParallelComm, comm_recv_msg_sizes)
 {
   MPI_Comm comm = MPI_COMM_WORLD;
@@ -107,6 +108,7 @@ TEST(ParallelComm, comm_recv_procs_and_msg_sizes)
     }
   }
 }
+#endif
 
 TEST(ParallelComm, CommSparse_pair_with_string)
 {
@@ -216,21 +218,6 @@ TEST(ParallelComm, CommSparse_all_including_self)
     srcBuf.unpack(msg);
     EXPECT_EQ(msg, srcProc);
   }
-
-  commSparse.swap_send_recv();
-  commSparse.reset_buffers();
-
-  for(int destProc=0; destProc<numProcs; ++destProc) {
-    commSparse.send_buffer(destProc).pack(destProc);
-  }
-
-  for(int srcProc=0; srcProc<numProcs; ++srcProc) {
-    stk::CommBuffer& srcBuf = commSparse.recv_buffer(srcProc);
-    EXPECT_EQ(sizeof(int), static_cast<unsigned>(srcBuf.remaining()));
-    int msg;
-    srcBuf.unpack(msg);
-    EXPECT_EQ(msg, myProc);
-  }
 }
 
 TEST(ParallelComm, CommSparse_set_procs)
diff --git a/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestCouplingVersions.cpp b/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestCouplingVersions.cpp
index f6d66953a16d..26b6c60ae6b1 100644
--- a/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestCouplingVersions.cpp
+++ b/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestCouplingVersions.cpp
@@ -25,14 +25,14 @@ class CouplingVersionsTester : public ::testing::Test
 
 TEST_F(CouplingVersionsTester, CompatibileRangeGetter)
 {
-  EXPECT_EQ(stk::util::get_local_max_coupling_version(), STK_MAX_COUPLING_VERSION);
+  EXPECT_EQ(stk::util::get_local_max_coupling_version(), stk::util::impl::SHORT_TERM_STK_MAX_COUPLING_VERSION /*STK_MAX_COUPLING_VERSION*/);
   EXPECT_EQ(stk::util::get_local_min_coupling_version(), STK_MIN_COUPLING_VERSION);
 }
 
 TEST_F(CouplingVersionsTester, DefaultVersion)
 {
   EXPECT_EQ(stk::util::get_common_coupling_version(), STK_MAX_COUPLING_VERSION);
-  EXPECT_EQ(stk::util::get_global_max_coupling_version(), STK_MAX_COUPLING_VERSION);
+  EXPECT_EQ(stk::util::get_global_max_coupling_version(), stk::util::impl::SHORT_TERM_STK_MAX_COUPLING_VERSION /*STK_MAX_COUPLING_VERSION*/);
 }
 
 TEST_F(CouplingVersionsTester, NewVersion)
@@ -48,7 +48,7 @@ TEST_F(CouplingVersionsTester, OldVersion)
 {
   stk::util::impl::set_coupling_version(STK_MIN_COUPLING_VERSION);
   EXPECT_EQ(stk::util::get_common_coupling_version(), STK_MIN_COUPLING_VERSION);
-  EXPECT_EQ(stk::util::get_global_max_coupling_version(), STK_MAX_COUPLING_VERSION);
+  EXPECT_EQ(stk::util::get_global_max_coupling_version(), stk::util::impl::SHORT_TERM_STK_MAX_COUPLING_VERSION /*STK_MAX_COUPLING_VERSION*/);
 }
 
 TEST_F(CouplingVersionsTester, MixedVersion)
@@ -81,8 +81,8 @@ TEST_F(CouplingVersionsTester, DeprecatedVersionCheck)
 TEST_F(CouplingVersionsTester, NewVersionComm)
 {
   stk::util::set_coupling_version(MPI_COMM_WORLD);
-  EXPECT_EQ(stk::util::get_common_coupling_version(), STK_MAX_COUPLING_VERSION);
-  EXPECT_EQ(stk::util::get_global_max_coupling_version(), STK_MAX_COUPLING_VERSION);
+  EXPECT_EQ(stk::util::get_common_coupling_version(), stk::util::impl::SHORT_TERM_STK_MAX_COUPLING_VERSION /*STK_MAX_COUPLING_VERSION*/);
+  EXPECT_EQ(stk::util::get_global_max_coupling_version(), stk::util::impl::SHORT_TERM_STK_MAX_COUPLING_VERSION /*STK_MAX_COUPLING_VERSION*/);
 
 }
 
@@ -90,12 +90,12 @@ TEST_F(CouplingVersionsTester, NonincreasingVersion)
 {
   stk::util::impl::set_coupling_version(STK_MIN_COUPLING_VERSION);
   EXPECT_EQ(stk::util::get_common_coupling_version(), STK_MIN_COUPLING_VERSION);
-  EXPECT_EQ(stk::util::get_global_max_coupling_version(), STK_MAX_COUPLING_VERSION);
+  EXPECT_EQ(stk::util::get_global_max_coupling_version(), stk::util::impl::SHORT_TERM_STK_MAX_COUPLING_VERSION /*STK_MAX_COUPLING_VERSION*/);
 
 
   stk::util::set_coupling_version(MPI_COMM_WORLD);
   EXPECT_EQ(stk::util::get_common_coupling_version(), STK_MIN_COUPLING_VERSION);
-  EXPECT_EQ(stk::util::get_global_max_coupling_version(), STK_MAX_COUPLING_VERSION);
+  EXPECT_EQ(stk::util::get_global_max_coupling_version(), stk::util::impl::SHORT_TERM_STK_MAX_COUPLING_VERSION /*STK_MAX_COUPLING_VERSION*/);
 }
 
 
diff --git a/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestParallelReduceBool.cpp b/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestParallelReduceBool.cpp
new file mode 100644
index 000000000000..f194f4d6f9e9
--- /dev/null
+++ b/packages/stk/stk_unit_tests/stk_util/parallel/UnitTestParallelReduceBool.cpp
@@ -0,0 +1,66 @@
+#include "gtest/gtest.h"
+#include "stk_util/parallel/Parallel.hpp"
+#include "stk_util/parallel/ParallelReduceBool.hpp"
+
+#ifdef STK_HAS_MPI
+
+TEST(ParallelReduceBool, MPI_Cxx_Bool)
+{
+  EXPECT_NE(MPI_CXX_BOOL, MPI_DATATYPE_NULL);
+}
+
+//-----------------------------------------------------------------------------
+// is_true_on_any_proc test
+
+TEST(ParallelReduceBool, is_true_on_any_proc_all_true)
+{
+  EXPECT_TRUE(stk::is_true_on_any_proc(MPI_COMM_WORLD, true));
+}
+
+TEST(ParallelReduceBool, is_true_on_any_proc_all_false)
+{
+  EXPECT_FALSE(stk::is_true_on_any_proc(MPI_COMM_WORLD, false));
+}
+
+TEST(ParallelReduceBool, is_true_on_any_proc_one_true)
+{
+  int comm_rank = stk::parallel_machine_rank(MPI_COMM_WORLD);
+  int comm_size = stk::parallel_machine_size(MPI_COMM_WORLD);
+
+  for (int i=0; i < comm_size; ++i)
+  {
+    bool val = comm_rank == i ? true : false;
+    EXPECT_TRUE(stk::is_true_on_any_proc(MPI_COMM_WORLD, val));
+  }
+}
+
+//-----------------------------------------------------------------------------
+// is_true_on_all_procs tests
+
+TEST(ParallelReduceBool, is_true_on_all_procs_all_true)
+{
+  EXPECT_TRUE(stk::is_true_on_all_procs(MPI_COMM_WORLD, true));
+}
+
+TEST(ParallelReduceBool, is_true_on_all_procs_all_false)
+{
+  EXPECT_FALSE(stk::is_true_on_all_procs(MPI_COMM_WORLD, false));
+}
+
+TEST(ParallelReduceBool, is_true_on_all_procs_one_true)
+{
+  int comm_rank = stk::parallel_machine_rank(MPI_COMM_WORLD);
+  int comm_size = stk::parallel_machine_size(MPI_COMM_WORLD);
+
+  for (int i=0; i < comm_size; ++i)
+  {
+    bool val = comm_rank == i ? true : false;
+    if (comm_size > 1) {
+      EXPECT_FALSE(stk::is_true_on_all_procs(MPI_COMM_WORLD, val));
+    } else {
+      EXPECT_TRUE(stk::is_true_on_all_procs(MPI_COMM_WORLD, val));
+    }
+  }
+}
+
+#endif
\ No newline at end of file
diff --git a/packages/stk/stk_unit_tests/stk_util/schedulerTest.cpp b/packages/stk/stk_unit_tests/stk_util/schedulerTest.cpp
index f38a3121f358..93992a20f6ea 100644
--- a/packages/stk/stk_unit_tests/stk_util/schedulerTest.cpp
+++ b/packages/stk/stk_unit_tests/stk_util/schedulerTest.cpp
@@ -164,6 +164,23 @@ TEST(SchedulerTest, emptyScheduler)
     EXPECT_FALSE(scheduler.is_it_time(terminationTime+0.5, 2));
 }
 
+TEST(SchedulerTest, stepIntervalWithTerminationTime)
+{
+  using stk::util::Step;
+
+  stk::util::Scheduler scheduler;
+  const stk::util::Time terminationTime = 4.5;
+  scheduler.set_termination_time(terminationTime);
+  scheduler.add_interval(Step(0), Step(2));
+  EXPECT_TRUE(scheduler.is_it_time(0.0, 0));
+  EXPECT_FALSE(scheduler.is_it_time(0.5, 1));
+  EXPECT_TRUE(scheduler.is_it_time(2.0, 2));
+  EXPECT_FALSE(scheduler.is_it_time(3.5, 3));
+  EXPECT_TRUE(scheduler.is_it_time(4.0, 4));
+  EXPECT_TRUE(scheduler.is_it_time(terminationTime, 5));
+  EXPECT_FALSE(scheduler.is_it_time(terminationTime+0.5, 6));
+}
+
 TEST(SchedulerTest, largeStartingTimeFollowedBySmallStep)
 {
     stk::util::Scheduler scheduler;
diff --git a/packages/stk/stk_unit_tests/stk_util/util/UnitTestScheduler.cpp b/packages/stk/stk_unit_tests/stk_util/util/UnitTestScheduler.cpp
index 277f99f7181f..d57466edaaae 100644
--- a/packages/stk/stk_unit_tests/stk_util/util/UnitTestScheduler.cpp
+++ b/packages/stk/stk_unit_tests/stk_util/util/UnitTestScheduler.cpp
@@ -93,9 +93,7 @@ TEST(Scheduler, LogarithmicOutput)
   const double dt_max = 100.0;
 
   std::mt19937 rng;
-  auto time = static_cast<unsigned>(stk::wall_time());
-  rng.seed(time);
-  std::cout << "Running with seed = " << time << std::endl;
+  rng.seed(666);
 
   std::uniform_real_distribution<double> noise(-1.0, 1.0);
 
diff --git a/packages/stk/stk_util/stk_util/environment/CPUTime.cpp b/packages/stk/stk_util/stk_util/environment/CPUTime.cpp
index d7d10f4a9c3f..67e7ba09aee1 100644
--- a/packages/stk/stk_util/stk_util/environment/CPUTime.cpp
+++ b/packages/stk/stk_util/stk_util/environment/CPUTime.cpp
@@ -33,23 +33,15 @@
 // 
 
 #include "stk_util/environment/CPUTime.hpp"
-#include <sys/resource.h>  // for rusage, getrusage, RUSAGE_SELF
-#include <sys/time.h>      // for timeval
-
+#include <chrono>
 
 namespace stk {
 
 double
 cpu_time()
 {
-  struct rusage my_rusage;
-
-  ::getrusage(RUSAGE_SELF, &my_rusage);
-
-  double seconds = my_rusage.ru_utime.tv_sec + my_rusage.ru_stime.tv_sec;
-  double micro_seconds = my_rusage.ru_utime.tv_usec + my_rusage.ru_stime.tv_usec;
-  
-  return seconds + micro_seconds*1.0e-6;
+  auto time = std::chrono::high_resolution_clock::now();
+  return std::chrono::duration<double>(time.time_since_epoch()).count();
 }
 
 } // namespace stk
diff --git a/packages/stk/stk_util/stk_util/environment/Env.cpp b/packages/stk/stk_util/stk_util/environment/Env.cpp
index d66b99f8a969..4b3298d9dbe7 100644
--- a/packages/stk/stk_util/stk_util/environment/Env.cpp
+++ b/packages/stk/stk_util/stk_util/environment/Env.cpp
@@ -363,7 +363,6 @@ set_param(
   const char *s = std::strcpy(new char[std::strlen(option) + 1], option);
 
   stk::parse_command_line_args(argc, &s, stk::get_options_specification(), stk::get_parsed_options());
-
   delete [] s;
 }
 
diff --git a/packages/stk/stk_util/stk_util/parallel/CommSparse.cpp b/packages/stk/stk_util/stk_util/parallel/CommSparse.cpp
index bff636ae975d..471cee624eee 100644
--- a/packages/stk/stk_util/stk_util/parallel/CommSparse.cpp
+++ b/packages/stk/stk_util/stk_util/parallel/CommSparse.cpp
@@ -52,10 +52,15 @@ namespace stk {
 
 static const int STK_COMMSPARSE_MPI_TAG_MSG_SIZING  = 10101;
 static const int STK_COMMSPARSE_MPI_TAG_PROC_SIZING = 10111;
+
+#if STK_MIN_COUPLING_VERSION < 6
 static const int STK_COMMSPARSE_MPI_TAG_DATA        = 11011;
+#endif
+
 
 namespace {
 
+#if STK_MIN_COPULING_VERSION < 6
 void launch_ireceives(ParallelMachine p_comm,
                       const std::vector<int>& recv_procs,
                       std::vector<CommBuffer>& recv,
@@ -175,6 +180,8 @@ void communicate_unpack(ParallelMachine p_comm ,
 
 }
 
+#endif  // STK_MIN_COUPLING_VERSION
+
 #else
 
 // Not parallel
@@ -183,6 +190,7 @@ void communicate_unpack(ParallelMachine p_comm ,
 
 //----------------------------------------------------------------------
 
+#if STK_MIN_COUPLING_VERSION < 6
 namespace {
 
 inline
@@ -194,28 +202,40 @@ size_t align_quad( size_t n )
 
 }
 
-//----------------------------------------------------------------------
+#endif
 
-void CommSparse::reset_buffers()
-{
-  for (size_t i=0 ; i<m_send.size(); ++i) {
-    m_send[i].reset();
-  }
-  for (size_t i=0 ; i<m_recv.size(); ++i) {
-    m_recv[i].reset();
-  }
-}
 
-//----------------------------------------------------------------------
 
-void CommSparse::swap_send_recv()
+void CommSparse::reset_buffers()
 {
-  ThrowRequireMsg(!m_recv.empty(), "stk::CommSparse::swap_send_recv(){ NULL recv buffers }");
-  m_send.swap(m_recv);
-}
+  stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+  if (stk::util::get_common_coupling_version() >= 6) {
+    if (m_exchanger)
+    {
+      for (int p=0; p < m_size; ++p)
+      {
+        m_exchanger->get_send_buf(p).reset();
+        m_exchanger->get_recv_buf(p).reset();
+      }
+    } else
+    {
+      m_null_comm_send_buffer.reset();
+      m_null_comm_recv_buffer.reset();
+    }
 
-//----------------------------------------------------------------------
+    m_num_recvs = DataExchangeUnknownPatternNonBlocking::Unknown;
+  } else {
+    for (size_t i=0 ; i<m_send.size(); ++i) {
+      m_send[i].reset();
+    }
+    for (size_t i=0 ; i<m_recv.size(); ++i) {
+      m_recv[i].reset();
+    }
+  }
+}
 
+#if STK_MIN_COUPLING_VERSION < 6
 void CommSparse::allocate_data(std::vector<CommBuffer>& bufs, std::vector<unsigned char>& data)
 {
   size_t n_size = 0;
@@ -235,46 +255,71 @@ void CommSparse::allocate_data(std::vector<CommBuffer>& bufs, std::vector<unsign
     p_data += align_quad( sz );
   }
 }
+#endif
 
 bool CommSparse::allocate_buffers()
 {
-  m_send.resize(m_size);
-  m_recv.resize(m_size);
+  stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+  if (stk::util::get_common_coupling_version() >= 6) {
+    if (m_exchanger) {
+      m_exchanger->allocate_send_buffers();
+    } else {
+      size_t size = m_null_comm_send_buffer.size();
+      m_null_comm_storage.resize(size);
+      auto* ptr = m_null_comm_storage.data();
+      m_null_comm_send_buffer.set_buffer_ptrs(ptr, ptr, ptr + size);
+      m_null_comm_recv_buffer.set_buffer_ptrs(ptr, ptr, ptr + size);
+    }
 
-  if (m_size > 1) {
-    comm_recv_procs_and_msg_sizes(m_comm, m_send, m_recv, m_send_procs, m_recv_procs);
-    allocate_data(m_send, m_send_data);
-    allocate_data(m_recv, m_recv_data);
-  }
-  else {
-    allocate_data(m_send, m_send_data);
-    m_recv = m_send;
-    m_recv_data = m_send_data;
-    if (m_send[0].capacity() > 0) {
-      m_send_procs.resize(1);
-      m_send_procs[0] = 0;
-      m_recv_procs = m_send_procs;
+    return false;
+  } else {
+    m_send.resize(m_size);
+    m_recv.resize(m_size);
+
+    if (m_size > 1) {
+      comm_recv_procs_and_msg_sizes(m_comm, m_send, m_recv, m_send_procs, m_recv_procs);
+      allocate_data(m_send, m_send_data);
+      allocate_data(m_recv, m_recv_data);
     }
+    else {
+      allocate_data(m_send, m_send_data);
+      m_recv = m_send;
+      m_recv_data = m_send_data;
+      if (m_send[0].capacity() > 0) {
+        m_send_procs.resize(1);
+        m_send_procs[0] = 0;
+        m_recv_procs = m_send_procs;
+      }
+    }
+    return ((m_send_procs.size() > 0) || (m_recv_procs.size() > 0)); 
   }
-  return ((m_send_procs.size() > 0) || (m_recv_procs.size() > 0));
 }
 
 void CommSparse::allocate_buffers(const std::vector<int>& send_procs, const std::vector<int>& recv_procs)
 {
-  m_send.resize(m_size);
-  m_recv.resize(m_size);
-  
-  m_send_procs = send_procs;
-  m_recv_procs = recv_procs;
-
-  if (m_size > 1) {
-    comm_recv_msg_sizes(m_comm , send_procs, recv_procs, m_send, m_recv);
-    allocate_data(m_send, m_send_data);
-    allocate_data(m_recv, m_recv_data);
-  }
-  else {
-    m_recv = m_send;
-    m_recv_data = m_send_data;
+
+  stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+  if (stk::util::get_common_coupling_version() >= 6) {
+    allocate_buffers();
+    m_num_recvs = recv_procs.size();
+  } else {
+    m_send.resize(m_size);
+    m_recv.resize(m_size);
+    
+    m_send_procs = send_procs;
+    m_recv_procs = recv_procs;
+
+    if (m_size > 1) {
+      comm_recv_msg_sizes(m_comm , send_procs, recv_procs, m_send, m_recv);
+      allocate_data(m_send, m_send_data);
+      allocate_data(m_recv, m_recv_data);
+    }
+    else {
+      m_recv = m_send;
+      m_recv_data = m_send_data;
+    }    
   }
 }
 
@@ -283,7 +328,7 @@ void CommSparse::verify_send_buffers_filled()
 #ifndef NDEBUG
   for ( int i = 0 ; i < m_size ; ++i ) {
     // Verify the send buffers have been filled
-    if ( m_send[i].remaining() ) {
+    if ( send_buffer(i).remaining() ) {
       std::ostringstream msg ;
       msg << "stk::CommSparse::communicate LOCAL[" << m_rank << "] ERROR: Send[" << i
           << "] Buffer not filled." ;
@@ -295,23 +340,50 @@ void CommSparse::verify_send_buffers_filled()
 
 void CommSparse::communicate()
 {
-  verify_send_buffers_filled();
+#ifdef STK_HAS_MPI
+  stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+  if (stk::util::get_common_coupling_version() >= 6) {
+    if (m_exchanger) 
+    {
+        auto f = [](int rank, stk::CommBuffer& buf) {};
+        communicate_with_unpacker(f);
+    }
+  } else {
+    verify_send_buffers_filled();
 
-  if ( 1 < m_size ) {
-    communicate_any( m_comm , m_send , m_recv, m_send_procs, m_recv_procs );
+    if ( 1 < m_size ) {
+      communicate_any( m_comm , m_send , m_recv, m_send_procs, m_recv_procs );
+    }
   }
+#endif
 }
 
 void CommSparse::communicate_with_unpacker(const std::function<void(int fromProc, CommBuffer& buf)>& functor)
 {
-  verify_send_buffers_filled();
+#ifdef STK_HAS_MPI
+  stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+  if (stk::util::get_common_coupling_version() >= 6) {
+    if (m_exchanger)
+    {
+      verify_send_buffers_filled();
+    
+      m_exchanger->start_nonblocking(m_num_recvs);
+      m_exchanger->post_nonblocking_receives();
+      m_exchanger->complete_receives(functor);
+      m_exchanger->complete_sends();
+    }
+  } else {
+    verify_send_buffers_filled();
 
-  if (1 < m_size) {
-    communicate_unpack(m_comm , m_send , m_recv, m_send_procs, m_recv_procs, functor);
+    if (1 < m_size) {
+      communicate_unpack(m_comm , m_send , m_recv, m_send_procs, m_recv_procs, functor);
+    }    
   }
+#endif
 }
 
-//----------------------------------------------------------------------
 //----------------------------------------------------------------------
 
 #if defined(STK_HAS_MPI)
diff --git a/packages/stk/stk_util/stk_util/parallel/CommSparse.hpp b/packages/stk/stk_util/stk_util/parallel/CommSparse.hpp
index 99251cbc297f..09fa19e5ee8a 100644
--- a/packages/stk/stk_util/stk_util/parallel/CommSparse.hpp
+++ b/packages/stk/stk_util/stk_util/parallel/CommSparse.hpp
@@ -35,9 +35,10 @@
 #ifndef stk_util_parallel_CommSparse_hpp
 #define stk_util_parallel_CommSparse_hpp
 
+#include "stk_util/parallel/CouplingVersions.hpp"
 #include "stk_util/util/ReportHandler.hpp"
 #include "stk_util/parallel/Parallel.hpp"      // for ParallelMachine, parallel_machine_null
-#include "stk_util/parallel/ParallelComm.hpp"  // for CommBuffer
+#include "stk_util/parallel/DataExchangeUnknownPatternNonBlockingBuffer.hpp"
 #include <cstddef>                             // for size_t
 #include <vector>                              // for vector
 
@@ -53,13 +54,14 @@ namespace stk {
  * Output vectors for send-procs and recv-procs will have
  * length num-send-procs and num-recv-procs respectively.
  */
-void comm_recv_procs_and_msg_sizes(ParallelMachine comm,
+#ifndef STK_HIDE_DEPRECATED_CODE // delete coupling version 5 is deprecated
+STK_DEPRECATED void comm_recv_procs_and_msg_sizes(ParallelMachine comm,
                      const unsigned * const send_size,
                      unsigned * const recv_size,
                      std::vector<int>& output_send_procs,
                      std::vector<int>& output_recv_procs);
 
-void comm_recv_procs_and_msg_sizes(ParallelMachine comm ,
+STK_DEPRECATED void comm_recv_procs_and_msg_sizes(ParallelMachine comm ,
                                    const std::vector<CommBuffer>& send_bufs ,
                                          std::vector<CommBuffer>& recv_bufs,
                                    std::vector<int>& send_procs,
@@ -69,17 +71,19 @@ void comm_recv_procs_and_msg_sizes(ParallelMachine comm ,
  * send-procs and recv-procs (of length number-of-procs-to-send/recv-with),
  * set recv sizes (recv_size array has length number-of-MPI-processor-ranks).
  */
-void comm_recv_msg_sizes(ParallelMachine comm ,
+
+STK_DEPRECATED void comm_recv_msg_sizes(ParallelMachine comm ,
                      const unsigned * const send_size ,
                      const std::vector<int>& send_procs,
                      const std::vector<int>& recv_procs,
                      unsigned * const recv_size);
 
-void comm_recv_msg_sizes(ParallelMachine comm ,
+STK_DEPRECATED void comm_recv_msg_sizes(ParallelMachine comm ,
                      const std::vector<int>& send_procs,
                      const std::vector<int>& recv_procs,
                      const std::vector<CommBuffer>& send_bufs,
                      std::vector<CommBuffer>& recv_bufs);
+#endif
 
 class CommSparse {
 public:
@@ -92,21 +96,67 @@ class CommSparse {
   CommBuffer & send_buffer( int p )
   {
     ThrowAssertMsg(p < m_size,"CommSparse::send_buffer: "<<p<<" out of range [0:"<<m_size<<")");
-    return m_send[p] ;
+    stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+    if (stk::util::get_common_coupling_version() >= 6) {
+      if (m_exchanger) {
+        return m_exchanger->get_send_buf(p);
+      } else {
+        return m_null_comm_send_buffer;
+      }
+    } else {
+      return m_send[p] ;
+    }
+  }
+
+  const CommBuffer & send_buffer( int p ) const
+  {
+    ThrowAssertMsg(p < m_size,"CommSparse::send_buffer: "<<p<<" out of range [0:"<<m_size<<")");
+    stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+    if (stk::util::get_common_coupling_version() >= 6) {
+      if (m_exchanger) {
+        return m_exchanger->get_send_buf(p);
+      } else {
+        return m_null_comm_send_buffer;
+      }
+    } else {
+      return m_send[p] ;
+    }
   }
 
   /** Obtain the message buffer for a given processor */
   CommBuffer & recv_buffer( int p )
   {
     ThrowAssertMsg(p < m_size,"CommSparse::recv_buffer: "<<p<<" out of range [0:"<<m_size<<")");
-    return m_recv[p] ;
+    stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+    if (stk::util::get_common_coupling_version() >= 6) {
+      if (m_exchanger) {
+        return m_exchanger->get_recv_buf(p);
+      } else {
+        return m_null_comm_recv_buffer;
+      }
+    } else {
+      return m_recv[p] ;
+    }
   }
 
   /** Obtain the message buffer for a given processor */
   const CommBuffer & recv_buffer( int p ) const
   {
     ThrowAssertMsg(p < m_size,"CommSparse::recv_buffer: "<<p<<" out of range [0:"<<m_size<<")");
-    return m_recv[p] ;
+    stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+    if (stk::util::get_common_coupling_version() >= 6) {
+      if (m_exchanger) {
+        return m_exchanger->get_recv_buf(p);
+      } else {
+        return m_null_comm_recv_buffer;
+      }
+    } else {
+      return m_recv[p] ;
+    }
   }
 
   //----------------------------------------
@@ -125,21 +175,25 @@ class CommSparse {
     : m_comm( comm ),
       m_size( parallel_machine_size( comm ) ),
       m_rank( parallel_machine_rank( comm ) ),
+#if STK_MIN_COUPLING_VERSION < 6
       m_send(m_size),
       m_recv(m_size),
       m_send_data(),
       m_recv_data(),
       m_send_procs(),
-      m_recv_procs()
+      m_recv_procs(),
+#endif
+      m_exchanger(nullptr)
   {
+    if (comm != MPI_COMM_NULL  && stk::util::get_common_coupling_version() >= 6) {
+      m_exchanger = std::make_shared<DataExchangeUnknownPatternNonBlockingCommBuffer>(comm);
+    }
   }
 
   CommSparse(const CommSparse&) = delete;
 
   /** Allocate communication buffers based upon
    *  sizing from the surrogate send buffer packing.
-   *  Returns true if the local processor is actually
-   *  sending or receiving.
    */
   bool allocate_buffers();
 
@@ -162,64 +216,65 @@ class CommSparse {
     communicate_with_unpacker(alg);
   }
 
-  /** Swap send and receive buffers leading to reversed communication. */
-  void swap_send_recv();
-
   /** Reset, but do not reallocate, message buffers for reprocessing.
    *  Sets 'size() == 0' and 'remaining() == capacity()'.
    */
   void reset_buffers();
 
-  ~CommSparse()
-  {
-    m_comm = parallel_machine_null();
-    m_size = 0 ;
-    m_rank = 0 ;
-    m_send.clear();
-    m_recv.clear();
-  }
 private:
 
-  /** Construct for undefined communication.
-   *  No buffers are allocated.
-   */
-  CommSparse()
-    : m_comm( parallel_machine_null() ),
-      m_size( 0 ), 
-      m_rank( 0 ),
-      m_send(),
-      m_recv(),
-      m_send_data(),
-      m_recv_data(),
-      m_send_procs(),
-      m_recv_procs()
-  {}
-
+#if STK_MIN_COUPLING_VERSION < 6
   void allocate_data(std::vector<CommBuffer>& bufs, std::vector<unsigned char>& data);
+#endif
   void verify_send_buffers_filled();
   void communicate_with_unpacker(const std::function<void(int fromProc, CommBuffer& buf)>& functor);
 
   ParallelMachine m_comm ;
   int             m_size ;
   int             m_rank ;
+#if STK_MIN_COUPLING_VERSION < 6
   std::vector<CommBuffer> m_send;
   std::vector<CommBuffer> m_recv;
   std::vector<unsigned char> m_send_data;
   std::vector<unsigned char> m_recv_data;
   std::vector<int> m_send_procs;
   std::vector<int> m_recv_procs;
+#endif
+
+  int             m_num_recvs = DataExchangeUnknownPatternNonBlocking::Unknown;
+  std::shared_ptr<DataExchangeUnknownPatternNonBlockingCommBuffer> m_exchanger;
+
+  stk::CommBuffer m_null_comm_send_buffer;
+  stk::CommBuffer m_null_comm_recv_buffer;
+  std::vector<unsigned char> m_null_comm_storage;
 };
 
 template<typename COMM, typename PACK_ALGORITHM>
 bool pack_and_communicate(COMM & comm, const PACK_ALGORITHM & algorithm)
 {
+  stk::util::print_unsupported_version_warning(5, __LINE__, __FILE__);
+
+  if (stk::util::get_common_coupling_version() >= 6) {
+    algorithm();
+    comm.allocate_buffers();
+    algorithm();
+    comm.communicate();
+
+    for (int i=0; i < comm.parallel_size(); ++i) {
+      if (comm.send_buffer(i).capacity() > 0 || comm.recv_buffer(i).capacity() > 0) {
+        return true;
+      }
+    }
+    return false;
+  } else {
     algorithm();
     const bool actuallySendingOrReceiving = comm.allocate_buffers();
     if (actuallySendingOrReceiving) {
         algorithm();
         comm.communicate();
     }
-    return actuallySendingOrReceiving;
+    return actuallySendingOrReceiving; 
+  }
 }
 
 template<typename COMM, typename UNPACK_ALGORITHM>
diff --git a/packages/stk/stk_util/stk_util/parallel/CouplingVersions.cpp b/packages/stk/stk_util/stk_util/parallel/CouplingVersions.cpp
index db132ddc15a2..54bdb0ca8301 100644
--- a/packages/stk/stk_util/stk_util/parallel/CouplingVersions.cpp
+++ b/packages/stk/stk_util/stk_util/parallel/CouplingVersions.cpp
@@ -12,6 +12,7 @@
 namespace stk {
 namespace util {
 
+
 #ifdef STK_HAS_MPI
 
 void MPI_Op_MaxMinReduction(void* invec, void* inoutvec, int* len, MPI_Datatype* datatype)
@@ -19,17 +20,17 @@ void MPI_Op_MaxMinReduction(void* invec, void* inoutvec, int* len, MPI_Datatype*
   int* invec_int    = reinterpret_cast<int*>(invec);
   int* inoutvec_int = reinterpret_cast<int*>(inoutvec);
 
-  inoutvec_int[0] = std::max(invec_int[0], inoutvec_int[0]);
   inoutvec_int[1] = std::min(invec_int[1], inoutvec_int[1]);
+  inoutvec_int[2] = std::max(invec_int[2], inoutvec_int[2]);
 }
 
 std::pair<int, int> allreduce_minmax(MPI_Comm comm, int localVersion)
 {
   // for compatibility with the ParallelReduce code, the buffer has to be
-  // large enough for 3 ints (2 ints + empty struct + padding), even though 
-  // only the first 2 are used
+  // large enough for 3 ints (empty struct + padding + 2 ints), even though 
+  // only the ints are used
   constexpr int bufSize = 3;
-  std::array<int, bufSize> inbuf{localVersion, localVersion, -1}, outbuf;
+  std::array<int, bufSize> inbuf{-1, localVersion, localVersion}, outbuf;
 
   MPI_Op mpiOp = MPI_OP_NULL ;
   MPI_Op_create( MPI_Op_MaxMinReduction , false , &mpiOp );
@@ -49,7 +50,7 @@ std::pair<int, int> allreduce_minmax(MPI_Comm comm, int localVersion)
 
   MPI_Op_free(&mpiOp);
 
-  return {outbuf[1], outbuf[0]};
+  return {outbuf[1], outbuf[2]};
 }
 
 
@@ -68,7 +69,7 @@ class StkCompatibleVersion
 
     void set_version(MPI_Comm comm)
     {
-      set_version_impl(comm, m_version);
+      set_version_impl(comm, std::min(impl::SHORT_TERM_STK_MAX_COUPLING_VERSION, m_version) /*m_version*/);
     }
 
     void set_error_on_reset(bool val)
@@ -78,7 +79,7 @@ class StkCompatibleVersion
 
     void reset_global_max_coupling_version()
     {
-      m_globalMaxVersion = STK_MAX_COUPLING_VERSION;
+      m_globalMaxVersion = impl::SHORT_TERM_STK_MAX_COUPLING_VERSION; // STK_MAX_COUPLING_VERSION;
     }
 
   private:
@@ -150,7 +151,7 @@ class StkCompatibleVersion
     }
 
     int m_version = STK_MAX_COUPLING_VERSION;
-    int m_globalMaxVersion = STK_MAX_COUPLING_VERSION;
+    int m_globalMaxVersion = impl::SHORT_TERM_STK_MAX_COUPLING_VERSION; // STK_MAX_COUPLING_VERSION;
     bool m_isVersionSet = false;
     bool m_errorOnResetVersion = true;
 };
@@ -170,13 +171,13 @@ int get_common_coupling_version()
 #ifdef STK_HAS_MPI
   return get_stk_coupling_version().get_version();
 #else
-  return STK_MAX_COUPLING_VERSION;
+  return STK_impl::SHORT_TERM_MAX_COUPLING_VERSION; //STK_MAX_COUPLING_VERSION;
 #endif
 }
 
 int get_local_max_coupling_version()
 {
-  return STK_MAX_COUPLING_VERSION;
+  return impl::SHORT_TERM_STK_MAX_COUPLING_VERSION; //STK_MAX_COUPLING_VERSION;
 }
 
 int get_local_min_coupling_version()
@@ -190,7 +191,7 @@ int get_global_max_coupling_version()
 #ifdef STK_HAS_MPI
   return get_stk_coupling_version().get_global_max_version();
 #else
-  return STK_MAX_COUPLING_VERSION
+  return impl::SHORT_TERM_STK_MAX_COUPLING_VERSION; // STK_MAX_COUPLING_VERSION
 #endif
 }
 
@@ -202,7 +203,10 @@ std::string get_deprecation_date(int version)
                                                       std::make_pair(2, "7/26/2022"),
                                                       std::make_pair(3, "7/26/2022"),
                                                       std::make_pair(4, "7/27/2022"),
-                                                      std::make_pair(5, "")
+                                                      std::make_pair(5, "9/13/2022"),
+                                                      std::make_pair(6, "9/18/2022"),
+                                                      std::make_pair(7, "10/16/2022"),
+                                                      std::make_pair(8, "")
                                                     };
 
   return deprecationDates.at(version);
@@ -222,10 +226,10 @@ bool is_local_stk_coupling_deprecated()
 }
 
 
-void print_unsupported_version_warning(int version, int line, const std::string& file)
+void print_unsupported_version_warning(int version, int line, const char* file)
 {                                                                                      
   if ( STK_MIN_COUPLING_VERSION > version ) {
-    std::cerr  << "The function at line " << __LINE__ << " of file " << __FILE__
+    std::cerr  << "The function at line " << line << " of file " << file
                << " can be simplified now that STK_MIN_COUPLING_VERSION is greater than "
                << (version) << std::endl;
   }
diff --git a/packages/stk/stk_util/stk_util/parallel/CouplingVersions.hpp b/packages/stk/stk_util/stk_util/parallel/CouplingVersions.hpp
index 99725675ca08..da2fbaee8caa 100644
--- a/packages/stk/stk_util/stk_util/parallel/CouplingVersions.hpp
+++ b/packages/stk/stk_util/stk_util/parallel/CouplingVersions.hpp
@@ -8,13 +8,18 @@
 
 #include <string>
 
-#define STK_MAX_COUPLING_VERSION 5
+#define STK_MAX_COUPLING_VERSION 8
 #define STK_MIN_COUPLING_VERSION 0                                                                               
-
+ 
 namespace stk {
 
 namespace util {
 
+namespace impl {
+constexpr int SHORT_TERM_STK_MAX_COUPLING_VERSION=1;
+}
+
+
 int get_common_coupling_version();
 
 int get_local_max_coupling_version();
@@ -31,7 +36,7 @@ void set_coupling_version(MPI_Comm comm);
 
 bool is_local_stk_coupling_deprecated();
 
-void print_unsupported_version_warning(int version, int line, const std::string& file);
+void print_unsupported_version_warning(int version, int line, const char* file);
 
 }
 
diff --git a/packages/stk/stk_util/stk_util/parallel/DataExchangeUnknownPatternNonBlocking.cpp b/packages/stk/stk_util/stk_util/parallel/DataExchangeUnknownPatternNonBlocking.cpp
index a7674d509142..b3a8ef258325 100644
--- a/packages/stk/stk_util/stk_util/parallel/DataExchangeUnknownPatternNonBlocking.cpp
+++ b/packages/stk/stk_util/stk_util/parallel/DataExchangeUnknownPatternNonBlocking.cpp
@@ -25,7 +25,7 @@ void DataExchangeUnknownPatternNonBlocking::yield()
 {
   // Note: sleep_for would be better for this, but its minimum sleep time is
   // too long
-  std::this_thread::yield();
+  //std::this_thread::yield();
 }
 
 }  // namespace
diff --git a/packages/stk/stk_util/stk_util/parallel/MPITagManager.cpp b/packages/stk/stk_util/stk_util/parallel/MPITagManager.cpp
index 205e1d9e235a..69e7ce3f4e76 100644
--- a/packages/stk/stk_util/stk_util/parallel/MPITagManager.cpp
+++ b/packages/stk/stk_util/stk_util/parallel/MPITagManager.cpp
@@ -1,4 +1,5 @@
 #include "stk_util/parallel/MPITagManager.hpp"
+#include "stk_util/parallel/CouplingVersions.hpp"
 #include <cassert>
 
 namespace stk {
@@ -176,7 +177,16 @@ void MPITagManager::check_same_value_on_all_procs_debug_only(MPI_Comm comm, int
 
 MPITagManager& get_mpi_tag_manager()
 {
-  int deletionGroupSize = 32;
+  stk::util::print_unsupported_version_warning(7, __LINE__, __FILE__);
+  int deletionGroupSize;
+  if (stk::util::get_common_coupling_version() >= 8)
+  {
+    deletionGroupSize = 33;
+  } else
+  {
+    deletionGroupSize = 32;
+  }
+
   static int delayCount = -1;
   if (delayCount < 0)
   {
diff --git a/packages/stk/stk_util/stk_util/parallel/ManagedBufferBase.hpp b/packages/stk/stk_util/stk_util/parallel/ManagedBufferBase.hpp
index 82dab06afd67..65f9c91835b8 100644
--- a/packages/stk/stk_util/stk_util/parallel/ManagedBufferBase.hpp
+++ b/packages/stk/stk_util/stk_util/parallel/ManagedBufferBase.hpp
@@ -121,8 +121,7 @@ class ManagedCommBufferBase
     explicit ManagedCommBufferBase(MPI_Comm comm) :
     m_comm(comm)
     {
-      int commSize;
-      MPI_Comm_size(comm, &commSize);
+      int commSize = parallel_machine_size(comm);
       m_sendBufs.resize(commSize);
       m_sendBufStorage.resize(commSize);
       m_recvBufs.resize(commSize);
@@ -141,6 +140,11 @@ class ManagedCommBufferBase
       return m_sendBufs[rank];
     }
 
+    const stk::CommBuffer& get_send_buf(int rank) const
+    { 
+      return m_sendBufs[rank];
+    }
+
     stk::CommBuffer& get_recv_buf(int rank)
     { 
       if (m_recvsInProgress)
diff --git a/packages/stk/stk_util/stk_util/parallel/ParallelReduceBool.hpp b/packages/stk/stk_util/stk_util/parallel/ParallelReduceBool.hpp
index 4b1f6c692240..b66ce7486b82 100644
--- a/packages/stk/stk_util/stk_util/parallel/ParallelReduceBool.hpp
+++ b/packages/stk/stk_util/stk_util/parallel/ParallelReduceBool.hpp
@@ -46,8 +46,13 @@ inline bool is_true_on_all_procs(ParallelMachine comm , const bool truthValue)
 {
 #ifdef STK_HAS_MPI
     stk::util::print_unsupported_version_warning(2, __LINE__, __FILE__);
-
-  if (stk::util::get_common_coupling_version() >= 3) {
+    stk::util::print_unsupported_version_warning(6, __LINE__, __FILE__);
+  
+  if (stk::util::get_common_coupling_version() >= 7) {
+    int truthValueInt = truthValue, globalResult;
+    MPI_Allreduce(&truthValueInt, &globalResult, 1, MPI_INT, MPI_LAND, comm);
+    return globalResult;
+  } else if (stk::util::get_common_coupling_version() >= 3) {
     bool globalResult;
     MPI_Allreduce(&truthValue, &globalResult, 1, MPI_CXX_BOOL, MPI_LAND, comm);
     return globalResult;
@@ -67,8 +72,13 @@ inline bool is_true_on_any_proc(ParallelMachine comm , const bool truthValue)
 {
 #ifdef STK_HAS_MPI
   stk::util::print_unsupported_version_warning(2, __LINE__, __FILE__);
+  stk::util::print_unsupported_version_warning(6, __LINE__, __FILE__);
 
-  if (stk::util::get_common_coupling_version() >= 3) {
+  if (stk::util::get_common_coupling_version() >= 7) {
+    int truthValueInt = truthValue, globalResult;
+    MPI_Allreduce(&truthValueInt, &globalResult, 1, MPI_INT, MPI_LOR, comm);
+    return globalResult;
+  } else if (stk::util::get_common_coupling_version() >= 3) {
     bool globalResult;
     MPI_Allreduce(&truthValue, &globalResult, 1, MPI_CXX_BOOL, MPI_LOR, comm);
     return globalResult;
diff --git a/packages/stk/stk_util/stk_util/registry/ProductRegistry.cpp b/packages/stk/stk_util/stk_util/registry/ProductRegistry.cpp
index 83dfc511008d..2f9a625d632c 100644
--- a/packages/stk/stk_util/stk_util/registry/ProductRegistry.cpp
+++ b/packages/stk/stk_util/stk_util/registry/ProductRegistry.cpp
@@ -42,7 +42,7 @@
 //In Sierra, STK_VERSION_STRING is provided on the compile line by bake.
 //For Trilinos stk snapshots, the following macro definition gets populated with
 //the real version string by the trilinos_snapshot.sh script.
-#define STK_VERSION_STRING "5.7.4-14-gb9702494"
+#define STK_VERSION_STRING "5.9.2-596-g5255aa34"
 #endif
 
 namespace stk {
diff --git a/packages/stk/stk_util/stk_util/util/StkNgpVector.hpp b/packages/stk/stk_util/stk_util/util/StkNgpVector.hpp
index 529eeec21516..2f386caef4d5 100644
--- a/packages/stk/stk_util/stk_util/util/StkNgpVector.hpp
+++ b/packages/stk/stk_util/stk_util/util/StkNgpVector.hpp
@@ -53,11 +53,7 @@ class NgpVector
     NgpVector(const std::string &n, size_t s)
         : mSize(s),
           deviceVals(Kokkos::view_alloc(Kokkos::WithoutInitializing, n), mSize),
-#ifndef NEW_TRILINOS_INTEGRATION
-          hostVals(Kokkos::create_mirror_view(HostSpace(), deviceVals, Kokkos::WithoutInitializing))
-#else
           hostVals(Kokkos::create_mirror_view(Kokkos::WithoutInitializing, HostSpace(), deviceVals))
-#endif
         {
     }
     NgpVector(size_t s) : NgpVector(get_default_name(), s)
diff --git a/packages/stk/stk_util/stk_util/util/VecSet.hpp b/packages/stk/stk_util/stk_util/util/VecSet.hpp
index bdce1e339730..0f7b79b4de56 100644
--- a/packages/stk/stk_util/stk_util/util/VecSet.hpp
+++ b/packages/stk/stk_util/stk_util/util/VecSet.hpp
@@ -104,11 +104,8 @@ class vecset {
 
 public:
 
+
   typedef typename storage::allocator_type         allocator_type ;
-  typedef typename allocator_type::reference       reference ;
-  typedef typename allocator_type::const_reference const_reference ;
-  typedef typename allocator_type::pointer         pointer ;
-  typedef typename allocator_type::const_pointer   const_pointer ;
   typedef typename storage::size_type              size_type ;
   typedef typename storage::difference_type        difference_type ;
   typedef typename storage::iterator		   iterator ;

From 8e12ab3f89b6115754f7b1ae7f64fd61bc73beeb Mon Sep 17 00:00:00 2001
From: tcclevenger <tccleve@sandia.gov>
Date: Tue, 23 Aug 2022 16:12:23 -0600
Subject: [PATCH 117/130] fix scratch typos

---
 packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
index 724f5f858aad..701256680171 100644
--- a/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
+++ b/packages/tpetra/core/src/Tpetra_BlockCrsMatrix_def.hpp
@@ -2773,10 +2773,10 @@ class GetLocalDiagCopy {
     {
       using policy_type = Kokkos::TeamPolicy<host_exec>;
       size_t scratch_per_row = sizeof(GO) * maxRowNumEnt + sizeof (LO) * maxRowNumEnt + numBytesPerValue * maxRowNumScalarEnt
-        + 2 * sizeof(GO) // Yeah, this is a fudge factor
+        + 2 * sizeof(GO); // Yeah, this is a fudge factor
 
       const auto policy = policy_type (numImportLIDs, 1, 1)     
-        .set_scratch_size (0, Kokkos::PerTeam (scratch_size_per_row);
+        .set_scratch_size (0, Kokkos::PerTeam (scratch_per_row));
       using host_scratch_space = typename host_exec::scratch_memory_space;
       
       using pair_type = Kokkos::pair<size_t, size_t>;

From 9dd5c7f1167680eb242b149b35fd7d9087d72ff8 Mon Sep 17 00:00:00 2001
From: luz paz <luzpaz@pm.me>
Date: Fri, 19 Aug 2022 21:26:59 -0400
Subject: [PATCH 118/130] Fix typos in some docs

Found via `codespell -q 3 -S ./packages,./commonTools/gtest`
---
 INSTALL.rst                                        |  2 +-
 .../memo/SMemo_PListDoc.tex                        |  2 +-
 doc/DocumentingParameterLists/memo/smemo.cls       |  6 +++---
 doc/build_docs.pl                                  |  2 +-
 doc/build_ref/TrilinosBuildReferenceTemplate.rst   | 14 +++++++-------
 5 files changed, 13 insertions(+), 13 deletions(-)

diff --git a/INSTALL.rst b/INSTALL.rst
index 4bd0faccdb87..65abe7aacf82 100644
--- a/INSTALL.rst
+++ b/INSTALL.rst
@@ -93,7 +93,7 @@ Intermediate MPI instructions (enables a few packages)
   make -j<n> install
 
 
-Intermediate MPI instructions (enables a few packages, explict compilers)
+Intermediate MPI instructions (enables a few packages, explicit compilers)
 -------------------------------------------------------------------------
 
 ::
diff --git a/doc/DocumentingParameterLists/memo/SMemo_PListDoc.tex b/doc/DocumentingParameterLists/memo/SMemo_PListDoc.tex
index 92a4a30c7e5c..f7214e45483d 100644
--- a/doc/DocumentingParameterLists/memo/SMemo_PListDoc.tex
+++ b/doc/DocumentingParameterLists/memo/SMemo_PListDoc.tex
@@ -30,7 +30,7 @@
     \from{Bill Spotz, Org 1446; Dena Vigil, Org 1441}
 
     % Fill in a subject
-    \subject{How to Document \texttt{Teuchos::ParameterList}s with collapsable HTML}
+    \subject{How to Document \texttt{Teuchos::ParameterList}s with collapsible HTML}
 
 
diff --git a/doc/DocumentingParameterLists/memo/smemo.cls b/doc/DocumentingParameterLists/memo/smemo.cls
index 71c958daf00b..ed2f3ac9f6d6 100644
--- a/doc/DocumentingParameterLists/memo/smemo.cls
+++ b/doc/DocumentingParameterLists/memo/smemo.cls
@@ -918,7 +918,7 @@
 %    ****************************************
 %
 %  The distribution environment switches to two column mode if necessary,
-%  shrinks up the \baselineskip and \parskip, allowing disribution list
+%  shrinks up the \baselineskip and \parskip, allowing distribution list
 %  to be set in a minimal amount of space.
 
 \def\distribution#1{%
@@ -1029,8 +1029,8 @@
 % of counter CTR.  It is defined in terms of the following macros:
 %
 %  \arabic{COUNTER} : The value of COUNTER printed as an arabic numeral.
-%  \roman{COUNTER}  : Its value printed as a lower-case roman numberal.
-%  \Roman{COUNTER}  : Its value printed as an upper-case roman numberal.
+%  \roman{COUNTER}  : Its value printed as a lower-case roman numeral.
+%  \Roman{COUNTER}  : Its value printed as an upper-case roman numeral.
 %  \alph{COUNTER}   : Value of COUNTER printed as a lower-case letter:
 %                         1 = a, 2 = b, etc.
 %  \Alph{COUNTER}   : Value of COUNTER printed as an upper-case letter:
diff --git a/doc/build_docs.pl b/doc/build_docs.pl
index 3efb64e550d7..8fc3769079ec 100755
--- a/doc/build_docs.pl
+++ b/doc/build_docs.pl
@@ -3,7 +3,7 @@
 ###############################################################################
 # Trilinos/doc/build_docs.pl
 #
-# - You must run this script from this directoy!
+# - You must run this script from this directory!
 # - Run any build_docs in any doc directory
 # - Create html file with links to each set of documentation
 #
diff --git a/doc/build_ref/TrilinosBuildReferenceTemplate.rst b/doc/build_ref/TrilinosBuildReferenceTemplate.rst
index 488087a4ba95..6dd71d06903c 100644
--- a/doc/build_ref/TrilinosBuildReferenceTemplate.rst
+++ b/doc/build_ref/TrilinosBuildReferenceTemplate.rst
@@ -48,17 +48,17 @@ various Trilinos packages can be enabled using the following options:
 
   ``-DTrilinos_ENABLE_FLOAT=ON``
 
-    Enables suppport and explicit instantiations for the ``float`` scalar
+    Enables support and explicit instantiations for the ``float`` scalar
     data-type in all supported Trilinos packages.
 
   ``-DTrilinos_ENABLE_COMPLEX=ON``
 
-    Enables suppport and explicit instantiations for the ``std::complex<T>``
+    Enables support and explicit instantiations for the ``std::complex<T>``
     scalar data-type in all supported Trilinos packages.
 
   ``-DTrilinos_ENABLE_COMPLEX_FLOAT=ON``
 
-    Enables suppport and explicit instantiations for the
+    Enables support and explicit instantiations for the
     ``std::complex<float>`` scalar data-type in all supported Trilinos
     packages.  This is set to ``ON`` by default when
     ``-DTrilinos_ENABLE_FLOAT=ON`` and ``-DTrilinos_ENABLE_COMPLEX=ON`` are
@@ -66,7 +66,7 @@ various Trilinos packages can be enabled using the following options:
 
   ``-DTrilinos_ENABLE_COMPLEX_DOUBLE=ON``
 
-    Enables suppport and explicit instantiations for the
+    Enables support and explicit instantiations for the
     ``std::complex<double>`` scalar data-type in all supported Trilinos
     packages.  This is set to ``ON`` by default when
     ``-DTrilinos_ENABLE_COMPLEX=ON`` is set.
@@ -125,7 +125,7 @@ target machine.  These build-related flags are selected to create correct and
 perforamnt code and for C++ software that uses Kokkos.
 
 ============================    ======================================
-Functionality                   CMake Cache Varaible
+Functionality                   CMake Cache Variable
 ============================    ======================================
 Specify architecture            ``KOKKOS_ARCH``
 Debug builds                    ``KOKKOS_DEBUG``
@@ -218,7 +218,7 @@ Addressing problems with large builds of Trilinos
 -------------------------------------------------
 
 Trilinos is a large collection of complex software.  Depending on what gets
-enbaled when building Trlinos, one can experience build and installation
+enabled when building Trlinos, one can experience build and installation
 problems due to this large size.
 
 When running into problems like these, the first thing that should be tried is
@@ -289,7 +289,7 @@ This will do the following:
 
 * Generate wrappers ``build_stats_<op>_wrapper.sh`` for C, C++, and Fortran
   (and for static builds also ``ar``, ``randlib`` and ``ld``) in the build
-  tree that will compute statics as a byproduct of every invocation of these
+  tree that will compute statistics as a byproduct of every invocation of these
   commands.  (The wrappers create a file ``<output-file>.timing`` for every
   generated object, library and executable ``<output-file>`` file.)
 

From 20f48df858ba0ec6962bce2e53314c0875b2b484 Mon Sep 17 00:00:00 2001
From: luz paz <luzpaz@pm.me>
Date: Sat, 20 Aug 2022 07:01:12 -0400
Subject: [PATCH 119/130] Revert incorrect fix in previous commit

---
 doc/build_ref/TrilinosBuildReferenceTemplate.rst | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/doc/build_ref/TrilinosBuildReferenceTemplate.rst b/doc/build_ref/TrilinosBuildReferenceTemplate.rst
index 6dd71d06903c..87841989a7b1 100644
--- a/doc/build_ref/TrilinosBuildReferenceTemplate.rst
+++ b/doc/build_ref/TrilinosBuildReferenceTemplate.rst
@@ -289,7 +289,7 @@ This will do the following:
 
 * Generate wrappers ``build_stats_<op>_wrapper.sh`` for C, C++, and Fortran
   (and for static builds also ``ar``, ``randlib`` and ``ld``) in the build
-  tree that will compute statistics as a byproduct of every invocation of these
+  tree that will compute statics as a byproduct of every invocation of these
   commands.  (The wrappers create a file ``<output-file>.timing`` for every
   generated object, library and executable ``<output-file>`` file.)
 

From 9c5d1119794562a0fc991d84cdb085f451104fb2 Mon Sep 17 00:00:00 2001
From: Roger Pawlowski <rppawlo@sandia.gov>
Date: Wed, 24 Aug 2022 13:04:19 -0600
Subject: [PATCH 120/130] Panzer: move periodic helper typedefs into namespace

---
 .../Panzer_STK_PeriodicBC_Matcher.hpp         | 16 +++++-----
 .../test/periodic_bcs/periodic_search.cpp     | 30 +++++++++----------
 2 files changed, 24 insertions(+), 22 deletions(-)

diff --git a/packages/panzer/adapters-stk/src/stk_interface/Panzer_STK_PeriodicBC_Matcher.hpp b/packages/panzer/adapters-stk/src/stk_interface/Panzer_STK_PeriodicBC_Matcher.hpp
index 0b317a4e9e67..f6181fb59440 100644
--- a/packages/panzer/adapters-stk/src/stk_interface/Panzer_STK_PeriodicBC_Matcher.hpp
+++ b/packages/panzer/adapters-stk/src/stk_interface/Panzer_STK_PeriodicBC_Matcher.hpp
@@ -52,13 +52,6 @@
 
 #ifdef PANZER_HAVE_STKSEARCH
 #include "stk_search/CoarseSearch.hpp"
-// Copied from PeriodicBoundarySearch
-typedef double Scalar;
-typedef stk::search::IdentProc<stk::mesh::EntityKey> SearchId;
-typedef stk::search::Sphere<Scalar> Sphere;
-typedef std::vector< std::pair<Sphere,SearchId> > SphereIdVector;
-typedef std::vector<std::pair<SearchId,SearchId> > SearchPairVector;
-typedef std::vector<std::pair<stk::mesh::EntityKey,stk::mesh::EntityKey> > SearchPairSet;
 #endif
 
 namespace panzer_stk {
@@ -69,6 +62,15 @@ namespace panzer_stk {
   */
 namespace periodic_helpers {
 
+#ifdef PANZER_HAVE_STKSEARCH
+  // Copied from PeriodicBoundarySearch
+  typedef stk::search::IdentProc<stk::mesh::EntityKey> SearchId;
+  typedef stk::search::Sphere<double> Sphere;
+  typedef std::vector< std::pair<Sphere,SearchId> > SphereIdVector;
+  typedef std::vector<std::pair<SearchId,SearchId> > SearchPairVector;
+  typedef std::vector<std::pair<stk::mesh::EntityKey,stk::mesh::EntityKey> > SearchPairSet;
+#endif
+
    /** Construct the vector pair (similar to <code>getLocallyMatchedPair</code>)
      * usign specified side sets, mesh object, and matcher object. This
      * is primarily a utility function.
diff --git a/packages/panzer/adapters-stk/test/periodic_bcs/periodic_search.cpp b/packages/panzer/adapters-stk/test/periodic_bcs/periodic_search.cpp
index 64002f04756b..8010a1d8ef70 100644
--- a/packages/panzer/adapters-stk/test/periodic_bcs/periodic_search.cpp
+++ b/packages/panzer/adapters-stk/test/periodic_bcs/periodic_search.cpp
@@ -117,7 +117,7 @@ namespace panzer {
     auto myrank = mesh->getBulkData()->parallel_rank();
 
     panzer_stk::CoordMatcher x_matcher(0);
-    SphereIdVector coordsIds;
+    panzer_stk::periodic_helpers::SphereIdVector coordsIds;
     auto error = x_matcher.getAbsoluteTolerance();
     panzer_stk::periodic_helpers::fillLocalSearchVector(*mesh,coordsIds,error,"top","coord");
    
@@ -150,7 +150,7 @@ namespace panzer {
     auto myrank = mesh->getBulkData()->parallel_rank();
 
     panzer_stk::CoordMatcher x_matcher(0);
-    SphereIdVector coordsIds;
+    panzer_stk::periodic_helpers::SphereIdVector coordsIds;
     auto error = x_matcher.getAbsoluteTolerance();
     panzer_stk::periodic_helpers::fillLocalSearchVector(*mesh,coordsIds,error,"top","edge");
    
@@ -185,7 +185,7 @@ namespace panzer {
     auto myrank = mesh->getBulkData()->parallel_rank();
 
     panzer_stk::CoordMatcher x_matcher(0);
-    SphereIdVector coordsIds;
+    panzer_stk::periodic_helpers::SphereIdVector coordsIds;
     auto error = x_matcher.getAbsoluteTolerance();
     panzer_stk::periodic_helpers::fillLocalSearchVector(*mesh,coordsIds,error,"top","face");
 
@@ -250,8 +250,8 @@ namespace panzer {
     TEST_EQUALITY(mesh->getBulkData()->parallel_size(),2);
 
     panzer_stk::CoordMatcher x_matcher(0),y_matcher(1),z_matcher(2);
-    SphereIdVector topCoordsIds,leftCoordsIds,frontCoordsIds;
-    SphereIdVector uniqueLeftCoordsIds,uniqueFrontCoordsIds;
+    panzer_stk::periodic_helpers::SphereIdVector topCoordsIds,leftCoordsIds,frontCoordsIds;
+    panzer_stk::periodic_helpers::SphereIdVector uniqueLeftCoordsIds,uniqueFrontCoordsIds;
     auto error = x_matcher.getAbsoluteTolerance();
 
     // first get all the ids on each face
@@ -261,7 +261,7 @@ namespace panzer {
 
     // now only get ids if they have not already been found
     std::vector<std::vector<std::string> > matchedSides(3);
-    std::vector<SearchId> doubleRequestsL, doubleRequestsF;
+    std::vector<panzer_stk::periodic_helpers::SearchId> doubleRequestsL, doubleRequestsF;
     matchedSides[0].push_back("top");
     panzer_stk::periodic_helpers::fillLocalSearchVector(*mesh,uniqueLeftCoordsIds,error,"left","coord",false,matchedSides[0],doubleRequestsL);
     matchedSides[0].push_back("left");
@@ -430,7 +430,7 @@ namespace panzer {
      panzer_stk::CoordMatcher x_matcher(0);
      panzer_stk::CoordMatcher y_matcher(1);
 
-     SphereIdVector bottom, left;
+     panzer_stk::periodic_helpers::SphereIdVector bottom, left;
 
      // create lines of points to be shifted
 
@@ -438,7 +438,7 @@ namespace panzer {
 
      stk::mesh::EntityId id(0); // doesnt matter
      stk::mesh::EntityKey key(stk::topology::NODE_RANK,id); // doesnt matter
-     SearchId search_id(key,0); // doesnt matter
+     panzer_stk::periodic_helpers::SearchId search_id(key,0); // doesnt matter
      for (size_t n=0; n<nPoints; ++n) {
        stk::search::Point<double> yCenter(0,n,0);
        stk::search::Point<double> xCenter(n,0,0); 
@@ -474,7 +474,7 @@ namespace panzer {
      panzer_stk::PlaneMatcher yz_matcher(1,2);
      panzer_stk::PlaneMatcher xz_matcher(0,2);
 
-     SphereIdVector xy, yz, xz;
+     panzer_stk::periodic_helpers::SphereIdVector xy, yz, xz;
 
      // create planes of points to be shifted
 
@@ -482,7 +482,7 @@ namespace panzer {
 
      stk::mesh::EntityId id(0); // doesnt matter
      stk::mesh::EntityKey key(stk::topology::NODE_RANK,id); // doesnt matter
-     SearchId search_id(key,0); // doesnt matter
+     panzer_stk::periodic_helpers::SearchId search_id(key,0); // doesnt matter
      for (size_t i=0; i<nPoints; ++i) {
        for (size_t j=0; j<nPoints; ++j) {
          stk::search::Point<double> xyCenter(i,j,0);
@@ -546,7 +546,7 @@ namespace panzer {
      panzer_stk::QuarterPlaneMatcher xzY_matcher(0,2,1);
      panzer_stk::QuarterPlaneMatcher yxZ_matcher(1,0,2);
 
-     SphereIdVector yz,zx,zy,xz;
+     panzer_stk::periodic_helpers::SphereIdVector yz,zx,zy,xz;
 
      // create planes of points to be shifted (these are side B's)
 
@@ -554,7 +554,7 @@ namespace panzer {
 
      stk::mesh::EntityId id(0); // doesnt matter
      stk::mesh::EntityKey key(stk::topology::NODE_RANK,id); // doesnt matter
-     SearchId search_id(key,0); // doesnt matter
+     panzer_stk::periodic_helpers::SearchId search_id(key,0); // doesnt matter
      for (size_t i=0; i<nPoints; ++i) {
        for (size_t j=0; j<nPoints; ++j) {
          stk::search::Point<double> yzCenter(0,i,j); 
@@ -633,7 +633,7 @@ namespace panzer {
      panzer_stk::WedgeMatcher YZ_matcher(panzer_stk::WedgeMatcher::MirrorPlane::YZ_PLANE,params);
      panzer_stk::WedgeMatcher XZ_matcher(panzer_stk::WedgeMatcher::MirrorPlane::XZ_PLANE,params);
 
-     SphereIdVector YZ_sideB, XZ_sideB;
+     panzer_stk::periodic_helpers::SphereIdVector YZ_sideB, XZ_sideB;
 
      // create planes of points to be shifted (these are side B's)
 
@@ -641,7 +641,7 @@ namespace panzer {
 
      stk::mesh::EntityId id(0); // doesnt matter
      stk::mesh::EntityKey key(stk::topology::NODE_RANK,id); // doesnt matter
-     SearchId search_id(key,0); // doesnt matter
+     panzer_stk::periodic_helpers::SearchId search_id(key,0); // doesnt matter
      // we will create planes with corners (0,0,0) (1,1,0) (1,1,1) (0,0,1) 
      for (size_t i=0; i<nPoints; ++i) {
        for (size_t j=0; j<nPoints; ++j) {
@@ -727,7 +727,7 @@ namespace panzer {
     Teuchos::RCP<std::vector<std::pair<std::size_t,std::size_t> > > globallyMatchedIds_edge
           = panzer_stk::periodic_helpers::matchPeriodicSidesSearch("left","right",*mesh,matcher,"edge");
 
-    SphereIdVector leftCoordsIds_edge,rightCoordsIds_edge;
+    panzer_stk::periodic_helpers::SphereIdVector leftCoordsIds_edge,rightCoordsIds_edge;
     auto error = matcher.getAbsoluteTolerance();
     panzer_stk::periodic_helpers::fillLocalSearchVector(*mesh,leftCoordsIds_edge,error,"left","edge");
     panzer_stk::periodic_helpers::fillLocalSearchVector(*mesh,rightCoordsIds_edge,error,"right","edge");

From 54277ecd54e1781eaab6224546d291e3c335d46a Mon Sep 17 00:00:00 2001
From: "Roscoe A. Bartlett" <rabartl@sandia.gov>
Date: Wed, 24 Aug 2022 16:28:02 -0600
Subject: [PATCH 121/130] Remove printing of vars that are now empty
 (TriBITSPub/TriBITS#299)

I forgot to remove these vars in Trilinos PR #10813.  They should not be
printed anymore because they should not be used anymore.
---
 demos/simpleBuildAgainstTrilinos/CMakeLists.txt | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/demos/simpleBuildAgainstTrilinos/CMakeLists.txt b/demos/simpleBuildAgainstTrilinos/CMakeLists.txt
index 23c4f2e34ea9..bf9450b1c063 100644
--- a/demos/simpleBuildAgainstTrilinos/CMakeLists.txt
+++ b/demos/simpleBuildAgainstTrilinos/CMakeLists.txt
@@ -22,11 +22,8 @@ MESSAGE("   Trilinos_VERSION = ${Trilinos_VERSION}")
 MESSAGE("   Trilinos_PACKAGE_LIST = ${Trilinos_PACKAGE_LIST}")
 MESSAGE("   Trilinos_LIBRARIES = ${Trilinos_LIBRARIES}")
 MESSAGE("   Trilinos_INCLUDE_DIRS = ${Trilinos_INCLUDE_DIRS}")
-MESSAGE("   Trilinos_LIBRARY_DIRS = ${Trilinos_LIBRARY_DIRS}")
 MESSAGE("   Trilinos_TPL_LIST = ${Trilinos_TPL_LIST}")
-MESSAGE("   Trilinos_TPL_INCLUDE_DIRS = ${Trilinos_TPL_INCLUDE_DIRS}")
 MESSAGE("   Trilinos_TPL_LIBRARIES = ${Trilinos_TPL_LIBRARIES}")
-MESSAGE("   Trilinos_TPL_LIBRARY_DIRS = ${Trilinos_TPL_LIBRARY_DIRS}")
 MESSAGE("   Trilinos_BUILD_SHARED_LIBS = ${Trilinos_BUILD_SHARED_LIBS}")
 MESSAGE("End of Trilinos details\n")
 

From 3663abb97e8e684f5028bcaad577b871177d5d9d Mon Sep 17 00:00:00 2001
From: "Roscoe A. Bartlett" <rabartl@sandia.gov>
Date: Tue, 23 Aug 2022 12:43:41 -0600
Subject: [PATCH 122/130] Pliris: Remove local var hiding cache var
 Pliris_ENABLE_DREAL (#10774, TriBITSPub/TriBITS#516)

A TriBITS update is exporting package cache vars to the <Package>Config.cmake
file and you can't have a local var with the same name as a cache var with
different values.

In this case, it was just lucky that no downstream package was reading this
var (through the cache var) because they would have gotten the wrong value.
It seems that only code in CMakeLists.txt files under packages/pliris/ were
reading this var.
---
 packages/pliris/CMakeLists.txt | 18 +++++++++---------
 1 file changed, 9 insertions(+), 9 deletions(-)

diff --git a/packages/pliris/CMakeLists.txt b/packages/pliris/CMakeLists.txt
index 738a4416edd3..c03d1d7390fe 100644
--- a/packages/pliris/CMakeLists.txt
+++ b/packages/pliris/CMakeLists.txt
@@ -20,11 +20,6 @@ TRIBITS_ADD_OPTION_AND_DEFINE(${PACKAGE_NAME}_ENABLE_SCPLX
   "Enable single precision complex functionality."
   OFF )
 
-TRIBITS_ADD_OPTION_AND_DEFINE(${PACKAGE_NAME}_ENABLE_DREAL
-  DREAL
-  "Set reals to double precision."
-  OFF )
-
 TRIBITS_ADD_OPTION_AND_DEFINE(${PACKAGE_NAME}_ENABLE_SREAL
   SREAL
   "Set reals to single precision."
@@ -37,11 +32,16 @@ TRIBITS_ADD_OPTION_AND_DEFINE(${PACKAGE_NAME}_ENABLE_SREAL
 #If no options are specified set DREAL as the default
 IF(NOT ${PACKAGE_NAME}_ENABLE_ZCPLX AND
    NOT ${PACKAGE_NAME}_ENABLE_SCPLX AND
-   NOT ${PACKAGE_NAME}_ENABLE_SREAL AND
-   NOT ${PACKAGE_NAME}_ENABLE_DREAL)
-
-  SET(${PACKAGE_NAME}_ENABLE_DREAL ON)
+   NOT ${PACKAGE_NAME}_ENABLE_SREAL
+  )
+  SET(${PACKAGE_NAME}_ENABLE_DREAL_DEFAULT ON)
+ELSE()
+  SET(${PACKAGE_NAME}_ENABLE_DREAL_DEFAULT OFF)
 ENDIF()
+TRIBITS_ADD_OPTION_AND_DEFINE(${PACKAGE_NAME}_ENABLE_DREAL
+  DREAL
+  "Set reals to double precision."
+  ${${PACKAGE_NAME}_ENABLE_DREAL_DEFAULT} )
 
 ADD_SUBDIRECTORY(src)
 

From d03c5842af4a9d6bce3ef86ef10f2a596ef220cf Mon Sep 17 00:00:00 2001
From: "Roscoe A. Bartlett" <rabartl@sandia.gov>
Date: Wed, 24 Aug 2022 16:22:49 -0600
Subject: [PATCH 123/130] Change cmake_minimum_required() from 3.17.1 to 3.0
 (TriBITSPUb/TriBITS#522)

This is to simulate external projects that call find_package(Trilinos) that
may require an older version of CMake than that is required by
Trilinos/TriBITS.

NOTE: This exposes the error:

---------------------------------------------

CMake Warning (dev) at /ascldap/users/rabartl/Trilinos.base/BUILDS/PR/clang-10.0.0/install/lib/cmake/Kokkos/KokkosConfig.cmake:197 (IF):
  Policy CMP0057 is not set: Support new IN_LIST if() operator.  Run "cmake
  --help-policy CMP0057" for policy details.  Use the cmake_policy command to
  set the policy and suppress this warning.

  IN_LIST will be interpreted as an operator when the policy is set to NEW.
  Since the policy is not set the OLD behavior will be used.
Call Stack (most recent call first):
  /ascldap/users/rabartl/Trilinos.base/BUILDS/PR/clang-10.0.0/install/lib/cmake/Trilinos/TrilinosConfig.cmake:114 (include)
  CMakeLists.txt:8 (find_package)
This warning is for project developers.  Use -Wno-dev to suppress it.

CMake Error at /ascldap/users/rabartl/Trilinos.base/BUILDS/PR/clang-10.0.0/install/lib/cmake/Kokkos/KokkosConfig.cmake:197 (IF):
  if given arguments:

    "Kokkos_ENABLE_THREADS" "AND" "NOT" "DEPRECATED_CODE_3" "IN_LIST" "Kokkos_OPTIONS"

  Unknown arguments specified
Call Stack (most recent call first):
  /ascldap/users/rabartl/Trilinos.base/BUILDS/PR/clang-10.0.0/install/lib/cmake/Trilinos/TrilinosConfig.cmake:114 (include)
  CMakeLists.txt:8 (find_package)

-- Configuring incomplete, errors occurred!

---------------------------------------------

reported in trilinos/Trilinos#10456 and TRILINOSHD-128

In a later commit, we will update the version of TriBITS that addresses this.
---
 demos/simpleBuildAgainstTrilinos/CMakeLists.txt              | 2 +-
 .../find_package_Trilinos/CMakeLists.txt                     | 5 ++++-
 2 files changed, 5 insertions(+), 2 deletions(-)

diff --git a/demos/simpleBuildAgainstTrilinos/CMakeLists.txt b/demos/simpleBuildAgainstTrilinos/CMakeLists.txt
index bf9450b1c063..990287789e66 100644
--- a/demos/simpleBuildAgainstTrilinos/CMakeLists.txt
+++ b/demos/simpleBuildAgainstTrilinos/CMakeLists.txt
@@ -1,6 +1,6 @@
 # CMAKE File for "MyApp" application building against an installed Trilinos
 
-cmake_minimum_required(VERSION 3.17.1)
+cmake_minimum_required(VERSION 3.0)
 
 # Declare project but don't process compilers yet
 #
diff --git a/packages/TrilinosInstallTests/find_package_Trilinos/CMakeLists.txt b/packages/TrilinosInstallTests/find_package_Trilinos/CMakeLists.txt
index 65661f2b7d3d..4b4d8cb0f549 100644
--- a/packages/TrilinosInstallTests/find_package_Trilinos/CMakeLists.txt
+++ b/packages/TrilinosInstallTests/find_package_Trilinos/CMakeLists.txt
@@ -1,4 +1,7 @@
-cmake_minimum_required(VERSION 3.17)
+cmake_minimum_required(VERSION 3.0)
+
+# Disable Kokkos warning about not supporting C++ extensions
+set(CMAKE_CXX_EXTENSIONS OFF)
 
 project(find_package_Trilinos NONE)
 

From 2604374bffff29b3b17b30979b2ac48c081d919d Mon Sep 17 00:00:00 2001
From: "Roscoe A. Bartlett" <rabartl@sandia.gov>
Date: Wed, 24 Aug 2022 20:48:04 -0600
Subject: [PATCH 124/130] Automatic snapshot commit from tribits at ab419429

Origin repo remote tracking branch: 'github/master'
Origin repo remote repo URL: 'github = git@github.com:TriBITSPub/TriBITS.git'
Git describe: Vera4.0-RC1-start-1263-g8817a8f9

At commit:

commit ab41942990e8d3655463551036a979c674b27fcc
Author:  Roscoe A. Bartlett <rabartl@sandia.gov>
Date:    Wed Aug 24 16:50:38 2022 -0600
Summary: Add version check and calls to cmake_minimum_required() (#522)
---
 cmake/tribits/CHANGELOG.md                    |  21 ++-
 cmake/tribits/common_tpls/FindTPLNetcdf.cmake |   2 +-
 .../common_tpls/find_modules/FindHDF5.cmake   |  18 +--
 .../common_tpls/find_modules/FindNetCDF.cmake |  24 ++--
 .../TribitsPackageConfigTemplate.cmake.in     |   9 ++
 .../TribitsProjectConfigTemplate.cmake.in     |   9 ++
 .../package_arch/TribitsAddAdvancedTest.cmake |  18 +--
 .../core/package_arch/TribitsAddLibrary.cmake |   6 +-
 .../TribitsAddOptionAndDefine.cmake           |  19 ++-
 .../core/package_arch/TribitsAddTest.cmake    |   4 +-
 .../package_arch/TribitsAddTestHelpers.cmake  |   4 +-
 .../TribitsAdjustPackageEnables.cmake         |  78 +++++++++--
 ...ribitsExternalPackageWriteConfigFile.cmake |   8 +-
 .../package_arch/TribitsGlobalMacros.cmake    |  18 +--
 .../package_arch/TribitsPackageMacros.cmake   | 116 +++++++++-------
 .../TribitsPkgExportCacheVars.cmake           | 130 ++++++++++++++++++
 .../TribitsSubPackageMacros.cmake             |  27 ++--
 ...ribitsTplFindIncludeDirsAndLibraries.cmake |   2 +-
 .../TribitsWriteClientExportFiles.cmake       |  11 +-
 .../TribitsAddDashboardTarget.cmake           |   4 +-
 .../ctest_driver/TribitsCTestDriverCore.cmake |  20 +--
 .../TribitsCTestDriverCoreHelpers.cmake       |  24 ++--
 .../tribits/doc/guides/TribitsGuidesBody.rst  |  26 ++--
 .../TribitsMacroFunctionDocTemplate.rst       |   2 +
 .../examples/TribitsExampleApp/CMakeLists.txt |   3 +
 .../packages/simple_cxx/CMakeLists.txt        |   1 +
 .../packages/with_subpackages/a/A.cpp         |   5 +
 .../packages/with_subpackages/a/A.hpp         |   3 +
 .../with_subpackages/a/CMakeLists.txt         |  12 +-
 .../a/cmake/WithSubpackagesA_config.h.in      |   6 +
 .../with_subpackages/a/tests/CMakeLists.txt   |   1 +
 .../with_subpackages/a/tests/a_test.cpp       |   8 +-
 32 files changed, 461 insertions(+), 178 deletions(-)
 create mode 100644 cmake/tribits/core/package_arch/TribitsPkgExportCacheVars.cmake
 create mode 100644 cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/cmake/WithSubpackagesA_config.h.in

diff --git a/cmake/tribits/CHANGELOG.md b/cmake/tribits/CHANGELOG.md
index de889ddac29c..558c787b124e 100644
--- a/cmake/tribits/CHANGELOG.md
+++ b/cmake/tribits/CHANGELOG.md
@@ -2,6 +2,20 @@
 ChangeLog for TriBITS
 ----------------------------------------
 
+## 2022-08-22:
+
+* **Added:** Added support for exporting cache variables for packages in their
+    `<Package>Config.cmake` files using the new function
+    `tribits_pkg_export_cache_var()`.
+
+## 2022-08-18:
+
+* **Changed:** Made setting parent package tests/examples enable/disable
+  correctly propagate down to subpackages in a more intuitive way (see
+  [TriBITSPub/TriBITS#268](https://github.com/TriBITSPub/TriBITS/issues/268)).
+  This also results in not enabling tests for subpackages that are not
+  explicitly enabled or enabled as part of the forward sweep of packages
+  enables due to `<Project>_ENABLE_ALL_FORWARD_DEP_PACKAGES=ON`.
 
 ## 2022-08-11:
 
@@ -11,13 +25,6 @@ ChangeLog for TriBITS
   and
   [TriBITSPub/TriBITS#510](https://github.com/TriBITSPub/TriBITS/issues/510)).
 
-* **Changed:** Made setting parent package tests/examples enables correctly
-  propagate down to subpackages in a more intuitive way (see
-  [TriBITSPub/TriBITS#268](https://github.com/TriBITSPub/TriBITS/issues/268)).
-  This also results in not enabling tests for subpackages that are not
-  explicitly enabled or enabled as part of the forward sweep of packages
-  enables due to `<Project>_ENABLE_ALL_FORWARD_DEP_PACKAGES=ON`.
-
 ## 2022-07-20:
 
 * **Changed:** Fixed TriBITS generated and installed `<tplName>Config.cmake`
diff --git a/cmake/tribits/common_tpls/FindTPLNetcdf.cmake b/cmake/tribits/common_tpls/FindTPLNetcdf.cmake
index 9ffd66c06a63..13730f0457eb 100644
--- a/cmake/tribits/common_tpls/FindTPLNetcdf.cmake
+++ b/cmake/tribits/common_tpls/FindTPLNetcdf.cmake
@@ -130,7 +130,7 @@ if ("${TPL_Netcdf_PARALLEL}" STREQUAL "")
       string(REGEX MATCH "[01]" netcdf_par_val "${netcdf_par_string}")
       if (netcdf_par_val EQUAL 1)
          set(TPL_Netcdf_PARALLEL True CACHE INTERNAL
-	     "True if netcdf compiled with parallel enabled")
+             "True if netcdf compiled with parallel enabled")
       endif()
    endif()
    if ("${TPL_Netcdf_PARALLEL}" STREQUAL "")
diff --git a/cmake/tribits/common_tpls/find_modules/FindHDF5.cmake b/cmake/tribits/common_tpls/find_modules/FindHDF5.cmake
index bed6cb04b1ca..1ec93541032f 100644
--- a/cmake/tribits/common_tpls/find_modules/FindHDF5.cmake
+++ b/cmake/tribits/common_tpls/find_modules/FindHDF5.cmake
@@ -389,10 +389,10 @@ else()
 
       foreach( _component ${HDF5_VALID_COMPONENTS} )
         set(target ${HDF5_${_component}_TARGET})
-	if ( TARGET ${target} )
-	  set(HDF5_${_component}_LIBRARY ${target})
-	  list(APPEND HDF5_LIBRARIES ${HDF5_${_component}_LIBRARY})
-	endif()  
+        if ( TARGET ${target} )
+          set(HDF5_${_component}_LIBRARY ${target})
+          list(APPEND HDF5_LIBRARIES ${HDF5_${_component}_LIBRARY})
+        endif()  
       endforeach()
 
       # Define HDF5_C_LIBRARIES to contain hdf5 and hdf5_hl C libraries
@@ -470,7 +470,7 @@ else()
                          LOCATION ${_HDF5_C_LIBRARY}
                          LINK_LANGUAGES "C"
                          LINK_INTERFACE_LIBRARIES "${HDF5_LINK_LIBRARIES}")
-    set(HDF5_C_LIBRARY ${HDF5_C_TARGET})		       
+    set(HDF5_C_LIBRARY ${HDF5_C_TARGET})                       
 
     # --- Search for the other possible component libraries
 
@@ -495,7 +495,7 @@ else()
     # Define the HDF5_<component>_LIBRARY to point to the target
     foreach ( _component ${HDF5_VALID_COMPONENTS} )
       if ( TARGET ${HDF5_${_component}_TARGET} )
-	set(HDF5_${_component}_LIBRARY ${HDF5_${_component}_TARGET})
+        set(HDF5_${_component}_LIBRARY ${HDF5_${_component}_TARGET})
       endif()
     endforeach()
 
@@ -513,7 +513,7 @@ else()
     set(HDF5_LIBRARIES)
     foreach (_component ${HDF5_VALID_COMPONENTS})
       if ( TARGET ${HDF5_${_component}_TARGET} )
-	list(APPEND HDF5_LIBRARIES ${_HDF5_${_component}_LIBRARY})
+        list(APPEND HDF5_LIBRARIES ${_HDF5_${_component}_LIBRARY})
       endif()
     endforeach()
     list(APPEND HDF5_LIBRARIES ${HDF5_LINK_LIBRARIES})      
@@ -581,8 +581,8 @@ if ( NOT HDF5_FIND_QUIETLY )
   set(HDF5_COMPONENTS_NOTFOUND)
   foreach (_component ${HDF5_VALID_COMPONENTS} )
     if ( HDF5_${_component}_FOUND )
-	#message(STATUS "\t  HDF5_${_component}_LIBRARY\t\t=${HDF5_${_component}_LIBRARY}")
-	message(STATUS "\t${HDF5_${_component}_LIBRARY}")
+        #message(STATUS "\t  HDF5_${_component}_LIBRARY\t\t=${HDF5_${_component}_LIBRARY}")
+        message(STATUS "\t${HDF5_${_component}_LIBRARY}")
     else()   
       list(APPEND HDF5_COMPONENTS_NOTFOUND ${_component})
     endif()
diff --git a/cmake/tribits/common_tpls/find_modules/FindNetCDF.cmake b/cmake/tribits/common_tpls/find_modules/FindNetCDF.cmake
index 960088f3e4cf..1e97c3e237bc 100644
--- a/cmake/tribits/common_tpls/find_modules/FindNetCDF.cmake
+++ b/cmake/tribits/common_tpls/find_modules/FindNetCDF.cmake
@@ -186,21 +186,21 @@ else(NetCDF_LIBRARIES AND NetCDF_INCLUDE_DIRS)
             set(NetCDF_LARGE_DIMS FALSE)
         endif()
 
-	set(NetCDF_PARALLEL False)
+        set(NetCDF_PARALLEL False)
         find_path(meta_path
-	          NAMES "netcdf_meta.h"
+                  NAMES "netcdf_meta.h"
                   HINTS ${NetCDF_INCLUDE_DIR}
                   NO_DEFAULT_PATH)
         if(meta_path)
-	   # Search meta for NC_HAS_PARALLEL setting...
-	   # Note that there is both NC_HAS_PARALLEL4 and NC_HAS_PARALLEL, only want NC_HAS_PARALLEL
-	   # so add a space to end to avoid getting NC_HAS_PARALLEL4
-	   file(STRINGS "${meta_path}/netcdf_meta.h" netcdf_par_string REGEX "NC_HAS_PARALLEL ")
-	   string(REGEX REPLACE "[^0-9]" "" netcdf_par_val "${netcdf_par_string}")
-	   # NOTE: The line for NC_HAS_PARALLEL has an hdf5 string in it which results
+           # Search meta for NC_HAS_PARALLEL setting...
+           # Note that there is both NC_HAS_PARALLEL4 and NC_HAS_PARALLEL, only want NC_HAS_PARALLEL
+           # so add a space to end to avoid getting NC_HAS_PARALLEL4
+           file(STRINGS "${meta_path}/netcdf_meta.h" netcdf_par_string REGEX "NC_HAS_PARALLEL ")
+           string(REGEX REPLACE "[^0-9]" "" netcdf_par_val "${netcdf_par_string}")
+           # NOTE: The line for NC_HAS_PARALLEL has an hdf5 string in it which results
            #       netcdf_par_val being set to 05 or 15 above...
-	   if (netcdf_par_val EQUAL 15)
-	      set(NetCDF_PARALLEL True)
+           if (netcdf_par_val EQUAL 15)
+              set(NetCDF_PARALLEL True)
            endif()    
         endif()
 
@@ -291,8 +291,8 @@ else(NetCDF_LIBRARIES AND NetCDF_INCLUDE_DIRS)
         message(STATUS "\tNetCDF_ROOT is ${NetCDF_ROOT}")
         find_program(netcdf_config nc-config 
                        PATHS ${NetCDF_ROOT}/bin ${NetCDF_BIN_DIR}
-		       NO_DEFAULT_PATH
-		       NO_CMAKE_SYSTEM_PATH
+                       NO_DEFAULT_PATH
+                       NO_CMAKE_SYSTEM_PATH
                        DOC "NetCDF configuration script")
 
         if (netcdf_config)
diff --git a/cmake/tribits/core/installation/TribitsPackageConfigTemplate.cmake.in b/cmake/tribits/core/installation/TribitsPackageConfigTemplate.cmake.in
index 15025561c294..abfb2f4360bc 100644
--- a/cmake/tribits/core/installation/TribitsPackageConfigTemplate.cmake.in
+++ b/cmake/tribits/core/installation/TribitsPackageConfigTemplate.cmake.in
@@ -45,6 +45,15 @@
 #
 ##############################################################################
 
+if(CMAKE_VERSION VERSION_LESS 3.3)
+  set(${PDOLLAR}{CMAKE_FIND_PACKAGE_NAME}_NOT_FOUND_MESSAGE
+    "${PACKAGE_NAME} requires CMake 3.3 or later for 'if (... IN_LIST ...)'"
+    )
+  set(${PDOLLAR}{CMAKE_FIND_PACKAGE_NAME}_FOUND FALSE)
+  return()
+endif()
+cmake_minimum_required(VERSION 3.3...${CMAKE_VERSION})
+
 ## ---------------------------------------------------------------------------
 ## Compilers used by ${PROJECT_NAME}/${PACKAGE_NAME} build
 ## ---------------------------------------------------------------------------
diff --git a/cmake/tribits/core/installation/TribitsProjectConfigTemplate.cmake.in b/cmake/tribits/core/installation/TribitsProjectConfigTemplate.cmake.in
index 5872986017f6..cdd3ee08c70f 100644
--- a/cmake/tribits/core/installation/TribitsProjectConfigTemplate.cmake.in
+++ b/cmake/tribits/core/installation/TribitsProjectConfigTemplate.cmake.in
@@ -46,6 +46,15 @@
 #
 ##############################################################################
 
+if(CMAKE_VERSION VERSION_LESS 3.3)
+  set(${PDOLLAR}{CMAKE_FIND_PACKAGE_NAME}_NOT_FOUND_MESSAGE
+    "${PROJECT_NAME} requires CMake 3.3 or later for 'if (... IN_LIST ...)'"
+    )
+  set(${PDOLLAR}{CMAKE_FIND_PACKAGE_NAME}_FOUND FALSE)
+  return()
+endif()
+cmake_minimum_required(VERSION 3.3...${CMAKE_VERSION})
+
 ## ---------------------------------------------------------------------------
 ## Compilers used by ${PROJECT_NAME} build
 ## ---------------------------------------------------------------------------
diff --git a/cmake/tribits/core/package_arch/TribitsAddAdvancedTest.cmake b/cmake/tribits/core/package_arch/TribitsAddAdvancedTest.cmake
index 3f4d02a35ac4..2f4928c8f0b8 100644
--- a/cmake/tribits/core/package_arch/TribitsAddAdvancedTest.cmake
+++ b/cmake/tribits/core/package_arch/TribitsAddAdvancedTest.cmake
@@ -1097,7 +1097,7 @@ function(tribits_add_advanced_test TEST_NAME_IN)
          ""
          # multi_value_keywords
          "COPY_FILES_TO_TEST_DIR;SOURCE_DIR;DEST_DIR" 
-	 # Arguments to parse
+         # Arguments to parse
          ${PARSE_TEST_${TEST_CMND_IDX}}
          )
       tribits_check_for_unparsed_arguments()
@@ -1113,20 +1113,20 @@ function(tribits_add_advanced_test TEST_NAME_IN)
       # Parse TEST_<IDX> block args for types EXEC and CMND
 
       set(testBlockOptionsList  NOEXEPREFIX  NOEXESUFFIX  NO_ECHO_OUTPUT  PASS_ANY
-	STANDARD_PASS_OUTPUT  ALWAYS_FAIL_ON_NONZERO_RETURN  ALWAYS_FAIL_ON_ZERO_RETURN
-	WILL_FAIL  ADD_DIR_TO_NAME  SKIP_CLEAN_WORKING_DIRECTORY
+        STANDARD_PASS_OUTPUT  ALWAYS_FAIL_ON_NONZERO_RETURN  ALWAYS_FAIL_ON_ZERO_RETURN
+        WILL_FAIL  ADD_DIR_TO_NAME  SKIP_CLEAN_WORKING_DIRECTORY
         )
 
       set(testBlockMultiValueKeywordsList  EXEC  CMND  ARGS  DIRECTORY  MESSAGE
-	WORKING_DIRECTORY  OUTPUT_FILE  NUM_MPI_PROCS  NUM_TOTAL_CORES_USED
-	PASS_REGULAR_EXPRESSION_ALL  FAIL_REGULAR_EXPRESSION  PASS_REGULAR_EXPRESSION
-	)
+        WORKING_DIRECTORY  OUTPUT_FILE  NUM_MPI_PROCS  NUM_TOTAL_CORES_USED
+        PASS_REGULAR_EXPRESSION_ALL  FAIL_REGULAR_EXPRESSION  PASS_REGULAR_EXPRESSION
+        )
 
       cmake_parse_arguments(
          PARSE  #prefix
-	 "${testBlockOptionsList}"
-	 ""     # one_value_keywords
-	 "${testBlockMultiValueKeywordsList}"
+         "${testBlockOptionsList}"
+         ""     # one_value_keywords
+         "${testBlockMultiValueKeywordsList}"
          ${PARSE_TEST_${TEST_CMND_IDX}}
          )
 
diff --git a/cmake/tribits/core/package_arch/TribitsAddLibrary.cmake b/cmake/tribits/core/package_arch/TribitsAddLibrary.cmake
index 26bddd91931e..bb32b1c3ae8e 100644
--- a/cmake/tribits/core/package_arch/TribitsAddLibrary.cmake
+++ b/cmake/tribits/core/package_arch/TribitsAddLibrary.cmake
@@ -701,7 +701,7 @@ function(tribits_add_library_assert_deplibs)
     else()
       message(WARNING "WARNING: The case PARSE_TESTONLY=${PARSE_TESTONLY},"
         " depLibAlreadyInPkgLibs=${depLibAlreadyInPkgLibs},"
-	  " depLibIsTestOnlyLib=${depLibIsTestOnlyLib}, has"
+          " depLibIsTestOnlyLib=${depLibIsTestOnlyLib}, has"
         " not yet been handled!")
     endif()
 
@@ -781,7 +781,7 @@ function(tribits_add_library_determine_install_lib_and_or_headers
     if (${PROJECT_NAME}_VERBOSE_CONFIGURE)
       message("-- " "Skipping installation of headers and libraries"
         " because ${PROJECT_NAME}_INSTALL_LIBRARIES_AND_HEADERS=FALSE and"
-	  " BUILD_SHARED_LIBS=FALSE ...")
+          " BUILD_SHARED_LIBS=FALSE ...")
     endif()
     set(installLib OFF)
     set(installHeaders OFF)
@@ -789,7 +789,7 @@ function(tribits_add_library_determine_install_lib_and_or_headers
     if (${PROJECT_NAME}_VERBOSE_CONFIGURE)
       message("-- " "Skipping installation of headers but installing libraries"
         " because ${PROJECT_NAME}_INSTALL_LIBRARIES_AND_HEADERS=FALSE and"
-	  " BUILD_SHARED_LIBS=TRUE ...")
+        " BUILD_SHARED_LIBS=TRUE ...")
     endif()
     set(installHeaders OFF)
   endif()
diff --git a/cmake/tribits/core/package_arch/TribitsAddOptionAndDefine.cmake b/cmake/tribits/core/package_arch/TribitsAddOptionAndDefine.cmake
index 8c98b1717d74..ea812e51cded 100644
--- a/cmake/tribits/core/package_arch/TribitsAddOptionAndDefine.cmake
+++ b/cmake/tribits/core/package_arch/TribitsAddOptionAndDefine.cmake
@@ -37,12 +37,13 @@
 # ************************************************************************
 # @HEADER
 
+include(TribitsPkgExportCacheVars)
 include(GlobalSet)
 
 
 # @MACRO: tribits_add_option_and_define()
 #
-# Add an option and a define variable in one shot.
+# Add an option and an optional macro define variable in one shot.
 #
 # Usage::
 #
@@ -58,6 +59,18 @@ include(GlobalSet)
 #
 #   #cmakedefine <macroDefineName>
 #
+# NOTE: This also calls `tribits_pkg_export_cache_var()`_ to export the
+# variables ``<userOptionName>`` and ``<macroDefineName>``.  This also
+# requires that local variables with the same names of these cache variables
+# not be assigned with a different value from these cache variables.  If they
+# are, then an error will occur later when these variables are read.
+#
+# NOTE: The define var name ``<macroDefineName>`` can be empty "" in which
+# case all logic related to ``<macroDefineName>`` is skipped.  (But in this
+# case, it would be better to just call::
+#
+#   set(<userOptionName> <defaultValue> CACHE BOOL "<docStr>")
+#
 macro(tribits_add_option_and_define  USER_OPTION_NAME  MACRO_DEFINE_NAME
   DOCSTRING  DEFAULT_VALUE
   )
@@ -70,6 +83,10 @@ macro(tribits_add_option_and_define  USER_OPTION_NAME  MACRO_DEFINE_NAME
       global_set(${MACRO_DEFINE_NAME} OFF)
     endif()
   endif()
+  tribits_pkg_export_cache_var(${USER_OPTION_NAME})
+  if(NOT ${MACRO_DEFINE_NAME} STREQUAL "")
+    tribits_pkg_export_cache_var(${MACRO_DEFINE_NAME})
+  endif()
 endmacro()
 
 # 2008/10/05: rabartl: ToDo: Add an option to automatically add the macro
diff --git a/cmake/tribits/core/package_arch/TribitsAddTest.cmake b/cmake/tribits/core/package_arch/TribitsAddTest.cmake
index bdf500b5bf1b..5853d99a08f6 100644
--- a/cmake/tribits/core/package_arch/TribitsAddTest.cmake
+++ b/cmake/tribits/core/package_arch/TribitsAddTest.cmake
@@ -1009,7 +1009,7 @@ function(tribits_add_test EXE_NAME)
         "${EXECUTABLE_PATH}" "${PARSE_CATEGORIES}"  "${NUM_PROCS_USED}"
         "${NUM_TOTAL_CORES_USED}"
         "${SET_RUN_SERIAL}" "${SET_DISABLED_AND_MSG}" ADDED_TEST_NAME  ${INARGS}
-	"${${TEST_NAME_INSTANCE}_EXTRA_ARGS}" )
+        "${${TEST_NAME_INSTANCE}_EXTRA_ARGS}" )
       if(PARSE_ADDED_TESTS_NAMES_OUT AND ADDED_TEST_NAME)
         list(APPEND ADDED_TESTS_NAMES_OUT ${ADDED_TEST_NAME})
       endif()
@@ -1054,7 +1054,7 @@ function(tribits_add_test EXE_NAME)
         "${EXECUTABLE_PATH}" "${PARSE_CATEGORIES}" "${NUM_PROCS_USED}" 
         "${NUM_TOTAL_CORES_USED}"
         "${SET_RUN_SERIAL}" "${SET_DISABLED_AND_MSG}" ADDED_TEST_NAME  ${INARGS}
-	"${${TEST_NAME_INSTANCE}_EXTRA_ARGS}"
+        "${${TEST_NAME_INSTANCE}_EXTRA_ARGS}"
         )
       if(PARSE_ADDED_TESTS_NAMES_OUT AND ADDED_TEST_NAME)
         list(APPEND ADDED_TESTS_NAMES_OUT ${ADDED_TEST_NAME})
diff --git a/cmake/tribits/core/package_arch/TribitsAddTestHelpers.cmake b/cmake/tribits/core/package_arch/TribitsAddTestHelpers.cmake
index ca8d1b0bd9c8..453de5432672 100644
--- a/cmake/tribits/core/package_arch/TribitsAddTestHelpers.cmake
+++ b/cmake/tribits/core/package_arch/TribitsAddTestHelpers.cmake
@@ -658,10 +658,10 @@ function(tribits_add_test_process_skip_ctest_add_test  ADD_THE_TEST_OUT)
   if(${PACKAGE_NAME}_SKIP_CTEST_ADD_TEST OR ${PARENT_PACKAGE_NAME}_SKIP_CTEST_ADD_TEST)
     if (PARENT_PACKAGE_NAME STREQUAL PACKAGE_NAME)
       set(DISABLE_VAR_MSG
-	"${PACKAGE_NAME}_SKIP_CTEST_ADD_TEST='${${PACKAGE_NAME}_SKIP_CTEST_ADD_TEST}'")
+        "${PACKAGE_NAME}_SKIP_CTEST_ADD_TEST='${${PACKAGE_NAME}_SKIP_CTEST_ADD_TEST}'")
     else()
       set(DISABLE_VAR_MSG
-	"${PARENT_PACKAGE_NAME}_SKIP_CTEST_ADD_TEST='${${PARENT_PACKAGE_NAME}_SKIP_CTEST_ADD_TEST}'")
+        "${PARENT_PACKAGE_NAME}_SKIP_CTEST_ADD_TEST='${${PARENT_PACKAGE_NAME}_SKIP_CTEST_ADD_TEST}'")
     endif()
     message_wrapper(
       "-- ${TEST_NAME}: NOT added test because ${DISABLE_VAR_MSG}!")
diff --git a/cmake/tribits/core/package_arch/TribitsAdjustPackageEnables.cmake b/cmake/tribits/core/package_arch/TribitsAdjustPackageEnables.cmake
index 84a5994320fa..5b26b5549781 100644
--- a/cmake/tribits/core/package_arch/TribitsAdjustPackageEnables.cmake
+++ b/cmake/tribits/core/package_arch/TribitsAdjustPackageEnables.cmake
@@ -999,10 +999,59 @@ macro(tribits_apply_test_example_enables PACKAGE_NAME)
 endmacro()
 
 
-# Macro to set ${TRIBITS_SUBPACKAGE)_ENABLE_TESTS and
+# Macro to disable ${PARENT_PACKAGE_NAME)_ENABLE_ENABLES by default if
+# ${PARENT_PACKAGE_NAME)_ENABLE_TESTS is explicitly disabled.
+#
+macro(tribits_apply_package_examples_disable  PARENT_PACKAGE_NAME)
+  if (NOT "${${PARENT_PACKAGE_NAME}_ENABLE_TESTS}" STREQUAL ""
+    AND NOT ${PARENT_PACKAGE_NAME}_ENABLE_TESTS
+    AND "${${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES}" STREQUAL ""
+    )
+    message("-- " "Setting"
+      " ${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES"
+      "=${${PARENT_PACKAGE_NAME}_ENABLE_TESTS}"
+      " because"
+      " ${PARENT_PACKAGE_NAME}_ENABLE_TESTS"
+      "=${${PARENT_PACKAGE_NAME}_ENABLE_TESTS}" )
+     set(${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES ${${PARENT_PACKAGE_NAME}_ENABLE_TESTS})
+  endif()
+endmacro()
+# NOTE: Above, the top-level package ${PARENT_PACKAGE_NAME} may not even be
+# enabled yet when this gets called but its subpackages might and we need to
+# process this default disable in case their are any enabled subpackages.
+
+
+# Macro to disable ${TRIBITS_SUBPACKAGE)_ENABLE_TESTS and
 # ${TRIBITS_SUBPACKAGE)_ENABLE_EXAMPLES based on
 # ${TRIBITS_PARENTPACKAGE)_ENABLE_TESTS or
 # ${TRIBITS_PARENTPACKAGE)_ENABLE_EXAMPLES
+#
+macro(tribits_apply_subpackage_tests_or_examples_disables  PARENT_PACKAGE_NAME
+    TESTS_OR_EXAMPLES
+  )
+  set(parentPkgEnableVar ${PARENT_PACKAGE_NAME}_ENABLE_${TESTS_OR_EXAMPLES})
+  if (NOT "${${parentPkgEnableVar}}" STREQUAL "" AND NOT ${parentPkgEnableVar})
+    foreach(spkg IN LISTS ${PARENT_PACKAGE_NAME}_SUBPACKAGES)
+      set(fullSpkgName ${PARENT_PACKAGE_NAME}${spkg})
+      if (${PROJECT_NAME}_ENABLE_${fullSpkgName} AND NOT ${parentPkgEnableVar})
+        if ("${${fullSpkgName}_ENABLE_${TESTS_OR_EXAMPLES}}" STREQUAL "")
+          message("-- " "Setting"
+            " ${fullSpkgName}_ENABLE_${TESTS_OR_EXAMPLES}=${${parentPkgEnableVar}}"
+            " because parent package"
+            " ${parentPkgEnableVar}=${${parentPkgEnableVar}}")
+          set(${fullSpkgName}_ENABLE_${TESTS_OR_EXAMPLES} ${${parentPkgEnableVar}})
+        endif()
+      endif()
+    endforeach()
+  endif()
+endmacro()
+
+
+# Macro to enable ${TRIBITS_SUBPACKAGE)_ENABLE_TESTS and
+# ${TRIBITS_SUBPACKAGE)_ENABLE_EXAMPLES based on
+# ${TRIBITS_PARENTPACKAGE)_ENABLE_TESTS or
+# ${TRIBITS_PARENTPACKAGE)_ENABLE_EXAMPLES
+#
 macro(tribits_apply_subpackage_tests_examples_enables  PARENT_PACKAGE_NAME)
   if ("${${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES}" STREQUAL ""
     AND ${PARENT_PACKAGE_NAME}_ENABLE_TESTS
@@ -1019,20 +1068,20 @@ macro(tribits_apply_subpackage_tests_examples_enables  PARENT_PACKAGE_NAME)
       if (${PARENT_PACKAGE_NAME}_ENABLE_TESTS)
         if ("${${fullSpkgName}_ENABLE_TESTS}" STREQUAL "")
           message("-- " "Setting"
-	    " ${fullSpkgName}_ENABLE_TESTS=${${PARENT_PACKAGE_NAME}_ENABLE_TESTS}"
-	    " because parent package"
-	    " ${PARENT_PACKAGE_NAME}_ENABLE_TESTS"
-	    "=${${PARENT_PACKAGE_NAME}_ENABLE_TESTS}")
+            " ${fullSpkgName}_ENABLE_TESTS=${${PARENT_PACKAGE_NAME}_ENABLE_TESTS}"
+            " because parent package"
+            " ${PARENT_PACKAGE_NAME}_ENABLE_TESTS"
+            "=${${PARENT_PACKAGE_NAME}_ENABLE_TESTS}")
           set(${fullSpkgName}_ENABLE_TESTS ${${PARENT_PACKAGE_NAME}_ENABLE_TESTS})
         endif()
       endif()
       if (${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES)
         if ("${${fullSpkgName}_ENABLE_EXAMPLES}" STREQUAL "")
           message("-- " "Setting"
-	    " ${fullSpkgName}_ENABLE_EXAMPLES=${${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES}"
-	    " because parent package"
-	    " ${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES"
-	    "=${${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES}")
+            " ${fullSpkgName}_ENABLE_EXAMPLES=${${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES}"
+            " because parent package"
+            " ${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES"
+            "=${${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES}")
           set(${fullSpkgName}_ENABLE_EXAMPLES ${${PARENT_PACKAGE_NAME}_ENABLE_EXAMPLES})
         endif()
       endif()
@@ -1399,9 +1448,18 @@ macro(tribits_adjust_package_enables)
     ${PROJECT_NAME}_ENABLED_SE_PACKAGES  "")
 
   #
-  # C) Enable tests for currently enabled SE packages
+  # C) Disable and enable tests for currently enabled SE packages
   #
 
+  message("")
+  message("Disabling subpackage tests/examples based on parent package tests/examples disables ...")
+  message("")
+  foreach(TRIBITS_PACKAGE ${${PROJECT_NAME}_PACKAGES})
+    tribits_apply_package_examples_disable(${TRIBITS_PACKAGE} TESTS)
+    tribits_apply_subpackage_tests_or_examples_disables(${TRIBITS_PACKAGE} TESTS)
+    tribits_apply_subpackage_tests_or_examples_disables(${TRIBITS_PACKAGE} EXAMPLES)
+  endforeach()
+
   if (${PROJECT_NAME}_ENABLE_TESTS OR ${PROJECT_NAME}_ENABLE_EXAMPLES)
     message("")
     message("Enabling all tests and/or examples that have not been"
diff --git a/cmake/tribits/core/package_arch/TribitsExternalPackageWriteConfigFile.cmake b/cmake/tribits/core/package_arch/TribitsExternalPackageWriteConfigFile.cmake
index 3c1c6763d4f5..2d041a2ca424 100644
--- a/cmake/tribits/core/package_arch/TribitsExternalPackageWriteConfigFile.cmake
+++ b/cmake/tribits/core/package_arch/TribitsExternalPackageWriteConfigFile.cmake
@@ -328,7 +328,7 @@ function(tribits_extpkg_add_find_upstream_dependencies_str
      )
     foreach (upstreamTplDepEntry IN LISTS ${tplName}_LIB_ENABLED_DEPENDENCIES)
       tribits_extpkg_get_dep_name_and_vis(
-	"${upstreamTplDepEntry}"  upstreamTplDepName  upstreamTplDepVis)
+        "${upstreamTplDepEntry}"  upstreamTplDepName  upstreamTplDepVis)
       if ("${${upstreamTplDepName}_DIR}" STREQUAL "")
         message(FATAL_ERROR "ERROR: ${upstreamTplDepName}_DIR is empty!")
       endif()
@@ -336,9 +336,9 @@ function(tribits_extpkg_add_find_upstream_dependencies_str
         "if (NOT TARGET ${upstreamTplDepName}::all_libs)\n"
         "  set(${upstreamTplDepName}_DIR \"\${CMAKE_CURRENT_LIST_DIR}/../${upstreamTplDepName}\")\n"
         "  find_dependency(${upstreamTplDepName} REQUIRED CONFIG \${${tplName}_SearchNoOtherPathsArgs})\n"
-	"  unset(${upstreamTplDepName}_DIR)\n"
+        "  unset(${upstreamTplDepName}_DIR)\n"
         "endif()\n"
-	"\n"
+        "\n"
         )
     endforeach()
     string(APPEND configFileFragStr
@@ -705,7 +705,7 @@ function(tribits_extpkg_append_upstream_target_link_libraries_str
       "target_link_libraries(${prefix_libname}\n")
     foreach (upstreamTplDepEntry IN LISTS ${tplName}_LIB_ENABLED_DEPENDENCIES)
       tribits_extpkg_get_dep_name_and_vis(
-	"${upstreamTplDepEntry}"  upstreamTplDepName  upstreamTplDepVis)
+        "${upstreamTplDepEntry}"  upstreamTplDepName  upstreamTplDepVis)
       if (upstreamTplDepVis STREQUAL "PUBLIC")
         string(APPEND configFileStr
           "  INTERFACE ${upstreamTplDepName}::all_libs  # i.e. PUBLIC\n")
diff --git a/cmake/tribits/core/package_arch/TribitsGlobalMacros.cmake b/cmake/tribits/core/package_arch/TribitsGlobalMacros.cmake
index ca763c91480b..c269cf63b9ae 100644
--- a/cmake/tribits/core/package_arch/TribitsGlobalMacros.cmake
+++ b/cmake/tribits/core/package_arch/TribitsGlobalMacros.cmake
@@ -204,12 +204,12 @@ function(assert_project_set_group_and_permissions_on_install_base_dir)
         "***\n"
         "*** ERROR in ${PROJECT_NAME}_SET_GROUP_AND_PERMISSIONS_ON_INSTALL_BASE_DIR!\n"
         "***\n"
-	"\n"
-	"${PROJECT_NAME}_SET_GROUP_AND_PERMISSIONS_ON_INSTALL_BASE_DIR=${${PROJECT_NAME}_SET_GROUP_AND_PERMISSIONS_ON_INSTALL_BASE_DIR}\n"
+        "\n"
+        "${PROJECT_NAME}_SET_GROUP_AND_PERMISSIONS_ON_INSTALL_BASE_DIR=${${PROJECT_NAME}_SET_GROUP_AND_PERMISSIONS_ON_INSTALL_BASE_DIR}\n"
         "\n"
         "is not a strict base dir of:\n"
-	"\n"
-	"CMAKE_INSTALL_PREFIX=${CMAKE_INSTALL_PREFIX}\n"
+        "\n"
+        "CMAKE_INSTALL_PREFIX=${CMAKE_INSTALL_PREFIX}\n"
         "\n"
         "Either remove ${PROJECT_NAME}_SET_GROUP_AND_PERMISSIONS_ON_INSTALL_BASE_DIR from the cache or set it to be a base dir of CMAKE_INSTALL_PREFIX!\n"
         "\n"
@@ -2079,7 +2079,7 @@ macro(tribits_configure_enabled_packages)
         endif()
       else()
         set(${TRIBITS_PACKAGE}_BINARY_DIR
-	  ${CMAKE_CURRENT_BINARY_DIR}/${${TRIBITS_PACKAGE}_REL_SOURCE_DIR})
+          ${CMAKE_CURRENT_BINARY_DIR}/${${TRIBITS_PACKAGE}_REL_SOURCE_DIR})
       endif()
       if (${PROJECT_NAME}_VERBOSE_CONFIGURE)
         print_var(${TRIBITS_PACKAGE}_BINARY_DIR)
@@ -2139,7 +2139,7 @@ macro(tribits_configure_enabled_packages)
           "${TRIBITS_PACKAGE_CMAKELIST_FILE}")
         if (NOT ${TRIBITS_PACKAGE}_SOURCE_DIR STREQUAL ${PROJECT_NAME}_SOURCE_DIR)
           add_subdirectory(${${TRIBITS_PACKAGE}_SOURCE_DIR} ${${TRIBITS_PACKAGE}_BINARY_DIR})
-	else()
+        else()
           include("${TRIBITS_PACKAGE_CMAKELIST_FILE}")
         endif()
         if (NOT ${PACKAGE_NAME}_TRIBITS_PACKAGE_POSTPROCESS)
@@ -2307,15 +2307,15 @@ macro(tribits_setup_packaging_and_distribution)
       # package has to have this file to work correctly it should be
       # guaranteed to be there.
       string(REGEX MATCH "[.][.]/" RELATIVE_PATH_CHARS_MATCH
-	${${TRIBITS_PACKAGE}_REL_SOURCE_DIR})
+        ${${TRIBITS_PACKAGE}_REL_SOURCE_DIR})
       if ("${RELATIVE_PATH_CHARS_MATCH}" STREQUAL "")
         set(CPACK_SOURCE_IGNORE_FILES
-	  "${PROJECT_SOURCE_DIR}/${${TRIBITS_PACKAGE}_REL_SOURCE_DIR}/"
+          "${PROJECT_SOURCE_DIR}/${${TRIBITS_PACKAGE}_REL_SOURCE_DIR}/"
           ${CPACK_SOURCE_IGNORE_FILES})
       else()
         find_path(ABSOLUTE_PATH  CMakeLists.txt  PATHS
           "${PROJECT_SOURCE_DIR}/${${TRIBITS_PACKAGE}_REL_SOURCE_DIR}"
-	  NO_DEFAULT_PATH)
+          NO_DEFAULT_PATH)
         if ("${ABSOLUTE_PATH}" STREQUAL "ABSOLUTE_PATH-NOTFOUND")
           message(AUTHOR_WARNING "Relative path found for disabled package"
             " ${TRIBITS_PACKAGE} but package was missing a CMakeLists.txt file."
diff --git a/cmake/tribits/core/package_arch/TribitsPackageMacros.cmake b/cmake/tribits/core/package_arch/TribitsPackageMacros.cmake
index 99191e850611..62d3791e1b67 100644
--- a/cmake/tribits/core/package_arch/TribitsPackageMacros.cmake
+++ b/cmake/tribits/core/package_arch/TribitsPackageMacros.cmake
@@ -52,6 +52,7 @@ include(RemoveGlobalDuplicates)
 include(TribitsGatherBuildTargets)
 
 include(TribitsAddOptionAndDefine)
+include(TribitsPkgExportCacheVars)
 include(TribitsLibraryMacros)
 include(TribitsAddExecutable)
 include(TribitsAddExecutableAndTest)
@@ -180,25 +181,7 @@ macro(tribits_package_decl PACKAGE_NAME_IN)
     message("\nTRIBITS_PACKAGE_DECL: ${PACKAGE_NAME_IN}")
   endif()
 
-  if (CURRENTLY_PROCESSING_SUBPACKAGE)
-    tribits_report_invalid_tribits_usage(
-      "Cannot call tribits_package_decl() in a subpackage."
-      " Use tribits_subpackage() instead"
-      " error in ${CURRENT_SUBPACKAGE_CMAKELIST_FILE}")
-  endif()
-
-  if(${PACKAGE_NAME}_TRIBITS_PACKAGE_DECL_CALLED)
-    tribits_report_invalid_tribits_usage(
-      "tribits_package_decl() called more than once in Package ${PACKAGE_NAME}"
-      " This may be because tribits_package_decl() was explicitly called more than once or"
-      " TRIBITS_PACKAGE_DECL was called after TRIBITS_PACKAGE. You do not need both."
-      " If your package has subpackages then do not call tribits_package() instead call:"
-      " tribits_pacakge_decl() then tribits_process_subpackages() then tribits package_def()"
-    )
-  endif()
-
-  # Set flag to check that macros are called in the correct order
-  set(${PACKAGE_NAME}_TRIBITS_PACKAGE_DECL_CALLED TRUE)
+  tribits_package_decl_assert_call_context()
 
   #
   # A) Parse the input arguments
@@ -236,6 +219,7 @@ macro(tribits_package_decl PACKAGE_NAME_IN)
   #
 
   tribits_set_common_vars(${PACKAGE_NAME_IN})
+  tribits_pkg_init_exported_vars(${PACKAGE_NAME_IN})
 
   set(${PACKAGE_NAME_IN}_DISABLE_STRONG_WARNINGS OFF
      CACHE BOOL
@@ -268,6 +252,31 @@ macro(tribits_package_decl PACKAGE_NAME_IN)
 endmacro()
 
 
+macro(tribits_package_decl_assert_call_context)
+
+  if (CURRENTLY_PROCESSING_SUBPACKAGE)
+    tribits_report_invalid_tribits_usage(
+      "Cannot call tribits_package_decl() in a subpackage."
+      " Use tribits_subpackage() instead"
+      " error in ${CURRENT_SUBPACKAGE_CMAKELIST_FILE}")
+  endif()
+
+  if(${PACKAGE_NAME}_TRIBITS_PACKAGE_DECL_CALLED)
+    tribits_report_invalid_tribits_usage(
+      "tribits_package_decl() called more than once in Package ${PACKAGE_NAME}"
+      " This may be because tribits_package_decl() was explicitly called more than once or"
+      " TRIBITS_PACKAGE_DECL was called after TRIBITS_PACKAGE. You do not need both."
+      " If your package has subpackages then do not call tribits_package() instead call:"
+      " tribits_pacakge_decl() then tribits_process_subpackages() then tribits package_def()"
+    )
+  endif()
+
+  # Set flag to check that macros are called in the correct order
+  set(${PACKAGE_NAME}_TRIBITS_PACKAGE_DECL_CALLED TRUE)
+
+endmacro()
+
+
 # @MACRO: tribits_package_def()
 #
 # Macro called in `<packageDir>/CMakeLists.txt`_ after subpackages are
@@ -291,6 +300,30 @@ endmacro()
 #
 macro(tribits_package_def)
 
+  if (${PROJECT_NAME}_VERBOSE_CONFIGURE)
+    message("\nTRIBITS_PACKAGE_DEF: ${PACKAGE_NAME}")
+  endif()
+
+  tribits_package_def_assert_call_context()
+
+  if (NOT ${PROJECT_NAME}_ENABLE_${PACKAGE_NAME})
+    if (${PROJECT_NAME}_VERBOSE_CONFIGURE)
+      message("\n${PACKAGE_NAME} not enabled so exiting package processing")
+    endif()
+    return()
+  endif()
+
+  # Reset in case were changed by subpackages
+  tribits_set_common_vars(${PACKAGE_NAME})
+
+  # Define package linkage variables
+  tribits_define_linkage_vars(${PACKAGE_NAME})
+
+endmacro()
+
+
+macro(tribits_package_def_assert_call_context)
+
   # check that this is not being called from a subpackage
   if(NOT ${SUBPACKAGE_FULLNAME}_TRIBITS_SUBPACKAGE_POSTPROCESS_CALLED)
     if (CURRENTLY_PROCESSING_SUBPACKAGE)
@@ -311,23 +344,6 @@ macro(tribits_package_def)
       "${CURRENT_SUBPACKAGE_CMAKELIST_FILE}")
   endif()
 
-  if (${PROJECT_NAME}_VERBOSE_CONFIGURE)
-    message("\nTRIBITS_PACKAGE_DEF: ${PACKAGE_NAME}")
-  endif()
-
-  if (NOT ${PROJECT_NAME}_ENABLE_${PACKAGE_NAME})
-    if (${PROJECT_NAME}_VERBOSE_CONFIGURE)
-      message("\n${PACKAGE_NAME} not enabled so exiting package processing")
-    endif()
-    return()
-  endif()
-
-  # Reset in case were changed by subpackages
-  tribits_set_common_vars(${PACKAGE_NAME})
-
-  # Define package linkage variables
-  tribits_define_linkage_vars(${PACKAGE_NAME})
-
   set(${PACKAGE_NAME}_TRIBITS_PACKAGE_DEF_CALLED TRUE)
 
 endmacro()
@@ -353,6 +369,13 @@ endmacro()
 # side-effects (and variables set) after calling this macro.
 #
 macro(tribits_package PACKAGE_NAME_IN)
+  tribits_package_assert_call_context()
+  tribits_package_decl(${PACKAGE_NAME_IN} ${ARGN})
+  tribits_package_def()
+endmacro()
+
+
+macro(tribits_package_assert_call_context)
 
   if (CURRENTLY_PROCESSING_SUBPACKAGE)
     if (NOT ${SUBPACKAGE_FULLNAME}_TRIBITS_SUBPACKAGE_POSTPROCESS_CALLED)
@@ -381,8 +404,6 @@ macro(tribits_package PACKAGE_NAME_IN)
 
   set(${PACKAGE_NAME}_TRIBITS_PACKAGE_CALLED TRUE)
 
-  tribits_package_decl(${PACKAGE_NAME_IN} ${ARGN})
-  tribits_package_def()
 endmacro()
 
 
@@ -440,6 +461,9 @@ endmacro()
 # typically called in the package's `<packageDir>/CMakeLists.txt`_ file (see
 # the example ``SimpleCxx/CMakeLists.txt``).
 #
+# NOTE: This also calls `tribits_pkg_export_cache_var()`_ to export the
+# variable ``${PACKAGE_NAME}_ENABLE_DEBUG``.
+#
 macro(tribits_add_debug_option)
   tribits_add_option_and_define(
     ${PACKAGE_NAME}_ENABLE_DEBUG
@@ -737,7 +761,7 @@ macro(tribits_package_postprocess)
        NOT ${PACKAGE_NAME}_TRIBITS_PROCESS_SUBPACKAGES_CALLED )
 
       tribits_report_invalid_tribits_usage(
-	"Must call tribits_package_decl(), tribits_process_subpackages()"
+        "Must call tribits_package_decl(), tribits_process_subpackages()"
         " and tribits_package_def() before tribits_package_postprocess()."
         "  Because this package has subpackages you cannot use tribits_package()"
         " you must call these in the following order:"
@@ -755,16 +779,16 @@ macro(tribits_package_postprocess)
     # This is a package without subpackages
 
     if (
-	(NOT ${PACKAGE_NAME}_TRIBITS_PACKAGE_CALLED)
-	AND
-	(NOT ${PACKAGE_NAME}_TRIBITS_PACKAGE_DEF_CALLED)
+        (NOT ${PACKAGE_NAME}_TRIBITS_PACKAGE_CALLED)
+        AND
+        (NOT ${PACKAGE_NAME}_TRIBITS_PACKAGE_DEF_CALLED)
       )
       tribits_report_invalid_tribits_usage(
         "Must call tribits_package() or tribits_package_def() before"
-	" tribits_package_postprocess()"
-	" at the top of the file:\n"
-	"  ${TRIBITS_PACKAGE_CMAKELIST_FILE}"
-	)
+        " tribits_package_postprocess()"
+        " at the top of the file:\n"
+        "  ${TRIBITS_PACKAGE_CMAKELIST_FILE}"
+        )
     endif()
 
   endif()
diff --git a/cmake/tribits/core/package_arch/TribitsPkgExportCacheVars.cmake b/cmake/tribits/core/package_arch/TribitsPkgExportCacheVars.cmake
new file mode 100644
index 000000000000..6fb85e0ef8de
--- /dev/null
+++ b/cmake/tribits/core/package_arch/TribitsPkgExportCacheVars.cmake
@@ -0,0 +1,130 @@
+# @HEADER
+# ************************************************************************
+#
+#            TriBITS: Tribal Build, Integrate, and Test System
+#                    Copyright 2013 Sandia Corporation
+#
+# Under the terms of Contract DE-AC04-94AL85000 with Sandia Corporation,
+# the U.S. Government retains certain rights in this software.
+#
+# Redistribution and use in source and binary forms, with or without
+# modification, are permitted provided that the following conditions are
+# met:
+#
+# 1. Redistributions of source code must retain the above copyright
+# notice, this list of conditions and the following disclaimer.
+#
+# 2. Redistributions in binary form must reproduce the above copyright
+# notice, this list of conditions and the following disclaimer in the
+# documentation and/or other materials provided with the distribution.
+#
+# 3. Neither the name of the Corporation nor the names of the
+# contributors may be used to endorse or promote products derived from
+# this software without specific prior written permission.
+#
+# THIS SOFTWARE IS PROVIDED BY SANDIA CORPORATION "AS IS" AND ANY
+# EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
+# IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR
+# PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL SANDIA CORPORATION OR THE
+# CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
+# EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
+# PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
+# PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
+# LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
+# NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
+# SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+#
+# ************************************************************************
+# @HEADER
+
+
+# @MACRO: tribits_pkg_export_cache_var()
+#
+# Macro that registers a package-level cache var to be exported in the
+# ``<Package>Config.cmake`` file
+#
+# Usage::
+#
+#   tribits_pkg_export_cache_var(<cacheVarName>)
+#
+# where ``<cacheVarName>`` must be the name of a cache variable (or an error
+# will occur).
+#
+# NOTE: This will also export this variable to the
+# ``<Package><Spkg>Config.cmake`` file for every enabled subpackage (if this
+# is called from a ``CMakeLists.txt`` file of a top-level package that has
+# subpackages).  That way, any top-level package cache vars are provided by
+# any of the subpackages' ``<Package><Spkg>Config.cmake`` files.
+#
+macro(tribits_pkg_export_cache_var  cacheVarName)
+  if (DEFINED ${PACKAGE_NAME}_PKG_VARS_TO_EXPORT)
+    # Assert this is a cache var
+    get_property(cacheVarIsCacheVar  CACHE ${cacheVarName} PROPERTY  VALUE  SET)
+    if (NOT cacheVarIsCacheVar)
+      message(SEND_ERROR
+        "ERROR: The variable ${cacheVarName} is NOT a cache var and cannot"
+        " be exported!")
+    endif()
+    # Add to the list of package cache vars to export
+    append_global_set(${PACKAGE_NAME}_PKG_VARS_TO_EXPORT
+      ${cacheVarName})
+  endif()
+endmacro()
+
+
+# @MACRO: tribits_assert_cache_and_local_vars_same_value()
+#
+# Asset that a cache variable and a possible local variable (if it exists)
+# have the same value.
+#
+# Usage::
+#
+#   tribits_assert_cache_and_local_vars_same_value(<cacheVarName>)
+#
+# If the local var ``<cacheVarName>`` and the cache var ``<cacheVarName>``
+# both exist but have different values, then ``message(SEND_ERROR ...)`` is
+# called with an informative error message.
+#
+macro(tribits_assert_cache_and_local_vars_same_value  cacheVarName)
+  set(cacheVarValue "$CACHE{${cacheVarName}}")
+  set(localValue "${${cacheVarName}}")
+  if (NOT localValue STREQUAL cacheVarValue)
+    message_wrapper(SEND_ERROR "ERROR: The cache variable ${cacheVarName} with the"
+      " cache var value '${cacheVarValue}' is not the same value as the local"
+      " variable ${cacheVarName} with value '${localValue}'!")
+  endif()
+endmacro()
+
+
+# Function that sets up data-structures for package-level cache var to be
+# exported
+#
+function(tribits_pkg_init_exported_vars  PACKAGE_NAME_IN)
+  global_set(${PACKAGE_NAME_IN}_PKG_VARS_TO_EXPORT "")
+endfunction()
+
+
+# Function that injects set() statements for a package's exported cache vars into
+# a string.
+#
+# This is used to create set() statements to be injected into a package's
+# ``<Package>Config.cmake`` file.
+#
+function(tribits_pkg_append_set_commands_for_exported_vars  packageName
+    configFileStrInOut
+  )
+  set(configFileStr "${${configFileStrInOut}}")
+  if (NOT "${${packageName}_PARENT_PACKAGE}" STREQUAL "")
+    foreach(exportedCacheVar IN LISTS ${${packageName}_PARENT_PACKAGE}_PKG_VARS_TO_EXPORT)
+      tribits_assert_cache_and_local_vars_same_value(${exportedCacheVar})
+      string(APPEND configFileStr
+        "set(${exportedCacheVar} \"${${exportedCacheVar}}\")\n")
+    endforeach()
+  endif()
+  foreach(exportedCacheVar IN LISTS ${packageName}_PKG_VARS_TO_EXPORT)
+    tribits_assert_cache_and_local_vars_same_value(${exportedCacheVar})
+    string(APPEND configFileStr
+      "set(${exportedCacheVar} \"${${exportedCacheVar}}\")\n")
+  endforeach()
+  set(${configFileStrInOut} "${configFileStr}" PARENT_SCOPE)
+endfunction()
diff --git a/cmake/tribits/core/package_arch/TribitsSubPackageMacros.cmake b/cmake/tribits/core/package_arch/TribitsSubPackageMacros.cmake
index 60a7c668e9a5..27383b1907b6 100644
--- a/cmake/tribits/core/package_arch/TribitsSubPackageMacros.cmake
+++ b/cmake/tribits/core/package_arch/TribitsSubPackageMacros.cmake
@@ -88,6 +88,7 @@ macro(tribits_subpackage SUBPACKAGE_NAME_IN)
   # Now override the package-like variables
   tribits_set_common_vars(${SUBPACKAGE_FULLNAME})
   tribits_define_linkage_vars(${SUBPACKAGE_FULLNAME})
+  tribits_pkg_init_exported_vars(${SUBPACKAGE_FULLNAME})
 
   tribits_append_package_specific_compiler_flags()
   if(${PROJECT_NAME}_VERBOSE_CONFIGURE)
@@ -123,23 +124,22 @@ function(tribits_subpackage_assert_call_context)
     if(${SUBPACKAGE_FULLNAME}_TRIBITS_SUBPACKAGE_CALLED)
       tribits_report_invalid_tribits_usage(
         "Already called tribits_subpackge() for the"
-	" ${PARENT_PACKAGE_NAME} subpackage ${TRIBITS_SUBPACKAGE}")
+        " ${PARENT_PACKAGE_NAME} subpackage ${TRIBITS_SUBPACKAGE}")
     endif()
 
     # make sure the name in the macro call matches the name in the packages cmake file
     if (NOT ${SUBPACKAGE_NAME_IN} STREQUAL ${SUBPACKAGE_NAME})
       tribits_report_invalid_tribits_usage(
         "Error, the package-defined subpackage name"
-	" '${SUBPACKAGE_NAME_IN}' is not the same as the subpackage name"
-	" '${SUBPACKAGE_NAME}' defined in the parent packages's"
-	" Dependencies.cmake file")
+        " '${SUBPACKAGE_NAME_IN}' is not the same as the subpackage name"
+        " '${SUBPACKAGE_NAME}' defined in the parent packages's"
+        " Dependencies.cmake file")
     endif()
   endif()
 
 endfunction()
 
 
-
 # @MACRO: tribits_subpackage_postprocess()
 #
 # Macro that performs standard post-processing after defining a `TriBITS
@@ -158,20 +158,22 @@ endfunction()
 # this macro but limitations of the CMake language make it necessary to do so.
 #
 macro(tribits_subpackage_postprocess)
+  tribits_subpackage_postprocess_assert_call_context()
+  tribits_package_postprocess_common()
+endmacro()
 
-  # check that this is not being called from a package
-  if (NOT CURRENTLY_PROCESSING_SUBPACKAGE)
 
-  # This is being called from a package
+macro(tribits_subpackage_postprocess_assert_call_context)
 
+  # check that this is not being called from a package
+  if (NOT CURRENTLY_PROCESSING_SUBPACKAGE)
+    # This is being called from a package
     tribits_report_invalid_tribits_usage(
       "Cannot call tribits_subpackage_postprocess() from a package."
       " Use tribits_package_postprocess() instead"
       " ${CURRENT_PACKAGE_CMAKELIST_FILE}")
-
   else()
-  # This is being caleld from a subpackage
-
+    # This is being called from a subpackage
     # check to make sure this has not already been called
     if (${SUBPACKAGE_FULLNAME}_TRIBITS_SUBPACKAGE_POSTPROCESS_CALLED)
       tribits_report_invalid_tribits_usage(
@@ -185,12 +187,9 @@ macro(tribits_subpackage_postprocess)
         "tribits_subpackage() must be called before tribits_subpackage_postprocess()"
         " for the ${PARENT_PACKAGE_NAME} subpackage ${TRIBITS_SUBPACKAGE}")
     endif()
-
   endif()
 
   # Set flags that are used  to check that macros are called in the correct order
   dual_scope_set(${SUBPACKAGE_FULLNAME}_TRIBITS_SUBPACKAGE_POSTPROCESS_CALLED TRUE)
 
-  tribits_package_postprocess_common()
-
 endmacro()
diff --git a/cmake/tribits/core/package_arch/TribitsTplFindIncludeDirsAndLibraries.cmake b/cmake/tribits/core/package_arch/TribitsTplFindIncludeDirsAndLibraries.cmake
index 987aaf8dd3b9..8a5eeb35f686 100644
--- a/cmake/tribits/core/package_arch/TribitsTplFindIncludeDirsAndLibraries.cmake
+++ b/cmake/tribits/core/package_arch/TribitsTplFindIncludeDirsAndLibraries.cmake
@@ -505,7 +505,7 @@ function(tribits_tpl_find_include_dirs_and_libraries TPL_NAME)
             "-- ${LIB_NOT_FOUND_MSG_PREFIX} Did not find a lib in the lib set \"${LIBNAME_SET}\""
              " for the TPL '${TPL_NAME}'!")
           if (MUST_FIND_ALL_LIBS)
-	    set(_${TPL_NAME}_ENABLE_SUCCESS FALSE)
+            set(_${TPL_NAME}_ENABLE_SUCCESS FALSE)
           else()
             break()
           endif()
diff --git a/cmake/tribits/core/package_arch/TribitsWriteClientExportFiles.cmake b/cmake/tribits/core/package_arch/TribitsWriteClientExportFiles.cmake
index 9b1f967af96b..cf3e9ef2f37b 100644
--- a/cmake/tribits/core/package_arch/TribitsWriteClientExportFiles.cmake
+++ b/cmake/tribits/core/package_arch/TribitsWriteClientExportFiles.cmake
@@ -38,6 +38,7 @@
 # @HEADER
 
 include(TribitsGeneralMacros)
+include(TribitsPkgExportCacheVars)
 
 ###
 ### WARNING: See "NOTES TO DEVELOPERS" at the bottom of the file
@@ -545,8 +546,7 @@ function(tribits_append_dependent_package_config_file_includes_and_enables packa
   # Parse input
 
   cmake_parse_arguments(
-     PARSE  #prefix
-     ""  #options
+     PARSE ""  # prefix, options
      #one_value_keywords
      "EXPORT_FILE_VAR_PREFIX;EXT_PKG_CONFIG_FILE_BASE_DIR;PKG_CONFIG_FILE_BASE_DIR;CONFIG_FILE_STR_INOUT"
      "" #multi_value_keywords
@@ -577,6 +577,11 @@ function(tribits_append_dependent_package_config_file_includes_and_enables packa
       "set(${EXPORT_FILE_VAR_PREFIX}_ENABLE_${depPkg} ${enableVal})\n")
   endforeach()
 
+  # Put in set() statements for exported cache vars
+  string(APPEND configFileStr
+    "\n# Exported cache variables\n")
+  tribits_pkg_append_set_commands_for_exported_vars(${packageName} configFileStr)
+
   # Include configurations of dependent packages
   string(APPEND configFileStr
     "\n# Include configuration of dependent packages\n")
@@ -876,7 +881,7 @@ include(\"${${TRIBITS_PACKAGE}_BINARY_DIR}/${TRIBITS_PACKAGE}Config.cmake\")")
       set(TRIBITS_PROJECT_INSTALL_INCLUDE_DIR "${${PROJECT_NAME}_INSTALL_INCLUDE_DIR}")
     else()
       set(TRIBITS_PROJECT_INSTALL_INCLUDE_DIR
-	"${CMAKE_INSTALL_PREFIX}/${${PROJECT_NAME}_INSTALL_INCLUDE_DIR}")
+        "${CMAKE_INSTALL_PREFIX}/${${PROJECT_NAME}_INSTALL_INCLUDE_DIR}")
     endif()
 
     configure_file(
diff --git a/cmake/tribits/ctest_driver/TribitsAddDashboardTarget.cmake b/cmake/tribits/ctest_driver/TribitsAddDashboardTarget.cmake
index a9a8b6992f21..723725deb3d7 100644
--- a/cmake/tribits/ctest_driver/TribitsAddDashboardTarget.cmake
+++ b/cmake/tribits/ctest_driver/TribitsAddDashboardTarget.cmake
@@ -196,7 +196,7 @@ macro(tribits_add_dashboard_target)
         # NOTE: Above, if ${PROJECT_NAME}_ENABLE_ALL_PACKAGES was set in CMakeCache.txt, then setting
         # -D${PROJECT_NAME}_ENABLE_ALL_PACKAGES:BOOL=OFF will turn it off in the cache.  Note that it will
         # never be turned on again which means that the list of packages will be set explicitly below.
-	)
+        )
 
       set(DASHBOARD_TARGET_CTEST_DRIVER_CMND_NUM "B) ")
 
@@ -226,7 +226,7 @@ macro(tribits_add_dashboard_target)
         COMMAND echo
         COMMAND echo "See the results at http://${CTEST_DROP_SITE}${CTEST_DROP_LOCATION}&display=project\#Experimental"
         COMMAND echo
-	)
+        )
 
     endif()
 
diff --git a/cmake/tribits/ctest_driver/TribitsCTestDriverCore.cmake b/cmake/tribits/ctest_driver/TribitsCTestDriverCore.cmake
index da12e79f96fe..33f2c886b88a 100644
--- a/cmake/tribits/ctest_driver/TribitsCTestDriverCore.cmake
+++ b/cmake/tribits/ctest_driver/TribitsCTestDriverCore.cmake
@@ -2128,18 +2128,18 @@ function(tribits_ctest_driver)
     if (EXISTS "${CTEST_TESTING_TAG_FILE}")
       file(READ "${CTEST_TESTING_TAG_FILE}" TAG_FILE_CONTENTS_STR)
       message(
-	"\nPrevious file:"
-	"\n"
-	"\n  '${CTEST_TESTING_TAG_FILE}'"
-	"\n"
-	"\nexists with contents:\n"
-	"\n"
-	"${TAG_FILE_CONTENTS_STR}\n")
+        "\nPrevious file:"
+        "\n"
+        "\n  '${CTEST_TESTING_TAG_FILE}'"
+        "\n"
+        "\nexists with contents:\n"
+        "\n"
+        "${TAG_FILE_CONTENTS_STR}\n")
     else()
       message(FATAL_ERROR
-	"ERROR: Previous file '${CTEST_TESTING_TAG_FILE}' does NOT exist!"
-	"  A previous ctest_start() was not called.  Please call again"
-	" this time setting CTEST_DO_NEW_START=TRUE")
+        "ERROR: Previous file '${CTEST_TESTING_TAG_FILE}' does NOT exist!"
+        "  A previous ctest_start() was not called.  Please call again"
+        " this time setting CTEST_DO_NEW_START=TRUE")
     endif()
 
     list(APPEND CTEST_START_ARGS APPEND)
diff --git a/cmake/tribits/ctest_driver/TribitsCTestDriverCoreHelpers.cmake b/cmake/tribits/ctest_driver/TribitsCTestDriverCoreHelpers.cmake
index f54285bb8c1f..1d62d292e8ea 100644
--- a/cmake/tribits/ctest_driver/TribitsCTestDriverCoreHelpers.cmake
+++ b/cmake/tribits/ctest_driver/TribitsCTestDriverCoreHelpers.cmake
@@ -50,7 +50,7 @@ macro(extrarepo_execute_process_wrapper)
     if (NOT EXTRAREPO_EXECUTE_PROCESS_WRAPPER_RTN_VAL STREQUAL "0")
       message(SEND_ERROR
         "Error: execute_process(${ARGN}) returned"
-	" '${EXTRAREPO_EXECUTE_PROCESS_WRAPPER_RTN_VAL}'")
+        " '${EXTRAREPO_EXECUTE_PROCESS_WRAPPER_RTN_VAL}'")
     endif()
   else()
     message("execute_process(${ARGN})")
@@ -136,12 +136,12 @@ function(tribits_clone_or_update_extrarepo  EXTRAREPO_NAME_IN  EXTRAREPO_DIR_IN
       set(CLONE_CMND_ARGS
         COMMAND "${GIT_EXECUTABLE}" clone
         ${CHECKOUT_BRANCH_ARG} -o ${${PROJECT_NAME}_GIT_REPOSITORY_REMOTE}
-	"${EXTRAREPO_REPOURL}" ${EXTRAREPO_DIR_IN}
+        "${EXTRAREPO_REPOURL}" ${EXTRAREPO_DIR_IN}
         WORKING_DIRECTORY "${${PROJECT_NAME}_SOURCE_DIRECTORY}"
         OUTPUT_FILE "${EXTRAREPO_CLONE_OUT_FILE}" )
     else()
       message(SEND_ERROR
-	"Error, Invalid EXTRAREPO_REPOTYPE_IN='${EXTRAREPO_REPOTYPE_IN}'!")
+        "Error, Invalid EXTRAREPO_REPOTYPE_IN='${EXTRAREPO_REPOTYPE_IN}'!")
     endif()
 
     # Do the clone
@@ -508,7 +508,7 @@ macro(enable_only_modified_packages)
   if (${PROJECT_NAME}_ENABLE_ALL_PACKAGES)
     if (NOT ${PROJECT_NAME}_CTEST_DO_ALL_AT_ONCE)
       message(FATAL_ERROR
-	"Error, failing 'ALL_PACKAGES' only allowed with all-at-once mode!")
+        "Error, failing 'ALL_PACKAGES' only allowed with all-at-once mode!")
     endif()
     message("\nDirectly modified or failing non-disabled packages that need"
       " to be tested:  ALL_PACKAGES")
@@ -954,7 +954,7 @@ macro(tribits_ctest_package_by_package)
     if (CTEST_DEPENDENCY_HANDLING_UNIT_TESTING)
 
       message("${TRIBITS_PACKAGE}: Skipping configure due"
-	" to running in unit testing mode!")
+        " to running in unit testing mode!")
 
     else()
 
@@ -1001,7 +1001,7 @@ macro(tribits_ctest_package_by_package)
 
       if (NOT CTEST_DO_CONFIGURE AND CTEST_DO_SUBMIT)
         message("${TRIBITS_PACKAGE}: Skipping submitting configure"
-	  " and notes due to CTEST_DO_CONFIGURE='${CTEST_DO_CONFIGURE}'!")
+          " and notes due to CTEST_DO_CONFIGURE='${CTEST_DO_CONFIGURE}'!")
       elseif (CTEST_DO_SUBMIT)
         message("\nSubmitting configure and notes ...")
         tribits_ctest_submit( PARTS configure notes )
@@ -1025,7 +1025,7 @@ macro(tribits_ctest_package_by_package)
     if ( NOT PBP_CONFIGURE_PASSED AND CTEST_DO_BUILD )
 
       message("\n${TRIBITS_PACKAGE}: Skipping build due"
-	" to configure failing!")
+        " to configure failing!")
 
       set(PBP_BUILD_PASSED FALSE)
       set(PBP_BUILD_LIBS_PASSED FALSE)
@@ -1033,14 +1033,14 @@ macro(tribits_ctest_package_by_package)
     elseif (NOT CTEST_DO_BUILD)
 
       message("\n${TRIBITS_PACKAGE}: Skipping build due"
-	" to CTEST_DO_BUILD='${CTEST_DO_BUILD}'!")
+        " to CTEST_DO_BUILD='${CTEST_DO_BUILD}'!")
 
     elseif (CTEST_DEPENDENCY_HANDLING_UNIT_TESTING OR
       CTEST_CONFIGURATION_UNIT_TESTING
       )
 
       message("\n${TRIBITS_PACKAGE}: Skipping build due"
-	" to running in unit testing mode!")
+        " to running in unit testing mode!")
 
     else()
 
@@ -1152,7 +1152,7 @@ macro(tribits_ctest_package_by_package)
           " exists so there were failed tests!")
       else()
         message("\n${TRIBITS_PACKAGE}: File '${FAILED_TEST_LOG_FILE}'"
-	  " does NOT exist so all tests passed!")
+          " does NOT exist so all tests passed!")
         set(PBP_TESTS_PASSED TRUE)
       endif()
       # 2009/12/05: ToDo: We need to add an argument to ctest_test(...)
@@ -1190,7 +1190,7 @@ macro(tribits_ctest_package_by_package)
     if (NOT PBP_BUILD_LIBS_PASSED AND CTEST_DO_MEMORY_TESTING)
 
       message("\n${TRIBITS_PACKAGE}: Skipping running memory checking"
-	 "tests since library build failed!\n")
+         "tests since library build failed!\n")
 
     elseif (NOT CTEST_DO_MEMORY_TESTING)
 
@@ -1209,7 +1209,7 @@ macro(tribits_ctest_package_by_package)
         BUILD "${CTEST_BINARY_DIRECTORY}"
         PARALLEL_LEVEL "${CTEST_PARALLEL_LEVEL}"
         INCLUDE_LABEL "^${TRIBITS_PACKAGE}$"
-	)
+        )
       # ToDo: Determine if memory testing passed or not and affect overall
       # pass/fail!
 
diff --git a/cmake/tribits/doc/guides/TribitsGuidesBody.rst b/cmake/tribits/doc/guides/TribitsGuidesBody.rst
index 848f5aea1d9d..293fcca3ea1e 100644
--- a/cmake/tribits/doc/guides/TribitsGuidesBody.rst
+++ b/cmake/tribits/doc/guides/TribitsGuidesBody.rst
@@ -3378,7 +3378,7 @@ management system are:
 9)  `TPL disable triggers auto-disables of downstream dependencies`_
 10) `Disables trump enables where there is a conflict`_
 11) `Enable/disable of parent package is enable/disable for subpackages`_
-12) `Enable of parent package tests/examples is enable for subpackages tests/examples`_
+12) `Enable/disable of parent package tests/examples is enable/disable for subpackages tests/examples`_
 13) `Subpackage enable does not auto-enable the parent package`_
 14) `Support for optional SE package/TPL is enabled by default`_
 15) `Support for optional SE package/TPL can be explicitly disabled`_
@@ -3588,17 +3588,19 @@ In more detail, these rules/behaviors are:
     see `Explicit enable of a package, its tests, an optional TPL, with ST
     enabled`_.
 
-.. _Enable of parent package tests/examples is enable for subpackages tests/examples:
-
-12) **Enable of parent package tests/examples is enable for subpackages
-    tests/examples**: Setting ``<TRIBITS_PACKAGE>_ENABLE_TESTS=ON`` is
-    equivalent to setting the default for
-    ``<TRIBITS_PACKAGE><SP>_ENABLE_TESTS=ON`` for each subpackage ``<SP>`` of
-    the parent package ``<TRIBITS_PACKAGE>`` (if ``<TRIBITS_PACKAGE>`` has
-    subpackages).  Same is true for ``<TRIBITS_PACKAGE>_ENABLE_EXAMPLES=ON``
-    setting the default for ``<TRIBITS_PACKAGE><SP>_ENABLE_EXAMPLES=ON``.  In
-    addition, setting ``<TRIBITS_PACKAGE>_ENABLE_TESTS=ON`` will set
-    ``<TRIBITS_PACKAGE>_ENABLE_EXAMPLES=ON`` by default as well.
+.. _Enable/disable of parent package tests/examples is enable/disable for subpackages tests/examples:
+
+12) **Enable/disable of parent package tests/examples is enable/disable for
+    subpackages tests/examples**: Setting
+    ``<TRIBITS_PACKAGE>_ENABLE_TESTS=[ON|OFF]`` is equivalent to setting the
+    default for ``<TRIBITS_PACKAGE><SP>_ENABLE_TESTS=[ON|OFF]`` for each
+    subpackage ``<SP>`` of the parent package ``<TRIBITS_PACKAGE>`` (if
+    ``<TRIBITS_PACKAGE>`` has subpackages).  Same is true for
+    ``<TRIBITS_PACKAGE>_ENABLE_EXAMPLES=[ON|OFF]`` setting the default for
+    ``<TRIBITS_PACKAGE><SP>_ENABLE_EXAMPLES=[ON|OFF]``.  In addition, setting
+    ``<TRIBITS_PACKAGE>_ENABLE_TESTS=[ON|OFF]`` will set
+    ``<TRIBITS_PACKAGE>_ENABLE_EXAMPLES=[ON|OFF]`` by default as well (but not
+    vice versa).
 
 .. _Subpackage enable does not auto-enable the parent package:
 
diff --git a/cmake/tribits/doc/guides/TribitsMacroFunctionDocTemplate.rst b/cmake/tribits/doc/guides/TribitsMacroFunctionDocTemplate.rst
index b87a485d85de..c045c1962e54 100644
--- a/cmake/tribits/doc/guides/TribitsMacroFunctionDocTemplate.rst
+++ b/cmake/tribits/doc/guides/TribitsMacroFunctionDocTemplate.rst
@@ -14,6 +14,7 @@
 @FUNCTION: tribits_add_test() +
 @MACRO:    tribits_add_test_directories() +
 @FUNCTION: tribits_allow_missing_external_packages() +
+@MACRO:    tribits_assert_cache_and_local_vars_same_value() +
 @FUNCTION: tribits_configure_file() +
 @FUNCTION: tribits_copy_files_to_binary_dir() +
 @FUNCTION: tribits_ctest_driver() +
@@ -30,6 +31,7 @@
 @FUNCTION: tribits_find_most_recent_source_file_timestamp() +
 @FUNCTION: tribits_install_headers() +
 @MACRO:    tribits_include_directories() +
+@MACRO:    tribits_pkg_export_cache_var() +
 @MACRO:    tribits_package() +
 @MACRO:    tribits_package_decl() +
 @MACRO:    tribits_package_def() +
diff --git a/cmake/tribits/examples/TribitsExampleApp/CMakeLists.txt b/cmake/tribits/examples/TribitsExampleApp/CMakeLists.txt
index 4de561d8acbb..562a38ffd4ab 100644
--- a/cmake/tribits/examples/TribitsExampleApp/CMakeLists.txt
+++ b/cmake/tribits/examples/TribitsExampleApp/CMakeLists.txt
@@ -17,6 +17,9 @@ include(AppHelperFuncs)
 
 getTribitsExProjStuffForApp()
 
+# Show that we can see exported cache vars
+message("-- WithSubpackagesA_SPECIAL_VALUE = '${WithSubpackagesA_SPECIAL_VALUE}'")
+
 # Enable the compilers now that we have gotten them from the *Config.cmake file
 enable_language(C)
 enable_language(CXX)
diff --git a/cmake/tribits/examples/TribitsExampleProject/packages/simple_cxx/CMakeLists.txt b/cmake/tribits/examples/TribitsExampleProject/packages/simple_cxx/CMakeLists.txt
index d9e5c1c2bd1a..4eb715a09576 100644
--- a/cmake/tribits/examples/TribitsExampleProject/packages/simple_cxx/CMakeLists.txt
+++ b/cmake/tribits/examples/TribitsExampleProject/packages/simple_cxx/CMakeLists.txt
@@ -8,6 +8,7 @@ tribits_package( SimpleCxx  ENABLE_SHADOWING_WARNINGS  CLEANED )
 #
 include(CheckFor__int64)
 check_for___int64(HAVE_SIMPLECXX___INT64)
+tribits_pkg_export_cache_var(HAVE_SIMPLECXX___INT64)
 
 #
 # C) Set up package-specific options
diff --git a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/A.cpp b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/A.cpp
index f9db8c90a125..85286e850a7c 100644
--- a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/A.cpp
+++ b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/A.cpp
@@ -1,4 +1,5 @@
 #include "A.hpp"
+#include "WithSubpackagesA_config.h"
 
 #include "SimpleCxx_HelloWorld.hpp"
 
@@ -9,3 +10,7 @@ std::string WithSubpackages::getA() {
 std::string WithSubpackages::depsA() {
   return "SimpleCxx "+SimpleCxx::deps();
 }
+
+int WithSubpackages::specialValue() {
+  return WITHSUBPACKAGESA_SPECIAL_VALUE;
+}
diff --git a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/A.hpp b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/A.hpp
index 3476ee5b17ff..36364a10af12 100644
--- a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/A.hpp
+++ b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/A.hpp
@@ -11,6 +11,9 @@ namespace WithSubpackages {
   // return a string describing the dependencies of "A", recursively
   std::string depsA();
 
+  // return special value
+  int specialValue();
+
 }
 
 
diff --git a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/CMakeLists.txt b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/CMakeLists.txt
index f9ede481a956..e7cdf9cf6f63 100644
--- a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/CMakeLists.txt
+++ b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/CMakeLists.txt
@@ -6,18 +6,22 @@ tribits_subpackage(A)
 #
 # B) Set up subpackage-specific options
 #
-# Typically there are none or are few as most options are picked up from the
-# parent package's CMakeLists.txt file!
+
+set(${PACKAGE_NAME}_SPECIAL_VALUE  3  CACHE STRING "Integer special value")
+tribits_pkg_export_cache_var(${PACKAGE_NAME}_SPECIAL_VALUE)
 
 #
 # C) Add the libraries, tests, and examples
 #
 
+tribits_configure_file(${PACKAGE_NAME}_config.h)
+
+include_directories(${CMAKE_CURRENT_BINARY_DIR})
+
 include_directories(${CMAKE_CURRENT_SOURCE_DIR})
 tribits_add_library(pws_a
   SOURCES A.cpp
-  HEADERS A.hpp
-  NOINSTALLHEADERS 
+  HEADERS A.hpp ${CMAKE_CURRENT_BINARY_DIR}/${PACKAGE_NAME}_config.h
 )
 
 tribits_add_test_directories(tests)
diff --git a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/cmake/WithSubpackagesA_config.h.in b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/cmake/WithSubpackagesA_config.h.in
new file mode 100644
index 000000000000..4536208a03c8
--- /dev/null
+++ b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/cmake/WithSubpackagesA_config.h.in
@@ -0,0 +1,6 @@
+#ifndef WITHSUBPACKAGESA_CONFIG_H
+#define WITHSUBPACKAGESA_CONFIG_H
+
+#define WITHSUBPACKAGESA_SPECIAL_VALUE ${WithSubpackagesA_SPECIAL_VALUE}
+
+#endif // WITHSUBPACKAGESA_CONFIG_H
diff --git a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/tests/CMakeLists.txt b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/tests/CMakeLists.txt
index 788b93eac65d..c891750a7e94 100644
--- a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/tests/CMakeLists.txt
+++ b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/tests/CMakeLists.txt
@@ -6,4 +6,5 @@ tribits_add_advanced_test( test_of_a
     PASS_REGULAR_EXPRESSION_ALL 
       "A label is: A"
       "A deps are: ${EXPECTED_SIMPLECXX_AND_DEPS}"
+      "A special value: ${WithSubpackagesA_SPECIAL_VALUE}"
   )
diff --git a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/tests/a_test.cpp b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/tests/a_test.cpp
index 4c48a7838eae..6497b4d8ebee 100644
--- a/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/tests/a_test.cpp
+++ b/cmake/tribits/examples/TribitsExampleProject/packages/with_subpackages/a/tests/a_test.cpp
@@ -3,13 +3,11 @@
 
 #include "A.hpp"
 
-using namespace WithSubpackages;
-
 int main() {
-  std::string label_A = getA();
-  std::string deps_A  = depsA();
+  std::string label_A = WithSubpackages::getA();
+  std::string deps_A  = WithSubpackages::depsA();
   std::cout << "A label is: " << label_A << std::endl;
   std::cout << "A deps are: " << deps_A << std::endl;
-
+  std::cout << "A special value: " << WithSubpackages::specialValue() << std::endl;
   return 0;
 }

From 1f9274ca940907d0d9c808e694eb73f10821fe60 Mon Sep 17 00:00:00 2001
From: "Roscoe A. Bartlett" <rabartl@sandia.gov>
Date: Thu, 25 Aug 2022 08:37:41 -0600
Subject: [PATCH 125/130] Force disable Pliris in ATS2 builds (#10931)

Because Seconddary Tested code is disable in ATS2 builds, we don't want a
change to Pliris to trigger the enable since it is already broken on thse ATS2
CUDA builds.  For all of the details, see #10931.
---
 packages/framework/ini-files/config-specs.ini | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/packages/framework/ini-files/config-specs.ini b/packages/framework/ini-files/config-specs.ini
index f74a1dcaa657..d7b531e520f6 100644
--- a/packages/framework/ini-files/config-specs.ini
+++ b/packages/framework/ini-files/config-specs.ini
@@ -887,6 +887,12 @@ opt-set-cmake-var Trilinos_CUDA_NUM_GPUS STRING : ${KOKKOS_NUM_DEVICES|ENV}
 opt-set-cmake-var Trilinos_CUDA_SLOTS_PER_GPU STRING : 2
 # See https://tribits.org/doc/TribitsBuildReference.html#spreading-out-and-limiting-tests-running-on-gpus
 opt-set-cmake-var Trilinos_AUTOGENERATE_TEST_RESOURCE_FILE BOOL FORCE : ON
+opt-set-cmake-var Trilinos_ENABLE_Pliris BOOL FORCE : OFF
+# NOTE: Above, FORCE is needed for Trilinos_ENABLE_Pliris=OFF in case somemoe
+# changes a file under packages/pliris/ and results in adding
+# set(Trilinos_ENABLE_Pliris ON CACHE BOOL "") in the packageEnables.cmake
+# file.  For more details on the complexity of this, see Trilinos GitHub Issue
+# #10931.
 
 [ATS2-COMMON-OVERRIDES]
 # Override TPL enables from [COMMON]

From 075198b44386616a4c2f4f30edec9621a15a1ecd Mon Sep 17 00:00:00 2001
From: "Roscoe A. Bartlett" <rabartl@sandia.gov>
Date: Thu, 25 Aug 2022 09:04:39 -0600
Subject: [PATCH 126/130] Disable Pliris tests in ATS2 GenConfig builds
 (#10931)

For some reason, CMake is not respecting the force disable of
Trilinos_ENABLE_Pliris from the last commit.  Rather than try to debug this, I
am just disabling the tests which will allow PR #10930 to pass the PR builds
and merge.

There are other issues with the GenConfig files that will need to be addressed
that I am seeing.
---
 packages/framework/ini-files/config-specs.ini | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/packages/framework/ini-files/config-specs.ini b/packages/framework/ini-files/config-specs.ini
index d7b531e520f6..e44dd8267081 100644
--- a/packages/framework/ini-files/config-specs.ini
+++ b/packages/framework/ini-files/config-specs.ini
@@ -983,6 +983,8 @@ opt-set-cmake-var PanzerAdaptersSTK_main_driver_energy-ss-blocked-tp_DISABLE BOO
 opt-set-cmake-var PanzerDiscFE_integration_values2_MPI_1_DISABLE BOOL : ON
 opt-set-cmake-var PanzerMiniEM_MiniEM-BlockPrec_Augmentation_MPI_4_DISABLE BOOL : ON
 opt-set-cmake-var PanzerMiniEM_MiniEM-BlockPrec_RefMaxwell_MPI_4_DISABLE BOOL : ON
+opt-set-cmake-var Pliris_vector_random_MPI_3_DISABLE BOOL : ON
+opt-set-cmake-var Pliris_vector_random_MPI_4_DISABLE BOOL : ON
 opt-set-cmake-var ROL_NonlinearProblemTest_MPI_4_DISABLE BOOL : ON
 opt-set-cmake-var ROL_adapters_minitensor_test_function_test_01_MPI_4_DISABLE BOOL : ON
 opt-set-cmake-var ROL_adapters_minitensor_test_function_test_02_MPI_4_DISABLE BOOL : ON

From 41a5fab5e643ae34a7c1c18067ae3d018875a277 Mon Sep 17 00:00:00 2001
From: "Roscoe A. Bartlett" <rabartl@sandia.gov>
Date: Thu, 25 Aug 2022 09:09:31 -0600
Subject: [PATCH 127/130] Automatic snapshot commit from tribits at 142e5362

Origin repo remote tracking branch: 'github/master'
Origin repo remote repo URL: 'github = git@github.com:TriBITSPub/TriBITS.git'
Git describe: Vera4.0-RC1-start-1265-gaa9a4256

At commit:

commit 142e536230040523bcf1f3de903df52f91c76d79
Author:  Roscoe A. Bartlett <rabartl@sandia.gov>
Date:    Thu Aug 25 08:43:09 2022 -0600
Summary: Change cmake_minimum_required() to upper bound TRIBITS_CMAKE_MINIMUM_REQUIRED (#522)
---
 .../core/installation/TribitsPackageConfigTemplate.cmake.in     | 2 +-
 .../core/installation/TribitsProjectConfigTemplate.cmake.in     | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/cmake/tribits/core/installation/TribitsPackageConfigTemplate.cmake.in b/cmake/tribits/core/installation/TribitsPackageConfigTemplate.cmake.in
index abfb2f4360bc..465648d63ac3 100644
--- a/cmake/tribits/core/installation/TribitsPackageConfigTemplate.cmake.in
+++ b/cmake/tribits/core/installation/TribitsPackageConfigTemplate.cmake.in
@@ -52,7 +52,7 @@ if(CMAKE_VERSION VERSION_LESS 3.3)
   set(${PDOLLAR}{CMAKE_FIND_PACKAGE_NAME}_FOUND FALSE)
   return()
 endif()
-cmake_minimum_required(VERSION 3.3...${CMAKE_VERSION})
+cmake_minimum_required(VERSION 3.3...${TRIBITS_CMAKE_MINIMUM_REQUIRED})
 
 ## ---------------------------------------------------------------------------
 ## Compilers used by ${PROJECT_NAME}/${PACKAGE_NAME} build
diff --git a/cmake/tribits/core/installation/TribitsProjectConfigTemplate.cmake.in b/cmake/tribits/core/installation/TribitsProjectConfigTemplate.cmake.in
index cdd3ee08c70f..67eb685ed483 100644
--- a/cmake/tribits/core/installation/TribitsProjectConfigTemplate.cmake.in
+++ b/cmake/tribits/core/installation/TribitsProjectConfigTemplate.cmake.in
@@ -53,7 +53,7 @@ if(CMAKE_VERSION VERSION_LESS 3.3)
   set(${PDOLLAR}{CMAKE_FIND_PACKAGE_NAME}_FOUND FALSE)
   return()
 endif()
-cmake_minimum_required(VERSION 3.3...${CMAKE_VERSION})
+cmake_minimum_required(VERSION 3.3...${TRIBITS_CMAKE_MINIMUM_REQUIRED})
 
 ## ---------------------------------------------------------------------------
 ## Compilers used by ${PROJECT_NAME} build

From 0ecde46427b67112070ccbd8c4781e3020d17f01 Mon Sep 17 00:00:00 2001
From: Christian Glusa <caglusa@sandia.gov>
Date: Fri, 29 Jul 2022 13:22:37 -0600
Subject: [PATCH 128/130] MueLu: Allow to print Kokkos config when default node
 type is used

---
 .../muelu/test/unit_tests/MueLu_Test_ETI.hpp  | 40 ++++++++++++++-----
 1 file changed, 30 insertions(+), 10 deletions(-)

diff --git a/packages/muelu/test/unit_tests/MueLu_Test_ETI.hpp b/packages/muelu/test/unit_tests/MueLu_Test_ETI.hpp
index c904379b227b..1ee25d148301 100644
--- a/packages/muelu/test/unit_tests/MueLu_Test_ETI.hpp
+++ b/packages/muelu/test/unit_tests/MueLu_Test_ETI.hpp
@@ -57,7 +57,7 @@
 // need this to have the ETI defined macros
 #if defined(HAVE_MUELU_EXPLICIT_INSTANTIATION)
 #include <MueLu_ExplicitInstantiation.hpp>
-#endif 
+#endif
 
 #if defined(HAVE_MUELU_TPETRA)
 #include <TpetraCore_config.h>
@@ -87,6 +87,14 @@ bool Automatic_Test_ETI(int argc, char *argv[]) {
   // MPI initialization using Teuchos
   Teuchos::GlobalMPISession mpiSession(&argc, &argv, NULL);
 
+  Teuchos::RCP<Teuchos::FancyOStream> out = Teuchos::rcp(new Teuchos::FancyOStream(Teuchos::rcpFromRef(std::cout)));
+#ifdef HAVE_MPI
+  Teuchos::RCP<const Teuchos::MpiComm<int> > comm = Teuchos::rcp_dynamic_cast<const Teuchos::MpiComm<int> >(Teuchos::DefaultComm<int>::getComm());
+  if (comm->getSize() > 1) {
+    out->setOutputToRootOnly(0);
+  }
+#endif
+
   // Tpetra nodes call Kokkos::execution_space::initialize if the execution
   // space is not initialized, but they don't call Kokkos::initialize.
   // Teuchos::GlobalMPISession captures its command-line arguments for later
@@ -145,7 +153,7 @@ bool Automatic_Test_ETI(int argc, char *argv[]) {
       // Both Epetra and Tpetra (with double, int, int) enabled
       return MUELU_AUTOMATIC_TEST_ETI_NAME<double,int,int,Xpetra::EpetraNode>(clp, lib, argc, argv);
 #    else
-      std::cout << "Skip running with Epetra since both Epetra and Tpetra are enabled but Tpetra is not instantiated on double, int, int." << std::endl;
+      *out << "Skip running with Epetra since both Epetra and Tpetra are enabled but Tpetra is not instantiated on double, int, int." << std::endl;
 #    endif // end Tpetra instantiated on double, int, int
 #  else
       // only Epetra enabled. No Tpetra instantiation possible
@@ -162,6 +170,11 @@ bool Automatic_Test_ETI(int argc, char *argv[]) {
       if (node == "") {
         typedef KokkosClassic::DefaultNode::DefaultNodeType Node;
 
+        if (config) {
+          *out << "Node type: " << Node::execution_space::name() << std::endl;
+          Node::execution_space::print_configuration(*out, true/*details*/);
+        }
+
 #ifndef HAVE_MUELU_EXPLICIT_INSTANTIATION
         return MUELU_AUTOMATIC_TEST_ETI_NAME<double,int,long,Node>(clp, lib, argc, argv);
 #else
@@ -191,8 +204,10 @@ bool Automatic_Test_ETI(int argc, char *argv[]) {
 #ifdef KOKKOS_ENABLE_SERIAL
         typedef Kokkos::Compat::KokkosSerialWrapperNode Node;
 
-        if (config)
-          Kokkos::Serial().print_configuration(std::cout, true/*details*/);
+        if (config) {
+          *out << "Node type: " << Node::execution_space::name() << std::endl;
+          Kokkos::Serial().print_configuration(*out, true/*details*/);
+        }
 
 #  ifndef HAVE_MUELU_EXPLICIT_INSTANTIATION
         return MUELU_AUTOMATIC_TEST_ETI_NAME<double,int,long,Node>(clp,  lib, argc, argv);
@@ -227,8 +242,9 @@ bool Automatic_Test_ETI(int argc, char *argv[]) {
         typedef Kokkos::Compat::KokkosOpenMPWrapperNode Node;
 
         if (config) {
-          Kokkos::OpenMP().print_configuration(std::cout, true/*details*/);
-          std::cout << "OpenMP Max Threads = " << omp_get_max_threads() << std::endl;
+          *out << "Node type: " << Node::execution_space::name() << std::endl;
+          Kokkos::OpenMP().print_configuration(*out, true/*details*/);
+          *out << "OpenMP Max Threads = " << omp_get_max_threads() << std::endl;
         }
 
 #  ifndef HAVE_MUELU_EXPLICIT_INSTANTIATION
@@ -263,8 +279,10 @@ bool Automatic_Test_ETI(int argc, char *argv[]) {
 #ifdef KOKKOS_ENABLE_CUDA
         typedef Kokkos::Compat::KokkosCudaWrapperNode Node;
 
-        if (config)
-          Kokkos::Cuda().print_configuration(std::cout, true/*details*/);
+        if (config) {
+          *out << "Node type: " << Node::execution_space::name() << std::endl;
+          Kokkos::Cuda().print_configuration(*out, true/*details*/);
+        }
 
 #  ifndef HAVE_MUELU_EXPLICIT_INSTANTIATION
         return MUELU_AUTOMATIC_TEST_ETI_NAME<double,int,long,Node>(clp, lib, argc, argv);
@@ -298,8 +316,10 @@ bool Automatic_Test_ETI(int argc, char *argv[]) {
 #ifdef KOKKOS_ENABLE_HIP
 	typedef Kokkos::Compat::KokkosHIPWrapperNode Node;
 
-        if (config)
-          Kokkos::Experimental::HIP().print_configuration(std::cout, true/*details*/);
+        if (config) {
+          *out << "Node type: " << Node::execution_space::name() << std::endl;
+          Kokkos::Experimental::HIP().print_configuration(*out, true/*details*/);
+        }
 
 #  ifndef HAVE_MUELU_EXPLICIT_INSTANTIATION
         return MUELU_AUTOMATIC_TEST_ETI_NAME<double,int,long,Node>(clp, lib, argc, argv);

From 4c901f56524dce20c4caef00776947551b491b0c Mon Sep 17 00:00:00 2001
From: Chris Siefert <csiefer@sandia.gov>
Date: Thu, 25 Aug 2022 14:05:27 -0600
Subject: [PATCH 129/130] Tpetra: Adding configure option to disable Kokkos
 integration test

---
 packages/tpetra/core/CMakeLists.txt                    | 10 ++++++++++
 .../tpetra/core/test/KokkosIntegration/CMakeLists.txt  |  4 +++-
 2 files changed, 13 insertions(+), 1 deletion(-)

diff --git a/packages/tpetra/core/CMakeLists.txt b/packages/tpetra/core/CMakeLists.txt
index 3bfbbce2590d..56d2a94e72f8 100644
--- a/packages/tpetra/core/CMakeLists.txt
+++ b/packages/tpetra/core/CMakeLists.txt
@@ -198,6 +198,16 @@ TRIBITS_ADD_OPTION_AND_DEFINE(
   OFF
   )
 
+TRIBITS_ADD_OPTION_AND_DEFINE(
+  Tpetra_ENABLE_KokkosIntegrationTest
+  HAVE_TPETRA_KOKKOSINTEGRATION_TEST
+  "Enable the KokkosIntegrationTest"
+  ON
+  )
+
+
+
+
 #
 # Add libraries, tests, and examples
 #
diff --git a/packages/tpetra/core/test/KokkosIntegration/CMakeLists.txt b/packages/tpetra/core/test/KokkosIntegration/CMakeLists.txt
index ea0b7d2fb933..e97ec317b559 100644
--- a/packages/tpetra/core/test/KokkosIntegration/CMakeLists.txt
+++ b/packages/tpetra/core/test/KokkosIntegration/CMakeLists.txt
@@ -1,7 +1,9 @@
 
 ASSERT_DEFINED (Tpetra_ENABLE_CUDA)
 
-IF (Tpetra_ENABLE_CUDA AND BUILD_SHARED_LIBS)
+ASSERT_DEFINED (Tpetra_ENABLE_KokkosIntegrationTest)
+
+IF (Tpetra_ENABLE_CUDA AND BUILD_SHARED_LIBS AND Tpetra_ENABLE_KokkosIntegrationTest)
   MESSAGE(STATUS "Tpetra: Enabling KokkosIntegration Tests")
 
   TRIBITS_ADD_LIBRARY(

From 40726a946b538072066329ad4e76b12b4dcd57dd Mon Sep 17 00:00:00 2001
From: Graham Harper <GrahamBenHarper@users.noreply.github.com>
Date: Thu, 25 Aug 2022 14:43:14 -0600
Subject: [PATCH 130/130] Intrepid2: update
 TensorData.setFirstComponentExtentInDimension0 to modify extents_[0] (#10929)

---
 packages/intrepid2/src/Shared/Intrepid2_TensorData.hpp | 1 +
 1 file changed, 1 insertion(+)

diff --git a/packages/intrepid2/src/Shared/Intrepid2_TensorData.hpp b/packages/intrepid2/src/Shared/Intrepid2_TensorData.hpp
index 280f651c9746..d0f8e7b6a24c 100644
--- a/packages/intrepid2/src/Shared/Intrepid2_TensorData.hpp
+++ b/packages/intrepid2/src/Shared/Intrepid2_TensorData.hpp
@@ -563,6 +563,7 @@ namespace Intrepid2
     {
       INTREPID2_TEST_FOR_EXCEPTION(!separateFirstComponent_ && (numTensorComponents_ != 1), std::invalid_argument, "setFirstComponentExtent() is only allowed when separateFirstComponent_ is true, or there is only one component");
       tensorComponents_[0].setExtent(0,newExtent);
+      extents_[0] = newExtent;
     }
   };
 }