anmyachev · anmyachev · Nov 29, 2023 · Nov 30, 2023 · Nov 30, 2023 · Dec 4, 2023
@@ -14,6 +14,7 @@
 """Module houses builder class for Binary operator."""
 
 from typing import Optional
+import warnings
 
 import numpy as np
 import pandas
@@ -126,7 +127,9 @@ def maybe_compute_dtypes_common_cast(
             df2 = pandas.DataFrame([[1] * len(common_columns)]).astype(
                 {i: dtypes_second[col] for i, col in enumerate(common_columns)}
             )
-            dtypes = func(df1, df2).dtypes.set_axis(common_columns)
+            with warnings.catch_warnings():
+                warnings.filterwarnings("ignore", category=pandas.errors.PerformanceWarning)
+                dtypes = func(df1, df2).dtypes.set_axis(common_columns)
         # it sometimes doesn't work correctly with strings, so falling back to
         # the "common_cast" method in this case
         except TypeError:

@@ -42,7 +42,16 @@ def to_numpy(cls, partitions, **kwargs):
         """
         if partitions.shape[1] == 1:
             parts = cls.get_objects_from_partitions(partitions.flatten())
-            parts = [part.to_numpy(**kwargs) for part in parts]
+            # breakpoint()
+            # inconsistency: parts[0].to_numpy(dtype="int64", copy=False, na_value=np.nan)
+            # *** ValueError: cannot convert float NaN to integer
+            # vs
+            # parts[0]["result"].to_numpy(dtype="int64", copy=False, na_value=np.nan)
+            # array([1577840521123543000, 1577934062321654000, 1578027849987321000], dtype=int64)
+            # breakpoint()
+            parts = [(part.squeeze(axis=1) if len(part.columns) == 1 else part).to_numpy(**kwargs) for part in parts]
+            # reshape to 2d numpy array
+            parts = [part.reshape(len(part), 1) if len(part.shape) == 1 else part for part in parts]
         else:
             parts = RayWrapper.materialize(
                 [

@@ -663,7 +663,7 @@
                 break
 
 
-def df_equals(df1, df2, check_dtypes=True):
+def df_equals(df1, df2, check_dtypes=True, check_exact=False):
     """Tests if df1 and df2 are equal.
 
     Args:
@@ -732,7 +732,7 @@
     elif isinstance(df1, pandas.Index) and isinstance(df2, pandas.Index):
         assert_index_equal(df1, df2)
     elif isinstance(df1, pandas.Series) and isinstance(df2, pandas.Series):
-        assert_series_equal(df1, df2, check_dtype=False, check_series_type=False)
+        assert_series_equal(df1, df2, check_dtype=False, check_series_type=False, check_exact=check_exact)
     elif (
         hasattr(df1, "dtype")
         and hasattr(df2, "dtype")