rapidsai · rapids-bot · Mar 29, 2021 · Mar 28, 2021 · Mar 28, 2021 · Mar 28, 2021
@@ -75,10 +75,6 @@
     is_space as cpp_isspace,
     is_upper as cpp_is_upper,
 )
-from cudf._lib.strings.convert.convert_integers import (
-    is_integer as cpp_is_integer,
-)
-from cudf._lib.strings.convert.convert_floats import is_float as cpp_is_float
 from cudf._lib.strings.combine import (
     concatenate as cpp_concatenate,
     join as cpp_join,
@@ -91,6 +87,10 @@
 from cudf._lib.strings.convert.convert_fixed_point import (
     to_decimal as cpp_to_decimal,
 )
+from cudf._lib.strings.convert.convert_floats import is_float as cpp_is_float
+from cudf._lib.strings.convert.convert_integers import (
+    is_integer as cpp_is_integer,
+)
 from cudf._lib.strings.convert.convert_urls import (
     url_decode as cpp_url_decode,
     url_encode as cpp_url_encode,
@@ -4760,10 +4760,7 @@ def base_size(self) -> int:
         if len(self.base_children) == 0:
             return 0
         else:
-            return int(
-                (self.base_children[0].size - 1)
-                / self.base_children[0].dtype.itemsize
-            )
+            return self.base_children[0].size - 1
 
     @property
     def data_array_view(self) -> cuda.devicearray.DeviceNDArray:

@@ -2922,3 +2922,17 @@ def test_string_std():
     assert_exceptions_equal(
         lfunc=psr.std, rfunc=sr.std, compare_error_message=False
     )
+
+
+def test_string_slice_with_mask():
+    actual = cudf.Series(["hi", "hello", None])
+    expected = actual[0:3]
+
+    assert actual._column.base_size == 3
+    assert_eq(actual._column.base_size, expected._column.base_size)
+    assert_eq(actual._column.null_count, expected._column.null_count)
+    assert_eq(
+        actual._column.mask.to_host_array(),
+        expected._column.mask.to_host_array(),
+    )
+    assert_eq(actual, expected)
 def test_string_no_children_properties(): 
     empty_col = StringColumn(children=()) 
     assert empty_col.base_children == () 
     assert empty_col.base_size == 0 
 def test_string_no_children_properties(): 
     empty_col = StringColumn(children=()) 
     assert empty_col.base_children == () 
     assert empty_col.base_size == 0 
@@ -6,11 +6,11 @@
 from dask.distributed import Client
 from distributed.utils_test import loop  # noqa: F401
 
-import dask_cudf
-
 import cudf
 from cudf.tests.utils import assert_eq
 
+import dask_cudf
+
 dask_cuda = pytest.importorskip("dask_cuda")
 
 
@@ -65,3 +65,13 @@ def test_ucx_seriesgroupby():
             dask_df_g = dask_df.groupby(["a"]).b.sum().compute()
 
             assert dask_df_g.name == "b"
+
+
+def test_str_series_roundtrip():
+    with dask_cuda.LocalCUDACluster(n_workers=1) as cluster:
+        with Client(cluster):
+            expected = cudf.Series(["hi", "hello", None])
+            dask_series = dask_cudf.from_cudf(expected, npartitions=2)
+
+            actual = dask_series.compute()
+            assert_eq(actual, expected)