huggingface · mariusarvinte · Nov 5, 2024 · Nov 5, 2024 · BenjaminBossan · Nov 5, 2024
diff --git a/src/accelerate/utils/operations.py b/src/accelerate/utils/operations.py
@@ -669,7 +669,7 @@ def _pad_across_processes(tensor, dim=0, pad_index=0, pad_first=False):
         old_size = tensor.shape
         new_size = list(old_size)
         new_size[dim] = max_size
-        new_tensor = tensor.new_zeros(tuple(new_size)) + pad_index
+        new_tensor = (tensor.new_zeros(tuple(new_size)) + pad_index).to(tensor.dtype)
 new_tensor[indices] = tensor 
 new_tensor[indices] = tensor 
         if pad_first:
             indices = tuple(
                 slice(max_size - old_size[dim], max_size) if i == dim else slice(None) for i in range(len(new_size))

diff --git a/tests/test_utils.py b/tests/test_utils.py
@@ -302,6 +302,8 @@ def forward(self, x):
     def test_pad_across_processes(self):
         from torch.nested import nested_tensor
 
+        from accelerate import Accelerator
+
         nt = nested_tensor([[1, 2, 3], [1], [1, 2]])
         with self.assertWarns(CannotPadNestedTensorWarning):
             nt2 = pad_across_processes(nt)
@@ -316,6 +318,12 @@ def test_pad_across_processes(self):
         padded_tensor = pad_across_processes(tensor, dim=-4)
         assert padded_tensor is tensor
 
+        # Booleans should be returned with the correct type
+        accelerator = Accelerator()
+        tensor = (torch.randn(4, 3, 100 * (accelerator.process_index + 1)) > 0).to(torch.bool)
+        padded_tensor = pad_across_processes(tensor, dim=-1)
+        assert padded_tensor.dtype == torch.bool
+
     def test_slice_and_concatenate(self):
         # First base case: 2 processes, batch size of 1
         num_processes = 2