sdv-dev · amontanez24 · Apr 14, 2021 · Apr 12, 2021 · Apr 12, 2021 · amontanez24
diff --git a/sdv/metadata/table.py b/sdv/metadata/table.py
@@ -584,6 +584,23 @@ def filter_valid(self, data):
 
         return data
 
+    def make_ids_unique(self, data):
+        """Repopulate any id fields in provided data to guarantee uniqueness.
+
+        Args:
+            data (pandas.DataFrame):
+                Table data.
+
+        Returns:
+            pandas.DataFrame:
+                Table where all id fields are unique.
+        """
+        for name, field_metadata in self._fields_metadata.items():
+            if field_metadata['type'] == 'id':
+                data[name] = self._make_ids(field_metadata, len(data))
+
+        return data
+
     # ###################### #
     # Metadata Serialization #
     # ###################### #

diff --git a/sdv/tabular/base.py b/sdv/tabular/base.py
@@ -296,6 +296,7 @@ def _sample_batch(self, num_rows=None, max_retries=100, max_rows_multiplier=10,
 
             counter += 1
 
+        sampled = self._metadata.make_ids_unique(sampled)
         return sampled.head(min(len(sampled), num_rows))
 
     def _make_conditions_df(self, conditions, num_rows):

diff --git a/tests/unit/metadata/test_table.py b/tests/unit/metadata/test_table.py
@@ -17,3 +17,23 @@ def test__make_ids_fail(self):
         metadata = {'subtype': 'string', 'regex': '[a-d]'}
         with pytest.raises(ValueError):
             Table._make_ids(metadata, 20)
+
+    def test_make_ids_unique(self):
+        """Test that id columns contain all unique values"""
+        metadata_dict = {
+            'fields': {
+                'item 0': {'type': 'id', 'subtype': 'integer'},
+                'item 1': {'type': 'boolean'}
+            },
+            'primary_key': 'item 0'
+        }
+        metadata = Table.from_dict(metadata_dict)
+        data = pd.DataFrame({
+            'item 0': [0, 1, 1, 2, 3, 5, 5, 6],
+            'item 1': [True, True, False, False, True, False, False, True]
+        })
+
+        new_data = metadata.make_ids_unique(data)
+
+        assert new_data['item 1'].equals(data['item 1'])
+        assert new_data['item 0'].is_unique