huggingface · sgugger · Jul 20, 2023 · Jun 22, 2023 · Jun 25, 2023 · Jun 28, 2023
diff --git a/src/transformers/training_args.py b/src/transformers/training_args.py
@@ -944,8 +944,8 @@ class TrainingArguments:
             )
         },
     )
-    sharded_ddp: str = field(
-        default="",
+    sharded_ddp: Optional[Union[str, bool, List[ShardedDDPOption]]] = field(
+        default=False,
         metadata={
             "help": (
                 "Whether or not to use sharded DDP training (in distributed training only). The base option should be"
@@ -955,8 +955,8 @@ class TrainingArguments:
             ),
         },
     )
-    fsdp: str = field(
-        default="",
+    fsdp: Optional[Union[str, bool, List[FSDPOption]]] = field(
+        default=False,
         metadata={
             "help": (
                 "Whether or not to use PyTorch Fully Sharded Data Parallel (FSDP) training (in distributed training"
@@ -976,7 +976,7 @@ class TrainingArguments:
             )
         },
     )
-    fsdp_config: Optional[str] = field(
+    fsdp_config: Optional[Union[str, Dict]] = field(
         default=None,
         metadata={
             "help": (