From 79210c254c128c5e640a829892751e250fbe8d1e Mon Sep 17 00:00:00 2001
From: vmoens <vincentmoens@gmail.com>
Date: Thu, 23 Nov 2023 14:48:43 +0000
Subject: [PATCH] init

---
 tensordict/_lazy.py      |  62 ++++---
 tensordict/_td.py        | 362 ++++++++++++++++++++++++---------------
 tensordict/base.py       |  82 +++------
 tensordict/nn/params.py  |  31 ++--
 tensordict/persistent.py |  28 ++-
 tensordict/utils.py      | 131 +++++++++++++-
 test/test_tensordict.py  |   5 +-
 7 files changed, 458 insertions(+), 243 deletions(-)

diff --git a/tensordict/_lazy.py b/tensordict/_lazy.py
index d060beda2..ae8c185eb 100644
--- a/tensordict/_lazy.py
+++ b/tensordict/_lazy.py
@@ -78,28 +78,36 @@ def is_batchedtensor(tensor: Tensor) -> bool:
 class _LazyStackedTensorDictKeysView(_TensorDictKeysView):
     tensordict: LazyStackedTensorDict
 
-    def __len__(self) -> int:
-        return len(self._keys())
-
-    def _keys(self) -> list[str]:
+    def _tensor_keys(self):
+        return self.tensordict._key_list(leaves_only=True)
+    def _node_keys(self):
+        return self.tensordict._key_list(nodes_only=True)
+    def _keys(self):
         return self.tensordict._key_list()
 
-    def __contains__(self, item):
-        item = _unravel_key_to_tuple(item)
-        if item[0] in self.tensordict._iterate_over_keys():
-            if self.leaves_only:
-                return not _is_tensor_collection(self.tensordict.entry_class(item[0]))
-            has_first_key = True
-        else:
-            has_first_key = False
-        if not has_first_key or len(item) == 1:
-            return has_first_key
-        # otherwise take the long way
-        return all(
-            item[1:]
-            in tensordict.get(item[0]).keys(self.include_nested, self.leaves_only)
-            for tensordict in self.tensordict.tensordicts
-        )
+    #
+    # def __len__(self) -> int:
+    #     return len(self._keys())
+    #
+    # def _keys(self) -> list[str]:
+    #     return self.tensordict._key_list()
+    #
+    # def __contains__(self, item):
+    #     item = _unravel_key_to_tuple(item)
+    #     if item[0] in self.tensordict._iterate_over_keys():
+    #         if self.leaves_only:
+    #             return not _is_tensor_collection(self.tensordict.entry_class(item[0]))
+    #         has_first_key = True
+    #     else:
+    #         has_first_key = False
+    #     if not has_first_key or len(item) == 1:
+    #         return has_first_key
+    #     # otherwise take the long way
+    #     return all(
+    #         item[1:]
+    #         in tensordict.get(item[0]).keys(self.include_nested, self.leaves_only)
+    #         for tensordict in self.tensordict.tensordicts
+    #     )
 
 
 class LazyStackedTensorDict(TensorDictBase):
@@ -1053,10 +1061,10 @@ def _change_batch_size(self, new_size: torch.Size) -> None:
         self._batch_size = new_size
 
     def keys(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool = False,
     ) -> _LazyStackedTensorDictKeysView:
         keys = _LazyStackedTensorDictKeysView(
-            self, include_nested=include_nested, leaves_only=leaves_only
+            self, include_nested=include_nested, leaves_only=leaves_only, nodes_only=nodes_only,
         )
         return keys
 
@@ -1071,10 +1079,10 @@ def _iterate_over_keys(self) -> None:
         yield from self._key_list()
 
     @cache  # noqa: B019
-    def _key_list(self):
-        keys = set(self.tensordicts[0].keys())
+    def _key_list(self, leaves_only=False, nodes_only=False):
+        keys = set(self.tensordicts[0].keys(leaves_only=leaves_only, nodes_only=nodes_only))
         for td in self.tensordicts[1:]:
-            keys = keys.intersection(td.keys())
+            keys = keys.intersection(td.keys(leaves_only=leaves_only, nodes_only=nodes_only))
         return sorted(keys, key=str)
 
     def entry_class(self, key: NestedKey) -> type:
@@ -2152,9 +2160,9 @@ def __repr__(self) -> str:
 
     # @cache  # noqa: B019
     def keys(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only:bool = False,
     ) -> _TensorDictKeysView:
-        return self._source.keys(include_nested=include_nested, leaves_only=leaves_only)
+        return self._source.keys(include_nested=include_nested, leaves_only=leaves_only, nodes_only=nodes_only)
 
     def select(
         self, *keys: str, inplace: bool = False, strict: bool = True
diff --git a/tensordict/_td.py b/tensordict/_td.py
index 5c34d8fbd..ced21c414 100644
--- a/tensordict/_td.py
+++ b/tensordict/_td.py
@@ -55,11 +55,11 @@
     _NON_STR_KEY_ERR,
     _NON_STR_KEY_TUPLE_ERR,
     _parse_to,
-    _set_item,
+    _set_item,unravel_key,
     _set_max_batch_size,
     _shape,
     _STRDTYPE2DTYPE,
-    _StringOnlyDict,
+    _StringOnlyDoubleDict,
     _sub_index,
     _unravel_key_to_tuple,
     as_decorator,
@@ -71,7 +71,7 @@
     is_tensorclass,
     KeyedJaggedTensor,
     lock_blocked,
-    NestedKey,
+    NestedKey, _NODES_LEAVES_ERR,
 )
 from torch import Tensor
 from torch.jit._shape_functions import infer_size_impl
@@ -205,7 +205,7 @@ def __init__(
         self._device = device
 
         if not _run_checks:
-            _tensordict: dict = _StringOnlyDict()
+            _tensordict: dict = _StringOnlyDoubleDict()
             self._batch_size = batch_size
             for key, value in source.items():
                 if isinstance(value, dict):
@@ -221,7 +221,7 @@ def __init__(
             self._tensordict = _tensordict
             self._td_dim_names = names
         else:
-            self._tensordict = _StringOnlyDict()
+            self._tensordict = _StringOnlyDoubleDict()
             if not isinstance(source, (TensorDictBase, dict)):
                 raise ValueError(
                     "A TensorDict source is expected to be a TensorDictBase "
@@ -526,9 +526,19 @@ def _apply_nest(
         if not inplace and is_locked:
             out.unlock_()
 
-        for key, item in self.items():
+        for key, item in self.items(leaves_only=True):
+            _others = [_other._get_str(key, default=NO_DEFAULT) for _other in others]
+            item_trsf = fn(item, *_others)
+            out._set_str(
+                key,
+                item_trsf,
+                inplace=BEST_ATTEMPT_INPLACE if inplace else False,
+                validated=checked,
+            )
+
+        for key, item in self.items(nodes_only=True):
             _others = [_other._get_str(key, default=NO_DEFAULT) for _other in others]
-            if not call_on_nested and _is_tensor_collection(item.__class__):
+            if not call_on_nested:
                 item_trsf = item._apply_nest(
                     fn,
                     *_others,
@@ -541,10 +551,7 @@ def _apply_nest(
             else:
                 item_trsf = fn(item, *_others)
             if item_trsf is not None:
-                if isinstance(self, _SubTensorDict):
-                    out.set(key, item_trsf, inplace=inplace)
-                else:
-                    out._set_str(
+                out._set_str(
                         key,
                         item_trsf,
                         inplace=BEST_ATTEMPT_INPLACE if inplace else False,
@@ -1728,21 +1735,23 @@ def select(self, *keys: NestedKey, inplace: bool = False, strict: bool = True) -
             keys_to_select = None
             for key in keys:
                 if isinstance(key, str):
-                    subkey = []
+                    subkey = None
                 else:
                     key, subkey = key[0], key[1:]
-                try:
-                    source[key] = self.get(key)
-                    if len(subkey):
-                        if keys_to_select is None:
-                            # delay creation of defaultdict
-                            keys_to_select = defaultdict(list)
-                        keys_to_select[key].append(subkey)
-                except KeyError as err:
+                val = self._get_str(key, None)
+                if val is None:
                     if not strict:
                         continue
                     else:
-                        raise KeyError(f"select failed to get key {key}") from err
+                        raise KeyError(f"select failed to get key {key} in tensordict with keys {self.keys()}")
+                else:
+                    source[key] = val
+
+                if subkey:
+                    if keys_to_select is None:
+                        # delay creation of defaultdict
+                        keys_to_select = defaultdict(list)
+                    keys_to_select[key].append(subkey)
             if keys_to_select is not None:
                 for key, val in keys_to_select.items():
                     source[key] = source[key].select(
@@ -1765,21 +1774,21 @@ def select(self, *keys: NestedKey, inplace: bool = False, strict: bool = True) -
         return out
 
     def keys(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool = False,
     ) -> _TensorDictKeysView:
-        if not include_nested and not leaves_only:
-            return self._tensordict.keys()
+        if not include_nested:
+            return self._tensordict.keys(leaves_only=leaves_only, nodes_only=nodes_only, )
         else:
             return self._nested_keys(
-                include_nested=include_nested, leaves_only=leaves_only
+                include_nested=include_nested, leaves_only=leaves_only, nodes_only=nodes_only,
             )
 
     # @cache  # noqa: B019
     def _nested_keys(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool = False,
     ) -> _TensorDictKeysView:
         return _TensorDictKeysView(
-            self, include_nested=include_nested, leaves_only=leaves_only
+            self, include_nested=include_nested, leaves_only=leaves_only, nodes_only=nodes_only,
         )
 
     def __getstate__(self):
@@ -1799,21 +1808,25 @@ def __setstate__(self, state):
 
     # some custom methods for efficiency
     def items(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only:bool=False,
     ) -> Iterator[tuple[str, CompatibleType]]:
-        if not include_nested and not leaves_only:
-            return self._tensordict.items()
+        if nodes_only and leaves_only:
+            raise ValueError(_NODES_LEAVES_ERR)
+        if not include_nested:
+            return self._tensordict.items(leaves_only=leaves_only, nodes_only=nodes_only)
         else:
-            return super().items(include_nested=include_nested, leaves_only=leaves_only)
+            return super().items(include_nested=include_nested, leaves_only=leaves_only, nodes_only=nodes_only)
 
     def values(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only:bool=False,
     ) -> Iterator[tuple[str, CompatibleType]]:
-        if not include_nested and not leaves_only:
-            return self._tensordict.values()
+        if nodes_only and leaves_only:
+            raise ValueError(_NODES_LEAVES_ERR)
+        if not include_nested:
+            return self._tensordict.values(leaves_only=leaves_only, nodes_only=nodes_only)
         else:
             return super().values(
-                include_nested=include_nested, leaves_only=leaves_only
+                include_nested=include_nested, leaves_only=leaves_only, nodes_only=nodes_only,
             )
 
 
@@ -2040,9 +2053,9 @@ def _set_at_tuple(self, key, value, idx, *, validated):
 
     # @cache  # noqa: B019
     def keys(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool = False,
     ) -> _TensorDictKeysView:
-        return self._source.keys(include_nested=include_nested, leaves_only=leaves_only)
+        return self._source.keys(include_nested=include_nested, leaves_only=leaves_only, nodes_only=nodes_only)
 
     def entry_class(self, key: NestedKey) -> type:
         source_type = type(self._source.get(key))
@@ -2371,7 +2384,79 @@ def _create_nested_str(self, key):
 
     _add_batch_dim = TensorDict._add_batch_dim
 
-    _apply_nest = TensorDict._apply_nest
+    def _apply_nest(
+        self,
+        fn: Callable,
+        *others: T,
+        batch_size: Sequence[int] | None = None,
+        device: torch.device | None = None,
+        names: Sequence[str] | None = None,
+        inplace: bool = False,
+        checked: bool = False,
+        call_on_nested: bool = False,
+        **constructor_kwargs,
+    ) -> T:
+        if inplace:
+            out = self
+        elif batch_size is not None:
+            out = TensorDict(
+                {},
+                batch_size=torch.Size(batch_size),
+                names=names,
+                device=self.device if not device else device,
+                _run_checks=False,
+                **constructor_kwargs,
+            )
+        else:
+            out = TensorDict(
+                {},
+                batch_size=self.batch_size,
+                device=self.device if not device else device,
+                names=self.names if self._has_names() else None,
+                _run_checks=False,
+                **constructor_kwargs,
+            )
+
+        is_locked = out.is_locked
+        if not inplace and is_locked:
+            out.unlock_()
+
+        for key, item in self.items(leaves_only=True):
+            _others = [_other._get_str(key, default=NO_DEFAULT) for _other in others]
+            item_trsf = fn(item, *_others)
+            out._set_str(
+                key,
+                item_trsf,
+                inplace=BEST_ATTEMPT_INPLACE if inplace else False,
+                validated=checked,
+            )
+
+        for key, item in self.items(nodes_only=True):
+            _others = [_other._get_str(key, default=NO_DEFAULT) for _other in others]
+            if not call_on_nested:
+                item_trsf = item._apply_nest(
+                    fn,
+                    *_others,
+                    inplace=inplace,
+                    batch_size=batch_size,
+                    device=device,
+                    checked=checked,
+                    **constructor_kwargs,
+                )
+            else:
+                item_trsf = fn(item, *_others)
+            if item_trsf is not None:
+                out._set_str(
+                        key,
+                        item_trsf,
+                        inplace=BEST_ATTEMPT_INPLACE if inplace else False,
+                        validated=checked,
+                    )
+
+        if not inplace and is_locked:
+            out.lock_()
+        return out
+
     # def _apply_nest(self, *args, **kwargs):
     #     return self.to_tensordict()._apply_nest(*args, **kwargs)
     _convert_to_tensordict = TensorDict._convert_to_tensordict
@@ -2420,77 +2505,76 @@ def __init__(
         tensordict: T,
         include_nested: bool,
         leaves_only: bool,
+        nodes_only: bool,
     ) -> None:
         self.tensordict = tensordict
         self.include_nested = include_nested
         self.leaves_only = leaves_only
+        self.nodes_only = nodes_only
 
     def __iter__(self) -> Iterable[str] | Iterable[tuple[str, ...]]:
-        if not self.include_nested:
-            if self.leaves_only:
-                for key in self._keys():
-                    target_class = self.tensordict.entry_class(key)
-                    if _is_tensor_collection(target_class):
-                        continue
-                    yield key
-            else:
-                yield from self._keys()
-        else:
-            yield from (
-                key if len(key) > 1 else key[0]
-                for key in self._iter_helper(self.tensordict)
-            )
-
-    def _iter_helper(
-        self, tensordict: T, prefix: str | None = None
-    ) -> Iterable[str] | Iterable[tuple[str, ...]]:
-        for key, value in self._items(tensordict):
-            full_key = self._combine_keys(prefix, key)
-            cls = value.__class__
-            if self.include_nested and (
-                _is_tensor_collection(cls) or issubclass(cls, KeyedJaggedTensor)
-            ):
-                subkeys = tuple(self._iter_helper(value, prefix=full_key))
-                yield from subkeys
-            if not self.leaves_only or not _is_tensor_collection(cls):
-                yield full_key
-
-    def _combine_keys(self, prefix: tuple | None, key: str) -> tuple:
-        if prefix is not None:
-            return prefix + (key,)
-        return (key,)
+        if not self.nodes_only:
+            yield from self._tensor_keys()
+        if not self.leaves_only or self.include_nested:
+            for node_key in self._node_keys():
+                if not self.leaves_only:
+                    yield node_key
+                if self.include_nested:
+                    yield from (unravel_key((node_key, _key)) for _key in self.tensordict._get_str(node_key, NO_DEFAULT).keys(include_nested=True, leaves_only=self.leaves_only, nodes_only=self.nodes_only))
+
+    # def _iter_helper(
+    #     self, tensordict: T, prefix: str | None = None
+    # ) -> Iterable[str] | Iterable[tuple[str, ...]]:
+    #     for key, value in self._items(tensordict):
+    #         full_key = self._combine_keys(prefix, key)
+    #         cls = value.__class__
+    #         if self.include_nested and (
+    #             _is_tensor_collection(cls) or issubclass(cls, KeyedJaggedTensor)
+    #         ):
+    #             subkeys = tuple(self._iter_helper(value, prefix=full_key))
+    #             yield from subkeys
+    #         if not self.leaves_only or not _is_tensor_collection(cls):
+    #             yield full_key
+
+    # def _combine_keys(self, prefix: tuple | None, key: str) -> tuple:
+    #     if prefix is not None:
+    #         return prefix + (key,)
+    #     return (key,)
 
     def __len__(self) -> int:
         return sum(1 for _ in self)
 
-    def _items(
-        self, tensordict: TensorDictBase | None = None
-    ) -> Iterable[tuple[NestedKey, CompatibleType]]:
-        if tensordict is None:
-            tensordict = self.tensordict
-        if isinstance(tensordict, TensorDict) or is_tensorclass(tensordict):
-            return tensordict._tensordict.items()
-        if isinstance(tensordict, KeyedJaggedTensor):
-            return tuple((key, tensordict[key]) for key in tensordict.keys())
-        from tensordict._lazy import (
-            _CustomOpTensorDict,
-            _iter_items_lazystack,
-            LazyStackedTensorDict,
-        )
-
-        if isinstance(tensordict, LazyStackedTensorDict):
-            return _iter_items_lazystack(tensordict, return_none_for_het_values=True)
-        if isinstance(tensordict, _CustomOpTensorDict):
-            # it's possible that a TensorDict contains a nested LazyStackedTensorDict,
-            # or _CustomOpTensorDict, so as we iterate through the contents we need to
-            # be careful to not rely on tensordict._tensordict existing.
-            return (
-                (key, tensordict._get_str(key, NO_DEFAULT))
-                for key in tensordict._source.keys()
-            )
-        raise NotImplementedError(type(tensordict))
-
-    def _keys(self) -> _TensorDictKeysView:
+    #@classmethod
+    #def _items(
+    #    cls, tensordict: TensorDictBase | None = None
+    #) -> Iterable[tuple[NestedKey, CompatibleType]]:
+    #    if isinstance(tensordict, TensorDict) or is_tensorclass(tensordict):
+    #        return tensordict._tensordict.items()
+    #    if isinstance(tensordict, KeyedJaggedTensor):
+    #        return tuple((key, tensordict[key]) for key in tensordict.keys())
+    #    from tensordict._lazy import (
+    #        _CustomOpTensorDict,
+    #        _iter_items_lazystack,
+    #        LazyStackedTensorDict,
+    #    )
+
+    #    if isinstance(tensordict, LazyStackedTensorDict):
+    #        return _iter_items_lazystack(tensordict, return_none_for_het_values=True)
+    #    if isinstance(tensordict, _CustomOpTensorDict):
+    #        # it's possible that a TensorDict contains a nested LazyStackedTensorDict,
+    #        # or _CustomOpTensorDict, so as we iterate through the contents we need to
+    #        # be careful to not rely on tensordict._tensordict existing.
+    #        return (
+    #            (key, tensordict._get_str(key, NO_DEFAULT))
+    #            for key in tensordict._source.keys()
+    #        )
+    #    raise NotImplementedError(type(tensordict))
+
+    def _tensor_keys(self):
+        return self.tensordict._tensordict._tensor_dict.keys()
+    def _node_keys(self):
+        return self.tensordict._tensordict._dict_dict.keys()
+    def _keys(self):
         return self.tensordict._tensordict.keys()
 
     def __contains__(self, key: NestedKey) -> bool:
@@ -2498,46 +2582,56 @@ def __contains__(self, key: NestedKey) -> bool:
         if not key:
             raise TypeError(_NON_STR_KEY_ERR)
 
-        if isinstance(key, str):
-            if key in self._keys():
-                if self.leaves_only:
-                    return not _is_tensor_collection(self.tensordict.entry_class(key))
-                return True
+        if len(key) == 1:
+            return key[0] in self._keys()
+        if not self.include_nested:
             return False
-        else:
-            # thanks to _unravel_key_to_tuple we know the key is a tuple
-            if len(key) == 1:
-                return key[0] in self._keys()
-            elif self.include_nested:
-                if key[0] in self._keys():
-                    entry_type = self.tensordict.entry_class(key[0])
-                    if entry_type in (Tensor, _MemmapTensor):
-                        return False
-                    if entry_type is KeyedJaggedTensor:
-                        if len(key) > 2:
-                            return False
-                        return key[1] in self.tensordict.get(key[0]).keys()
-                    _is_tensordict = _is_tensor_collection(entry_type)
-                    if _is_tensordict:
-                        # # this will call _unravel_key_to_tuple many times
-                        # return key[1:] in self.tensordict._get_str(key[0], NO_DEFAULT).keys(include_nested=self.include_nested)
-                        # this won't call _unravel_key_to_tuple but requires to get the default which can be suboptimal
-                        leaf_td = self.tensordict._get_tuple(key[:-1], None)
-                        if leaf_td is None or (
-                            not _is_tensor_collection(leaf_td.__class__)
-                            and not isinstance(leaf_td, KeyedJaggedTensor)
-                        ):
-                            return False
-                        return key[-1] in leaf_td.keys()
-                return False
-            # this is reached whenever there is more than one key but include_nested is False
-            if all(isinstance(subkey, str) for subkey in key):
-                raise TypeError(_NON_STR_KEY_TUPLE_ERR)
+        if key[0] in self._node_keys():
+            other_keys = unravel_key(key[1:])
+            return other_keys in self.tensordict._get_str(key[0], default=NO_DEFAULT).keys(include_nested=isinstance(other_keys, tuple), leaves_only=self.leaves_only, nodes_only=self.nodes_only)
+        return False
+
+        # if isinstance(key, str):
+        #     if key in self._keys():
+        #         if self.leaves_only:
+        #             return not _is_tensor_collection(self.tensordict.entry_class(key))
+        #         return True
+        #     return False
+        # else:
+        #     # thanks to _unravel_key_to_tuple we know the key is a tuple
+        #     if len(key) == 1:
+        #         return key[0] in self._keys()
+        #     elif self.include_nested:
+        #         if key[0] in self._keys():
+        #             entry_type = self.tensordict.entry_class(key[0])
+        #             if entry_type in (Tensor, _MemmapTensor):
+        #                 return False
+        #             if entry_type is KeyedJaggedTensor:
+        #                 if len(key) > 2:
+        #                     return False
+        #                 return key[1] in self.tensordict.get(key[0]).keys()
+        #             _is_tensordict = _is_tensor_collection(entry_type)
+        #             if _is_tensordict:
+        #                 # # this will call _unravel_key_to_tuple many times
+        #                 # return key[1:] in self.tensordict._get_str(key[0], NO_DEFAULT).keys(include_nested=self.include_nested)
+        #                 # this won't call _unravel_key_to_tuple but requires to get the default which can be suboptimal
+        #                 leaf_td = self.tensordict._get_tuple(key[:-1], None)
+        #                 if leaf_td is None or (
+        #                     not _is_tensor_collection(leaf_td.__class__)
+        #                     and not isinstance(leaf_td, KeyedJaggedTensor)
+        #                 ):
+        #                     return False
+        #                 return key[-1] in leaf_td.keys()
+        #         return False
+        #     # this is reached whenever there is more than one key but include_nested is False
+        #     if all(isinstance(subkey, str) for subkey in key):
+        #         raise TypeError(_NON_STR_KEY_TUPLE_ERR)
 
     def __repr__(self):
         include_nested = f"include_nested={self.include_nested}"
         leaves_only = f"leaves_only={self.leaves_only}"
-        return f"{self.__class__.__name__}({list(self)},\n{indent(include_nested, 4*' ')},\n{indent(leaves_only, 4*' ')})"
+        nodes_only = f"leaves_only={self.nodes_only}"
+        return f"{self.__class__.__name__}({list(self)},\n{indent(include_nested, 4*' ')},\n{indent(leaves_only, 4*' ')},\n{indent(nodes_only, 4*' ')})"
 
 
 def _set_tensor_dict(  # noqa: F811
diff --git a/tensordict/base.py b/tensordict/base.py
index e9f0b7b5a..8d1765f29 100644
--- a/tensordict/base.py
+++ b/tensordict/base.py
@@ -36,7 +36,7 @@
     _shape,
     _split_tensordict,
     _td_fields,
-    _unravel_key_to_tuple,
+    _unravel_key_to_tuple,unravel_key,
     as_decorator,
     cache,
     convert_ellipsis_to_idx,
@@ -48,7 +48,7 @@
     lazy_legacy,
     lock_blocked,
     NestedKey,
-    prod,
+    prod, _NODES_LEAVES_ERR,
 )
 from torch import distributed as dist, multiprocessing as mp, nn, Tensor
 
@@ -2088,75 +2088,43 @@ def setdefault(
         return self.get(key)
 
     def items(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool = False,
     ) -> Iterator[tuple[str, CompatibleType]]:
         """Returns a generator of key-value pairs for the tensordict."""
         # check the conditions once only
-        if include_nested and leaves_only:
-            for k in self.keys():
-                val = self._get_str(k, NO_DEFAULT)
-                if _is_tensor_collection(val.__class__):
-                    yield from (
-                        (_unravel_key_to_tuple((k, _key)), _val)
-                        for _key, _val in val.items(
-                            include_nested=include_nested, leaves_only=leaves_only
-                        )
-                    )
-                else:
-                    yield k, val
-        elif include_nested:
-            for k in self.keys():
-                val = self._get_str(k, NO_DEFAULT)
-                yield k, val
-                if _is_tensor_collection(val.__class__):
-                    yield from (
-                        (_unravel_key_to_tuple((k, _key)), _val)
-                        for _key, _val in val.items(
-                            include_nested=include_nested, leaves_only=leaves_only
-                        )
-                    )
-        elif leaves_only:
-            for k in self.keys():
+        if nodes_only and leaves_only:
+            raise ValueError(_NODES_LEAVES_ERR)
+        if not nodes_only:
+            for k in self.keys(leaves_only=True):
+                yield k, self._get_str(k, NO_DEFAULT)
+        if not leaves_only or include_nested:
+            for k in self.keys(nodes_only=True):
                 val = self._get_str(k, NO_DEFAULT)
-                if not _is_tensor_collection(val.__class__):
+                if not leaves_only:
                     yield k, val
-        else:
-            for k in self.keys():
-                yield k, self._get_str(k, NO_DEFAULT)
+                if include_nested:
+                    yield from (unravel_key((k, subk)) for subk, val in val.items(leaves_only=leaves_only, nodes_only=nodes_only, include_nested=True))
 
     def values(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool = False
     ) -> Iterator[CompatibleType]:
         """Returns a generator representing the values for the tensordict."""
         # check the conditions once only
-        if include_nested and leaves_only:
-            for k in self.keys():
-                val = self._get_str(k, NO_DEFAULT)
-                if _is_tensor_collection(val.__class__):
-                    yield from val.values(
-                        include_nested=include_nested, leaves_only=leaves_only
-                    )
-                else:
-                    yield val
-        elif include_nested:
-            for k in self.keys():
-                val = self._get_str(k, NO_DEFAULT)
-                yield val
-                if _is_tensor_collection(val.__class__):
-                    yield from val.values(
-                        include_nested=include_nested, leaves_only=leaves_only
-                    )
-        elif leaves_only:
-            for k in self.keys():
+        if nodes_only and leaves_only:
+            raise ValueError(_NODES_LEAVES_ERR)
+        if not nodes_only:
+            for k in self.keys(leaves_only=True):
+                yield self._get_str(k, NO_DEFAULT)
+        if not leaves_only or include_nested:
+            for k in self.keys(nodes_only=True):
                 val = self._get_str(k, NO_DEFAULT)
-                if not _is_tensor_collection(val.__class__):
+                if not leaves_only:
                     yield val
-        else:
-            for k in self.keys():
-                yield self._get_str(k, NO_DEFAULT)
+                if include_nested:
+                    yield from val.values(leaves_only=leaves_only, nodes_only=nodes_only, include_nested=True)
 
     @abc.abstractmethod
-    def keys(self, include_nested: bool = False, leaves_only: bool = False):
+    def keys(self, include_nested: bool = False, leaves_only: bool = False, nodes_only:bool = False):
         """Returns a generator of tensordict keys."""
         ...
 
diff --git a/tensordict/nn/params.py b/tensordict/nn/params.py
index 9b713a3f9..1e857fb79 100644
--- a/tensordict/nn/params.py
+++ b/tensordict/nn/params.py
@@ -865,13 +865,14 @@ def __repr__(self):
         return f"TensorDictParams(params={self._param_td})"
 
     def values(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool = False,
     ) -> Iterator[CompatibleType]:
-        for v in self._param_td.values(include_nested, leaves_only):
-            if _is_tensor_collection(type(v)):
+        if not nodes_only:
+            for v in self._param_td.values(include_nested, leaves_only=True):
+                yield self._apply_get_post_hook(v)
+        if not leaves_only:
+            for v in self._param_td.values(include_nested, nodes_only=True):
                 yield v
-                continue
-            yield self._apply_get_post_hook(v)
 
     def state_dict(
         self, *args, destination=None, prefix="", keep_vars=False, flatten=True
@@ -928,14 +929,24 @@ def _load_from_state_dict(
         )
         self.data.load_state_dict(data)
 
+    @_fallback
     def items(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool=False,
     ) -> Iterator[CompatibleType]:
-        for k, v in self._param_td.items(include_nested, leaves_only):
-            if _is_tensor_collection(type(v)):
+        if not nodes_only:
+            # we also need leaves
+            for k, v in self._param_td.items(
+                leaves_only=True,
+                include_nested=include_nested,
+                ):
+                yield k, self._apply_get_post_hook(v)
+        if not leaves_only:
+            # we also need nodes
+            for k, v in self._param_td.items(
+                nodes_only=True,
+                include_nested=include_nested,
+            ):
                 yield k, v
-                continue
-            yield k, self._apply_get_post_hook(v)
 
     def _apply(self, fn, recurse=True):
         """Modifies torch.nn.Module._apply to work with Buffer class."""
diff --git a/tensordict/persistent.py b/tensordict/persistent.py
index 7f0ce86a6..1c67168a1 100644
--- a/tensordict/persistent.py
+++ b/tensordict/persistent.py
@@ -71,10 +71,14 @@ def __iter__(self):
                 for key in visitor:
                     if self.tensordict._get_metadata(key).get("array", None):
                         yield key
+            elif self.nodes_only:
+                for key in visitor:
+                    if not self.tensordict._get_metadata(key).get("array", None):
+                        yield key
             else:
                 yield from visitor
         else:
-            yield from self.tensordict._valid_keys()
+            yield from self.tensordict._valid_keys(nodes_only=self.nodes_only, leaves_only=self.leaves_only)
 
     def __contains__(self, key):
         if isinstance(key, tuple) and len(key) == 1:
@@ -405,21 +409,33 @@ def __setitem__(self, index, value):
         sub_td.update(value, inplace=True)
 
     @cache  # noqa: B019
-    def _valid_keys(self):
+    def _valid_keys(self, leaves_only=False, nodes_only=False):
         keys = []
-        for key in self.file.keys():
-            if self._get_metadata(key):
-                keys.append(key)
+        if not leaves_only and not nodes_only:
+            for key in self.file.keys():
+                if self._get_metadata(key):
+                    keys.append(key)
+        elif leaves_only:
+            for key, val in self.file.items():
+                if self._get_metadata(key).get('dtype', None):
+                    keys.append(key)
+        elif nodes_only:
+            for key, val in self.file.items():
+                if self._get_metadata(key).get('dtype', NO_DEFAULT) is None:
+                    keys.append(key)
         return keys
 
+
+
     # @cache  # noqa: B019
     def keys(
-        self, include_nested: bool = False, leaves_only: bool = False
+        self, include_nested: bool = False, leaves_only: bool = False, nodes_only: bool = False,
     ) -> _PersistentTDKeysView:
         return _PersistentTDKeysView(
             tensordict=self,
             include_nested=include_nested,
             leaves_only=leaves_only,
+            nodes_only=nodes_only,
         )
 
     def _items_metadata(self, include_nested=False, leaves_only=False):
diff --git a/tensordict/utils.py b/tensordict/utils.py
index 8c462d1dc..a50f1727c 100644
--- a/tensordict/utils.py
+++ b/tensordict/utils.py
@@ -1041,6 +1041,7 @@ def new_fun(self, *args, **kwargs):
 
 _NON_STR_KEY_TUPLE_ERR = "Nested membership checks with tuples of strings is only supported when setting `include_nested=True`."
 _NON_STR_KEY_ERR = "TensorDict keys are always strings. Membership checks are only supported for strings or non-empty tuples of strings (for nested TensorDicts)"
+_NODES_LEAVES_ERR = "leaves_only and nodes_only are exclusive arguments."
 _GENERIC_NESTED_ERR = "Only NestedKeys are supported. Got key {}."
 
 
@@ -1061,9 +1062,15 @@ def __contains__(self, item):
                 item = unravel_item[0]
         return super().__contains__(item)
 
+    def __add__(self, other):
+        return _StringKeys((*self, *other))
 
-class _StringOnlyDict(dict):
-    """A dict class where contains is restricted to strings."""
+class _StringOnlyDoubleDict:
+    """A dict class where contains is restricted to strings.
+
+    Keys are sorted in two different dictionaries, depending on whether they are of Tensor
+    type or not.
+    """
 
     # kept here for debugging
     # def __setitem__(self, key, value):
@@ -1071,6 +1078,23 @@ class _StringOnlyDict(dict):
     #         raise RuntimeError
     #     return super().__setitem__(key, value)
 
+    def __init__(self, *args, **kwargs):
+        self._tensor_dict = {}
+        self._dict_dict = {}
+        if args:
+            if len(args) > 1:
+                raise TypeError("Expected at most one argument.")
+            if isinstance(args[0], _StringOnlyDoubleDict):
+                self._tensor_dict.update(args[0]._tensor_dict)
+                self._dict_dict.update(args[0]._dict_dict)
+            else:
+                kwargs.update(args[0])
+        for key, item in kwargs.items():
+            if isinstance(item, torch.Tensor):
+                self._tensor_dict[key] = item
+            else:
+                self._dict_dict[key] = item
+
     def __contains__(self, item):
         if not isinstance(item, str):
             try:
@@ -1083,11 +1107,104 @@ def __contains__(self, item):
                 raise TypeError(_NON_STR_KEY_TUPLE_ERR)
             else:
                 item = unravel_item[0]
-        return super().__contains__(item)
-
-    def keys(self):
-        return _StringKeys(self)
-
+        return (item in self._tensor_dict) or (item in self._dict_dict)
+
+    def __getitem__(self, key):
+      result = self._tensor_dict.get(key, None)
+      if result is None:
+          return self._dict_dict[key]
+      return result
+
+    def __setitem__(self, key, value):
+      if isinstance(value, torch.Tensor):
+          self._tensor_dict[key] = value
+          self._dict_dict.pop(key, None)
+      else:
+          self._dict_dict[key] = value
+          self._tensor_dict.pop(key, None)
+
+    def __iter__(self):
+      yield from self._tensor_dict
+      yield from self._dict_dict
+
+    def keys(self, leaves_only=False, nodes_only=False):
+        if leaves_only:
+            return _StringKeys(self._tensor_dict.keys())
+        if nodes_only:
+            return _StringKeys(self._dict_dict.keys())
+        return _StringKeys(self._tensor_dict.keys()) + _StringKeys(self._dict_dict.keys())
+
+    def keys_tensors(self):
+        return self._tensor_dict.keys()
+
+    def items(self, leaves_only=False, nodes_only=False):
+        if not nodes_only:
+            yield from self._tensor_dict.items()
+        if not leaves_only:
+            yield from self._dict_dict.items()
+
+    def items_tensors(self):
+      return self._tensor_dict.items()
+
+    def values(self, leaves_only=False, nodes_only=False):
+        if not nodes_only:
+            yield from self._tensor_dict.values()
+        if not leaves_only:
+            yield from self._dict_dict.values()
+
+    def list(self):
+        return list(self.keys())
+
+    def len(self):
+        return len(self._tensor_dict) + len(self._dict_dict)
+
+    def __delitem__(self, key):
+        val = self._tensor_dict.pop(key, None)
+        if val is None:
+            del self._dict_dict[key]
+    def get(self, key, *args, **kwargs):
+        if not args and not kwargs:
+            return self[key]
+        default = args[0] if args else kwargs['default']
+        val = self._tensor_dict.get(key, None)
+        if val is None:
+            return self._dict_dict.get(key, default)
+        return val
+    def pop(self, key, *args, **kwargs):
+        if not args and not kwargs:
+            val = self._tensor_dict.pop(key, None)
+            if val is None:
+                return self._dict_dict.pop(key)
+            return val
+        default = args[0] if args else kwargs['default']
+        val = self._tensor_dict.pop(key, None)
+        if val is None:
+            return self._dict_dict.pop(key, default)
+        return val
+    def copy(self):
+        return type(self)(self)
+
+    def popitem(self):
+        raise NotImplementedError(f"Cannot execute popitem on {type(self)} as the insertion order isn't guaranteed.")
+
+    def reversed(self):
+        return reversed(self.keys())
+    def setdefault(self, key, *args, **kwargs):
+        if not args and not kwargs:
+            return self.get(key, None)
+        if key in self._tensor_dict:
+            return self._tensor_dict[key]
+        if key in self._dict_dict:
+            return self._dict_dict[key]
+        default = args[0] if args else kwargs['default']
+        if isinstance(default, torch.Tensor):
+            return self._tensor_dict.setdefault(key, default=default)
+        return self._dict_dict.setdefault(key, default=default)
+    def update(self, other):
+        for key, item in other.items():
+            self[key] = item
+    def __or__(self, other):
+        return _StringOnlyDoubleDict(self, **other)
 
 def lock_blocked(func):
     """Checks that the tensordict is unlocked before executing a function."""
diff --git a/test/test_tensordict.py b/test/test_tensordict.py
index 2a28e4042..bbd188bd4 100644
--- a/test/test_tensordict.py
+++ b/test/test_tensordict.py
@@ -2339,8 +2339,9 @@ def test_items_values_keys(self, td_name, device):
         values = list(td.values())
         items = list(td.items())
 
-        # Test that keys is still sorted after adding the element
-        assert all(keys[i] <= keys[i + 1] for i in range(len(keys) - 1))
+        # This is now broken due to the double-dict backend
+        # # Test that keys is still sorted after adding the element
+        # assert all(keys[i] <= keys[i + 1] for i in range(len(keys) - 1))
 
         # Test td.items()
         # after adding the new element