PaddlePaddle · YuanRisheng · Mar 24, 2023 · Feb 24, 2023 · Feb 24, 2023 · Feb 24, 2023
diff --git a/paddle/fluid/distributed/collective/process_group_bkcl.cc b/paddle/fluid/distributed/collective/process_group_bkcl.cc
@@ -197,9 +197,8 @@ void ProcessGroupBKCL::CreateBKCLEnvCache(const Place& place,
   // must use XPUDeviceContext here to make sure XPUContext::Init() is called
   auto comm_ctx = std::make_unique<XPUDeviceContext>(place);
   // set allocator
-  comm_ctx->SetAllocator(memory::allocation::AllocatorFacade::Instance()
-                             .GetAllocator(place)
-                             .get());
+  comm_ctx->SetAllocator(
+      memory::allocation::AllocatorFacade::Instance().GetAllocator(place));
 
   BKCLContext_t bkcl_comm;
   BKCLCHECK(bkcl_init_rank(&bkcl_comm, GetRank(), GetSize(), &bkcl_id));

diff --git a/paddle/fluid/framework/data_type_transform_test.cu b/paddle/fluid/framework/data_type_transform_test.cu
@@ -20,9 +20,9 @@ TEST(DataTypeTransform, GPUTransform) {
   auto cpu_place = paddle::platform::CPUPlace();
   auto gpu_place = paddle::platform::CUDAPlace(0);
   phi::GPUContext context(gpu_place);
-  context.SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                           .GetAllocator(gpu_place, context.stream())
-                           .get());
+  context.SetAllocator(
+      paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+          gpu_place, context.stream()));
   context.PartialInitWithAllocator();
 
   auto kernel_fp16 = phi::KernelKey(

diff --git a/paddle/fluid/framework/tensor_util.cc b/paddle/fluid/framework/tensor_util.cc
@@ -156,8 +156,7 @@ void TensorCopyImpl(const TENSOR& src,
     auto npu_pinned_allocator =
         static_cast<paddle::memory::allocation::NPUPinnedAllocator*>(
             paddle::memory::allocation::AllocatorFacade::Instance()
-                .GetAllocator(npu_pinned_place)
-                .get());
+                .GetAllocator(npu_pinned_place));
     phi::Allocation* allocation = npu_pinned_tensor.Holder().get();
     npu_pinned_allocator->RecordEvent(
         allocation,

diff --git a/paddle/fluid/framework/tensor_util.h b/paddle/fluid/framework/tensor_util.h
@@ -168,8 +168,7 @@ void TensorFromArray(const T* src,
     auto npu_pinned_allocator =
         static_cast<paddle::memory::allocation::NPUPinnedAllocator*>(
             paddle::memory::allocation::AllocatorFacade::Instance()
-                .GetAllocator(npu_pinned_place)
-                .get());
+                .GetAllocator(npu_pinned_place));
     phi::Allocation* allocation = npu_pinned_tensor.Holder().get();
     npu_pinned_allocator->RecordEvent(
         allocation,
@@ -255,8 +254,7 @@ void TensorFromVector(const std::vector<T>& src,
     auto npu_pinned_allocator =
         static_cast<paddle::memory::allocation::NPUPinnedAllocator*>(
             paddle::memory::allocation::AllocatorFacade::Instance()
-                .GetAllocator(npu_pinned_place)
-                .get());
+                .GetAllocator(npu_pinned_place));
     phi::Allocation* allocation = npu_pinned_tensor.Holder().get();
     npu_pinned_allocator->RecordEvent(
         allocation,
@@ -347,8 +345,7 @@ inline void TensorFromVector(const std::vector<bool>& src,
     auto npu_pinned_allocator =
         static_cast<paddle::memory::allocation::NPUPinnedAllocator*>(
             paddle::memory::allocation::AllocatorFacade::Instance()
-                .GetAllocator(npu_pinned_place)
-                .get());
+                .GetAllocator(npu_pinned_place));
     phi::Allocation* allocation = npu_pinned_tensor.Holder().get();
     npu_pinned_allocator->RecordEvent(
         allocation,

diff --git a/paddle/fluid/framework/tensor_util_test.cc b/paddle/fluid/framework/tensor_util_test.cc
@@ -73,9 +73,9 @@ TEST(TensorCopy, Tensor) {
     // CPU phi::DenseTensor to GPU phi::DenseTensor
     auto gpu_place = new platform::CUDAPlace(0);
     phi::GPUContext gpu_ctx(*gpu_place);
-    gpu_ctx.SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                             .GetAllocator(*gpu_place, gpu_ctx.stream())
-                             .get());
+    gpu_ctx.SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            *gpu_place, gpu_ctx.stream()));
     gpu_ctx.PartialInitWithAllocator();
     TensorCopy(src_tensor, *gpu_place, gpu_ctx, &gpu_tensor);
 
@@ -170,9 +170,9 @@ TEST(TensorFromVector, Tensor) {
     gpu_tensor.Resize(phi::make_ddim({3, 3}));
     auto gpu_place = new paddle::platform::CUDAPlace();
     phi::GPUContext gpu_ctx(*gpu_place);
-    gpu_ctx.SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                             .GetAllocator(*gpu_place, gpu_ctx.stream())
-                             .get());
+    gpu_ctx.SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            *gpu_place, gpu_ctx.stream()));
     gpu_ctx.PartialInitWithAllocator();
     paddle::framework::TensorFromVector<int>(src_vec, gpu_ctx, &gpu_tensor);
     // Copy from GPU to CPU tensor for comparison
@@ -238,9 +238,9 @@ TEST(TensorToVector, Tensor) {
     phi::DenseTensor gpu_tensor;
     paddle::platform::CUDAPlace place;
     phi::GPUContext gpu_ctx(place);
-    gpu_ctx.SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                             .GetAllocator(place, gpu_ctx.stream())
-                             .get());
+    gpu_ctx.SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            place, gpu_ctx.stream()));
     gpu_ctx.PartialInitWithAllocator();
     paddle::framework::TensorFromVector<int>(src_vec, gpu_ctx, &gpu_tensor);
 
@@ -285,9 +285,9 @@ TEST(TensorToVector, Tensor_bool) {
     phi::DenseTensor gpu_tensor;
     paddle::platform::CUDAPlace place;
     phi::GPUContext gpu_ctx(place);
-    gpu_ctx.SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                             .GetAllocator(place, gpu_ctx.stream())
-                             .get());
+    gpu_ctx.SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            place, gpu_ctx.stream()));
     gpu_ctx.PartialInitWithAllocator();
     paddle::framework::TensorFromVector<bool>(src_vec, gpu_ctx, &gpu_tensor);
 
@@ -523,9 +523,9 @@ TEST(Tensor, FromAndToStream) {
 
     auto gpu_place = new platform::CUDAPlace();
     phi::GPUContext gpu_ctx(*gpu_place);
-    gpu_ctx.SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                             .GetAllocator(*gpu_place, gpu_ctx.stream())
-                             .get());
+    gpu_ctx.SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            *gpu_place, gpu_ctx.stream()));
     gpu_ctx.PartialInitWithAllocator();
 
     TensorCopy(src_tensor, *gpu_place, gpu_ctx, &gpu_tensor);

diff --git a/paddle/fluid/imperative/gloo_context.cc b/paddle/fluid/imperative/gloo_context.cc
@@ -48,17 +48,15 @@ void GLOOParallelContext::Init() {
   gloo_wrapper->Init();
   device_ = std::unique_ptr<phi::CPUContext>(
       new phi::CPUContext(platform::CPUPlace()));
-  device_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                            .GetAllocator(platform::CPUPlace())
-                            .get());
+  device_->SetAllocator(
+      paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+          platform::CPUPlace()));
   device_->SetHostAllocator(
-      paddle::memory::allocation::AllocatorFacade::Instance()
-          .GetAllocator(paddle::platform::CPUPlace())
-          .get());
+      paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+          paddle::platform::CPUPlace()));
   device_->SetZeroAllocator(
-      paddle::memory::allocation::AllocatorFacade::Instance()
-          .GetZeroAllocator(platform::CPUPlace())
-          .get());
+      paddle::memory::allocation::AllocatorFacade::Instance().GetZeroAllocator(
+          platform::CPUPlace()));
 }
 
 void GLOOParallelContext::InitWithRingID(int ring_id) {

diff --git a/paddle/fluid/inference/api/analysis_predictor.cc b/paddle/fluid/inference/api/analysis_predictor.cc
@@ -421,25 +421,20 @@ void AnalysisPredictor::InitDeviceContexts() {
               ResourceManager::Instance().GetGPUResource(predictor_stream_);
           auto *gpu_context = new InferGPUContext(place_);
           gpu_context->SetAllocator(
-              memory::allocation::AllocatorFacade::Instance()
-                  .GetAllocator(place_, gpu_resource->GetStream())
-                  .get());
+              memory::allocation::AllocatorFacade::Instance().GetAllocator(
+                  place_, gpu_resource->GetStream()));
           gpu_context->SetPinnedAllocator(
-              memory::allocation::AllocatorFacade::Instance()
-                  .GetAllocator(paddle::platform::CUDAPinnedPlace())
-                  .get());
+              memory::allocation::AllocatorFacade::Instance().GetAllocator(
+                  paddle::platform::CUDAPinnedPlace()));
           gpu_context->SetHostAllocator(
-              memory::allocation::AllocatorFacade::Instance()
-                  .GetAllocator(platform::CPUPlace())
-                  .get());
+              memory::allocation::AllocatorFacade::Instance().GetAllocator(
+                  platform::CPUPlace()));
           gpu_context->SetZeroAllocator(
-              memory::allocation::AllocatorFacade::Instance()
-                  .GetZeroAllocator(place_)
-                  .get());
+              memory::allocation::AllocatorFacade::Instance().GetZeroAllocator(
+                  place_));
           gpu_context->SetHostZeroAllocator(
-              memory::allocation::AllocatorFacade::Instance()
-                  .GetZeroAllocator(platform::CPUPlace())
-                  .get());
+              memory::allocation::AllocatorFacade::Instance().GetZeroAllocator(
+                  platform::CPUPlace()));
           gpu_context->SetGenerator(
               phi::DefaultCUDAGenerator(place_.GetDeviceId()).get());
           gpu_context->SetHostGenerator(phi::DefaultCPUGenerator().get());
@@ -472,8 +467,7 @@ void AnalysisPredictor::InitDeviceContexts() {
                   << ", allotor ptr is "
                   << reinterpret_cast<void *>(
                          memory::allocation::AllocatorFacade::Instance()
-                             .GetAllocator(place_, gpu_resource->GetStream())
-                             .get());
+                             .GetAllocator(place_, gpu_resource->GetStream()));
           return std::unique_ptr<phi::DeviceContext>(gpu_context);
         }));
   }

diff --git a/paddle/fluid/inference/api/resource_manager.cc b/paddle/fluid/inference/api/resource_manager.cc
@@ -182,9 +182,9 @@ void GPUContextResource::InitGpuProperties() {
 }
 
 void GPUContextResource::InitGpuEigenDevice() {
-  auto* allocator = paddle::memory::allocation::AllocatorFacade::Instance()
-                        .GetAllocator(place_)
-                        .get();
+  auto* allocator =
+      paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+          place_);
   eigen_stream_.reset(new internal::EigenGpuStreamDevice());
   eigen_stream_->Reinitialize(stream_, allocator, place_);
   gpu_eigen_device_.reset(new Eigen::GpuDevice(eigen_stream_.get()));
@@ -435,9 +435,9 @@ void GPUContextResource::ReBindSparseHandle(gpuStream_t stream) const {
 void GPUContextResource::ReBindEigenDevice(gpuStream_t stream,
                                            GPUPlace place) const {
   if (eigen_stream_) {
-    auto* allocator = paddle::memory::allocation::AllocatorFacade::Instance()
-                          .GetAllocator(place_)
-                          .get();
+    auto* allocator =
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            place_);
     eigen_stream_->Reinitialize(stream, allocator, place);
   }
 }

diff --git a/paddle/fluid/inference/lite/test_engine_lite.cc b/paddle/fluid/inference/lite/test_engine_lite.cc
@@ -75,9 +75,9 @@ void make_fake_model(std::string* model, std::string* param) {
 #if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
   platform::CUDAPlace place;
   phi::GPUContext ctx(place);
-  ctx.SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                       .GetAllocator(place, ctx.stream())
-                       .get());
+  ctx.SetAllocator(
+      paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+          place, ctx.stream()));
   ctx.PartialInitWithAllocator();
 #else
   platform::CPUPlace place;

diff --git a/paddle/fluid/inference/tensorrt/test_dynamic_engine.cc b/paddle/fluid/inference/tensorrt/test_dynamic_engine.cc
@@ -36,21 +36,18 @@ class TensorRTDynamicShapeValueEngineTest : public ::testing::Test {
  protected:
   void SetUp() override {
     ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
-    ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                           .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
-                           .get());
+    ctx_->SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            platform::CUDAPlace(0), ctx_->stream()));
     ctx_->SetHostAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CPUPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CPUPlace()));
     ctx_->SetZeroAllocator(
         paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetZeroAllocator(platform::CUDAPlace(0))
-            .get());
+            .GetZeroAllocator(platform::CUDAPlace(0)));
     ctx_->SetPinnedAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CUDAPinnedPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CUDAPinnedPlace()));
     ctx_->PartialInitWithAllocator();
 
     std::map<std::string, std::vector<int>> min_input_shape = {
@@ -167,21 +164,18 @@ class TensorRTDynamicEngineTest : public ::testing::Test {
  protected:
   void SetUp() override {
     ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
-    ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                           .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
-                           .get());
+    ctx_->SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            platform::CUDAPlace(0), ctx_->stream()));
     ctx_->SetHostAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CPUPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CPUPlace()));
     ctx_->SetZeroAllocator(
         paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetZeroAllocator(platform::CUDAPlace(0))
-            .get());
+            .GetZeroAllocator(platform::CUDAPlace(0)));
     ctx_->SetPinnedAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CUDAPinnedPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CUDAPinnedPlace()));
     ctx_->PartialInitWithAllocator();
 
     std::map<std::string, std::vector<int>> min_input_shape = {
@@ -335,21 +329,18 @@ class TensorRTDynamicTestFusedTokenPrune : public ::testing::Test {
  protected:
   void SetUp() override {
     ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
-    ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                           .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
-                           .get());
+    ctx_->SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            platform::CUDAPlace(0), ctx_->stream()));
     ctx_->SetHostAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CPUPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CPUPlace()));
     ctx_->SetZeroAllocator(
         paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetZeroAllocator(platform::CUDAPlace(0))
-            .get());
+            .GetZeroAllocator(platform::CUDAPlace(0)));
     ctx_->SetPinnedAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CUDAPinnedPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CUDAPinnedPlace()));
     ctx_->PartialInitWithAllocator();
 
     std::map<std::string, std::vector<int>> min_input_shape = {
@@ -543,21 +534,18 @@ class TensorRTDynamicTestFusedTokenPruneHalf : public ::testing::Test {
  protected:
   void SetUp() override {
     ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
-    ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                           .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
-                           .get());
+    ctx_->SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            platform::CUDAPlace(0), ctx_->stream()));
     ctx_->SetHostAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CPUPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CPUPlace()));
     ctx_->SetZeroAllocator(
         paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetZeroAllocator(platform::CUDAPlace(0))
-            .get());
+            .GetZeroAllocator(platform::CUDAPlace(0)));
     ctx_->SetPinnedAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CUDAPinnedPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CUDAPinnedPlace()));
     ctx_->PartialInitWithAllocator();
 
     std::map<std::string, std::vector<int>> min_input_shape = {
@@ -751,21 +739,18 @@ class TensorRTDynamicShapeGNTest : public ::testing::Test {
  protected:
   void SetUp() override {
     ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
-    ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
-                           .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
-                           .get());
+    ctx_->SetAllocator(
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            platform::CUDAPlace(0), ctx_->stream()));
     ctx_->SetHostAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CPUPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CPUPlace()));
     ctx_->SetZeroAllocator(
         paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetZeroAllocator(platform::CUDAPlace(0))
-            .get());
+            .GetZeroAllocator(platform::CUDAPlace(0)));
     ctx_->SetPinnedAllocator(
-        paddle::memory::allocation::AllocatorFacade::Instance()
-            .GetAllocator(paddle::platform::CUDAPinnedPlace())
-            .get());
+        paddle::memory::allocation::AllocatorFacade::Instance().GetAllocator(
+            paddle::platform::CUDAPinnedPlace()));
     ctx_->PartialInitWithAllocator();
 
     std::map<std::string, std::vector<int>> min_input_shape = {