Fix Parsing for DeviceParser

anutosh491 · anutosh491 · commit ee374eed24ec · 2025-04-22T11:22:40.000+05:30
diff --git a/clang/lib/Interpreter/DeviceOffload.cpp b/clang/lib/Interpreter/DeviceOffload.cpp
@@ -28,10 +28,10 @@ IncrementalCUDADeviceParser::IncrementalCUDADeviceParser(
     std::unique_ptr<CompilerInstance> DeviceInstance,
     CompilerInstance &HostInstance,
     llvm::IntrusiveRefCntPtr<llvm::vfs::InMemoryFileSystem> FS,
-    llvm::Error &Err, const std::list<PartialTranslationUnit> &PTUs)
+    llvm::Error &Err, std::list<PartialTranslationUnit> &PTUs)
     : IncrementalParser(*DeviceInstance, Err), PTUs(PTUs), VFS(FS),
-      CodeGenOpts(HostInstance.getCodeGenOpts()),
-      TargetOpts(HostInstance.getTargetOpts()) {
+      CodeGenOpts(DeviceInstance->getCodeGenOpts()),
+      TargetOpts(DeviceInstance->getTargetOpts()) {
   if (Err)
     return;
   StringRef Arch = TargetOpts.CPU;
@@ -51,37 +51,61 @@ IncrementalCUDADeviceParser::Parse(llvm::StringRef Input) {
   if (!PTU)
     return PTU.takeError();
 
-  auto PTX = GeneratePTX();
-  if (!PTX)
-    return PTX.takeError();
+  // auto PTX = GeneratePTX();
+  // if (!PTX)
+  //   return PTX.takeError();
 
-  auto Err = GenerateFatbinary();
-  if (Err)
-    return std::move(Err);
+  // auto Err = GenerateFatbinary();
+  // if (Err)
+  //   return std::move(Err);
 
-  std::string FatbinFileName =
-      "/incr_module_" + std::to_string(PTUs.size()) + ".fatbin";
-  VFS->addFile(FatbinFileName, 0,
-               llvm::MemoryBuffer::getMemBuffer(
-                   llvm::StringRef(FatbinContent.data(), FatbinContent.size()),
-                   "", false));
+  // std::string FatbinFileName =
+  //     "/incr_module_" + std::to_string(PTUs.size()) + ".fatbin";
+  // VFS->addFile(FatbinFileName, 0,
+  //              llvm::MemoryBuffer::getMemBuffer(
+  //                  llvm::StringRef(FatbinContent.data(), FatbinContent.size()),
+  //                  "", false));
 
-  CodeGenOpts.CudaGpuBinaryFileName = FatbinFileName;
+  // CodeGenOpts.CudaGpuBinaryFileName = FatbinFileName;
 
-  FatbinContent.clear();
+  // FatbinContent.clear();
 
   return PTU;
 }
 
+PartialTranslationUnit &
+IncrementalCUDADeviceParser::RegisterPTU(TranslationUnitDecl *TU) {
+  llvm::errs() << "[CUDA] RegisterPTU called. TU = " << TU << "\n";
+  PTUs.push_back(PartialTranslationUnit());
+  llvm::errs() << "[CUDA] PTUs size after push: " << PTUs.size() << "\n";
+  PartialTranslationUnit &LastPTU = PTUs.back();
+  LastPTU.TUPart = TU;
+  return LastPTU;
+}
+
 llvm::Expected<llvm::StringRef> IncrementalCUDADeviceParser::GeneratePTX() {
+  llvm::errs() << "[CUDA] Generating PTX. PTUs size: " << PTUs.size() << "\n";
+  assert(!PTUs.empty() && "PTUs list is empty during PTX generation!");
   auto &PTU = PTUs.back();
   std::string Error;
 
+  if (!PTU.TheModule) {
+    llvm::errs() << "[CUDA] Error: PTU has no associated Module!\n";
+  } else {
+    llvm::errs() << "[CUDA] Module Triple: " << PTU.TheModule->getTargetTriple().str() << "\n";
+  }
+
+  llvm::errs() << ">>> PTU Module Target Triple: " << PTU.TheModule->getTargetTriple().str() << "\n";
+  llvm::errs() << ">>> Using CPU: " << TargetOpts.CPU << "\n";
+
   const llvm::Target *Target = llvm::TargetRegistry::lookupTarget(
       PTU.TheModule->getTargetTriple(), Error);
-  if (!Target)
+  if (!Target) {
+    llvm::errs() << ">>> Failed to lookup target: " << Error << "\n";
     return llvm::make_error<llvm::StringError>(std::move(Error),
                                                std::error_code());
+  }
+
   llvm::TargetOptions TO = llvm::TargetOptions();
   llvm::TargetMachine *TargetMachine = Target->createTargetMachine(
       PTU.TheModule->getTargetTriple(), TargetOpts.CPU, "", TO,
@@ -173,9 +197,33 @@ llvm::Error IncrementalCUDADeviceParser::GenerateFatbinary() {
 
   FatbinContent.append(PTXCode.begin(), PTXCode.end());
 
+  std::string FatbinFileName =
+      "/incr_module_" + std::to_string(PTUs.size()) + ".fatbin";
+
+  VFS->addFile(FatbinFileName, 0,
+               llvm::MemoryBuffer::getMemBuffer(
+                   llvm::StringRef(FatbinContent.data(), FatbinContent.size()),
+                   "", false));
+
+  CodeGenOpts.CudaGpuBinaryFileName = FatbinFileName;
+
+  FatbinContent.clear();
+
   return llvm::Error::success();
 }
 
+// void IncrementalCUDADeviceParser::EmitFatbinaryToVFS(std::string &FatbinFileName) {
+//   std::string FatbinFileName = "/incr_module_" + std::to_string(PTUs.size()) + ".fatbin";
+
+//   VFS->addFile(FatbinFileName, 0,
+//                llvm::MemoryBuffer::getMemBuffer(
+//                    llvm::StringRef(FatbinContent.data(), FatbinContent.size()),
+//                    "", false));
+
+//   CodeGenOpts.CudaGpuBinaryFileName = FatbinFileName;
+//   FatbinContent.clear();
+// }
+
 IncrementalCUDADeviceParser::~IncrementalCUDADeviceParser() {}
 
 } // namespace clang
diff --git a/clang/lib/Interpreter/DeviceOffload.h b/clang/lib/Interpreter/DeviceOffload.h
@@ -24,14 +24,14 @@ class CodeGenOptions;
 class TargetOptions;
 
 class IncrementalCUDADeviceParser : public IncrementalParser {
-  const std::list<PartialTranslationUnit> &PTUs;
+  std::list<PartialTranslationUnit> &PTUs;
 
 public:
   IncrementalCUDADeviceParser(
       std::unique_ptr<CompilerInstance> DeviceInstance,
       CompilerInstance &HostInstance,
       llvm::IntrusiveRefCntPtr<llvm::vfs::InMemoryFileSystem> VFS,
-      llvm::Error &Err, const std::list<PartialTranslationUnit> &PTUs);
+      llvm::Error &Err, std::list<PartialTranslationUnit> &PTUs);
 
   llvm::Expected<TranslationUnitDecl *> Parse(llvm::StringRef Input) override;
 
@@ -41,6 +41,9 @@ class IncrementalCUDADeviceParser : public IncrementalParser {
   // Generate fatbinary contents in memory
   llvm::Error GenerateFatbinary();
 
+  PartialTranslationUnit &RegisterPTU(TranslationUnitDecl *TU);
+  // llvm::Expected<TranslationUnitDecl *> Parse(llvm::StringRef Input) override;
+
   ~IncrementalCUDADeviceParser();
 
 protected:
diff --git a/clang/lib/Interpreter/Interpreter.cpp b/clang/lib/Interpreter/Interpreter.cpp
@@ -561,9 +561,50 @@ Interpreter::Parse(llvm::StringRef Code) {
   // If we have a device parser, parse it first. The generated code will be
   // included in the host compilation
   if (DeviceParser) {
+    llvm::errs() << "[CUDA] Parsing device code...\n";
     llvm::Expected<TranslationUnitDecl *> DeviceTU = DeviceParser->Parse(Code);
-    if (auto E = DeviceTU.takeError())
+    if (auto E = DeviceTU.takeError()) {
+      llvm::errs() << "[CUDA] Device Parse failed!\n";
       return std::move(E);
+    }
+    llvm::errs() << "[CUDA] Device parse successful.\n";
+
+    auto *CudaParser = llvm::cast<IncrementalCUDADeviceParser>(DeviceParser.get());
+    llvm::errs() << "[CUDA] Registering device PTU...\n";
+
+    PartialTranslationUnit &DevicePTU = CudaParser->RegisterPTU(*DeviceTU);
+    FrontendAction *WrappedAct = Act->getWrapped();
+    if (!WrappedAct->hasIRSupport()) {
+      llvm::errs() << "[CUDA] Error: WrappedAct has no IR support!\n";
+      return llvm::make_error<llvm::StringError>(
+          "Device action has no IR support", llvm::inconvertibleErrorCode());
+    }
+
+    CodeGenerator *CG = static_cast<CodeGenAction *>(WrappedAct)->getCodeGenerator();
+    if (!CG) {
+      llvm::errs() << "[CUDA] Error: CodeGen is null!\n";
+      return llvm::make_error<llvm::StringError>(
+          "Device CodeGen is null", llvm::inconvertibleErrorCode());
+    }
+    std::unique_ptr<llvm::Module> M(CG->ReleaseModule());
+    if (!M) {
+      llvm::errs() << "[CUDA] Error: Released module is null!\n";
+      return llvm::make_error<llvm::StringError>(
+          "Device LLVM module is null", llvm::inconvertibleErrorCode());
+    }
+    static unsigned ID = 0;
+    CG->StartModule("incr_module_" + std::to_string(ID++), M->getContext());
+    DevicePTU.TheModule = std::move(M);
+    llvm::errs() << "[CUDA] Assigned LLVM module to DevicePTU\n";
+    llvm::errs() << "[CUDA] Registered device PTU. TUPart=" << DevicePTU.TUPart << "\n";
+    llvm::errs() << "[CUDA] Generating PTX...\n";
+    llvm::Expected<llvm::StringRef> PTX = CudaParser->GeneratePTX();
+    if (!PTX)
+      return PTX.takeError();
+
+    llvm::Error Err = CudaParser->GenerateFatbinary();
+    if (Err)
+      return std::move(Err);
   }
 
   // Tell the interpreter sliently ignore unused expressions since value