Efficient GPU implementation of a Boltzmann‑Schrödinger‑Poisson solver for the simulation of nanoscale DG MOSFETs Vecil, Francesco Mantas Ruiz, José Miguel Alonso‑Jordá, Pedro Semiconductor physics Deterministic mesoscopic models Parallel heterogeneous systems GPU computing Schrödinger-Poisson system Parallelization of numerical algorithms Un estudio anterior realizado por Mantas y Vecil describe un simulador eficiente y preciso para MOSFET de doble puerta a nanoescala mediante un modelo determinista Boltzmann-Schrödinger-Poisson con siete mecanismos de dispersión electrón-fonón usando una plataforma de cómputo híbrida paralela CPU/GPU. La fase computacional de transporte, es decir, la integración temporal de las ecuaciones de Boltzmann, se trasladó a la GPU utilizando extensiones CUDA, pero el cálculo de los estados propios del sistema, es decir, la solución del bloque Schrödinger-Poisson, solo se paralelizó utilizando OpenMP (e CPU) debido a su complejidad. Este trabajo llena el vacío al describir la adaptación eficiente a la GPU para el solucionador del bloque Schrödinger-Poisson. Esta nueva propuesta implementa en la GPU un método de relajación planificada de Jacobi para resolver los sistemas lineales dispersos que surgen al abordar la ecuación de Poisson en 2D. La ecuación de Schrödinger en 1D se resuelve en la GPU adaptando una iteración multisección y el algoritmo de Newton-Raphson para aproximar los niveles de energía, y se utiliza el método iterativo de potencia inversa para aproximar los vectores de onda. Queremos destacar que este solucionador para el bloque Schrödinger-Poisson puede considerarse un módulo independiente de la fase de transporte (Boltzmann) y puede utilizarse para solucionadores que utilizan diferentes niveles de descripción para los electrones; por lo tanto, es de especial interés al poder adaptarse a otros resolvedores macroscópicos, y por lo tanto más rápidos, para dispositivos confinados explotados a nivel industrial. A previous study by Mantas and Vecil describes an efficient and accurate solver for nanoscale DG MOSFETs through a deterministic Boltzmann-Schrödinger-Poisson model with seven electron-phonon scattering mechanisms on a hybrid parallel CPU/GPU platform. The transport computational phase, i.e. the time integration of the Boltzmann equations, was ported to the GPU using CUDA extensions, but the computation of the system’s eigenstates, i.e. the solution of the Schrödinger-Poisson block, was parallelized only using OpenMP due to its complexity. This work fills the gap by describing a port to GPU for the solver of the Schrödinger-Poisson block. This new proposal implements on GPU a Scheduled Relaxation Jacobi method to solve the sparse linear systems which arise in the 2D Poisson equation. The 1D Schrödinger equation is solved on GPU by adapting a multi-section iteration and the Newton-Raphson algorithm to approximate the energy levels, and the Inverse Power Iterative Method is used to approximate the wave vectors. We want to stress that this solver for the Schrödinger-Poisson block can be thought as a module independent of the transport phase (Boltzmann) and can be used for solvers using different levels of description for the electrons; therefore, it is of particular interest because it can be adapted to other macroscopic, hence faster, solvers for confined devices exploited at industrial level. 2023-05-17T07:12:37Z 2023-05-17T07:12:37Z 2023-04-23 journal article Vecil, F., Mantas, J.M. & Alonso-Jordá, P. Efficient GPU implementation of a Boltzmann-Schrödinger-Poisson solver for the simulation of nanoscale DG MOSFETs. J Supercomput (2023). [https://doi.org/10.1007/s11227-023-05189-0] https://hdl.handle.net/10481/81597 10.1007/s11227-023-05189-0 eng http://creativecommons.org/licenses/by/4.0/ open access Atribución 4.0 Internacional Springer Nature