Hybrid OpenMP-CUDA parallel implementation of a deterministic solver for ultrashort DG-MOSFETs
Metadata
Show full item recordEditorial
SAGE
Date
2020Referencia bibliográfica
https://journals.sagepub.com/doi/abs/10.1177/1094342019879985
Abstract
La simulación de dispositivos transistores ultracortos MOSFET de doble puerta (DG-MOSFET) y dispositivos semiconductores similares mediante un modelo mesoscópico determinista, y por lo tanto preciso, puede ser muy útil para la industria: puede proporcionar resultados de referencia para resolvedores macroscópicos más sencillos y también permite describir adecuadamente zonas débilmente cargadas del dispositivo. Para el alcance de este trabajo, utilizamos un modelo Boltzmann-Schrödinger-Poisson altamente preciso, pero que presenta como principal inconveniente su elevada demanda de poder computacional, que hace que un código puramente secuencial, basado en este modelo. necesite semanas para simular altos voltajes. En este artículo, desarrollamos un resolvedor paralelo híbrido para una plataforma computacional heterogénea dotada de una unidad de procesamiento gráfico (GPU). Con el fin de acelerar las simulaciones, las ecuaciones de transporte de Boltzmann se resuelven en la GPU utilizando el modelo de programación del marco CUDA, mientras que el bloque Schrödinger-Poisson se ejecuta en una CPU multinúcleo utilizando hebras OpenMP. Hemos adaptado las fases de cálculo más costosas a la GPU de manera eficiente, logrando un alto rendimiento y reduciendo drásticamente los tiempos de simulación. Proporcionamos detalles sobre la estrategia de diseño paralelo y mostramos los resultados de rendimiento. The simulation of ultrashort two-dimensional double gate metal-oxide semiconductor field-effect transistors and similar semiconductor devices through a deterministic mesoscopic, hence accurate, model can be very useful for the industry: It can provide reference results for macroscopic solvers and properly describe weakly charged zones of the device. For the scope of this work, we use a Boltzmann–Schrödinger–Poisson model. Its drawback is being particularly costly from the computational point of view, and a purely sequential code may take weeks to simulate high voltages. In this article, we develop a hybrid parallel solver for a graphics processing unit (GPU)-based platform. In order to accelerate the simulations, the Boltzmann transport equations are solved on GPU using the CUDA programing model, while the Schrödinger–Poisson block is performed on multicore CPUs using OpenMP. We have adapted the costliest computing phases to the GPU in an efficient manner, achieving high performance and drastically reducing the simulation time. We give details about the parallel-design strategy and show the performance results. 





