In den Materialwissenschaften und in der Chemie werden Experimente und Simulationen in vielfältiger Weise verwendet, um charakteristische Eigenschaften und Prozesse besser zu verstehen, um neue Materialien mit verbesserten Eigenschaften zu entwickeln und um damit verbundene Prozesse zu optimieren. Moderne Techniken der Datenanalyse und des maschinellen Lernens eröffnen neue Möglichkeiten, insbesondere mittels Experiment und Simulation generierte Daten zur beschleunigten Materialentwicklung und Prozessoptimierung zu nutzen. Ein Ziel der Materials Data Genome Initiative ist es zum Beispiel, die bisherigen typischen Entwicklungszeiten zu halbieren, bei einem Bruchteil der Kosten.
SCAI entwickelt und setzt verschiedene Methoden des Maschinellen Lernens und der Datenanalyse in unterschiedlichen Teilbereichen der Materialentwicklung und Chemie ein, zum Beispiel zur Modellextraktion (zum Beispiel einfache Modelle zur Beschreibung zugrundeliegender physikalisch-technischer Prozesse), zur effizienten Vorhersage der Performance von Materialien (zum Beispiel im Projekt MultiModel) und zur Generierung von effizienten Modellen auf der atomaren Skala (zum Beispiel die geförderten Projekte ATOMMODEL und SchmiRmaL). Insbesondere kombiniert SCAI dazu im Ansatz des datengetriebenen virtuellen Materialdesigns Methoden der hoch-dimensionalen Optimierung, des Maschinellen Lernens, der Datenanalyse und der Multiskalen-Simulation. Hier wird typischerweise in sogenannten Graybox-Ansätzen die gesamte Prozesskette einbezogen. Diese Vorgehensweise bildet auch die Grundlage zur Entwicklung von sogenannten simulationsbasierten Entscheidungsunterstützungssystemen.