Ein superskalarer CPU-Entwurf ermöglicht eine Form des parallelen Rechnens, die als Parallelität auf Instruktionsebene innerhalb einer einzigen CPU bezeichnet wird, wodurch bei gleicher Taktrate mehr Arbeit geleistet werden kann. Dies bedeutet, dass die CPU während eines Taktzyklus mehr als einen Befehl ausführt, indem sie mehrere Befehle gleichzeitig ausführt (als Befehls-Dispatching bezeichnet), und zwar auf doppelten Funktionseinheiten. Jede Funktionseinheit ist nur eine Ausführungsressource innerhalb des CPU-Kerns, wie eine arithmetisch-logische Einheit (ALU), eine Gleitkommaeinheit (FPU), ein Bit-Shifter oder ein Multiplikator.

Die meisten superskalaren CPUs sind auch gepipelt, aber es ist möglich, eine nicht-gepipelte superskalare CPU oder eine gepipelte nicht-superskalare CPU zu haben.

Die superskalare Technik wird durch mehrere Merkmale des CPU-Kerns unterstützt:

  1. Die Anweisungen stammen aus einer geordneten Anweisungsliste.
  2. CPU-Hardware kann herausfinden, welche Anweisungen welche Datenabhängigkeiten haben.
  3. Kann mehrere Anweisungen pro Taktzyklus lesen

Jeder Befehl, der von einem Skalarprozessor ausgeführt wird, ändert ein oder zwei Datenelemente auf einmal, aber jeder Befehl, der von einem Vektorprozessor ausgeführt wird, verarbeitet viele Datenelemente auf einmal. Ein superskalarer Prozessor ist eine Mischung aus beidem:

  1. Jede Anweisung verarbeitet ein Datenelement.
  2. Innerhalb jedes CPU-Kerns gibt es mehrere doppelte Funktionseinheiten, so dass mehrere Befehle unabhängige Datenelemente gleichzeitig verarbeiten.

In einer superskalaren CPU liest ein Instruktionsdispatcher Instruktionen aus dem Speicher und entscheidet, welche parallel ausgeführt werden können, indem er sie auf die mehreren doppelten Funktionseinheiten verteilt, die innerhalb der CPU verfügbar sind.

Beim superskalaren CPU-Design geht es darum, die Genauigkeit des Instruktionsdispatchers zu verbessern und es ihm zu ermöglichen, die verschiedenen Funktionseinheiten jederzeit zu beschäftigen. Seit 2008 sind alle Allzweck-CPUs superskalar, eine typische superskalare CPU kann bis zu 4 ALUs, 2 FPUs und zwei SIMD-Einheiten enthalten. Wenn der Dispatcher nicht alle Einheiten auslasten kann, ist die Leistung der CPU geringer.