... schön daß Du Dich so detailliert dafür interessierst. Es schadet nie die absolut grundlegende Funktionsweise -auf Du und Du mit dem Prozessor- zu verstehen. Es gibt jedoch haufenweise Kurse dazu, das Schwierige ist halt das passende zu finden.
Du willst nicht nur den statischen Aufbau einer CPU wissen, sondern was dynamisch passiert ?
Die wichtigsten Funktionsgruppen einer CPU sind der Programmzähler (Program Counter, PC),
der Stack ST (Stapelspeicher, funktioniert wie ein Stapel Teller: Du legst zuoberst einen Teller drauf und kannst auch nur diesen als nächstes wieder herunternehmen.) und ein Satz an Registern (das sind im Grunde sehr schnelle Speicherzellen welche ein Byte oder vielfache davon auf einmal zwecks Verarbeitung aufnehmen können.
Das wichtigste Register ist der 'Akkumulator' AC (hat nichts mit einer Batterie zu tun).
Der PC zeigt immer auf den nächsten auszuführenden Befehl. Dieser Befehl (jetzt sind wir auf der Ebene 'Maschinensprache' oder auch 'Assembler') sagt auch aus welche Operanden zu bearbeiten sind und wo diese stehen. Also z.B. 'hole den Inhalt der Speicheradresse, welche in den folgenden 4 bytes steht und schreiben ihn in den AC. Oder: sichere die aktuellen Registerinhalte auf dem ST und springe zu der Adresse, welche in den nächsten beiden Bytes steht.
Daher ist der PC zentral. Wenn Du den Strom einschaltest steht der PC immer bei 0. Beim PersonalComputer ist an dieser -fest verlöteten Adresse- immer der Anfang des BIOS-Speichers. Daher führt der Microprozssor immer zuerst den Code aus, der im BIOS steht und der ist mit ein paar Megabytes recht umfangreich.
Damit der Microprozessor sich nicht um jeden Mist selber kümmern muss sind auf jeder Computerplatine HilfsChips integriert, welche spezielle Funktionen übernehmen können, z.B. das lesen von Sektoren einer SSD (oder HDD). Massenspeicher (wie SSDs) arbeten blockorientiert und nicht byteorientiert, d.h. es können nur ganze Blöcke (Sektoren à z.B. 512 Bytes) gelesen oder geschrieben werden. Der Prozessor 'sagt' über einen Ein-/Ausgabeport (das ist wieder so eine Art Register, dessen Inhalte aber über die Anschlusspins des Prozessors nach draussen aufs Mainboard geführt wird), daß der SSD Controller einen bestimmten Sektor (welcher ? Hier kommt das Dateisystem ins Spiel) direkt in das RAM (welche Adresse ? Das wiederum sollte dann in den Registern stehen, welche von dem Befehl referenziert werden) schreiben soll. Das nennt sich DMA (Direct Memory Access). Die CPU könnte zwar Byte für Byte selbst vom Controller abholen und nacheinander ins Ram schreiben, effizient wäre das aber nicht.
So, angenommen der PC (Programm Counter) ist nun am Ende des BIOS Codes angekommen, die Befehle im BIOS sind abgearbeitet, es sind keine Fehler aufgetreten ... und nun ? Nun schickt das BIOS den Prozessor mit den entsprechenden Befehlen zum SSD-Controller um die Partitionstabelle der SSD in seine Register zu laden. Immer noch unter der 'Autorität' des BIOS. In einem der Register steht nun der Startsektor des zu ladenden Betriebssystems, welches der Mikroprozessor nun vom Controller anfordert in den Startbereich des RAM (der ist hart verdrahtet, also durch das BIOS vorgegeben, steht also zu diesem Zeitpunkt als 'Operand' in den Registern des auszuführenden Befehls) zu schreiben. Hat das geklappt übergibt das BIOS die Kontrolle an den Bootloader des OS, welcher nun am Beginn des RAM's steht, d.h. der PC des Mikroprozssors wird auf die erste RAM-Adresse gesetzt und führt den ersten dort befindlichen Befehl aus. Das ist der Beginn der Bootsequenz des Betriebssystems (welches das auch immer ist).
Die von Dir erwähnte Arithemtic and Logic Unit (ALU) besteht im Prinzip aus drei dieser Register: in zweien stehen die Operanden welche zu verarbeiten oder zu 'berechnen' sind und im dritten (meistens der AC) das Ergebnis. In den schematischen Zeichnungen der Prozessoren ist die ALU daher oft in Form einer 'kurzen Hose' dargestellt. Ein Assemblerbefehl der Art OR (CE,DE) würde eine logische ODER-Verknüpfung zwischen den Inhalten der Register CE und DE durchführen und das Ergebnis im AC ablegen wo es z.B. in einer Programmschleife, weiterverarbeitet werden könnte.
Wenn Dir diese Beschreibung etwas sagt, dann beschäftige Dich tatsächlich einmal mit Assembler und halte daneben den schematischen Aufbau 'Deines' Mikroprozessorsystems bereit. Auch ein einfaches Experimentiersystem kann sehr helfen und spannend sein. Alles weitere nach Bedarf: Google weiß ...

Good luck.