software:diy:assembler:kkurs
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen RevisionVorhergehende ÜberarbeitungNächste Überarbeitung | Vorhergehende Überarbeitung | ||
software:diy:assembler:kkurs [22/12/2005 10:12] – 8088 | software:diy:assembler:kkurs [12/11/2024 21:11] (aktuell) – [Teil 2: Prozessorregister und Befehlssatz (aus PofoInfo 3/97)] bttr | ||
---|---|---|---|
Zeile 8: | Zeile 8: | ||
Doch jetzt zur Sache. Bekanntlich tut im Portfolio ein Intel-Prozessor namens 8088 seinen Dienst. Das Faszinierende an dieser 1979 mit dem 8086 (16-Bit-Datenbus, | Doch jetzt zur Sache. Bekanntlich tut im Portfolio ein Intel-Prozessor namens 8088 seinen Dienst. Das Faszinierende an dieser 1979 mit dem 8086 (16-Bit-Datenbus, | ||
+ | |||
==== Maschinensprache und Assembler ==== | ==== Maschinensprache und Assembler ==== | ||
Zeile 17: | Zeile 18: | ||
In den Zeiten als die Programme noch kurz, Disketten Luxus und Mailboxen die Domäne von Hackern waren, wurden Listings ja gern in so einer Form gedruckt. Zur Programmentwicklung ist diese Darstellung jedoch denkbar ungeeignet. Um sich nicht für jeden Maschinenbefehl eine Zahl merken zu müssen, bedient man sich einer anderen Schreibweise. Für alle Maschinenbefehle des Prozessors existieren eingängige Abkürzungen, | In den Zeiten als die Programme noch kurz, Disketten Luxus und Mailboxen die Domäne von Hackern waren, wurden Listings ja gern in so einer Form gedruckt. Zur Programmentwicklung ist diese Darstellung jedoch denkbar ungeeignet. Um sich nicht für jeden Maschinenbefehl eine Zahl merken zu müssen, bedient man sich einer anderen Schreibweise. Für alle Maschinenbefehle des Prozessors existieren eingängige Abkürzungen, | ||
- | | + | <code asm> |
- | xor ax,ax ; Zähler auf 0 | + | |
- | Marke: | + | xor ax,ax ; Zähler auf 0 |
- | dec ax ; Zähler -1 | + | Marke: |
- | jnz Marke ; Schleife | + | dec ax ; Zähler -1 |
- | mov ax,4c80h | + | jnz Marke ; Schleife |
- | out dx,al ; Ton aus | + | mov ax,4c80h |
- | int 21h ; beenden | + | out dx,al ; Ton aus |
+ | int 21h ; beenden | ||
+ | </ | ||
==== Unser Handwerkszeug ==== | ==== Unser Handwerkszeug ==== | ||
Zeile 30: | Zeile 33: | ||
Dieser Quelltext muß nun in zwei Schritten mit einem Assembler und einem Linker in ein lauffähiges Programm übersetzt werden. Man kann diese zwei Schritte mit einem Batchprogramm zusammenfassen. Die bekanntesten Assembler sind MASM von Microsoft (zugehöriger Linker: LINK), TASM (Linker: TLINK) von Borland sowie der Sharewareassembler A86. Ich selbst benutze Borlands Turbo Assembler, jedoch scheint mir A86 den einfachsten Einstieg zu ermöglichen, | Dieser Quelltext muß nun in zwei Schritten mit einem Assembler und einem Linker in ein lauffähiges Programm übersetzt werden. Man kann diese zwei Schritte mit einem Batchprogramm zusammenfassen. Die bekanntesten Assembler sind MASM von Microsoft (zugehöriger Linker: LINK), TASM (Linker: TLINK) von Borland sowie der Sharewareassembler A86. Ich selbst benutze Borlands Turbo Assembler, jedoch scheint mir A86 den einfachsten Einstieg zu ermöglichen, | ||
- | Neben einem Assembler sollten zur Grundausstattung aber auch Nachschlagewerke zu den Themen Prozessorarchitektur, | + | Neben einem Assembler sollten zur Grundausstattung aber auch Nachschlagewerke zu den Themen Prozessorarchitektur, |
==== Das erste Programm ==== | ==== Das erste Programm ==== | ||
Zeile 91: | Zeile 94: | ||
Der klassische Weg vom Quelltext zum Code führt über die sogenannte Objektdatei. Sie wird vom Assembler aus dem Quelltext erzeugt und enthält einen Mix aus Symbolen und Code. Erst durch das anschließende Linken gelangt man zum ausführbaren Programm. Dieses Verfahren ist zwar vielseitiger (man kann z.B. mehrere Objektdateien zusammenlinken), | Der klassische Weg vom Quelltext zum Code führt über die sogenannte Objektdatei. Sie wird vom Assembler aus dem Quelltext erzeugt und enthält einen Mix aus Symbolen und Code. Erst durch das anschließende Linken gelangt man zum ausführbaren Programm. Dieses Verfahren ist zwar vielseitiger (man kann z.B. mehrere Objektdateien zusammenlinken), | ||
- | | + | <code asm> |
- | .code | + | .model tiny |
- | ORG 100h | + | .code |
- | Start: | + | ORG 100h |
- | xor ax,ax ; Zähler auf 0 | + | Start: |
- | Marke: | + | xor ax,ax ; Zähler auf 0 |
- | dec ax ; Zähler -1 | + | Marke: |
- | jnz Marke ; Schleife | + | dec ax ; Zähler -1 |
- | mov ax,4c80h | + | jnz Marke ; Schleife |
- | out dx,al ; Ton aus | + | mov ax,4c80h |
- | int 21h ; beenden | + | out dx,al ; Ton aus |
- | END Start | + | int 21h ; beenden |
+ | END Start | ||
+ | </ | ||
Die hinzugekommenen Assemblerdirektiven machen Angaben über das Speichermodell, | Die hinzugekommenen Assemblerdirektiven machen Angaben über das Speichermodell, | ||
Zeile 128: | Zeile 133: | ||
Das umständlichste - pardon professionellste - Werkzeug stammt, wie sollte es anders sein, aus dem Hause Microsoft. Die hier verwendete MASM-Version 1.25 ist allerdings schon leicht in die Jahre gekommen, so daß das Beispiel eventuell nicht mit aktuelleren Versionen nachvollziehbar ist. Trotzdem hier der angepaßte Quelltext: | Das umständlichste - pardon professionellste - Werkzeug stammt, wie sollte es anders sein, aus dem Hause Microsoft. Die hier verwendete MASM-Version 1.25 ist allerdings schon leicht in die Jahre gekommen, so daß das Beispiel eventuell nicht mit aktuelleren Versionen nachvollziehbar ist. Trotzdem hier der angepaßte Quelltext: | ||
- | | + | <code asm> |
- | ASSUME CS: | + | code SEGMENT |
+ | ASSUME CS: | ||
ORG 100h | ORG 100h | ||
- | | + | Start: |
- | xor ax,ax ; Zähler auf 0 | + | xor ax,ax ; Zähler auf 0 |
- | Marke: | + | Marke: |
- | dec ax ; Zähler -1 | + | dec ax ; Zähler -1 |
- | jnz Marke ; Schleife | + | jnz Marke ; Schleife |
- | mov ax,4c80h | + | mov ax,4c80h |
- | out dx,al ; Ton aus | + | out dx,al ; Ton aus |
- | int 21h ; beenden | + | int 21h ; beenden |
- | code ENDS | + | code ENDS |
- | END Start | + | END Start |
+ | </ | ||
Bis zum Endprodukt sind jetzt drei Schritte erforderlich. Zunächst wie beim Borland-Produkt die Assemblierung und das Linken. LINK erzeugt allerdings eine ausführbare Datei im .EXE-Format (783 Bytes), die danach noch ins COM-Format konvertiert werden muß: | Bis zum Endprodukt sind jetzt drei Schritte erforderlich. Zunächst wie beim Borland-Produkt die Assemblierung und das Linken. LINK erzeugt allerdings eine ausführbare Datei im .EXE-Format (783 Bytes), die danach noch ins COM-Format konvertiert werden muß: | ||
Zeile 178: | Zeile 185: | ||
Mit der Anweisung ASM lassen sich Assemblerbefehle auch in ein Pascalprogramm einbauen. Dabei ist zu beachten, daß Labels mit dem Klammeraffen beginnen müssen und Kommentare in geschweifte Klammern gestellt werden müssen: | Mit der Anweisung ASM lassen sich Assemblerbefehle auch in ein Pascalprogramm einbauen. Dabei ist zu beachten, daß Labels mit dem Klammeraffen beginnen müssen und Kommentare in geschweifte Klammern gestellt werden müssen: | ||
- | | + | <code asm> |
- | ASM | + | begin |
- | mov dx,8020h {Portadresse | + | ASM |
- | xor ax,ax {Zähler auf 0 } | + | mov dx,8020h {Portadresse |
- | @Marke: out dx,al {Ton erzeugen } | + | xor ax,ax {Zähler auf 0 } |
- | dec ax | + | @Marke: out dx,al {Ton erzeugen } |
- | jnz @Marke | + | dec ax |
- | mov ax,4c80h | + | jnz @Marke |
- | out dx,al {Ton aus } | + | mov ax,4c80h |
- | int 21h {beenden | + | out dx,al {Ton aus } |
- | end; | + | int 21h {beenden |
- | end. | + | end; |
+ | end. | ||
+ | </ | ||
Kompiliert mit TP 6.0 ergibt dieser Quelltext ein 1488 Bytes langes .EXE-Programm. Da der Befehl int 21h das Programm vorzeitig beendet, sollte man diese Zeile besser weglassen. Es ist aber auch möglich (z.B. mit DEBUG), unsere 15 Bytes aus dem .EXE Programm herauszuschneiden und als .COM-Programm zu speichern. Der betreffende Abschnitt reicht übrigens vom 16. bis zum 30. der 1488 Bytes. | Kompiliert mit TP 6.0 ergibt dieser Quelltext ein 1488 Bytes langes .EXE-Programm. Da der Befehl int 21h das Programm vorzeitig beendet, sollte man diese Zeile besser weglassen. Es ist aber auch möglich (z.B. mit DEBUG), unsere 15 Bytes aus dem .EXE Programm herauszuschneiden und als .COM-Programm zu speichern. Der betreffende Abschnitt reicht übrigens vom 16. bis zum 30. der 1488 Bytes. | ||
Zeile 202: | Zeile 211: | ||
Von Jan Laitenberger gibt es den __Freeware-Assembler__ JASMIN, der unkomprimiert nur knapp 20 KByte groß ist und speziell für den Einsatz auf dem Portfolio konzipiert wurde. Der begrenzte Funktionsumfang (keine Makros, nur 8086/88, nur COM-Programme) ermöglicht eine sehr einfache Bedienung, so daß JASMIN besonders für Einsteiger gut geeignet ist. Trotz seiner Eigenheiten (Labels müssen mit @ beginnen, Speicherzugriffe sind durch eckige Klammern kenntlich zu machen) ist dieser Assembler ein Muß für Portfolio-Fans! (Bezugsquelle: | Von Jan Laitenberger gibt es den __Freeware-Assembler__ JASMIN, der unkomprimiert nur knapp 20 KByte groß ist und speziell für den Einsatz auf dem Portfolio konzipiert wurde. Der begrenzte Funktionsumfang (keine Makros, nur 8086/88, nur COM-Programme) ermöglicht eine sehr einfache Bedienung, so daß JASMIN besonders für Einsteiger gut geeignet ist. Trotz seiner Eigenheiten (Labels müssen mit @ beginnen, Speicherzugriffe sind durch eckige Klammern kenntlich zu machen) ist dieser Assembler ein Muß für Portfolio-Fans! (Bezugsquelle: | ||
+ | |||
+ | **Update 12.11.2024: | ||
+ | |||
+ | Auszug aus '' | ||
+ | |||
+ | Seit dem 7.10.2006 ist fuer dieses Programm auch der Source-Code | ||
+ | | ||
+ | | ||
+ | in Teilen bedarf der schriftlichen Einwilligung des Autors! | ||
Vielleicht wartet der eine oder andere Leser bereits ungeduldig darauf, endlich die ersten 8086-Befehle (der 8088 ist bekanntlich kompatibel) zu lernen, um selbst ein Assemblerprogramm zu " | Vielleicht wartet der eine oder andere Leser bereits ungeduldig darauf, endlich die ersten 8086-Befehle (der 8088 ist bekanntlich kompatibel) zu lernen, um selbst ein Assemblerprogramm zu " | ||
Zeile 223: | Zeile 241: | ||
Abgesehen von SP und IP dürfen auch diese Register nach Belieben verwendet werden. Insbesondere eignen sie sich aber zur indirekten Adressierung und für die sog. Stringbefehle. | Abgesehen von SP und IP dürfen auch diese Register nach Belieben verwendet werden. Insbesondere eignen sie sich aber zur indirekten Adressierung und für die sog. Stringbefehle. | ||
- | ^ Register ^ Name/ | + | ^ Register ^ Name/ |
- | | IP | Instruction Pointer (Finger weg!) | | | + | | IP | Instruction Pointer (Finger weg!) | |
- | | SP | Stackpointer (Finger weg!) | PUSH, POP | | + | | SP | Stackpointer (Finger weg!) | PUSH, POP | |
- | | BP | Basepointer | + | | BP | Basepointer |
- | | SI | Sourceindex | + | | SI | Sourceindex |
- | | DI | Destination index | + | | DI | Destination index | STOSB | |
Zeile 235: | Zeile 253: | ||
Die Segmentregister haben eine spezielle Funktion, die später noch genauer erklärt wird. Nur ES steht zur freien Verfügung. | Die Segmentregister haben eine spezielle Funktion, die später noch genauer erklärt wird. Nur ES steht zur freien Verfügung. | ||
- | ^ Register ^ Name/ | + | ^ Register ^ Name/ |
| CS | Codesegment (Finger weg!) | | | | CS | Codesegment (Finger weg!) | | | ||
- | | DS | Datensegment (Vorsicht!) | + | | DS | Datensegment (Vorsicht!) |
- | | SS | Stacksegment (Vorsicht!) | + | | SS | Stacksegment (Vorsicht!) |
| ES | Extrasegment | | ES | Extrasegment | ||
Zeile 250: | Zeile 268: | ||
Wie die Namen der Segmentregister vermuten lassen, ist es vorgesehen, für Programmcode, | Wie die Namen der Segmentregister vermuten lassen, ist es vorgesehen, für Programmcode, | ||
+ | |||
==== Eine handvoll Befehle ==== | ==== Eine handvoll Befehle ==== | ||
Zeile 259: | Zeile 278: | ||
Der vielseitigste und meist genutzte Assemblerbefehl ist sicherlich der MOV-Befehl (move). Er überträgt ein Datenwort z.B. aus dem Speicher in ein Register oder aus einem Register in ein anderes. Zudem unterstützt dieser Befehl verschiedene Adressierungsarten für Speicherzugriffe. Hierzu eine Auswahl an Beispielen: | Der vielseitigste und meist genutzte Assemblerbefehl ist sicherlich der MOV-Befehl (move). Er überträgt ein Datenwort z.B. aus dem Speicher in ein Register oder aus einem Register in ein anderes. Zudem unterstützt dieser Befehl verschiedene Adressierungsarten für Speicherzugriffe. Hierzu eine Auswahl an Beispielen: | ||
+ | |||
+ | <code asm> | ||
mov al,2 ; Lädt das Register al mit dem Wert 2 | mov al,2 ; Lädt das Register al mit dem Wert 2 | ||
mov al, | mov al, | ||
Zeile 265: | Zeile 286: | ||
mov al, | mov al, | ||
; bx im Datensegment steht (indirekte Adressierung) | ; bx im Datensegment steht (indirekte Adressierung) | ||
- | mov cl,[si+3] ; Lädt al mit dem Byte-Wert, der an der Speicherstelle | + | mov cl,[si+3] ; Lädt cl mit dem Byte-Wert, der an der Speicherstelle |
; si+3 im Datensegment steht (indirekte indizierte Adr.) | ; si+3 im Datensegment steht (indirekte indizierte Adr.) | ||
mov [7], | mov [7], | ||
+ | </ | ||
Diese Beispiele wickeln den Datenaustausch mit dem Speicher nur über die 8-Bit-" | Diese Beispiele wickeln den Datenaustausch mit dem Speicher nur über die 8-Bit-" | ||
Wer sich mit DEBUG einmal den Maschinencode für obige Varianten des MOV-Befehls ansieht, kann feststellen, | Wer sich mit DEBUG einmal den Maschinencode für obige Varianten des MOV-Befehls ansieht, kann feststellen, | ||
+ | <code asm> | ||
B002 MOV | B002 MOV | ||
A00200 | A00200 | ||
Zeile 278: | Zeile 301: | ||
8A4C03 | 8A4C03 | ||
88360700 | 88360700 | ||
+ | </ | ||
Besonders effizient codiert wurden die ersten beiden Zeilen: Die Befehlscodes (OP-Codes) bestehen dort aus einem einzigen Byte (B0 bzw. A0), gefolgt von einem bzw. zwei Bytes für den zweiten Parameter. Man sieht auch, daß die 16-Bit-Konstante 0002 im Format Lowbyte/ | Besonders effizient codiert wurden die ersten beiden Zeilen: Die Befehlscodes (OP-Codes) bestehen dort aus einem einzigen Byte (B0 bzw. A0), gefolgt von einem bzw. zwei Bytes für den zweiten Parameter. Man sieht auch, daß die 16-Bit-Konstante 0002 im Format Lowbyte/ | ||
Zeile 304: | Zeile 328: | ||
Dieser Befehl ruft die durch Nummer spezifizierte Interruptroutine auf. Der INT-Befehl stellt die Schnittstelle zum Betriebssystem dar, denn sowohl BIOS als auch DOS belegen etliche Interruptvektoren mit Routinen, die von Anwendungsprogrammen genutzt werden können (und sollen). Je nach Funktion müssen zuvor diverse Parameter in bestimmten Registern abgelegt werden. Beispiel: | Dieser Befehl ruft die durch Nummer spezifizierte Interruptroutine auf. Der INT-Befehl stellt die Schnittstelle zum Betriebssystem dar, denn sowohl BIOS als auch DOS belegen etliche Interruptvektoren mit Routinen, die von Anwendungsprogrammen genutzt werden können (und sollen). Je nach Funktion müssen zuvor diverse Parameter in bestimmten Registern abgelegt werden. Beispiel: | ||
+ | <code asm> | ||
mov ah,7 ; 7=Zeicheneingabe nach al | mov ah,7 ; 7=Zeicheneingabe nach al | ||
int 21h ; 21=wichtigster DOS-Interrupt | int 21h ; 21=wichtigster DOS-Interrupt | ||
Zeile 309: | Zeile 334: | ||
mov ah,6 ; 6=Zeichenausgabe (dl=ASCII) | mov ah,6 ; 6=Zeichenausgabe (dl=ASCII) | ||
int 21h | int 21h | ||
+ | </ | ||
Übrigens lautet der Maschinencode für Int 21h 'CD 21' (dezimal 205, 33) und dürfte eine der häufigsten Bytekombinationen in DOS-Programmen darstellen. | Übrigens lautet der Maschinencode für Int 21h 'CD 21' (dezimal 205, 33) und dürfte eine der häufigsten Bytekombinationen in DOS-Programmen darstellen. | ||
Zeile 316: | Zeile 342: | ||
Eine wichtige Eigenart der 80x86-Prozessorfamilie sind die Portadressen. Parallel zum Arbeitsspeicher existiert ein 64 KByte großer Adreßraum, über den Peripheriebausteine (z.B. paralleles Interface) angesprochen werden. Der Prozessorbefehl IN liest einen 8-Bit- oder 16-Bit-Wert von der Portadresse dx ein. Folgendes Beispiel übernimmt den Zustand der Statusleitungen des Druckerports in das Register al: | Eine wichtige Eigenart der 80x86-Prozessorfamilie sind die Portadressen. Parallel zum Arbeitsspeicher existiert ein 64 KByte großer Adreßraum, über den Peripheriebausteine (z.B. paralleles Interface) angesprochen werden. Der Prozessorbefehl IN liest einen 8-Bit- oder 16-Bit-Wert von der Portadresse dx ein. Folgendes Beispiel übernimmt den Zustand der Statusleitungen des Druckerports in das Register al: | ||
+ | <code asm> | ||
mov dx, | mov dx, | ||
in al,dx ; nur dx möglich! | in al,dx ; nur dx möglich! | ||
+ | </ | ||
**OUT dx, | **OUT dx, | ||
Zeile 328: | Zeile 356: | ||
Addiert zum Operand1 den Operand2. Falls das Ergebnis zu groß für Operand1 ist, wird das Carry-Flag gesetzt (Abfrage z.B. über den bedingten Sprungbefehl JC - jump if carry), welches somit das im Ergebnis fehlende höchste Bit repräsentiert. Beispiel: | Addiert zum Operand1 den Operand2. Falls das Ergebnis zu groß für Operand1 ist, wird das Carry-Flag gesetzt (Abfrage z.B. über den bedingten Sprungbefehl JC - jump if carry), welches somit das im Ergebnis fehlende höchste Bit repräsentiert. Beispiel: | ||
+ | <code asm> | ||
mov cx, | mov cx, | ||
add cx,3 ; cx=2000 | add cx,3 ; cx=2000 | ||
+ | </ | ||
**SUB Operand1, | **SUB Operand1, | ||
Zeile 335: | Zeile 365: | ||
Subtraktion analog zu ADD. Beispiel: | Subtraktion analog zu ADD. Beispiel: | ||
+ | <code asm> | ||
mov bx, | mov bx, | ||
sub bl,bh ; bl=FFh | sub bl,bh ; bl=FFh | ||
+ | </ | ||
Hier wird das Carry-Flag gesetzt, was bedeutet, daß FFh als -1 zu interpretieren ist. | Hier wird das Carry-Flag gesetzt, was bedeutet, daß FFh als -1 zu interpretieren ist. | ||
Zeile 344: | Zeile 376: | ||
Der pure Luxus: Strukturierte Programmierung in Maschinensprache durch Unterprogramme! | Der pure Luxus: Strukturierte Programmierung in Maschinensprache durch Unterprogramme! | ||
+ | <code asm> | ||
| | ||
call PortAus | call PortAus | ||
Zeile 355: | Zeile 388: | ||
pop dx ; Reihenfolge | pop dx ; Reihenfolge | ||
ret | ret | ||
+ | </ | ||
**Weitere Prozessorbefehle** | **Weitere Prozessorbefehle** | ||
Zeile 366: | Zeile 400: | ||
| LOOP | Schleife mit cx als Zähler | | LOOP | Schleife mit cx als Zähler | ||
| SHL,SHR ROL,ROR | Bitweises Schieben und Rotieren | | SHL,SHR ROL,ROR | Bitweises Schieben und Rotieren | ||
- | | LODSB, STOSB | Stringbefehle (Laden/ | + | | LODSB, STOSB | Stringbefehle (Laden/ |
==== Ein Wort zur Ausführungsgeschwindigkeit ==== | ==== Ein Wort zur Ausführungsgeschwindigkeit ==== | ||
Zeile 433: | Zeile 467: | ||
Summe: DW ? ; wird 900 | Summe: DW ? ; wird 900 | ||
- | Die meisten Assembler unterstützen für die hier auftretenden Speicherreferenzen eine spezielle Form von Labels ohne Doppelpunkt, | + | Die meisten Assembler unterstützen für die hier auftretenden Speicherreferenzen eine spezielle Form von Labels ohne Doppelpunkt, |
mov ax, | mov ax, | ||
Zeile 445: | Zeile 479: | ||
==== Auf Nummer sicher ==== | ==== Auf Nummer sicher ==== | ||
- | Dank der " | + | Dank der " |
- | Eine einfache Möglichkeit, | + | Eine einfache Möglichkeit, |
Noch nobler ist es aber, dem Betriebssystem zur Laufzeit mitzuteilen, | Noch nobler ist es aber, dem Betriebssystem zur Laufzeit mitzuteilen, | ||
Zeile 763: | Zeile 797: | ||
[7] Assembler-Routine " | [7] Assembler-Routine " | ||
- |
software/diy/assembler/kkurs.1135244060.txt.gz · Zuletzt geändert: 16/02/2024 17:02 (Externe Bearbeitung)