# Grundlagen der Digitaltechnik Foliensatz 4: Rechenwerke und Operationsabläufe

## G. Kemnitz

## 23. Februar 2021

## Contents

| 1 | Rec | henwerke                  | 1  |
|---|-----|---------------------------|----|
|   | 1.1 | Addierer                  | 2  |
|   | 1.2 | Subtrahierer, Zähler etc  | 6  |
|   | 1.3 | Multiplizierer            | 9  |
|   | 1.4 | Komparatoren              | 10 |
|   | 1.5 | Block-Shifter             | 12 |
| 2 | Aut | omaten                    | 13 |
|   | 2.1 | Entwurf mit KV-Diagrammen | 16 |
|   | 2.2 | Beschreibung in VHDL      | 17 |
|   | 2.3 | Redundante Zustände       | 19 |
|   | 2.4 | Spezifikation und Entwurf | 21 |
| 3 | Ope | erationsabläufe           | 25 |
|   | 3.1 | Serielle Schnittstelle    | 27 |
|   | 3.2 | Serieller Addierer        | 32 |
|   | 3.3 | Dividierer                | 35 |

Die Zielfunktionen für Schaltungen aus Tausenden bis Millionen von Gattern werden als Programme beschrieben, simuliert und synthetisiert.

Programme zur Beschreibung digitaler Schaltungen nutzen neben logischen Ausdrücken und Fallunterscheidungen auch arithmetische Ausdrücke.

Arithmetische Ausdrücke werden durch Rechenwerke und taktgesteuerte Berechnungsabläufe nachgebildet.

Auch andere komplexe Verarbeitungsfunktionen werden sequentiell durch taktgesteuerte Abläufe nachgebildet.

## 1 Rechenwerke

#### Rechenwerke

Rechenwerke sind Schaltungen ohne Zwischenspeicher zur Ausführung arithmetischer (und bitscheibenorientierter Logik-) Operationen. Gebräuchliche Rechenwerke:

- Addierer,
- Subtrahierer (Addierer mit negiertem Subtrahenden),
- Multiplizierer,
- Vergleicher für gleich, größer, größer gleich, ...
- Shifter (Potenzierung mit Zweierpotenz),
- mehrfunktionale Einheiten, z.B. die ALU (Arithmetic Logic Unit) eines Prozessors.

Kompliziertere arithmetische Funktionen (Division, Potenzierung, Winkelfunktionen, ...) werden in Schritten, gesteuert durch einen Automaten oder ein Programm, ausgeführt.

Beschreibung algorithmisch, parametriert. Schaltungsgeneratoren.

#### 1.1 Addierer

## Algorithmus der Addition

- Wiederhole für alle Stellen beginnend mit der niederwertigsten
  - Addition der Ziffern und des Übertrags der Bitstelle zuvor.

Für die Addition von drei Binärziffern  $a_i + b_i + c_i$  gilt:

- Summe  $s_i = 1$ , wenn ein oder alle Summanden »1« sind, und
- Übertrag  $c_{i+1} = 1$ , wenn mindestens zwei der Summanden »1 « sind

 $(a_i, b_i - \text{Binärziffern}; c_i - \ddot{\text{U}} \text{bertrag}).$ 

#### Voll- und Halbaddierer

Volladdierer addiert zwei Summanden- und ein Übertragsbit.

Halbaddierer addiert nur zwei Bit.

| $c_i$            | $b_i$            | $a_i$            | $c_{i+1} s_i$                                                        | <u>Halbaddierer</u>                                                                                                  | Schaltung Volladdierer                                      |
|------------------|------------------|------------------|----------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------|-------------------------------------------------------------|
| 0 0 0            | 0<br>0<br>1      | 0<br>1<br>0      | $\begin{array}{ccc} 0 & 0 \\ 0 & 1 \\ 0 & 1 \end{array}$             | $\begin{array}{c c} & a_i & \\ & b_i & \\ \end{array} \text{HA} \begin{array}{c} s & s_i \\ c & c_{i+1} \end{array}$ | $\begin{bmatrix} a_i \\ b_i \\ c_i \end{bmatrix} = 1 - s_i$ |
| 0                | 1                | 1                | 1 0                                                                  | Volladdierer                                                                                                         | $a_i - \&$                                                  |
| 1<br>1<br>1<br>1 | 0<br>0<br>1<br>1 | 0<br>1<br>0<br>1 | $\begin{array}{c cccc} 0 & 1 \\ 1 & 0 \\ 1 & 0 \\ 1 & 1 \end{array}$ | $ \begin{cases}     a_i \\     b_i \\     c_i \end{cases} VA S C C_{i+1} $                                           | $b_i  \&  \geq 1  c_{i+1}$ $c_i  \&  $                      |

|                    | Halbaddierer     | Volladdierer                     |
|--------------------|------------------|----------------------------------|
| Summe $s_i$        | $a_i \oplus b_i$ | $a_i \oplus b_i \oplus c_i$      |
| Übertrag $c_{i+1}$ | $a_i b_i$        | $a_ib_i \vee a_ic_i \vee b_ic_i$ |

#### Ripple-Addierer

Der Ripple-Addierer ist der einfachste Addierer. Er besteht aus n über die Übertragssignale verketteten Volladdierern.



#### Beschreibung durch eine Generierungsschleife

```
signal a,b,s:std_logic_vector(n-1 downto 0);
signal cin, cout: std_logic;
                                                                                                    t_{
m dVA}
process(a, b, cin)
 variable c: std_logic;
                                                                                            c_{\rm in}
                                                                                                            s_0
begin
                                                                                            a_0
 c := cin;
                                                                                            b_0
 for i in 0 to n-1 loop
  s(i) \ll a(i) \text{ xor } b(i) \text{ xor } c;
  c := (a(i) \text{ and } b(i)) \text{ or}(a(i) \text{ and } c)
     or (b(i) \text{ and } c);
 end loop;
                                                                                                           s_{n-1}
 cout <= c;
end process;
                                                                                                            c_{
m out}
```

c muss eine Variable sein, damit im Folgeschleifendurchlauf der zuletzt berechnete Wert weiterverarbeitet wird.

#### Verzögerungszeit eines Ripple-Addierers



 $\bullet$  Die maximale Verzögerung ist die vom Übertragseingang  $c_0$  bis zum Übertragsausgang  $c_n$  und beträgt

$$t_{\rm dAdd} = n \cdot t_{\rm dVA}$$

 $(t_{\text{dVA}} - \text{Verz\"{o}gerung eines einzelnen Volladdierers}).$ 

• Verringerbar durch Minimierung der Verzögerung von  $c_{i-1}$  bis  $c_i$  für alle Volladdierer.

#### Schneller Übertragsdurchlauf

Zur Minimierung der Übertragsverzögerung werden bitweise zwei Hilfssignale gebildet:

• Übertrag weiterleiten (propagate):

$$p_i = a_i \oplus b_i$$

• Übertrag erzeugen (generate):

$$g_i = a_i b_i$$

Mit diesen Hilfssignalen vereinfacht sich der zeitkritische Berechnungsteil zu:



$$c_i = p_i c_{i-1} \vee g_i$$



Der Aufwand ist etwa derselbe wie für den Ripple-Addierer mit Volladdierern ohne schnellen Übertragsdurchlauf. Die Verzögerung ist nur etwa halb so groß.

In dem FPGA für die Übungen gibt es spezielle Verbindungen und Gatter für die schnelle Übertragsweitergabe zwischen benachbarten Zellen. Dadurch ist die Addition im Vergleich zu anderen gleichlangen Gatterverkettungen sehr schnell.

## Hierarchische Addierer

In einem hierarchischen Addierer wird die Übertragsberechnung

- in eine assoziative Operation überführt und
- die Kettenstruktur durch eine Baumstruktur ersetzt:

$$x_6 \circ \ldots \circ x_1 \circ x_0 = ((x_1 \circ x_0) \circ (x_3 \circ x_2)) \circ ((x_4 \circ x_5) \circ x_6)$$

Bei einem Baum nimmt die Verzögerung nur noch mit dem Logarithmus statt linear der Anzahl der Operationen zu.





## Block-Generate-Propagate-Addierer

Aus den Generate- und Propagate-Signalen  $g_i$  und  $p_i$  der einzelnen Bitstellen wird für jede Bitstelle i ein Block-Generate-Signal  $g_{0.i}$  und ein Block-Propagate-Signal  $p_{0.i}$  gebildet. Diese beschreiben, ob die Summandenbits 0 bis i zusammen für Bit i einen Übertrag generieren oder den Eingangsübertrag  $c_0$  bis Bit i weiterleiten. Die Bildung der Block-Generate- und Block-Propagate-Signale ist assoziativ.



Die Kettenoperation zur Bildung der Block-Generate- und Block-Propagate-Signale für drei aufeinanderfolgende Bits:

$$(p_2, g_2) \circ [(p_1, g_1) \circ (p_0, g_0)] = (p_2 p_1 p_0, g_2 \vee g_1 p_2 \vee g_0 p_2 p_1)$$

führt bei Vertauschung der Berechnungsreihenfolgen auf dieselben logischen Operationen (Beweis der Assoziativität):

$$[(p_2, g_2) \circ (p_1, g_1)] \circ (p_0, g_0) = (p_2 p_1 p_0, g_2 \vee g_1 p_2 \vee g_0 p_2 p_1)$$

Für drei Bits besteht die Verarbeitungskette aus den Operationen:



Mit einer anderen Ausführungsreihenfolge (Klammersetzung)

$$(p_3, g_3) \circ [(p_2, g_2) \circ [(p_1, g_1) \circ (p_0, g_0)]] = [(p_3, g_3) \circ (p_2, g_2)] \circ [(p_1, g_1) \circ (p_0, g_0)]$$

können die erste und die letzte Operation gleichzeitig erfolgen. Aus dem kettenartigen wird ein baumartiger Datenfluss:



 $(t_{do} - \text{max. Verzögerung der Operatorfunktion (entspricht der Verzögerung einer UND-ODER-Kette)}$ .

Erweiterung auf die Berechnung aller Block-Propagate- und Block-Generate-Signale für eine 8-Bit-Addition:



Die Verzögerungszeit wächst logarithmisch mit der Bitbreite n:

| n               | 8                            | 16                            | 32                            | 64                            |
|-----------------|------------------------------|-------------------------------|-------------------------------|-------------------------------|
| $t_{ m dKette}$ | $\approx 8 \cdot t_{\rm do}$ | $\approx 16 \cdot t_{\rm do}$ | $\approx 32 \cdot t_{\rm do}$ | $\approx 64 \cdot t_{\rm do}$ |
| $t_{ m dBaum}$  | $\approx 5 \cdot t_{\rm do}$ | $\approx 6 \cdot t_{\rm do}$  | $\approx 7 \cdot t_{\rm do}$  | $\approx 8 \cdot t_{\rm do}$  |

Preis: überproportional mit n wachsender Schaltungsaufwand.

#### Carry-Save-Addierer

Ein Carry-Save-Addierer besteht je Bit aus einem Volladdierer, der drei Summandenbits zu einem Summen- und einem Übertragsbit zusammenfasst.

Abschließende Addition des Summen- und des Übertragsvektors mit einem normalen Addierer.

Die gesamte Additionsdauer für zwei Additionen ist nur um eine Volladdiererverzögerung länger als für eine Addition.



Für mehr als zwei Additionen erfolgt zuerst eine baumartige 3-zu-2-Reduktion und zum Abschluss wieder die Addition des Summen- und des Übertragsvektors mit einem normalen Addierer.



Beim Entwurf eines solchen Vektoraddierers ist zu beachten, dass die Bitanzahl der Zwischensummen mit der Summandenanzahl zunimmt, bei zwei Summanden um ein Bit, bei drei und vier Summanden um zwei Bit etc.

#### Zusammenfassung

- Ripple-Addierer: Kette von n Volladdierern. Zur Bitbreite n proportionale Verzögerungszeit.
- Schneller Übertragsdurchlauf: Halbierung der Additionsdauer ohne nennenswerten Zusatzaufwand.
- Hierarchische Addierer: Schnelle Addierer für große Bitbreiten. Nur logarithmisch mit der Bitbreite zunehmende Verzögerungszeit. Mehr Schaltungsaufwand.
- Carry-Save-Addierer: Addierer für mehrere Summanden, bei dem die Verzögerungszeit mit der Summandenanzahl nur logarithmisch zunimmt.

#### 1.2 Subtrahierer, Zähler etc.

## Subtraktion

Die Subtraktion ist die Addition mit dem negierten Summanden:

$$a - b = a + (-b)$$

Die Negation n-stelliger Zahlen ist »Stellenkomplement +1«:

$$-b = \bar{b} + 1$$

Zur Probe, die Summe aus einer Zahl und ihrem Stellenkomplement ist die größte darstellbare Zahl. Eins addiert im Zahlenkreis ergibt null. Beispiel:

$$387 + \overline{387} + 1 = 387 + 612 + 1$$
  
=  $999 + 1 = (1^*)000$ 

(1\* – nicht darstellbarer Übertrag). Das Stellenkomplement für Binärzahlen ist die bitweise Negation:

$$\bar{x} = \begin{cases} 1 & \text{für } x = 0 \\ 0 & \text{für } x = 1 \end{cases}$$

## Subtraktionsbeispiel und Subtrahierer



Die Differenz »eins minus Eingangsübertrag« ist der negierte Eingangsübertrag:

$$1 - c_0 = \bar{c}_0$$

Schaltung eines Subtrahierers:



## Binärzähler

Binärzähler bestehen aus einem Register für den Zustand und einer Inkrement-Operation (+1) oder der Dekrement-Operation (-1).



- I Initialisierungssignal
- Tak
- z Signal für den Zählstand

#### Inkrement-Rechenwerk

Das Rechenwerk für die Inkrement-Operation ist ein Addierer mit der Konstanten null und dem Eingabeübertrag.



Ein Volladdierer mit einem konstanten Summanden null vereinfacht sich zu einem Halbaddierer.

#### Dekrement-Rechenwerk

Für die Dekrement-Operation werden die Zweierkomplementdarstellung von minus eins (11...1) und der negierte Eingabeübertrag  $\bar{c}_0$  addiert. Das zweite Summandenbit der Volladdierer ist konstant eins. Die vereinfachte Schaltung ähnelt dem Halbaddierer für die Dekrement-Operation.



## Rechenwerk für die Negation

Die Negation ist die Invertierung plus eins:



## Rechenwerk zur Betragsbildung

Die Betragsbildung ist eine bedingte Negation:



## 1.3 Multiplizierer

#### Vorzeichenfreie Multiplikation

$$\frac{\left(a_3 \cdot 2^3 + a_2 \cdot 2^2 + a_1 \cdot 2^1 + a_0 \cdot 2^0\right) \cdot \left(b_3 \cdot 2^3 + b_2 \cdot 2^2 + b_1 \cdot 2^1 + b_0 \cdot 2^0\right) =}{a_3b_0 \cdot 2^3 + a_2b_0 \cdot 2^2 + a_1b_0 \cdot 2^1 + a_0b_0 \cdot 2^0} \\ a_3b_1 \cdot 2^4 + a_2b_1 \cdot 2^3 + a_1b_1 \cdot 2^2 + a_0b_1 \cdot 2^1 \\ a_3b_2 \cdot 2^5 + a_2b_2 \cdot 2^4 + a_1b_2 \cdot 2^3 + a_0b_2 \cdot 2^2 \\ a_3b_3 \cdot 2^6 + a_2b_3 \cdot 2^5 + a_1b_3 \cdot 2^4 + a_0b_3 \cdot 2^3 \\ p_7 \quad p_6 \quad p_5 \quad p_4 \quad p_3 \quad p_2 \quad p_1 \quad p_0$$

Die Multiplikation setzt sich zusammen aus

- 1-Bit-Multiplikationen (UND-Verknüpfungen).
- Zeilen- und spaltenweise Addition mit Halb- und Volladdierern.
- Anzahl der Produktbits gleich der Summe der Anzahl der Operandenbits, für das Beispiel:
  - Kleinstes Ergebnis:  $0000_2 \cdot 0000_2 \mapsto 0000\,0000_2$
  - Größtes Ergebnis:  $1111_2 \cdot 1111_2 \mapsto 1110\,0001_2$



#### Matrix-Multiplizierer für Vorzeichenzahlen

 $Schaltung \ wie \ bisheriger \ Matrix multiplizierer, \ nur \ mit \ zum \ Teil \ negativ \ bewerteten \ Zwischenergebnissen.$ 



## 1.4 Komparatoren

#### Test auf Gleichheit oder Ungleichheit

signal a, b: std\_logic\_vector(n-1 downto 0);
signal v: std\_logic;



#### Test auf größer, größer oder gleich etc.

Ein Größenvergleich ist eine Subtraktion unter Auswertung des Vorzeichenbits:

- $a > b \Rightarrow a b 1 \ge 0$
- $a \ge b \Rightarrow a b \ge 0$
- $a \le b \Rightarrow a b 1 < 0$
- $a < b \Rightarrow a b < 0$

Da für n-Bit-Vergleich WB  $(a-b)=[-2^n-1,\,2^n-1]$  bzw. WB  $(a-b-1)=[-2^n,\,2^n-2]$  muss die Differenz mit n+1-Bit berechnet werden. Für vorzeichenfreie Zahlen<sup>1</sup>:



|           | $\bar{c}_n = 0$ | $\bar{c}_n = 1$ |
|-----------|-----------------|-----------------|
| $c_0 = 0$ | $a \ge b$       | a < b           |
| $c_0 = 1$ | a > b           | $a \leq b$      |

#### Für vorzeichenbehaftete Zahlen

Um ein Bit vorzeichenerweiterte Werte für a und b subtrahieren und Vorzeichenbit (höchstwertiges Summenbit) auswerten:



|           | $s_n = 0$ | $s_n = 1$  |
|-----------|-----------|------------|
| $c_0 = 0$ | $a \ge b$ | a < b      |
| $c_0 = 1$ | a > b     | $a \leq b$ |

Die Summenbits  $s_0$  bis  $s_{n-1}$  und das letzte Übertragsbit  $c_{n+1}$  werden nicht benötigt.

In der nachfolgenden Subtrahierschaltung mit schnellem Übertragsdurchlauf können die EXOR-Gatter für die Bildung der Summenbits weggelassen werden.



Schaltungsaufwand und Verzögerung sind ähnlich wie bei einem Subtrahierer. Wenn Schaltungsaufwand und Geschwindigkeit wichtige Optimierungsziele sind, ist der Test auf Gleichheit einem Größenvergleich in der Zielfunktion vorzuziehen.

 $<sup>^1 \, {\</sup>rm Wegen} \ a_n = 0$  und  $b_n = 1$  ist das auszuwertende Vorzeichenbit  $s_{\rm n} = \bar{c}_{\rm n}.$ 

## 1.5 Block-Shifter

#### Verschiebung und Rotation



- Operand 1: std\_logic\_vector, unsigned, signed
- Operand 2: natural
- Logische Verschiebung: Füllen der freiwerdenden Bits mit > 0«; rechts  $\mapsto$  Halbierung, links  $\mapsto$  Verdopplung

$$\underbrace{\frac{1010\,1101_2}{\mathrm{AD}_{16}}}_{\mathrm{AD}_{16}}\,\mathrm{srl}\,2 \quad \mapsto \quad \underbrace{\frac{0010\,1011_2}{2\mathrm{B}_{16}}}_{\mathrm{2B}_{16}}$$

$$\underbrace{\frac{0010\,1011_2}{2\mathrm{B}_{16}}}_{\mathrm{AC}_{16}}\,\mathrm{srl}\,2 \quad \mapsto \quad \underbrace{\frac{1010\,1100_2}{\mathrm{AC}_{16}}}_{\mathrm{AC}_{16}}$$

• Arithmetische Verschiebung: Füllen der freiwerdenden Bits mit dem Vorzeichenbit; rechts →vorzeichenbehaftete Halbierung

Auch bei negativen Ergebnissen wird abgerundet.

#### **Block-Shifter**

Eine konstante Verschiebung beschreibt Verbindungen ohne logische Verknüpfungen.

Eine variable Verschiebung beschreibt umschaltbare Verbindungen mit Multiplexern, realisiert als Block-Shifter.



#### Rotation

Bei der Rotation werden die Bits im Kreis verschoben.



Verschiebung und Rotation lassen sich auch mit Indexoperationen und Konkatenation beschreiben:

## 2 Automaten

#### **Endliche Automaten**

Endliche Automaten (FSM, Finite State Machine) beschreiben in der digitalen Schaltungstechnik Abläufe durch:

- eine Eingabemenge  $\Sigma = \{E_1, E_2, \ldots\},\$
- eine Zustandsmenge  $S = \{Z_1, Z_2, \ldots\}$  mit
- einem Anfangszustand  $Z_1 \in S$ ,
- eine Ausgabemenge  $\Pi = \{A_1, A_2, \ldots\},\$
- eine Übergangsfunktion  $f_s: S \times \Sigma \to S$  und
- eine Ausgabefunktion  $f_a: S \times \Sigma \to \Pi$ .

Graphisch werden Zustände als Knoten und Zustandsübergänge als Kanten dargestellt. Die Kanten sind mit den Eingaben beschriftet, bei denen die Übergänge stattfinden.



#### Transduktor, Moore- und Mealy-Automat

Die Automaten in der Digitaltechnik sind Transduktoren, die Ausgaben aus Zuständen und Eingaben generieren. Sie dienen zur Steuerung von Operationsabläufen.



- Moore-Automat: Ausgabe hängt nur vom Zustand ab.
- Mealy-Automat: Ausgabe hängt auch von der Eingabe ab und ist den Zustandsübergängen zugeordnet.

Mit beiden Automatentypen lassen sich dieselben Zielfunktionen beschreiben. Die Moore-Form braucht mehr Zustände, die Mealy-Form hat eine kompliziertere Ausgabefunktion.

#### Vereinbarungen:

- Wenn keine Ausgaben explizit zugeordnet sind, ist der Zustand die Ausgabe.
- Kanten mit demselben Anfangs- und Endknoten können weggelassen werden.

Automaten ohne Eingabe werden als autonome Automaten bezeichnet. Zyklische autonome Automaten dienen z.B. als Taktteiler und zyklenfreie zur Steuerung von Initialisierungsabläufen.



#### Automat als Schaltung

Bei der Realisierung als digitale Schaltung sind die Eingaben, Zustände und Ausgaben Bitvektoren. Die Darstellung von m Eingabe-, Zustands- oder Ausgabewerten verlangt Bitvektoren der Breite:

$$n \geq \log_2{(m)}$$

Der Zustand wird in einem Register gespeichert. Anfangszustand ist der Initialisierungswert des Registers. Die Zustandsübergänge erfolgen mit der aktiven Taktflanke. Die Übergangs- und Ausgabefunktion wird mit Schaltungen für Verarbeitungsfunktionen realisiert:



#### Kontrollfragen

Ein zu entwerfender Automat habe die Eingabemenge  $\Sigma = \{E_1, E_2, E_3\}$ , die Zustandsmenge  $S = \{Z_1, Z_2, Z_3, Z_4, Z_5\}$  und die Ausgabemenge:  $\Pi = \{A_1, A_2\}$ .

- 1. Legen Sie eine Zustandscodierung mit minimaler Bitanzahl fest.
- 2. Legen Sie eine 1-Hot-Zustandscodierung fest<sup>2</sup>.
- 3. Wie viele Möglichkeiten gibt es für beide Codierungen?

| Zustand | Code min. Bitanzahl | Code 1-Hot |
|---------|---------------------|------------|
| $Z_1$   |                     |            |
| $Z_2$   |                     |            |
| $Z_3$   |                     |            |
| $Z_4$   |                     |            |
| $Z_5$   |                     |            |

<sup>&</sup>lt;sup>2</sup>Jeder Zustandswert enthält genau eine Eins und den Rest Nullen.

#### Zur Kontrolle

- 1. Die minimale Bitanzahl für  $n_s \ge \log_2(5)$  ist 3.
- 2. Ein 1-Hot-Code für 5 Werte verlangt 5 Bit.

| Zustand | Code min. Bitanzahl | Code 1-Hot |
|---------|---------------------|------------|
| $Z_1$   | 000                 | 00001      |
| $Z_2$   | 001                 | 00010      |
| $Z_3$   | 010                 | 00100      |
| $Z_4$   | 011                 | 01000      |
| $Z_5$   | 100                 | 10000      |

3. Bei min. Bitanzahl sind 5 Codeworte auf  $2^3 = 8$  Möglichkeiten anzuordnen:

$$8 \cdot 7 \cdot 6 \cdot 5 \cdot 4 = 6720$$

Für die 1-Hot-Codierung sind 5 Codeworte 5 Möglichkeiten zuzuordnen:

$$5 \cdot 4 \cdot 3 \cdot 2 \cdot 1 = 120$$

#### Signalverläufe an Automaten

Alle Signaländerungen sind zeitlich am Takt ausgerichtet (RT-Funktionen). Für asynchrone Eingaben erfordert das ein zusätzliches Eingaberegister (grau unterlegt), das nicht zur Schaltung des Automaten zählt.



- x<sup>+</sup> Eingabe vor der Abtastung
- $I^+$  Init.-Signal vor der Abtastung
- $\mathbf{y}$ ' abgetastetes Ausgabesignal
- s<sup>+</sup> Folgezustand
- · · · Abtastzeitpunkt
- Wert ungültig / ohne Bedeutung



#### Vereinfachte Automaten

Bei einem Moore-Automaten ist die Ausgabe nicht von der Eingabe abhängig ( $\mathbf{x}$  – Eingabe;  $\mathbf{s}$  –Zustand;  $\mathbf{y}$  – Ausgabe; I – Initialisierungssignal; T – Takt).



Ohne explizite Zuordnung von Ausgaben ist die Ausgabe der Zustand.



Bei einem autonomen Automaten ist der Folgezustand nur eine Funktion des Ist-Zustands.

## 2.1 Entwurf mit KV-Diagrammen

#### Vorwärts-/Rückwärtszähler

Die Funktion sei als Graph gegeben. Das Beispiel ist ein Zähler, der bei Eingabe »V« vorwärts, bei »R« rückwärts zählt und bei »H« seinen Zustand beibehält. Die Zählfolge ist »A«, »B«, ... Die Ausgabe ist den Übergängen zugeordnet (Mealy-Automat):



Ausgehend davon sind die Codierung der symbolischen Werte sowie die Größe des Zustandsregisters festzulegen und die Übergangs- und Ausgabefunktion zu entwerfen.

Aufstellen der Tabellen für die Übergangs- und Ausgabefunktion. Festlegung der Zustandscodierung.



Die drei bzw. vier symbolischen Werte für die Eingabe, die Ausgabe und den Zustand verlangen mindestens je zwei Bit. Die Eingabecodierung ist im Beispiel willkürlich gewählt. Die Ausgabecodierung ist so gewählt, das die Ausgabe gleich dem Folgezustand ist:

$$\mathbf{y} = \mathbf{s}^+$$

Das 2-Bit-Zustandsregister wird mit "00" initialisiert.

#### Aufstellen der KV-Diagramme

Für jedes Zustands- und jedes Ausgabebit ist ein KV-Diagramm aufzustellen. Wegen  $\mathbf{y}=\mathbf{s}^+$  genügen im Beispiel zwei:



 $y_0 = s_0^+ = \bar{s}_0 \bar{x}_0 \lor s_0 x_0$  $y_1 = s_1^+ = \bar{s}_1 s_0 \bar{x}_1 \bar{x}_0 \lor \bar{s}_1 \bar{s}_0 x_1 \lor s_1 \bar{s}_0 \bar{x}_1 \lor s_1 x_0 \lor s_1 s_0 x_1$ 

#### Vom KV-Diagramm zur Schaltung

Im nächsten Schritt sind die minimierten logischen Funktionen durch verfügbare digitale Bausteine nachzubilden. Früher, als der digitale Schaltungsentwurf noch überwiegend Handarbeit war, wurden vorzugsweise Schaltkreise mit mehreren NAND-Gattern eingesetzt (vergl. Foliensatz F1). Die Gleichungsumformung aus der AND-OR-Form in die NAND-NAND-Form erfolgt mit Hilfe der De Morganschen Regeln:

$$y_0 = s_0^+ = \bar{s}_0 \bar{x}_0 \lor s_0 x_0 = \overline{(\bar{s}_0 \bar{x}_0)} (\bar{s}_0 \bar{x}_0)$$

$$y_1 = s_1^+ = \bar{s}_1 s_0 \bar{x}_1 \bar{x}_0 \lor \bar{s}_1 \bar{s}_0 x_1 \lor s_1 \bar{s}_0 \bar{x}_1 \lor s_1 x_0 \lor s_1 s_0 x_1$$

$$= \overline{(\bar{s}_1 s_0 \bar{x}_1 \bar{x}_0)} (\bar{s}_1 \bar{s}_0 x_1) (\bar{s}_1 \bar{s}_0 \bar{x}_1) (\bar{s}_1 \bar{s}_0 x_1)$$

Umsetzung der logischen Funktionen in eine Gatterschaltung. Ergänzung der Speicherzellen des Zustandsregisters, des Takts und des Initialisierungssignals.



- Mit dem hier dargestellten Entwurfsfluss wurden bis vor wenigen Jahrzehnten die Ablaufsteuerungen für Rechner und andere digitale Schaltungen entworfen.
- Die Klausur zum Semesterende enthält traditionell eine Aufgabe von diesem Typ.
- Für Übergangs- und Ausgabefunktionen mit mehr als vier Eingabebits funktioniert der Bleistiftund-Papier-Entwurf nur noch begrenzt. Übergang zu rechnergestützten Verfahren wie Quine und McCluskey.
- Die zu entwerfenden Automaten in der Klausur werden nie mehr als  $n_{\rm x}+n_{\rm s}\leq 4$  Eingabe- plus Zustandsbits haben.
- Heute werden die Übergangs- und Ausgabefunktionen mit Wertetabellen, Fallunterscheidungen und anderen algorithmischen Mitteln beschrieben und zu Schaltungen synthetisiert. Siehe Folgeabschnitt ...

## 2.2 Beschreibung in VHDL

Übergangs- und Ausgabefunktionen



Die aus dem Zustandsgraphen ablesbaren Übergangs- und Ausgabefunktionen werden bevorzugt nach folgendem Schema beschrieben:

```
case Zustand is
when ... => if Eingabe = ... then Zustand <= ; ...
...
when others => Zustand <= <Anfangswert<sup>3</sup>>; end case;
```

#### Beispielbeschreibung für einen Mealy-Automat



- Eingabemenge:  $\{0,1\} \Rightarrow Bit$
- Zustandsmenge:  $\{00, 01, 10\} \Rightarrow 2$ -Bit-Vektor
- Ausgabenenge:  $\{0,1\} \Rightarrow Bit$

```
signal x, y, T, I: std_logic;
signal s: std_logic_vector(1 downto 0);
```

## Übergangsfunktion als Abtastprozess

```
process (I, T)  
    variable sx: std_logic_vector(2 downto 0);  
    begin  
    if I = '1' then  
        s <= "00";  
    elsif rising_edge(T) then  
    sx := s & x;  

    case sx is  
    when "00" & '0' | "10" & '0' => s <= "00";  
    when "01" & '0' | "00" & '1' => s <= "01";  
    when "10" & '1' | "01" & '1' => s <= "10";  
    when "10" & '1' | "01" & '1' => s <= "10";  
    when others => s <= "00";  
        — Neuinitialisierung  
    end case;  
    end if;  
end process;
```

#### Ausgabefunktion als kombinatorischer Prozess

```
process(x, s)
  variable sx: std_logic_vector(2 downto 0);
begin
  sx := s & x;
  case sx is
    when "00"&'1' | "01"&'0' | "10"&'0' => y <= '0';
    when others => y <= '1';
  end case;
end process;</pre>
```

Auswahl ist wieder eine Konkatenation aus Zustand und Eingabe<sup>5</sup>.

<sup>&</sup>lt;sup>3</sup> Neuinitialisierung bei unzulässigen Zuständen ist eine vorbeugende Maßnahme gegen Abstürze (siehe nächster Abschnitt).

<sup>&</sup>lt;sup>4</sup> Auswahlwert ist die Konkatenation aus Zustand und Eingabe.

<sup>&</sup>lt;sup>5</sup>Von unserem Entwurfssystem als schlechter Entwurfsstil bemängelt. Die empfohlene Beschreibung mit »case« für Zustands- und »if« für die Eingabeauswahl nach Folie 17 passt aber nicht auf die Folien.

#### Beispiel Moore-Automat







Die Eingabe-, Zustands- und Ausgabemenge sowie Übergangsfunktion und damit die Schnittstellenbeschreibung und der Abtastprozess sind wie im Beispiel zuvor. Die Ausgabe hängt vom Zustand ab und ist als kombinatorischer Prozess mit dem Zustand in der Weckliste beschrieben.

#### Symbolische Zustände

Zu Beschreibung eines Automaten mit symbolischen Zuständen ist für den Zustand ein Aufzählungstyp zu definieren. Die Synthese verwendet dann bevorzugt eine 1-Hot-Codierung.

```
type t_state is (ready, run, sleep);
signal s: t_state;
...

case s is
when ready =>
    if x1='1' then s <= run; end if;
when run =>
    if x2='1' then s <= ready;
    elsif x3='1' then s <= sleep;
    end if;
when sleep =>
    if x1='0' then s <= ready; end if;
end case;</pre>
```



#### 2.3 Redundante Zustände

#### Definition

Redundante Zustände sind Zustände eines Automaten, die er annehmen kann, die aber im spezifizierten Ablauf nicht enthalten sind.

Die Zustandsanzahl einer digitalen Schaltung ist immer eine Zweierpotenz:

$$N_{\rm Z} = 2^n$$

 $(N_{\rm Z}-{\rm Anzahl}$  der Zustände;  $n-{\rm Anzahl}$  der Speicherelemente). Die Anzahl der genutzten Zustände kann, aber muss keine Zweierpotenz sein. Außerdem ist eine Codierung mit minimaler Bitanzahl nicht unbedingt die günstigste Lösung. Automaten haben deshalb oft sehr viele redundante Zustände.

- Kann ein Automat redundante Zustände erreichen?
- Kann ein Automat seine redundanten Zustände wieder verlassen?

#### Beispiel Johnson-Zähler



Ein Johnson-Zähler ist ein mit einem Inverter rückgekoppeltes Schieberegister. Ausgehend vom Initialzustand "0000" läuft er zyklisch zuerst mit Einsen und dann wieder mit Nullen voll. Die Zykluslänge ist  $2 \cdot n$  (n – Bitanzahl des Zustandsregisters). Die einfache Übergangsfunktion erlaubt hohe Taktfrequenzen.

Ein 4-Bit-Johnson-Zähler hat 16 Zustände. Davon werden 8 genutzt und 8 Zustände sind redundant.

#### Beschreibung in VHDL

```
signal T, I: std_logic;
signal s: std_logic_vector(3 downto 0);
...
process(I, T)
begin
    if I='1' then s <= "0000";
    elsif rising_edge(T) then
        s <= s(2 downto 0) & (not s(3));
end if;
end process;</pre>
```

Der Johnson-Zähler ist ein gutes Beispiel, dass sich Automaten oft viel einfacher als mit Fallunterscheidungen nach Zuständen und Eingabe beschreiben lassen.

#### Redundante Zustände und Systemabsturz

Viele Automaten nutzen nur einen kleinen Teil der  $2^n$  (n – Bitanzahl des Zustandsregisters) Zustände, der 4-Bit-Johnson-Zähler z.B. nur 8 von 16 Zuständen. Was passiert, wenn der Automat in einen ungenutzten (unzulässigen) Zustand übergeht?



Der Johnson-Zähler durchläuft seine acht unzulässigen Zustände zyklisch. Bis zur Neuinitialisierung keine sinnvolle Reaktion mehr. Wenn ein System ohne Neuinitialisierung keinen zulässigen Zustand mehr erreicht, spricht man von einem Systemabsturz.

#### Neuinitialisierung in unzulässigen Zuständen

Zuweisung des Initialwertes im Others-Zweig. Verkompliziert und verlangsamt im Beispiel die Schaltung erheblich.

```
0001
                                                                          0100
                                                                                  0000
process(I, T)
                                                                           1010
begin
                                                                                  1000
                                                                                         0011
 if I = '1' then s \le "0000";
                                                                           1101
 elsif rising edge(T) then
                                                                                  1100
                                                                                         0111
                                                                           0110
  case s is
   when "0000" | "1000" | "1100"
                                                                           1011
                                                                                  1110
                                                                                         1111
        |"1110"|"1111"|"0111"
```

#### Neuinitialisierung aus nur einem redundanten Zustand je Zyklus



## Watchdog



RA Ein Uberlauf des Watchdogs initialisiert den Automaten neu.
 RW Bei einem bestimmten, regelmäßig stattfindenden Zustandsübergang wird der Watchdog neu initialisiert.

Bei großen Automaten mit praktisch unzählbar vielen redundanten Zuständen werden Abstürze durch Zeitüberwachung erkannt.

Der überwachte Automat setzt in periodisch zu erreichenden Sollzuständen einen Zeitzähler<sup>6</sup> zurück, der bei Überlauf den Automaten neu initialisiert.

#### 2.4 Spezifikation und Entwurf

#### Spezifikation und Entwurf

Das Automatenmodell ist ein Werkzeug zur Spezifikation und schrittweisen Verfeinerung der Zielfunktion. Das praktische Vorgehen dabei soll an zwei Beispielen vorgeführt werden:

• Spezifikation einer Fahrstuhltürsteuerung und

<sup>&</sup>lt;sup>6</sup>Bei Rechnern wird dieser Zeitzähler als Watchdog bezeichnet.

• Entwurf der Steuerung eines Zahlenschlosses.

Das erste Beispiel zeigt, dass eine Zielfunktion wahlweise als Moore- oder Mealy-Automat spezifiziert werden kann und dass nach den ersten Skizzen der Zielfunktion meist Nachbesserungen erforderlich werden (Widersprüche entfernen, Abläufe optimieren).

Das zweite Beispiel demonstriert, wie sich ein Automatenentwurf in einen Gesamtentwurf einbettet. Ausgehend von der Zielfunktion wird schrittweise die VHDL-Beschreibung für die Simulation und Synthese entwickelt.

#### Spezifikation einer Fahrstuhltürsteuerung

Die ersten Schritte der Spezifikation eines Automaten sind in der Regel die Zusammenstellung der Eingaben, Ausgaben und Zustände als Mengen.

Eingangssignale der Fahrstuhltürsteuerung:

- Sensorsignal » Tür ist komplett auf «  $(S_A = 1)$ ,
- Sensorsignal » Tür ist komplett zu«  $(S_Z = 1)$ ,
- Tastereingabe » Tür öffnen «  $(T_A = 1)$  und
- Tastereingabe » Tür schließen «  $(T_S = 1)$ .

Gesteuert wird der Schließmotor der Tür. Die Ausgaben sind:

- »Motor aus«  $(A_0)$ ,
- »Tür öffnen«  $(A_A)$  und
- »Tür schließen«  $(A_S)$ .

Der Steuerablauf in der Moore-Form hat die Zustände »auf«, »schließen«, »zu« und »öffnen«. Bei den Tastereingaben wechselt der Automat in die Zustände »öffnen« bzw. »schließen« und bei Aktivierung der Endlagenschalter in die Zustände »auf« bzw. »zu«.



In der Mealy-Form werden nur die Zustände »öffnen« und »schließen« unterschieden. Das Abschalten des Motors über die Endlagenschalter ist in der Ausgabefunktion enthalten.

#### Kontrolle und Verfeinerung der Zielfunktion

Die Automatenbeschreibung des Moore-Automaten ist noch fehlerhaft/unvollständig. Sie beschreibt z.B. nicht, was in den Zuständen »öffnen« und »schließen« bei gleichzeitiger Aktivierung von Taster und Endlagenschalter passieren soll. Wenn beide Taster gedrückt sind, ist der permanente Wechsel zwischen »öffnen« und »schließen« sicher unerwünscht. Verbesserung:



Anhand der graphischen Beschreibung:

- alle Kantenübergänge, Übergangsbedingungen, ... kontrollieren,
- über mögliche Funktionserweiterungen, Verbesserungen nachdenken, ...

Ergebnis ist eine eindeutige, simulierbare in der zuvor beschriebenen Weise in eine Schaltung umsetzbare Beschreibung der Zielfunktion.

## Entwurf der Steuerung eines Zahlenschlosses

Ein elektronisches Zahlenschloss wartet auf eine bestimmte Folge von Eingaben. Bei der richtigen Eingabefolge öffnet das Schloss. Im nachfolgenden Beispiel wird der Öffner durch eine LED nachgebildet:

- $\bullet$  Eingabefolge: Reset + richtige Zahlenfolge  $\Rightarrow$  LED leuchtet
- $\bullet$  Eingabefolge: Reset + falsche Zahlenfolge  $\Rightarrow$  LED bleibt aus

#### Entwurfsablauf:

- Schaltungsskizze mit dem Automaten als Black-Box,
- Spezifikation des Zustandsgraphen für den Automaten,
- Beschreibung in VHDL,
- Simulation, Synthese, Test.

## Schaltungsskizze



• m Zifferntasten + Reset-Taste. Asynchron prellend. Abtastung z.B. mit  $T_{\rm P}\approx 10\,{\rm ms.}$  »0« wenn gedrückt.

- Gültige Eingabe: Abtastfolge keine Taste eine Taste betätigt. Mehrere Tasten gilt als falsche Taste.
- Ausgabe-LED + Vorwiderstand. LED leuchtet bei y = 0.
- Moore-Automat (zustandszugeordnete Ausgabe).
- Neuinitialisierung mit abgetastetem Reset-Wert »0«.
- $x_{\rm U}$  UND-Verknüpfung der Tasten: 1«, wenn im Abtastmoment keine Taste gedrückt, sonst 0«.

#### Spezifikation des Ablaufs



- $Z_i$  Zustandsname; i Nummer der nächsten Geheimzahl.
- Übergangsbedingung: aktive Taktflanke  $\land x_{\rm U} = 0$  (Taste gedrückt)  $\land x_{\rm U}$ ' (Abtastschritt zuvor keine Taste gedrückt)  $\land s \neq F \land s \neq Z_3$  (kein Endzustand).
- Richtige Zahlenfolge 0-3-1  $\Rightarrow$  Eingabefolge 1110-0111-1101 (m = 4 Zifferntasten).
- Falsche Eingabe  $\Rightarrow$  Fehlerzustand F.
- $\bullet$  Die Endzustände F und  $Z_3$  werden nur durch Neuinitialisierung verlassen.

#### Beschreibung in VHDL



```
\begin{array}{l} \text{signal } T, \ I\_\text{next}, \ I, \ xu, \ xu\_\text{del}, \ y \colon \ \text{std\_logic}; \\ \text{signal } s \colon \ \text{std\_logic\_vector}(2 \ downto \ 0); \\ \text{signal } x\_\text{next}, \ x \colon \ \text{std\_logic\_vector}(3 \ downto \ 0); \\ \dots \\ \text{process}(T) \ begin \\ \text{if } rising\_\text{edge}(T) \ then \\ x <= x\_\text{next}; \\ I <= I\_\text{next}; \\ xu\_\text{del} <= xu; \\ \text{end } \text{if}; \\ \text{end } \text{process}; \\ xu <= x(0) \ \text{and} \ x(1) \ \text{and} \ x(2) \ \text{and} \ x(3); \\ \end{array}
```



#### Zusammenfassung

Ein Automat ist ein (mathematisches) Modell, das sich gut für die Spezifikation von Steuerabläufen in digitalen Schaltungen eignet.

Die Schaltung eines Automaten besteht aus einem Zustandsregister, der Übergangs- und der Ausgabefunktion. Anfangszustand ist der Initialwert des Registers. Die Übergangszeitpunkte legt der Takt fest.

Der Schaltungsentwurf mit Automaten besteht in der Regel aus

- 1. einem Schaltungsentwurf mit dem Automaten als Black-Box,
- 2. der Spezifikation des Zustandsgraphen und
- 3. der Beschreibung der Gesamtfunktion in VHDL.

Der kreative Aufgabenteil steckt in den beiden ersten Teilaufgaben. Die abschließende Beschreibung in VHDL ist nur noch Fleißarbeit.

## 3 Operationsabläufe

#### Steuerung von Operationsabläufen

Die Zustands- und Kantenanzahl eines Automaten wächst exponentiell mit der Anzahl der Eingabe- und Zustandsbits. Bei zu vielen Zuständen Aufteilung der Gesamtfunktionen in

- Operationen und
- einen Steuerablauf.

Die Steuerung erhält zusätzlich zum Zustandsregister Operandenregister und aufgabenspezifische RT-Funktionen.

Die Eingaben für den eingebetteten Automaten, die die Zustandsübergänge steuern, dürfen auch Ergebnisse von Vergleichs- und Logikoperationen sein.

Die den Zuständen und Kanten als Ausgaben zugeordneten Ausgaben dürfen auch Operationen bzw. Steuersignale für auszuführende Register-Transfer-Operationen sein.

#### Erweiterung der Graphendarstellung

- Die Startkennung darf zusätzlich Anfangswertzuweisungen an Operandenregister enthalten.
- Übergangsbedingungen dürfen zusätzlich Vergleichsergebnisse und logische Ausdrücke sein.
- Die den Zuständen (Moore-Automat) oder den Kanten (Mealy-Automat) zugeordneten Ausgaben können auch gesteuerte Operationen sein.



Bereits ein einzelner Zähler kann die Anzahl der Ablaufzustände drastisch verringern.

#### Dreiecksignalgenerator

Aufgabe sei die zyklische Erzeugung des nachfolgenden Dreiecksignalverlaufs:



Ein bisheriger Automat für diese Aufgabe hat 305Zustandschrietzyklisch durchlaufen werden und denen Ausgaben zugeordnet sind.



Mit einem Vor-/Rückwärtszähler als gesteuertes Rechenwerk genügen zwei Zustände.



Die Beschreibung als Operationsablauf ist kleiner, skalierbar und einfacher zu programmieren.

#### Beschreibung in VHDL

```
signal T, I, S: std_logic;
signal z: unsigned(3 downto 0);
process (I, T)
                                                                                         15
                                                                                               30
                                                                                                   Schritt
begin
 if I = '1' then
           ', 0, '; z \le 0;
                                                                                            <="0000"
 elsif rising edge(T) then
                                                                                         Aufwärtszählen
   when '0' \Rightarrow z <= z + 1;
     if \ z{=}14 \ then \ S{<}{=}\,'1'; \ end \ if;
                                                                                                 z = "1110"
   when others \Rightarrow z \iff z -1;
                                                                                          Abwärtszählen
     i\, f\ z{=}1\ then\ S\,{<}{=}\,{}^{!}0\,{}^{!};\ end\ i\, f\,;
                                                                                            z \leq z - 1
  end case:
 end if:
                                                                                                 z = "0001"
end process;
```

## 3.1 Serielle Schnittstelle

#### UART

UART (Universal Asynchronous Receiver Transmitter) Sende- und Empfangseinheit für den Datenaustausch über 3 Leitungen, insbesondere zwischen Mikrorechnern und PC.



## Asynchrone Übertragung ohne Takt



- Asynchrone Eingabesignale bitweise abtasten.
- Der Empfänger erkennt den Übertragungsbeginn an der Stopp-/ Start-Flanke und übernimmt die Werte nach 1,5, 2,5 etc. Bitzeiten.

Voraussetzung: Gleich eingestellte Bitzeit, Bitanzahl, Stoppbitanzahl (und Parität) bei Sender und Empfänger. Der Kehrwert der Bitzeit ist die Baudrate b. Typische Baudraten: 4800 Bd, 9600 Bd, 19,2 kBd.

#### Entwicklung eines Operationsablaufs für den Sender



- Zustandsdauer mindestens/genau eine Bitzeit. Taktung des Automaten mit der Baudrate (9600 Bd = 9600 Hz).
- Zustandscodierung: s1, s0 und sd plus Bitzähler (ct).
- Startzustand: s1
- Datenausgabe an TxD und busy beim Verlassen des jeweiligen Zustands (einen Takt verzögert).

#### Operationsablaufgraph und Simulation





```
entity uart_sender is — Schnittstellenbeschreibung
 port(start, T, I: in std_logic;
  dat: in std_logic_vector(7 downto 0);
  TxD, busy: out std_logic);
end entity;
architecture a of uart_sender is
 type t_state is (s1, s0, sd);
 signal state: t state;
 signal I_del, start_del: std_logic;
signal ct: natural range 0 to 7;
begin
 process(T) -- Abtasten der asynchronen Eingaben
 begin
  if rising_edge(T) then
  I del \ll I; start del \ll start;
 end if;
 end process;
 <\!Ablaufbeschreibung\ des\ Senders\!>
end architecture;
```

```
process (I del, T) - Ablaufbeschreibung
begin
                         des Senders
 if I del = '1' then
  state \le s1;
 elsif rising_edge(T) then
  case state is
   when s1 \Rightarrow TxD \le 1;
    busy <= '0'; ct <= 0;
    if start del = '1' then state \le s0;
    end if;
   when s0 \Rightarrow TxD < = '0';
    busy <= '1'; ct <= 0; state <= sd;
   when sd \Rightarrow TxD \leq dat(ct);
    busy <= '1';
    if ct=7 then state \le s1; ct \le 0;
    else ct \leq ct + 1;
    end if:
  end case;
 end if;
end process;
```



s1 Pause/Sende Stoppbit

s0 Sende Startbit

sd Sende Daten

## Operationsablauf für den Empfänger



- RxD' ist das abgetastete asynchrone RxD-Signal.
- $\bullet$  Die Startflankenabfrage »RxD'='0'« muss mehrfach je Bitzeit erfolgen. Festlegung 16×. Taktung mit der 16-fachen Baudrate.
- Messung der Bitzeit mit einem zusätzlichen 4-Bit-Zähler »vt«, der bei Erkennung der Startflanke rückgesetzt wird.
- Lesen der  $b_i$ -Werte jeweils bei »vt=7« (halbe Bitzeit).
- Ansonsten Zustandscodierung wie beim Sendeautomat.

#### Operationsablaufgraph und Simulation

busy



```
entity uart_receiver is
port(T, I, RxD: in std_logic;
 dat: out std_logic_vector(7 downto 0);
 busy: out std_logic);
end entity;
architecture a of uart_receiver is
type t_state is (s1, s0, sd);
 signal state: t_state;
 signal vt: natural range 0 to 15;
 signal ct: natural range 0 to 7;
 signal RxD del, I del: std_logic;
begin
— Abtastprozess für RxD und I
 process(T) ... end process;
-- Zustandsautomat
process(I del, T)
begin end process;
end architecture;
```

```
process(I_del, T)
begin
 if I_del='1' then
  state \le s1;
 elsif rising_edge(T) then
  case state is
   when s1 \Rightarrow
    ct \le 0; vt \le 0; busy \le 0;
    if RxD del='0' then state <= s0; end if;
   when s0 =>
    ct <= 0; busy <= '1';
    i\,f\ vt\!=\!15\ then\ vt\ <=\ 0\,;\ state\ <=\ sd\,;
    \verb|else| vt| <= vt +1;
    end if;
   when sd \Rightarrow
     . . .
```



```
\nabla
                                           vt = 15
      s1
                                 s0
                                                                \operatorname{sd}
                                           vt <= \overline{0}
vt \le 0
                                                       busy<='1'
               RxD'='0'
                            ct \le 0
ct \le 0
                                                       wenn vt=7
                            busy \le 1'
busy<='0'
                                                        dat(ct) \le RxD'
                                 sonst
                                      \leq vt+1
                                   vt
                                                                     sonst wenn vt=15
                                                                       vt \le 0; ct \le ct + 1
                                     wenn (vt = 15) \land ct = 7
                                                                     sonst
                                         vt <= 0; ct <= 0
                                                                       vt \le vt+1
```

```
\begin{array}{lll} when \ sd => \\ b\,usy <= '1'; \\ i\,f \ vt =7 \ then \ dat(\,ct) <= RxD\_del; \ end \ i\,f; \\ i\,f \ vt = 15 \ then \ vt <= 0; \end{array}
```

```
if ct=7 then state <= s1; ct <=0;
else ct <= ct +1;
end if;
else vt <= vt +1;
end if;
end case;
end if;
end process;</pre>
```

#### Testrahmen

```
entity test_uart is end entity;

architecture a of test_uart is — Testrahmen
constant tb_send: delay_length := 1 sec/9620;
constant tb_rec: delay_length := 1 sec/9513;
< Vereinbarung der Anschlusssignale>
begin
<Instanziierung von Sender und Empfänger>
<2 Prozesse zur Erzeugung der Takt und Init.-Signale>
<Prozess zur Datenbereitstellung und zum Übertragungsstart>
end architecture;
```



```
-- Simulation einer verzögerten Datenübertragung
RxD <= transport TxD after 26 us;
-- Generierung von Sendetakt und -initialisierung
process
begin
T_send <= '0'; I_send <='1'; wait for tb_send/2;
T_send <= '1'; wait for tb_send/2;
T_send <= '0'; I_send <='0'; wait for tb_send/2;
while now < 3 ms loop
T_send <= not T_send; wait for tb_send/2;
end loop;</pre>
```

```
wait:
end process;
-- Für den Empfänger mit ca. 16-facher Frequenz
process
begin
 {\tt T\_rec} \ \mathrel{<=} \ {\tt '0'}; \ {\tt I\_rec} \mathrel{<=} {\tt '1'}; \ {\tt wait} \ {\tt for} \ {\tt tb\_rec} \, / \, {\tt 32};
end process;
               -- Startsignalerzeugung und
               -- Bereitstellung der Sendedaten
 begin
   \mathtt{start} \ <= \ \texttt{'0'}; \ \mathtt{wait} \ \mathtt{for} \ \mathtt{200} \ \mathtt{us};
   s\,t\,a\,r\,t \ <= \ '1\ '; \ d\,at\,\_s \ <= \ x\,"\,D5\,"\,;
   wait until busy_send = '1'; wait for 40 us;
   start \ll 0;
   wait until busy_send = '0'; wait for 150 us;
   start <= '1'; dat s <= x"6A";
   wait until busy_send = '1'; wait for 63 us;
   start <= '0';
   wait;
end process;
```



## Simulationsergebnis



## 3.2 Serieller Addierer

Generierungsschleife für einen Ripple-Addierer



Maximale Verzögerung:  $t_{\text{dRAdd}} \approx n \cdot t_{\text{dVA}}$  (vergl. Seite ??)

#### Serieller Addierer

Addition der Bits in aufeinanderfolgenden Takten. Erfordert ein Register für den Übertrag. Dafür genügt ein Volladdierer.

```
process
  variable c: std_logic;
begin
  <warte auf Operanden und Additionsauftrag>
  c:= cin;
  for i in 0 to n-1 loop
    s(i)<= a(i) xor b(i) xor c;
    c:= (a(i) and b(i)) or
        ((a(i) or b(i)) and c);
    -- warte einen Takt
    wait on rising_edge(T);
end loop;
  cout<=c;
end process;</pre>
```



#### Additionsdauer

Ripple-Addierer ohne schnellen Übertragsdurchlauf:

$$t_{\mathrm{dRAdd}} \ge n \cdot t_{\mathrm{dVA}}$$

Serieller Addierer:

$$t_{\rm dSAdd} \ge n \cdot (t_{\rm dMux} + t_{\rm dVA} + t_{\rm s} + t_{\rm dr})$$

Etwa doppelt so lange, wie ein Ripple-Addierer ohne und viermal so lange wie ein Ripple-Addierer mit schnellem Übertragsdurchlauf.

#### Erweiterung um eine Ablaufsteuerung

Zusätzlich erforderliche Hardware

- Schieberegister für die Summanden und das Ergebnis.
- Bitzähler.

Geplanter Ablauf:

- Warte auf ein Starteingabesignal.
- Übernehme Summanden und  $c_{\rm in}$ . Aktiviere Ausgabe »busy«.
- Addiere nacheinander die n = 4 Bits.
- Deaktiviere »busy«.



(vas() - VA-Summenbit, vac() - VA-Übertrag; sr - logische Rechtsverschiebung).

## Schaltungsbeschreibung in VHDL

```
signal a, a_in, b, b_in, s:std_logic_vector(3 downto 0);
signal init, T, c, c in, Start, busy: std_logic;
signal i: natural range 0 to 3;
process (init,T)
begin
 if init = '1' then busy <= '0';
 elsif rising edge(T) then
  if busy = 0, and Start = 1, then
   busy <= '1'; i <= 0;
   a \le a in; b \le b in; c \le c in;
  elsif busy='1' then
   s \le vas(a(0), b(0), c) & s(3 downto 1);
   c \le vac(a(0),b(0),c); i \le i+1;
   a <= 0, & a(3 \text{ downto } 1); b <= 0, & b(3 \text{ downto } 1);
   if i=3 then busy <= 0; end if;
  end if; end if;
end process;
```



#### Simulationsergebnis



#### Zusammenfassung

Der hier entworfene serielle Addierer besteht aus:

- einem Volladdierer + 1-Bit-Übertragsregister,
- 3 n-Bit Schieberegistern für Summanden und Summe,
- $\bullet$  einem Zähler von 0 bis mindestens n-1 und

• einer Ablaufsteuerung mit zwei Zuständen.

Der Entwurf erfolgte in den Schritten:

- Operationsablauf ohne Steuerautomat.
- Ergänzung von RT-Funktionen (Schieberegister und Zähler) und Spezifikation des Steuerablaufs.
- Beschreibung in VHDL. Simulation. Synthese. Test. ...

Ab einer Entwurfskomplexität wie im Beispiel ist eine Simulation des Entwurfs dringend zu empfehlen.

Ein serieller Addierer ist ähnlich aufwändig wie ein Ripple-Addierer und langsamer. Für den praktischen Einsatz uninteressant.

#### 3.3 Dividierer

#### Division von Binärzahlen

b

$$\frac{\mathbf{a}}{\mathbf{b}} = \mathbf{q} + \frac{\mathbf{r}}{\mathbf{b}}$$

• Berechnung des Quotienten **q** und des Divisionsrest **r** für a = 11 und b = 3:



Simulation mit  $a = "1010\,0011"$  und  $b = "0010\,0111"$ :

```
process
  variable a: unsigned(7 downto 0) := x"A3";
  variable b: unsigned(7 downto 0) := x"27";
  variable r: unsigned(7 downto 0) := x"00";
  variable q: unsigned (7 \text{ downto } 0);
  variable d: unsigned(8 downto 0);
 begin
  report ( | a/b = q + r/b : | a = 10100011 | b = 00100111 | ) );
  for i in 0 to 7 loop
   r := r(6 \text{ downto } 0) \& a(7-i);
   d := '0' \& r - b;
   q := q(6 \text{ downto } 0) \& \text{ not } d(8);
   if d(8) = 0; then r := d(7 \text{ downto } 0); end if;
   report( < Ausgabe \ Zwischenergebnisse > );
  end loop;
  report ( < Ausgabe der Sollwerte zum Vergleich> );
  wait;
 end process;
```

Textausgabe der Simulation mit  $a = "1010\,0011"$ ,  $b = "0010\,0111"$ :

#### Erzeugung der Textausgaben

Die Programmierung formatierter Debug-Ausgaben ist in VHDL aufwändiger als in anderen Sprachen. Verwendete Konvertierfunktion für die Bitvektoren vom Typ unsigned in Ausgabetexte :

```
function str(w: unsigned) return string is variable tmp: string(1 to 3); variable s: string(1 to w'length); variable i: positive:=1; begin for j in w'range loop tmp := std_logic'image(w(j)); s(i) := tmp(2); i := i + 1; end loop; return s; end function;
```

Ausgabe einer Textzeile mit Zwischenergebnissen:

(report – Funktion für die Textausgabe; < Typ>'image – Attribut für elementare Datentypen zur Konvertierung in eine Textdarstellung; & – Konkatenationsoperator zur Zusammenfassung von Feldern und Feldelementen gleichen Typs).

#### Dauer einer Hardware-Division



- Der längste Pfad verläuft durch alle Subtrahierer. Quadratische Zunahme der Laufzeit mit der Bitanzahl<sup>7</sup>.
- Die Division wird deshalb in der Regel sequentiell in n Takten mit einer n-Bit-Subtraktion pro Takt ausgeführt.
- Vergleichbare Ausführungszeit bei deutlich geringerem Hardware-Aufwand und Stromverbrauch.

#### Serieller Dividierer



- 2 Zustände: busy∈{'0', '1'}
- ullet Register für den Rest  ${f r}$  und den Quotienten  ${f q}$
- n-Bit-Subtrahierer, Zähler von 0 bis n-1

#### Schaltungsbeschreibung in VHDL

```
entity ser div is
 generic (constant n: positive:=8);
 port (
   T, I, start: in std_logic;
   sa, sb: in unsigned (n-1 \text{ downto } 0);
   busy: out std_logic;
   sr , sq: out unsigned(n-1 downto 0));
end entity;
architecture a of ser div is
 signal si: natural range 0 to n-1;
 signal sd: unsigned(n downto 0);
begin
 process(T, I)
  < Beschreibung \ der \ Zielfunktion<math>>
 end process;
end architecture;
 variable vi: natural range 0 to n-1;
 variable vBusy: std_logic;
 variable vr: unsigned(n-1 downto 0);
 variable vq: unsigned (n-1 \text{ downto } 0);
 variable vd: unsigned(n downto 0);
begin
 if I = '1' then vBusy := '0';
 elsif\ rising\_edge(T)\ then
```

if vBusy = '0' and start = '1' then

<sup>&</sup>lt;sup>7</sup> Hardware-Multiplizierer nur lineare Laufzeitzunahme mit der Bitbreite.

```
vBusy := '1';
vi := 0;
vr := (others=> '0');
end if;
<Berechnungen im Zustand busy='1'>
si <= vi; sr <= vr; sq <= vq;
sd <= vd; busy <= vBusy;
end if;</pre>

busy='0'
i = 7

start='1'
r := "00...0"
i := 0
```

Berechnung in Variablen mit abschließender Zuweisung an Signale.

```
-- Berechnungen im Zustand busy = '1'
if vBusy = '1' then
 vr := vr (6 \text{ downto } 0) \& sa (n-1-vi);
 vd := (,0, & vr) - sb;
 vq := vq(6 \text{ downto } 0) \& \text{ not } vd(8);
 if vd(8) = 0; then vr := vd(7 \text{ downto } 0); end if;
 report( < Ausgabe \ Zwischenergebnisse > );
 if vi < n-1 then vi := vi + 1;
 else
  vBusy := '0';
  report( < Ausgabe \ Endergebnisse > );
 end if;
                                                                                              i = 7
end if;
                                                                                           busy='1
                                                                                        r := r_{6:0} \& a_{7-i}
                                                             r_{6:0}
                                                      \bar{x}_{7:1}
                                                                                        d := (0, \& r) - b
                                                      x_0
                                                                                        q := p_{6:0} \& d_8
                                                                   Sub
                                                                                        wenn d_8 = 0
                                                                                        dann r := d_{7:0}
                                                                                               sonst
                                                                                               i := i + 1
```

#### Testrahmen



```
{\bf ClkProc:\ process\ --\ \it Takt-\ \it und\ \it Init.-Erzeugung}
  begin
   T \le '0'; I \le '1'; wait for 5 ns;
   T <= \ `1"; \ wait \ for \ 5 \ ns;
   T \le '0'; I \le '0'; wait for 5 ns;
    while now < 200 ns loop
    T <= \ not \ T; \ wait \ for \ 5 \ ns;
   end loop;
    wait:
  end process;
InpProc: process -- Eingabeerzeugung
  begin
   wait until busy = '0'; wait for 3 ns;
   a <= x"56"; b <= x"19"; Start <= '1';
   wait until busy = '1'; wait for 3 ns;
   Start <= \ensuremath{\,^{^{\circ}}} 0 ':
   < dasselbe mit a=E1 und b=2A>
   wait:
 end process;
```

#### Signal- und Textausgaben zur Kontrolle





#### Zusammenfassung

Auch der Dividierer wurde in Schritten entworfen:

- Formulierung des Algorithmus mit einem Zahlenbeispiel.
- Programmierung und Test des Algorithmus als imperatives Programm nach der »printf«-Methode.
- Spezifikation des Steuerablaufs und aller Operationen.
- Programmierung und Simulation. Kontrolle der Signalverläufe.
- Kontrolle der Textausgaben (Regressionstest).

#### Tatsache

Je komplizierter die Entwurfsaufgabe desto wichtiger ist ein strukturiertes testgetriebenes Herangehen.

Der nächste Schritt wäre die Überführung in eine synthesefähige VHDL-Beschreibung + Testrahmen, Regressionstest, ..., Test in der Anwendungsumgebung.