| Zeitschrift: | Bulletin des Schweizerischen Elektrotechnischen Vereins, des<br>Verbandes Schweizerischer Elektrizitätsunternehmen = Bulletin de<br>l'Association suisse des électriciens, de l'Association des entreprises<br>électriques suisses |  |  |  |
|--------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--|--|--|
| Herausgeber: | Schweizerischer Elektrotechnischer Verein ; Verband Schweizerischer Elektrizitätsunternehmen                                                                                                                                       |  |  |  |
| Band:        | 77 (1986)                                                                                                                                                                                                                          |  |  |  |
| Heft:        | 11                                                                                                                                                                                                                                 |  |  |  |
| Artikel:     | FFT-Prozessor für Echtzeit-Signalverarbeitung                                                                                                                                                                                      |  |  |  |
| Autor:       | Küng, R.                                                                                                                                                                                                                           |  |  |  |
| DOI:         | https://doi.org/10.5169/seals-904215                                                                                                                                                                                               |  |  |  |

### Nutzungsbedingungen

Die ETH-Bibliothek ist die Anbieterin der digitalisierten Zeitschriften. Sie besitzt keine Urheberrechte an den Zeitschriften und ist nicht verantwortlich für deren Inhalte. Die Rechte liegen in der Regel bei den Herausgebern beziehungsweise den externen Rechteinhabern. <u>Siehe Rechtliche Hinweise.</u>

## **Conditions d'utilisation**

L'ETH Library est le fournisseur des revues numérisées. Elle ne détient aucun droit d'auteur sur les revues et n'est pas responsable de leur contenu. En règle générale, les droits sont détenus par les éditeurs ou les détenteurs de droits externes. <u>Voir Informations légales.</u>

#### Terms of use

The ETH Library is the provider of the digitised journals. It does not own any copyrights to the journals and is not responsible for their content. The rights usually lie with the publishers or the external rights holders. <u>See Legal notice.</u>

**Download PDF:** 01.04.2025

ETH-Bibliothek Zürich, E-Periodica, https://www.e-periodica.ch

# FFT-Prozessor für Echtzeit-Signalverarbeitung

R. Küng

Bei der digitalen Verarbeitung analoger Signale (DSP) spielt die Fast Fourier Transformation (FFT) eine wesentliche Rolle. Um Echtzeitbedürfnissen gerecht zu werden, ist eine ausgewogene Soft- und Hardware-Aufgabenteilung notwendig. Die FFT-Programme sollen möglichst kurz sein, da innerhalb einer Verarbeitungsaufgabe oft mehrere FFT-Arten vorkommen können. Der skizzierte Prozessor eignet sich besonders für DSP-Aufgaben mit hochauflösenden FFT.

La transformation de Fourier rapide joue un rôle essentiel pour le traitement numérique de signaux analogiques. Afin de satisfaire aux besoins en temps réel, il importe de répartir convenablement les tâches du logiciel et celles du matériel. Les proarammes de traitement numérique doivent être aussi brefs que possible, car un tel traitement peut souvent comporter plusieurs modes FFT. Le processeur décrit convient particulièrement à ces traitements avec transformation de Fourier rapide à haute résolution.

#### **Adresse des Autors**

Roland Küng, dipl. El.-Ing. ETH, Leiter der Forschung drahtlose Kommunikation, Zellweger TeleCommunications AG, 8634 Hombrechtikon.

### 1. Einleitung

Die digitale Verarbeitung analoger Signale, im englischen Digital Signal Processing (DSP), ist ein relativ junges, eigenständiges Fachgebiet. Viele Algorithmen und Implementationen wurden erst in den letzten Jahren, als die ersten DSP-Bausteine auf den Markt kamen, studiert. Es zeigte sich bald, dass mittels DSP Systeme realisierbar wurden, die auf Grund ihrer Komplexität mit analogen Mitteln nicht zu realisieren waren. Zugleich wurden viele Systeme digitalisiert, um die Vorteile der Zuverlässigkeit, Stabilität, Alterungsfreiheit und vereinfachter Produktion nutzen zu können. Inzwischen ist die neue Technik aus Nachrichtentechnik, Regeltechnik, Medizin, Messtechnik, System-Monitoring usw. nicht mehr wegzudenken.

Um auf dem Gerätemarkt preislich angemessene Ersatzlösungen für die bisherige analoge Technik anbieten zu können, sind Systeme mit max. zwei Mikroprozessoren für DSP und Ablaufsteuerung die Regel. Andererseits verlangt der Ersatz von analogen, zeitkontinuierlichen Schaltungen eine Echtzeitverarbeitung der Signale; man denke vor allem an nachrichtentechnische Anwendungen und Regelkreise. Die Begrenzung der Anzahl DSP-Prozessoren und die Forderung nach Echtzeitverarbeitung kann dazu führen, dass die Rechenlast die Kapazität der Prozessoren übersteigt. Einer der bekanntesten und zugleich auch rechenintensivsten Algorithmen ist die Fouriertransformation. Wegen der hohen Rechenlast wirkt sie bei Echtzeitverarbeitung oft als begrenzendes Element.

In den folgenden Kapiteln soll nun gezeigt werden, wie ein optimiertes System mit einem einzigen DSP-Prozessor gebaut und für Echtzeit-Signalverarbeitung bis 8 kHz (Sprachband) genutzt werden kann. Wegen der Optimierung für FFT-Routinen wird das System im folgendem als FFT-Prozessor bezeichnet. Das System wurde mit dem DSP-Prozessor TMS 32010 von Texas Instruments realisiert; prinzipiell sind aber auch andere handelsübliche Prozessoren einsetzbar. Vielfach verfügen DSP-Prozessoren nur über einen relativ kleinen Programmspeicher, weshalb die Programme für die Transformation vom Zeit- in den Frequenzbereich und umgekehrt sehr kompakt geschrieben werden müssen.

## 2. Die schnelle Fouriertransformation (FFT)

Die Fouriertransformation ist definiert durch

$$F(j\omega) = \int_{-\infty}^{\infty} f(t)e^{-j\omega t}dt$$
 (1)

Durch Einführung eines Abtastintervalls T, das anstelle von dt in (1) eingesetzt wird, gelangt man zur Fouriertransformation für diskrete Signale (FTD) [1]:

$$F_{\rm D}(j\omega) = \sum_{n = -\infty}^{\infty} f(nT) e^{-jn\omega T}$$
(2)

Man beachte, dass (2) eine kontinuierliche Funktion beschreibt. Der Zusammenhang zwischen (1) und (2) ist gegeben durch

$$F_{\rm D}(j\omega) = \frac{1}{T} \sum_{n = -\infty}^{\infty} F\left(j\omega - j\frac{2\pi n}{T}\right) \qquad (3)$$

Da für die Berechnung von  $F_D(j\omega)$ nur N Abtastwerte zur Verfügung stehen, können auch nur N (komplexe) Spektralwerte bestimmt werden



$$F_{\rm N}\left(j\,\frac{2\pi k}{NT}\right) = \sum_{n=0}^{N-1} f(nT)\,w^{kn} \tag{4}$$

mit

$$w = e^{-2\pi j/N}, k = 0, 1, 2...N-1$$
 (5a)

Die durch [4] definierte Transformation wird als diskrete Fouriertransformation (DFT) bezeichnet, da sie im Gegensatz zur FTD diskreten Werten andere diskrete Werte zuordnet.

Für reelle Signale gilt zudem die Symmetriebedingung:

$$F_{\rm N}\left(j\,\frac{2\pi k}{NT}\right) = F_{\rm N}\left(j\,\frac{2\pi\,(N-k)}{NT}\right)^*$$
(5b)

Für die weiteren Betrachtungen wichtig ist Gleichung (4) und die Tatsache, dass die Frequenzauflösung offensichtlich durch

$$\Delta f = \frac{1}{NT} \tag{6}$$

gegeben ist.

Die schnelle Fouriertransformation (FFT) ist nun keine neue Transformation. Bei ihr wird lediglich (4) so umgeformt, dass gleiche Produkte von  $f(nT) \cdot w^{kn}$  wegen des zyklischen Charakters der ej-Funktion möglichst nur einmal berechnet werden müssen. Dabei wird die Summe (4) derart in Teilsummen unterteilt, dass zur Berechnung günstige Zerlegungen entstehen. Meist wird N als Zweierpotenz gewählt, so dass die Transformation

Schritt für Schritt und solange in je 2 kleinere FTT zerlegt werden kann, bis eine 2-Punkte-FFT übrigbleibt. Um übersichtliche Vorschriften für den Berechnungsweg zu erhalten, führte man Signalflussdiagramme (SFD) ein. Die Figur 1 zeigt ein Beispiel für N = 8. Die Abarbeitung des SFD geschieht Kolonne für Kolonne jeweils von oben nach unten. Die Knoten im SFD sind durch die Angabe der Kolonne und der Zeile eindeutig bestimmt. Das bestimmende Zahlenpaar wird als Adresse und das einzelne Signalflusselement als Butterfly bezeichnet. Die Figur 2 zeigt die verwendeten Bezeich-

i-ter Abtastwert

j-ter Spektralwert



Fig. 2 Butterfly

=(0,...,N/2-1)т

 $= a_r + ja_j$ A

B  $= b_{\rm r} + jb_{\rm j}$ C

 $= c_{\rm r} + jc_{\rm j} = A + Bw^m$  $= d_{\rm r} + jd_{\rm j} = A + Bw^{m+N/2}$ D

nungen und die zugehörige Rechenvorschrift. Damit lässt sich aus Figur 1 z. B. folgende Beziehung ablesen.

 $F(1) = f(0) + f(4)w^4$ 

+ 
$$[f(2)+f(6)w^4] \cdot w^2$$
 (7)  
+  $[[f(1)+f(5)w^4] + [f(3)+f(7)w^4] \cdot w^2] \cdot W$ 

Zur Berechnung von F(5) muss in (7) lediglich der eingekreiste Term zu w<sup>5</sup> geändert werden.

Eine weitere Vereinfachung erlaubt die Beziehung

$$w^m = -w^{m+N/2} \tag{8}$$

Die nun resultierende detaillierte Rechenvorschrift ist in Tabelle I dokumentiert.

Rechenvorschrift für Butterfly

$$\sin^{2\pi}m$$

Tabelle I

$$c_{\rm r} = a_{\rm r} + b_{\rm r} \cos \frac{2\pi}{N} m + b_{\rm j} \sin \frac{2\pi}{N} m$$

$$c_{\rm j} = a_{\rm j} + b_{\rm j} \cos \frac{2\pi}{N} m - b_{\rm j} \sin \frac{2\pi}{N} m$$

$$d_{\rm r} = a_{\rm r} - b_{\rm r} \cos \frac{2\pi}{N} m - b_{\rm r} \sin \frac{2\pi}{N} m$$

$$d_{\rm j} = a_{\rm j} - b_{\rm j} \cos \frac{2\pi}{N} m + b_{\rm j} \sin \frac{2\pi}{N} m$$

$$w^m = -e^{-2\pi j m/N} = \cos \frac{2\pi}{N} m - j \sin \frac{2\pi}{N} m$$

Damit reduziert sich die Anzahl der zu berechnenden Produkte von  $N^2$  auf  $(N/2) \log_2 N$  (für N = 512 um mehr als 99%). Im allgemeinen sind sowohl  $f_i$ wie F<sub>i</sub> komplexe Werte.

Bis heute wurden viele Zerlegungsarten gefunden; diejenige in Figur l fällt dadurch auf, dass die Spektralwerte in ihrer Reihenfolge irgendwie vertauscht sind. Dieses «irgendwie» enträtselt sich als sogenannte Bitumkehr-Ordnung. Schreibt man nämlich die Zeilen binär rückwärts auf, so erhält man den Index j der zugehörigen Spektralwerte, so wird zum Beispiel aus Zeile 3 (011) Zeile 6 (110).

Strukturen, bei denen jedes Signalflusselement 2 Eingangsknoten besitzt, werden mit Radix-2 bezeichnet. Weitere Arten entstehen durch Zusammenlegen mehrerer Knoten (4, 8...), doch kommt in der Prozessorimplementation aus Übersichtlichkeitsgründen meist nur Radix-2 und Radix-4 vor.

Obwohl bei der Durchführung der Transformation die Abtastwerte nicht einfach der zeitlichen Reihenfolge entsprechend verarbeitet werden können, ist doch in Figur 1 (und auch andern Signalflussdiagrammen) eine Gesetzmässigkeit zu erkennen. Tatsächlich können die Adressen der an einem Butterfly beteiligten Knoten, als Funktion des Wertes N, der SFD-Art und der Kolonne, in welcher der Butterfly liegt, bestimmt werden (Rekursionsformel oder Zähler) [2; 3].

# 3. Publizierte Lösungen von FFT-Prozessoren

In vielen Signalverarbeitungsaufgaben wird die FFT lediglich als Hilfsmittel eingesetzt, Funktionen in den Frequenz- oder Zeitbereich zu transformieren; sie ist dabei nicht die Hauptaufgabe.

Lösungen, die zur Erreichung einer hohen Verarbeitungsgeschwindigkeit das gesamte Signalflussdiagramm voll ausprogrammieren [4], d.h. sämtliche Adressen aller Knoten mitberechnen, sind für eine hohe Auflösung nicht brauchbar. Der Programmspeicherplatz der meisten DSP-Prozessoren (z.B. 1 k für NEC PD7720, 4 k für TMS 32010) ist dazu zu beschränkt. In [4] sind für Vocoderanwendung FFT mit N = 256 beschrieben. Die Aufgabe wird durch Zerlegung in 64-Punkte-FFT gelöst. Da das Programm für N = 64 etwa 2700 ausprogrammierte Schritte und 600 µs Ausführungszeit benötigt, sind für die 256 Punkte 6,2 ms Rechenzeit und noch ein paar Programmschritte mehr erforderlich. Die Rechenzeit wächst bei diesem Ansatz nicht linear mit der FFT-Grösse.

Ein anderer Ansatz [5] löst das Echtzeitproblem durch Einsatz von bis zu 8 DSP-Prozessoren. Sehr grosse FFT werden dabei aufgeteilt in kleinere, die parallel abgearbeitet werden. Eine weitere Möglichkeit ist, die FFT-Operation abwechslungsweise den einzelnen Prozessoren aufzutragen, so dass die freien Prozessoren in der Zwischenzeit die Ein-/Ausleseoperationen bewältigen können. Für N = 512wird eine Rechenzeit von 16 ms angegeben (exklusiv Datentransfer). Sicherlich ist aber diese Lösung in bezug auf Leistungsverbrauch, Preis und Flexibilität für viele Anwendungen zu aufwendig.

Beim Vergleich von FFT-Rechenzeiten ist etwas Vorsicht geboten; nicht immer wird erwähnt, ob Datentransferzeiten oder allfälliges Vorsortieren der Daten miteinbezogen wurde.

## 4. Realisiertes System

### 4.1 Systemforderungen

Die Anforderungen, die an den nachstehend beschriebenen Echtzeit-FFT-Prozessor gestellt werden, sind folgende: Ein Sprachbandsignal (Bandbreite 3,4 kHz) soll mit 8 kHz abgetastet werden. Bei der Verarbeitung der Signale sollen höchstens 50% der total möglichen Rechenzeit für



 Fig. 3
 Blockschema des Echtzeit-FFT-Prozessors

 Image: Datenbus
 Image: Datenbus
 Image: Datenbus

 Image: Datenbus
 Image: Datenbus
 Image: Datenbus

FFT aufgebracht werden und der Rest für die Analyse des Spektrums und zur Verarbeitung des Signals zur Verfügung stehen. Die FFT-Dimension soll im Bereich N = 16...4096 Punkte als Zweierpotenz wählbar sein.

Neben FFT und inverser FFT sollen FFT mit zeitlich überlappenden Abtastwertesätzen in allen gängigen SFD, in Radix-2- und Radix-4-Struktur, durchführbar sein. Der aktuelle Abtastwertesatz (Menge der Abtastwerte) soll auch nach seiner Transformation zugänglich sein, das heisst, er darf nicht durch die FFT-Resultate oder die laufend entstehenden Abtastwerte überschrieben werden, bevor ein neuer Satz von N Abtastwerten vorhanden ist. Im folgenden werden die Teilfunktionen des Prozessors entsprechend dem Blockdiagramm in Figur 3 erläutert.

## 4.2 DSP-Prozessor und Speicher

Als DSP-Prozessor dient ein TMS 32010 (Texas Instruments), über dessen Eigenschaften [7] nähere Auskunft gibt. Wichtig an dieser Stelle sind lediglich die für die meisten Befehle gültige Befehlszykluszeit von 200 ns sowie die Tatsache, dass er ein 16×16-bit-Multiplizierwerk und je 8 Ein-/Ausgabe-Steuertore besitzt. Der Prozessor verfügt über getrennte Abtastwerteund FFT-Resultatespeicher. Dies erlaubt nach einer FFT, den Abtastwertesatz aufgrund der Resultate weiter zu verarbeiten (z. B. Frequenzverschiebung, Filterung).

Mit überlappender FFT wird eine Betriebsart bezeichnet, bei der die Signalinformation zweimal ausgewertet wird, indem jeweils die neuere Hälfte des Abtastwertesatzes für die nächste FFT als ältere Satzhälfte wiederverwendet wird. Bei bestimmten Aufgaben ist dies wichtig, weil der Verlust an Signalenergie durch die Verwendung nichtrechteckförmiger Fensterfunktionen untragbar ist (z. B. robuste Detektion). Der Abtastwertespeicher (Grösse 2N ist zu diesem Zweck in Teilbereiche der Grösse N/2 unterteilt und wird durch eine eigene Steuerung kontrolliert. Der jeweils zu bearbeitende Satz der Grösse N wird von der Steuerung zusammengestellt und an den Datenbus des DSP-Prozessors angeschlossen. Ein Flag (INSTAT) zeigt dem TMS-Prozessor jeweils den Umschaltzeitpunkt an, so dass der für Echtzeit typische synchrone Ablauf aufrechterhalten bleibt. Der DSP-Prozessor hat jederzeit Zugriff zum Abtastwertesatz, denn der A/D-Wandler schreibt die Daten für den nächsten Abtastwertesatz über einen unabhängigen Bus in den verbleibenden freien Speicherraum. Die einzigen Eingriffe in die Steuerung durch den TMS-Prozessor sind Rücksetzfunktion, Wahl von N und Wahl «Normal/Überlappend». Somit belastet die Zusammenstellung der Datenpakete den Prozessor in keiner Weise. Der FFT-Resultatespeicher umfasst einen Block Realteil und einen Block Imaginärteil, je von der Grösse N.

#### 4.3 Koeffiziententabellen

Eine weitere Entlastung des DSP-Prozessors bzw. des Programmumfangs ergibt sich durch die Verwendung von ROM-Tabellen für die benötigten Sinus/Cosinus-Werte (Tab. I). Wegen (8) ist dabei lediglich der Bereich  $0...\pi$  zu tabellieren. Auch die Fensterfunktion zur Gewichtung der Abtastwerte ist in einem ROM tabelliert. Der Sinn dieser Fenster ist folgender: Der Einfluss des endlichen Beobachtungsintervalls  $N \cdot T$  kann mathematisch durch die Multiplikation des Eingangssignals mit einer Rechteckfunktion beschrieben werden. Gegenüber dem tatsächlichen Spektrum ist die Dynamik des gemessenen Spektrums dadurch stark eingeschränkt. Durch die Wahl von Fenstern mit stark abklingenden Spektren (z.B. cos<sup>2</sup>-Funktion) kann dieser negative Effekt vermindert werden. Der Multiplikation von Fenster h(t) und Zeitfunktion f(t)im Zeitbereich entspricht im Bildbereich die Faltung der beiden Spektren:

$$z(t) = f(t) \cdot h(t) \tag{9a}$$

$$Z(j\omega) = \frac{1}{2\pi} \int_{-\infty}^{\infty} F(j\widetilde{\omega}) H[j(\omega - \widetilde{\omega})] d\widetilde{\omega} \quad (9b)$$

Die verschiedenen gebräuchlichen Fensterfunktionen sind in [6] beschrieben. Die Figur 4 zeigt am Beispiel einer Cosinusschwingung, wie das Spektrum durch (4) und (9) gegenüber



#### Fig. 4 Mit Rechteckfenster gewichtete und abgetastete Cosinus-Schwingung

- a Zeitbereich
- b Frequenzbereich
- N Anzahl Abtastwerte (N = 16) T Abtastrate (T = 0,625s)

$$F_{\rm N}$$
 Nyquistfrequenz  $\left(F_{\rm N} = \frac{1}{2T} = 0.8\right)$ 

#### Fig. 5 FFT-Operations-Ablauf Auszug aus dem Datenblatt AM 29540 [8]. Die Vereinfachung gegenüber Figur 1 ist Resultat der Symmetrieausnutzung. IT Flag: signalisiert Ende 1. Kolonne FFT Flag: signalisiert Ende FFT



dem ursprünglichen Spektrum (einfache Spektrallinie) verändert wird.

Alle ROM-Funktionen werden Offline berechnet und die resultierenden Werte mit 16-bit-Auflösung gespeichert. Die Wahl des gewünschten ROM geschieht über ein Steuertor des DSP-Prozessors.

#### 4.4 Adressierung

Die weitaus wichtigste Umlagerung von Software auf Hardware (zur Verkürzung des Programms und zur Beschleunigung der Rechenzeit) ist das Abspalten der Adressberechnung für die Knoten der einzelnen Butterflies im Signalflussdiagramm. Gelingt dies, so braucht der DSP-Rechner lediglich die Gleichungen von Tabelle I aufzulösen.

Der DSP-Prozessor wird - je nach gewählter Zerlegungsart - von einem Hardwarezähler (Sequencer) durch das SFD geführt. Dies ist möglich dank der Regelmässigkeit, wie sie z.B. in Figur 1 zu sehen ist. Es wäre schade, die wertvolle Rechenkapazität des DSP-Prozessors mit reinen Zählaufgaben zu verschwenden. Eine eigene Sequencer-Entwicklung wurde nach Erscheinen des Adress-Sequencers AM 29540 von AMD abgebrochen. Dieser LSI ermöglicht die Adressierung von etwa 1 Dutzend FFT-Arten

(N = 2 bis 65536 Punkte, Radix-2 und Radix-4) [7]. Es müssen ihm lediglich die Anzahl Stützstellen N sowie der SFD-Typ eingegeben werden, damit er aus den relativen Adressen (Butterfly-knotenadressen A, B, C, D in Fig. 2) die absoluten Adressen und damit auch die ROM-Adressen für die Sinus-/Cosinuswerte (Exponent m) bestimmen kann.

Dem Softwareprogramm bleibt lediglich die Steuerung des Sequencers vorbehalten. Die Figur 5 zeigt den Rechenvorgang anhand einer 8-Punkte-FFT. Der DSP-Prozessor generiert die Reset/Count-Signale sowie die relative Adresse und überwacht die Flags IT und FFT, die beim Durchrechnen das Ende jeder Kolonne bzw. der gesamten FFT anzeigen. Die Ausgabe bzw. Eingabe dieser Signale geschieht über den Datenbus, wobei sie in einem separaten Steuerwort-Latch zwischengespeichert werden.

## 5. Software

## 5.1 Das FFT-Programm

Um das Zusammenspiel der Blöcke in Figur 3 besser zeigen zu können, wird im folgenden ein Softwarebeispiel für eine FFT mit Gewichtung der Abtastwerte durch ein nicht rechteckförmiges Fenster vorgestellt. Dazu noch zwei Bemerkungen:

1. Unter Ausnutzung von (8) gibt es Zerlegungen (Decimation in Time = DIT) in SFD, die ausschliesslich Exponenten m = 0 in der ganzen ersten Kolonne aufweisen. Nach Tabelle I entfallen daher die Multiplikationen mit den trigonometrischen Funktionen. Diese Vereinfachung erlaubt stattdessen, die Multiplikationen mit der Fensterfunktion einzuschieben. Die richtigen Fensterwertadressen können mit folgendem Kunstgriff gewonnen werden: Dem Sequencer wird beim ersten Schritt eine andere SFD-Zerlegung, nämlich eine DIF-Zerlegung (Decimation in Frequency) vorgetäuscht, deren Werte von m genau den Indizes von  $f_i$  entsprechen und somit als Adressen der Fensterwerte hi dienen können. Ein Beispiel einer solchen Zuordnung wäre etwa  $f_1 \rightarrow m = 1$  $\rightarrow h(1) \rightarrow f_1 \cdot h(1).$ 

Diese Operation spart eine Kolonne Rechenarbeit, was für N = 1024 immerhin 10% Zeitersparnis einbringt.

2. Die Figur 1 zeigte Spektralwerte in Bitumkehr-Ordnung. Meistens



## Fig. 6 Flussdiagramm des N-Punkt-FFT

- DIT Mode nach [2] DIF Decimation in Frequency
- DIT Decimation in Time
- Reset, N, Mode ... (1)
- Steuerwörter für Sequenzer eingeben (2)
- (3)N Abtastwerte abwarten
- 1. Kolonne mit Fenster bearbeiten (4)
- 1. Kolonne beendet? (5)
- 2. und weitere Kolonnen bearbeiten (6)
- FFT beendet? (7)

Listing-Auszug

| Start-Adr    | 0220      |      |              |                                                           |                |
|--------------|-----------|------|--------------|-----------------------------------------------------------|----------------|
| Start-Auro   |           | FFT  | 1.KOLONNE    | ****                                                      |                |
| •            | 0021      |      |              |                                                           |                |
|              | 0021      | ZAC  |              |                                                           |                |
|              | 0022      | SACL | TEMP         | TEMP Speicher wird geloescht                              |                |
|              | 0023      | OUT  | K1K1W1,STL   | Vorbereitung des Adr.Sequenzer<br>zum Lesen des Wertes ar | • u            |
|              | 0024      | IN   | AR, INRAM    |                                                           | μ,             |
|              | 0025      | OUT  | K1K1W2,STL   |                                                           | ×              |
|              | 0026      | IN   | BR, INRAM    |                                                           | Ň              |
|              | 0027      | OUT  | KIFK1,STL    |                                                           | 2              |
|              | :         |      | :            |                                                           | 4              |
|              | •         |      | •            |                                                           | 1              |
|              | :         |      |              |                                                           |                |
|              | :         |      | :            |                                                           |                |
|              |           | FET  | 2 KOLONNE ## | *****                                                     |                |
|              | 0041      |      |              |                                                           | 4              |
|              | :         |      | :            |                                                           |                |
| 0            | :         |      |              |                                                           |                |
| -            | :         |      | :            |                                                           |                |
| eh           | ÷         |      | 1            |                                                           |                |
| s.Te         | xt 0047   | IN   | SIN, SROM    | (~sin) Iin Mem.SIN einlesen                               |                |
| 8            | ► 0048    | 001  | KIK2W2,STL   |                                                           |                |
| st           |           | IN   | BR, RRAM     | br in Mem.BK einlesen                                     |                |
| ~            | 004A      | IN   | BI, IRAM     | DJ IN MEM.BI eINIESEN                                     |                |
| 1            | 0048      | MOV  | BR           | he (                                                      |                |
|              | 0040      |      | LU3          | pr.(-cos/                                                 |                |
|              | 0040      | MEV  | C IN         | bi (main)                                                 |                |
|              | DOAE      | I TA | BI           | A = br. (-cos) + bi. (-sin)                               | 1              |
|              |           | 2    |              |                                                           | E              |
|              | :         |      |              |                                                           | , <del>u</del> |
|              | :         |      | ÷            |                                                           | ×              |
|              |           | OUT  | TEMPT DOAM   | hat is DAM sealshops                                      | Ñ              |
|              | 0061      |      | TEMPA IDAM   | bi' in RAM speichern                                      | 6              |
|              | 0062      | OUT  | KINDHI STI   | b) in KAR speichern                                       | 5              |
|              | 0083      | 001  | TEMP FRAM    | ar' in RAM sogichern                                      | 1              |
|              | 0045      | DUT  | TEMP5, IRAM  | ai' in RAM speichern                                      |                |
| s.Te         | xt _ ggss | IN   | SIRAM.STI    | FFT Flag einlesen                                         |                |
|              | 0067      | OUT  | IBK1K2.5TL   | increment Butterfly                                       |                |
|              | 0068      | ZALS | STRAM        |                                                           |                |
|              | 0069      | AND  | FFTFL        |                                                           |                |
| Fnd-Adres    | SP 006A   | BZ   | KOLN         | jump if FFT Flag=0                                        |                |
| I Lina hares | 006B      |      |              |                                                           |                |
|              | 006C      | DUT  | RSFL,STL     | Reset FFT Flag                                            | 1              |
|              |           |      | ENDE         | ******                                                    |                |
|              |           |      |              |                                                           |                |

möchte man aber das Resultat in richtiger Reihenfolge geordnet haben. Es gibt solche SFD, allerdings mit Bitumkehr-Ordnung bei den Abtastwerten. SFD mit geordneten Werten auf beiden Seiten haben den Nachteil, dass sie den doppelten Arbeitsspeicherplatz benötigen. Die Bitumkehr-Ordnung bei der Adressierung der Abtastwerte wird durch Verkreuzen des Adressbusses des LSI-Sequencers beim Abtastwertespeicher realisiert; im Blockdiagramm ist dies symbolisch angedeutet.

Das Flussdiagramm der FFT ist in Figur 6 dargestellt. Der DSP-Prozessor gibt zur Steuerung der Hardware ein Steuerwort über den Datenbus in das Steuerwort-Latch. Das Steuerwort besteht aus 16 bit, die zweckmässig zusammengesetzt werden. Einer dieser Steuerwortbefehle findet sich im Listing<sup>1</sup> (Tab. II) als Befehl OUT K1K2W2, STL und steuert den LSI-Sequencer für das Einlesen des Wertes

<sup>1</sup> Komplettes Listing beim Autor erhältlich.

des 2. Knotens im Butterfly für die 2. Kolonne. Danach können die Eingangswerte  $b_r$  und  $b_i$  aus dem Abtastwert- bzw. Arbeitsspeicher (Fig. 2 und 7) eingelesen werden (IN BR, RRAM / IN BI, IRAM) und im DSP-Prozessor-internen RAM in BR bzw. BI abgelegt werden. Ähnlich wie Steuerwörter ausgegeben, können Flagwörter eingelesen werden (IN STRAM, STL).

Das gesamte Programm umfasst lediglich 74 Programmschritte. Die Belastung des Programmspeichers ist sehr gering und das erste Ziel dieser Arbeit kann damit als erfüllt bezeichnet werden.

## 5.2 Rechenzeiten

Die 1. Kolonne umfasst Operationen zu 47 Rechenzyklen à 200 ns pro Butterfly, die übrigen Kolonnen 59 Zyklen. Für N = 2048 ergibt sich somit (11 Kolonnen, 1024 Butterflies) eine Gesamtrechenzeit von 129 ms. Damit ist auch das zweite Ziel erreicht, nämlich die Echtzeitforderung. Alle 250 ms ergibt sich bei 8 kHz Abtastfrequenz ein Abtastwertesatz von 2048 Punkten,

Tabelle II

die in 129 ms transformiert werden. Somit verbleiben, wie gefordert, etwa 50% Rechenzeit für die Analyse des Spektrums, bevor ein neuer Satz transformiert werden muss.

Inverse FFT und Radix-4 lassen sich selbstverständlich in gleicher Weise programmieren. Eine Ausgabe der Rücktransformierten (Zeitsignal) über D/A-Wandler funktioniert analog dem A/D-Wandlerteil in Figur 3 und ist übersichtlichkeitshalber weggelassen.

## 6. Resultate

Für Radix-2 FFT beträgt die Rechenzeit in etwa:

$$\tau_2 \simeq N/2 \cdot 12 \,\mu \mathrm{s} \cdot \log_2 N \tag{10}$$

Eine Radix-4-Variante wurde entwickelt, die etwa dreimal soviele Zyklen benötigt, aber dafür weniger Butterflies, nämlich die Hälfte, aufweist. Somit gilt:

$$\tau_4 \approx 0,75 \cdot \tau_2 \tag{11}$$

Nach (11) ist es sogar möglich, überlappende FFT mit 8 kHz Abtastfrequenz in Echtzeit zu realisieren. Es bleiben noch etwa 25% Rechenzeit für eine Auswertung. Die beschriebene Architektur beweist ihre Vorteile am deutlichsten bei FFT grosser Auflösung, wie Tabelle III eindrücklich dokumentiert.

Man könnte nun einwenden, dass die 1,6 ms für N = 64 in Tabelle III, verglichen mit den 600  $\mu$ s in [4], sehr lang sind. Man muss aber berücksichtigen, dass dort alle 64 komplexen Werte ins interne RAM des TMS 320 eingelesen werden und so für die übri-

|            |                     |                   | Tabelle III                  |
|------------|---------------------|-------------------|------------------------------|
| Ra-<br>dix | N<br>(kom-<br>plex) | Rechenzeit<br>FFT | Rechenlast $N = 2048$        |
| 2          | 64                  | 2,2 ms            | 11 260 Butterflies           |
| 4          | 64                  | 1,6 ms            | 45 060 Multipli-<br>kationen |
| 2          | 256                 | 12,2 ms           |                              |
| 4          | 256                 | 9,2 ms            |                              |
| 2          | 1024                | 59 ms             | 135 000 Additionen           |
| 4          | 1024                | 44 ms             | 112 600 I/O-<br>Operationen  |
| 2          | 2048                | 129 ms            | - <b>F</b>                   |
| 4          | 2048                | 97 ms             |                              |



gen Kolonnen die Transfers mit den OUT- und IN-Befehlen entfallen. Der grosse Nachteil ist aber, dass praktisch der gesamte interne Speicher des TMS-Prozessors durch die FFT belegt ist, während beim beschriebenen FFT-Prozessor lediglich etwa 20% durch Werte und Steuerwörter belegt sind. Für Aufgaben, bei denen die FFT nur eine Nebenrolle spielt, ist eine Vollbelegung sicher nicht erwünscht, da alle übrigen Daten jeweils gerettet werden müssten. Eine einfache Rechnung zeigt aber, dass diese Methode tatsächlich etwa 1 ms Rechenzeit für N = 64einsparen würde. Für grosse FFT verkleinert sich der Vorteil, da diese zuerst in Teil-FFT zu 64 Punkten zerlegt werden müssen. Die Übersichtlichkeit nimmt dabei auch ab, während der hier präsentierte Vorschlag immer etwa gleich kompakt und übersichtlich abläuft.

Die im Programm (Tabelle II) angewendete Rundungstechnik ist relativ konservativ, nämlich für alle Kolonnen gleich. Sie erbringt aber immerhin eine nebenlinienfreie Dynamik von 66 dB, und dies ist für die meisten Anwendungen genügend, da analoge Schaltungen, eingeschlossen die SC-Technik, selten bessere Werte erbringen. Eine bessere Ausnutzung der insgesamt 90 dB Dynamik ist in Anbetracht des kurzen Programms denkbar. So kann z. B. jeder Kolonne eine eigene Rundungsmechanik zugeteilt oder eine Skalierung erst im Falle eines Überlaufs durchgeführt werden.

In Figur 7a ist das Spektrum einer Sinusfunktion mit dem durch «Rundungsfehler» generierten Rauschen



dargestellt. Die Figur 7b zeigt das Spektrum dreier Cosinusfunktionen. Zwei davon haben gleiche und eine (bei 533 Hz) eine gegenüber dem Spitzenwert um 66 dB niedrigere Amplitude. Das Spektrum der letzteren wird noch korrekt mit nur 3° Phasenfehler berechnet (33,69° statt 37°).

## 7. Ausblick

Die Anwendung solcher FFT-orientierter DSP-Architekturen ist vielseitig. Im vorliegenden Beispiel werden analoge Basisbandfunktionen in Funkanlagen wahrgenommen. Genau gleich lässt sich der Aufbau auch für die FFT-IR-Spektroskopie – mit ihren Spektren von N = 2048 und mehr Auflösung – oder für die Überwachung von Vibrationen und Stössen, z.B. in der Geologie und Seismik, einsetzen.

Angesichts der vielfältigen Varianten, FFT zu realisieren, sind noch einige Verbesserungen denkbar. Eine triviale Aufwertung ergibt sich durch die Wahl schnellerer DSP-Prozessoren (z. B. TI 32025, Fujitsu MB 8764, ITT UPDI 01) mit 100 ns Zykluszeit. Dank dem geringen Programmspeicherplatzbedarf sind die hier angeführten Überlegungen einfach übertragbar und führen somit zu einer Rechenzeitreduktion um den Faktor 2 (2048 Punkte, Radix-4: in 50 ms).

Die Zukunft von DSP-Prozessoren wird sicher auch schnelle CMOS-Typen bringen, so dass der Einsatz in portablen Geräten möglich wird. Ebenso werden die Preise von DSP- Bausteinen noch fallen, so dass ein Einsatz mit 2 Prozessoren zu rechtfertigen ist. Damit könnten dann z.B. 2-Kanal-Aufgaben oder Aufgaben mit Hin- und Rücktransformationen optimal durchgeführt werden. Dass Bausteine wie der LSI AM 29540 auch für andere DSP-Routinen enwickelt werden, wäre durchaus zu begrüssen.

#### Literatur

- A. W.H. von den Enden: Digitale Signalverarbeitung: Theoretische Grundlagen. Bull. SEV/VSE 77(1986)11, S. 613...620.
   R.W. Ramirez: The FFT fundamentals and concepts. Englewood Cliffs, N.J., Prentice-Hall, 1985.
   S.D. Stearns: Digitale Verarbeitung analoger Si-gnale. München/Wien, Oldenbourg, 1979.
   L. Morris: Structural considerations for large FFT's on the TMS 32010 DSP microchip. IEEE international pro-cessing (ICASSP'85) Tampa Florida, March 26...29, 1985; vol. 4, p. 1648.
- [5] D. Morgan and H. Silverman: Investigation into efficiency of a parallel TMS 320 architecture. IEEE international conference on accoustics, speech and signal processing (ICASSP'85) Tampa Florida, March 26...29, 1985; vol. 4, p. 1601.
   [6] A. H. Nuttell, Some wind the matrix tampa for the second statement of the s
- [6] A. H. Nuttall: Some windows with very good side-lobe behavior. IEEE Trans. ASSP 29(1981)1, p. 84...91.

[7] TMS 32010 user's guide. Dallas, Texas Instruments, 1983.

[8] AM 29540 programmable FFT address sequencer. Data sheet. Sunnyvale/California, Advanced Micro Devices, November 1984.





Beachten Sie bitte Katalog electro team, Teilliste 16.

## UNILINE. Die neue Sicherungselemente-Generation.

UNILINE Sicherungselemente mit gleichem Sammelschienen-Niveau wie Weber Leitungsschutzschalter UNICLIC erleichtern die Verschienung. Sie sind bei montierter Sammelschiene ein- und ausbaubar (Kreuzschlitz- und Normalschraubenzieher für Ein- und Abgangsklemmen).

Das universelle System vereinfacht die Lagerhaltung. Neutralleitertrenner können angebaut, Frontabdeckungen separat geliefert werden. Die hellblaue Neutralleiterbezeichnung ist integriert.

Vollständige Reihe 25…160 A.



moulese tit Invoceduation -Sender Stephene an under steiningene de horse offen an under stei nem Bestell ¥ongle8 aterial Aliseung echt und dioBeet innova is eurostech bieten det PLZION tigungs it'al auch pie 0 25 nach mehr 5 Energieenspart Sie besselet weitweit Get diefor 1ard tongres. awandte etahlvon IN AUSSIGNING THE RECTINE MERYA tor USE BIET DE DE ibe - Internet of the second second 125 thom ton you Web Divestor 6-11-10-86 2º asend Unenementer de ine und Automoties in releast 25 alue Konton of men Wisser Kongest. 8. und 9.10.86 Schubber of Structure of Struct O BHO

agriert.

## Brown Boveri und die Welt der Elektrizität:



## Beatrice von Wartburg (31), Chefeinkäuferin eines grossen Modehauses, ist eine ausgesprochene Vielfliegerin und daher ein anspruchsvoller Flugpassagier. Sie meint: Kloten ist attraktiver geworden.

Seit der Eröffnung des neuen Fingerdocks haben sich die Wartezeiten bei Abflug und Ankunft deutlich verkürzt. Es besteht kaum mehr ein Anlass, in die Luft zu gehen, bevor man in die Luft geht.

Wer zudem geschäftlich viel unterwegs ist, ist unbedingt darauf angewiesen, dass alles Gepäck in der gleichen Maschine mitreist. Da könnte ein fehlgeleiteter Koffer schon Folgen haben.

Obwohl heute in Kloten an Spitzentagen bis zu 28000 Gepäckstücke rasch und exakt auf unzäh-

lige Flugzeuge verteilt werden, sind solche Fehlleistungen praktisch undenkbar.

Dafür sorgt eine brandneue Gepäcksortieranlage mit einem zuverlässigen elektronischen Leitsystem von BBC.

Wenn einer eine Reise tut – dann kann er auf uns zählen.

BBC Aktiengesellschaft Brown, Boveri & Cie. CH-5401 Baden/Schweiz

