Umwandlung eines Automaten in einen regulären Ausdruck

Kapitoly: Reguläre Ausdrücke, Umwandlung eines regulären Ausdrucks in einen Automaten, Verallgemeinerte NKA, Umwandlung eines Automaten in einen regulären Ausdruck

Wir werden zeigen, wie man einen beliebigen endlichen Automaten in einen regulären Ausdruck umwandelt.

Beschreibung des Algorithmus

Als Eingabe haben wir einen NKA A. Als erstes machen wir ihn zu einem ZNKA. In der zweiten Phase entfernen wir in einem Schritt jeweils einen Zustand, ändern die Übergangsfunktionen korrekt und wiederholen den Vorgang, bis nur noch zwei Zustände übrig bleiben, der Anfangs- und der Endzustand. Zwischen ihnen wird eine Kante verlaufen, die ein regulärer Ausdruck als Label ist, der das Ergebnis des gesamten Algorithmus ist. Die gesamte Prozedur besteht also in erster Linie darin, einen Zustand zu entfernen und dann den Automaten zu reparieren, um einen gleichwertigen Automaten zu erhalten.

Entfernen eines Zustands

Wir können das Entfernen eines einzelnen Zustands anhand eines einfachen Beispiels veranschaulichen. Nehmen wir an, dass ein Teil unseres Automaten wie folgt aussieht:

wobei R_i einige reguläre Ausdrücke sind. Wie würde der Automat aussehen, wenn wir den Zustand q_r entfernen würden? Wir können uns vorstellen, dass wir uns im Zustand q_i befinden und uns fragen, welche Wörter wir in diesem Abschnitt erzeugen können. Wenn wir vom Zustand q_i direkt zum Zustand q_j übergehen, sind es alle Wörter, die dem regulären Ausdruck R₄ entsprechen.

Wenn wir aber zum Zustand q_r gehen, können wir Wörter der Form R₁ erzeugen. Aber im Zustand q_r können wir nach dem regulären Ausdruck R₂ suchen, so dass wir tatsächlich Wörter der Form $R_1\circ(R_2^\ast)$ erzeugen können. Nun, da wir immer noch vom Zustand q_r zum Zustand q_j gelangen können, können wir den regulären Ausdruck R₃ hinzufügen. Insgesamt können wir auf diese Weise Wörter der Form $R_1\circ(R_2^\ast)\circ R_3$ erhalten.

Nun wissen wir, dass dieser Teil des Automaten Wörter der Form R₄ oder der Form $R_1\circ(R_2^\ast)\circ R_3$ erzeugen kann. Natürlich können wir dies in Form eines regulären Ausdrucks wie $(R_4)|(R_1\circ(R_2^\ast)\circ R_3)$ schreiben.

Nun können wir einfach den Zustand q_r entfernen und nur die beiden Zustände q_i und q_j übrig lassen und den eben berechneten regulären Ausdruck anstelle von R₄ schreiben:

Wir tun dies mit jeder Kante von jedem Zustand q_i zu irgendeinem Zustand q_j und einschließlich Schleifen, d.h. einschließlich des Falles, in dem q_i = q_j.

Nachdem wir einen Zustand entfernt haben, erhalten wir einen äquivalenten Automaten - einen Automaten, der die gleiche Sprache erkennt.

Der gesamte Algorithmus

Als Eingabe haben wir NKA $A=\left<Q, \Sigma, \delta, q_0, F\right>$.

Wir wandeln NKA A in ZNKA $Z=\left<Q^\prime, \Sigma, \delta^\prime, q_0^\prime, q_f^\prime\right>$ um. Anschließend verwenden wir den Buchstaben k, um die Anzahl der Zustände in Z zu bezeichnen.
Wenn k = 2, wird der Algorithmus beendet und die Kante zwischen dem Anfangs- und Endzustand ist der resultierende reguläre Ausdruck.
Wenn k>2, wählen wir jeden Zustand q_r aus, der sich vom Anfangs- und Endzustand unterscheidet, d.h. $q_r\ne q_0^\prime$ und $q_r\ne q_f^\prime$. Als Nächstes erstellen wir eine neue ZNKA $Z^\prime=\left<Q^{\prime\prime}, \Sigma, \delta^{\prime\prime},q_0^{\prime},q_f^{\prime}\right>$, für die sie gültig sein wird: $$ Q^{\prime\prime}=Q^\prime\setminus\left\{q_r\right} $$ und für alle $q_i\in Q^{\prime\prime}\setminus\left\{q_f^\prime\right\}$ und für alle $q_j\in Q^{\prime\prime}\setminus \left\{q_0^\prime\right\}$ sei $$ \delta^{\prime\prime}(q_i, q_j)=(R_4)|(R_1(R_2^\ast)R_3), $$ wobei $R_1=\delta^\prime(q_i,q_r)$, $R_2=\delta^\prime(q_r,q_r)$, $R_3=\delta^\prime(q_r, q_j)$, $R_4=\delta^\prime(q_i, q_j)$. Fahren Sie mit Schritt 2 fort.

Beispiel

Betrachten wir den folgenden endlichen Automaten als Eingabe:

Zuerst wandeln wir ihn in ZNKA um (wir werden keine unnötigen ∅-Übergänge zeigen):

Nun wenden wir den zweiten Teil des Algorithmus an und entfernen einen Knoten. Wir beginnen mit dem Knoten q₂. Wir entfernen den Knoten q₂ und fügen einen Übergang vom Zustand q₁ zum Zustand q_f hinzu. Wir bezeichnen diesen Übergang als $b(a|b)^\ast$, denn vom Knoten q₁ gelangen wir für Wörter der Form b in den Zustand q₂, dann können wir für a|b zyklisch vorgehen und erhalten so $(a|b)^\ast$, und schließlich bewegen wir uns mit Hilfe der Epsilon-Regel zu q_f. Auf diese Weise erhalten wir $b(a|b)^\ast\epsilon=b(a|b)^\ast$. Wir erhalten einen Automaten:

Wir entfernen den letzten Zustand, q₁, und fügen eine Kante vom Zustand q_s zum Zustand q_f hinzu. Wie markieren wir sie? Wir können über die Epsilon-Regel zum Zustand q₁ gelangen, den wir einfach weglassen können. Dann können wir für a zyklisch vorgehen, so dass wir den regulären Ausdruck $a^\ast$ erhalten. Schließlich gelangen wir über die Kante zu q_f, also verketten wir den Ausdruck mit $b(a|b)^\ast$. Also beschreiben wir die Kante mit dem regulären Ausdruck $a^\ast b(a|b)^\ast$.

Der Automat hat nur noch zwei Zustände, also endet der Algorithmus. Die Kante ist der resultierende reguläre Ausdruck.

Hilfsmittel

Das Beispiel und die Beschreibung des Algorithmus stammen aus M. Sipser: Introduction to the Theory of Computation

« Vorheriges: Verallgemeinerte NKA

Nächstes: Schätzen von eindeutigen Werten »