Konačni transduktor

Konačni transduktor ili konačni pretvarač je konačni automat sa dvije trake.

Uporedite ovo sa običnim konačnim automatom koji ima jednu traku. Za automat kažemo da prepoznaje niz znakova (string) ako sadržaj trake shvatimo kao ulaz. Drugim riječima, automat računa funkciju koja preslikava niz znakova u skup {0,1}. Alternativno, možemo reći da automat generiše nizove znakova, što znači da traku shvatamo kao izlaznu traku. Sa ovog gledišta, automat generiše formalni jezik, koji je formalno definisan skupom nizova znakova nad abecedom. Oba gledišta na automat su istovjetna - funkcija koju automat računa je tačno karakteristična funkcija jezika kojeg prepoznaje. Klasa jezika koje konačni automat generira jest klasa regularnih jezika.

Dvije trake transduktora se tipično gledaju kao ulazna traka i izlazna traka. Po ovom, za transduktor kažemo da transducira (ili preoblikuje) sadržaj svoje ulazne trake na izlaznu traku, prihvatanjem niza znakova na svojoj ulaznoj traci i pisanjem drugog niza na svojoj izlaznoj traci. Taj preobražaj može obaviti i nedeterministički te na taj način proizvesti više nego jedan izlaz za svaki ulazni niz. Transduktor također može i da ne proizvede izlaz za dati ulazni niz, pa u tom slučaju kažemo da ne prihvata (ili odbija) ulaz. Općenito, transduktor računa relaciju između dva formalna jezika. Klasa relacija koju računaju konačni transduktori jest klasa racionalnih relacija.

Formalna definicija uredi

Formalno, konačni transduktor T je šestorka (Q, Σ, Γ, I, F, δ) takva da:

  • Q je konačan skup stanja;
  • Σ je konačan skup ulaznih znakova (ili ulazna abeceda);
  • Γ je konačan skup izlaznih znakova (ili izlazna abeceda);
  • I je podskup skupa Q, skup početnih (ili inicijalnih) stanja;
  • F je podskup skupa Q,skup konačnih (ili finalnih) stanja; i
  •   (gdje je ε prazni niz) je relacija prijelaza.

Par (Q, δ) možemo shvatiti kao usmjereni graf (digraf) poznat kao graf prijelaza automata T: skup vrhova je Q, a   znači da postoji označeni (labelirani) brid iz vrha q prema vrhu r. Još kažemo da je a ulazna oznaka (ili ulazna labela) a b je izlazna oznaka (ili izlazna labela) tog brida.

Definišemo proširenu relaciju prijelaza   kao najmanji skup takav da:

  •  ;
  •   za svaki  ; i
  • ako   i   tada  .

Proširena relacija prijelaza jest u biti refleksivno okruženje grafa prijelaza koji je povećan na način da uzima u obzir i oznake bridova. Elementi relacije   su poznati kao putevi. Bridne oznake puta se dobiju nadovezivanjem bridnih oznaka svojih sastavnih prijelaza u redoslijedu.

Ponašanje transduktora T je racionalna relacija [T] definisana na sljedeći način:   ako i samo ako postoji   i   takvi da  . Ovime kao da kažemo da T transducira niz znakova   u niz znakova   ako postoji put od početnog do konačnog stanja čija je ulazna oznaka x i izlazna oznaka y.

Operacije nad konačnim transduktorima uredi

Sljedeće operacije definisane nad konačnim automatima također vrijede i za konačne transduktore:

  • Unija. Za date transduktore T i S, postoji transduktor   takav da   ako i samo ako   ili  .
  • Nadovezivanje (konkatenacija). Za date transduktore T i S, postoji transduktor   takav da   ako i samo ako   i  .
  • Kleeneov operator. Za dati transduktor T, postoji transduktor   sa sljedećim svojstvima: (1)  ; (2) ako   i   tada  ; i   ne vrijedi osim ako to ne nalažu (1) ili (2).

Uočite da ne postoji operacija presjeka transduktora. Umjesto toga, postoji operacija kompozicije koja je specifična za transduktore i čija je konstrukcija slična onoj pri presjeku drugih automata. Kompozicija je definisana na sljedeći način:

  • Za dati transduktor T nad abecedama Σ i Γ i transduktor S nad abecedama Γ i Δ, postoji transduktor   nad Σ i Δ takav da   ako i samo ako postoji niz znakova   takav da   i  .

Također se može napraviti projekcija neke od traka transduktora kako bi se dobio automat. Postoje dvije funkcije projekcije:

  čuva ulaznu traku, i   čuva izlaznu traku. Prva projekcija,   je definisana na sljedeći način:

  • Za dati transduktor T, postoji konačni automat   takav da   prihvaća x ako i samo ako postoji niz znakova y za koji  .

Druga projekcija,   je definisana na sličan način.

Dodatna svojstva konačnih transduktora uredi

  • Odlučivo je da li je relacija [T] transduktora T prazna.
  • Odlučivo je postoji li niz znakova y takav da x[T]y za dati niz znakova x.
  • Neodlučivo je jesu li dva transduktora istovjetna.

Također pogledajte uredi

Dodatna literatura uredi

  • Daniel Jurafsky, James H. Martin - Speech and Language Processing, Prentice Hall, 2000. ISBN 0-13-095069-6
  • Galvez, Carmen (2006). An Evaluation of Conflation Accuracy Using Finite-State Transducers. Journal of Documentation. str. vol. 62 (3), 328–349. ISSN 0022-0418. Nepoznati parametar |coauthors= zanemaren (prijedlog zamjene: |author=) (pomoć); CS1 održavanje: nepreporučeni parametar (link)
  • Galvez, Carmen (2007). Approximate Personal Name-Matching Through Finite-State Graphs. Journal of The American Society for Information Science and Technology. str. vol.58 (13), 1960–1976. ISSN 1532-2882. CS1 održavanje: nepreporučeni parametar (link)

Vanjski linkovi uredi