Turingmaskiner – en kortfattet introduksjon Christian F Heide
Transcription
Turingmaskiner – en kortfattet introduksjon Christian F Heide
10. november 2015 Turingmaskiner – en kortfattet introduksjon Christian F Heide En turingmaskin er ikke en fysisk datamaskin, men et konsept eller en tankekonstruksjon laget for å kunne resonnere omkring blant annet beregnbarhet. Det var den brilliante matematikeren Alan Turing (1912 – 1954) som introduserte dette konseptet i sin artikkel On Computable Numbers i 1936 [1, 2]. En turingmaskin består av 1. En tape (f. eks. en papirstrimmel eller en magnetisk tape), uendelig lang i begge retninger, som er inndelt i celler, hvor hver celle inneholder et symbol. 2. En styringsenhet som kan være i én av et endelig antall tilstander, med et skrive/lesehode som kan lese et symbol fra og skrive et symbol til den cellen på tapen som styringsenheten peker på. Man tenker seg at styringsenheten kan flytte seg en celle fram eller tilbake i forhold til tapen og at lese-/skrivehodet deretter kan lese ett symbol fra den nye cellen og så eventuelt overskrive denne cellen med et nytt symbol. Tilstanden til styringsenheten vil kunne endre seg og styringsenheten vil kunne flytte seg til høyre eller venstre avhengig av hvilket symbol den leser fra tapen. Turingmaskinen skiller seg fra endelige automater ved at den har et uendelig minne (tapen). Det som viser seg – kanskje noe overraskende – er at en Turingmaskin i prinsippet kan gjøre alt en datamaskin kan, og således er en enkel men generell modell av en datamaskin [3]. En turingmaskin kan formelt defineres på følgende måte [3]: En turingmaskin T = (S, I, f, s 0 ) består av en endelig mengde av tilstander, S, et alfabet, I, som inkluder det tomme symbolet, B, og en partiell funksjon, f, fra 𝑆 × 𝐼 til 𝑆 × 𝐼 × {𝑅, 𝐿}, samt en starttilststand, s 0 . R og L angir henholdsvis right og left, altså om styringsenheten skal beveges til høyre eller venstre. At f er en partiell funksjon, innebærer at den ikke er definert for alle elementer i 𝑆 × 𝐼. Men for de (tilstand, symbol)-par som den er definert for, er det assosiert et unikt (tilstand, symbol, retning)-trippel. Vi kaller de sammenhørende (tilstand, symbol)-par og (tilstand, symbol, retning)-tripler for turingmaskinens overgangsregler. La oss nå se hvordan en turingmaskin kan tenkes å operere. En turingmaskin opererer trinnvis. I hvert trinn vil lesehodet lese symbolet, x, i cellen den peker på. Dersom styringsenheten er i tilstand s, og dersom funksjonen f er definert for paret (s, x) med f(s, x) = (s’, x’, d) vil følgende skje: - kontrollenheten går til sin nye tilstand s’ - lesehodet skriver symbolet x’ i cellen den peker på - styringsenheten flyttes til høyre dersom d = R og til venstre dersom d = L Vi kan skrive dette trinnet som (s, x, s’, x’, d). Dersom f ikke er definert for paret (s, x) vil turingmaskinen stoppe. Man kan definere en turingmaskin ved å liste alle fem-tupler av formen (s, x, s’, x’, d). På den måten vil man også implisitt definere inngangsalfabetet og mengden av tilstander. Det er alltid definert en starttilstand for turingmaskinen, kalt s 0 . Videre antar man at lesehodet ved oppstart er posisjonert over den cellen som er lengst til venstre som ikke er blank. Vi kaller dette startposisjonen. Ulike typer turingmaskiner Det kan defineres mange ulike typer turingmaskiner. For eksempel kan vi definere en turingmaskin som i tillegg til å kunne flytte høyre og venstre, også kan bli stående på samme tape-posisjon. Vi kan tillate at en turingmaskin opererer på mer enn en tape om gangen, en såkalt multitape turingmaskin. Vi kan videre tillate at tapen er todimensjonal, slik at den lese/skrivehodet kan flyttes opp og ned, i tillegg til høyre og venstre. Vi kan ha flere lesehoder som leser flere celler samtidig. Vi kan også tillate at en turingmaskin opererer såkalt ikkedeterministisk ved å tillate at et (tilstand, tape-symbol)-par kan opptre som de to første elementer i mer enn ett fem-tuppel. Vi kan også redusere turingmaskinens kapasitet, f. eks. ved at tapen er uendelig bare i en retning, eller vi kan begrense alfabetet til bare å omfatte to symboler. Poenget med å liste opp alle disse mulighetene er å gjøre følgende poeng tydelig: uansett hvilke av disse variasjonene vi bruker, vil vi aldri bedre eller redusere maskinens regnekraft. Alt som kan gjøres med en av disse variantene av turingmaskinen, kan også gjøres av den originale turingmaskinen. 2 I tillegg til å introdusere konseptet turingmaskin, viste også Alan Turing at det er mulig å konstruere en turingmaskin som kan simulere beregningene til enhver annen turingmaskin. En slik maskin kalles en universell turingmaskin. Church-Turing-tesen Turingmaskiner kan virke svært enkle. Allikevel viser det seg at de er ekstremt kraftige i den forstand at selv om det kan være vanskelig å lage en turingmaskin som kan utføre en bestemt algoritme, så er det alltid mulig å lage en slik turingmaskin. Church-Turing-tesen sier at dersom man har et problem (en oppgave) som kan løses med en algoritme, så vil det finnes en turingmaskin som kan løse dette problemet. Dette betyr at ethvert problem som kan løses av en datamaskin, også kan løses av en turingmaskin. Man kan også se det slik at en turingmaskin angir den teoretiske grensen for hva en datamaskin kan gjøre. Kompleksitet, beregnbarhet og beslutningsproblem Turingmaskiner kan benyttes som et presist mål for å angi en algoritmes kompleksitet. Fra Church-Turing-tesen som vi presenterte ovenfor, vet vi at dersom et problem kan løses ved hjelp av en effektiv algoritme, så finnes det en turingmaskin som kan løse problemet. Når en turingmaskin brukes til å løse et problem, vil inputen til problemet være kodet som en streng av symboler som skrives til turingmaskinens tape. Kodingen av inputen vil kunne være forskjellig. For eksempel kan vi kode et positivt heltall som en streng av 1-ere. Vi kan ha andre regler for å kode par av heltall, negative heltall osv. Skal vi bruke en turingmaskin for å løse graf-algoritmer, må vi ha en måte å kode grafens kanter og noder på, noe som kan gjøres på flere ulike måter. Poenget her er at måten inputen kodes på ikke har noen vesentlig betydning, så lenge kodingen er rimelig effektiv, siden en turingmaskin alltid kan endre kodingen fra en type til en annen. De problemene som enklest kan studeres ved hjelp av turingmaskiner, er de hvor svaret er enten ja eller nei. Definisjon Et beslutningsproblem (decision problem) spør hvorvidt et utsagn fra en klasse av utsagn er sant. Denne type problem er også kjent som ja-eller-nei-problem. Gitt et slikt beslutningsproblem ønsker vi å vite hvorvidt det finnes en algoritme som kan avgjøre hvorvidt ulike utsagn fra denne klassen av utsagn er sanne. Som et eksempel kan vi se på klassen av utsagn som spør om et bestemt heltall, n, er et primtall. Dette er et beslutningsproblem fordi svaret på spørsmålet «Er n et primtall?» er enten 3 ja eller nei. Spørsmålet er altså om det finnes en algoritme som kan avgjøre hvorvidt hvert av utsagnene i beslutningsproblemet er sant, altså avgjør om et heltall n er et primtall. Svaret er at det finnes slike algoritmer. Mengden av input hvor svaret på ja-nei-problemet er ja, er en delmengde av mengden av mulige input, altså en delmengde av input-alfabetet. Dette innebærer at det å løse ja-nei-problem er det samme som å gjenkjenne språket som består av alle bitstrenger som representerer input-verdiene til problemet som leder til svaret «ja». Følgelig er det å løse et ja-nei-problem det samme som å gjenkjenne språket som svarer til input-verdiene som gir svaret «ja» på problemet. Beslutningsproblem (Decidability) Dersom det finnes en effektiv algoritme som kan finne om en instans av et beslutningsproblem er sant, så sier vi at problemet er løsbart eller avgjørbart. Som eksempel kan vi si at problemet med å avgjøre hvorvidt et heltall er et primtall, er avgjørbart. Dersom det ikke finnes noen slik algoritme, sier vi at problemet er uløsbart eller uavgjørbart. For å vise at et problem er avgjørbart, må vi lage en algoritme som kan avgjøre problemet. Dersom vi skal vise at et problem er uavgjørbart, må vi bevise at det ikke finnes noen slik algoritme. Det er ikke tilstrekkelig at vi ikke klarte å finne en slik algoritme. Å bevise dette kan være svært vanskelig. Stopproblemet (The halting problem) er beslutningsproblemet som spør hvorvidt en turingmaskin vil stoppe når den gis en bestemt input-streng, x. Det viser seg at stopproblemet er et uløsbart beslutningsproblem (altså et uavgjørbart problem) [4]. Dette innebærer at det ikke finnes noen turingmaskin som – dersom den gis en koding av turingmaskin T og dens input x – kan avgjøre om T vil stoppe dersom den starter med x skrevet på tapen. Andre eksempler på problemer som ikke er avgjørbare er: - problemet med å bestemme hvorvidt to kontekstfrie grammatikker genererer samme mengde av strenger Hilberts tiende problem som spør hvorvidt det finnes heltallsløsninger på et gitt polynom med heltallskoeffisienter. Beregnbarhet En funksjon som kan beregnes av en turingmaskin, kalles beregnbar, og en funksjon som ikke kan beregnes av en turingmaskin kalles uberegnbar. Det kan vises at det finnes funksjoner som er uberegnbare. Det er imidlertid ikke så enkelt å lage en slik funksjon. Merk at ethvert beslutningsproblem kan reformuleres slik at det blir en beregning av en funksjon som har verdien 1 når svaret er ja, og 0 når svaret er nei. Et beslutningsproblem er løsbart hvis og bare hvis den tilsvarende funksjonen er beregnbar. 4 Appendiks – Noen eksempler på bruk av turingmaskiner (Dette er ikke pensum til eksamen) Bruk av turingmaskiner for å gjenkjenne mengder En av oppgavene turingmaskiner kan brukes til, er å gjenkjenne mengder. Vi må da først definere hva vi mener med en sluttilstand for en turingmaskin. Dersom vi definerer turingmaskinen ved hjelp av fem-tupler som beskrevet i begynnelsen av dette notatet, er sluttilstanden en tilstand som ikke er listet som første tilstand i noen av fem-tuplene, kun som annen tilstand (altså kun som s’, ikke som s, dersom man bruker symbolene i forrige avsnitt). Vi kan nå definere hva vi formelt sett mener med at en turingmaskin gjenkjenner en streng [3]: La V være en delmengde av alfabetet I. En turingmaskin T = (S, I, f, s 0 ) gjenkjenner en streng x i V* hvis og bare hvis T, som starter i startposisjonen når x skrives til tapen, stopper i en sluttilstand. T sies å gjenkjenne en delmengde A av V* dersom x gjenkjennes av T hvis og bare hvis x tilhører A. Merk at for å gjenkjenne en delmengde A av V* kan vi bruke symboler som ikke er elementer i V. Dette betyr at inngangsalfabetet I kan inneholde symboler som ikke er elementer i V. Disse symbolene kan f eks benyttes som markører. Når vil en turingmaskin ikke gjenkjenne en streng x i V*? Svaret er at x ikke gjenkjennes dersom turingmaskinen ikke stanser eller stanser i en tilstand som ikke er en sluttilstand. Eksempel Finn en turingmaskin som gjenkjenner en bitstreng som har 1 som sin andre bit, dvs. strengen (0 + 1) · 1 · (0 + 1)* Løsning: Følgende sett av fem-tupler definerer en turingmaskin som gjør dette: ( s 0 , 0, s1 , 0, R) ( s 0 , 1, s1 , 1, R) Disse to første leser inn det første symbolet og setter turingmaskinen i tilstand s1. I tillegg må vi ha følgende to: ( s1 , 0, s 2 , 0, R) ( s1 , 1, s 3 , 1, R) Disse to leser inn symbol nummer to, og går til tilstand s 2 dersom symbol nummer to er 0, og til tilstand s 3 dersom symbol nummer to er 1. Vi tenker oss her at s 3 er sluttilstanden, mens s 2 ikke må være en sluttilstand. Vi må derfor inkludere et fem-tuppel med s 2 som 5 starttilstand: ( s 2 , 0, s 2 , 0, R) Fordi vi ikke ønsker å gjenkjenne en tom streng eller en streng med ett bit, inkluderer vi følgende to fem-tupler: ( s 0 , B, s 2 , 0, R) ( s1 , B, s 2 , 0, R) En turingmaskin definert av disse syv fem-tupler, vil terminere i sluttilstanden s 3 hvis og bare hvis bitstrengen har minst to bit og det andre bitet er 1. Ellers vil maskinen terminere i tilstanden s 2 som altså ikke er en sluttilstand. Eksempel Finn en turingmaskin som gjenkjenner en bitstreng som består av en eller flere 0-er fulgt av det samme antall 1-ere, altså strengen 0n 1n med n ≥ 1 Her vil det være lurt å benytte seg av et ekstra symbol som et merke, la oss kalle det M. Vi har da V = {0, 1} og I = {0, 1, M}. Vi ser her at V* består av alle mulige bitstrenger, mens vi ønsker å gjenkjenne en delmengde av disse. Vi lager nå turingmaskinen slik at den erstatter en 0 lengst til venstre med en M, og en 1 lengst til høyre med en M. Dette er altså for å holde styr på hvilken 0 lengst til venstre og hvilken 1 lengst til høyre vi har sjekket. Sluttilstanden vil bli hetende s6, og maskinen skal altså nå denne tilstanden kun dersom den finner en blokk med 0-er fulgt av en blokk med samme antall 1-ere. Denne turingmaskinen defineres av følgende fem-tupler: (s0, 0, s1, M, R) (s1, 0, s1, 0, R) (s1, 1, s1, 1, R) (s1, M, s2, M, L) (s1, B, s2, B, L) (s2, 1, s3, M, L) (s3, 1, s3, 1, L) (s3, 0, s4, 0, L) (s3, M, s5, M, R) (s4, 0, s4, 0, L) (s4, M, s0, M, R) (s5, M, s6, M, R) 6 Funksjonsberegninger ved hjelp av turingmaskiner En turingmaskin kan betraktes som en maskin som finner verdien til en partiell funksjon. Vi kan se dette ved å anta at når turingmaskinen T gis strengen x som input, terminerer den med strengen y på tapen. Vi kan da definere funksjonen y = T(x). Definisjonsmengden til T er mengden av strenger for hvilke turingmaskinen T terminerer. T(x) er udefinert dersom T ikke terminerer når den gis strengen x som input. Men kan dette brukes når vi skal beregne funksjonsverdier av mer «vanlige» heltallsfunksjoner? Ja, det er mulig, men det blir ikke veldig enkelt og oversiktlig. Dette vil da bli en funksjon fra k-tupler av ikke-negative heltall til ikke-negative heltall. En slik funksjon kalles en tallteoretisk funksjon. For å kunne bruke en turingmaskin til dette, må vi ha en måte å representere k-tupler av heltall på turingmaskinens tape. Til dette kan vi bruke en såkalt unær (unary) representasjon av heltall. Dette består i å representere det ikke-negative heltallet n med en streng av n + 1 enere. F. eks. vil da tallet 0 representeres av 1, tallet 2 representeres av 111 og tallet 5 representeres av 111111. For å representere fem-tuplene som turingmaskinen består av, bruker vi et skilletegn (ofte *) mellom hvert av de fem symbolene. Dersom vi skal representere fem-tuplet (2, 0, 1, 3) vil vi da gjøre det ved hjelp av strengen 111*1*11*1111. Vi kan da betrakte en turingmaskin som en beregning av sekvenser av tallteoretiske funksjoner 𝑇, 𝑇 2 , 𝑇 3 , … , 𝑇 𝑘 , … Funksjonen 𝑇 𝑘 er definert ved aksjonen av T på k-tuplene av heltall representert ved den unære representasjonen av heltall separert med skilletegn. Eksempel Lag en turingmaskin som adderer to ikke-negative heltall. Vi ønsker altså å bygge en turingmaskin, T, som beregner funksjonen f(n1, n2) = n1 + n2. Den unære representasjon av paret n1, n2 består av en streng av n1 + 1 enere fulgt av en stjerne fulgt av n2 +1 enere. Maskinen skal altså ta denne strengen som input og skal som output produsere en tape med n1 + n2 + 1 enere. En mulighet for å oppnå dette, er som følger: Maskinen starter med eneren lengst til venstre i inputstrengen, og sletter denne. Den stopper dersom n1 = 0. Den bytter ut stjerna med den gjenværende eneren lengst til venstre, og stopper så. Vi kan bruke følgende fem-tupler for å oppnå dette: (s0, 1, s1, B, R) (s1, *, s3, B, R) (s1, 1, s2, B, R) (s2, 1, s2, 1, R) (s2, *, s3, 1, R) Som vi ser krever det en del tankearbeid og trening for å lage en turingmaskin som beregner selv ganske enkle funksjoner. 7 Referanser 1. Turing, A.M., «On Computable Numbers, with an Application to the Entscheidungsproblem», Proceedings of the London Mathematical Society, 2 42: 230– 65, 1937. 2. Turing, A.M., «On Computable Numbers, with an Application to the Entscheidungsproblem: A correction», Proceedings of the London Mathematical Society, 2 43: 544–6). 3. Rosen, K. H., «Discrete Mathematics and Its Applications», New York, McGraw-Hill, 2007, 6. utgave, avsnitt 12.5. 4. Sipser, Michael, «Introduction to the Theory of Computation», Boston, Course Technology Inc, 2006, 2. utgave. 8