Turingmaskiner – en kortfattet introduksjon Christian F Heide

Transcription

Turingmaskiner – en kortfattet introduksjon Christian F Heide
10. november 2015
Turingmaskiner – en kortfattet introduksjon
Christian F Heide
En turingmaskin er ikke en fysisk datamaskin, men et konsept eller en tankekonstruksjon
laget for å kunne resonnere omkring blant annet beregnbarhet. Det var den brilliante
matematikeren Alan Turing (1912 – 1954) som introduserte dette konseptet i sin artikkel On
Computable Numbers i 1936 [1, 2].
En turingmaskin består av
1. En tape (f. eks. en papirstrimmel eller en magnetisk tape), uendelig lang i begge
retninger, som er inndelt i celler, hvor hver celle inneholder et symbol.
2. En styringsenhet som kan være i én av et endelig antall tilstander, med et skrive/lesehode som kan lese et symbol fra og skrive et symbol til den cellen på tapen som
styringsenheten peker på.
Man tenker seg at styringsenheten kan flytte seg en celle fram eller tilbake i forhold til tapen
og at lese-/skrivehodet deretter kan lese ett symbol fra den nye cellen og så eventuelt
overskrive denne cellen med et nytt symbol. Tilstanden til styringsenheten vil kunne endre
seg og styringsenheten vil kunne flytte seg til høyre eller venstre avhengig av hvilket symbol
den leser fra tapen.
Turingmaskinen skiller seg fra endelige automater ved at den har et uendelig minne (tapen).
Det som viser seg – kanskje noe overraskende – er at en Turingmaskin i prinsippet kan
gjøre alt en datamaskin kan, og således er en enkel men generell modell av en datamaskin
[3].
En turingmaskin kan formelt defineres på følgende måte [3]:
En turingmaskin T = (S, I, f, s 0 ) består av en endelig mengde av tilstander, S, et
alfabet, I, som inkluder det tomme symbolet, B, og en partiell funksjon, f, fra 𝑆 × 𝐼 til
𝑆 × 𝐼 × {𝑅, 𝐿}, samt en starttilststand, s 0 .
R og L angir henholdsvis right og left, altså om styringsenheten skal beveges til høyre eller
venstre. At f er en partiell funksjon, innebærer at den ikke er definert for alle elementer i 𝑆 ×
𝐼. Men for de (tilstand, symbol)-par som den er definert for, er det assosiert et unikt (tilstand,
symbol, retning)-trippel. Vi kaller de sammenhørende (tilstand, symbol)-par og (tilstand,
symbol, retning)-tripler for turingmaskinens overgangsregler.
La oss nå se hvordan en turingmaskin kan tenkes å operere.
En turingmaskin opererer trinnvis. I hvert trinn vil lesehodet lese symbolet, x, i cellen den
peker på. Dersom styringsenheten er i tilstand s, og dersom funksjonen f er definert for paret
(s, x) med f(s, x) = (s’, x’, d) vil følgende skje:
- kontrollenheten går til sin nye tilstand s’
- lesehodet skriver symbolet x’ i cellen den peker på
- styringsenheten flyttes til høyre dersom d = R og til venstre dersom d = L
Vi kan skrive dette trinnet som (s, x, s’, x’, d). Dersom f ikke er definert for paret (s, x) vil
turingmaskinen stoppe.
Man kan definere en turingmaskin ved å liste alle fem-tupler av formen (s, x, s’, x’, d). På den
måten vil man også implisitt definere inngangsalfabetet og mengden av tilstander.
Det er alltid definert en starttilstand for turingmaskinen, kalt s 0 . Videre antar man at
lesehodet ved oppstart er posisjonert over den cellen som er lengst til venstre som ikke er
blank. Vi kaller dette startposisjonen.
Ulike typer turingmaskiner
Det kan defineres mange ulike typer turingmaskiner. For eksempel kan vi definere en
turingmaskin som i tillegg til å kunne flytte høyre og venstre, også kan bli stående på samme
tape-posisjon. Vi kan tillate at en turingmaskin opererer på mer enn en tape om gangen, en
såkalt multitape turingmaskin. Vi kan videre tillate at tapen er todimensjonal, slik at den lese/skrivehodet kan flyttes opp og ned, i tillegg til høyre og venstre. Vi kan ha flere lesehoder
som leser flere celler samtidig. Vi kan også tillate at en turingmaskin opererer såkalt ikkedeterministisk ved å tillate at et (tilstand, tape-symbol)-par kan opptre som de to første
elementer i mer enn ett fem-tuppel. Vi kan også redusere turingmaskinens kapasitet, f. eks.
ved at tapen er uendelig bare i en retning, eller vi kan begrense alfabetet til bare å omfatte to
symboler.
Poenget med å liste opp alle disse mulighetene er å gjøre følgende poeng tydelig: uansett
hvilke av disse variasjonene vi bruker, vil vi aldri bedre eller redusere maskinens regnekraft.
Alt som kan gjøres med en av disse variantene av turingmaskinen, kan også gjøres av den
originale turingmaskinen.
2
I tillegg til å introdusere konseptet turingmaskin, viste også Alan Turing at det er mulig å
konstruere en turingmaskin som kan simulere beregningene til enhver annen turingmaskin. En
slik maskin kalles en universell turingmaskin.
Church-Turing-tesen
Turingmaskiner kan virke svært enkle. Allikevel viser det seg at de er ekstremt kraftige i den
forstand at selv om det kan være vanskelig å lage en turingmaskin som kan utføre en bestemt
algoritme, så er det alltid mulig å lage en slik turingmaskin.
Church-Turing-tesen sier at dersom man har et problem (en oppgave) som kan løses med en
algoritme, så vil det finnes en turingmaskin som kan løse dette problemet.
Dette betyr at ethvert problem som kan løses av en datamaskin, også kan løses av en
turingmaskin. Man kan også se det slik at en turingmaskin angir den teoretiske grensen for
hva en datamaskin kan gjøre.
Kompleksitet, beregnbarhet og beslutningsproblem
Turingmaskiner kan benyttes som et presist mål for å angi en algoritmes kompleksitet.
Fra Church-Turing-tesen som vi presenterte ovenfor, vet vi at dersom et problem kan løses
ved hjelp av en effektiv algoritme, så finnes det en turingmaskin som kan løse problemet. Når
en turingmaskin brukes til å løse et problem, vil inputen til problemet være kodet som en
streng av symboler som skrives til turingmaskinens tape. Kodingen av inputen vil kunne være
forskjellig. For eksempel kan vi kode et positivt heltall som en streng av 1-ere. Vi kan ha
andre regler for å kode par av heltall, negative heltall osv. Skal vi bruke en turingmaskin for å
løse graf-algoritmer, må vi ha en måte å kode grafens kanter og noder på, noe som kan gjøres
på flere ulike måter.
Poenget her er at måten inputen kodes på ikke har noen vesentlig betydning, så lenge
kodingen er rimelig effektiv, siden en turingmaskin alltid kan endre kodingen fra en type til
en annen.
De problemene som enklest kan studeres ved hjelp av turingmaskiner, er de hvor svaret er
enten ja eller nei.
Definisjon
Et beslutningsproblem (decision problem) spør hvorvidt et utsagn fra en klasse av utsagn er
sant.
Denne type problem er også kjent som ja-eller-nei-problem.
Gitt et slikt beslutningsproblem ønsker vi å vite hvorvidt det finnes en algoritme som kan
avgjøre hvorvidt ulike utsagn fra denne klassen av utsagn er sanne.
Som et eksempel kan vi se på klassen av utsagn som spør om et bestemt heltall, n, er et
primtall. Dette er et beslutningsproblem fordi svaret på spørsmålet «Er n et primtall?» er enten
3
ja eller nei. Spørsmålet er altså om det finnes en algoritme som kan avgjøre hvorvidt hvert av
utsagnene i beslutningsproblemet er sant, altså avgjør om et heltall n er et primtall. Svaret er
at det finnes slike algoritmer. Mengden av input hvor svaret på ja-nei-problemet er ja, er en
delmengde av mengden av mulige input, altså en delmengde av input-alfabetet. Dette
innebærer at det å løse ja-nei-problem er det samme som å gjenkjenne språket som består av
alle bitstrenger som representerer input-verdiene til problemet som leder til svaret «ja».
Følgelig er det å løse et ja-nei-problem det samme som å gjenkjenne språket som svarer til
input-verdiene som gir svaret «ja» på problemet.
Beslutningsproblem (Decidability)
Dersom det finnes en effektiv algoritme som kan finne om en instans av et beslutningsproblem er sant, så sier vi at problemet er løsbart eller avgjørbart. Som eksempel kan vi si at
problemet med å avgjøre hvorvidt et heltall er et primtall, er avgjørbart. Dersom det ikke
finnes noen slik algoritme, sier vi at problemet er uløsbart eller uavgjørbart. For å vise at et
problem er avgjørbart, må vi lage en algoritme som kan avgjøre problemet. Dersom vi skal
vise at et problem er uavgjørbart, må vi bevise at det ikke finnes noen slik algoritme. Det er
ikke tilstrekkelig at vi ikke klarte å finne en slik algoritme. Å bevise dette kan være svært
vanskelig.
Stopproblemet (The halting problem) er beslutningsproblemet som spør hvorvidt en
turingmaskin vil stoppe når den gis en bestemt input-streng, x.
Det viser seg at stopproblemet er et uløsbart beslutningsproblem (altså et uavgjørbart
problem) [4].
Dette innebærer at det ikke finnes noen turingmaskin som – dersom den gis en koding av
turingmaskin T og dens input x – kan avgjøre om T vil stoppe dersom den starter med x
skrevet på tapen.
Andre eksempler på problemer som ikke er avgjørbare er:
-
problemet med å bestemme hvorvidt to kontekstfrie grammatikker genererer samme
mengde av strenger
Hilberts tiende problem som spør hvorvidt det finnes heltallsløsninger på et gitt
polynom med heltallskoeffisienter.
Beregnbarhet
En funksjon som kan beregnes av en turingmaskin, kalles beregnbar, og en funksjon som
ikke kan beregnes av en turingmaskin kalles uberegnbar. Det kan vises at det finnes
funksjoner som er uberegnbare. Det er imidlertid ikke så enkelt å lage en slik funksjon.
Merk at ethvert beslutningsproblem kan reformuleres slik at det blir en beregning av en
funksjon som har verdien 1 når svaret er ja, og 0 når svaret er nei. Et beslutningsproblem er
løsbart hvis og bare hvis den tilsvarende funksjonen er beregnbar.
4
Appendiks – Noen eksempler på bruk av turingmaskiner
(Dette er ikke pensum til eksamen)
Bruk av turingmaskiner for å gjenkjenne mengder
En av oppgavene turingmaskiner kan brukes til, er å gjenkjenne mengder. Vi må da først
definere hva vi mener med en sluttilstand for en turingmaskin. Dersom vi definerer
turingmaskinen ved hjelp av fem-tupler som beskrevet i begynnelsen av dette notatet, er
sluttilstanden en tilstand som ikke er listet som første tilstand i noen av fem-tuplene, kun som
annen tilstand (altså kun som s’, ikke som s, dersom man bruker symbolene i forrige avsnitt).
Vi kan nå definere hva vi formelt sett mener med at en turingmaskin gjenkjenner en streng
[3]:
La V være en delmengde av alfabetet I. En turingmaskin T = (S, I, f, s 0 ) gjenkjenner en
streng x i V* hvis og bare hvis T, som starter i startposisjonen når x skrives til tapen, stopper i
en sluttilstand. T sies å gjenkjenne en delmengde A av V* dersom x gjenkjennes av T hvis og
bare hvis x tilhører A.
Merk at for å gjenkjenne en delmengde A av V* kan vi bruke symboler som ikke er elementer
i V. Dette betyr at inngangsalfabetet I kan inneholde symboler som ikke er elementer i V.
Disse symbolene kan f eks benyttes som markører.
Når vil en turingmaskin ikke gjenkjenne en streng x i V*? Svaret er at x ikke gjenkjennes
dersom turingmaskinen ikke stanser eller stanser i en tilstand som ikke er en sluttilstand.
Eksempel
Finn en turingmaskin som gjenkjenner en bitstreng som har 1 som sin andre bit, dvs. strengen
(0 + 1) · 1 · (0 + 1)*
Løsning:
Følgende sett av fem-tupler definerer en turingmaskin som gjør dette:
( s 0 , 0, s1 , 0, R)
( s 0 , 1, s1 , 1, R)
Disse to første leser inn det første symbolet og setter turingmaskinen i tilstand s1. I tillegg må
vi ha følgende to:
( s1 , 0, s 2 , 0, R)
( s1 , 1, s 3 , 1, R)
Disse to leser inn symbol nummer to, og går til tilstand s 2 dersom symbol nummer to er 0, og
til tilstand s 3 dersom symbol nummer to er 1. Vi tenker oss her at s 3 er sluttilstanden, mens
s 2 ikke må være en sluttilstand. Vi må derfor inkludere et fem-tuppel med s 2 som
5
starttilstand:
( s 2 , 0, s 2 , 0, R)
Fordi vi ikke ønsker å gjenkjenne en tom streng eller en streng med ett bit, inkluderer vi
følgende to fem-tupler:
( s 0 , B, s 2 , 0, R)
( s1 , B, s 2 , 0, R)
En turingmaskin definert av disse syv fem-tupler, vil terminere i sluttilstanden s 3 hvis og bare
hvis bitstrengen har minst to bit og det andre bitet er 1. Ellers vil maskinen terminere i
tilstanden s 2 som altså ikke er en sluttilstand.
Eksempel
Finn en turingmaskin som gjenkjenner en bitstreng som består av en eller flere 0-er fulgt av
det samme antall 1-ere, altså strengen
0n 1n med n ≥ 1
Her vil det være lurt å benytte seg av et ekstra symbol som et merke, la oss kalle det M. Vi har
da V = {0, 1} og I = {0, 1, M}. Vi ser her at V* består av alle mulige bitstrenger, mens vi
ønsker å gjenkjenne en delmengde av disse.
Vi lager nå turingmaskinen slik at den erstatter en 0 lengst til venstre med en M, og en 1
lengst til høyre med en M. Dette er altså for å holde styr på hvilken 0 lengst til venstre og
hvilken 1 lengst til høyre vi har sjekket. Sluttilstanden vil bli hetende s6, og maskinen skal
altså nå denne tilstanden kun dersom den finner en blokk med 0-er fulgt av en blokk med
samme antall 1-ere.
Denne turingmaskinen defineres av følgende fem-tupler:
(s0, 0, s1, M, R)
(s1, 0, s1, 0, R)
(s1, 1, s1, 1, R)
(s1, M, s2, M, L)
(s1, B, s2, B, L)
(s2, 1, s3, M, L)
(s3, 1, s3, 1, L)
(s3, 0, s4, 0, L)
(s3, M, s5, M, R)
(s4, 0, s4, 0, L)
(s4, M, s0, M, R)
(s5, M, s6, M, R)
6
Funksjonsberegninger ved hjelp av turingmaskiner
En turingmaskin kan betraktes som en maskin som finner verdien til en partiell funksjon. Vi
kan se dette ved å anta at når turingmaskinen T gis strengen x som input, terminerer den med
strengen y på tapen. Vi kan da definere funksjonen y = T(x). Definisjonsmengden til T er
mengden av strenger for hvilke turingmaskinen T terminerer. T(x) er udefinert dersom T ikke
terminerer når den gis strengen x som input.
Men kan dette brukes når vi skal beregne funksjonsverdier av mer «vanlige» heltallsfunksjoner? Ja, det er mulig, men det blir ikke veldig enkelt og oversiktlig. Dette vil da bli en
funksjon fra k-tupler av ikke-negative heltall til ikke-negative heltall. En slik funksjon kalles
en tallteoretisk funksjon. For å kunne bruke en turingmaskin til dette, må vi ha en måte å
representere k-tupler av heltall på turingmaskinens tape. Til dette kan vi bruke en såkalt unær
(unary) representasjon av heltall. Dette består i å representere det ikke-negative heltallet n
med en streng av n + 1 enere. F. eks. vil da tallet 0 representeres av 1, tallet 2 representeres av
111 og tallet 5 representeres av 111111. For å representere fem-tuplene som turingmaskinen
består av, bruker vi et skilletegn (ofte *) mellom hvert av de fem symbolene. Dersom vi skal
representere fem-tuplet (2, 0, 1, 3) vil vi da gjøre det ved hjelp av strengen 111*1*11*1111.
Vi kan da betrakte en turingmaskin som en beregning av sekvenser av tallteoretiske
funksjoner 𝑇, 𝑇 2 , 𝑇 3 , … , 𝑇 𝑘 , …
Funksjonen 𝑇 𝑘 er definert ved aksjonen av T på k-tuplene av heltall representert ved den
unære representasjonen av heltall separert med skilletegn.
Eksempel
Lag en turingmaskin som adderer to ikke-negative heltall.
Vi ønsker altså å bygge en turingmaskin, T, som beregner funksjonen f(n1, n2) = n1 + n2. Den
unære representasjon av paret n1, n2 består av en streng av n1 + 1 enere fulgt av en stjerne
fulgt av n2 +1 enere. Maskinen skal altså ta denne strengen som input og skal som output
produsere en tape med n1 + n2 + 1 enere. En mulighet for å oppnå dette, er som følger:
Maskinen starter med eneren lengst til venstre i inputstrengen, og sletter denne. Den stopper
dersom n1 = 0. Den bytter ut stjerna med den gjenværende eneren lengst til venstre, og stopper
så. Vi kan bruke følgende fem-tupler for å oppnå dette:
(s0, 1, s1, B, R)
(s1, *, s3, B, R)
(s1, 1, s2, B, R)
(s2, 1, s2, 1, R)
(s2, *, s3, 1, R)
Som vi ser krever det en del tankearbeid og trening for å lage en turingmaskin som beregner
selv ganske enkle funksjoner.
7
Referanser
1. Turing, A.M., «On Computable Numbers, with an Application to the
Entscheidungsproblem», Proceedings of the London Mathematical Society, 2 42: 230–
65, 1937.
2. Turing, A.M., «On Computable Numbers, with an Application to the
Entscheidungsproblem: A correction», Proceedings of the London Mathematical
Society, 2 43: 544–6).
3. Rosen, K. H., «Discrete Mathematics and Its Applications», New York, McGraw-Hill,
2007, 6. utgave, avsnitt 12.5.
4. Sipser, Michael, «Introduction to the Theory of Computation», Boston, Course
Technology Inc, 2006, 2. utgave.
8