PDF-Dokument - Deutscher Blinden
Transcription
PDF-Dokument - Deutscher Blinden
Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006. Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen......... 1 Zusammenfassung..................................................................................... 2 Rechtliche Hinweise ................................................................................... 3 1. Klagelied eines frustrierten PDF-Neulings........................................... 3 1.1. Zusammenfassung von Teil 1 .................................................... 12 2. Nützliche Software zum Lesen und Umwandeln von PDF-Dateien... 13 2.1. Installation und Konfiguration des Adobe Readers .................... 15 2.2. Installation von XPDF................................................................. 20 2.3. Installation von GhostScript und GSView................................... 21 2.4. Installation und Konfiguration von Omnipage Pro ...................... 25 3. Wann wird welches Programm eingesetzt? - ein Entscheidungsschema ............................................................................. 27 4. Lesen, was drinsteht: Den Adobe Reader im Griff ............................ 31 4.1. Wie Screenreader und Adobe Reader zusammenarbeiten........ 32 4.2. PDF-Dokumente im Adobe Reader lesen .................................. 36 4.3. Formularbearbeitung mit dem Adobe Reader ............................ 44 4.4. Die Sprachausgabe des Adobe Readers ................................... 49 4.5. Weitere Einstellungstipps für den Adobe Reader....................... 52 5. Raus holen, was drinsteckt: PDF in Text umwandeln ....................... 53 5.1. Von PDF nach Text mit dem Adobe Reader .............................. 53 5.2. Von PDF nach Text mit PDFToText........................................... 55 5.3. Von PDF nach Text mit GSView ................................................ 59 5.4. Von PDF nach Text per Texterkennungsprogramm................... 60 5.5. Von PDF nach Text oder HTML per Internet.............................. 65 6. Noch mehr Hintergrundwissen zu PDF ............................................. 66 6.1. Die sieben Versionen des PDF .................................................. 66 6.2. Verschlüsselt und versiegelt? - Die PDF-Sicherheitseinstellungen ................................................................................................... 69 6.3. PDF mit und ohne Tags ............................................................. 72 6.4. Zur fertigen PDF-Datei auf tausend (Irr)wegen .......................... 74 7. Zugänglichkeit von PDF für Blinde: Eine kritische Bilanz .................. 79 8. Weiterführende Literaturhinweise...................................................... 84 9. Über den Autor.................................................................................. 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Zusammenfassung Dateien im so genannten Portable Document Format (PDF) finden immer größere Verbreitung - vor allem im Internet. Dafür gibt es zwei Hauptgründe: 1. PDF-Dateien sind so beschaffen, dass sie - im Gegensatz zu den meisten anderen Dokumentformaten - auf allen Betriebssystemen und in allen Anzeigeprogramme stets gleich aussehen, und zwar immer so, wie es der Autor beabsichtigt. 2. Autoren einer PDF-Datei können ihr geistiges Eigentum wirksam schützen, indem sie das Ausdrucken und Kopieren von Dokumentinhalten bzw. den Export in andere Dateiformate durch Verschlüsselung und Einschränkung der Zugriffsrechte verbieten. Gerade diese beiden für sehende Autoren und Leser vorteilhaften Aspekte ('optisches Erscheinungsbild steht im Vordergrund und ist zunächst unveränderlich' und 'Zugriffsrechte des Benutzers können eingeschränkt werden') sind es, die uns blinden Computernutzern das Leben mit PDFDokumenten schwer machen können. Bei der Arbeit mit dem Computer sind wir auf spezielle Bildschirmvorlesesoftware (so genannte Screenreader) angewiesen. Diese Programme bereiten die für Sehende EDV-Anwender auf dem Computermonitor sichtbare Information auf und präsentieren sie uns mit geeigneten Ausgabemedien: Akustisch über eine Sprachausgabe oder tastbar über eine so genannte Braillezeile. Die Schwierigkeiten, die wir mit PDF-Dokumenten haben, hängen eng mit der Notwendigkeit zusammen, einen Screenreader benutzen zu müssen - sie lassen sich in drei Problemkreisen zusammenfassen: 1. PDF-Dokumente können dem Screenreader keine oder zu wenige Informationen über ihre Struktur geben, da sie diese Informationen nicht oder in zu geringem Maße enthalten oder weil dem Screenreader der Zugriff auf diese Informationen aufgrund von Eingeschränkten Benutzerrechten verweigert wird. 2. Einzelne Screenreader unterstützen Programme wie den Adobe Reader, mit deren Hilfe PDF-Dokumente gelesen werden könnten, nur mangelhaft. 3. Die blinden Benutzer sind im Umgang mit PDF-Dateien nicht genügend geschult. Ausgehend von diesen Problemkreisen verfolgt der vorliegende Artikel drei Ziele: 1. Ich möchte erklären, warum die Tatsache, dass das PDF ein optisches und kein logisches Dokumentenformat ist dazu führt, dass wir viele PDF-Dateien nicht oder nur unter großen Mühen lesen können. 2. ich möchte erläutern, wie man mit den verschiedenen Screenreadern PDF-Dokumente lesen kann. Seite 2 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 3. Ich möchte konkret beschreiben, wie man PDF-Dokumente mit Hilfe des Adobe Readers lesen kann oder - falls dies schwierig bzw. unmöglich sein sollte - wie man den Inhalt einer PDF-Datei in ein lesbares Dokumentenformat (Text, Word, usw.) umwandeln kann. Um die Probleme, ihre Ursachen und Lösungen zu schildern, muss ich leider eine Menge computertechnisches Detailwissen ansprechen. Damit das nicht so trocken wird, habe ich mich dazu entschlossen, den Artikel in Form eines Dialoges zwischen einem blinden EDV-Berater und einem wissensdurstigen PDF-Neuling zu verfassen. Rechtliche Hinweise 1. Das vorliegende Dokument ist geistiges Eigentum des Autors Oliver Nadig (Marburg). Es darf für den privaten Gebrauch kostenlos genutzt und beliebig kopiert werden. 2. Das Dokument darf nur unverändert und nur kostenlos an Dritte weiter gegeben werden. 3. Dritten ist der Vortrag und die Weitergabe des Dokuments im Rahmen von EDV-Schulungen, Seminaren, Workshops, Weiterbildungen und ähnlichen Veranstaltungen nur gestattet, wenn entweder die Teilnahme kostenlos ist oder die entsprechende Veranstaltung von einer Organisation der Blinden- und Sehbehindertenselbsthilfe durchgeführt wird. 4. Der Text wurde mit Sorgfalt erstellt, trotzdem sind Irrtümer nicht aus zu schließen. Der Autor haftet nicht für eventuelle Fehlinformationen und Schäden, die unmittelbar oder mittelbar durch die Nutzung des vorliegenden Dokumentes entstehen könnten. 1. Klagelied eines frustrierten PDF-Neulings "Wer hat bloß dieses PDF erfunden", fragt - nein seufzt der blinde Herr in mittleren Jahren, der mir in meiner EDV-Sprechstunde für blinde und sehbehinderte Computernutzer gegenübersitzt. "Das PDF (die Abkürzung steht übrigens für Portable Document Format) wurde im Jahre 1993 von der Firma Adobe Systems Incorporated erfunden", könnte ich meinem Gesprächspartner antworten, aber das würde seine Probleme, die er mir bereits geschildert hat, nicht lösen. Mein Besucher ist seit einigen Wochen stolzer Besitzer eines blindengerecht ausgerüsteten Computerarbeitsplatzes. Das bedeutet zunächst einmal, dass auf seinem Schreibtisch ein handelsüblicher Computer mit Monitor und einem Paar Lautsprecherboxen steht. Neben dem Betriebssystem Windows XP, der Textverarbeitung Microsoft Word und einigen weiteren Anwendungsprogrammen ist auf der Festplatte des Computers noch eine für meinen Besucher absolut notwendige Software installiert, nämlich ein so genanntes Bildschirmausleseprogramm (auch Screenreader genannt). Da Seite 3 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen mein Gast als blinder Computernutzer den Bildschirminhalt optisch nicht wahrnehmen kann, sorgt der Screenreader dafür, dass die Informationen, die auf dem Computermonitor zu sehen sind, aufbereitet und über eine Sprachausgabe und eine so genannte Braillezeile wiedergegeben werden. Die Sprachausgabe ist eine - meist bereits in den Screenreader integrierte Software. Ihre meist gut verständliche und zuweilen recht angenehme Stimme wird über die Lautsprecher des Computers ausgegeben. Die Braillezeile ist ein meist platzsparend unter der PC-Tastatur stehendes flaches elektronisch gesteuertes Ausgabegerät, das mit Hilfe einer Vielzahl von Stiften Blindenschriftbuchstaben formt, die mit den Fingern ertastet werden. Da die Stifte bei Bedarf jederzeit entweder unter der Oberfläche verschwinden oder wieder daraus hervorgeschoben werden können, lässt sich dort, wo eben noch ein alter Buchstabe zu fühlen war, ein Neuer Formen, wenn sich beispielsweise der Bildschirminhalt ändert. Je nach Breite der Braillezeile können dort gleichzeitig zwischen 20 und 80 Zeichen abgebildet werden - in jedem Falle aber maximal eine Bildschirmzeile, wovon das Gerät seinen Namen erhalten hat. Zusätzlich hat sich mein blinder Gesprächspartner auch einen Scanner angeschafft. Sein Besitzer kann sich damit unter Verwendung einer Texterkennungssoftware Briefe, Bücher, Zeitschriften und sonstige gedruckte Schriftstücke aller Art zugänglich machen. Dazu erstellt der Scanner zunächst ein Bild von der Textseite, die auf seine Glasplatte gelegt wurde und überträgt es an den Computer. Dort kümmert sich dann die Texterkennungssoftware darum, dass die auf dem Seitenabbild sichtbare Schrift in ein Textdokument verwandelt wird. Dieser elektronische Text wird dann mit Hilfe des Screenreaders über die Sprachausgabe und die Braillezeile wiedergegeben. Nun hat sich mein Besucher also mit seinen Geräten angefreundet, hat unter Verwendung seines Scanners schon so manchen Text gelesen, hat in Word schon so manchen Brief an Bekannte geschrieben, ist sogar ins Internet vorgedrungen und hat dort - oh Schreck - Bekanntschaft mit PDFDokumenten gemacht. "Zusatzinformationen zur letzten Wissenschaftssendung auf meinem Lieblingsradiosender, eine Broschüre über die Rentenreform, die Bedienungsanleitung zu meinem Fernseher, deren Original ich letztes Jahr irgendwie verlegt habe - sogar die Abwassergebührenordnung meiner Heimatgemeinde - alles habe ich im Internet gefunden, aber immer nur als PDF-Datei!" "Welche Probleme gab es denn beim Lesen dieser Dokumente", frage ich und ahne schon, was da kommen würde. "Eine ganze Menge - und jedes Mal was Anderes!", kam prompt die erwartete Antwort. "Es fängt schon damit an, dass sich die PDF-Dateien im Internet immer automatisch öffnen, was ich gar nicht will. Manchmal kann ich nur die erste Seite der PDF-Datei lesen - ab und zu noch nicht mal die! In der Seite 4 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Rentenbroschüre waren alle Sätze und Absätze durcheinander. Bei der Abwassergebührenordnung und bei der Bedienungsanleitung zu meinem Fernseher kamen sogar Fehlermeldungen. Beim Abwassertext hat meine Sprachausgabe irgendwas davon erzählt, dass das Dokument leer zu sein scheint - das kann doch aber wohl nicht ganz stimmen. Bei der Bedienungsanleitung wurde etwas von Sicherheitseinstellungen geplappert, die angeblich das Lesen des Dokuments verhindern würden. Ein verflixter Kram ist das mit dem PDF!" Mir wird sofort klar, dass ich ganz am Anfang beginnen muss, wenn ich dem verzweifelten Herrn helfen möchte, seine PDF-Dokumente so weit wie möglich in den Griff zu bekommen. Also fange ich mit einer oft geprobten Vorrede an: "Da haben wir ja gleich einen ganzen Sack voller Ärgernisse. Alle Probleme, die Sie schildern, habe ich entweder selbst schon beim Umgang mit PDFDateien gehabt oder ich kenne andere blinde Computernutzer, die über diese Schwierigkeiten und Fehlermeldungen berichtet haben. Wenn Ihnen bei Ihrem Kampf mit den PDF-Dateien allerdings eine sehende Person über die Schulter geschaut hätte, wäre sie etwas verwundert über Ihre Schwierigkeiten gewesen, denn am Bildschirm war mit Sicherheit in jedem Fall ein optisch ansprechender Text zu sehen." "Das glaube ich Ihnen ja aufs Wort. Aber wie kann es denn sein, dass wir Benutzer eines Screenreaders so viele Probleme mit etwas haben, das für Sehende die einfachste Sache der Welt zu sein scheint?" "Das liegt meistens in der Natur der PDF-Dokumente selbst und sehr viel seltener daran, dass unsere Bildschirmausleseprogramme Mängel aufweisen." "Muss ja eine sehr vielseitige Natur sein, wenn es bei einigen PDFDokumenten fast gar keine Probleme gibt und mit Anderen scheinbar überhaupt nicht geht." "Mit dem Stichwort 'Vielfalt' haben Sie in der Tat den Nagel auf den Kopf getroffen. Man kann nämlich buchstäblich auf tausend Wegen zu einer PDFDatei gelangen." "Tatsächlich? Ich hatte mir das so ähnlich wie bei der Textverarbeitung in Microsoft Word vorgestellt. Da habe ich doch ein einziges Programm, mit dem ich Dateien erstelle, die dann die Endung '.doc' bekommen und die dann als Word-Dokumente bezeichnet werden." "Bei PDF-Dateien ist das ein wenig anders. Es gibt zwar Programme, in denen Sie ein Dokument erstellen und dann direkt als PDF-Datei abspeichern können. Das Bekannteste und am besten dafür geeignete Programm stammt von den Erfindern der PDF-Dokumente selbst, also von der Firma Adobe Systems und heißt Adobe Acrobat. Das gibt es jetzt aktuell schon in der Version sieben." Seite 5 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen "Mein Computer öffnet PDF-Dokumente immer mit einem Programm namens Adobe Reader, Version 6.02. Bedeuten Adobe Acrobat und Adobe Reader das gleiche?" "Nein, aber aufgrund der Namensähnlichkeit sind Verwechslungen nur all zu verständlich! Hinzu kommt noch, dass das Programm erst seit der Version 6.0 Adobe Reader heißt, bis zur Version 5.1 aber auf den Namen Adobe Acrobat Reader hörte. Der Adobe Reader ist ein kostenloses Programm, mit dem Sie PDFDokumente zwar lesen, aber nicht selbst erstellen können. Sie bekommen den Adobe Reader über das Internet, er ist aber auch auf vielen ProgrammCDs enthalten, weil mittlerweile zahlreiche Software-Handbücher als PDFDatei zur Verfügung gestellt werden. Der Adobe Reader ist das einzige PDFAnzeigeprogramm, das mit Screenreadern direkt zusammen arbeitet. Versuchen Sie also nicht, sich mit Hilfe anderer Software PDF-Dokumente vorlesen zu lassen - der Versuch ist zum Scheitern verurteilt. Vergessen Sie nie, dass der Adobe Reader kein Textverarbeitungsprogramm, sondern nur ein Betrachter, ein so genannter Viewer ist." "Dann vermute ich mal, dass die Software namens Adobe Acrobat, mit der man PDF-Dokumente nicht nur anschauen, sondern auch erstellen kann, eine Kleinigkeit kostet." "Ja, und das nicht zu knapp! Das Produkt Adobe Acrobat gibt es einmal in der Standard-Version, die aber schon über 400 Euro kostet. Die Professional Edition kostet sogar über 600 Euro. Die Finanzen sind übrigens der Knackpunkt: Mit Hilfe von Adobe Acrobat lassen sich zwar hervorragend zugängliche PDF-Dokumente erstellen; Da die Software aber so teuer ist, wird sie nur von wenigen PDF-Autoren eingesetzt, die lieber auf kostengünstigere oder kostenlose Möglichkeiten zur PDF-Erstellung zurück greifen, Leider liefern die kostengünstigen und kostenlosen Programme aber im Durchschnitt sehr viel schlechter zugängliches PDF." "Dann habe ich wohl schon mit ein paar schlecht zugänglichen PDF-Dateien Bekanntschaft gemacht. Bestimmt haben wir im Laufe unseres Gespräches noch Gelegenheit zu besprechen, auf welchen unterschiedlichen Wegen PDF-Dateien erzeugt werden können und mit welchen Programmen man die am besten für Screenreader geeigneten Dokumente produziert. Für den Augenblick interessiert mich aber mehr, wie ich diese Dateien vernünftig lesen kann. Gut: Es gibt viele Erstellungsmöglichkeiten für PDF-Dateien, Aber ich selbst benutze doch immer denselben Screenreader und immer den selben Viewer, nämlich den Adobe Reader 6.02. Wodurch unterscheiden sich denn nun genau die für mich gut zugänglichen - also gut lesbaren PDF-Dokumente von den schlecht Zugänglichen?" "Zunächst müssen wir uns darüber klar werden, dass das PDF ein Schaukasten-Dokumentformat ist. Ich meine damit folgendes: PDF ist so beschaffen, dass die entsprechenden Dokumente auf allen Betriebssystemen und in allen Anzeigeprogrammen stets gleich aussehen, und zwar so, wie es der Autor wünscht. Dazu bettet er einfach die Seite 6 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Informationen über das optische Erscheinungsbild, die verwendeten Schriftarten, die benötigten Bilder und vieles mehr in sein Dokument ein. PDF ist nahezu ein Allesfresser, wenn es um Schrift und Grafik geht. Diese erzwungene Unveränderbarkeit des Erscheinungsbildes kann im übertragenen Sinne so gedeutet werden, als würde jemand ein Dokument in eine Glasvitrine hängen, um es vor beabsichtigten oder unbeabsichtigten Veränderungen zu schützen. Dies steht natürlich im Widerspruch zu den Bedürfnissen blinder und sehbehinderter Computeranwender: • • Sehbehinderte müssen ihre Bildschirmeinstellungen wie Farben, Kontraste und Schriftgrößen stets individuell an ihre Sehbehinderung anpassen, Blinde benötigen zum Lesen eines PDF-Dokumentes einen Screenreader, der den Inhalt Sprachausgaben- und braillezeilengerecht umformt. Denken Sie in diesem Zusammenhang nur einmal daran wie wichtig es für Sie als Nicht-Sehenden bei einem Museumsbesuch ist, dass die Ausstellungsstücke aus ihren Vitrinen geholt werden, damit sie Sie betasten können." "Das leuchtet mir ein: PDF-Dateien sind wie Ausstellungsgegenstände, die in Schaukästen oder hinter Absperrungen vor mir in Sicherheit gebracht wurden, und es scheint nicht eben einfach zu sein, eine Ausnahmegenehmigung zu erhalten, sie anfassen zu dürfen. Worin liegen denn nun aber konkret die Barrieren, die potentiell zwischen mir und dem Inhalt meiner PDF-Dokumente liegen?" "Es lassen sich die folgenden sieben Punkte benennen, in denen sich ein schlecht zugängliches von einem gut zugänglichen (barrierefreien) PDFDokument unterscheidet: 1. Der Inhalt liegt nicht als Text, sondern als Grafik vor: Sie wissen, dass ein Screenreader nur mit solchen Informationen etwas anfangen kann, die als Text vorliegen; Grafiken kann ein Bildschirmleseprogramm dagegen nicht erkennen. Nun ist es technisch aber möglich, einen Text mit Hilfe eines Scanners elektronisch zu erfassen, ihn als reine Grafik zu speichern und daraus ein PDF-Dokument zu erstellen. Dieses kann Ihnen Ihr Screenreader aber nicht vorlesen, da es rein grafisch ist. Auch für sehende Benutzer haben grafische PDFDateien einen gravierenden Nachteil: Der Text kann zwar mit den Augen gelesen, aber nicht nach bestimmten Wörtern durchsucht werden, weil die Buchstaben ja keine echten Textzeichen, sondern Bestandteile eines Bildes sind. Für einen Screenreader jedenfalls ist ein grafisches Dokument leer und damit unzugänglich. Das dürfte auch auf die Abwassergebührenordnung zutreffen, von der Sie eingangs gesprochen haben. Barrierefreie PDF-Dokumente bestehen immer aus 'echtem' Text, also aus einer Menge 'echter' Zeichen, in denen nach Textpassagen gesucht werden kann. Grafische PDF-Dokumente können Sie sich nur mit Hilfe spezieller Texterkennungsprogramme zugänglich machen. Dies Seite 7 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen besprechen wir ausführlich in Abschnitt 5.4 Aber bereits die Autoren können grafische und damit unzugängliche PDF-Dokumente zugänglich machen, indem Sie ihre Dokumente nach dem Scannen per Texterkennung umwandeln lassen. Dies besprechen wir in Abschnitt 6.4. 2. Fehlende Informationen über die logische Dokumentstruktur: Nehmen Sie einmal an, dass Sie mit Hilfe von Microsoft Word einen Brief an Ihre normalsichtige Tante Elvira schreiben. Indem Sie über die Tastatur die notwendigen Zeichen eintippen, erzeugen Sie den Inhalt des Briefes. Indem Sie Text einrücken, fett drucken, unterstreichen oder bestimmte Textteile in anderer Schriftart und Schriftgröße darstellen, geben Sie ihrem Brief seine äußere Form: Sein Layout. Wenn Tante Elvira den Brief mit den Augen überfliegt kann sie anhand seines Layouts sofort erkennen, welcher Text welchen Sinn erfüllt. Beispielsweise kann sie sofort sehen, wo auf dem Papier sich Adressangaben, Anrede, Fließtext und Grußformel befinden. Das kann sie aber nur deshalb, weil sie über den allgemeinen Aufbau eines Briefes und seine Bestandteile bescheid weiß. Tante Elvira kann also durch einen einzigen Blick auf den Brief seinen logischen Aufbau aus Adressblöcken, Anrede, Fließtext und Grußformel erkennen, ohne dass diese Informationen über die Dokumentstruktur in der Word-Datei enthalten sind. Wer nichts über den logischen Aufbau eines Briefes wüsste, der würde in ihrem Word-Dokument auch keine Hinweise darauf finden. Sie können gerne sagen, dass das bei einem Brief auch gar nicht so schlimm ist, aber stellen Sie sich statt des Briefes einen längeren Referatstext, eine Hausarbeit oder einen wissenschaftlichen Artikel vor. Derartige Dokumente sind normalerweise mit Hilfe verschiedener Überschriften-Ebenen hierarchisch gegliedert und enthalten Nummerierte Listen, Aufzählungen, Fußnoten, Tabellen und vieles mehr." "Solche Artikel kenne ich aus dem Internet. Da werden mir aber die Überschriften, Nummerierungen, Listen und Tabellen immer brav von meinem Screenreader vorgelesen." "So ist es. Das liegt daran, dass in diesen Texten neben dem reinen Inhalt und den Informationen über das Layout auch Angaben über die logische Dokumentstruktur enthalten sind. Diese Angaben werden in Form von Markierungen in die Dokumente eingebettet und im Fachjargon als Tags bezeichnet. In den Internet-Dokumenten sind also nicht nur Informationen zum optischen Erscheinungsbild hinterlegt sondern auch Tags, die beispielsweise sagen: 'Dies hier ist eine Überschrift' oder 'das hier ist ein Fließtextabsatz' oder 'jetzt kommt eine Tabelle mit drei Spalten und fünf Reihen'. Ihr Screenreader wertet diese Tags aus und liest Ihnen den Text entsprechend strukturiert vor." "Ich glaube ich verstehe: Wenn ich mit meinem Screenreader ein Dokument lese, dem diese strukturierenden Tags fehlen, kann zwar vielleicht der Sehende anhand des Layouts erkennen, ob ein bestimmter Textteil eine Überschrift, eine Aufzählung oder eine Tabellenzelle sein soll, Seite 8 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen aber mein Screenreader kann das nicht, weil er kein intuitives Wissen über die Regeln der Textgestaltung hat." "Vollkommen korrekt. Gut zugängliche PDF-Dokumente enthalten Tags, die dem Screenreader erstens die logische Dokumentstruktur mitteilen und zweitens Auskunft darüber geben, in welcher Reihenfolge die verschiedenen Textblöcke auf den jeweiligen Textseiten vorgelesen werden müssen. Die Anwesenheit von Tags wirkt sich aber nicht nur positiv auf das Vorlesen durch eine Sprachausgabe, sondern auch auf die Qualität von Dateien aus, die durch die Umwandlung von PDFDokumenten in ein anderes Dokumentformat entstehen. Schlecht zugängliche PDF-Dateien sehen zwar am Bildschirm schön aus, sind aber inhaltlich nicht strukturiert, weil sie keine Tags enthalten. Sie haben keine Chance, sich absatz- oder überschriftenweise in einem solchen Dokument zu bewegen. Die Texte werden ohne logische Gliederung 'in einem Rutsch' vorgelesen. Was aber noch viel schlimmer ist: Die Reihenfolge, in der die Textteile vorgelesen werden müssen, stimmt unter Umständen nicht mehr. Bei Texten, deren Seiten mehrere Textspalten aufweisen, wobei die Spalten womöglich noch durch Bilder und über die ganze Seitenbreite verlaufende Überschriften unterbrochen werden, werden Absätze durcheinander gewürfelt, Textpassagen in falscher Reihenfolge vorgelesen und es werden Tabellen 'zerpflückt'. Das trifft vermutlich auf die Rentenbroschüre zu, von der Sie gesprochen haben." "Aha, dann ist das also vergleichbar mit der Situation, die ich manchmal beim Einscannen von mehrspaltigen Zeitschriften- und Zeitungsseiten habe: Da wird mir der Text einer Seite ab und zu auch in verkehrter Reihenfolge vorgelesen oder es werden Tabellen 'zerrissen." "Genau richtig! Während ein normalsichtiger Mensch ohne Mühe die Lesereihenfolge (Lesefolge) der verschiedenen Textblöcke auf einer Seite bestimmen kann, versagen Texterkennungsprogramme und Screenreader beim Entziffern mehrspaltiger Textseiten hin und wieder." "Beim Einscannen mehrspaltiger Seiten kann ich die Probleme ja notfalls dadurch lösen, dass ich das Blatt von einem Sehenden entsprechend zerschneiden lasse. Gibt es denn für mehrspaltige PDF-Dokumente auch eine Lösung." "Zumindest gibt es Lösungsversuche. Die bespreche ich mit Ihnen, wenn wir uns in Teil vier im Abschnitt 4.2 ausführlich mit dem Adobe Reader beschäftigen. Außerdem vertiefen wir das Thema 'Tags' aus einer eher theoretischen Sicht in Abschnitt 6.3. Kommen wir aber zunächst einmal zum dritten der sechs Probleme im Zusammenhang mit schlecht zugänglichen PDF-Dokumenten. 3 Zugriffsfeindlicher Dokumentschutz: Wie bereits erwähnt, kann der Autor den Inhalt seines PDF-Dokumentes schützen. Obwohl man es auf dem Bildschirm sehen und sich darin bewegen kann, lässt sich mit Hilfe der PDF-Sicherheitsmechanismen Seite 9 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen insbesondere das Ausdrucken und das Kopieren von Dokumentinhalten in die Zwischenablage verbieten. Der Autor kann beim Schützen eines Dokumentes so ungeschickt vorgehen, dass dem Screenreader der Zugriff auf sämtlichen Dokumentinhalt ebenfalls verweigert wird. In diesem Fall kann das Dokument zwar von sehenden Personen mit den Augen, nicht aber von einem blinden Computeranwender mittels Screenreader gelesen werden. In diesem Fall kann man versuchen, den Text des Dokumentes mit Hilfe von Programmen zu extrahieren, die die Sicherheitsmechanismen ignorieren. Wir besprechen die Handhabung derartiger Software in Abschnitt 5.3. Zugängliche PDF-Dokumente verwenden Schutzmechanismen, die den Zugriff des Screenreaders auf den Dokumentinhalt nicht verhindern und damit sowohl dem Schutzbedürfnis des Autors als auch dem Informationsbedürfnis des Screenreader-Nutzers Rechnung tragen. Nähere Informationen zu diesem Thema erhalten Sie in Abschnitt 6.2. Nun zum vierten Problem ... 4. Fehlende Navigationsmöglichkeiten: In längeren Texten will man sich nicht nur zeilen- und seitenweise bewegen können; von Dokumenten in modernen Dateiformaten wie HTML (Internetseiten) oder DOC (Microsoft Word) erwarten wir, dass uns interne Querverweise (Links) zur Verfügung stehen. Beispielsweise sollte es ein Inhaltsverzeichnis geben, dessen Einträge Querverweise zu den einzelnen Dokumentabschnitten darstellen. Auch im Text erwarten wir immer wieder Links zu anderen Textstellen, wenn darauf verwiesen wird. Mit anderen Worten: In einem komplexeren Dokument sollte man sich nicht nur auf physischer Ebene zeilen- und seitenweise, sondern auch auf logischer Ebene kapitel- und abschnittsweise bewegen können. Dies ist auch in gut strukturierten PDF-Dokumenten mit Hilfe von Querverweisen möglich. Schlecht zugängliche PDF-Dokumente wurden ohne Querverweise erstellt. Wie Sie PDF-Querverweise beim Lesen im Adobe Reader benutzen, erfahren Sie in Abschnitt 4.2. Nun zum fünften Problem ... 5. Fehlende Umflusskontrolle bei Textvergrößerung: Sehbehinderte Computerbenutzer verwenden neben spezieller Vergrößerungssoftware oftmals auch die vom jeweiligen Programm selbst zur Verfügung gestellten Zoom-Funktionen. Dabei vergrößert sich natürlich nur die Schrift, während der verfügbare Platz im Programmfenster gleich bleibt. Um den gesamten Inhalt zu lesen, muss das Dokument unter Umständen im Fenster horizontal gescrollt werden. In einer solchen Situation wünschen sich Sehbehinderte ein Dokument, das unabhängig von der eingestellten Vergrößerungsstufe stets komplett im Fenster sichtbar bleibt. Dies kann nur so realisiert werden, dass sich Zeilenumbrüche, Textspalten und Tabellen automatisch und intelligent umorganisieren. Die Anordnung von Textblöcken wird dabei also je nach Seite 10 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Textvergrößerung sinnvoll verändert. Diesen Vorgang nennt man 'umfließen'. Für Sehbehinderte Schlecht zugängliche PDF-Dokumente enthalten keinerlei Informationen darüber, wie sich ihr Inhalt bei veränderter Darstellungsgröße am Bildschirm dynamisch umordnen muss, sie haben ein schlechtes Umfließverhalten. Gut zugängliche PDF-Dateien umfließen automatisch bei veränderter Dokumentanzeigegröße. 6. Darstellungsprobleme bei selbst gewähltem Farbschema im Zusammenhang mit farbigen Texthinterlegungen: Diese für sehbehinderte Computeranwender relevante Problematik wird sehr anschaulich auf den Seiten des Projektes "Barrierefrei Informieren und Kommunizieren" (BIK) dargestellt, weshalb ich hier daraus zitieren möchte: ... so bietet der Adobe Reader zwar die für viele sehbehinderte Benutzer wichtige Möglichkeit, die Farben von PDFs anzupassen. Die Benutzereinstellungen beeinflussen jedoch nur den Seitenhintergrund und die Textfarbe - nicht aber Hintergrundflächen wie zum Beispiel farbig (oder auch weiß) hinterlegte Spalten oder Textkästen. Dadurch kann Text unter Umständen unlesbar werden, weil Schrift und Hintergrund in der gleichen Farbe angezeigt werden. Ein Beispiel: Bei einem Textkasten mit gelbem Hintergrund und schwarzer Schrift führt die Einstellung "Gelber Text auf schwarz" zu unsichtbarer Schrift, denn nur der Seitenhintergrund wird schwarz, der Kasten bleibt jedoch Gelb. Das Ergebnis: gelbe Schrift auf gelbem Hintergrund. Für die genannte Problematik ist nicht der PDF-Autor, sondern ein Fehler in der Adobe-Software verantwortlich. Einstweilen empfiehlt es sich keine farbigen Hintergründe und Texthinterlegungen zu verwenden. 7. Schlechte Zeichencodierung: während sehende Computerbenutzer Schriftzeichen an ihrem optischen Erscheinungsbild erkennen, identifizieren Screenreader Buchstaben, Ziffern und Sonderzeichen anhand einer festgelegten Zahl. Dabei muss jedem Buchstaben eindeutig genau eine Zahl und jeder Zahl eindeutig genau ein Buchstabe zugeordnet sein. Vielleicht wissen Sie, dass es in der Schrift der Sehenden üblich ist, bestimmte Buchstaben dann näher aneinander zu rücken, wenn sie in bestimmten Kombinationen vorkommen. Das ist zum Beispiel der Fall, wenn ein großes 'T' und ein kleines 'e' oder zwei kleine 'f' aufeinander folgen. Diese BuchstabenAneinanderrückungen werden als Unterschneidungen und als Ligaturen bezeichnet. Manche Zeichensätze verwenden für Ligaturen und Unterschneidungen eigene Zahlenbezeichnungen, die aber nicht eindeutig sind. Die Folge: Muss ein Screenreader einen Text mit Ligaturen und Unterschneidungen vorlesen, der unter Verwendung eines derartigen ungünstigen Zeichensatzes codiert wurde, spricht er für jede Ligatur und jede Unterschneidung unverständlichen 'Buchstabensalat'. Seite 11 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Gut zugängliche PDF-Dokumente verwenden Zeichensätze, die Ligaturen und Unterschneidungen entweder gar nicht separat codieren oder die ihnen zumindest eindeutige zahlen zuordnen, so dass der Text von einem Screenreader problemlos erkannt wird. Auch beim Umwandeln von PDF in ein anderes Dokumentenformat gibt es dann keine Schwierigkeiten." "Sie haben einzelne Abschnitte des vor uns liegenden Gespräches erwähnt. Wie sieht denn die grobe Gliederung Ihrer Beratung insgesamt aus?" "Sie haben schon gemerkt, dass Sie nicht mit einem einzigen Programm auskommen, wenn Sie sich insbesondere auch problematische, also unzugängliche, PDF-Dateien erschließen müssen. Welche Software Sie installieren sollten, wo Sie sie erhalten und wie die Installation und die Konfiguration der Programme vor sich geht, besprechen wir zunächst im folgenden Teil zwei. Faustregeln dafür, unter welchen Umständen bzw. bei welchen Problemen Sie welches Programm auf eine bestimmte PDF-Datei loslassen, diskutieren wir in Teil drei. In Teil fünf reden wir dann darüber, wie diese Programme bedient werden, nachdem wir uns in Teil vier den Geheimnissen des Adobe Readers gewidmet haben. In Teil sechs möchte ich Ihnen noch ein wenig mehr Hintergrundwissen über PDF im Allgemeinen geben, weil Sie danach gefragt haben. Wir werden daraus auch ein paar Kriterien für zugängliche PDF- Dokumente ableiten, die Sie als konkrete Tipps an PDF-Autoren weiter geben können. Abschließend ziehen wir in Teil sieben Bilanz - und ich nenne Ihnen ganz zum Schluss weiterführende Literatur, falls Sie das heute erworbene Wissen vertiefen möchten." "Da haben wir ja noch eine Menge vor uns. Vieles habe ich aber auch schon in der Einleitung unseres Gespräches gelernt. Lassen Sie es mich noch einmal kurz zusammenfassen ..." 1.1. Zusammenfassung von Teil 1 1. "PDF ist die Abkürzung für Portable Document Format und bezeichnet ein von der Firma Adobe Systems entwickeltes Dokumentenformat. Es handelt sich um ein 'Schaukasten-Format', weil das optische Erscheinungsbild der Dokumente im Mittelpunkt steht. 2. Die für uns blinde und sehbehinderte Computernutzer barrierefreien (also gut zugänglichen) PDF-Dokumente unterscheiden sich in bis zu sieben Eigenschaften von den schlecht Zugänglichen - sie enthalten: Seite 12 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen a) Text, der nicht als Grafik, sondern als Buchstabenfolge abgespeichert und damit durchsuchbar ist; b) Informationen über den logischen Dokumentaufbau, sogenannte Tags, die es dem Screenreader ermöglichen, auch komplex gestaltete PDF-Texte strukturiert und in richtiger Lesefolge wieder zu geben; c) Schutzmechanismen, die nicht auch gleichzeitig dem Screenreader den Zugriff auf das Dokument verwehren; d) Navigationsmöglichkeiten in Form von Querverweisen, die das kapitel- und abschnittsweise Bewegen im Dokument unterstützen; e) Informationen, die das automatische Umfließen eines Dokumentes beim Schriftvergrößern unterstützen; f) möglichst keine farbigen Hintergründe und Texthinterlegungen, damit durch einen generellen Fehler in den Software-Produkten von Adobe Text bei Verwendung eines benutzerdefinierten Farbschemas nicht in der gleichen Farbe wie sein Hintergrund angezeigt wird und dadurch verschwindet; g) ausschließlich solche Zeichensätze, bei denen jedes Zeichen oder jede Zeichenkombination eindeutig einer festen Zahl zugeordnet ist. 3. Zum direkten Lesen von PDF-Dokumenten mit einem Screenreader kommt als einziges Betrachtungsprogramm (als sogenannter Viewer) der Adobe Reader in Frage, der von der Firma Adobe Systems kostenlos zur Verfügung gestellt wird. 4. I einigen Fällen kann es günstig sein, die PDF-Datei in ein zugänglicheres Dokumentenformat wie 'nur Text', 'Word' oder 'RTF' um zu wandeln. Hierzu stehen neben dem Adobe Reader einige weitere Programme zur Verfügung. 5. Den Inhalt von PDF-Dokumenten, die aus reiner Grafik bestehen kann man sich nur unter Einsatz einer Texterkennungssoftware zugänglich machen." "Das haben Sie so gut zusammen gefasst, dass wir gleich zum nächsten Abschnitt übergehen können. Ich möchte übrigens im Folgenden zwei Kürzungen im Zusammenhang mit den häufig vorkommenden Bezeichnungen 'Adobe Reader' bzw. 'Acrobat Reader' verwenden: 1. Wenn ich von 'A.R.' spreche, meine ich eine beliebige Version des Adobe Readers oder des Acrobat Readers. 2. Setze ich noch eine Zahl hinter 'A.R.', so meine ich eine ganz bestimmte Version oder Generation des Adobe Readers bzw. Acrobat Readers. Das Kürzel 'A.R.7' bezeichnet die aktuelle Programmversion 7; die Abkürzung 'A.R.5' soll für 'Acrobat Reader, Version 5' stehen." 2. Nützliche Software zum Lesen und Umwandeln von PDF-Dateien Seite 13 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen "Jetzt also zu der kleinen Programmsammlung, die Sie zum Arbeiten mit PDF-Dateien auf Ihrem PC installiert haben sollten. Zunächst nenne ich Ihnen die einzelnen Programme, dann beschreibe ich, wie sie installiert werden: 1. Da wäre zunächst natürlich der Adobe Reader (A.R.) selbst, mit dessen Installation und Konfiguration wir uns in Abschnitt 2.1 befassen. Die Version 6.02 dieses Programms haben Sie ja bereits auf Ihrem Rechner installiert. Ich würde Ihnen aber ein Update auf die neueste Version (derzeit 7.05) empfehlen. Mit dem A.R. können Sie PDF-Dateien direkt lesen, sie aber auch: a) Unter Beibehaltung des Layouts über die Zwischenablage ins Format 'Word' bzw. 'RTF' konvertieren b) Unter weitgehendem Verlust der Textstrukturmerkmale per Menübefehl als reine Textdatei abspeichern. c) Sollen bei einer Konvertierung vom PDF- Ins Textformat Leerzeilen und einige weitere Texteigenschaften erhalten bleiben, brauchen Sie ein anderes Umwandlungsprogramm, nämlich: 2. Das Programm PDFToText, das im Programmpaket XPDF enthalten ist. PDFToText ist beim Konvertieren wesentlich schneller als der A.R. Mit der Installation von XPDF beschäftigen wir uns in Abschnitt 2.2. Macht es der Autor einer PDF-Datei durch die Aktivierung diverser Sicherheitseinstellungen dem Screenreader unmöglich, an den Inhalt des Dokumentes zu gelangen, weigern sich sowohl der A.R., als auch das Programm PDFToText, das Dokument in andere Formate um zu wandeln. Dann benötigen Sie zusätzlich: 3. Das Programmpaar AFPL GhostScript/GSView. Das Programm AFPL GhostScript selbst verfügt nicht über eine grafische Benutzeroberfläche. Diese liefert GSView, deshalb werden beide Programme nacheinander installiert. Wie - das erfahren Sie in Abschnitt 2.3. • Wenn ein PDF-Dokument jedoch aus reiner Grafik besteht, nützen uns all die bisher genannten Programme nichts. Dann brauchen wir: 4. Eine Texterkennungssoftware. Ich möchte Ihnen sogar zwei Programme kurz vorstellen. Zum Einen das handelsübliche 'Omnipage Pro', zum Anderen das speziell für Blinde und Sehbehinderte entwickelte 'An Open Book'. Installation und Konfiguration von Omnipage beschreibe ich in Abschnitt 2.4. Die Installation der genannten Programme ist in allen Fällen absolut unkompliziert. Mit Ausnahme des Programmpaketes XPDF, greifen nämlich sämtliche Produkte bei der Installation auf den Windows Installer zurück. Das ist ein fester Bestandteil des Betriebssystems Windows, der Sie beim Aufspielen einer Software mit einer Benutzeroberfläche namens Install Shield Wizard unterstützt. Der Install Shield Wizard, den ich im Folgenden einfach als Installationsassistenten bezeichnen möchte, leitet Sie Schritt für Schritt durch die Programminstallation. Dazu werden mehrere Fenster in einer ganz bestimmten Reihenfolge angezeigt. Sobald Sie in einem Fenster alle Eingaben bzw. Einstellungen vorgenommen haben, können Sie mit Hilfe der Schaltfläche 'Weiter' zum nächsten Fenster gelangen. Möchten Sie Seite 14 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen nachträglich zu einem vorangehenden Schritt zurück kehren, so ist dies jederzeit über die Schaltfläche 'Zurück' möglich. "Fast alle professionellen Programme nutzen übrigens den Install Shield Wizard. Damit ist gewährleistet, dass jede Installation - unabhängig vom konkreten Programm - stets nach dem gleichen Schema abläuft." "Alles klar! Dann mal los." 2.1. Installation und Konfiguration des Adobe Readers "Da Ihre PC-Ausstattung die Systemvoraussetzungen zur Installation der neuesten Version des Adobe Readers erfüllt, würde ich Ihnen das Update von der vorhandenen Version 6.02 auf die derzeit aktuelle Version 7.05 empfehlen." "Stellt denn der A.R.7 so hohe Ansprüche ans System?" "Nun, das Betriebssystem Windows 98 wird vom A.R.7 nicht mehr unterstützt. Benutzer von Windows 98 müssen also mit der Version 6 des Programms Vorlieb nehmen." "Wo bekomme ich denn die Version 7 her?" "Grundsätzlich finden Sie alle verfügbaren A.R.-Versionen Zum Herunterladen im Internet unter der Adresse www.adobe.com/products/acrobat/readstep2_allversions.html . Sollte sich diese Adresse mittlerweile geändert haben, beginnen Sie bei der Startseite der Firma Adobe Systems unter der Adresse www.adobe.com. Achtung! Von jeder Programmversion des A.R. gibt es Varianten, die keine Unterstützung für Screenreader enthalten. Diese für Sie ungeeigneten Spielarten heißen beim A.R.7 'Basic Version'. Sie benötigen hingegen eine Vollversion mit Screenreader-Unterstützung. Achten Sie deshalb darauf, dass im Namen der Datei, die Sie letztendlich herunterladen, der Namensbestandteil 'Full' vorkommt. Auf der Download-Seite bestimmen Sie über Ausklapplisten zunächst, für welches Betriebssystem, welche Betriebssystemversion und welche Landessprache Sie einen A.R. benötigen. Danach geben Sie über eine Gruppe von Auswahlschaltern die A.R.-Version an (die Aktuellste ist immer voreingestellt). Über zwei standardmäßig aktivierte Kontrollfelder bestimmen Sie, welche Zusatzkomponenten ebenfalls im Download-Paket enthalten sein sollen. Wählbar sind das Programm 'Adobe PhotoShop' sowie die 'Yahoo Toolbar'. Falls Sie nicht absolut sicher sind, dass Sie die beiden genannten Zusatzkomponenten benötigen, deaktivieren Sie die entsprechenden Kontrollfelder. Beginnen Sie den Download schließlich über den entsprechenden Link unterhalb des Formulars. Beachten Sie dabei, dass das Download-Paket vermutlich mehr als 20 Megabyte groß ist. Speichern Sie das Programm auf Ihrer Festplatte in einem Ordner, den Sie schnell Wieder finden. Seite 15 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Nachdem der Download abgeschlossen ist, öffnen Sie die heruntergeladene Datei über den ARBEITSPLATZ oder den WINDOWS EXPLORER. Damit Starten Sie den Installationsvorgang. Durch die Installation von A.R.7 wird übrigens ein eventuell auf dem System noch vorhandener A.R.6 automatisch deinstalliert. Zur Installation, durch die Sie mit Hilfe des Install Shield Wizard Schrittweise geleitet werden, ist folgendes zu sagen: 1. Direkt nach dem Start des Installationsvorgangs wird zunächst die Konfiguration Ihres PCs untersucht, um eine optimierte Installation des A.R. durch zu führen. Dieser Vorgang dauert je nach Geschwindigkeit Ihres Computers eine bis mehrere Minuten. 2. Nachdem die Installation vorbereitet ist, erscheint ein erstes Dialogfenster, in dem sich der Installationsassistent ankündigt. Bestätigen Sie es mit der standardmäßig angewählten Schaltfläche 'Weiter'. 3. Im zweiten Dialogfenster werden Sie vom Installationsassistenten begrüßt und erhalten einige rechtliche Hinweise. Bestätigen Sie auch dieses Fenster mit der standardmäßig angewählten Schaltfläche 'Weiter'. 4. Im dritten Dialogfenster haben Sie die Möglichkeit fest zu legen, in welchen Ordner der A.R.7 auf Ihrer Festplatte installiert wird. Behalten Sie nach Möglichkeit den vorgegebenen Installationsordner • 'C:\Programme\Adobe\Acrobat 7.0' • bei. Bestätigen Sie das Dialogfenster mit der standardmäßig angewählten Schaltfläche 'Weiter'. 5. Im vierten Dialogfenster werden Ihnen die aktuellen Einstellungen nochmals präsentiert, um sie gegebenenfalls vor der eigentlichen Installation noch einmal ändern zu können. da Sie dies nicht wollen, starten Sie die Installation über die standardmäßig angewählte Schaltfläche 'installieren'. 6. Nach ein bis zwei Minuten ist die Installation abgeschlossen. Wenn der Vorgang erfolgreich war, wird Ihnen dies gemeldet - und Sie können den Installationsassistenten über die standardmäßig angewählte Schaltfläche 'fertigstellen' beenden. 7. Falls Sie jetzt aufgefordert werden, Ihren Computer neu zu starten, sollten Sie dies tun, indem Sie die standardmäßig angewählte Schaltfläche 'Ja' betätigen." "Wollen Sie mir damit sagen, dass ich zum Installieren des A.R. mit den Standardeinstellungen lediglich sechsmal bei entsprechender Gelegenheit auf die EINGABETASTE drücken muss?" "Genauso ist es. Das Installieren aller weiteren Programme wird ähnlich einfach sein. Lassen Sie uns zunächst aber den frisch installierten Adobe Reader 7 konfigurieren - das heißt die wichtigsten Programmeinstellungen vornehmen: 1. Die Installation hat bewirkt, dass auf Ihrem DESKTOP ein Symbol zum Öffnen des A.R.7 abgelegt wurde. Bitte rufen Sie das Programm auf. Seite 16 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 2. Zunächst werden Sie aufgefordert, den Lizenzvertrag zu lesen und ihm zu zu stimmen. Benutzen Sie hierzu die Schaltfläche 'akzeptieren'. 3. Falls der A.R. auf Ihrem System eine so genannte 'Hilfstechnologie', also einen Screenreader oder ein Bildschirmvergrößerungsprogramm findet, wird der 'Assistent für Ausgabehilfen' gestartet. Es erscheint das erste von fünf Dialogfenstern. Der Systemfokus steht in einer Gruppe von drei Auswahlschaltern, von denen der Dritte mit der Bezeichnung 'Alle Ausgabehilfeoptionen festlegen' ausgewählt ist. Alternativ könnten Sie entweder nur 'Optionen für Vergrösserungsprogramme Festlegen' oder nur 'Optionen für Sprachausgabeprogramme festlegen'. Behalten Sie jedoch die vorgewählte Option bei. Das Dialogfenster stellt außerdem die Schaltfläche 'Empfohlene Einstellungen verwenden und Setup überspringen' zur Verfügung, mit deren Hilfe Sie den Anpassungsvorgang dem A.R. überlassen könnten. Betätigen Sie jedoch die Schaltfläche 'Weiter', um die Einstellungen höchst persönlich vor zu nehmen. 4. Im zweiten Schritt des Assistenten für Ausgabehilfen nehmen Sie visuelle Einstellungen vor: • Aktivieren Sie bei Bedarf das Kontrollfeld 'Kontrastreiche Farben für Dokumenttext verwenden', um anschließend aus einer Liste von Kontrasten den Passenden auswählen zu können. • Deaktivieren Sie bei Bedarf das Kontrollfeld 'Textglättung deaktivieren', damit Text nicht zusätzlich geglättet wird. • Legen Sie bei Bedarf über die Liste 'Standardanzeigegröße' einen Vergrößerungsfaktor für die Darstellung des Dokumentes fest. Dies wirkt sich - wie auch all die anderen Einstellungen dieses Dialoges - nicht auf das Zusammenspiel zwischen dem A.R. und einem Screenreader aus. • Lassen Sie das Kontrollfeld 'Immer Auswahl-Cursor der Tastatur verwenden' aktiviert. • Bestätigen Sie das Fenster zum Abschluss mit 'Weiter'. 5. Die Einstellungen im dritten der fünf Schritte des Ausgabehilfeassistenten beziehen sich auf Dokumente, die keine Tags, also keine Informationen über ihren logischen Aufbau und damit auch keinerlei Angaben über die Lesereihenfolge von Textblöcken enthalten: • Mit Hilfe einer Gruppe von Drei Auswahlschaltern legen Sie für Dokumente, die keine Tags enthalten, die Leserichtung fest. Bei der vorgewählten Option 'Leserichtung aus Dokument ableiten (empfohlen)' wird die Leserichtung anhand des Textflusses und des Schriftverlaufes nach einem komplizierten Verfahren aus dem Dokument ermittelt. Alternativ können Sie auch eine Leserichtung festlegen. Hierzu stehen die Optionen 'Leserichtung von links nach rechts, von oben nach unten' und 'Leserichtung in Druckdatenstrom verwenden' zur Verfügung. In der Praxis hat sich die empfohlene Option bewährt. • Lassen Sie das Kontrollfeld 'Leserichtung in Dokumenten mit Tags überschreiben' deaktiviert. Bei Dokumenten, die Tags enthalten, kann der A.R. zwar die durch die Tags vorgegebene Seite 17 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Lesereihenfolge überschreiben und die angegebene Leserichtung verwenden; dies ist in der Regel jedoch nicht notwendig, da die Lesereihenfolge über die Tags hinreichend genau angegeben sein sollte. • Lassen Sie das Kontrollfeld 'Tags nur nach vorheriger Bestätigung in Dokumenten einfügen' aktiviert. Der A.R. kann zwar versuchen, ein Dokument ohne Tags nachträglich damit zu versehen, dies sollte man aber dem Programm bei Bedarf gestatten und nicht automatisiert durchführen lassen. • Bestätigen Sie abschließend das Fenster mit 'Weiter'. 6. In Schritt vier des Ausgabehilfeassistenten geht es darum, in welchen Portionen der Inhalt des PDF-Dokumentes an einen Screenreader übermittelt wird. Die 'Portionsgrößen' können entscheidend dafür sein, ob der Screenreader das Dokument flüssig vorliest, ob man beim Umblättern von Seiten länger auf eine Reaktion der Sprachausgabe warten muss oder ob der Screenreader sogar wegen 'Überfütterung' abstürzt: • Wie viele Informationen dem Screenreader auf einmal übergeben werden, legen Sie über eine Gruppe von drei Auswahlschaltern fest. Die dritte Option 'Alle Seiten nur bei kleinen Dokumenten bereitstellen' ist standardmäßig aktiviert. Alternativ stehen zur Verfügung: 'Momentan sichtbare Seiten bereitstellen' (liefert dem Bildschirmleser nur sehr wenige Informationen auf einmal) und 'Gesamtes Dokument auf einmal bereitstellen' (überfüttert unter Umständen den Screenreader bei umfangreichen PDF-Dateien). Behalten Sie also die vorgewählte Einstellung bei. • Wenn Sie dies tun, ist das Eingabefeld 'Maximale Seitenanzahl in einem kleinen Dokument' verfügbar. Hier können Sie angeben, bis zu wie vielen Seiten ein PDF-Dokument als 'klein' gelten soll. Die Praxis hat gezeigt, dass der hier voreingestellte Wert von 50 zu groß ist. Geben Sie am Besten die Zahl 10 ein. • Bestätigen Sie das Fenster mit 'Weiter'. 7. Im fünften und letzten Schritt des Ausgabehilfeassistenten legen Sie folgende Einstellungen fest: z Lassen Sie das Kontrollfeld 'Automatisches Speichern deaktivieren' aktiviert. Diese Option dürfte sich in Ihrer Arbeitspraxis allerdings kaum auswirken: Automatisch in bestimmten Zeitabständen gespeichert würde nämlich nur dann, wenn Sie ein PDF-Dokument mit Anmerkungen versehen, es überprüfen oder digital unterschreiben dürfen. Dafür muss der Autor das Dokument jedoch mit so genannten 'erweiterten Verwendungsrechten' ausstatten. Dies ist jedoch nur bei den wenigsten der über das Internet veröffentlichten PDF-Dateien der Fall. Trotzdem würde ein automatisches Speichern dazu führen, dass der A.R. das Dokument neu laden muss. Das hätte eine Unterbrechung des Vorlesens durch den Screenreader zur Folge. z Lassen Sie das Kontrollfeld 'Dokumente mit zuletzt angezeigter Seite wieder öffnen' aktiviert wenn Sie möchten, dass PDF-Dateien, die Sie schon einmal geöffnet hatten und erneut aufrufen, ab der zuletzt aufgeschlagenen Seite vorgelesen werden. Soll das Seite 18 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Vorlesen jedoch stets am Anfang des Dokumentes beginnen, deaktivieren Sie das Kontrollfeld. z Die dritte Option in diesem Dialogfenster bezieht sich auf ein Problem das Sie mir am Anfang unseres Gespräches geschildert haben: Wenn Sie ein PDF-Dokument von einer Internet-Seite aus aufrufen, wird es direkt im Fenster des Internet Explorers geöffnet. Sie möchten jedoch, dass es in einem Fenster des A.R. präsentiert wird. Sie erreichen dies, indem Sie das Kontrollfeld 'PDFDokumente im Web-Browser anzeigen' auf seiner Standardeinstellung (deaktiviert) lassen. Diese Option war in früheren Versionen des A.R. ungünstigerweise eingeschaltet. z Bestätigen Sie nun noch das Dialogfenster mit 'Fertigstellen' und Sie haben den A.R. optimal für die Zusammenarbeit mit einem Screenreader angepasst! 8. Eventuell werden Sie jetzt wieder aufgefordert, Ihren PC neu zu starten, damit die geänderten Einstellungen wirksam werden können. Lassen Sie dies zu, indem Sie die angewählte Schaltfläche 'Ja' betätigen." "Mal angenommen, ich behalte entweder meinen A.R.6 oder möchte nachträglich in A.R.7 die mit dem Ausgabehilfeassistenten vorgenommenen Einstellungen überprüfen oder ändern - wie gehe ich da vor?" "Dazu stehen Ihnen in A.R.7 zwei Wege offen: 1. Rufen Sie über den Menüpunkt 'Bearbeiten | Grundeinstellungen' oder die Tastenkombination STRG+K den Dialog 'Grundeinstellungen' auf. Der Systemfokus steht dann in einer Liste mit verschiedenen Themen, zu denen Einstellungen vorgenommen werden können. Sie finden: a) In der Einstellungskategorie 'Lesen' neben Optionen für die Sprachausgabefunktion des A.R. die Einstellmöglichkeiten für PDF-Dokumente ohne Tags (Dialogfenster drei des Ausgabehilfeassistenten) und Einstellmöglichkeiten für die Art der Dokumentübermittlung an den Screenreader (Dialogfenster vier des Ausgabehilfeassistenten); b) In der Einstellungskategorie 'Internet' das Kontrollfeld 'PDFDokumente in Browser anzeigen', das festlegt, ob sich PDFDateien direkt in Ihrem Internet Browser oder in einem eigenen Fenster des A.R. öffnen (Dialogfenster fünf des Ausgabehilfeassistenten); c) in der Einstellungskategorie 'Seitenanzeige' die visuellen Einstellungen aus Dialogfenster zwei des Ausgabehilfeassistenten. 2. Wählen Sie mit den Pfeiltasten die gewünschte Einstellungskategorie und durchlaufen Sie sie mit der TAB-Taste. 3. Sie können sämtliche Schritte des Ausgabehilfeassistenten jederzeit erneut durchlaufen. Rufen Sie dazu den Menüpunkt 'Hilfe | SetupAssistent für Ausgabehilfe' auf." Seite 19 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 2.2. Installation von XPDF "Nun zum Programmpaket XPDF. Auch dieses laden Sie zunächst aus dem Internet herunter. Es ist unter der sogenannten GNU General Public License frei verfügbar. Die Adresse der Homepage der Software lautet www.foolabs.com/xpdf. Auch hier können Sie eine Download-Seite unter www.foolabs.com/xpdf/download.html direkt erreichen. XPDF wird in seiner derzeit aktuellen Version 3.01 für eine Reihe von Betriebssystemen angeboten. Suchen Sie deshalb auf der Download-Seite nach Text, der mit 'X86, Dos/Win32' beginnt. Der Link unterhalb dieses Textes, der derzeit 'xpdf-3.01-win32.zip' heißt, startet direkt den Download der Datei, die die Windows-Version von XPDF enthält. Wie Sie der Dateinamenerweiterung (.zip) ansehen, handelt es sich nicht um eine ausführbare Installationsdatei - diese müsste die Endung .exe haben. Es handelt sich vielmehr um ein gepacktes Datei-Archiv im Format ZIP. Wer nicht mit dem Betriebssystem Windows XP arbeitet, müsste zum 'Auspacken' (Extrahieren) dieses ZIP-Archivs ein geeignetes Programm installiert haben, zum Beispiel WinZip, WinRar oder FreeZip. Windows XP hat jedoch eine direkte Unterstützung von Dateien im ZIP-Format integriert - und ich möchte Ihnen das Entpacken mittels dieser integrierten Funktion schildern. Rufen Sie also die heruntergeladene Datei über ARBEITSPLATZ oder Windows Explorer auf. Nun passiert Folgendes: 1. Zunächst wird das ZIP-Archiv geöffnet. Der Inhalt wird in einem gewöhnlichen Ordnerfenster angezeigt, so dass Sie sich mit den Pfeiltasten von Eintrag zu Eintrag bewegen können. Allerdings ist im gerade geöffneten Archiv lediglich ein einziger Eintrag, nämlich ein Ordner namens 'XPDF-3.01-Win32' enthalten. Markieren Sie diesen Ordner mit der LEERTASTE. 2. Rufen sie anschließend den Menüpunkt 'Datei | Alle extrahieren' (ALT+D, H) auf. Sie werden dann in einem Dialogfenster vom Extrahier-Assistenten begrüßt. Bestätigen Sie dieses Fenster mit der standardmäßig angewählten Schaltfläche 'Weiter'. 3. Im zweiten Fenster des Extrahier-Assistenten werden Sie aufgefordert, den Pfad eines Ordners an zu geben, in den der soeben von Ihnen markierte gezippte Ordner 'xpdf-3.01-win32' entpackt werden soll. Überschreiben Sie die Vorgaben in diesem Eingabefeld möglichst mit dem Pfad 'C:' oder einer anderen Bezeichnung für eines Ihrer Festplattenlaufwerke. Ich gehe im Weiteren davon aus, dass 'C:' eingegeben wurde. Die übrigen Optionen des Dialoges brauchen Sie nicht zu beachten, weshalb Sie das Fenster mit der standardmäßig voraktivierten Schaltfläche 'Weiter' bestätigen können. 4. Im dritten Fenster des Extrahier-Assistenten erhalten Sie die Meldung, dass die gewählten Dateien erfolgreich in das angegebene Verzeichnis extrahiert wurden. Über das standardmäßig aktivierte Kontrollfeld 'Extrahierte Dateien anzeigen' erhalten Sie die Möglichkeit, die entpackten Inhalte direkt nach dem Fertigstellen des Assistenten begutachten zu können. Lassen Sie das Kontrollfeld also Seite 20 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen aktiviert und bestätigen Sie das Fenster mit der standardmäßig voraktivierten Schaltfläche 'Fertigstellen'. 5. Nach dem Fertigstellen des Assistenten erscheint ein Ordnerfenster, das den Inhalt des Ordners anzeigt, in den Sie die gewählten Dateien (in Ihrem Fall war es ein Ordner) entpackt haben. Bezogen auf das Beispiel sollte der Inhalt des Ordners C:\ angezeigt werden. Hierin existiert nun ein Unterordner mit dem Namen 'xpdf-3.01-win32'. Da dieser Name etwas unhandlich ist, sollten Sie den Ordner in 'xpdf' umbenennen. Benutzen Sie dazu bei angewähltem Ordnernamen entweder das Kontextmenü oder die Taste F2. 6. Damit ist die Software XPDF und somit insbesondere das benötigte Umwandlungsprogramm PDFToText einsatzbereit. Wie man es benutzt, besprechen wir in Abschnitt 5.2." 2.3. Installation von GhostScript und GSView "Mit Hilfe von AFPL GhostScript lassen sich PDF-Dateien anzeigen und in Text umwandeln, und zwar auch Solche bei denen dem Screenreader aufgrund ungewollt strenger PDF-Sicherheitseinstellungen der Zugriff auf den Inhalt nicht möglich ist. Die Steuerung des an sich äußerst leistungsfähigen Programms ist jedoch umständlich, da es über keine menüund dialoggestützte Bedienoberfläche verfügt, wie man es von Microsoft Word und anderen Anwendungen gewohnt ist. Hier setzt das Programm GSView an. Seine wesentliche Aufgabe besteht darin, für AFPL Ghostscript eine Windows-gemäße Benutzeroberfläche mit Menüs und Dialogfenstern zur Verfügung zu stellen. Da GSView die Anwesenheit von AFPL Ghostscript auf Ihrem System voraussetzt, muss man AFPL Ghostscript vor GSView installieren. Beide Programme werden unter der Public License kostenlos zur Verfügung gestellt. Eine gemeinsame Homepage finden Sie unter der Adresse www.ghostscript.com . Die derzeit aktuelle Version 8.51 von AFPL Ghostscript ist direkt über einen FTP-Server unter der Adresse ftp://mirror.cs.wisc.edu/pub/mirrors/ghost/AFPL/gs851/ erreichbar. Achtung: Wenn Sie diese lange Adresse per Hand eingeben, beachten Sie unbedingt die Groß-/kleinschreibung. Suchen Sie innerhalb dieses FTPOrdners nach der Datei 'gs851w32.exe'. Dies ist die Ghostscript-Variante für Windows. Nachdem Sie die Datei heruntergeladen und über ARBEITSPLATZ oder WINDOWS EXPLORER gestartet haben, läuft die Installation in folgenden Schritten ab: 1. Zunächst meldet sich in einem Dialogfenster der 'WinZip SelfExtractor' für AFPL Ghostscript. Dies ist eine Hilfsroutine für Installationsdateien. Bestätigen Sie dieses Fenster einfach durch Betätigen der standardmäßig angewählten Schaltfläche 'Setup'. 2. Nachdem die Dateien auf Ihrer Festplatte vorübergehend extrahiert wurden, öffnet sich das Fenster 'AFPL Ghostscript Setup'. Sie können darin einige Einstellungen treffen, sollten aber nach Möglichkeit alles auf seinen Originalwerten belassen und das Fenster mit der Seite 21 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen standardmäßig voraktivierten Schaltfläche 'Install' bestätigen. Insbesondere bestätigen Sie damit den Installationsordner • C:\gs • sowie die Installation der AFPL Ghostscript-Schriftarten. 3. Das Ende der erfolgreichen Installation erkennen Sie daran, dass das Fenster 'WinZip Self-Extractor' und das Fenster 'AFPL Ghostscript Setup' geschlossen werden und die im Startmenü für AFPL Ghostscript angelegte Programmgruppe in einem Ordnerfenster angezeigt wird. Dieses Fenster können Sie mit ALT+F4 schließen und haben Ghostscript damit bereits fertig installiert. Nun besorgen Sie sich das Programm GSView aus dem Internet. Die programmspezifische Webseite hat die Adresse www.cs.wisc.edu/~ghost/gsview/ . Die Seite der derzeit aktuellen GSViewVersion 4.7 finden Sie unter www.cs.wisc.edu/~ghost/gsview/get47.htm. GSView wird für eine Reihe von Betriebssystemen angeboten. Suchen Sie auf der angegebenen Seite nach dem Link 'gsv47w32.exe'. Dieser führt Sie unmittelbar zur GSView-Installationsdatei für Windows. Nachdem Sie die Datei heruntergeladen und über ARBEITSPLATZ oder WINDOWS EXPLORER gestartet haben, läuft die Installation in folgenden Schritten ab: 1. Zunächst meldet sich in einem Dialogfenster der 'WinZip SelfExtractor' für GSView. Dies ist eine Hilfsroutine für Installationsdateien. Bestätigen Sie dieses Fenster einfach durch Betätigen der standardmäßig angewählten Schaltfläche 'Setup'. 2. Nachdem die Dateien auf Ihrer Festplatte vorübergehend extrahiert wurden, öffnet sich das Fenster 'Select Language', in dem Sie eine Sprache für den Installationsvorgang auswählen. Drücken Sie so lange TAB, bis Sie auf der Schaltfläche 'Deutsch' stehen und bestätigen Sie diese. 3. Nun öffnet sich das Fenster ' GSView Installation', das Sie willkommen heißt. Außerdem werden Sie darauf aufmerksam gemacht, dass GSView das Programm AFPL Ghostscript zwingend voraussetzt, und zwar in einer Versionsnummer zwischen 7.04 und 9.19. Da Sie Ghostscript bereits installiert haben, können Sie das Fenster über die standardmäßig angewählte Schaltfläche 'Weiter' bestätigen. 4. Im folgenden Fenster werden Ihnen rechtliche Informationen zur Kenntnis gebracht. Bestätigen Sie es über die angewählte Schaltfläche 'Weiter'. 5. Nun erscheint ein Fenster, in dem Sie festlegen, welche Dateien Windows automatisch mit GSView aufruft und deshalb deren Namenserweiterungen mit dem Programm verknüpft. Bitte achten Sie darauf, dass nur das erste der beiden Kontrollfelder ('Verknüpfung von PostScript (.ps und .eps) Dateien mit GSView') aktiviert ist, das Zweite ('Verknüpfung von PDF (.pdf) Dateien mit GSView' jedoch deaktiviert ist. PDF-Dateien sollen schließlich standardmäßig nach wie vor mit dem A.R. geöffnet werden. c Bestätigen Sie das Fenster über die Schaltfläche 'Weiter'. Seite 22 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 6. Jetzt erscheint ein Dialog, in dem Sie den Installationsordner für GSView ändern können. Behalten Sie nach Möglichkeit die Voreinstellung c C:\programme\ghostgum c bei und bestätigen Sie das Fenster über die standardmäßig angewählte Schaltfläche 'Weiter'. 7. Falls der Installationsordner noch nicht existiert, werden Sie nun in einem Fenster darüber informiert, dass er erstellt wird. Bestätigen Sie das Fenster mit der standardmäßig angewählten Schaltfläche 'Weiter'. 8. Nun können Sie noch einmal alle Einstellungen überprüfen und die Installation über die standardmäßig angewählte Schaltfläche 'Fertig' starten. 9. Bei erfolgreichem Abschluss der Installation wird die im Startmenü für GSView neu angelegte Programmgruppe in einem Ordnerfenster präsentiert. dieses Fenster können Sie mit ALT+F4 schließen. 10. Schließen Sie auch das Fenster ' GSView Installation' über die standardmäßig angewählte Schaltfläche 'Ende'. Starten Sie jetzt bitte das Programm GSView, um noch einige Einstellungen vor zu nehmen: 1. Da für GSView kein Symbol auf dem DESKTOP angelegt wurde, starten Sie es über 'Startmenü > Programme > Ghostgum > GSView 4.7'. 2. Es erscheint ein Dialog, der Sie zum Registrieren des Programms auffordert. Achtung: Erscheint dieser Dialog in deutscher Sprache, bestätigen Sie ihn bitte über die OK-Schaltfläche, warten, bis sich GSView geöffnet hat und schließen es mit ALT+F4 sofort wieder - Sie müssen nichts einstellen! Wird der Dialog hingegen in englisch angezeigt, bestätigen Sie ihn ebenfalls über die OK-Schaltfläche, lassen aber GSView anschließend geöffnet. 3. Sobald das Programmfenster von GSView erscheint, rufen Sie das Untermenü 'Options > Language' (ALT+P, L) auf. Der Fokus steht nun auf dem derzeit aktivierten Untermenüpunkt 'English'. Achtung: Vermutlich wird Ihnen Ihr Screenreader keine Rückmeldungen über Sprachausgabe und Braillezeile geben, wenn Sie sich in diesem Untermenü mit den Pfeiltasten bewegen. Führen Sie deshalb folgenden Bedienschritt im absoluten 'Blindflug' aus! c Drücken Sie vom Untermenüpunkt 'English' aus zweimal die Taste PFEIL-RUNTER und bestätigen Sie durch Drücken der EINGABETASTE. Sie haben damit die Bedienoberfläche von GSView auf deutsch umgeschaltet. Überprüfen Sie dies, indem Sie mit der ALT-Taste die Menüleiste aktivieren; jetzt sollte dort 'Datei ...' und nicht mehr 'File ...' stehen. Haben Sie versehentlich eine andere Sprache ausgewählt, wiederholen Sie den aktuellen Schritt noch einmal. 4. Schließen Sie GSView mit ALT+F4. Das Programm merkt sich die getroffenen Einstellungen und wird sich Ihnen beim nächsten Start in deutsch präsentieren. Seite 23 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Leider ist noch eine Kleinigkeit zu erledigen: In Zukunft wird es hin und wieder nötig sein, PDF-Dateien mit GSView zu öffnen. Da Dateien mit der Namenserweiterung .pdf standardmäßig jedoch mit dem A.R. angezeigt werden, dürfen Sie die PDF-Datei also nicht mit der EINGABETASTE öffnen. Vielmehr nutzen Sie den Menüpunkt 'Öffnen mit' aus dem Kontextmenü der PDF-Datei. Leider wird dort momentan das Programm GSView noch nicht angeboten - dies müssen Sie Windows erst angewöhnen. Das können Sie mit folgenden Schritten tun: 1. Öffnen Sie den ARBEITSPLATZ oder den WINDOWS EXPLORER und suchen Sie nach einer PDF-Datei. Sie können beispielsweise in den Ordner c 'C:\Programme\Adobe\Acrobat 7.0\help\deu' c wechseln und sich mit dem Cursor auf das Handbuch zum A.R. stellen, das in der Datei 'reader.pdf' gespeichert ist. 2. Öffnen Sie das Kontextmenü der Angewählten Datei (UMSCHALT+F10 oder KONTEXTTASTE) und aktivieren Sie darin den Menüpunkt 'Öffnen mit'. 3. Windows bietet Ihnen in einer Strukturansicht einige Programme zum Öffnen einer PDF-Datei an. Leider ist, wie gesagt, GSView nicht dabei. Betätigen Sie deshalb die Schaltfläche 'Durchsuchen'. 4. Es öffnet sich ein Dialogfenster, welches an den Dialog 'Datei öffnen' von Microsoft Word erinnert. Darin geben Sie den Pfad zur ausführbaren Programmdatei von GSView an. Entweder tun Sie dies direkt über das hierfür vorgesehene Eingabefeld, in dem gerade auch der Cursor steht - oder Sie tun dies mit Hilfe der Listenansicht, die Sie vom Eingabefeld aus mit UMSCHALT+TAB erreichen. In der Listenansicht ist der Ordner 'c:\programme' bereits geöffnet. Bestätigen Sie darin den Eintrag 'Ghostgum (den Installationsordner von GSView), und sein Inhalt erscheint in der Listenansicht. Bestätigen Sie dann darin den Ordner ' GSView', worauf sein Inhalt in der Listenansicht erscheint. Bestätigen Sie dann darin den Dateinamen ' GSView32.exe', was die ausführbare Datei von GSView ist. Das Fenster schließt sich, und Sie gelangen zurück in die Liste der von Windows zum Öffnen von PDF-Dokumenten angebotenen Programme. Nun ist darin GSView als ' GSView32' aufgeführt. c Falls Sie im 'Durchsuchen'-Fenster den Pfad zur ausführbaren Datei von GSView direkt ins Eingabefeld eingeben möchten, haben Sie die Zeichenfolge c:\programme\ghostgum\GSView\GSView32.exe zu tippen. 5. Sie sind zurück in der Liste der von Windows zum Öffnen von PDFDokumenten angebotenen Programme und der Eintrag ' GSView32' ist markiert. Bestätigen Sie ihn durch drücken der OK-Schaltfläche. 6. Nun begrüßt Sie GSView mit der deutschsprachigen Aufforderung, das Programm zu registrieren. Bestätigen Sie dies mit OK, worauf die Datei 'reader.pdf' oder eine andere von Ihnen ausgewählte PDF-Datei in GSView geöffnet wird. Achtung: Der Umstand, dass Ihre Sprachausgabe und die Braillezeile nichts außer der Titelleiste von GSView vorlesen, ist vollkommen normal. Wie weiter oben bereits angedeutet, lassen sich PDF-Dokumente mit Hilfe eines Screenreaders ausschließlich im A.R. lesen. Wir benutzen GSView Seite 24 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen lediglich dazu, eine PDF-Datei in Text zu konvertieren. Das ist ohne Schwierigkeiten möglich, denn schließlich bereitet die Bedienung der GSView-Menüs und GSView-Dialogfenster mit dem Screenreader keinerlei Probleme." 2.4. Installation und Konfiguration von Omnipage Pro "Jetzt fehlt uns nur noch ein Texterkennungsprogramm, also eine so genannte OCR-Software, auch kurz als 'OCR' bezeichnet. Dabei steht die Abkürzung für optical character recognition, also 'optische Zeichenerkennung'." "Vielleicht können wir uns diesen Abschnitt sparen, ich habe nämlich auf meinem Rechner die speziell für Blinde und Sehbehinderte entwickelte OCR 'An Open Book'" "Da Sie eine recht neue PC-Ausstattung haben gehe ich davon aus, dass Sie entweder die Version 6 oder die Version 7 von Openbook besitzen." "Richtig, ich arbeite mit der Version 7." "OK, dann werden wir auch besprechen, wie Sie ein PDF-Dokument mit Hilfe von Openbook verarbeiten lassen. Für alle, die entweder noch mit den Versionen 4 und 5 von Openbook arbeiten oder das recht teure Programm nicht besitzen, beschreibe ich noch eine kostengünstigere Alternative. Blinde und Sehbehinderte, die sich an ihrem PC fit fühlen, können auch solche Texterkennungsprogramme verwenden, die im allgemeinen Handel angeboten werden. Die beiden verbreitetsten Programme sind hier 'Finereader' von der Firma ABBYY und 'Omnipage Pro' von der Firma Scansoft. Ich werde im Folgenden beispielhaft die Installation und Konfiguration von Omnipage Pro schildern. Die Vorgehensweise beim Finereader ist vergleichbar. Die OCR Omnipage Pro gibt es derzeit in der Version 14 und kostet rund 100 Euro. Sie erhalten dafür eine CD-ROM und ein Handbuch. Die Installation des Programms verläuft wie folgt: 1. Nachdem Sie die Programm-CD eingelegt haben, sollte sie automatisch starten. Falls nicht: Rufen Sie die Datei 'Setup.exe' auf der CD per Hand auf. 2. Im ersten Dialog wählen Sie eine Sprache aus. Wandern Sie mit TAB zur Schaltfläche 'Deutsch' und bestätigen Sie diese. 3. Im folgenden Fenster werden Ihnen mehrere Aktionen über Schaltflächen angeboten. Betätigen Sie die standardmäßig angewählte Schaltfläche 'Omnipage installieren'. 4. Nun begrüßt Sie der Installationsassistent. Bestätigen Sie dies mit 'Weiter'. 5. Nun müssen Sie dem Lizenzvertrag zustimmen, damit Sie das Programm überhaupt installieren können. Bewegen Sie sich dazu mit Seite 25 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen den Pfeiltasten von der ausgewählten Option 'Ich lehne die Bedingungen der Lizenzvereinbarung ab' zur Option 'Ich akzeptiere die Bedingungen der Lizenzvereinbarung' und bestätigen Sie mit 'Weiter'. 6. Auf die gleiche Weise wie eben müssen Sie eventuell nun noch den Bedingungen der GNU General Public License für eine Programmkomponente namens GSBMP zustimmen und bestätigen ebenfalls mit 'Weiter'. 7. Im folgenden Dialog geben Sie Ihre persönlichen Daten ein. Was in den Eingabefeldern für 'Benutzername' und 'Organisation' steht, ist ohne Belang. In das Eingabefeld 'Seriennummer' müssen Sie allerdings sorgfältig die Seriennummer eintragen, die Sie mit Ihrer Programm-CD erhalten haben. Bestätigen Sie dann mit 'Weiter'. 8. Wird Ihre Seriennummer akzeptiert, können Sie im nächsten Dialog den Installationsordner bestimmen. Behalten Sie nach Möglichkeit das vorgeschlagene Verzeichnis c C:\Programme\scansoft\omnipagePro14.0 c bei und bestätigen Sie mit 'Weiter'. 9. Nun können Sie die gemachten Einstellungen nochmals überprüfen. Ist alles korrekt, starten Sie die Installation über die Schaltfläche 'Installieren'. 10. Nach einer Weile erscheint eine Erfolgsmeldung, die Sie durch betätigen von 'Fertigstellen' quittieren. 11. Nun fordert Sie ein Dialog auf, das Programm über das Internet zu registrieren. sie können diese Registrierung entweder jetzt vornehmen oder über einen zweiten Auswahlschalter festlegen, dass Sie in sieben Tagen erneut erinnert werden. Bestätigen Sie unabhängig von Ihrer Auswahl das Fenster über 'OK' - und schon haben Sie Omnipage Pro installiert. Jetzt sollte das Programm allerdings noch konfiguriert werden: 1. Da noch kein Programmsymbol auf dem DESKTOP existiert, starten Sie Omnipage über 'Startmenü > Programme > Scansoft Omnipage Pro 14.0 > Omnipage Pro 14'. 2. Eventuell startet ein Assistent, der nach Software Updates für Omnipage Pro 14 sucht. Brechen Sie diesen Assistenten ab oder führen Sie die vorgeschlagenen Schritte komplett aus. 3. Beim ersten Start möchte Sie das Programm mit Tipps des Tages versorgen. Verhindern Sie dies durch Deaktivieren des Kontrollfeldes 'Tipps nach dem Programmstart anzeigen' und anschließendes Betätigen der Schaltfläche 'Schließen'. 4. Deaktivieren Sie das Lineal des Texteditorfensters, indem Sie den Menüpunkt 'Ansicht > Lineal (ALT+A, L) aufrufen. 5. Deaktivieren Sie den Dokument-Manager, indem Sie den Menüpunkt 'Ansicht > Dokument-Manager' (ALT+A, M) aufrufen. 6. Deaktivieren Sie die Anzeige von Miniaturbildern, indem sie den Menüpunkt 'Ansicht > Miniaturbilder' (ALT+A, D) aufrufen. 7. Aktivieren Sie die Texteditoransicht 'Keine Formatierung', indem Sie den Menüpunkt 'Ansicht > Texteditoransichten > Keine Formatierung' (ALT+A, T, K) aufrufen." Seite 26 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 8. Verhindern Sie, dass Omnipage bei der Texterkennung automatisch eine Rechtschreibprüfung durchführt. rufen Sie dazu den Menüpunkt 'Extras > Optionen' (ALT+X, O) auf, wechseln Sie im erscheinenden Dialogfenster auf die Registerkarte 'Prüfung' und deaktivieren Sie darin das Kontrollfeld 'Nach der Erkennung Ergebnisse automatisch prüfen'. Achtung: Falls sie mit der Version 12 des Programms arbeiten, erscheint nach Aufruf von 'Extras > Optionen' ein Untermenü, dessen Eintrag 'Prüfung' Sie dann aktivieren und anschließend das Kontrollfeld 'Nach der Erkennung Ergebnisse automatisch prüfen' ausschalten." 3. Wann wird welches Programm eingesetzt? - ein Entscheidungsschema "Nachdem Sie sich so viel Mühe mit dem Installieren und Konfigurieren von Programmen gemacht haben bin ich Ihnen einige Erläuterungen darüber schuldig, wann welche Software zum Einsatz kommen soll." "Das hängt doch bestimmt davon ab, ob eine PDF-Datei beim Lesen Probleme macht oder nicht." "Genau. Ich möchte Ihnen eine Art Entscheidungsschema dafür vorschlagen, was Sie mit einer vorliegenden PDF-Datei tun sollten. Dieses Schema besteht aus sechs Schritten und sieht wie folgt aus: 1. Werden Sie sich zu Allererst darüber klar, ob Sie die vorliegende PDFDatei lesen oder in ein anderes Dokumentformat umwandeln möchten. Falls Sie sich fürs Lesen entscheiden, öffnen Sie das Dokument zwangsläufig mit dem Adobe Reader (A.R.). Tipps, nützliche Tastenkombinationen und einige Hintergrundinformationen zum Lesen von PDF-Dokumenten mit dem A.R. erhalten Sie in 4.1 Wie Screenreader und Adobe Reader zusammenarbeiten. Sollten Sie sich für die Umwandlung entscheiden, haben Sie zwei Möglichkeiten: a) Falls Sie wissen, dass das Dokument nur wenige Seiten umfasst und/oder mehrspaltig gesetzte Textseiten enthält, sollten Sie zur Konvertierung den A.R. verwenden. Wie Sie dabei vorgehen, schildere ich in Abschnitt 5.1. b) Umfangreiche und einspaltig gesetzte Dokumente sollten Sie aus Geschwindigkeitsgründen mit PDFToText umwandeln. Wie Sie dabei vorgehen, schildere ich in Abschnitt 5.2. 2. Haben Sie sich in Schritt 1 entschieden, das Dokument mit Hilfe des A.R. lesen zu wollen, kann dieser Versuch zu drei verschiedenen Ergebnissen führen: a) Der Text lässt sich problemlos lesen. Es gibt keine Schwierigkeiten mit der Anzeige von Inhaltsverzeichnissen, die Lesereihenfolge der Textspalten ist korrekt, Tabellen sind entweder nicht vorhanden oder werden zufrieden stellend vorgelesen. Dann gibt es keine technischen Hürden mehr und Sie können sich dem eigentlichen Inhalt des PDF-Dokumentes zuwenden. Seite 27 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen b) Es wird zwar Text angezeigt, aber es gibt Probleme beim Vorlesen von Inhaltsverzeichnissen, mehrspaltig gesetztem Text oder Tabellen. Dann bleibt Ihnen nichts Anderes übrig, als das Dokument von einem Texterkennungsprogramm (einer CRSoftware) verarbeiten zu lassen und zu hoffen, dass dieses gute Verarbeitungsergebnisse liefert und die einzelnen Textblöcke auf den Seiten sinnvoller anordnet als der A.R. Wie Sie PDFDokumente von einer OCR verarbeiten lassen, erfahren Sie in Abschnitt 5.4. c) Nach dem Versuch, das PDF-Dokument zu öffnen meldet Ihr Screenreader, dass das Dokument leer zu sein scheint. Es handelt sich dann um eine grafische PDF-Datei. Dann bleibt Ihnen nichts Anderes übrig, als das Dokument von einer OCR verarbeiten zu lassen und zu hoffen, dass diese gute Erkennungsergebnisse liefert. Wie Sie PDF-Dokumente von einer OCR erkennen lassen, erfahren Sie in Abschnitt 5.4. 3. Haben Sie sich in Schritt 1 entschieden, das Dokument mit Hilfe des A.R. in ein anderes Dokumentenformat um zu wandeln, kann dieser Versuch zu vier verschiedenen Ergebnissen führen: a) Das unter Verwendung des A.R. entstandene Dokument ist sehr gut lesbar. Es gibt kein Durcheinander bei Inhaltsverzeichnissen, die Textspalten sind korrekt angeordnet und Tabellen sind zufrieden stellend konvertiert worden. Dann gibt es keine technischen Hürden mehr und Sie können sich dem Inhalt der nunmehr in einem zugänglicheren Format vorliegenden Datei zuwenden. b) Das unter Verwendung des A.R. entstandene Dokument ist schlecht bis unmöglich lesbar. Bei der Umwandlung von Inhaltsverzeichnissen, Textspalten und Tabellen ist Textmischmasch entstanden. Mit Textumwandlungsversuchen ist dann nichts mehr zu machen, da der A.R. im Vergleich zu allen anderen Umwandlungswerkzeugen die beste TextreihenfolgeErkennung aufweist. Obwohl es sich bei der ursprünglichen PDFDatei nicht um Grafik, sondern um Text handelt, sollten Sie diese jetzt von einer OCR verarbeiten lassen. Dabei dürfen Sie hoffen, dass die Texterkennung möglichst fehlerfrei ist und die einzelnen Textblöcke auf den Seiten sinnvoller angeordnet werden als durch die Umwandlung mit Hilfe des A.R. Wie Sie PDF-Dokumente von einer OCR verarbeiten lassen, erfahren Sie in Abschnitt 5.4. c) Das unter Verwendung des A.R. entstandene Dokument enthält entweder gar keinen Text oder vollkommen unleserlichen Buchstabensalat. Dies ist ein Zeichen dafür, dass es sich bei der Ursprünglichen PDF-Datei um ein rein grafisches Dokument handelt, dessen Inhalt durch eine Textkonvertierung natürlich nicht zugänglich gemacht werden kann. Dann bleibt Ihnen nichts Anderes übrig, als die entstandene Datei zu löschen, das ursprüngliche PDF-Dokument von einer OCR verarbeiten zu lassen und zu hoffen, dass dabei gute Erkennungsergebnisse geliefert werden. Wie Sie PDF-Dokumente von einer OCR verarbeiten lassen, erfahren Sie in Abschnitt 5.4. Seite 28 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen d) Die Umwandlung mit dem A.R. schlägt fehl, weil die entsprechenden Menüpunkte überhaupt nicht verfügbar sind. Dies ist ein Zeichen dafür, dass der Autor das Drucken und die Entnahme von Dokumentinhalten untersagt hat. Dann bleibt Ihnen nichts Anderes übrig als zu versuchen, das Dokument mit dem Programm GSView zu öffnen und den enthaltenen Text in eine Textdatei zu extrahieren. Der Versuch, das ursprüngliche PDFDokument von einer OCR verarbeiten zu lassen wird mit an Sicherheit grenzender Wahrscheinlichkeit scheitern, da auch Texterkennungsprogramme den Sicherheitseinstellungen in PDFDokumenten Folge leisten. Wie Sie mit Hilfe von GSView den Text einer PDF-Datei extrahieren, erfahren Sie in Abschnitt 5.3. 4. Haben Sie sich in Schritt 1 entschieden, das Dokument mit Hilfe des Programms PDFToText in Text um zu wandeln, kann dieser Versuch ähnlich wie die Konvertierung mit dem A.R. zu vier verschiedenen Ergebnissen führen: a) Die unter Verwendung von PDFToText entstandene Textdatei Ist sehr gut lesbar. Es gibt kein Durcheinander bei Inhaltsverzeichnissen, die Textspalten sind korrekt angeordnet und Tabellen sind zufrieden stellend in Text konvertiert worden. Dann gibt es keine technischen Hürden mehr und Sie können sich dem Inhalt der nunmehr im Textformat vorliegenden Datei zuwenden. b) Die unter Verwendung von PDFToText entstandene Textdatei Ist schlecht bis unmöglich lesbar. Bei der Umwandlung von Inhaltsverzeichnissen, Textspalten und Tabellen ist Textmischmasch entstanden. Dann können Sie die entstandene Datei löschen und haben zwei Möglichkeiten: i. Sie versuchen, die ursprüngliche PDF-Datei mit dem A.R. zu lesen oder um zu wandeln. Der A.R. ist beim Anordnen von Textblöcken nämlich sehr viel geschickter als PDFToText. Bringt das ebenfalls keine befriedigenden Ergebnisse, bleibt Ihnen nichts anderes übrig, als das PDF-Dokument von einer OCR verarbeiten zu lassen. Sie dürfen dann hoffen, dass die Texterkennung möglichst fehlerfrei ist und die einzelnen Textblöcke auf den Seiten sinnvoller angeordnet werden als von PDFToText und dem A.R. Wie Sie PDF-Dokumente von einer OCR verarbeiten lassen, erfahren Sie in Abschnitt 5.4. ii. Sie können eine OCR natürlich auch direkt nach dem erfolglosen Umwandlungsversuch mit PDFToText einsetzen. Lassen Sie sich nicht von der Tatsache beirren, dass die ursprüngliche PDF-Datei eigentlich gar keine Grafik ist. Eine OCR kann auch solche Dateien verarbeiten, die bereits in Textform vorliegen! c) Die unter Verwendung von PDFToText entstandene Textdatei enthält entweder gar keinen Text oder vollkommen unleserlichen Buchstabensalat. Dies ist ein Zeichen dafür, dass es sich bei der Ursprünglichen PDF-Datei um ein rein grafisches Dokument handelt, dessen Inhalt durch eine Textkonvertierung natürlich nicht zugänglich gemacht werden kann. Dann bleibt Ihnen nichts Anderes übrig, als die entstandene Datei zu löschen, das ursprüngliche PDF-Dokument von einer OCR verarbeiten zu Seite 29 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen lassen und zu hoffen, dass dabei gute Erkennungsergebnisse geliefert werden. Wie Sie PDF-Dokumente von einer OCR verarbeiten, erfahren Sie in Abschnitt 5.4. c) Der Versuch der Textkonvertierung wird von PDFToText mit der Fehlermeldung 'Error: Copying of text from this document is not allowed' beantwortet und abgebrochen. Diese Meldung besagt, dass der Autor beim vorliegenden Dokument die Entnahme von Text verboten hat. Dann bleibt Ihnen nichts Anderes übrig als zu versuchen, das Dokument mit dem Programm GSView zu öffnen und den enthaltenen Text in eine Textdatei zu extrahieren. Der Versuch, das ursprüngliche PDF-Dokument von einer OCR verarbeiten zu lassen wird mit an Sicherheit grenzender Wahrscheinlichkeit fehlschlagen, da auch Texterkennungsprogramme den Sicherheitseinstellungen in PDFDokumenten Folge leisten. Wie Sie mit Hilfe von GSView den Text einer PDF-Datei extrahieren, erfahren Sie in Abschnitt 5.3. 5. Weil Lese- und Textumwandlungsversuche Textmischmasch, unlesbaren Buchstabensalat oder sogar leere Dateien geliefert haben, lassen Sie das PDF-Dokument von einer OCR verarbeiten. Hinweise zum Umgang mit derartigen Programmen erhalten Sie in Abschnitt 5.4. 6. Weil Zugriffsbeschränkungen dafür sorgen, dass sowohl der A.R., als auch das Programm PDFToText beim Versuch der Umwandlung von PDF in andere Dokumentformate scheitern, nehmen Sie die Software GSView zu Hilfe. In aller Regel kann GSView den Text extrahieren. Hinweise zur Bedienung von GSView erhalten Sie in Abschnitt 5.3." "Sehr hilfreich, so ein Entscheidungsschema! Trotzdem hätte ich dazu noch drei Fragen - zunächst: Warum empfehlen Sie nicht bereits in den ersten Schritten den Einsatz einer Texterkennungssoftware oder das Öffnen einer PDF-Datei mit GSView?" "Das sind im Grunde zwei Fragen. Den sofortigen Einsatz eines Texterkennungsprogrammes empfehle ich nicht, weil solch eine OCRSoftware beim Verarbeiten eines Dokumentes stets einige Erkennungsfehler macht. Wenn sich der Originaltext also zufrieden stellend lesen oder als Datei abspeichern lässt, sollte man die Qualität nicht durch eine Texterkennung vermindern lassen. Den sofortigen Einsatz von GSView empfehle ich deshalb nicht, weil dieses Programm beim Konvertieren mehrspaltiger PDF-Dokumente dem A.R. deutlich unterlegen ist. Setzen Sie es nur ein, wenn weder der A.R. noch PDFToText auf den Inhalt einer PDF-Datei zugreifen können." "Gut. Meine zweite Frage lautet: Kann ich einer PDF-Datei denn nicht schon 'von außen' anmerken, ob sie mehrspaltig gesetzten text enthält, rein grafisch aufgebaut ist oder ob Zugriffsbeschränkungen meinem Screenreader das Lesen des Dokumentinhalts verweigern?" "Nun, Gewissheit über das Spaltenlayout eines PDF-Dokumentes erhalten Sie nur dann, wenn Sie die Datei zum Lesen öffnen. Als Faustregel können Seite 30 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Sie sich aber merken: Handelt es sich bei dem Dokument um Prospektmaterial oder eine Broschüre, können Sie mehrspaltiges Layout fast mit Sicherheit voraussetzen; bei Referatstexten, Bedienungsanleitungen oder Gesetzestexten können Sie Glück haben und einem einfachen Spaltensatz begegnen. Ob die PDF-Datei nur aus Bildern besteht oder nicht, erkennen Sie im Extremfall - aber nur dann - an der Dateigröße. Bei PDF-Dateien, die größer sind als 20 Megabyte, handelt es sich mit 99%iger Wahrscheinlichkeit um reine Grafik, an deren Inhalt Sie nur mittels OCR herankommen. Ob der Zugriff auf den Inhalt eines Dokumentes eingeschränkt ist oder nicht, können Sie nicht herausfinden, ohne das Dokument zu öffnen oder zu analysieren. Die aktuell gültigen Sicherheitseinstellungen einer geöffneten PDF-Datei kann Ihnen der A.R. verraten. Auch im Programmpaket XPDF ist neben dem bereits mehrfach erwähnten PDFToText ein Programm namens PDFInfo enthalten, das Ihnen ebenfalls über den Sicherheitsstatus eines PDFDokumentes Auskunft geben kann. Über das Thema 'Sicherheit in PDFDokumenten' sprechen wir in Abschnitt 6.2." "Alles Klar. Nun meine dritte Frage: Wenn ich eine Umwandlung von PDF in Text sowohl mit dem A.R. als auch mit GSView vornehmen kann und wenn wie Sie sagen - der A.R. bei mehrspaltigen Dokumenten sowieso die besten Umwandlungsergebnisse liefert - ist dann das Programm PDFToText nicht überflüssig?" "Nein. PDFToText zeigt seine Stärken bei einspaltigen PDF-Dokumenten. Zunächst einmal verläuft die Textumwandlung sehr viel schneller als bei GSView und beim A.R. Zusätzlich gehen bei der Umwandlung mit PDFToText keine Leerzeilen im Text verloren, und auch Einrückungen und Zentrierungen bleiben erhalten. Wenn Sie also Wert auf einigermaßen ansehnliche Textdateien legen, dann geben Sie bei der Textumwandlung 'pflegeleichter' PDF-Dokumente früher oder später PDFToText den Vorzug." "Schön! Jetzt hätte ich aber endlich gerne ein paar Tipps für das Lesen von PDF-Dokumenten mit dem A.R." "Gut, die sollen Sie bekommen." 4. Lesen, was drinsteht: Den Adobe Reader im Griff "Wie stets zu Anfang eines neuen Gesprächsteils möchte ich kurz zusammenfassen, was Sie darin erwartet: 1. Im einleitenden Abschnitt 4.1 müssen wir uns kurz mit der Frage beschäftigen, auf welche Weise der Adobe Reader (A.R.) einem Screenreader überhaupt den Inhalt eines PDF-Dokumentes zur Verfügung stellt. Nur so lassen sich nämlich die Arbeitstechniken verstehen, die Sie beim Lesen einer PDF-Datei im A.R. anwenden müssen. 2. In Abschnitt 4.2 versorge ich Sie mit den wichtigsten Tastenkombinationen, die Sie beim Lesen von Fließtext und Tabellen Seite 31 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen sowie beim Benutzen von Querverweisen und Lesezeichen verwenden können. 3. Da das Ausfüllen von PDF-Formularen in der Arbeitspraxis immer mehr an Bedeutung gewinnt, widmen wir diesem speziellen Thema den Abschnitt 4.3. 4. In Abschnitt 4.4 gehe ich kurz auf die in A.R.6 und A.R.7 verfügbaren integrierten Sprachausgabefunktionen ein. 5. Schließlich gebe ich Ihnen in Abschnitt 4.5 einige weiterführende Tipps zu nützlichen Programmeinstellungen, obwohl wir ja bereits in Abschnitt 2.1 über die Konfiguration des Adobe Readers gesprochen haben." 4.1. Wie Screenreader und Adobe Reader zusammenarbeiten "Sehende Personen, die beobachten möchten, was ihr Computer gerade tut, holen sich diese Informationen durch einen Blick auf den Monitor. Ein Screenreader, der im Dienste eines blinden EDV-Anwenders das Gleiche tun soll, hat es da sogar noch besser: Auch einem Screenreader stehen Mittel und Wege zur Verfügung, den Inhalt des Computerbildschirms zu analysieren - nicht umsonst heißt Screenreader ja wörtlich 'Bildschirmleser'. Häufig kann ein Screenreader jedoch noch auf zahlreiche andere Informationen zugreifen: Besonders entgegenkommende Programme flüstern dem Bildschirmleser zusätzliche hilfreiche Botschaften zu, die entweder momentan nicht auf dem Bildschirm stehen oder gar nicht für die optische Ausgabe bestimmt sind." "Könnten Sie mir ein konkretes Beispiel nennen, damit ich mir das besser vorstellen kann?" "Gerne. Führen Sie zusammen mit einer sehenden Person das folgende Experiment durch (die Sprachausgabe Ihres Screenreaders muss dazu eingeschaltet sein): 1. Öffnen Sie den Microsoft Internet Explorer und rufen Sie über die Taste F1 das Hilfesystem auf. 2. Das Hilfefenster ist senkrecht in zwei Teile gegliedert. Im linken Teil finden Sie das Inhaltsverzeichnis mit den verfügbaren Hilfebüchern und den darin enthaltenen Hilfethemen. Gehen Sie mit den Pfeiltasten im Inhaltsverzeichnis nach unten, bis Sie auf das Hilfebuch 'Anpassen Ihres Webbrowsers' stoßen und öffnen Sie es durch Betätigen der EINGABETASTE. 3. Betätigen Sie dreimal die Taste 'Pfeil-unten'. Ihre Sprachausgabe sollte jetzt die Überschrift eines Hilfethemas vorlesen. Der Überschriftentext lautet: 'Ändern von Schriftarten und Hintergrundfarben bei der Anzeige von Webseiten'. Da dieser Text sehr lang, das linke Teilfenster des Hilfefensters jedoch nicht sehr breit ist, wird der Text rechts abgeschnitten. Dies können Sie eventuell auch mit Hilfe Ihrer Braillezeile erkennen. Während der Sehende auf Ihrem Bildschirm beispielsweise nur 'Ändern von Schriftarten und Seite 32 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Hintergrund' lesen kann, sagt die Sprachausgabe den Text vollständig an." "Faszinierend - und das funktioniert, weil der Internet Explorer meinem Screenreader den gesamten Text 'zuflüstert'?" "Richtig. Der Internet Explorer und einige andere screenreader-freundliche Programme bedienen sich dazu einer Technologie namens Microsoft Active Accessibility, abgekürzt MSAA. Dabei muss MSAA gleichzeitig von den freundlichen Programmen und vom eingesetzten Screenreader unterstützt werden. Es ist wie bei einer Sprache: Versteht einer der beiden beteiligten Sprecher die Sprache nicht, kommt keine Kommunikation zustande. Glücklicherweise wird MSAA von allen gängigen Screenreadern unterstützt." "Was bedeutet das aber im Zusammenhang mit PDF?" "Ein PDF-Dokument wird vom A.R. zunächst einmal rein grafisch am Bildschirm dargestellt. Nun werden einem eingesetzten Screenreader Informationen über den Inhalt und - falls vorhanden - auch Informationen über die logische Struktur des Dokumentes mit Hilfe der MSAA-Technologie zur Verfügung gestellt. Der Screenreader wertet diese Informationen aus und sorgt dafür, dass Sie das PDF-Dokument über Sprachausgabe und Braillezeile lesen können." "Ich glaube, jetzt habe ich die Probleme mit PDF-Dateien auch auf technischer Ebene verstanden: • • • • • Ein PDF-Dokument mit einfachem (einspaltigem) Seitenaufbau lässt sich aufgrund der MSAA-Unterstützung des A.R. problemlos mit diesem Programm lesen. Bei einem Dokument mit komplizierterem Seitenaufbau reicht die MSAA-Information nicht aus, damit der Screenreader alle Textbestandteile in der richtigen Reihenfolge vorliest. Es fehlen in den meisten Dokumenten nämlich Hinweise über den logischen Aufbau (die sogenannten Tags). Wenn der Autor eines Dokumentes die PDF-Sicherheitseinstellungen ungeschickt einsetzt, kann er unbeabsichtigt verhindern, dass sich der A.R. und der Screenreader über MSAA verständigen können - und das Dokument kann nicht gelesen werden. Ein rein grafisches PDF-Dokument schließlich enthält gar keine MSAA-Informationen über seinen Inhalt. Außer dem A.R. unterstützt kein Betrachterprogramm für PDFDokumente die MSAA-Technologie, so dass ich beispielsweise mit Hilfe von GSView eine PDF-Datei nicht direkt lesen kann." "Besser kann man es gar nicht zusammenfassen! Die meisten Hersteller von Screenreadern haben das Lesen von PDFDateien im A.R. sehr komfortabel gemacht: Sie bauen aus den MSAAInformationen ein eigenes Dokument zusammen, indem man sich sogar mit Seite 33 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen einem Cursor komfortabel wie in einem Textverarbeitungsprogramm bewegen kann." "Heißt das: Im A.R. selbst gibt es gar keinen Cursor?" "Ebenso wenig wie im Internet Explorer." "Ich kann mich aber doch auf Webseiten mit den Cursortasten bewegen. Wie kommt denn das?" "Hier wenden die Entwickler von Screenreadern das gleiche Prinzip wie beim A.R. an: Der Internet Explorer ist genau so ein freundliches Programm wie der A.R. Auch er liefert Informationen über Inhalt und Aufbau der am Bildschirm gezeigten Dokumente (in seinem Falle sind das Webseiten) an Ihr Bildschirmleseprogramm. Dieses baut daraus ein vollkommen neues und zugleich 'blindengerechtes' - Dokument auf, das heißt, es ist braillezeilenund sprachausgabenfreundlich formatiert; außerdem kann man es mit den Pfeiltasten ähnlich bequem lesen wie ein Dokument in einem Textverarbeitungsprogramm. Einen 'echten' Cursor gibt es im A.R. und im Internet Explorer" nur im Zusammenhang mit der Formularbearbeitung." "Sie sprachen davon, dass der Screenreader aus den Informationen die er vom A.R. über eine PDF-Datei bzw. vom Internet Explorer über eine Webseite bekommt, ein völlig neues Dokument aufbaut, das 'blindenfreundlich' formatiert ist und über einen Cursor verfügt, den es eigentlich gar nicht gibt. Was hat denn dieses Dokument, das ich mit der Braillezeile und der Sprachausgabe lesen kann, überhaupt noch mit dem zu tun, was der Sehende auf dem Bildschirm sieht?" "Unter Umständen nicht mehr sehr viel, das kommt aber auf das Dokument und den Screenreader bzw. weitere Hilfsprogramme an. Ich gebe Ihnen mal einen kurzen Überblick: • • • Der Screenreader JAWS nennt diese bildschirmunabhängige Dokumentdarstellung 'virtuellen Puffer' und den Cursor 'virtuellen PCCursor'. Das Wort 'virtuell' bedeutet so viel wie 'künstlich'. Eine sehende Person, die mit einem JAWS-Benutzer zusammen am Computer sitzt, hat keinen Überblick über das gesamte virtuelle Dokument. Sie kann höchstens den von JAWS zur Verfügung gestellten Braille- Betrachter einschalten und bekommt dann in einem schmalen Fenster immer gerade den Inhalt der Textzeile angezeigt, in der sich der virtuelle Cursor augenblicklich befindet. Ähnlich liegen die Verhältnisse beim Screenreader Virgo. Hier heißt die vom eigentlichen Bildschirmgeschehen abgekoppelte Dokumentdarstellung 'DocumentWizard' und der dort verfügbare Cursor 'simulierter Cursor'. Den beiden Screenreadern 'Blindows' und 'HAL' wurde von ihren Entwicklern zwar kein virtueller Puffer oder DocumentWizard spendiert; beide Produkte arbeiten jedoch mit einem Programm namens 'WebFormator' zusammen. Den WebFormator kann man sich kostenlos in der aktuellen Version 2.1 von der Webseite Seite 34 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen www.webformator.de herunterladen. Auch der WebFormator baut ein von der Bildschirmdarstellung der PDF-Datei oder Webseite unabhängiges Dokument auf, zeigt dieses im Gegensatz zum virtuellen Puffer von JAWS und dem DocumentWizard von VIRGO aber in einem sichtbaren Fenster an. Dieses Fenster legt sich über das Programmfenster des A.R. bzw. des Internet Explorers, so dass Sehende genau verfolgen können, was dem blinden Benutzer auf der Braillezeile angezeigt und über die Sprachausgabe angesagt wird. Übrigens kann der WebFormator auch zusammen mit JAWS und Virgo eingesetzt werden." "Nun gibt es ja den A.R., die verschiedenen Screenreader und den WebFormator in unterschiedlichen Versionen. Deshalb möchte ich, bevor wir zu den Tastenkombinationen des A.R. kommen noch schnell fragen, ab welcher Screenreader-Version ich mit welcher Version des A.R. arbeiten kann." "Mit dem WebFormator können Sie erst ab der aktuellen Version 2.1 PDFDokumente lesen und benötigen dazu mindestens den A.R.6. Ab welcher Screenreader-Version welche Version des A.R. unterstützt wird, erläutere ich Ihnen am Besten anhand einer Tabelle: Name des Screenreaders Erforderliche ScreenreaderVersion für Acrobat Reader 5 Erforderliche ScreenreaderVersion für Adobe Reader 6 Erforderliche ScreenreaderVersion für Adobe Reader 7 Blindows (*) 2.21 (empfohlen: 3.01) 3.10 3.10 HAL / SuperNova 5.11 5.20 5.20 JAWS 3.71 (empfohlen: 4.02) 5.0 5.0 (empfohlen: 6.1) Virgo (*) 4.4 4.4 4.4 (*) Anwendern von Virgo und Blindows wird seitens der Hersteller empfohlen, PDF-Dokumente mit Hilfe des WebFormators (Version 2.1) zu lesen, der seinerseits mindestens den A.R.6 voraussetzt." "Darf ich das in diesem Abschnitt Gelernte noch einmal kurz zusammenfassen:" Zusammenfassung 1. "Die Darstellung eines PDF-Dokumentes im A.R. ist rein grafisch und kann mit Hilfe eines Screenreaders nur deshalb gelesen werden, weil der A.R. dem Bildschirmleser Informationen über den Textinhalt und falls vorhanden - Informationen über den logischen Aufbau des Dokumentes über die MSAA-Technologie zur Verfügung stellt. 2. Die meisten Screenreader bauen aus den MSAA-Informationen ein eigenständiges, von der Bildschirmdarstellung unabhängiges Seite 35 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Dokument auf und stellen in diesem Dokument sogar einen Cursor zum komfortablen Lesen zur Verfügung. 3. Der Screenreader JAWS nennt diese bildschirmunabhängige Darstellung 'virtuellen Puffer' und den bereit gestellten Cursor 'virtuellen PC-Cursor'. Bei Virgo heißt die Dokumentdarstellung 'DocumentWizard' und der Cursor 'simulierter Cursor'. Die beiden Screenreader 'HAL / Supernova' und 'Blindows' verfügen über keinen speziellen Anzeigemodus für PDF-Dokumente. Deshalb wird für die beiden letztgenannten Produkte sowie für Virgo der Einsatz des kostenlosen Programms 'WebFormator' empfohlen, das ab der Version 2.1 im Zusammenspiel mit A.R.6 und A.R.7 ebenfalls PDFDokumente anzeigen kann." 4.2. PDF-Dokumente im Adobe Reader lesen "Um ein PDF-Dokument mit Hilfe des Adobe Readers (A.R.) zu lesen, gehen Sie wie folgt vor: 1. Öffnen Sie das Dokument über den ARBEITSPLATZ oder den Windows Explorer. Dateien mit der Namenserweiterung .pdf sind mit dem A.R. verknüpft und werden deshalb automatisch in diesem Programm angezeigt. Alternativ können Sie natürlich auch zunächst den A.R. über sein Symbol auf dem DESKTOP oder über das STARTMENÜ aktivieren, den Menüpunkt 'Datei > Öffnen' aufrufen bzw. die Tastenkombination STRG+O drücken und das zu lesende PDF-Dokument mit Hilfe des dann erscheinenden Fensters 'Öffnen' laden. 2. Falls Sie mit dem A.R.6 arbeiten, wird das Dokument sofort geöffnet. Falls Sie mit dem A.R.7 arbeiten, das Dokument nicht über Tags verfügt und Sie den A.R. so eingestellt haben, wie wir es in Abschnitt 2.1 unter dem Stichwort Konfiguration des Adobe Readers besprochen haben, öffnet sich nun das Dialogfenster 'Lesen eines Dokuments ohne Tags. Dieses ähnelt dem Dialogfenster in Schritt zwei des Assistenten für Ausgabehilfen, den wir in Abschnitt 2.1 ausführlich besprochen haben: c Mit Hilfe einer Gruppe von Drei Auswahlschaltern legen Sie die Leserichtung fest. Bei der vorgewählten Option 'Leserichtung aus Dokument ableiten (empfohlen)' wird die Leserichtung anhand des Textflusses und des Schriftverlaufes nach einem komplizierten Verfahren aus dem Dokument hergeleitet. Alternativ können Sie auch eine Leserichtung festlegen. Hierzu stehen die Optionen 'Leserichtung von links nach rechts, von oben nach unten' und 'Leserichtung in Druckdatenstrom verwenden' zur Verfügung. In der Praxis hat sich die voreingestellte Option bewährt. c Während der Konfiguration des A.R.7 in Abschnitt 2.1 haben Sie im dritten Schritt des Ausgabehilfeassistenten festgelegt, dass dem Screenreader nur dann das gesamte PDFDokument übermittelt wird, wenn es 'klein' ist - und Sie haben Seite 36 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen bestimmt, dass Dokumente bis zu einer maximalen Seitenzahl von 10 als 'klein' an zu sehen sind. c Hat die PDF-Datei, die Sie gerade öffnen möchten mehr als 10 Seiten und wird somit nicht mehr als 'klein' eingestuft, ist im Gruppenfeld 'Optionen für Lesemodus' der Auswahlschalter 'Nur momentan sichtbare Seiten lesen' aktiviert. Hat das Dokument weniger als 10 Seiten, ist der Auswahlschalter 'Gesamtes Dokument lesen' vorgewählt. c Speziell für dieses Dokument können Sie nun bei Bedarf die jeweils andere Option auswählen (was aber nicht empfohlen wird). c Möchten Sie, dass das Dialogfenster 'Lesen eines Dokuments ohne Tags nicht wieder angezeigt wird, aktivieren Sie das Kontrollfeld 'Immer Einstellungen aus "LesenGrundeinstellungen" verwenden (dieses Dialogfeld nicht mehr anzeigen)'. c Bestätigen Sie das Dialogfenster 'Lesen eines Dokuments ohne Tags nun über die Schaltfläche 'Anfang', um mit dem Lesen des Dokumentes auf der ersten Seite zu beginnen. 3. Falls im vorigen Schritt das Dialogfenster 'Lesen eines Dokuments ohne Tags bearbeitet wurde, muss der A.R.7 nun die PDF-Datei erst zum Lesen vorbereiten. Über den Fortschritt der Dokumentvorbereitung werden Sie im Dialogfenster 'Inhaltsvorbereitung - Status' informiert. Neben der Meldung 'Warten Sie, während das Dokument zum Lesen vorbereitet wird' können Sie verfolgen, wie viele Seiten bereits vorbereitet wurden und nachlesen, wie viele Seiten das Dokument insgesamt hat. Nachdem das Dokument geladen wurde, können Sie es mit Hilfe Ihres Screenreaders lesen. Mit den folgenden Tasten können Sie den virtuellen PC-Cursor im virtuellen Puffer von JAWS, den simulierten Cursor im DocumentWizard von Virgo oder den Cursor im Fenster des WebFormators bewegen: • • • Um sich zeichenweise nach links bzw. rechts zu bewegen, drücken Sie PFEIL-LINKS bzw. PFEIL-RECHTS. Um sich wortweise nach links bzw. rechts zu bewegen, drücken Sie STRG+PFEIL-LINKS bzw. STRG+PFEIL-RECHTS. Um sich zeilenweise nach oben bzw. unten zu bewegen, drücken Sie PFEIL-OBEN bzw. PFEIL-UNTEN. Wenn dem Screenreader das Dokument seitenweise übermittelt wurde müssen Sie beachten, dass Ihnen das Dokument auch nur Seite für Seite angezeigt wird. Zum Umblättern müssen Sie STRG+BILD-AB (nächste Seite) oder STRG+BILD-AUF (vorige Seite) drücken. Mit den folgenden Tasten bewegen Sie sich in größeren Schritten durch das Dokument: • Zur vorigen Seite gelangen Sie mit STRG+BILD-AUF. Seite 37 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • • • • Zur nächsten Seite gelangen Sie mit STRG+BILD-AB. Zur ersten Seite gelangen Sie mit STRG+POS1 oder STRG+UMSCHALT+BILD-AUF. Zur letzten Seite gelangen Sie mit STRG+ENDE oder STRG+UMSCHALT+BILD-AB. Um zu einer bestimmten Seite zu gelangen, rufen Sie mit STRG+UMSCHALT+N das Dialogfenster 'Gehe zu Seite' auf, geben in das Eingabefeld eine Seitennummer ein und bestätigen mit der EINGABETASTE. Beachten Sie, dass Sie Tastenkombinationen wie STRG+POS1 gegebenenfalls direkt an den A.R. durchreichen müssen. Beim Arbeiten mit dem Screenreader JAWS drücken Sie vor der eigentlichen Tastenkombination JAWS-TASTE+3; im WebFormator schalten Sie zunächst den Tastenpassiermodus ein. Genau wie in der Textverarbeitung Microsoft Word können Sie auch im A.R. gleichzeitig mehrere Dokumente geöffnet haben. In dieser Arbeitssituation sind die folgenden Tastenbefehle nützlich: • • • • • Schalten Sie zum nächsten geöffneten Dokument um, indem Sie STRG+F6 drücken. Schalten Sie zum vorigen geöffneten Dokument um, indem Sie STRG+UMSCHALT+F6 drücken. Schließen Sie das aktive Dokumentfenster, indem Sie STRG+F4 oder STRG+W drücken. Schließen Sie sämtliche geöffneten Dokumentfenster, indem Sie STRG+UMSCHALT+F4 oder STRG+UMSCHALT+W drücken. Ordnen Sie die geöffneten Fenster überlappend an, indem Sie STRG+UMSCHALT+J drücken." "Kurze Zwischenfrage: Da ich ja entweder mit der virtuellen Dokumentdarstellung meines Screenreaders oder im Fenster des WebFormators arbeite, bekomme ich von der Darstellung innerhalb des A.R. selbst wenig mit. Wie muss ich mir denn den Aufbau des Fensters vom A.R. vorstellen?" "Wie fast alle Fenster von Programmen, so ist auch das Fenster des A.R. in mehrere Bereiche unterteilt: • • • Ganz oben im Fenster finden Sie die Titelzeile, in der auch der Name des gerade geöffneten PDF-Dokumentes angezeigt wird. Darunter ist die Menüleiste angeordnet. Es stehen Ihnen die sieben Menüs 'Datei', 'Bearbeiten', 'Anzeige', 'Dokument', 'Werkzeuge', 'Fenster' und 'Hilfe' zur Verfügung. Unterhalb der Menüleiste können eine oder mehrere Werkzeugleisten eingeblendet sein. Eine Werkzeugleiste im A.R. sollten Sie sich genauso vorstellen, wie eine Symbolleiste in Microsoft Word. Die einzelnen Symbole einer Werkzeugleiste werden im A.R. als 'Werkzeuge' bezeichnet. Obwohl sie für die Mausbedienung Seite 38 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • • • • • geschaffen wurden, sind die Werkzeugleisten auch mit der Tastatur erreichbar. Ein PDF-Dokument kann über so genannte 'erweiterte Verwendungsrechte' verfügen. Das kann zum Beispiel bedeuten, dass Sie berechtigt sind, das Dokument mit Anmerkungen zu versehen, das Dokument zu unterschreiben oder dem Dokument beigefügte Dateianlagen zu öffnen. Verfügt eine geöffnete PDF-Datei über erweiterte Verwendungsrechte, erscheint unterhalb eventuell eingeblendeter Werkzeugleisten eine gelbe Dokumentmeldungsleiste. Diese enthält die Werkzeuge, mit deren Hilfe Sie von den zugestandenen erweiterten Rechten Gebrauch machen können. Unterhalb der Werkzeugleisten bzw. der Dokumentmeldungsleiste ist das Fenster des A.R. senkrecht unterteilt: Ganz links befindet sich das so genannte Navigationsfenster. Je nach Arbeitssituation finden Sie darin eine oder mehrere Register, die so genannten Navigationsregisterkarten. Über diese Karten können Sie - falls verfügbar - Lesezeichen, Kommentare, einzelne Seiten und viele andere Bestandteile eines PDF-Dokumentes gezielt ansteuern. Rechts neben dem Navigationsfenster wird das PDF-Dokument im so genannten Dokumentanzeigebereich dargestellt. Rechts neben dem Dokumentanzeigebereich kann bei Bedarf das so genannte Verfahren-Fenster eingeblendet werden. In diesem Fenster können Sie nachlesen, welche Schritte Sie zum Ausführen bestimmter Aktionen durchführen müssen. Unterhalb von Navigations- und Dokumentanzeigebereich befindet sich waagrecht angeordnet die Statusleiste des A.R. Neben einigen Navigationsschaltflächen enthält Sie die Nummer der aktuell aufgeschlagenen Seite und die Gesamtseitenzahl. Ist die geöffnete PDF-Datei mit erweiterten Verwendungsrechten ausgestattet, befinden sich ganz links einige Symbole, die den Dokumentstatus anzeigen." "Beeindruckend! Kann ich mich zwischen den einzelnen Fensterbereichen auch mit der Tastatur bewegen bzw. kann ich die für mich nicht wichtigen Elemente auch abschalten?" "Selbstverständlich. Leider sind die hierfür nutzbaren Tastenkombinationen zwischen dem Versionen 6 und 7 des A.R. teilweise verschieden, deshalb führe ich sie nach den Versionen getrennt in einer Tabelle auf: Aktion Tastenbefehl in A.R.6 Tastenbefehl in A.R.7 Navigationsfenst F6 er öffnen/schließen: F4 Umschalten vom UMSCHALT+F6 Navigationsfenst er in den Dokumentbereic h: UMSCHALT+F6 Verfahren- UMSCHALT+F4 F4 Seite 39 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Fenster öffnen/schließen: Umschalten UMSCHALT+F4 zwischen VerfahrenFenster und Dokumentbereic h: zweimal F6 Hilfe-Fenster öffnen: F1 F1 Hilfe-Fenster schließen: STRG+F4 oder STRG+W STRG+F4 oder STRG+W Zu nächstem geöffneten Dialogfenster oder schwebender Symbolleiste wechseln: ALT+F6 ALT+F6 Zu vorigem geöffneten Dialogfenster oder schwebender Symbolleiste wechseln: ALT+UMSCHALT+F6 ALT+UMSCHALT+F6 Menüleiste aus/einblenden: F9 F9 Erste eingeblendete Werkzeugleiste anspringen: UMSCHALT+F8 UMSCHALT+F8 Zwischen STRG+TAB Werkzeugleisten vorwärts wechseln: STRG+TAB Zwischen STRG+UMSCHALT+ STRG+UMSCHALT+TAB Werkzeugleisten TAB rückwärts wechseln: Auf einer Werkzeugleiste zwischen Symbolen wechseln: PFEIL-RECHTS bzw. PFEIL-RECHTS bzw. PFEILPFEIL-LINKS LINKS Aktuell gewählte F8 F8 Seite 40 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Werkzeugleisten aus-/einblenden: Alle (kein Befehl) Werkzeugleisten andocken: STRG+F8 Zum (kein Tastenbefehl) Dokumentbereic h springen: F5 Zur Statusleiste springen: UMSCHALT+F5 (kein Befehl) "Sehr schön! Gibt es denn auch hilfreiche Tastenkombinationen zur Darstellung der Anzeige für Sehbehinderte?" "Ja, auch wieder eine ganze Liste: • • • • • • • • • • • Wählen Sie ein Ihrer Sehbehinderung angemessenes Farbschema aus, indem Sie mit der Tastenkombination STRG+K die A.R.Grundeinstellungen öffnen, in die Einstellungskategorie 'Ausgabehilfen' wechseln, das Kontrollfeld 'Farben ersetzen' aktivieren und die gewünschten Farbeinstellungen vornehmen, Erhöhen Sie den Zoomfaktor, mit dem das Dokument angezeigt wird, indem Sie STRG+PLUS drücken. Verringern Sie den Zoomfaktor, mit dem das Dokument angezeigt wird, indem Sie STRG+MINUS drücken. Wenn Sie die Anzeigegröße durch Eingabe eines gewünschten Vergrößerungsfaktors festlegen möchten, rufen Sie mit STRG+M das Dialogfenster 'Zoomfaktor' auf, geben einen Vergrößerungsfaktor in das Eingabefeld ein und bestätigen mit der Eingabetaste. Um die Seitenanzeige an die Fenstergröße an zu passen, rufen Sie den Menüpunkt 'Ansicht > Fenstergröße' auf oder drücken Sie STRG+0. Um die Seitenanzeige an die Fensterbreite an zu passen, rufen Sie den Menüpunkt 'Ansicht > Fensterbreite' auf oder drücken Sie STRG+2. Um die Seitenanzeige an die Seitenbreite an zu passen, rufen Sie den Menüpunkt 'Ansicht > Seitenbreite' auf oder drücken Sie STRG+3. Um das Dokument im Vollbildmodus an zu zeigen, rufen Sie den Menüpunkt 'Fenster > Vollbildmodus' auf oder drücken Sie die Tastenkombination STRG+L. Mit STRG+L bzw. ESC können Sie den Vollbildmodus wieder verlassen. Um das Dokument neu umfließen zu lassen, rufen Sie den Menüpunkt 'Ansicht > Umfließen' auf oder drücken Sie STRG+4. Um zur Originaldarstellung der Seitenanzeige zurück zu kehren, rufen Sie den Menüpunkt 'Ansicht > Originalgröße' auf oder drücken Sie STRG+1. Haben sie die Ansicht des Dokumentes verändert und möchten zur vorigen Ansicht wechseln, rufen Sie den Menüpunkt 'Ansicht > Gehe zu > Vorige Ansicht' auf oder drücken Sie ALT+PFEIL-LINKS. Seite 41 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • Haben sie die Ansicht des Dokumentes verändert und möchten zur nächsten Ansicht wechseln, rufen Sie den Menüpunkt 'Ansicht > Gehe zu > Nächste Ansicht' auf oder drücken Sie ALT+PFEIL-RECHTS." "Jetzt die entscheidende Frage: Was kann ich tun, wenn der Text nicht richtig vorgelesen wird, wenn also beispielsweise Absätze durcheinander gewürfelt werden?" "Sie sollten dann folgende Schritte in Erwägung ziehen: 1. Experimentieren Sie mit der Lesereihenfolge des A.R. In den Grundeinstellungen des Programms oder mit Hilfe des Ausgabehilfeassistenten haben Sie festgelegt, dass der A.R. die Lesereihenfolge aus dem Text ableiten soll. Führt das zu Problemen, so probieren Sie die anderen beiden Optionen für die Leserichtung aus: Rufen Sie den Menüpunkt 'Dokument > Leseoptionen für Ausgabehilfe ändern' (ALT+U, L) auf oder drücken Sie die Tastenkombination STRG+UMSCHALT+5. Es öffnet sich darauf hin ein Dialogfenster, das die gleichen Optionen enthält wie das weiter oben beschriebene Fenster 'Lesen eines Dokuments ohne Tags'. Probieren Sie, ob sich die Anzeige des Dokuments verbessert, wenn Sie 'Leserichtung von links nach rechts, von oben nach unten' oder 'Leserichtung in Druckdatenstrom verwenden' wählen. Führt dies nicht zu befriedigenden Ergebnissen, sollten Sie das Dokument mit Hilfe eines Texterkennungsprogramms verarbeiten (hinweise hierzu enthält der Abschnitt 5.4) 2. Lassen Sie das Dokument vom A.R. auf Zugänglichkeit überprüfen, indem Sie den Menüpunkt 'Dokument > Ausgabehilfe - schnelle Prüfung' aufrufen oder die Tastenkombination STRG+UMSCHALT+6 drücken. Es wird Ihnen ein Kurzreport angezeigt, auf den Sie entsprechend reagieren können." "Meine Word-Dokumente kann ich nach bestimmten Wörtern durchsuchen. Geht das auch in PDF-Dokumenten?" "Ja, und auch hier stehen Ihnen wieder mehrere Tastenbefehle zur Verfügung. Beim Arbeiten mit dem Screenreader JAWS müssen Sie die meisten davon allerdings durch reichen: • • • • Um das aktuell geöffnete PDF-Dokument zu durchsuchen, drücken Sie STRG+F, geben in das Eingabefeld 'Suchen' die zu suchende Zeichenfolge ein und betätigen die Schaltfläche 'weiter'. Der A.R. erstellt darauf hin eine Liste mit Suchergebnissen. Um zum nächsten Suchergebnis zu gelangen, drücken Sie F3 oder STRG+G. Um zum vorigen Suchergebnis zu gelangen, drücken Sie STRG+UMSCHALT+G. Sie können auch eine erweiterte Suche starten, die wir aus Platzgründen hier nicht besprechen wollen. Rufen Sie diese Suchfunktion mit STRG+UMSCHALT+F auf. Seite 42 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Links innerhalb eines PDF-Dokumentes können Sie mit der EINGABETASTE aktivieren." "Wie zugänglich sind Tabellen innerhalb von PDF-Dokumenten?" "Das hängt mehr vom Dokument als vom Screenreader ab. Falls das PDFDokument so gut strukturiert ist, dass Tabellen von Ihrem Bildschirmausleseprogramm erkannt werden, können Sie sämtliche Tabellenlesefunktionen benutzen, die Ihr Screenreader bietet. Besonders komfortable Tabellenlesefunktionen zum zellen-, zeilen- und spaltenweisen Bewegen stellt Ihnen JAWS zur Verfügung." "Wie verwende ich Lesezeichen?" "Wenn Sie Mit dem Screenreader JAWS arbeiten, können Sie sich die Lesezeichen mit der Tastenkombination STRG+K auflisten lassen. Sollte dies nicht funktionieren oder sollte ein anderes Bildschirmvorleseprogramm zum Einsatz kommen, gehen Sie wie folgt vor: Zunächst müssen Sie auf der Navigationsregisterkarte 'Lesezeichen' überprüfen, ob der Autor im Dokument überhaupt Lesezeichen bereitstellt. Wenn ja, gehen Sie damit um wie mit Querverweisen: 1. Wechseln Sie im A.R.6 mit UMSCHALT+F6 und im A.R.7 mit F6 vom Dokument- in den Navigationsbereich. 2. Sollten Sie sich noch nicht auf der Registerkarte 'Lesezeichen' befinden, wechseln Sie durch eventuell mehrmaliges Drücken von STRG+TAB dort hin. 3. Wählen Sie mit den Pfeiltasten ein Lesezeichen aus. Lesezeichen können hierarchisch aufgebaut sein, das heißt, ein Lesezeichen kann untergeordnete Lesezeichen enthalten. Somit gleicht ein A.R.Lesezeichen entweder einem Buch oder einem Thema in der üblichen Windows-Hilfe. Handelt es sich um ein hierarchisch übergeordnetes Lesezeichen blenden Sie seine Unterthemen ein, indem Sie PFEILRechts drücken. Untergeordnete Lesezeichen werden ausgeblendet, indem sie sich mit dem Cursor auf das übergeordnete Lesezeichen stellen und PFEIL-LINKS drücken. 4. Aktivieren Sie das gewählte Lesezeichen durch Drücken der EINGABETASTE. Der Fokus springt automatisch zurück in den Dokumentbereich. Tipp: Sie können 'auf einen Schlag' sämtliche untergeordneten Lesezeichen eines Dokumentes einblenden. Schalten Sie dazu den Nummernblock Ihrer Tastatur ein und drücken Sie UMSCHALT+NUM*. Sie können auch alle untergeordneten Lesezeichen wieder ausblenden, indem Sie bei eingeschaltetem Nummernblock UMSCHALT+NUM/ drücken." Seite 43 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 4.3. Formularbearbeitung mit dem Adobe Reader "Damit Sie als blinder Computernutzer von elektronischen Formularen profitieren, müssen zwei Bedingungen erfüllt sein: 1. Sie müssen in der Lage sein, das elektronische Formular am PC aus zu füllen. Ein elektronisches Formular, das Sie zuerst ausdrucken, mit sehender Hilfe bearbeiten und schließlich per Post verschicken müssen, bringt Ihnen im Vergleich zu einem herkömmlichen Papierformular keine wesentliche Arbeitserleichterung und erst recht keinen Gewinn an Selbständigkeit. Damit Sie das Formular direkt am PC ausfüllen können, muss das elektronische Dokument, welches das Formular enthält, für Sie mit Ihrem Screenreader zugänglich sein. Dies bedeutet insbesondere, dass der Bildschirmleser die einzelnen Bestandteile des Formulars (die so genannten Formularfelder) erkennt und diesen ihre Beschriftung oder Beschreibung korrekt zuordnen kann. 2. Es muss außerdem erstens die Möglichkeit bestehen, das fertig ausgefüllte Formular elektronisch an den Absender bzw. Autor zurück zu senden; zweitens muss gewährleistet sein, dass Sie das fertig ausgefüllte Formular sowohl ausdrucken als auch elektronisch speichern und so zu Ihren persönlichen Akten nehmen können. Bedingung 1 (Zugänglichkeit des Formulars und seiner einzelnen Felder) ist für einen Autor nur dadurch vollständig zu erfüllen, dass er das Formular erstens mit Strukturinformationen Tags und zweitens mit zusätzlichen MSAAInformationen versieht." "Das mit den Tags verstehe ich ja, schließlich muss der Screenreader den Aufbau des Formulars korrekt wiedergeben. Was aber sollen die zusätzlichen MSAA-Informationen?" "Ganz einfach: Es reicht nicht, dass Sie wissen, wo im Formular ein Eingabefeld oder ein Auswahlschalter ist. Sie müssen auch wissen, was sie in das Eingabefeld hineinschreiben sollen bzw. was der Auswahlschalter bedeutet." "Sie meinen damit wohl, dass mir mein Screenreader die Bedeutung eines Formularfeldes jederzeit mitteilen können muss, dass er also beispielsweise erläutert: 'In dieses Eingabefeld ist der Vorname ein zu geben' - oder so ähnlich." "Genau. Der Screenreader sollte nicht nur dem Formularfeld seine Beschriftung oder Beschreibung zuordnen können, er sollte weitere Erläuterungstexte zu jedem Formularfeld parat haben - und die sollte ihm das PDF-Dokument per MSAA liefern. Alles Wissenswerte rund um das Thema MSAA habe ich Ihnen ja in Abschnitt 4.1 bereits erzählt." "Kann ich mit PDF-Formularen, die weder Tags noch zusätzliche MSAAInformationen enthalten, überhaupt arbeiten." Seite 44 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen "Eine gewisse Chance besteht dann, wenn Sie den A.R.7 einsetzen. Alle früheren Versionen helfen Ihnen in solch einer Situation vermutlich nicht weiter." "Mal angenommen, das Formular enthält zumindest entweder Tags oder MSAA-Informationen; kann ich dann ein PDF-Formular genauso ausfüllen wie ein Formular im Internet?" "Mit einigen kleineren Abweichungen: Ja. Beim Einsatz des Screenreaders JAWS beispielsweise, bewegen Sie sich mit dem virtuellen PC-Cursor zunächst zu einem Formularfeld und aktivieren dann den Formularmodus, um Daten ein zu geben, eine Wahl in einer Liste zu treffen, ein Kontrollfeld um zu schalten, einen Auswahlschalter zu wählen oder eine Schaltfläche zu aktivieren. Wenn das Formular Tags oder MSAA-Informationen enthält, sollte Ihnen JAWS beim Einschalten des Formularmodus die Beschreibung bzw. Beschriftung des Formularfeldes vorlesen, zum Beispiel: 'Familienname, Eingabefeld'. Haben Sie die Daten eingegeben, wandern Sie mit der TABTaste zum nächsten Formularfeld usw. Beim Arbeiten mit dem WebFormator stellen Sie den Cursor zunächst ebenfalls auf das Formularfeld und drücken die EINGABETASTE. Geben Sie in das erscheinende Eingabefeld die Daten ein und bestätigen Sie erneut mit der EINGABETASTE. Danach können Sie mit der TAB-Taste zum nächsten Formularfeld springen." "Ich nehme an, dass mir bei schlecht zugänglichen Formularen mein Screenreader die Bedeutung der Formularfelder nicht oder nicht richtig ansagt, wenn ich mich mit der TAB-taste durchs Formular bewege." "Das kann passieren. Im schlimmsten Falle werden sogar einzelne Formularfelder gar nicht erkannt. Wenn Ihnen eine Formularfeldbeschriftung nicht oder nicht richtig vorgelesen wird, sollten Sie beim Arbeiten mit JAWS den Formularmodus verlassen, indem Sie den virtuellen PC-Cursor aktivieren. Versuchen Sie, die Bedeutung des Formularfeldes heraus zu finden und aktivieren Sie danach den Formularmodus erneut." "Gut, aber was nützt mir denn das Ausfüllen eines PDF-Formulars überhaupt. Ich dachte, man kann ein PDF-Dokument überhaupt nicht verändern. Dann dürfte es doch auch nicht möglich sein, ein ausgefülltes PDF-Formular zu speichern und zu versenden. Somit, denke ich, lässt sich doch die zweite von Ihnen genannte Bedingung durch ein PDF-Dokument gar nicht erfüllen." "In der Tat scheitert ein sinnvoller Einsatz von PDF-Formularen in der Praxis häufig an dieser Bedingung. Meistens werden nämlich nur 'klassische' PDFFormulare zur Verfügung gestellt." "Was zeichnet denn ein klassisches PDF-Formular aus und welche Formulararten gibt es denn noch?" Seite 45 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen "Nun, das mag auf den ersten Moment etwas verwirren - Es gibt drei Arten von PDF-Formularen: 1. Klassische PDF-Formulare sind in der Regel digitale Versionen von gedruckten Formularen, die eingescannt und eventuell nachbearbeitet wurden. Ein klassisches Formular kann jedoch nicht elektronisch verschickt werden, auch wenn sich seine Felder im A.R. eventuell bearbeiten lassen. Ein klassisches PDF-Formular müssen Sie also stets ausdrucken, in Papierform ausfüllen und dann per Fax oder Post an den Absender zurück schicken. 2. PDF-Formulare zum Senden per E-Mail enthalten eine Schaltfläche, mit der entweder nur die Formulardaten oder aber das gesamte ausgefüllte PDF-Formular als Anhang per Mail verschickt werden. 3. PDF-Formulare zum Online-Senden enthalten eine Schaltfläche, mit der die Formulardaten über das Internet direkt an einen Server geschickt werden. Egal, ob Sie ein klassisches, ein E-Mail- oder ein Online-Formular am PC ausfüllen: Das ausgefüllte Formular können Sie nur dann als elektronisches Dokument auf Ihrer festplatte speichern, wenn der Autor dem Benutzer sogenannte erweiterte Verwendungsrechte am Dokument eingeräumt hat und das ist selten der Fall." "Wie soll ich denn Ihren Satz verstehen, dass es unter Umständen möglich ist, auch ein klassisches PDF-Formular am PC aus zu füllen und welchen Sinn sollte das haben, wo ich es doch nicht elektronisch versenden kann?" "In klassischen PDF-Formularen können Ihnen zwei unterschiedliche Typen von Formularfeldern begegnen: • • Statische Formularfelder: Sie können elektronisch überhaupt nicht bearbeitet werden. Es sind lediglich Platzhalter, die dem sehenden Benutzer anzeigen, an welcher Stelle Daten eingetragen werden, wenn das Formular ausgedruckt wurde und in Papierform bearbeitet wird. Interaktive Formularfelder: Sie können immer elektronisch ausgefüllt werden - auch wenn man - wie im Fall von klassischen Formularen die Formulardaten nicht elektronisch übermitteln kann." "Mir schwirrt der Kopf vor lauter neuen Begriffen. Lassen Sie mich bitte versuchen, das Ganze in meinen Worten noch mal kurz zusammen zu fassen: 1. Es gibt drei Arten von PDF-Formularen: Klassische, die ich überhaupt nicht elektronisch übermitteln kann, E-Mail-Formulare, die ich per elektronischer Post ausgefüllt zurück schicke und Online-Formulare, die ich direkt im Internet bearbeiten und über eine Schaltfläche an einen Server sende. 2. Weiterhin gibt es zwei Arten von Formularfeldern: Statische, die ich überhaupt nicht mit dem PC bearbeiten kann und Interaktive, die sich in jedem Fall auch elektronisch ausfüllen lassen. Seite 46 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 3. Formulare, die ich auf elektronischem Wege (per Mail oder direkt über eine Webseite) zurück schicken kann, enthalten immer interaktive Formularfelder. In klassischen PDF-Formularen können sowohl statische als auch interaktive Formularfelder vorkommen. 4. Auch wenn ein PDF-Formular ausschließlich interaktive Formularfelder enthält und auf elektronischem Wege übermittelt werden kann, darf ich nur dann eine elektronische Kopie des ausgefüllten Dokumentes speichern, wenn der Autor mir erweiterte Verwendungsrechte erteilt hat, was aber in den seltensten Fällen geschieht. Als Ausgleich dazu ist es jedoch möglich, ein elektronisch ausgefülltes Formular mitsamt den Formulardaten zu drucken." "Ganz hervorragend, wie Sie die komplizierte Sachlage zusammengefasst haben." "Vielen Dank, aber jetzt habe ich drei Fragen. Erstens: Warum sind so viele PDF-Formulare klassisch und so wenige als echte Online-Formulare gestaltet?" "Oftmals sind klassische Formulare gleichermaßen für sehende Benutzer wie für ihre Autoren völlig ausreichend. Bedenken Sie, dass die meisten PDFFormulare von öffentlichen Institutionen stammen. Eine Behörde beispielsweise, die ein elektronisches Formular per E- Mail zusendet oder über eine Webseite zum Herunterladen anbietet, erspart dem Kunden den Gang zum Amt. Sehende Computernutzer sind oftmals bereits zufrieden, wenn sie ein elektronisches Formular bekommen, welches sie dann ausdrucken, in Papierform ausfüllen und per Briefpost zurück senden. Auch uns blinden Computeranwendern bleibt bei einem elektronischen Behördenformular natürlich der Amtsgang erspart. Ohne fremde Hilfe können wir das Formular jedoch nur dann ausfüllen, wenn sämtliche seiner Formularfelder interaktiv sind, sich also am PC bearbeiten lassen. Wenn es sich um ein klassisches Formular handelt, müssen wir es zwar nach dem Bearbeiten ausdrucken und per Post oder Fax verschicken, aber zumindest können wir es selbständig ausfüllen." "Ich glaube, ich habe begriffen: Ein PDF-Formular kann überhaupt nur dann barrierefrei sein, wenn es ausschließlich aus interaktiven Formularfeldern besteht. Dass ein PDF-Formular komplett interaktiv ist, ist zwar eine notwendige, jedoch keine ausreichende Bedingung dafür, dass es barrierefrei ist. Um wirklich zugänglich zu sein, muss es - wie ich von Ihnen gelernt habe - zusätzlich Tags und MSAA-Informationen enthalten." "Das ist ein hervorragender Merksatz!" "Danke. Jetzt zu meiner zweiten Frage: Woran merke ich denn, dass ein PDF-Formular nicht mit erweiterten Verwendungsrechten ausgestattet ist und somit nicht ausgefüllt gespeichert werden kann?" "Sobald Sie das erste Formularfeld eines Dokumentes ohne erweiterte Verwendungsrechte bearbeiten, erscheint das Fenster 'Formularinformationen können nicht gespeichert werden'. Darin wird Ihnen Seite 47 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen folgendes mitgeteilt: 'Hinweis: Sie können keine ausgefüllte Kopie des Formulars auf Ihrem System speichern. Wenn Sie eine Kopie für Ihre Unterlagen aufheben möchten, drucken Sie das ausgefüllte Formular aus'. Wenn Sie möchten, dass diese Meldung nicht wieder erscheint, aktivieren Sie das Kontrollfeld 'Nicht mehr anzeigen'. In jedem Fall bestätigen Sie das Fenster über 'Schließen'. Falls Sie Glück haben und das Formular zugänglich ist, können Sie es - wie gesagt - dennoch ausfüllen und ausdrucken; Sie können eben nur keine ausgefüllte Kopie speichern oder das ausgefüllte elektronische Original an den Autor zurück senden. Haben Sie in ein PDFFormular ohne erweiterte Verwendungsrechte Daten eingegeben und versuchen, es zu schließen, erscheint ein Fenster mit folgendem Hinweis: 'Sie schließen ein Formular, das Daten enthält. Formulardaten können nicht gespeichert werden'. Für das weitere Vorgehen können Sie zwischen drei Schaltflächen wählen: Mit 'Formular weiter ausfüllen' können sie die Arbeit am Formular fortsetzen - es wird nicht geschlossen. Mit 'Daten verwerfen und Formular schließen' schließen Sie das Formular, wobei Ihre Eingaben verloren gehen. Mit 'Formular drucken' können Sie eine ausgefüllte Kopie des Formulars drucken, falls Sie das nicht schon getan haben." "Gehen wir einmal davon aus, dass ich ein Formular habe, welches ich aufgrund fehlender erweiterter Verwendungsrechte zwar nicht ausgefüllt speichern darf, das aber ansonsten ohne Zugangsschwierigkeiten elektronisch ausgefüllt werden kann. So ein Formular nützt mir doch auch schon etwas - oder?" "Richtig, denn Sie können das Formular ohne fremde Hilfe am Computer bearbeiten, sowie eine ausgefüllte Kopie ausdrucken und in Ihren schriftlichen Unterlagen abheften. Einziger Haken: Um das ausgefüllte Formular als elektronisches Dokument verfügbar zu haben, müssen Sie ein ausgedrucktes Exemplar einscannen und von einer Texterkennungssoftware bearbeiten lassen." "Da wäre noch meine dritte Frage: Was habe ich denn zu beachten, wenn ich ein Online-Formular vor mir habe?" "Online-Formulare müssen Sie immer in Ihrem Internet-Browser öffnen, damit sie zum Server übertragen werden können. Dazu aktivieren Sie das Kontrollfeld 'PDF in Browser anzeigen', das Sie im Dialog 'Grundeinstellungen' in der Einstellungskategorie 'Internet' finden. Zugänglichkeitsprobleme können entstehen, wenn der eingesetzte Screenreader PDF-Dokumente, die direkt im Browser angezeigt werden, nicht vorlesen kann. Um beispielsweise mit dem Screenreader JAWS PDFDokumente im Browser lesen zu können, müssen Sie mindestens JAWS, Version 5.0 verwenden." "Gibt es sonst noch etwas im Zusammenhang mit Formularen zu beachten?" "Zwei Dinge wären noch zu nennen: 1. Der A.R. verfügt seit Version 6.0 über Sprachausgabefunktionen. Seit Version 7.0 können Sie das Programm so einrichten, dass Ihnen Seite 48 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Formularfelder automatisch von einer Sprachausgabe vorgelesen werden. Rufen Sie dazu den Dialog 'Grundeinstellungen' über den Menüpunkt 'Bearbeiten | Grundeinstellungen' oder die Tastenkombination STRG+K auf, wechseln Sie in die Einstellungskategorie 'Lesen' und aktivieren Sie das Kontrollfeld 'Formularfelder lesen'. Unter Umständen liest Ihnen der A.R. den Inhalt von Formularfeldern zuverlässiger vor als Ihr Screenreader probieren Sie es aus! Die Sprachausgabefunktionen des A.R. sind ohnehin Thema im folgenden Abschnitt 4.4. 2. Wer über einen Sehrest verfügt, sollte sich die Einstellungskategorie 'Formulare' im Dialog 'Grundeinstellungen' des A.R. aufmerksam anschauen und damit experimentieren. Es stehen eine Reihe von Funktionen zur Verfügung, mit deren Hilfe Sie Formularfelder am Bildschirm sehfreundlicher gestalten können. Achtung: Das Umfließen funktioniert in Formularfeldern und in signierten Dokumenten nicht!" 4.4. Die Sprachausgabe des Adobe Readers "Um es gleich vorweg zu nehmen: A.R.6 und a.R.7 bringen keine eigene Sprachausgabe, sondern lediglich Sprachausgabefunktionen mit. Um diese Funktionen zu nutzen, muss auf Ihrem Computer bereits eine Sprachausgabe installiert sein, die der A.R. verwenden kann." "Heißt das: Es gibt auch Sprachausgaben, die der A.R. nicht nutzen kann?" "Ja. Eine Sprachausgabe, die vom A.R. genutzt werden kann, muss SAPI4oder SAPI5-kompatibel sein. SAPI ist die Abkürzung für die englische Bezeichnung 'Speech Application Programming Interface'. Das könnte man mit 'Anwendungsprogrammierschnittstelle für Sprache' ins Deutsche übersetzen. SAPI muss sowohl von einem Anwendungsprogramm als auch von der Sprachausgabe unterstützt werden. Ist das der Fall, kann ein Anwendungsprogramm Text an eine Sprachausgabe senden, der dann laut vorgelesen wird. Außerdem kann das Programm über SAPI Einstellungen der Sprachausgabe verändern, zum Beispiel die Tonhöhe, die Geschwindigkeit, die Lautstärke oder die Betonung, mit der die Sprachausgabe spricht. SAPI gibt es in verschiedenen Versionen. Ihr Betriebssystem Windows XP arbeitet standardmäßig mit der Version SAPI 5.1, die man vereinfachend auch als SAPI5 bezeichnet. Windows 98 und Windows 2000 verfügen standardmäßig über die Version 'SAPI 4.0'. A.R.6 und A.R.7 unterstützen SAPI4 und SAPI5. Computeranwender, die zwar keinen Screenreader besitzen, dafür aber eine SAPI5-kompatible Sprachausgabe auf ihrem System installiert haben, können sich deshalb PDF-Dokumente oder einzelne Seiten daraus vorlesen lassen. Nicht alle Sprachausgaben, die Sie installieren, unterstützen jedoch SAPI, selbst wenn sie es theoretisch könnten. Die Sprachausgabe 'Eloquence', die mit dem Screenreader JAWS ausgeliefert wird, lässt sich nicht über SAPI ansteuern und deshalb auch nicht vom A.R. verwenden. Wenn Sie aber zum Beispiel die Version 12 des Texterkennungsprogramms Omnipage Pro auf Ihrem System haben, verfügen Sie über die SAPI5-kompatible Sprachausgabe 'Vera'; Befindet sich das Texterkennungsprogramm Seite 49 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Openbook in der Version 6 oder 7 auf Ihrem Computer, wurde die SAPI5kompatible Sprachausgabe 'IBM ViaVoice' ebenfalls installiert. der A.R. erkennt auf Ihrem Windows 98- oder Windows 2000-Rechner alle SAPI4und auf Ihrem Windows XP-Rechner alle SAPI5-kompatiblen Sprachausgaben. Sind mehrere Sprachausgaben vorhanden, nutzt A.R. diejenige, die auf Ihrem System als Standardsprachausgabe festgelegt wurde. Unter Windows XP ist das leider fast immer die englischsprachige Systemsprachausgabe von Microsoft, die Ihnen deutsche Texte mit englischer Betonung vorliest. Dies trägt natürlich nicht gerade zur Verständlichkeit bei. Wenn Sie über eine deutsche SAPI4/5-kompatible Sprachausgabe verfügen, stellen Sie diese als Sprachausgabe für den A.R. ein. Gehen Sie dazu wie folgt vor: 1. Öffnen Sie im A.R. über den Menüpunkt 'Bearbeiten > Grundeinstellungen' oder die Tastenkombination STRG+K den Dialog 'Grundeinstellungen'. 2. Wechseln Sie mit den Pfeiltasten in die Einstellungskategorie 'Lesen' 3. Deaktivieren Sie das Kontrollfeld 'Standardstimme verwenden'; dadurch wird eine Liste aller mit dem A.R. nutzbaren Sprachausgaben verfügbar. 4. Wählen Sie in der Liste 'Stimme' die Stimme einer deutschen Sprachausgabe aus und bestätigen Sie den Grundeinstellungsdialog mit 'OK'. Wenn Sie noch keine deutsche Sprachausgabe besitzen, können Sie gezielt eine erwerben oder erhalten sie automatisch zusammen mit anderen Anwendungen wie beispielsweise den Texterkennungsprogrammen Omnipage Pro 12 (nicht Version 14!) oder Openbook (Versionen 6 oder 7). Wird keine SAPI-kompatible Sprachausgabe auf Ihrem System gefunden, steht die Sprachausgabefunktion in A.R. natürlich nicht zur Verfügung." "Angenommen, auf meinem Computer wären alle Voraussetzungen erfüllt, die Sprachfunktionen des A.R. zu nutzen. Was kann ich dann damit anfangen?" "Dann stehen Ihnen vier interessante Funktionen zur Verfügung: • • • • Zum Lesen der aktuellen Seite rufen Sie den Menüpunkt 'Ansicht > Sprachausgabe > Nur diese Seite lesen' auf oder drücken die Tastenkombination STRG+UMSCHALT+V. Um beginnend von der aktuellen Seite bis zum Dokumentende zu lesen, rufen Sie den Menüpunkt 'Ansicht > Sprachausgabe > Bis zum Ende des Dokuments lesen' auf oder drücken die Tastenkombination STRG+UMSCHALT+B. Um das laufende Vorlesen vorübergehend zu unterbrechen (PauseFunktion), rufen Sie den Menüpunkt 'Ansicht > Sprachausgabe > Anhalten' auf oder drücken die Tastenkombination STRG+UMSCHALT+C. Um die Sprachausgabe endgültig zu stoppen, rufen Sie den Menüpunkt 'Ansicht > Sprachausgabe > Stoppen' auf oder drücken die Tastenkombination STRG+UMSCHALT+E." Seite 50 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen "Sie sprachen eben kurz von der Einstellungskategorie 'Lesen' im Grundeinstellungsdialog des A.R. Welche weiteren Optionen gibt es denn außerdem darin?" "Zunächst einmal finden Sie darin die Einstellungen wieder, die Ihnen bereits während der Installation des A.R.7 in Schritt 3 des Ausgabehilfeassistenten gezeigt worden sind; danach folgen weitere spezielle Einstellungen für die Sprachausgabefunktionen: • • • • In der Liste 'Leserichtung' legen Sie für Dokumente, die keine Tags enthalten fest, wie der A.R. die Lesefolge für die Textblöcke einer Dokumentseite zu ermitteln versucht: Bei der vorgewählten Option 'Leserichtung aus Dokument ableiten (empfohlen)' wird die Lesefolge anhand des Textflusses und des Schriftverlaufes abgeleitet. Alternativ können Sie 'Leserichtung von links nach rechts, von oben nach unten' oder 'Leserichtung in Druckdatenstrom verwenden' einstellen. In der Praxis hat sich die empfohlene Option bewährt. Wenn der A.R. beim Vorlesen des Textes jedoch Absätze durcheinander würfelt und Tabellen 'zerpflückt', müssen Sie mit den Einstellungen für die Leserichtung experimentieren. Bei Dokumenten, die Tags enthalten, kann der A.R. die durch die Tags vorgegebene Lesereihenfolge ignorieren und stattdessen die in der vorangehenden Liste festgelegte Leserichtung verwenden. Dies wird allerdings nicht empfohlen, deshalb sollten Sie das Kontrollfeld 'Leserichtung in Dokumenten mit Tags überschreiben' deaktiviert lassen. In der Liste 'Seite und Dokument' stellen Sie ein, in welchen Portionen der Inhalt des PDF-Dokumentes über MSAA an den Screenreader übermittelt wird. Die 'Portionsgrößen' können entscheidend dafür sein, ob der Screenreader das Dokument flüssig vorliest, ob man beim Umblättern länger auf eine Reaktion der Sprachausgabe warten muss oder ob der Screenreader sogar wegen 'Überfütterung' abstürzt. Die voreingestellte Option 'Bei großen Dokumenten nur momentan sichtbare Seiten lesen' ist sehr sinnvoll. Wenn Sie diese Einstellung verwenden, müssen Sie beim Lesen eines PDF-Dokumentes allerdings nach jeder Seite mit der Tastenkombination STRG+BILDAB die nächste Dokumentseite an den Screenreader übergeben. Dies ist zwar ein wenig unkomfortabel, sorgt aber für eine reibungslose Zusammenarbeit zwischen Ihrem Bildschirmleseprogramm und dem A.R. Hingegen bestünde bei Verwendung der Option 'Gesamtes Dokument lesen' die Gefahr der Überfütterung des Screenreaders und bei 'Nur momentan sichtbare Seiten lesen' würde er sich bei kleinen Dokumenten unterfordert fühlen. Wenn Sie in der soeben besprochenen Liste die Voreinstellung 'Bei großen Dokumenten nur momentan sichtbare Seiten lesen' beibehalten haben, ist danach das Eingabefeld 'Minimale Seitenanzahl in einem großen Dokument' verfügbar. Hier können Sie angeben, ab wie vielen Seiten ein PDF-Dokument als 'groß' gelten soll. Die Praxis hat gezeigt, dass der hier voreingestellte Wert von 50 zu groß ist. Geben Sie am Besten die Zahl 10 ein. Seite 51 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • • • • • • • Der A.R. kann versuchen, ein Dokument ohne Tags nachträglich zu 'taggen'. Dies sollte man aber dem Programm bei Bedarf gestatten und nicht automatisch erlauben. Lassen Sie deshalb das Kontrollfeld 'Tags nur nach vorheriger Bestätigung in Dokumenten einfügen' aktiviert. In der Liste 'Lautstärke' legen Sie die Lautstärke der verwendeten Sprachausgabe fest. Standardwert ist 7. Der A.R. ist so voreingestellt, dass er beim Vorlesen die Standardsprachausgabe des Systems benutzt. Möchten Sie dies nicht (weil das entweder eine englische Sprachausgabe ist oder Sie die Stimme schlecht verstehen), sollten Sie das Kontrollfeld 'Standardstimme verwenden' deaktivieren. Wenn Sie das Kontrollfeld 'Standardstimme verwenden' deaktivieren, ist die Liste 'Stimme' verfügbar, aus der Sie eine auf Ihrem System verfügbare SAPI5-kompatible Sprachausgabenstimme auswählen können. Beachten Sie, dass diese Liste leer ist, wenn Sie keine SAPI5-kompatible Sprachausgabe installiert haben. Jede Stimme verfügt über eine standardmäßige Tonhöhe und eine Standardgeschwindigkeit. Der A.R. ist so voreingestellt, dass er die zum Vorlesen verwendete Stimme mit diesen Standardattributen sprechen lässt. Möchten Sie selbst Tonhöhe und Sprechgeschwindigkeit der Lesestimme festlegen, deaktivieren Sie das Kontrollfeld 'Standardsprachattribute verwenden'. Haben Sie das Kontrollfeld 'Standardsprachattribute verwenden' deaktiviert, ist erstens die Liste 'Tonhöhe' und zweitens das Eingabefeld 'Wörter pro Minute' verfügbar. Legen Sie darin Tonhöhe und Sprechgeschwindigkeit der verwendeten Lesestimme fest. Über das Kontrollfeld 'Formularfelder lesen' legen Sie fest, ob Typ und Inhalt von Formularfeldern automatisch vorgelesen werden sollen oder nicht. Im vorangegangenen Abschnitt 4.3 habe ich Ihnen empfohlen, das Kontrollfeld ruhig zu aktivieren um zu testen, ob entweder Ihr Screenreader oder die vom A.R. gesteuerte Sprachausgabe mehr Informationen aus PDF-Formularen herausholt." 4.5. Weitere Einstellungstipps für den Adobe Reader "Gerade sprachen wir über nützliche Programmeinstellungen für den A.R. im Bereich 'Lesen'. Zuvor hatte ich insbesondere für Sehbehinderte empfohlen, sich die Optionen in den Einstellungskategorien 'Formulare' und 'Anzeige' an zu sehen. In diesem letzten Abschnitt des Kapitels über den A.R. möchte ich Sie noch auf einige andere Einstellmöglichkeiten im Dialog 'Grundeinstellungen' aufmerksam machen (zur Erinnerung - am Einfachsten wird der Dialog 'Grundeinstellungen' über die Tastenkombination STRG+K aufgerufen): • • Deaktivieren Sie in der Einstellungskategorie 'Programmstart' das Kontrollfeld 'Eröffnungsbildschirm anzeigen' (der Eröffnungsbildschirm ist nicht für den Screenreader lesbar). PDF-Dateien können auch Multimedia-Elemente enthalten. In der Einstellungskategorie 'Multimedia' können Sie über eine Liste das von Seite 52 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • Ihnen bevorzugte Abspielprogramm auswählen. Es sind alle vom A.R. auf Ihrem System gefundenen Multimediaanwendungen aufgeführt. Wählen Sie diejenige Anwendung aus, die mit Ihrem Screenreader am besten bedient werden kann. Stellen Sie sicher, dass in der Einstellungskategorie 'Multimedia' die drei folgenden Kontrollfelder aktiviert sind: 'Synchronisierte Audiodatei wiedergeben, wenn verfügbar', 'Zusätzliche Textbeschreibungen anzeigen, wenn verfügbar' und 'Audiobeschreibung (bzw. Videobeschreibung oder beschreibendes Video) anzeigen, wenn verfügbar'." 5. Raus holen, was drinsteckt: PDF in Text umwandeln "Es kann mehrere Gründe geben, warum Sie eine bestehende PDF-Datei in ein zugänglicheres Dokumentenformat umwandeln möchten: 1. Sie möchten die Datei in einem gewohnten Textverarbeitungsprogramm lesen und können auf einige Merkmale des Originals (Schriftart-, Schriftgrößen- und Schriftformatierungsinformationen, Links und Tabellen) verzichten. 2. Das Dokument soll in Punktschrift übertragen werden. 3. Der A.R. weigert sich aufgrund der Sicherheitseinstellungen des Dokumentes, etwas vor zu lesen. 4. Die PDF-Datei besteht aus reiner Grafik und kann deshalb vom Screenreader nicht unter Verwendung des A.R. gelesen werden. In diesem Kapitel bespreche ich mit Ihnen fünf Möglichkeiten, an den Text einer PDF-Datei zu gelangen: 1. Mit Hilfe des A.R. Abschnitt 5.1), 2. mit Hilfe des Programms PDFToText (Abschnitt 5.2), 3. mit Hilfe des Programmpaares AFPL GhostScript/GSView (Abschnitt 5.3), 4. mit Hilfe von Texterkennungsprogrammen (Unterabschnitte von Abschnitt 5.4) und 5. über einen Internet Service der Firma Adobe Systems (Abschnitt 5.5)." 5.1. Von PDF nach Text mit dem Adobe Reader "Einige wichtige Hinweise vorab: 1. Wandeln Sie mit dem A.R. nur solche PDF-Dateien in Text um, die sie mit Hilfe des A.R. selbst gut lesen können. Wenn der A.R. Absätze durcheinander würfelt und Tabellen zerpflückt, so erreichen Sie auch durch eine Umwandlung in Text oder durch das Kopieren in die Zwischenablage keine besseren Anzeigeergebnisse. 2. Ist eine PDF-Datei derart geschützt, dass keine Inhalte entnommen werden dürfen, kann ihr Text weder in die Zwischenablage kopiert Seite 53 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen noch als Datei abgespeichert werden. Hier hilft nur das Programm GSView, das wir uns in Abschnitt 5.3 anschauen werden. 3. Der A.R. ist kein Texterkennungsprogramm! Es nützt also nichts zu versuchen, eine aus Grafik bestehende PDF-Datei im Textformat ab zu speichern. Sollte das entstehende Dokument überhaupt irgendwelchen Inhalt haben, dann besteht dieser lediglich aus unlesbarem Buchstabensalat. Der Inhalt Grafischer PDF-Dateien kann nur mit Hilfe von Texterkennungsprogrammen wie 'Omnipage Pro', 'FineReader', 'Openbook' oder Spezialwerkzeugen wie dem 'PDF Transformer zugänglich gemacht werden (vgl. Abschnitt 5.4. Mit Hilfe des A.R. können Sie den Inhalt einer PDF-Datei auf zwei Arten entnehmen: 1. Durch kopieren in die Zwischenablage, 2. Durch Speichern als Textdatei. So kopieren Sie den gesamten Text eines PDF-Dokumentes in die Zwischenablage: 1. Rufen Sie den Menüpunkt 'Bearbeiten > Datei in Zwischenablage kopieren' (ALT+B, Z) auf. Achtung: Verwenden Sie genau diesen Befehl - versuchen Sie nicht, mit den klassischen Textmarkierungsfunktionen oder STRG+A das gesamte Dokument zu markieren um es anschließend mit STRG+C in die Zwischenablage zu kopieren. 2. Wechseln Sie in ein Textverarbeitungsprogramm - zum Beispiel Microsoft Word und fügen Sie mit STRG+V den Inhalt der Zwischenablage ein. Hinweis: Sollte der Menübefehl 'Bearbeiten > Datei in Zwischenablage kopieren' nicht verfügbar sein, ist das PDF-Dokument derart geschützt, dass sein Inhalt nicht entnommen werden darf. Sie können sich unter diesen Umständen den Versuch, das Dokument als Textdatei zu speichern, ebenfalls sparen, da dann automatisch auch dieser Menüpunkt nicht verfügbar ist. Ist die Entnahme des Textes über die Zwischenablage allerdings gelungen, werden sogar einige Formatierungsmerkmale wie Schriftart-, Schriftgrößen-, Schriftstil- und Formatvorlageninformationen nach Microsoft Word übernommen. So speichern Sie den gesamten Inhalt einer PDF-Datei im Textformat: 1. Rufen Sie den Menüpunkt 'Datei > Als Text speichern' (ALT+D, T) auf. 2. Legen Sie im erscheinenden Dialogfenster 'Speichern unter' einen Dateinamen und einen Speicherort für die Datei fest und bestätigen Sie mit der Schaltfläche 'Speichern'. In A.R.7 kann das Speichern sehr lange dauern - dafür ist das Programm sehr gründlich. Den Speicherfortschritt können Sie jederzeit über die Statusleiste verfolgen. Seite 54 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Ist der genannte Menüpunkt nicht verfügbar, so ist die Entnahme von Inhalten aus der PDF-Datei vom Autor untersagt worden. Durch das Speichern im Textformat gehen nahezu sämtliche Textstrukturmerkmale des Ursprungsdokumentes verloren. Sollen Zentrierungen, Einrückungen und hängende Absätze im Textformat noch erkennbar sein, eignet sich der A.R. zur Umwandlung nicht besonders. Setzen Sie dann das im folgenden Abschnitt 5.2 besprochene Programm PDFToText ein." "Sie haben mir eben von den 'klassischen' Textmarkierungstechniken im A.R. abgeraten - warum?" "Erinnern Sie sich daran, dass sie mit den meisten Screenreadern in einer vom eigentlichen A.R.-Fenster losgelösten Dokumentdarstellung arbeiten Stichwort 'virtueller PC-Cursor' bei JAWS oder 'DocumentWizard' bei Virgo. Natürlich können Sie in dieser Darstellung Text mit Hilfe der Umschalttaste und den Pfeiltasten markieren, Sie können auch STRG+A drücken. Denken Sie aber daran, dass große PDF-Dokumente dem Screenreader seitenweise übermittelt werden. Wenn Sie STRG+A drücken, markieren Sie unter Umständen nur den Text der aktuellen Seite, nicht aber das vollständige Dokument. Außerdem werden nicht die Originalformatierungen der PDFDatei verwendet; der Text wird so in die Zwischenablage übernommen, wie er Ihnen mit JAWS, Virgo, dem WebFormator oder einem anderen Screenreader angezeigt wird." 5.2. Von PDF nach Text mit PDFToText "Wie im vorigen Abschnitt erwähnt: In den mit Hilfe von A.R. aus PDFDokumenten erzeugten Textdateien finden sich kaum noch Textstrukturmerkmale. Besonders unangenehm ist dies, wenn dadurch Zentrierungen, Einrückungen und hängende Absätze, wie sie zum Beispiel bei Nummerierungen und Aufzählungen vorkommen, verloren gehen. Möchten Sie die genannten Textstrukturmerkmale in Ihrer Textdatei wiederfinden, so sollten Sie PDF-Dateien nicht mit dem A.R., sondern mit PDFToText ins Textformat konvertieren. PDFToText konvertiert außerdem wesentlich schneller als der A.R. Bevor ich Ihnen die nötigen Arbeitsschritte beschreibe, sind noch einige warnende Hinweise nötig: 1. PDFToText ist nicht sehr gut darin, die Lesereihenfolge in mehrspaltigen Texten zu erkennen. Bei komplex gestalteten Dokumenten bleibt Ihnen nur der A.R. als Konvertierungswerkzeug. 2. PDFToText verfügt über keine Windows-Benutzeroberfläche. Dies bedeutet, dass Sie das Programm aus der Eingabeaufforderung (auch 'DOS-Box' genannt) heraus über die Kommandozeile steuern. Für jemanden, der die Zeiten des textorientierten Betriebssystems MSDOS nicht erlebt hat, wird dies als sehr störend empfunden. 3. Genau wie der A.R., so kann auch PDFToText keine Inhalte aus PDFDokumenten entnehmen, bei denen dies vom Autor untersagt wurde. Seite 55 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Ist also im A.R. der Menüpunkt 'Datei > Als Text speichern' nicht verfügbar, brauchen Sie PDFToText gar nicht erst zu bemühen. 4. Die derzeit aktuelle Version 3.01 von PDFToText unterstützt die neueste Version 1.6 von PDF noch nicht direkt. Übergeben Sie PDFToText ein Dokument im Format PDF 1.6, gibt das Programm eine Warnung aus, dass das Ausgabeergebnis unter Umständen nicht zufriedenstellend sein könnte. Bisher waren die Umwandlungsergebnisse von PDF 1.6-Dokumenten in meiner Arbeitspraxis jedoch nie zu beanstanden. Vom A.R.7 wird PDF 1.6 übrigens voll unterstützt. Mehr zu den verschiedenen Versionen von PDF möchte ich Ihnen in Abschnitt 6.1 erzählen. Zur Erinnerung: In Abschnitt 2.2 haben wir das Programmpaket XPDF und damit das Programm PDFToText im Ordner C:\xPdf installiert. So konvertieren Sie mit Hilfe von PDFToText eine PDF-Datei ins Textformat: 1. Benutzen Sie den ARBEITSPLATZ oder den WINDOWS EXPLORER, um die zu konvertierende Datei in denjenigen Ordner zu kopieren, in dem auch PDFToText installiert wurde. In unserem Beispiel ist das der Ordner c C:\xpdf . c Durch diesen auf den ersten Blick unnötigen Schritt sparen Sie sich im Folgenden eine Menge Tipparbeit. 2. Da PDFToText über die Kommandozeile gesteuert wird, sollten Sie zunächst ein Fenster für die sogenannte 'Eingabeaufforderung' öffnen. rufen Sie dazu den Menüpunkt 'Startmenü > Programme > Zubehör > Eingabeaufforderung' auf. Mit dem Eingabeaufforderungs-Fenster öffnet sich für Sie eine neue, textorientierte Welt: Statt mit grafischen Benutzeroberflächen arbeiten Sie in der Eingabeaufforderung mit Textkommandos. Auch die Rückmeldungen die Sie von den in der Eingabeaufforderung ausgeführten Befehlen und Programmen erhalten, werden in der Regel in Textform ausgegeben. Dabei gilt die Regel: Keine Nachricht ist eine gute Nachricht - Rückmeldungen gibt es meistens nur, wenn Fehler aufgetreten sind. 3. Das Fenster der Eingabeaufforderung wartet nun auf Ihre Befehle. Um Ihnen dies zu signalisieren, zeigt die Eingabeaufforderung ein sogenanntes Prompt an, hinter dem der Cursor blinkt. Das Prompt besteht aus einer Pfadangabe der Art c 'c:\windows' oder c 'c:\dokumente und einstellungen\benutzer'. c Danach folgt ein Größer-als-Zeichen, hinter dem der Cursor steht. Die Pfadangabe zeigt Ihnen das sogenannte 'aktuelle Verzeichnis' an. Stellen Sie sich das am besten wie einen Ordner vor, dessen Inhalt Sie sich mit Hilfe des ARBEITSPLATZ oder des WINDOWS EXPLORERS anzeigen lassen. 4. Wechseln Sie nun in den Ordner, in dem das Programmpaket XPDFWIN installiert ist. Für unser Beispiel gehe ich vom Ordner c C:\xpdf Seite 56 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen aus. Geben Sie dazu zunächst in der Eingabeaufforderung die Zeichenfolge c cd\ c ein und lassen den Befehl durch Drücken der Eingabetaste ausführen. Das 'cd' steht für 'Change Directory', also für die Aufforderung, das aktuelle Verzeichnis zu wechseln. Der direkt an die Buchstaben 'cd' angehängte Backslash besagt, dass wir in den Stammordner des aktuellen Laufwerkes wechseln wollen. Der Stammordner hat die Bezeichnung C:\, und genau dieser Text sollte jetzt links von einem Größer-als-Zeichen und dem Cursor angezeigt werden. Nun müssen Sie vom Stammordner aus in den Ordner c:\xpdf wechseln. Tun Sie dies durch Eingabe von c cd xpdf c und anschließendes Drücken der EINGABETASTE. 'cd' ist wieder der Befehl zum Ordnerwechsel, 'xpdf' ist der Name des Ordners, in den wir zu wechseln wünschen. Links von Ihrem Cursor sollte nun der Text c c:\xpdf> c zu lesen sein. 5. Nun starten Sie die Konvertierung mit PDFToText und übergeben dem Programm dabei die benötigten Informationen. Diese bestehen einerseits aus einem Befehl der Anzeigt, dass Sie die Übernahme möglichst vieler Layout-Merkmale in die Textdatei wünschen und andererseits im Namen der umzuwandelnden PDF-Datei. Tippen Sie also zunächst das Wort c PDFToText c und dann ein Leerzeichen. Tippen Sie dann die Zeichenfolge c -layout c und ein Leerzeichen. Der Bindestrich vor dem Wort 'layout' zeigt an, dass es sich bei diesem Befehl um eine sogenannte Kommandozeilenoption handelt. PDFToText verfügt über eine Reihe von Kommandozeilenoptionen, wobei '-layout' die Wichtigste ist. Sie teilt dem Programm wie gesagt mit, dass wir die Übernahme möglichst vieler Layout-Merkmale der PDFOriginaldatei in die Textdatei wünschen. c Geben Sie jetzt noch den Namen der zu konvertierenden PDFDatei mitsamt Dateiendung ein und führen den Befehl durch Drücken der EINGABETASTE aus. Hier noch einmal zur Kontrolle die gesamte Eingabezeile: c PDFToText -layout handbuch.pdf 6. Nachdem Sie den Befehl abgeschickt haben, verschwindet das Prompt für einige Augenblicke. Selbst bei PDF-Dateien, die aus mehreren hundert Seiten bestehen, sollte dies jedoch nicht länger als zehn Sekunden dauern! Wenn Ihr Screenreader nicht - wie beispielsweise JAWS ab Version 6.1 dies tut - die Meldungen der Eingabeaufforderung automatisch vorliest, sollten Sie beim Wiederauftauchen des Prompts mit Hilfe Ihres Screenreaders eine Textzeile nach oben wandern um nach zu lesen, ob PDFToText Meldungen ausgegeben hat. Unter Umständen sind mehrere c Seite 57 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Meldungen erschienen - wandern Sie dann mit Hilfe des Cursors Ihres Screenreaders entsprechend viele Zeilen aufwärts. 7. Wurde gar keine Meldung ausgegeben, konnte PDFToText die Umwandlung erfolgreich durchführen. Sie finden die entstandene Textdatei im selben Ordner wie das PDF-Original. Sie sollten die Textdatei auf ihre Brauchbarkeit hin überprüfen. Wurden Absätze durcheinandergewürfelt oder Tabellen Zerpflückt, müssen Sie auf den A.R. als Umwandlungsprogramm zurück greifen. Ist die Konvertierung zu Ihrer vollen Zufriedenheit ausgefallen, können Sie bei Bedarf die ursprüngliche PDF-Datei löschen. 8. Die wichtigsten ernst zu nehmenden Fehlermeldungen von PDFToText sind: c * Error: Couldn't open file ...: c Zeigt an, dass Sie sich bei der Eingabe des Dateinamens oder der Kommandozeilenoptionen vertippt haben. PDFToText konnte jedenfalls keine Datei des angegebenen Namens finden und konvertieren. c Error: Copying of text from this document is not allowed: Dies zeigt Ihnen, dass das Entnehmen von Inhalten aus der PDF-Datei nicht gestattet ist. Sie müssen dann auf GSView als Umwandlungsprogramm zurück greifen. c Error: Couldn't read xref table: Diese Meldung weist auf eine vermutlich irreparabel beschädigte Datei hin. Sie brauchen keine Hoffnungen zu haben, dass sich das Dokument mit einem anderen Programm öffnen lässt, weil PDFToText selbst bereits eine gegen lesefehler sehr unempfindliche Software ist. c Daneben gibt es zahlreiche weniger dramatische Fehlermeldungen, die in der Regel keinen Einfluss auf die Qualität der Textausgabe haben. Ich möchte den Vorgang der Textumwandlung mit PDFToText noch einmal in aller Kürze zusammenfassen:" Zusammenfassung 1. "Kopieren Sie die zu konvertierende PDF-Datei in den Ordner, in dem sich auch das Programm PDFToText befindet. 2. Öffnen Sie über 'Startmenü > Programme > Zubehör > Eingabeaufforderung' ein Fenster für die Eingabeaufforderung. 3. Wechseln Sie mit dem Kommando cd\ in den Stammordner von Laufwerk C. 4. Wechseln Sie mit dem Kommando c cd xpdf c in den Ordner, in dem sich das Programm PDFToText befindet. 5. Geben Sie den Befehl für die Textumwandlung durch Eingabe von c PDFToText -layout [PDF-Datei] c ein, wobei Sie '[PDF-Datei]' durch den Namen des zu konvertierenden Dokumentes ersetzen. Seite 58 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Reagieren Sie angemessen auf eventuelle Fehlermeldungen oder überprüfen Sie im Falle einer erfolgreichen Konvertierung die Qualität der entstandenen Textdatei." 5.3. Von PDF nach Text mit GSView "Die Programme Ghostscript und GSView kommen immer dann zum Einsatz, wenn eine PDF-Datei dem Screenreader den Zugriff auf ihren Inhalt verweigert. Dabei stellt GSView die Bedienoberfläche für das Programm Ghostscript dar, mit dem Sie gar nicht in Berührung kommen (die Bedienung von Ghostscript selbst wäre übrigens noch weit unbequemer als diejenige von PDFToText). In Abschnitt 2.3 habe ich erläutert, wie Ghostscript und GSView installiert werden, wie GSView auf deutsch umgestellt wird und wie man GSView in das Kontextmenü von PDF-Dateien einbaut. Ich gehe im folgenden davon aus, dass Sie diese Schritte nachvollzogen haben - dann ist das Umwandeln einer PDF-Datei in Text mittels GSView nur noch ein Kinderspiel: 1. Wählen Sie im ARBEITSPLATZ oder im Windows Explorer die um zu wandelnde PDF-Datei mit den Pfeiltasten an. 2. Öffnen Sie das Kontextmenü mit der KONTEXTTASTE oder der Tastenkombination UMSCHALT+F10. 3. Rufen Sie darin den Menüpunkt 'Öffnen mit' auf. 4. Wählen Sie im eingeblendeten Untermenü den Eintrag 'gsview32' und bestätigen Sie mit der EINGABETASTE. 5. GSView öffnet sich und zeigt zunächst den Registrierungsdialog an. Bestätigen Sie diesen mit der EINGABETASTE. Warten Sie einige Sekunden, bis GSView das PDF-Dokument geladen hat. 6. Rufen Sie den Menüpunkt 'Bearbeiten > Text extrahieren' (ALT+B, T) auf. Sollte sich daraufhin das Dialogfenster 'Auswahl Seiten' nicht öffnen, warten Sie noch ein paar Sekunden, bevor Sie erneut 'Bearbeiten > Text extrahieren' aufrufen. 7. Im eingeblendeten Dialog 'Seiten auswählen' betätigen Sie zunächst mit der Tastenkombination ALT+S die Schaltfläche 'Alle Seiten' und drücken anschließend die EINGABETASTE, um das Fenster mit 'OK' zu bestätigen. 8. Bei großen Dokumenten kann die Textextraktion mehrere Minuten in Anspruch nehmen. Sie können den Fortschritt überwachen, indem Sie sich von Ihrem Screenreader in gewissen Zeitabständen die Statusleiste des GSView-Fensters vorlesen lassen; dort erhöht sich nach und nach die angezeigte Prozentzahl. 9. Konnte die Textextraktion erfolgreich durchgeführt werden, erscheint das Fenster 'Datei speichern unter'. Legen Sie darin für die zu speichernde Textdatei einen Namen (einschließlich der Endung .txt) und einen Speicherort fest; bestätigen Sie das Fenster durch Betätigen der Schaltfläche 'Speichern'. Bricht GSView die Textextraktion mit einer Fehlermeldung ab, ist die PDF-Datei höchst wahrscheinlich beschädigt. Sie brauchen dann keine großen Hoffnungen mehr zu haben, sie mit einem anderen Programm öffnen Seite 59 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen und Ihren Inhalt lesen zu können. Wenden Sie sich gegebenenfalls an den Autor, um ein unbeschädigtes Exemplar der Datei zu erhalten. 10. Schließen Sie GSView mit ALT+F4. Achtung: Überprüfen Sie die entstandene Textdatei unbedingt auf ihre Lesbarkeit. Unter Umständen werden für Anführungszeichen und Trennstriche nicht die korrekten Zeichen dargestellt. Tauschen Sie dann mit Hilfe der Funktion 'Suchen und Ersetzen' eines Textverarbeitungsprogramms die falschen Zeichen durch die Richtigen aus." 5.4. Von PDF nach Text per Texterkennungsprogramm "Einige PDF-Dokumente bestehen aus reiner Grafik. Deren Inhalt kann weder mit dem A.R. gelesen, noch mit Hilfe von PDFToText oder GSView als Text zugänglich gemacht werden. Rein grafische PDF-Dokumente erkennen Sie unter Anderem an folgenden Merkmalen: • • • Die Datei ist mehr als 20 Megabyte groß. Beim Öffnen der Datei mit dem A.R. weist Ihr Screenreader Sie darauf hin, dass das Dokument leer zu sein scheint. Bei der Textumwandlung mit Hilfe des A.R., des Programms PDFToText oder des Programms GSView ist eine Textdatei entstanden, die entweder leer ist oder lediglich unlesbaren Buchstabensalat enthält. Ich möchte Ihnen in diesem Abschnitt den Einsatz folgender Texterkennungsprogramme demonstrieren: • • • Omnipage Pro, Version 14, Omnipage Pro, Version 12, Openbook, Version 6 oder 7. Im Folgenden gehe ich davon aus, dass die benötigten Programme auf Ihrem Computer installiert sind. Über die Installation und Konfiguration von Omnipage Pro haben wir in Abschnitt 2.4 ausführlich gesprochen." Texterkennung mit Omnipage Pro, Version 14 "Starten Sie das Programm Omnipage, Version 14. Sie finden es entweder im Startmenü unter 'Programme > Scansoft Omnipage ...' oder als Symbol auf Ihrem DESKTOP. Hinweis: Verfügen Sie über die ältere Programmversion 12, lesen Sie bitte den Abschnitt 5.4.2. Hier nun die Erläuterungen zur Programmversion 14: 1. Wenn Sie zum ersten Mal ein PDF-Dokument von Omnipage 14 erkennen lassen, müssen Sie das Programm auf die Verarbeitung einer PDF-Datei vorbereiten. Dazu werden die Programmeinstellungen für die drei Arbeitsschritte 'Laden der zu erkennenden Datei', 'Erkennung des Textes' und 'Speichern der Texterkennungsergebnisse' entsprechend angepasst: Seite 60 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 2. 3. 4. 5. a) Rufen Sie das Untermenü 'Verarbeiten > Seite abrufen' (ALT+A, S) auf und aktivieren Sie darin falls erforderlich den Menüpunkt 'Bilddatei laden'. Dies bewirkt, dass Omnipage nicht - wie üblich erwartet, dass Sie ein Dokument über einen Scanner einlesen. Es soll vielmehr mit einer vorhandenen Datei eine Texterkennung durchführen. b) Rufen Sie das Untermenü 'Verarbeiten > OCR ausführen' (ALT+V, O) auf und aktivieren Sie darin falls erforderlich den Menüpunkt 'Automatisch'. Dies bewirkt, dass Omnipage die Anordnung der Textblöcke auf einer Textseite automatisch zu erkennen versucht und sich an keinerlei diesbezügliche - meist unnütze Voreinstellungen hält. c) Rufen Sie das Untermenü 'Verarbeiten > Ergebnisse exportieren' (ALT+V, X) auf und aktivieren Sie darin falls erforderlich den Menüpunkt 'In Datei speichern'. Dies bewirkt, dass Omnipage Ihnen nach abgeschlossener Texterkennung die Möglichkeit anbietet, die Texterkennungsergebnisse in einer Datei zu speichern. Haben Sie Omnipage einmal auf die Verarbeitung einer PDF-Datei vorbereitet, merkt sich das Programm die getroffenen Einstellungen. Wenn Sie zwischendurch die Programmeinstellungen nicht verändern, so bleibt Ihnen zukünftig dieser Arbeitsschritt erspart, und Sie müssen lediglich die folgenden Arbeitsschritte ausführen: Rufen Sie das Untermenü 'Verarbeiten > Arbeitsprozesse' (ALT+V, A) auf und aktivieren Sie darin falls erforderlich den Menüpunkt '1 - 2 - 3'. Rufen Sie im Untermenü 'Verarbeiten > Arbeitsprozesse' den Menüpunkt 'Starten' auf. Weil Sie entweder die Programmeinstellungen von Omnipage in Schritt eins dieser Anleitung entsprechend angepasst haben oder weil sich das Programm an diese Einstellungen aus früheren Arbeitssitzungen 'erinnert', erscheint nun das Dialogfenster 'Bilddatei laden'. Wählen Sie im Dialogfenster 'Bilddatei laden' die PDF-Datei aus, mit der die Texterkennung durchgeführt werden soll und bestätigen Sie den Dialog über die Schaltfläche 'OK'. Omnipage beginnt darauf hin mit dem Öffnen und Erkennen der Datei. Sobald die erste Seite des Dokuments erkannt ist, wird sie im Texteditorfenster von Omnipage angezeigt. Den Fortschritt der Texterkennung, die automatisch für alle Dokumentseiten durchgeführt wird, können Sie über die Statusleiste verfolgen. Ist die Texterkennung beendet, wird automatisch der Dialog 'In Datei speichern' eingeblendet. Legen Sie darin Namen und Speicherort für die zu speichernde Textdatei fest, bestätigen Sie aber den Dialog noch nicht. Überprüfen Sie erst, ob die übrigen Optionen Ihren Vorstellungen entsprechen: c Wählen Sie in der Ausklappliste 'Dateityp' ein passendes Dokumentformat aus, zum Beispiel das Format für Microsoft Word 2000 und XP oder 'Text'. c Stellen Sie sicher, dass in der Liste 'Formatierungsgrad' der Eintrag 'Fließseite' ausgewählt ist. Damit stellen Sie sicher, dass Ihr Textdokument nicht übermäßig viele Seite 61 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen c c c Formatierungsinformationen und vor allem keine Grafiken mehr enthält. Stellen Sie sicher, dass in der Liste 'Dateioptionen' der Eintrag 'Eine Datei für alle Seiten anlegen' ausgewählt ist. Stellen Sie sicher, dass in der Liste 'Seitenbereich' der Eintrag 'Alle Seiten' ausgewählt ist. Dies ist absolut wichtig, da ansonsten eventuell nur die gerade im Texteditor von Omnipage sichtbare Seite abgespeichert wird. Bestätigen Sie erst jetzt das Dialogfenster 'in Datei speichern' über die Schaltfläche 'OK'. Wenn Sie das nächste Mal die Erkennungsergebnisse einer PDF-Datei speichern, wird sich Omnipage an die im Fenster 'In Datei speichern' getroffenen Einstellungen erinnern, so dass Sie diese dann nicht nochmals überprüfen müssen." Texterkennung mit Omnipage Pro, Version 12 "Starten Sie das Programm Omnipage, Version 12. Sie finden es entweder im Startmenü unter 'Programme > Scansoft Omnipage ...' oder als Symbol auf Ihrem DESKTOP. Hinweis: Verfügen Sie über die neuere Programmversion 14, lesen Sie bitte den Abschnitt 5.4.1. Hier nun die Erläuterungen zur Programmversion 12: Sollten Sie zum ersten mal ein PDF-Dokument mit Omnipage 12 erkennen lassen, gehen Sie bitte nach den im folgenden genannten Schritten vor: 1. Rufen Sie den Menüpunkt 'Verarbeiten > Seite abrufen > Bilddatei laden' auf. Dies ist erforderlich, da Sie im vorliegenden Fall kein Dokument über einen Scanner, sondern eine als Bild vorliegende PDF-Datei verarbeiten möchten. Es erscheint das Dialogfenster 'Bilddatei laden' 2. Wählen Sie im Dialogfenster 'Bilddatei laden' die PDF-Datei aus, mit der die Texterkennung durchgeführt werden soll und bestätigen Sie den Dialog mit 'OK'. Omnipage beginnt darauf hin mit dem Öffnen der PDF-Datei. Dies kann längere Zeit in Anspruch nehmen. Über den Fortschritt des Vorgangs können Sie sich jederzeit mit Hilfe der Meldungen in der Statuszeile informieren. Leider gibt Omnipage keine Meldung aus, wenn der Vorgang beendet ist, so dass Sie darauf achten müssen, wann das Laden der PDF-Datei abgeschlossen ist. 3. Nachdem das Laden der PDF-Datei abgeschlossen ist, rufen Sie den Menüpunkt 'Verarbeiten > OCR ausführen > Automatisch' auf. Dies bewirkt, dass Omnipage die Anordnung der Textblöcke auf einer Textseite automatisch zu erkennen versucht und sich an keinerlei diesbezügliche - meist unnütze - Voreinstellungen hält. Omnipage wird darauf hin die erste Dokumentseite erkennen. 4. Rufen Sie den Menüpunkt 'Verarbeiten > Automatische Verarbeitung starten' auf und aktivieren Sie im erscheinenden Dialogfenster 'Automatische Verarbeitung' die Schaltfläche 'Alle Seiten erneut verarbeiten'. Hierdurch erreichen Sie, dass nicht nur mit der Ersten, sondern mit sämtlichen Seiten der PDF-Datei eine Texterkennung durchgeführt wird. Den Fortschritt dieses Vorgangs können Sie jederzeit über die Meldungen verfolgen, die eine Zeile oberhalb der Seite 62 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Statusleiste eingeblendet werden. Nachdem die Texterkennung beendet ist, erscheint das Dialogfenster 'Speichern unter'. 5. Obwohl Sie jetzt bereits die Texterkennungsergebnisse speichern könnten, brechen Sie das Fenster 'Speichern unter' mit ESCAPE ab. 6. Rufen Sie den Menüpunkt 'Verarbeiten > Ergebnisse exportieren > In Datei speichern' auf. Dadurch öffnet sich der Dialog 'Speichern unter' erneut. Legen Sie darin Namen und Speicherort für die zu speichernde Textdatei fest, bestätigen Sie aber den Dialog noch nicht. Überprüfen Sie erst, ob die übrigen Optionen Ihren Vorstellungen entsprechen: z Wählen Sie in der Ausklappliste 'Dateityp' ein passendes Dokumentformat aus, zum Beispiel das Format für Microsoft Word 2000 und XP oder 'Text'. z Stellen Sie sicher, dass in der Liste 'Formatierungsgrad' der Eintrag 'Fließseite' ausgewählt ist. dies bewirkt, dass Ihr Textdokument nicht übermäßig viele Formatierungsinformationen und vor allem keine Grafiken mehr enthält. z Betätigen Sie die Schaltfläche 'Erweitert', wodurch zusätzliche Optionen im Dialogfenster eingeblendet werden. z Stellen Sie sicher, dass in der Liste 'Seitenbereich' der Eintrag 'Alle Seiten' ausgewählt ist. Dies ist absolut wichtig, da ansonsten eventuell nur die gerade im Texteditor von Omnipage sichtbare Seite abgespeichert wird. z Stellen Sie sicher, dass in der Liste 'Dateioptionen' der Eintrag 'Eine Datei für alle Seiten anlegen' ausgewählt ist. Haben Sie die soeben erläuterten Schritte bereits einmal durchgeführt, merkt sich Omnipage die getroffenen Einstellungen. diese müssen sie nicht wieder ändern - es sei denn, Sie setzen Omnipage neben dem Verarbeiten von PDF-Dokumenten auch für andere Zwecke ein. Hat sich Omnipage die Einstellungen einmal gemerkt, so können Sie zukünftig eine PDF-Datei mit den folgenden wenigen Arbeitsschritten erkennen lassen: 1. Rufen sie den Menüpunkt 'Verarbeiten > Automatische Verarbeitung starten' (ALT+V, S) auf. Es erscheint das Dialogfenster 'Bilddatei laden'. 2. Wählen Sie im Dialog 'Bilddatei laden' die PDF-Datei aus, mit der die Texterkennung durchgeführt werden soll und bestätigen Sie das Fenster mit 'OK'. Omnipage beginnt darauf hin mit dem Öffnen und Erkennen der Datei. Sobald die erste Seite des Dokuments erkannt ist, wird sie im Texteditorfenster von Omnipage angezeigt. Den Fortschritt der Texterkennung, die automatisch für alle Dokumentseiten durchgeführt wird, können Sie über die Statusleiste verfolgen. 3. Ist die Texterkennung beendet, wird automatisch der Dialog 'Speichern unter' angezeigt. Geben Sie darin Namen und Speicherort der zu sichernden Erkennungsergebnisse an und bestätigen Sie das Fenster über 'OK." Seite 63 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Texterkennung mit Openbook, Version 6 oder 7 "Das speziell für blinde und sehbehinderte Computernutzer entwickelte Programm 'An Open Book' (kurz: Openbook genannt), eignet sich besonders zum Verarbeiten grafischer PDF-Dokumente. Neben der gegenüber Omnipage komfortableren Bedienung gibt es einen weiteren wesentlichen Unterschied zwischen den beiden Programmen: Während Omnipage Pro PDF-Dokumente unabhängig davon verarbeiten kann, ob eine Version des A.R. auf Ihrem System installiert ist oder nicht, setzt Openbook den A.R. zwingend voraus. Grundsätzlich gibt es keine Unterschiede beim konkreten Vorgehen bei den neuesten Programmversionen 6 und 7 von Openbook; leider arbeiten jedoch beide Programmversionen nicht direkt mit dem A.R.7 zusammen. Wenn Sie also den A.R.7 auf Ihrem System installiert haben, müssen Sie einen geringfügig komplizierteren Weg wählen, um eine PDF-Datei mit Openbook (egal, ob Version 6 oder 7) erkennen zu lassen. Die geschilderte Vorgehensweise ist dafür jedoch allgemeiner. Bequemer können Sie arbeiten, wenn sie 'nur' den A.R.6 zusammen mit Openbook auf Ihrem Computer betreiben. Zunächst also zum allgemeinen Vorgehen, das Sie unabhängig von der Openbook- und der Adobe Reader-Version nutzen können: 1. Rufen Sie das PDF-Dokument, mit dem eine Texterkennung durchgeführt werden soll, über den ARBEITSPLATZ oder den WINDOWS EXPLORER auf, so dass es sich im A.R. öffnet. 2. Tun Sie so, als wollten Sie das Dokument drucken, indem Sie mit STRG+P den Dialog 'Drucken' aufrufen. 3. Zusammen mit Openbook wird der so genannte 'Freedom Import Printer' installiert. Dies ist ein so genannter Druckertreiber. Allerdings hat er nicht die Aufgabe, einen Tintenstrahl- oder Laserdrucker zu steuern; es ist vielmehr eine Software-Komponente, die eine Datei an das Programm Openbook übergibt, das dann seinerseits damit dann eine Texterkennung durchführt. Um im angezeigten Dialogfenster 'Drucken' den Freedom Import Printer zu aktivieren, wählen Sie in der Liste 'Name' des Gruppenfeldes 'Drucker' den Eintrag 'Freedom Import Printer' und betätigen die Eingabetaste, um den 'Druckauftrag' zu geben. 4. Nun öffnet sich das Programm Openbook und beginnt mit der Texterkennung für die gewählte PDF-Datei. Den Fortschritt bei diesem Vorgang können Sie jederzeit im Fenster 'Verarbeitung' verfolgen. 5. Ist die Texterkennung abgeschlossen, liest die OpenbookSprachausgabe die letzte erkannte Dokumentseite vor. Rufen Sie den Menüpunkt 'Datei > Speichern unter' auf. 6. Legen sie im erscheinenden Dialogfenster 'Speichern unter' Namen und Speicherort für den erkannten Text fest. Achtung: Wenn Sie das Dokument außerhalb von Openbook weiter verarbeiten möchten, dann wählen Sie in der Liste 'Dateityp' ein anderes als das vorgegebene Openbook-Dokumentformat. Entscheiden Sie sich zum Beispiel für das Format einer Word-Version oder für eine reine Textdatei. Bestätigen Sie das Fenster über die EINGABETASTE. Seite 64 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Haben Sie auf Ihrem Computer 'nur' A.R.6 installiert, vereinfacht sich die Verarbeitung eines PDF-Dokumentes mittels Openbook dramatisch, weil der A.R.6 von allen Openbook-Versionen direkt unterstützt wird: 1. Starten Sie das Programm Openbook. 2. Rufen Sie mit STRG+O den Dialog 'Öffnen' auf und wählen Sie darin die PDF-Datei, mit der die Texterkennung durchgeführt werden soll. Bestätigen Sie das Fenster mit der EINGABETASTE. 3. Die Texterkennung beginnt automatisch. Über den fortschritt dieses Vorgangs können Sie sich jederzeit im Fenster 'Verarbeitung' informieren. 4. Ist die Texterkennung abgeschlossen, liest die OpenbookSprachausgabe die letzte erkannte Dokumentseite vor. Rufen Sie den Menüpunkt 'Datei > Speichern unter' auf. 5. Legen sie im erscheinenden Dialogfenster 'Speichern unter' Namen und Speicherort für den erkannten Text fest. Achtung: Wenn Sie das Dokument außerhalb von Openbook weiter verarbeiten möchten, dann wählen Sie in der Liste 'Dateityp' ein anderes als das vorgegebene Openbook-Dokumentformat. Entscheiden Sie sich zum Beispiel für das Format einer Word-Version oder für eine reine Textdatei. Bestätigen Sie das Fenster über die EINGABETASTE." "Was passiert denn, wenn ich trotz installiertem A.R.7 versuche, ein PDFDokument direkt in Openbook zu öffnen?" "Dann behauptet das Programm im Rahmen einer Fehlermeldung, dass PDF-Dateien auf Ihrem System kein Programm zugeordnet sei und bricht die Verarbeitung ab. Ihnen bleibt wirklich nur der erste geschilderte Weg über den Aufruf des Freedom Import Printers über den 'Drucken'-Dialog des Adobe Readers." 5.5. Von PDF nach Text oder HTML per Internet "Wenn Sie keines der bisher genannten Programme installieren wollen oder können bleibt Ihnen immer noch eine Möglichkeit, an den Inhalt einer PDFDatei heran zu kommen: Sie können die Konvertierung über einen kostenlosen Internet Service der Firma Adobe Systems abwickeln lassen. Hierzu senden Sie ein PDF-Dokument als Anlage einer E-Mail an eine von zwei möglichen E-Mail-Adressen und erhalten postwendend eine Textdatei oder eine HTML-Datei zurück - je nachdem, für welche von den beiden Adressen sie sich entschieden haben: • • Um eine Textdatei zu erhalten, senden Sie die Ursprungs-PDF-Datei als Anlage an pdf2txt@adobe.com. Um eine HTML-Datei zu erhalten, senden Sie die Ursprungs-PDFDatei als Anlage an pdf2html@adobe.com. Natürlich besteht der Nachteil dieses Verfahrens darin, dass Sie das umgewandelte Dokument so akzeptieren müssen, wie es ist - Sie können auf Seite 65 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen den Konvertierungsprozess, der übrigens unter Verwendung des Produktes Adobe Acrobat Elements Server durchgeführt wird, keinen Einfluss nehmen." 6. Noch mehr Hintergrundwissen zu PDF "Zur praktischen Handhabung von PDF-Dokumenten wäre damit das Wichtigste gesagt. Einige Ihrer Hintergrundfragen sind allerdings noch unbeantwortet. Dies soll sich im vorliegenden Gesprächsteil ändern: • • • • In Abschnitt 6.1 erzähle ich Ihnen mehr über die bisher sieben verschiedenen Versionen des PDF und die damit einhergehenden sieben Generationen der Acrobat-Produkte. In Abschnitt 6.2 sprechen wir darüber, was sich hinter den bisher nebulös gebliebenen Begriffen 'Zugriffseingeschränktes PDFDokument' und 'PDF-Sicherheitseinstellungen' verbirgt. In Abschnitt 6.3 gebe ich Ihnen einige weiterführende Informationen zu Tags, also zu den Markierungen, die den logischen Aufbau und die Lesereihenfolge in PDF-Dokumenten beschreiben. Schließlich betrachten wir in Abschnitt 6.4 einige der tausend Wege, auf denen ein Autor aus einer Ursprungsdatei ein PDF-Dokument erstellen kann. Einige dieser Wege führen zwangsläufig zu minderwertigen PDF-Dokumenten ohne Tags bzw. inhaltliche Gliederung und müssen deshalb aus unserer Sicht als 'Irrwege' bezeichnet werden. Andere Programme und Umwandlungsprozeduren eignen sich dagegen sehr gut zur Herstellung mit Tags versehener PDF-Dateien. In Analogie Zur Abkürzung 'A.R.' für den Adobe Reader möchte ich die Abkürzung 'A.A.' für das Programm Adobe Acrobat, Professional Version einführen und auch hier die Versionsnummer - falls erforderlich - einfach anhängen." 6.1. Die sieben Versionen des PDF "Vielleicht hat Sie der folgende Satz aus Abschnitt 5.2 etwas irritiert: 'Die derzeit aktuelle Version 3.01 von PDFToText unterstützt die neueste Version 1.6 von PDF noch nicht direkt.' Dass Programme in Verschiedenen Versionen vorliegen, mag Ihnen einleuchten, aber dass Dokumentformate wie das PDF in mehreren Versionen existieren, mag Ihnen zunächst befremdlich erscheinen - ist es aber nicht, denn genau wie Programme, so werden auch Dateiformate stets weiter entwickelt. Die derzeit aktuelle PDF-Version aus dem Jahre 2004 ist '1.6', aber beginnen wir chronologisch: • Alles fing 1993 mit der Version 'PDF 1.0' an, die von den AcrobatSoftwareprodukten der Version eins unterstützt wurde. Außer der optisch attraktiven Darstellung von Text konnte diese PDF-Version Seite 66 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • • • • • noch nicht sehr viel: Es war möglich, Lesezeichen und dateiinterne Querverweise in ein PDF-Dokument ein zu betten. Bereits 1994 folgten: Die PDF-Version 1.1 und die Acrobat-Produkte in der Version zwei. PDF 1.1 unterstützte bereits externe Querverweise und die Einbettung von Multimedia-Dateien in älteren Sound- und Video-Formaten. Zusätzlich konnten die Dokumente durchsucht werden. 1995 kamen die PDF-Version 1.2 und die Acrobat-Produkte in der Version drei auf den Markt. Neu war die Möglichkeit der Verwendung des CMYK-Farbsystems. Außerdem konnten PDF-Dateien jetzt durch die Unterstützung von Browser-Erweiterungen (sogenannter Plugins) direkt aus dem Internet heraus aufgerufen werden. Die Firma Adobe Systems spendierte Screenreader-Nutzern ein spezielles Zugänglichkeits-Plugin für den A.R.3. Mit diesem Accessibility Plugin war es blinden Computernutzern erstmals in der Geschichte des PDF möglich, derartige Dateien zu lesen. Die PDF-Version 1.3 und die Acrobat-Produkte in der Version vier ließen bis 1999 auf sich warten. Neu in PDF 1.3 war die Unterstützung asiatischer Schriften. Das Accessibility Plugin für den A.R.4 wurde verbessert. Die Einführung von PDF in der Version 1.4 und der Acrobat-Produkte in der Version fünf im Jahre 2001 brachten für Screenreader-Benutzer drei entscheidende Veränderungen: 1. Ein Accessibility Plugin gab es nicht mehr, dafür unterstützte der A.R.5 nun MSAA. Die Firma Adobe Systems forderte die Screenreader-Hersteller auf, fortan selbst für die direkte Unterstützung des A.R. zu sorgen. 2. Konnten PDF-Dokumente bis zur PDF-Version 1.3 nur mit einer schwachen Verschlüsselung von 40 Bit gegen unbefugten Zugriff geschützt werden, so unterstützte PDF 1.4 nun die starke 128BitVerschlüsselung. Was dies für die Lesbarkeit zugriffseingeschränkter PDF-Dateien im Einzelnen bedeutet, erörtern wir in Abschnitt 6.2. 3. Enthielten PDF-Dokumente bis zur PDF-Version 1.3 lediglich Layout- aber keine Strukturinformationen, so wurde es in der PDFVersion 1.4 erstmals möglich, mit Hilfe spezieller Markierungen, den so genannten Tags, den logischen Dokumentaufbau zu beschreiben. Tags verbessern nicht nur die Lesbarkeit von PDFDokumenten für Screenreader, sie sorgen auch bei einer Umwandlung von PDF in andere Dokumentenformate für bessere Konvertierungsergebnisse. Mit dem Thema Tags setzen wir uns ausführlich in Abschnitt 6.3 auseinander. Die Erweiterungen der PDF-Version 1.5 und der Acrobat-Produkte der Version sechs aus dem Jahre 2003 brachten Neuerungen vor allem im Grafik-, Video- und Sound-Bereich: Bilder im Format JPEG2000, Filme im Format MPEG und Audiodateien im Format MP3 konnten jetzt in PDF-Dateien eingebettet werden. Aus dem Acrobat Reader wurde der Adobe Reader, dem die Herstellerfirma einige zusätzliche Optionen für Sehbehinderte und Blinde sowie Sprachausgabefunktionen spendierte. Seite 67 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • Im Jahre 2004 kamen dann die derzeit aktuelle Version 1.6 des PDF und die Versionen sieben der Acrobat-Produkte heraus. Der A.R.7 kann nun auf Wunsch unzugängliche PDF-Dokumente vorübergehend mit Tags versehen, liest mehrspaltige Dokumente sehr viel besser und kann Formularfelder mit Hilfe seiner Sprachausgabefunktionen direkt vorlesen. Ein Ausgabehilfeassistent unterstützt den Benutzer beim Optimieren der Programmeinstellungen für die Zusammenarbeit mit Screenreadern und Bildschirmvergrößerungsprogrammen." "Sieht ja so aus, als ob die Firma Adobe Systems gerade in den letzten beiden Jahren große Anstrengungen unternommen hätte, PDF-Dokumente für uns Blinde leichter handhabbar zu machen." "Das stimmt, und man sollte dies lobend anerkennen. Leider ist das aber nur die eine Seite der Medaille: Schlecht produzierten PDF-Dokumenten ohne Tags - und davon gibt es unzählig viele - stehen ein noch so zugänglicher A.R., ein noch so leistungsfähiger Screenreader und ein noch so gut geschulter blinder Computernutzer machtlos gegenüber." "Dann muss man bei den PDF-Autoren also noch eine Menge Aufklärungsarbeit leisten!" "Richtig! Bis vor Kurzem galt außerdem, dass Software, mit deren Hilfe Tagged PDF erzeugt werden kann, sehr teuer ist, denn dazu waren einzig und allein Produkte der Firma Adobe selbst in der Lage. Mittlerweile ist jedoch die Version 2 des kostenfreien Textverarbeitungsprogramms Open Office erschienen - und dieses Produkt scheint den Adobe-Programmen hinsichtlich der Fähigkeit, barrierefreie PDF-Dateien zu erzeugen, ernsthafte Konkurrenz machen zu können. In der Zeit vor Open Office 2 war es aber kein Wunder, wenn Autoren immer wieder auf schlechtere, dafür aber kostenlose PDF-Erstellungsmethoden zurück griffen." "Bei so vielen verschiedenen PDF-Versionen stellt sich mir natürlich sofort die Frage: Sind die denn untereinander kompatibel?" "PDF ist aufwärts-, aber leider nicht zwingend abwärtskompatibel. Jede neuere Version des Adobe Readers kann Dokumente aus älteren PDFVersionen anzeigen. Jede neue Version der Acrobat-produkte ist auch in der Lage, Dokumente in älteren Versionen zu erzeugen. Umgekehrt ist eine fehlende Abwärtskompatibilität natürlich vor allem in den für uns Screenreader-Benutzer sensiblen Bereichen der Tags und der Lesbarkeit von geschützten PDF-Dokumenten sehr ärgerlich. Es kann leider passieren, dass ein Dokument, welches mit einem Acrobat-Produkt der Version sechs mit Tags versehen wurde, mit der Version fünf des Acrobat Readers nicht richtig angezeigt wird, da die Tags nicht ordnungsgemäß erkannt werden. Leider ist bezogen auf Tags in der Praxis auch fehlende Aufwärtskompatibilität beobachtet worden: Ein mittels A.A.5 'getaggtes' Dokument ließ sich mit dem A.R.7 nicht mehr ordnungsgemäß anzeigen. Ein mit 128 Bit stark verschlüsseltes PDF-Dokument kann mit A.R.-Versionen kleiner als fünf gar nicht geöffnet werden. Auf Dokumentverschlüsselung und Sicherheitseinstellungen kommen wir in Abschnitt 6.2 zu sprechen. Seite 68 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Die ständige Fortentwicklung des PDF hat natürlich zur Folge, dass Umwandlungsprogramme wie PDFToText, GhostScript oder GSView zwangsläufig hinterher hinken und - wie dies augenblicklich bei PDFToText der Fall ist - nur die zweitaktuellste PDF-Version unterstützen." 6.2. Verschlüsselt und versiegelt? - Die PDFSicherheitseinstellungen "Es ist schon mehrfach angeklungen, dass PDF-Autoren ihre Dateien schützen können, indem Sie dem Benutzer verbieten, gewisse Dinge damit zu unternehmen. Mögliche Verbote können sein: • • • • • Das Ausdrucken der PDF-Datei ist entweder gar nicht oder nur in geringer Druckqualität möglich. Der Benutzer darf das Dokument nicht mit eigenen Anmerkungen versehen. Das Ausfüllen bzw. das Senden von Formularfeldern ist untersagt. Der Benutzer kann das Dokument nicht unterschreiben. Für Screenreader-Benutzer besonders relevant: Das kopieren von Dokumentinhalten in die Zwischenablage ist nicht möglich. Um ein Dokument derart zu schützen, vergibt der Autor ein so genanntes Berechtigungskennwort, auf dessen Grundlage das Dokument verschlüsselt wird. Bis zur Version PDF 1.3 (also der A.R.-Version 4) war es lediglich möglich, Dokumente mit einer schwächeren 40Bit-Verschlüsselung zu schützen. Ab der Version PDF 1.4 (also ab der A.R.-Version 5) steht zusätzlich eine mehr Sicherheit bietende (stärkere) 128Bit-Verschlüsselung zur Verfügung. Wird ein Dokument 128Bit-verschlüsselt, kann es allerdings mit dem A.R.4 und niedrigeren Versionen nicht mehr geöffnet werden. Daraus ergibt sich bezüglich der Dokumentsicherheit eine fehlende Abwärtskompatibilität bzw. ein Bruch zwischen den PDF-Versionen 1.3 und 1.4 und somit zwischen den A.R.-Versionen vier und fünf. PDF-Autoren befinden sich nun in folgender Zwickmühle: Entscheiden sie sich für eine in jedem Falle abwärtskompatible 40Bit-Verschlüsselung, so hat dies für uns Screenreader-Benutzer folgenden gravierenden Nachteil; wird in einem 40Bit-verschlüsselten PDF-Dokument das Kopieren von Inhalten in die Zwischenablage und damit ebenfalls die Umwandlung ins Textformat verboten, wird gleichzeitig automatisch auch dem Screenreader der grundsätzliche Zugriff auf den Dokumentinhalt verweigert. Der A.R. und der Screenreader können dann nicht mehr über MSAA Daten austauschen, während der sehende Anwender das Dokument natürlich am Bildschirm problemlos lesen kann. Entscheidet sich der Autor dagegen für eine modernere 128Bit-Verschlüsselung ist das Dokument nicht mehr völlig abwärtskompatibel. Dafür lassen sich aber die Berechtigungen zum Kopieren von Inhalten in die Zwischenablage einerseits und für den ScreenreaderZugriff andererseits getrennt regeln." "Bedeutet das: Nur beim Einsatz der modernen 128Bit-Verschlüsselung lässt sich der Zugriff für Screenreader erlauben, während die Entnahme von Seite 69 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Dokumentinhalten und die Textumwandlung unabhängig davon verboten sein kann." "Genauso ist es. Sie können die Sache auch umgekehrt betrachten: Verbietet ein PDF-Autor unter Einsatz der älteren 40Bit-Verschlüsselung das Kopieren von Inhalten in die Zwischenablage und die Textumwandlung, so verbietet er gleichzeitig auch den Screenreader-Zugriff, was fatale Folgen für die Lesbarkeit des Dokumentes hat. Grund: In A.A.4 gibt es in den Sicherheitseinstellungen das Kontrollfeld 'Inhalte entnehmen oder kopieren, Zugriff nicht zulassen'. Ab A.A.5 kann man durch Verwendung der 128BitVerschlüsselung diese beiden Funktionen entkoppeln. Hier die Vorgehensweise für den A.A.7: 1. Das zu schützende PDF-Dokument wird im A.A.7 geöffnet. 2. Der Menüpunkt 'Dokument | Sicherheit | Dieses Dokument schützen' wird aufgerufen; Es öffnet sich der Dialog 'Anzuwendende Richtlinie'. 3. Im Dialog 'Anzuwendende Richtlinie' können Sie entweder eine vorgegebene Sicherheitsrichtlinie auswählen oder eine Neue anlegen. Wählen Sie hier die Sicherheitsrichtlinie 'Öffnen und Bearbeiten durch Kennwort einschränken' und bestätigen mit der EINGABETASTE. 4. Nun wird das Dialogfenster 'Kennwortschutz-Einstellungen' eingeblendet. Wählen Sie in der Liste 'Kompatibilität unbedingt 'Acrobat 5.0 und höher'. 5. Stellen Sie sicher, dass das Kontrollfeld 'Kennwort zum Öffnen des Dokuments erforderlich' deaktiviert ist. 6. Um ein Berechtigungskennwort für den Dokumentschutz festlegen zu können, aktivieren Sie das Kontrollfeld 'Kennwort verwenden, um das Drucken und Bearbeiten des Dokuments bzw. seine Sicherheitseinstellungen einzuschränken'; der Fokus springt automatisch ins Eingabefeld für das Berechtigungskennwort. Geben Sie ein Berechtigungskennwort ein. 7. Legen Sie in den beiden Listen 'Zulässiges Drucken' und 'Zulässige Änderungen' Ihre gewünschten Einstellungen fest. 8. Jetzt das Entscheidende: Deaktivieren Sie das Kontrollfeld 'Kopieren von Text, Bildern und anderem Inhalt zulassen', damit kein Dokumentinhalt in die Zwischenablage kopiert und auch nicht als Text gespeichert werden kann; lassen Sie jedoch unbedingt das Kontrollfeld 'Textzugriff für Sprachausgabeprogramme für Sehbehinderte zulassen' eingeschaltet! Bestätigen Sie das Fenster über 'OK'. 9. Bestätigen Sie den Hinweis, dass die Sicherheitseinstellungen zwingend nur im Rahmen der Acrobat-Produkte unterstützt werden, und dass Benutzer von Drittanbieter-Programmen die Sicherheitseinstellungen möglicherweise umgehen können, mit 'OK'. 10. Abschließend müssen Sie das festgelegte Berechtigungskennwort noch einmal bestätigen. Fazit: Nur über die 128Bit-Verschlüsselung lässt sich dem Sicherheitsbedürfnis der Autoren und dem Informationsbedürfnis der Screenreader-Nutzer gleichermaßen Rechnung tragen." Seite 70 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen "Zwei Fragen hierzu - erstens: Wie komme ich an den Inhalt eines 40Bitverschlüsselten Dokumentes heran, bei dem das Kopieren oder Entnehmen von Inhalten verboten ist?" "Es sind zwei Szenarien denkbar: 1. Ihr Screenreader ist als so genannte 'Vertrauenswürdige Anwendung' zertifiziert. Dann liefert der Adobe Reader Informationen über den Dokumentinhalt an ihren Bildschirmleser, obwohl dieser Zugriff eigentlich über die Sicherheitseinstellungen verboten ist. Beispielsweise ist JAWS, Ab Version 5.0 eine solche 'vertrauenswürdige Anwendung'. Wenn Sie mit JAWS 5.0 und höher einen 40Bit-Verschlüsselten Text in A.R.5 oder höher öffnen, sollten Sie keine Zugriffsprobleme haben - der Text sollte sich wie ein ungeschütztes Dokument lesen lassen. Allerdings bleiben die Verbote bezüglich des Kopierens von Inhalt in die Zwischenablage und des Textumwandelns in Kraft. 2. Ihr Screenreader ist nicht als 'vertrauenswürdige Anwendung' zertifiziert. Dann bleibt Ihnen nichts anderes übrig, als das Dokument mit GSView zu öffnen. GSView (im Zusammenspiel mit AFPL GhostScript) ist ein Produkt, welches die Sicherheitseinstellungen der Acrobat-Produkte nicht berücksichtigt und nahezu alle geschützten Dokumente öffnet. wie dies in der Praxis funktioniert, haben Sie in Abschnitt 5.3 erfahren." "Meine zweite Frage: Ich liege doch bestimmt richtig mit der Vermutung, dass ich als Benutzer eines Dokumentes dessen Sicherheitseinstellungen zwar anzeigen lassen, jedoch nicht verändern kann - und: Wie verschaffe ich mir einen Einblick in die für ein PDF-Dokument geltenden Sicherheitseinstellungen?" "Richtig: Nur der Autor, der das Berechtigungskennwort weiß, kann die Sicherheitseinstellungen auch verändern. Zum Betrachten der Sicherheitseinstellungen haben Sie zwei Möglichkeiten: 1. Sie öffnen das Dokument im A.R. und rufen den Menüpunkt 'Dokument | Sicherheit | Sicherheitseinstellungen für dieses Dokument anzeigen' auf und lesen das eingeblendete Dialogfenster. Hier ein Beispiel der Anzeige für das Dokument 'Using accessible PDF Documents with Adobe Reader 7': c 'Kann geöffnet werden durch: Acrobat 5.0 und höher. Der gesamte Inhalt des Dokuments ist verschlüsselt, und Suchmaschinen können nicht auf die Metadaten des Dokuments zugreifen. Dokumenteinschränkungen Zusammenfassung. Drucken: Zulässig. Dokumentzusammenstellung: Nicht zulässig. Kopieren bzw. Entnehmen von Inhalt: Nicht zulässig. Inhalt für Ausgabehilfe entnehmen: Zulässig. Kommentieren: Nicht zulässig. Formularfelder ausfüllen: Nicht zulässig. Unterschreiben: Nicht zulässig. Vorlagenseiten erstellen: Nicht zulässig. Formulare senden: Nicht zulässig.' Seite 71 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 2. Sie lassen das Dokument von PDFInfo analysieren. Dieses Programm ist neben PDFToText Bestandteil des Programmpaketes XPDF, befindet sich also im Ordner c c:\xpdf . c Öffnen Sie also ein Fenster für die Eingabeaufforderung, wechseln Sie in den Ordner c:\xpdf und rufen Sie das Programm PDFInfo, gefolgt von einem Leerzeichen und dem Pfad bzw. Namen der zu analysierenden Datei auf. Hier eine Beispielausgabe von PDFInfo für die bereits oben verwendete Datei, die mit der Kommandozeile c PDFInfo p:\pdf_dokumente\reader7_accessibility.pdf c analysiert wurde: 'Title: Reading PDF Documents with Adobe Reader 7.0 Subject: A Guide for People with Disabilities Keywords: accessible, PDF, disabilities, disability, blindness, low vision, low sight, mobility, impairment, impaired, reading, Adobe, Acrobat, Reader, screen reader, text-to-speech, reflow, handicap Author: Adobe Systems, Inc. Creator: FrameMaker 7.1 Producer: Acrobat Distiller 7.0 (Windows) CreationDate: 02/25/05 10:36:58 ModDate: 03/03/05 15:12:19 Tagged: yes Pages: 73 Encrypted: yes (print:yes copy:no change:no addNotes:no) Page size: 612 x 792 pts (letter) File size: 3935496 bytes Optimized: yes PDF version: 1.5'" 6.3. PDF mit und ohne Tags "Sie wissen, dass der Inhalt einer PDF-Datei mit Hilfe von Tags logisch strukturiert werden kann. Beachten Sie: Die An- oder Abwesenheit von Tags wirkt sich nicht auf die visuelle Präsentation am Bildschirm aus. Sie beeinflusst drei für uns Screenreader-Benutzer wichtige Aspekte: 1. In welcher Reihenfolge die Dokumentbestandteile von einem Bildschirmleser über Sprachausgabe oder Braillezeile dargestellt werden, 2. ob beim Umwandeln von PDF in ein anderes Dokumentformat sämtliche Dokumentbestandteile berücksichtigt und in der richtigen Reihenfolge konvertiert werden, 3. ob das Dokument korrekt umfließt, wenn sehbehinderte A.R.-Nutzer die Anzeige vergrößern. Verwechseln Sie Tags bitte nicht mit Lesezeichen. In langen Dokumenten dürfen Lesezeichen nicht fehlen, um die Navigation zu ermöglichen. Damit Sie sich jetzt aber besser vorstellen können, was man unter einem Tag versteht, bringe ich ein praktisches Beispiel: In Abschnitt 4.2 unserer Unterhaltung findet sich der Text 'Umschalten vom Navigationsfenster in den Dokumentbereich'. Dieser Text ist Teil einer Tabelle, in der es um Tastenkombinationen zur Bedienung des A.R. geht; genauer gesagt: der Text befindet sich in Zeile 3, Spalte 3 der ersten (und Seite 72 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen einzigen) Tabelle des genannten Abschnittes. Wir wollen einmal nachvollziehen, wie die Information 'Der angegebene Text befindet sich in Zeile 3, Spalte 3 der ersten Tabelle von Abschnitt 4.2' mit Hilfe eines Tags dargestellt wird: 1. Die logische Struktur eines Dokumentes und damit auch die Struktur von Tags gliedert sich in mehrere Ebenen, ist also immer hierarchisch aufgebaut. Hierarchien lassen sich sehr gut mit Hilfe von Baumstrukturen veranschaulichen. Entsprechend gehört zu jedem 'getaggten' PDF-Dokument ein so genannter 'Tag-Baum'. 2. Die Wurzel des Tag-Baumes bildet das Dokument, den 'Stamm' des Tag-Baumes bilden in der Regel die einzelnen Dokumentseiten. 3. In gut strukturierten Dokumenten werden zur Gliederung verschiedene Überschriften-Ebenen eingesetzt. Im vorliegenden Text stehen das Inhaltsverzeichnis und die Überschriften der Kapitel auf Ebene eins, während die Überschriften der Abschnitte auf Ebene zwei und die Überschriften der Unterabschnitte (gibt es im vorliegenden Dokument nur in Abschnitt 5.4 und Abschnitt 6.4) auf Ebene drei angesiedelt sind. 4. Den Inhalt von Abschnitt 4.2 finden wir also im Tag-Baum, indem wir nach dem vierten Überschriftenelement der Ebene eins Ausschau halten, bei diesem Element in die nächst tiefere Baum-Ebene absteigen und uns dort zur zweiten Überschrift der Ebene zwei bewegen. 5. Der Inhalt von Abschnitt 4.2 ist wiederum untergliedert: Mehrere Textabsätze stehen auf hierarchisch gleicher Ebene nebeneinander. Es gibt aber auch eine Tabelle, die wiederum über Unterstrukturen verfügt: Die Tabelle, die den gesuchten Text 'Umschalten vom Navigationsfenster in den Dokumentbereich' enthält, gliedert sich in Zeilen, die wiederum aus Tabellenzellen aufgebaut sind. Beim angegebenen Text handelt es sich um den Inhalt der ersten Zelle in Tabellenzeile drei. Fazit: Der Text 'Umschalten vom Navigationsfenster in den Dokumentbereich' ist mit einem Tag versehen, der ihn strukturell als Inhalt der ersten Zelle in der dritten Zeile in der ersten Tabelle in Abschnitt zwei in Kapitel vier des vorliegenden Textes auszeichnet." "Ich denke, dass ich verstanden habe: Wenn ein PDF-Dokument 'Getaggt' ist, kann mein Screenreader die in den Tags enthaltene Information dazu nutzen, die Dokumentbestandteile gezielt an zu springen und mir die strukturierte Navigation zwischen ihnen zu ermöglichen. So kann ich etwa unter Hinzuziehung von Lesezeichen - die Überschrift von Abschnitt 4.2 aufsuchen und danach zur nächst folgenden Tabelle springen." "Genauso ist es. Wäre das Dokument 'ungetaggt', könnte ein sehender Computernutzer sicher anhand des Dokumentlayouts feststellen, dass sich in Abschnitt 4.2 eine Tabelle befindet. Ihr Screenreader wüsste jedoch nichts von dieser Tabellenstruktur. Sie hätten nicht die Möglichkeit, sich innerhalb der Tabelle von Zeile zu Zeile oder von Spalte zu Spalte zu bewegen und Seite 73 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Ihre Sprachausgabe würde den Inhalt der Tabelle vorlesen wie einen unstrukturierten Fließtext." 6.4. Zur fertigen PDF-Datei auf tausend (Irr)wegen "Ich erwähnte bereits in Kapitel 1 die folgenden Tatsachen: • • • PDF-Dokumente werden meist ursprünglich in anderen Programmen erstellt und nachträglich in PDF umgewandelt. Es gibt sehr viele verschiedene Wege, aus einem Ursprungsdokument ein PDF-Dokument zu machen. Diese Wege unterscheiden sich aus unserer Sicht vor allem dadurch, dass auf den meisten davon unzugängliches PDF und nur auf wenigen zugängliches PDF entsteht." "Richtig: Sie hatten mir sechs Merkmale genannt, in denen sich barrierefreie von unzugänglichen PDF-Dokumenten unterscheiden: 1. 2. 3. 4. Text, der in buchstaben- und nicht in Grafikform vorliegt, Vorhandensein von Tags, Vorhandensein einer Dokumentgliederung mittels Querverweisen, Sicherheitseinstellungen, die den Zugriff des Screenreaders auf Dokumentinhalte nicht verhindern, 5. Vorhandensein eines korrekten Umfließverhaltens, wenn das Dokument vergrößert dargestellt wird und 6. Verwendung unproblematischer Zeichensätze." "Genau! In diesem Abschnitt möchte ich zwei Dinge tun: 1. Im Unterabschnitt 6.4.1 möchte ich ein paar Worte darüber verlieren, auf welchen Wegen Autoren zu einem barrierefreien PDF-Dokument gelangen können, indem Sie für uns Screenreader-Benutzer ungünstige Wege der PDF-Erstellung vermeiden. 2. Mit der Erzeugung eines PDF-Dokumentes ist es oft noch nicht getan. Im Unterabschnitt 6.4.2 gehe ich deshalb auf die Aspekte der Nachbearbeitung einer bestehenden PDF-Datei zur Optimierung der Zugänglichkeit ein." Vom Autorenprogramm zur möglichst zugänglichen PDFDatei "Das Quelldokument, das später zu einer PDF-Datei gemacht wird, entsteht in einem Autorenprogramm. Als Autorenprogrammt kommt heut zu tage fast jede Software in Frage, weil es entsprechende Druckertreiber gibt, die PDFDateien erzeugen können. Wie diese Druckertreiber zu bewerten sind, stelle ich weiter unten ausführlich dar. Da sich aber einige Produkte mehr als Andere als Autorenprogramm eignen, möchte ich die potentiellen Kandidaten in Gruppen einteilen: • Textverarbeitungsprogramme wie Microsoft Word oder Corel Word Perfect, Seite 74 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • • • • Tabellenkalkulationsprogramme wie Microsoft Excel oder Lotus 1-2-3, Präsentationsprogramme wie Microsoft PowerPoint, DTP-Programme. Dabei steht die Abkürzung 'DTP' für 'Desktop Publishing' und meint die Herstellung druckreifer Dokumente mit Hilfe von Computersoftware. Beispiele für DTP-Programme sind Adobe InDesign, Adobe PageMaker oder QuarkXPress, Grafikprogramme wie Adobe PhotoShop oder Corel Draw. Die tausend Möglichkeiten, von einem Autorenprogramm zu einer PDF-Datei zu gelangen, lassen sich wie folgt einteilen: 1. Einsatz eines PDF-Druckertreibers: Das im Autorenprogramm erstellte Quelldokument wird mit Hilfe eines speziellen Druckertreibers direkt in PDF umgewandelt. Ein solcher Druckertreiber ist beispielsweise der in A.A. integrierte Treiber 'Adobe PDF'. Druckertreiber erzeugen in der Regel äußerst unzugängliche PDF-Dateien, da sie die im Quelldokument vorhandenen Strukturmerkmale nicht in Tags und die Gliederungsmerkmale nicht in Lesezeichen oder Querverweise verwandeln. 2. Einsatz eines so genannten Distillers: Distiller sind Programme, die PDF-Dokumente nicht direkt aus dem Format der Quelldatei, sondern aus einem 'Zwischenformat' erzeugen. Bei dem Zwischenformat handelt es sich um 'PostScript'. PostScript ist ein nicht für Bildschirme, sondern für Drucker gedachtes Dateiformat. PDF ist eine direkte Weiterentwicklung von PostScript. Distiller erstellen also zunächst eine - für den Benutzer meist unsichtbare PostScript-Datei und daraus dann das PDF-Dokument. Indem der Distiller die PostScript-Datei mit so genannten PDFMarks versieht, können Strukturmerkmale des Quelldokuments in 'Getaggtes' PDF und Gliederungsmerkmale in Lesezeichen und Querverweise überführt werden. Werden Distiller also intelligent eingesetzt, lassen sich aus Quelldokumenten sehr zugängliche PDF-Dateien erstellen. Der am besten hierfür geeignete Distiller ist der Adobe Acrobat Distiller, der - wie der allerdings ungeeignete Druckertreiber 'Adobe PDF' zusammen mit dem A.A. ausgeliefert wird. Benutzern der Microsoft Office-Programme Word, Excel, PowerPoint und - ab A.A.7 auch Outlook - wird der Einsatz des Adobe Acrobat Distillers besonders schmackhaft gemacht: Zusammen mit A.A. installiert sich eine Makrosammlung namens PDFMaker in die vier genannten OfficeProgramme. Der PDFMaker bereichert die Office-Programme um eine neue Symbolleiste und ein zusätzliches Menü namens 'Adobe PDF'. Mit Hilfe dieser neuen Bedienelemente kann der Autor die zahlreichen Einstellungen des Adobe Acrobat Distillers bequem steuern und so ohne große Mühe unter Einsatz des PDFMakers seine Word-, ExcelPowerPoint- und Outlook-Inhalte ohne viel Aufwand in barrierefreie PDF-Dokumente umwandeln. Dazu wird der Menüpunkt 'Adobe PDF | In Adobe PDF konvertieren' aus der entsprechenden OfficeAnwendung heraus aufgerufen. Möchten Sie dieses Thema vertiefen, so beachten Sie die Literaturhinweise [4] und [7]. Übrigens: c Auch das Programm AFPL GhostScript ist ein Distiller, was schon die Namensähnlichkeit von 'GhostScript' und Seite 75 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 3. 4. 5. 6. 7. 'PostScript' nahe legt. Leider sind die mit Hilfe des kostenlosen AFPL GhostScript hergestellten PDF-Dateien nicht ganz so barrierefrei wie diejenigen des teuren PDFMakers. c Arbeiten Sie nie direkt mit der Oberfläche des Adobe Acrobat Distillers! Nutzen Sie das Programm nur indirekt durch Verwendung von Makrosammlungen wie Adobe PDFMaker. Nur so werden dem Distiller automatisch die nötigen PDFMarks zugeleitet, aus denen die Tags und die Gliederung des entstehenden PDF-Dokumentes gebildet werden. Einsatz kostenloser Programme, die aber meist nichts Anderes darstellen als grafische Benutzeroberflächen für den Distiller GhostScript. Aus diesem Grund sind sie dem kostenpflichtigen Duo PDFMaker / Acrobat Distiller im Erzeugen barrierefreier PDFDokumente unterlegen. Ein Beispiel für eine derartige kostenlose Programmoberfläche ist 'WordToPDF'. Einsatz kostenloser Open Source-Textverarbeitungsprogramme wie Open Office ab Version 1.1.1. Das Programm unterstützt die direkte Erzeugung von PDF-Dateien aus Open Office-Quelldokumenten. Die Barrierefreiheit des von der Programmversion 1.1.1 gelieferten PDFs lässt leider noch einige Wünsche offen, dramatische Verbesserungen kündigen sich bereits für die Version 2 an. Einsatz kostenpflichtiger Programme, die sich als Konkurrenzprodukte zu A.A. verstehen, meist aber sehr viel preisgünstiger sind. Als Beispiele wären zu nennen: 1. Der 'JAWS PDF Creator', der nicht mit dem Screenreader 'JAWS' zu verwechseln ist, 2. 'PowerPDF', 3. 'S.A.D.K. PDF Xchange Pro', 4. 'PDF Machine', 5. 'PDF Studio', 6. 'PDF Genie'. Aus Sicht der Barrierefreiheit kann lediglich der JAWS PDF Creator empfohlen werden. DTP- und Grafikprogramme, die nicht aus dem Hause Adobe stammen: Hier sind vor allem die Produkte 'QuarkXPress', Programme der Firma Macromedia sowie 'Corel Draw' zu nennen. Die PDFKonvertierungsfunktionen dieser Produkte müssen aus der Sicht der Barrierefreiheit als nahezu unbrauchbar bezeichnet werden. DTP- und Grafikprogramme aus dem Hause Adobe: Obwohl sie stolze Preise haben, sind vor allem die DTP-Programme von Adobe Systems besonders gut zur Erstellung barrierefreier PDFDokumente geeignet. Hierbei sind zu nennen: a) 'Adobe FrameMaker' oder 'Adobe PageMaker' ab Version 6.0 zur Erstellung von Textdokumenten, b) 'Adobe Designer', 'Adobe GoLive' oder 'Adobe LiveCycle Designer' zur Erstellung von Formularen und c) 'Adobe InDesign' ab Version 2.0 zur Erstellung von Broschüren. Seite 76 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Bereits die Quelldokumente werden mit programmspezifischen Tags ausgestattet. Öffnet man die daraus hergestellten PDF-Dokumente in A.A., werden die autorenprogrammspezifischen Tags in Tags des A.A. umgewandelt. Danach lässt sich die Tag-Struktur bearbeiten (siehe hierzu den folgenden Unterabschnitt 6.4.2)." Zusammenfassung • • • • "Wer es sich finanziell leisten kann, sollte als Autorenprogramme für seine PDF-Dokumente unbedingt die Produkte des Microsoft OfficePaketes im Zusammenspiel mit dem PDFMaker einsetzen, der seinerseits Teil von A.A. ist. Dabei sollte man in jedem Fall die Professional-Edition von A.A. wählen, da nur sie im Gegensatz zur Standard-Version und zur Edition Adobe Acrobat Elements alle Werkzeuge zum Erstellen und Nachbearbeiten barrierefreier PDFDokumente enthält. der PDFMaker nutzt als PDFKonvertierungsroutine den Acrobat Distiller. Dieses Programm-Duo erstellt sehr gut strukturierte und gegliederte PDF-Dokumente. Wem die Office-Programme nicht zusagen, der sollte mit einem DTPProgramm aus dem Hause Adobe arbeiten, und die damit erzeugten PDF-Dokumente anschließend mit A.A. nach bearbeiten. Für den schmalen Geldbeutel ist das Programm 'JAWS PDF Creator' zu empfehlen. Wer auf kostenlose Software angewiesen ist, sollte unbedingt mit AFPL GhostScript arbeiten. Für diesen Distiller gibt es kostenlose grafische Oberflächen. Alle anderen in diesem Unterabschnitt genannten Produkte sind unter dem Aspekt der Barrierefreiheit nicht - oder noch nicht - zu empfehlen." PDF-Dokumente im Sinne der Barrierefreiheit nach bearbeiten "Selbst die unter dem Aspekt der Zugänglichkeit am Besten geeigneten Autorenprogramme, erzeugen PDF-Dokumente, die in der Regel nach bearbeitet werden müssen. Autorenprogramme sind nämlich nicht perfekt darin, die logische Dokumentstruktur angemessen in einem Tag-Baum nach zu bilden. Zwei Grundsätze sollten beim Erstellen und Nachbearbeiten eines PDF-Dokumentes stets beachtet werden: 1. Gliederung und Strukturierung sollten so weit wie möglich bereits im Quelldokument vorgenommen werden. Grund: Änderungen, die man nachträglich in der aus dem Quelldokument gewonnenen PDF-Datei vornimmt, lassen sich nicht ins Quelldokument rückübertragen. Wer beispielsweise die nach PDF gewandelte erste Version eines Quelldokumentes fünf Stunden lang nachbearbeitet und dann feststellt, dass im Quelldokument noch Änderungen vorgenommen werden müssen, darf mit der Nachbearbeitung von vorn beginnen. 2. Zur Nachbearbeitung sollte unbedingt entweder A.A.6 oder A.A.7 benutzt werden. Im Gegensatz zur Version 5 von Adobe Acrobat bieten die ProfessionalEditionen der sechser- und Siebenerversionen folgenden Vorteil: In A.A.5 Seite 77 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen mussten zwei wichtige Nachbearbeitungswerkzeuge nachträglich beschafft werden. Dabei handelte es sich: 1. Um 'Make Accessible', ein Modul zur Zugänglichkeitsprüfung von PDF-Dokumenten im Sinne der Barrierefreiheit und 2. um 'Paper Capture', ein Modul, das mit PDF-Dokumenten, die über einen Scanner erfasst wurden und als Grafik vorliegen, eine Texterkennung durchführt. Bei einer vollständigen Installation von A.A.6 und A.A.7 sind die genannten Werkzeuge automatisch verfügbar. Im A.A.7 werden sie über folgende Menüpunkte aufgerufen: • • • Die Zugänglichkeitsprüfung über 'Erweitert | Ausgabehilfe | Vollständige Prüfung', das Scannen inklusive Texterkennung mit 'Datei | PDF erstellen | Von Scanner' (danach im erscheinenden Dialog das Kontrollfeld 'Text mit OCR erkennen' aktivieren), die nachträgliche Texterkennung einer grafischen PDF-Datei über 'Dokument | Text mit OCR erkennen'. Außerdem sind die 'Kinderkrankheiten' beim Setzen und Bearbeiten von Tags in den Versionen A.A.6 und A.A.7 weitgehend behoben. Zur Erstellung barrierefreier Formulare wird nach wie vor ein Programm namens 'Adobe PDF Forms Access' empfohlen. Diese Software kann entweder als eigenständiges Produkt oder als Bestandteil des 'Adobe Acrobat Capture 3.0 Agent Pack' erworben werden." "Wie geht man beim Nachbearbeiten grundsätzlich vor?" "Folgende Schritte sind dazu erforderlich: 1. Das aus der Quelldatei entstandene PDF-Dokument wird in A.A. geöffnet. 2. In A.A.7 beispielsweise lässt man sich nun durch Einblenden der Navigationsregisterkarte 'Tags' den momentan existierenden TagBaum anzeigen. 3. Mit Hilfe verschiedener Werkzeuge von A.A., auf die ich hier nicht näher eingehe, kann der Tag-Baum bearbeitet werden. Dies kann bedeuten, dass neue Tags oder sogar neue Tag-Baum-Ebenen angelegt, bestehende Tags in oder zwischen Tag-Baum-Ebenen verschoben oder sogar überflüssige Tags gelöscht werden. 4. Die ausführliche Zugänglichkeitsprüfung hilft, vorhandene Unzulänglichkeiten zu erkennen. Als ultimatives Testkriterium sollten PDF-Autoren natürlich das Dokument bei ausgeschaltetem Bildschirm mit Hilfe eines Screenreaders zu lesen versuchen und nachprüfen, ob bei der Dokumentumwandlung ins Textformat alle Inhalte erhalten bleiben und in der richtigen Lesereihenfolge stehen. Seite 78 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Dies waren nur Grobinformationen. Details finden Sie in den im Verzeichnis weiterführender Literatur aufgeführten Publikationen [1], [2], [3] und [4]." 7. Zugänglichkeit von PDF für Blinde: Eine kritische Bilanz Mein Gast hat mir aufmerksam zugehört und sich wie ein Weltmeister Notizen gemacht. Es zeugt von seiner Umsichtigkeit, dass er mir die folgende Frage erst jetzt, am Ende des Gespräches stellt: "Was würden Sie denn sagen - ist PDF barrierefrei oder nicht?" "Nun, in den letzten paar Stunden haben Sie von mir vieles über das Format PDF und über die Handhabung von PDF- Dateien bei den verschiedensten Zugänglichkeitsproblemen erfahren. Es sollte klar geworden sein, dass das Thema zu komplex ist, um die gestellte Frage mit einem eindeutigen 'Ja' oder 'Nein' zu beantworten. In einer solchen Situation ist es ratsam, die Gesamtfragestellung in Teilfragen zu zerlegen, die leichter und eindeutiger zu beantworten sind. Über diese Teilfragen sollte sich dann auch konkreter diskutieren lassen, falls andere Personen, die sich ebenfalls mit der Materie beschäftigen, zu anderen Schlüssen kommen als ich. Lassen Sie mich deshalb ein kleines Frage-und-Antwortspiel veranstalten: Frage 1: Ist es einem Autor denn überhaupt möglich, ein für blinde und sehbehinderte Computeranwender vollkommen barrierefreies PDFDokument zu erstellen? Antwort 1: Ja, wenn sich die Autoren an die in 1. Klagelied eines frustrierten PDF-Neulings aufgezählten sieben Kriterien halten (der Inhalt liegt als Text vor, der Dokumentschutz steht nicht mit dem Zugriff eines Screenreaders in Konflikt, Tags sind vorhanden, Navigationsmöglichkeiten sind vorhanden, bei Vergrößerung umfließt das Dokument korrekt, Darstellungsprobleme bei Kontrastveränderungen im Zusammenhang mit farbiger Texthinterlegung werden vermieden, die verwendeten Zeichensätze sind unproblematisch). Zu beachten ist aber: Je komplexer Inhalt und Layout des Dokumentes sind, desto anspruchsvoller und zeitaufwendiger ist die Aufgabe, die Datei barrierefrei zu gestalten. Frage 2: Sind die meisten verfügbaren PDF-Dokumente barrierefrei? Antwort 2: Nein. Das hat mehrere Gründe: • • Viele Autoren sind sich des Problems überhaupt nicht bewusst. Sie wissen nicht, dass blinde und sehbehinderte Menschen überhaupt mit dem Computer arbeiten können - und wenn sie es wissen sind sie sich nicht darüber im Klaren, welche Faktoren beim Erstellen eines PDFDokumentes zu Zugangsschwierigkeiten führen können. Viele Autoren bedienen sich bei der Erstellung von PDF-Dateien solcher Werkzeuge, die aus der Sicht der Barrierefreiheit völlig Seite 79 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen • • ungeeignet sind, weil etwa keine Möglichkeit besteht, den Inhalt mit Tags zu versehen. Je länger und komplexer ein PDF-Dokument ist, desto zeitaufwendiger ist es für den Autor, seine Barrierefreiheit sicher zu stellen. Diese Zeit kann oder will sich nicht jeder angesichts der heutigen Schnelllebigkeit von Information nehmen. Das Sicherstellen der Barrierefreiheit ist nicht nur zeit-, sondern auch kostenaufwendig. Das einzige Werkzeug, das Zugänglichkeit wirklich garantieren kann, ist das über 600 Euro teure Programm Adobe Acrobat. Frage 3: Arbeiten unsere Screenreader bereits optimal mit dem Adobe Reader zusammen oder liegt diesbezüglich noch einiges im Argen? Antwort 3: Steigerungen sind noch möglich. Selbst beim Screenreader JAWS, der erfahrungsgemäß schon längere Zeit befriedigend im Adobe Reader arbeitet, sind noch Wünsche offen, die sich vor allem auf das Erkennen von Aufzählungen, Tabellen und Formularelementen richten. Grundsätzlich muss man aber festhalten, dass die Hersteller von Bildschirmvorleseprogrammen auf den guten Willen derjenigen Firmen angewiesen sind, die Anzeigeprogramme für PDF-Dokumente entwickeln. Zu deutsch: Ein Screenreaderhersteller, der es nicht schafft, gute Geschäftsbeziehungen zur Firma Adobe Systems zu knüpfen, hat hier das Nachsehen. Generell arbeiten sämtliche Bildschirmleseprogramme zumindest so gut mit dem Adobe Reader zusammen, dass man sagen kann: Gut zugängliche PDF-Dokumente können mit Hilfe jedes der derzeit aktuellen Bildschirmvorleseprogramme problemlos gelesen werden. Frage 4: Tut die Firma Adobe Systems ihrerseits alles Nötige, um das Erstellen barrierefreier PDF-Dokumente so leicht wie möglich zu machen? Antwort 4: Zunächst muss man festhalten, dass PDF einerseits und die Firma Adobe Systems nicht miteinander verwechselt werden dürfen. Mit dem Adobe Reader als Anzeigeprogramm und mit Adobe Acrobat als Herstellungswerkzeug von PDF-Dokumenten ist Adobe Systems der unumstrittene Marktführer. Die Spezifikation von PDF ist aber hinreichend offen gelegt, so dass auch jede andere Person oder Firma Programme entwickeln könnte, welche PDF-Dokumente darstellen. Man darf andererseits aber auch nicht vergessen, dass die Firma Adobe Systems als Erfinder des PDF in einer besonderen Verantwortung steht. Vor diesem Hintergrund ist es zu bedauern, dass echte Anstrengungen hinsichtlich der Zugänglichkeit des Formates erst sechs Jahre nach dessen Einführung gemacht wurden und dass es insgesamt acht Jahre gedauert hat, bis man in einem PDFDokument mittels der Tags überhaupt Informationen über dessen logische Struktur hinterlegen konnte. Ein weiterer Kritikpunkt ist der hohe Preis für Werkzeuge, mit denen sich Barrierefreiheit mit Sicherheit herstellen lässt: Viele Werkzeuge zur barrierefreien Erstellung und Nachbearbeitung von PDF-Dokumenten sind in der Standard-Edition von Adobe Acrobat nicht, sondern nur in der 200 Euro teureren Professional-Edition vorhanden. Werkzeuge zur Sicherstellung von Barrierefreiheit müssen meines Erachtens zur Standardausstattung eines Programms gehören! Zweifellos hat Adobe Seite 80 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Systems in der Vergangenheit viel für körper- und sinnesbehinderte Computeranwender getan: Die fast vollständige Tastaturbedienbarkeit des Adobe Readers, Die integrierte Sprachausgabefunktionalität und der Ausgabehilfeassistent für Blinde, die Umfließ-Funktion für Sehbehinderte sowie das automatische Scrollen für motorisch Behinderte sind große Meilensteine auf dem Weg zu gut Zugänglichen PDF-Dokumenten (siehe hierzu auch die Literaturhinweise [1] und [2]). Wir dürfen aber nicht vergessen, dass Adobe Systems diese großartigen Werkzeuge nicht ganz freiwillig, sondern auf massiven gesetzlichen und öffentlichen Druck in den USA in ihre Programme eingebaut hat. Fazit: Firmen wie Adobe Systems stehen nach wie vor in der Pflicht, an der Verbesserung der Zugänglichkeit ihrer Programme und des PDF als Dateiformat zu arbeiten. Frage 5: Kennen sich die blinden und sehbehinderten Computernutzer gut genug mit dem Thema PDF aus, um die Möglichkeiten ihrer Screenreader und der Anwendungsprogramme voll aus zu schöpfen? Antwort 5: Nein, obwohl das nur selten die Schuld des blinden oder sehbehinderten Anwenders selbst ist. Noch vor vier bzw. fünf Jahren war kein einziger Screenreader in der Lage, aus eigener Kraft PDF-Dokumente an zu zeigen. Natürlich lag dies vor allem daran, dass der Adobe Reader den Screenreadern keinerlei Informationen über den Dokumentinhalt lieferte (der A.R. unterstützte noch kein MSAA), wer PDF-Dokumente lesen wollte, musste sich mit einem von Adobe zur Verfügung gestellten Zusatzmodul für den A.R. behelfen. Das musste separat installiert und konfiguriert werden. Fakt ist, dass in jener Zeit bei weitem nicht alle blinden Anwender wussten, dass es überhaupt eine Chance gab, PDF-Dateien zu lesen. Als dann im Jahre 2001 die ersten Screenreader direkt mit dem A.R. zusammen arbeiten konnten, war diese Zusammenarbeit oft von vielen Kinderkrankheiten überschattet: Der Rechner lief instabil, die meisten logischen Strukturen von PDF-Dokumenten wurden noch nicht erkannt. Stand der Technik im Jahre 2001 war: Der Umgang mit PDF-Dokumenten ist - von wenigen gut zugänglichen Dokumenten einmal abgesehen - unmöglich bis problematisch. Seit dieser zeit hat es dramatische Verbesserungen gegeben. Wer sich allerdings seit vier Jahren nicht mehr mit dem Thema auseinander gesetzt hat, hat ein aus heutiger Sicht zu negatives Bild von der Zugänglichkeit von PDF. Wie in allen Lebensbereichen gibt es außerdem ungerechtfertigte Vorurteile gegenüber PDF-Dokumenten, die man wohl nie völlig ausräumen wird. Wer sich allerdings - aus privaten oder beruflichen Gründen - mit PDFDokumenten intensiv auseinander setzen muss, steht in der Pflicht, sich über die neuesten Fortschritte in der Screenreader-Technologie zu informieren. Diesen 'Holschulden' der blinden und sehbehinderten Benutzer steht andererseits die Tatsache gegenüber, dass es nur wenig und nicht allen interessierten Personen zugängliche Fachliteratur jenseits des Internet zum Thema PDF gibt und dass es aus organisatorischen und finanziellen Gründen nicht in jedem Falle einfach ist, an einer blinden- bzw. sehbehindertengerechten Computerschulung teil zu nehmen. Also: Auf der Seite der Screenreader-Hersteller und der Blinden (selbsthilfe)verbände gibt es 'Bringschulden', nämlich die potentiellen Kunden bzw. Mitglieder über die Fortschritte auf dem Gebiet der Computerhilfsmittel auf dem Laufenden zu halten; auf der Seite der Anwender muss das Interesse für Seite 81 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Technologiefortschritte ebenso vorhanden sein wie die Bereitschaft, Zeit und Geld in neue Versionen von Screenreadern und Bildschirmvergrößerungsprogrammen zu investieren. Frage 6: Kann man sich als blinder bzw. sehbehinderter Computeranwender aus finanzieller Sicht einen modernen Screenreader leisten, der gut mit PDF zu recht kommt? Antwort 6: Urteilen Sie selbst anhand der folgenden Fakten: • • • • Wer in der zweiten Hälfte des Jahres 2003 oder später mit einem Screenreader neu ausgestattet wurde, verfügt über eine zeitgemäße PDF-Unterstützung oder kann kostenlos ein Update für sein Bildschirmleseprogramm erwerben, welches die aktuelle Version des A.R. unterstützt. Wer zwischen den Jahren 2000 und 2003 mit einem Screenreader neu ausgestattet wurde, kann sich derzeit durch den Erwerb kostenpflichtiger Updates mit einem finanziellen Aufwand von maximal 450 Euro auf den aktuellen Stand bringen. Wer vor dem Jahr 2000 ausgestattet wurde, verfügt ohnehin nicht mehr über eine Zeitgemäße blindentechnische Ausrüstung und muss sich - vermutlich aus ganz anderen Gründen als der Notwendigkeit mit PDF-Dokumenten um zu gehen - demnächst nicht nur neue Software, sondern auch neue Hardware beschaffen. Wer wirklich - was aber recht unwahrscheinlich sein dürfte ausschließlich aus Gründen der Nutzung von PDF-Dateien seine Hilfsmittelausstattung modernisieren muss, der befindet sich entweder in Ausbildung, im Studium oder im Beruf und kann sich die entstehenden finanziellen Belastungen zumindest teilweise vom zuständigen Kostenträger ersetzen lassen. Frage 7: Was tut derjenige, der ein älteres System hat und unbedingt damit weiter arbeiten will oder muss? Antwort 7: Natürlich laufen moderne Texterkennungsprogramme und aktuelle Versionen des A.R. nicht mehr unter älteren Betriebssystemen wie MSDOS, Windows 3.1 oder Windows 95. Wer diese Systeme nutzen möchte oder muss, dem bleiben stets zwei Möglichkeiten: 1. Das PDF-Umwandlungsprogramm XPDF gibt es selbst in seiner aktuellsten Version immer noch für das Betriebssystem MSDOS. Diese DOS-Version läuft natürlich auch unter Windows 3.1 oder Windows 95. Zumindest alle einfacher gestalteten PDF-Dokumente können also problemlos auch unter älteren Betriebssystemen zugänglich gemacht werden. 2. Wer über Internet-Zugang verfügt, kann eine PDF-Datei stets als EMail-Anlage an einen Konvertierungsservice von Adobe schicken und erhält die Text- oder HTML-Version der Datei in einer Antwort-Mail. Das entsprechende Vorgehen beschrieb ich in 5.5 Von PDF nach Text oder HTML per Internet. Seite 82 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen Frage 8: Ist es unter den gegebenen Umständen überhaupt sinnvoll, einem blinden oder sehbehinderten Computeranwender ein Dokument als PDFDatei zu geben oder sind andere Dateiformate vor zu ziehen? Antwort 8: Ich möchte drei entscheidende Gründe anführen, warum andere Dokumentformate gegenüber dem PDF momentan (noch) in sehr vielen Situationen vor zu ziehen sind: 1. Vor dem Hintergrund des derzeitigen Entwicklungsstandes unserer Bildschirmleseprogramme und - damit zusammenhängend - dem Grad der Zugänglichkeit des Adobe Readers ist fest zu halten, dass sich andere Dokumentformate wie HTML (Internetseiten), DOC (Microsoft Word) oder das Rich Text Format (RTF) leichter lesen und navigieren lassen. Ausführliche Informationen zu diesem Thema finden sie im von Jan Eric Hellbusch herausgegebenen Buch (Literaturhinweis [5]). Die drei genannten Dateiformate lassen - ebenso wie PDF - eine logische Gliederung des Dokumentes zu, was Bildschirmleseprogrammen das schnelle Springen zwischen Kapiteln, Abschnitten, Tabellen, Querverweisen und anderen Dokumentstrukturen ermöglicht. 2. Für Autoren ist es wesentlich einfacher, ein HTML-, Word oder RTFDokument logisch zu strukturieren als eine PDF-Datei. Dies liegt nicht zuletzt an den dafür notwendigen Arbeitsschritten und Programmen. 3. Komplexe mathematische und chemische Formeln, Elektronische Schaltbilder, Musiknoten und fast alle Arten von Diagrammen, die Bestandteile von PDF-Dateien sind, lassen sich derzeit weder strukturiert mit Screenreadern auslesen noch durch eine Umwandlung in andere Dokumentformate erhalten. Gerade für naturwissenschaftliche Texte ist PDF derzeit denkbar ungeeignet. Zu beachten ist jedoch: Diese Einschätzung kann sich im Laufe der zeit verändern, wenn die Navigation in PDF-Dokumenten durch Fortschritte in der Screenreader-Technologie und das Strukturieren von PDF-Dokumenten durch besser bedienbare Software einfacher werden. Falls Sie nach Überblicksartikeln zum Stand der Technik suchen, empfehle ich Ihnen meine Literaturhinweise [6] und [8]. PDF als angemessenes Dokumentformat sollte nur in den folgenden klar definierten Situationen zum Einsatz kommen: • • • Das Dokument unterliegt einer hohen Geheimhaltungs- oder Vertraulichkeitsstufe und ist digital signiert bzw. zertifiziert (Beispiel: Notariell beglaubigte Schriftsätze und Stimmabgaben im Zusammenhang mit E-Government Das Dokument enthält sensible Daten, deren Echtheit garantiert sein muss (Beispiel: Krankenakten, elektronisch ausgestellte Rechnungen, Kontoauszüge, Belege etc.) Das Dokument ist die elektronische Fassung eines gedruckten Werkes und muss zitierfähig sein (Gesetzestext, Fachbuch). Hierbei ist jedoch zu beachten, dass das Dokument mittels Tags sehr gut mit Sprachausgaben und Braillezeilen gelesen werden kann." Seite 83 von 84 Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen 8. Weiterführende Literaturhinweise 1. Adobe Systems Inc. (2004). Creating Accessible PDF Documents with Adobe Acrobat 7.0. Online verfügbar als PDF-Dokument unter www.adobe.com/enterprise/accessibility/pdfs/acro7_pg_ue.pdf. 2. Adobe Systems Inc. (2004). Adobe Acrobat 7.0 and accessibility at-aglance. Online als PDF-Dokument verfügbar unter www.adobe.com/enterprise/accessibility/pdfs/acrobat7_accessibility_a ag.pdf. 3. Alles über PDF - das große Kompendium - Chip Ratgeber-Kompakt (1/2004). 4. Erle, Markus & Hellbusch, Jan Eric (2005). PDF und Barrierefreiheit. Online verfügbar unter www.barrierefreieswebdesign.de/knowhow/pdf/pdf-verstehen.html. 5. Hellbusch, Jan Eric (2005). Barrierefreies Webdesign Praxishandbuch für Webgestaltung und grafische Programmoberflächen. Heidelberg, dpunkt. 6. Hellbusch, Jan Eric (2005. Gestaltung barrierefreier PDF-Dokumente. Online verfügbar unter www.barrierefreieswebdesign.de/knowhow/pdf-barrierefrei/. 7. Heuwinkel, Roland (2003). PDF-Dokumente - lesbar für alle. Fachartikel für Aktion Mensch e.V. Online verfügbar als PDFDokument unter www.einfach-fuerale.de/artikel/pdf_barrierefrei/download/pdf_barrierefrei.pdf. 8. Krupinski, Darius-Nikolaus (2005). Portable Document Format (PDF). In: Hellbusch, Jan Eric: Barrierefreies Webdesign - Praxishandbuch für Webgestaltung und grafische Programmoberflächen. Heidelberg, dpunkt, S. 245-260. 9. Über den Autor Der Autor, Oliver Nadig, hat von 1992 bis 2000 an der Philipps-Universität Marburg Psychologie und Informatik studiert. Seit 1994 beschäftigt er sich als selbst blinder Computeranwender mit dem Thema der Zugänglichkeit und Nutzbarkeit des Internet sowie diverser Dokumentformate wie LaTeX, PostScript und PDF für blinde und sehbehinderte Menschen. Zusammen mit Patricia Ahrend hat er zwischen 1995 und 2002 mehrere Internet-Workshops für den Deutschen Verein der Blinden und Sehbehinderten in Studium und Beruf e.V. - DVBS durchgeführt. Von 1997 bis 2000 arbeitete er als Honorarkraft für die Rehabilitationseinrichtung für Blinde und Sehbehinderte (RES) in der Deutschen Blindenstudienanstalt, wo er seit Januar 2001 als Rehabilitationslehrer für EDV und elektronische Hilfsmittel fest angestellt ist. Seit Januar 2003 ist er im Auftrag des DVBS Mitglied im Fachausschuss für Informations- und Telekommunikationssysteme (FIT), einem gemeinsamen Fachausschuss der überregionalen Blinden- und Sehbehindertenselbsthilfeorganisationen. Seite 84 von 84