Beispiel - AG Stricker University of Kaiserslautern
Transcription
Beispiel - AG Stricker University of Kaiserslautern
Zweihändige Interaktion, Multi-Touch und Stift-basierte Anwendungen Intelligente Mensch-Maschine-Interaktion - IMMI SS 2011 Markus Weber Prof. Didier Stricker Didier.Stricker@dfki.de Multitouch Was ist “Multitouch” „Multitouch“ ist ein System zur Mensch-MaschineInteraktion. Es vereint Ein- und Ausgabegerät und kommt dadurch ohne herkömmliche Eingabegeräte wie Maus, Tastatur oder Stylus aus. Applikationen können direkt auf der Multitouchfläche mit einem oder mehreren Fingern manipuliert werden. Erlaubt eine intuitivere Interaktion für bestimmte Aufgaben. Multitouch Geschichte Multitouch ist über 25 alt! 1982: Erstes Multitouch System wurde beschrieben in : Mehta, Nimish, A Flexible Machine Interface, M.A.Sc. Thesis, University of Toronto 1984: Erster Multi-Touch Screen, Bob Boie, Bell Labs, Murray Hill NJ ... 2005: 2007: 2007: 2008: 2010: Jeff Han (NYU) Apple iPhone Microsoft Surface Computing N-trig Touch Screens Apple iPad http://www.billbuxton.com/multitouchOverview.html Multitouch Beispiele iPhone / iPod / iPad MS Surface Dell Latitude XT2 / HP touchSmart Windows 7 Zweihändige Interaktion Was ist zweihändige Interaktion? Theoretische Grundlagen von Buxton & Myers (1986) und Guiard (1987) Aktuelle Arbeiten im Bereich HCI von Zhai, Kabbash, Hinckley, Balakrishnan, etc. Idee: Gleichzeitige Nutzung beider Hände zum Lösen einer Aufgabe Arten: Asymmetrisch Symmetrisch Asymmetrische zweihändige Interaktion (Guiard) Hände führen unterschiedliche Teilaufgaben aus (asymmetrisch) Unterscheidung in dominante und nicht-dominante Hand Nicht-dominante Hand Führt die dominante Hand Definiert das Bezugssystem Bearbeitet “größere” / grobere Aufgaben Dominante Hand Folgt der nicht-dominanten Hand Arbeitet innerhalb des von der Nicht-dominanten Hand definierten Bezugssystems Bearbeitet “kleinere” / detaillierte Aufgaben Asymmetrisches Beispiel: Ein weiteres klassisches Beispiel für eine Aufgabe die an die nicht-dominanten Hand deligiert werden kann ist “Scrolling” Task Eigenschaften “Scrolling” • Wird vor oder parallel zu anderen Tasks ausgeführt, • Legt das Bezugssystem fest, • Kann unpräzise sein. Auswahl, Bearbeiten, Zeichnen, etc. • Wird nach oder parallel zum “Scrollen” ausgeführt, • Ausführung innerhalb des Bezugssystems, • Erfordert präzises Arbeiten. Scrolling Auswahl/Bearbeiten Spezielle Tasten für “cut, copy & paste” sowie “Scrollen” auf der linken Seite der Tastatur. Xerox Star, circa 1981 Microsoft Office Keyboard Symmetrische zweihändige Interaktion Hände führen identische Teilaufgaben aus (symmetrisch) Beispiele: Größenänderung eines Rechtecks Zoom in/out 2005: Tactiva 2006: Jeff Han NYU 2007: ThinSight, MS Research Touch Techniken kapazitive Oberflächen (kondensatorgesteuerte) Mit Metalloxid beschichtetes Glassubstrat An Ecken angelegte Spannung erzeugt ein gleichmäßiges elektrisches Feld Bei Berührung erfolgt ein Ladungstransport der an den Rändern gemessen wird und in direktem Verhältnis zur Position der Berührung steht Anwendungsbeispiele: iPhone / iPod Touch / iPad, Prada (LG), HTC-G1 Tablet PC (N-trig) Touch Techniken contd. Resistive (widerstandgesteuerte) Systeme Zwei Schichten mit konstanter Spannung durch Abstandshalter voneinander getrennt Bei Berührung mit dem Finger/Stift entsteht ein elektrischer Kontakt -> Änderung des Widerstandes Unterschiedliche Spannung an jeder Stelle -> Bestimmung der x und y Position des Kontaktes möglich Anwendungsbeispiele: Tablet-, Industrie-PCs Home-Entertainment (z.B. Nintendo DS) PDAs, Smartphones Touch Techniken contd. SAW (Surface Acoustic Wave) – „(schall)wellengesteuerte Systeme“ Bei Berührung werden Ultraschallwellen auf der Oberfläche absorbiert. Aus der Änderung der empfangenen Schallwellen kann die Position bestimmt werden Touch Techniken contd. Optische Systeme (Infrarot) In der Regel Infrarotlicht-Gitter vor dem Monitor (2 Seiten mit IR-LEDs, 2 Seiten mit Fotosensoren) Bei Berührung wird ein Schatten im Bild der gegenüberliegenden Kamera erzeugt. Durch Triangulation kann die Position der Berührung berechnet werden. Anwendungsbeispiele: Bankterminals HP-150 Touchscreen des HP-150 Touch Techniken contd. Computer Vision Von den Fingerkuppen reflektiertes Infrarotlicht wird von einer Kamera hinter der Displayfläche aufgenommen Mittels Blobtracking (Bildverarbeitung) wird die Position der Berührung berechnet Anwendungsbeispiele: Jeff Han MS Surface Community Multitouch Tables Multitouch Table Genereller Aufbau 1. 2. 3. 4. 5. 6. Infrarotkamera Tracking + Visualisierungs PC Projektor Spiegel Touchoberfläche Berühren der Touchoberfläche Aufgenommenes (Infrarot) Bild Bildverarbeitung (Blobtracking) Applikation Projektion Touchfläche Eingabe- sowie Ausgabemedium Durch Berühren der Fläche wird Infrarotlicht in Richtung der Kamera gelenkt Das Bild wird von unten auf die Touchfläche projeziert Verschiedene Techniken für Berührungserkennung FTIR DI LLP DSI Multitouch Table - Techniken FTIR (Frustrated Total Internal Reflection ) nuigroup.com • “unterbrochene” Totalreflexion, das in der Acrylscheibe totalreflektierte IR-Licht wird am Berührungspunkt zur Kamera gebrochen FTIR Vorteile: • Es wird keine geschlossene Box benötigt • “Blobs” haben einen starken Kontrast • Erlaubt das Erkennen von Druckunterschieden Nachteile: • Benötigt eine besondere Beschichtung • Nutzung von Markern ist nicht möglich • Glasoberfläche nicht möglich Multitouch Table - Techniken DI (Diffused Illumination) nuigroup.com • Die Touchfläche wird von hinten mit IR-Licht angestrahlt. Bei Berührung der Diffusorschicht wird IR-Licht zur Kamera reflektiert. DI Vorteile: • Keine spezielle Beschichtung nötig • beliebiges transparentes Material als Oberfläche (auch Glas) • Einfaches Setup (kein LED Rahmen benötigt) • Marker können verwendet werden Nachteile: • “Blobs” haben niedrigeren Kontrast • Geschlossene Box wird benötigt • Gleichmäßige Ausleuchtung schwer zu erreichen Multitouch Table - Techniken LLP (Laser Light Plane) nuigroup.com Über der Touchfläche wird mit IR Lasern eine Ebene aus IR Licht erzeugt. Bei Berührung wird diese unterbrochen und das IR Licht zur Kamera gelenkt. LLP Vorteile: • Keine spezielle Beschichtung nötig • beliebiges transparentes Material als Oberfläche (auch Glas) • Einfachstes Setup • Geschlossene Box nicht benötigt Nachteile: • Marker nicht möglich • Verdeckung kann auftreten Multitouch Table - Techniken DSI (Diffused Surface Illumination) nuigroup.com Durch spezielle Mikropartikel im Plexiglas (Endlighten) erfolgt eine gleichmäßige Verteilung und Abstrahlung des IR Lichts. DSI Vorteile: • Einfacher Wechsel zwischen DI (DSI) und FTIR • Marker verwendbar • Drucksensitiv • Gleichmäßige Finger- / Objektbeleuchtung auf der ganzen Fläche Nachteile: • Endlighten wesentlich teurer als normales Acrylglas / Plexiglas • “Blobs” haben niedrigen Kontrast Eine Infrarotkamera nimmt das reflektierte Licht auf Zur Erkennung der Berührungspunkte werden Algorithmen der Bildverarbeitung benutzt Subtraktion des Hintergrundes Glättung Filterung etc. Das resultierende S/W Bild beinhaltet nur noch die Berührungspunkte (Blobs) Verfügbare OpenSource Bibliotheken Touchlib, tbeta, ccv (www.nuigroup.org) reactiVision (http://reactivision.sourceforge.net/) BBTouch (http://benbritten.com/blog/bbtouchquick-start/) Blobtracking (CCV) Community Core Vision (http://ccv.nuigroup.com) Applikation Die Position der Berührungen wird an die Applikation gesendet Anhand der gesendeten Informationen wie Position und ID der Berührungen können daraus Gesten erkannt werden. Mit Gesten können Programme gesteuert oder spezielle Aktionen ausgeführt werden. Beispiele für Gesten Manche Techniken unterstützen die Verwendung von Markern. Damit können beliebige Objekte zur Steuerung der Applikation verwendet werden. Beispiele für Marker Gesten (Beispiele) Auswahl/Aktivierung “Mausklick (links)” Menüaufruf “Mausklick (rechts)” http://www.kickerstudio.com/blog/2008/12/touchscreen-stencils/ Gesten (Beispiele) Verschieben (z.B. Hintergrund) / Markieren (z.B. Text) / Scrollen Objekt verschieben (z.B. Bild) Mausbutton gedrückt halten Gesten (Beispiele) Verkleinern bzw. Vergößern Mausrad Gesten (Beispiele) Es sind weitere Gesten denkbar, z.B. “anstupsen” oder “wegschnippen” von Objekte. Diese sind aber stehts abhängig von der Applikation. Marker Die Verwendung von Markern erlaubt es damit gekennzeichnete Objekte zur Interaktion mit einem Multitouch Tisch zu benutzen. Die ist nur mit einigen Techniken möglich (DI, DSI) Anhand des Markers kann das Objekt (eindeutiges Muster) und dessen Orientierung auf der Oberfläche bestimmt werden. reactiVision Circular markers (DFKI) Projektionsfläche Zur Darstellung der Applikationsoberfläche in der Berührunsebene kommen zwei Techniken zum Einsatz. Projektion Das Bild wird mittels eines Projektors auf eine Diffusorfläche projeziert. Dazu wird eine gewisse Entfernung benötigt, welche durch die Verwendung von Spiegeln “verkürzt” wird. LCD Panel Das LCD Panel eines handelsüblichen Displays wird als zusätzliche Schicht unter der Touchfläche angebracht Die höhe des Tisches wird somit nur noch von der benötigten Kameraentfernung bestimmt Links Natural User Interfaces Group www.nuigroup.com ReactiVision http://reactivision.sourceforge.net/ History of Multitouch http://www.billbuxton.com/multitouchOverview.html Blog Multi-Touch Forschung http://www.touchusability.com/ Stiftbasierte Interaktion Stift als natürliches Eingabemedium in verschiedene Domänen (Design, Medizin, …). Möglichkeiten der Eingabe: Handschrift, Zeichnungen, Gesten. Touch&Write Projekt Multi-Touch Tisch mit Stiftunterstützung Link: http://www.touchandwrite.de/ Schichten Anoto Pattern und Stift Handschrifterkennung Handschriftliche Daten: MNIST – Datenbank für Ziffern (offline) 28 x 28 Bitmap Beispiel: Eingescannte Formulare IAM On-Line Handwriting Database (online) Schriftzug als Sequenz von Stiftkoordinaten Beispiel: Tablet-PC, Anoto Pen Formalismen Sample: Stroke: Sequence: Handschrifterkennung Verarbeitungsschritte Handschrift Pre-Processing Aufbereitete Daten Feature Extraktion Features <0.44, 23.5, …, 1> Klassifikation Alternativen [(„a“, 0.75), („0“, 0.25)] Post-Processing Text „a“ Pre-Processing Skew correction: Slant correction: Pre-Processing Equidistant resampling – Online Daten sind zeitlich konstant und werden räumlich normalisiert. Feature Extraktion Online Features: Geschwindigkeit / Beschleunigung Normalisierte (x, y) Koordinaten Differenz (∆ x, ∆ y) zwischen Samples Feature Extraktion Features: • length • area • angle Feature Extraktion Features: • curvature • circular variance • closure • number of strokes Klassifikation k-Nearest Neighbor Post-Processing Verwenden von Kontextinformation und Sprachmodellen. Kollokation bezeichnet man in der Linguistik das gehäufte benachbarte Auftreten von Wörtern, wie auch immer gemeinsames Auftreten zunächst begründbar sein mag (z.B.: alarm clock). Syntaktische Analyse zeigt die Strukturierung der Sätze und die Satzarten auf. Applikationen a.SCatch – Visuelle Suche von Grundrissen in Datenbank Stiftbasierte Applikation für Raumplanung Applikationen VideoTouch – Multi-User Video Annotation RoDes – Raumdesigner