Produktblatt als pdf

Transcription

Produktblatt als pdf
SymSpot
Flexibler Keyword-Spotter
Schlüsselworterkennung für gesprochene
Sprache
Client-Server-Architektur und Echtzeitadaption
Der Keyword-Spotter SymSpot ist in der Lage diejenigen Sprachsignale herauszufiltern, die mit hoher
Wahrscheinlichkeit ein bestimmtes Schlüsselwort oder
eine Schlüsselphrase enthalten.
SymSpot basiert technologisch auf Sympalogs bewährtem Spracherkenner SymRec und kann wie dieser durch seine Client-Server-Architektur in hochkanaligen Lösungen eingesetzt werden. Die automatische
Echtzeit-Adaption von SymSpot und SymRec stellt dabei eine optimale Auslastung der zur Verfügung stehenden Ressourcen sicher.
Anders als bei einem klassischen Spracherkenner wird
nicht die vollständige Wortfolge entschlüsselt. Stattdessen wird pro Sprachsignal (bzw. Sprachsignalabschnitt) nur die Information geliefert, ob ein bestimmtes Schlüsselwort identifiziert wurde. Dadurch
erkennt SymSpot Stichwörter weitgehend unabhängig
vom Gesprächskontext. Die erforderliche Empfindlichkeit kann dabei je nach Bedarf angepasst werden.
Kein phonetisches Aussprachelexikon
Die Eingabe von Schlüsselwörtern erfolgt bei SymSpot ganz einfach als Text (d.h. in orthographischer
Form), der direkt in ein internes statistisches Modell
umgeformt wird. Dieses Vorgehen hat folgende Vorteile:
• Leichte Anpassbarkeit an neue Sprachen:
Die Experten von Sympalog können allein auf Basis
von Sprachdaten und einer dazu passenden Verschriftung auf Wortebene sehr schnell eine Version
von SymSpot für eine neue Sprache bereitstellen.
• Effiziente Erstellung neuer Konfigurationen:
Durch den Verzicht auf manuell erstellte Phonemumschriften ist kein phonetisches Fachwissen bei
der Eingabe neuer Schlüsselwörter erforderlich.
Sympalog
Voice Solutions GmbH
Karl-Zucker-Straße 10
D-91052 Erlangen
Fon +49 (0) 9131 61661-0
Fax +49 (0) 9131 61661-20
info@sympalog.de
www.sympalog.de
Robuste Erkennung von Spontansprache
Wie SymRec ist auch SymSpot für kontinuierliche und
spontane Äußerungen optimiert. SymSpot arbeitet
sprecherunabhängig und verfügt über eine robuste
Kanaladaption zur Kompensation von unterschiedlichen Übertragungskanälen (z.B. Festnetztelefon, Handy).
Integriertes Sprachdetektions-Modul
Durch ein Modul zur Detektion gesprochener Sprache
kann die Segmentierung eines Signals in längere Abschnitte von sprachlichen Anteilen und Pausen automatisch vorgenommen werden; SymSpot liefert in
diesem Fall die Erkennungsergebnisse jeweils für einzelne, durch Pausen getrennte Signalabschnitte. Die
hierbei zugrunde liegende Pausenlänge ist frei konfigurierbar.
Einfache Bedienung durch GUI
Die grafische Benutzeroberfläche (GUI) von SymSpot
erleichtert dem Anwender das Laden von Sounddateien sowie die Eingabe der zu erkennenden Schlüsselwörter. Bei entsprechender Konfiguration verarbeitet
die GUI auch Sprachdaten, die über Mikrofon und
Soundkarte eingegeben werden.
Bild: Grafische Benutzeroberfläche
Technische Daten
❏ Lauffähig auf PC-Standard-Hardware
❏ Hardware-Mindestvoraussetzungen:
• 512 MB Hauptspeicher
• CPU mit 1,0 GHz (im Echtzeit-Modus steigt die Qualität der Erkennung
mit der Geschwindigkeit der CPU)
• Benötigter Festplattenplatz für Installation und Betrieb: 2 GB
❏ Betriebssysteme: Linux, Windows (Vista/XP/etc.), Windows Server; weitere auf
Anfrage
❏ Anzahl Schlüsselwörter/-phrasen: von 1 bis ca. 1000
❏ Ansteuerung des SymSpot-Servers über C/C++-API
❏ Sprachen: auf Anfrage
Sympalog
Voice Solutions GmbH
Karl-Zucker-Straße 10
D-91052 Erlangen
Fon +49 (0) 9131 61661-0
Fax +49 (0) 9131 61661-20
info@sympalog.de
www.sympalog.de