EML_Unternehmensportrait - EML European Media Laboratory GmbH

Transcription

EML_Unternehmensportrait - EML European Media Laboratory GmbH
r
Unternehmensportrait
Company Portrait
Experience IT!
EML European Media Laboratory GmbH
Unternehmensportrait | Company Portrait
Editorial
4
Als ich 1997 das EML gründete, bekam die neue
hin zum Produkt zu gehen. Wie weit sind wir da-
Firma einen klaren Auftrag: Sie sollte Forschung
mit gekommen? Der Überblick in diesem Heft zeigt,
und Entwicklung in der Informationstechnik durch-
dass wir auf verschiedenen Gebieten unseren An-
führen, ihren Erfolg aber nicht primär an der Zahl
spruch einlösen konnten; am unmittelbarsten mit
der veröffentlichten Artikel messen, sondern an
Ausgründungen, in denen mittlerweile schon über
der Umsetzung neuer Technologien in Produkte. In
100 Menschen arbeiten. Außerdem sind eine Reihe
Deutschland haben wir viele brillante Ideen, bauen
ehemaliger Mitarbeiter des EML als Firmengründer
beeindruckende Prototypen, entwickeln visionäre
erfolgreich, manche von ihnen als „serial entrepre-
Konzepte – aber die wirtschaftliche Verwertung er-
neurs“. Das vom EML mit initiierte „Heidelberger
folgt oft durch andere. Bei uns scheitert das oft an
Innovationsforum“ trägt regelmäßig dazu bei, neue
regulatorischen Hindernissen, an einer innovations-
Ideen aus den Labors der Verwertung zuzuführen.
feindlichen Öffentlichkeit oder einfach an mangeln-
Doch so erfreulich das ist ̶ wenn man in einer Stu-
dem Mut.
die des ZEW liest: „Bei einer Betrachtung der Gründungsdynamik von 1995 bis 2006 fällt auf, dass das
Das EML soll die Wissenschaftler und Ingenieure
Gründungsniveau im Hightech-Sektor in Deutsch-
ermutigen, nicht beim erfolgreichen „proof of con-
land insgesamt deutlich rückläufig ist“, dann sieht
cept“ aufzuhören, sondern den ganzen Weg bis
man, dass auf diesem Gebiet noch viel zu tun bleibt.
5
When I founded EML in 1997, I gave the new firm a
How far have we come? The present overview
clear mission. Its job was to engage in R&D in the
shows that we have lived up to our mission in vari-
IT sector, but I wanted its success to be measured
ous sectors, most obviously in the shape of spin-off
not primarily in terms of the number of articles pub-
companies now employing over 100 people. A num-
lished but in terms of the transformation of new tech-
ber of former EML staff scientists have also been
nologies into products. In Germany we have lots of
successful with firms of their own, some of them as
bright ideas, we produce impressive prototypes and
“serial entrepreneurs.” The Heidelberg Innovation
develop visionary approaches. But frequently it’s
Forum co-founded by EML also plays its part in get-
others who make money out of them. In our country,
ting new ideas from the labs onto the market.
factors militating against material success are red
tape, public hostility to innovation, and sheer lack
of guts.
All this is very gratifying. But in a major study by the
Centre for European Economic Research we read:
“In Germany between 1995 and 2006, the number of
We want EML to encourage scientists and engi-
new firms starting out in the high-tech sector clearly
neers not to come grinding to a halt with a success-
declined.” So there’s still a lot to be done.
ful proof of concept but to go the whole hog.
Dr. h. c. Dr.-Ing. E. h. Klaus Tschira
Gründer und geschäftsführender Gesellschafter /
Founder and Managing Partner
6
Inhaltsverzeichnis | Table of Contents
7
Editorial
4/5
Vorwort | Preface
8/9
Von Sprache durch Software zu Schrift | Voice Communication Technologies
10/11
Mehr Service durch Spracherkennung | Speech Analytics
12/13
Von der Sendung zum Text | Media Transcription
14/15
Die Botschaft kommt an | Voice Messaging
16/17
Mobiles Diktat und Sprachsuche | Mobile Dictation and Voice Search
16/17
Im Zentrum: Der Mensch | Interactive User Interfaces
18/19
Natürlich mit Technik umgehen | Multimodal Voice User Interfaces
20/21
Technik zur Sprache gebracht | Voice User Interfaces Output
22/23
Die Lücke schließen / Closing the Gap
24/25
Aufgezeichnet! | EML Technology for Digital Recording Systems
26/27
Hörsaal ohne Sprachgrenzen | Obliterating Language Boundaries
28/29
Beratung, Service & Hilfe | Consulting, Services & Help
32/33
Partner-Netzwerk | Partner Network
34/37
Messen und Veranstaltungen | Fairs and Events
38/39
EML: Von den Anfängen bis heute | EML Historical Review
40/41
Erfolgreicher Transfer | Successful Transfer
42
Vorwort
8
Klaus Tschira hat in seinem Editorial den Auftrag
dies eine Verschiebung der Aktivitäten weg vom
des EML hervorgehoben: Neue technologische
ursprünglichen Auftrag des Technologietransfers.
Konzepte sollen anwendbar gemacht und in Pro-
Also muss auf anderem Wege sicher gestellt wer-
dukte überführt werden. Für die praktische Umset-
den, dass die gefundenen Lösungen tatsächlich
zung bedeutet das zweierlei:
vermarktet werden, das EML aber frei ist, sich mit
Erstens muss man für den richtigen „Skill Mix“ sor-
einer neuen Technologie zu befassen. Die Möglich-
gen; neben den Technologen braucht es die Anwen-
keiten hierfür sind klar: Ausgründung, Verkauf oder
dungsexperten und auch diejenigen, die die Ge-
Lizenzierung.
schäftsprozesse verstehen. Das ist in einer kleinen
In den Jahren seit der Gründung haben wir jede die-
Firma wie EML nicht vollständig möglich; deshalb
ser Möglichkeiten erfolgreich genutzt. Es ist auch
sind strategische Kooperationen in jeder Phase er-
gelungen, Mitarbeiter zur Selbstständigkeit zu er-
forderlich.
mutigen, zur aktiven Verwertung eigener Ideen.
Am spannendsten ist aber immer der Moment,
Zweitens braucht man einen Plan für den Fall, dass
wenn wir eine Technologie erfolgreich transferiert
in einem Gebiet die Umsetzung in Produkte gelun-
und zum Beispiel eine neue Firma ausgegründet
gen ist. Würde EML sich auch noch mit Herstellung
haben: Dann braucht EML ein neues Thema und
und Vertrieb dieser Produkte befassen, bedeutete
ein neues Ziel.
Foreword
9
In his Editorial, Klaus Tschira emphasizes the mis-
ensuring that the solutions we come up with actually
sion entrusted to EML, that of making new tech-
find their way onto the market, while at the same
nological ideas applicable and turning them into
time safeguarding our liberty to work on technology.
products. In terms of practical implementation, that
The options are straightforward: spin-off, sale, licen-
means two things:
sing.
First, you have to have the right “skill mix,” that is
to say not just engineers but application experts
In the course of time EML has made successful use
and people who understand business processes. A
of all these options. In many cases, we have also
small firm like EML can’t do this entirely on its own,
managed to encourage staff members to go it alone
so instances of strategic collaboration are necessa-
and make the most of their ideas themselves.
ry at all stages.
Second, you need a plan for cases where transfor-
But the most exciting moment comes after the suc-
mation into a product is successful. If EML were to
cessful transfer of a technology, say, in the shape of
look after the manufacture and distribution of these
a brand new spin-off. Because then EML needs a
products alongside everything else, it would mean a
new baby and a new target.
shift of emphasis away from the original technology
transfer mission. So we have to find other ways of
Prof. Dr. Dr. h.c. Andreas Reuter
Geschäftsführer / Managing Director
Von Sprache durch Software zu Schrift
10
Die Sprache ist eines der wichtigsten mensch-
Optimierung der Spracherkennung auf bestimmte
lichen Kommunikationsmittel. Die automatische
Anwendungen mit vielen gesprochenen Äußerun-
Sprachverarbeitung erzielte im Laufe der letzten
gen. Denn damit kann der automatische Erkenner
Jahrzehnte große Fortschritte. Viele Menschen
sowohl lernen, „wie“ Menschen sprechen, als auch
haben Erfahrungen mit automatischen Telefonaus-
„was“ sie in bestimmten Situationen sagen. Für die
kunftssystemen, sprachgesteuerten Navigations-
Verschriftung von Nachrichtensendungen oder Par-
systemen oder auch Diktieranwendungen gemacht.
lamentsdebatten werden damit bereits recht hohe
Diese Anwendungen haben alle die Kommunikation
Erkennungsraten erreicht. Die Verarbeitung von
des Menschen mit dem Computer im Blick.
Kunde-Agent-Gesprächen im Call Center, Sprach-
Neueste Algorithmen und immer schnellere Rechner
nachrichten oder Spielfilmen ist mit mehr Erken-
ermöglichen es inzwischen, Anwendungen für die
nungsfehlern behaftet. Die Ergebnisse können aber
automatische Verarbeitung der Mensch-Mensch-
bereits sehr gut für die Klassifizierung oder statisti-
Kommunikation zu realisieren. Um die sprachliche
sche Auswertung von Kundengesprächen oder die
Kommunikation von Menschen erfolgversprechend
Suche in Videoinhalten eingesetzt werden. Smart-
in Schrift umzusetzen, müssen aber noch einige
phone-Nutzer profitieren außerdem von der Sprach-
Rahmenbedingungen erfüllt sein.
suche im Web oder der Möglichkeit, ihre E-Mails,
Ein Schlüsselfaktor für gute Ergebnisse ist die
Twitter- oder SMS-Nachrichten zu diktieren.
“Our aim is to employ speech technology for supporting communication among people.”
Voice Communication Technologies
11
One of the most important human communication
plications) by means of large quantities of spoken
resources is language. In the course of the last few
utterances. This way, the automatic recognizer can
decades, automatic language processing has made
learn both how people speak and what they say in
great strides. Today many people have experience
particular situations. Recognition rates are already
with automatic telephone information systems,
quite good for newscasts or parliamentary deba-
voice-controlled navigation systems, and dictation
tes. Far more errors are made in the processing of
applications. All these applications focus on human
client-agent exchanges in call centers, spoken mes-
communication with the computer.
sages, and feature films.
On the other hand, excellent use can be made of
In the meantime, the latest algorithms and increas-
these results for the classification or statistical eva-
ingly faster devices have made it possible to realize
luation of customer feedback and agent-customer
initial applications for the automatic processing of
exchanges or for searches in video material. Smart-
interpersonal communication. But to transform spo-
phone users may profit from searching internet con-
ken communication between humans successfully
tent by voice and from dictating their e-mails, tweets
into writing, various parameters have to be fulfilled.
or SMS.
One key factor for good results is optimization of
speech recognition in given domains (that is: ap-
Dr. Siegfried Kunzmann
Leiter F & E / Manager R & D
Mehr Service durch Spracherkennung
12
Die EML-Spracherkennung schafft die technischen
Hotline zugeordnet werden - eine interessante und
Voraussetzungen für Speech-Analytics-Anwendun-
verbraucherfreundliche Alternative im Gegensatz
gen im Contact-Center. Durch die automatische
zum langen Warten auf den nächsten Ansprech-
Transkription von Contact-Center-Dialogen kann
partner.
die gesamte telefonische Kommunikation mit dem
Auch beim Coaching von Contact-Center-Agenten
Kunden inhaltlich analysiert werden. Die Transkrip-
bieten sich neue Möglichkeiten: So können
Ge-
tionen ermöglichen es, Kategorien, Muster und Ge-
sprächsvorgaben automatisch überprüft und ab-
sprächsmerkmale zu identifizieren und die Anrufe
weichende
entsprechend zu klassifizieren. Eine Recherche
erlaubt ein effektives Coaching und stellt die Ein-
Gespräche identifiziert werden. Dies
nach Themen und wichtigen Begriffen (zum Bei-
haltung hoher qualitativer Standards sicher.
spiel „Preisinformation“, „Reklamation“) versetzt die
Durch das Abspeichern von verschrifteten Gesprä-
Verantwortlichen in die Lage, Trends und Probleme
chen in einer Datenbank kann auf unterschiedlichs-
zeitnah zu verfolgen und schnell zu reagieren.
te Informationen schnell zugegriffen werden, bei-
Zum Beispiel lassen sich Voice-Mails nach den dar-
spielsweise auf alle Kontakte mit einem Kunden
in erwähnten Produkten oder gewünschten Kunden-
oder alle Dialoge mit Kunden, die in den letzten 24
aktionen kategorisieren und können dem zuständi-
Stunden ein Netzwerkproblem gemeldet haben.
gen und qualifiziertesten Ansprechpartner in einer
Speech Analytics
13
EML speech recognition creates the preconditions
ternative to wasting time waiting for the next availa-
necessary for speech analytics applications in
ble agent.
contact centers. Automatic transcription of contact
center dialogues facilitates content analysis of all
New vistas also open up for the training of contact
telephone communications with customers. In this
center agents. The technology means that dialogue
way, categories, recurring patterns, and discourse
guidelines can be monitored and deviations from
features can be identified and the phone calls clas-
them identified. This makes for effective coaching
sified accordingly. Searches for topics and important
and helps ensure compliance with high quality stan-
concepts (“price information,” “complaint,” etc.) help
dards.
managers to keep a close eye on trends and to react quickly.
Central storage of scripted contact center dialogues
in a database provides quick access to all kinds of
Voicemails, for example, can be classified in terms
information, for instance all contacts with one parti-
of the products referred to or the actions requested
cular customer or all dialogues with customers re-
by the customer. This information can then be used
porting a network problem over the last 24 hours.
to route the call to the hotline agent best qualified to
deal with it, an interesting and consumer-friendly al-
„Sprachtechnologie stellt die Einhaltung hoher qualitativer Standards sicher.“
“Speech technology helps ensure compliance with high quality standards.”
Von der Sendung zum Text
14
Die Medientranskription ist ein wichtiger Teilbereich
der Beiträge sehr verschieden. Um diese digitalen
der EML-Sprachtechnologie. Das EML arbeitet an
Datenfluten durch automatische Verschriftung er-
einem Projekt zur automatischen Transkription von
folgreich archivieren und analysieren zu können,
Mediendaten, gefördert durch die Klaus Tschira
ist eine Verbesserung der Transkriptionsqualität
Stiftung. Das Projekt schließt an eine erfolgreich
notwendig. Dies geschieht durch die Weiterentwick-
abgeschlossene Pilotstudie zur Verschriftung von
lung von Algorithmen und webbasierten Arbeitsum-
Fernsehsendungen an, die in Kooperation mit dem
gebungen. So können die Komponenten des
Bayrischen Rundfunk durchgeführt wurde.
Spracherkenners angepasst und das Sprachenport-
In der vorherigen Studie stand noch das weit-
folio erweitert werden. Gerade die Erweiterung des
gehend automatische Erstellen druckreifer Vor-
Sprachenportfolios profitiert dabei von bereits ge-
tragsmanuskripte im Vordergrund. Das neue, seit
leisteten Arbeiten zur Entwicklung eines bilingualen
September 2011 geförderte Projekt ist wesentlich
(deutsch/englischen) Prototyps. Diese wurden vom
breiter angelegt. Das Angebot an Mediendaten aus
Bundesministerium für Wirtschaft und Technologie
verschiedensten Quellen und Domänen – angefan-
im Rahmen des Zentralen Innovationsprogramms
gen von den täglichen Fernsehnachrichten bis hin
Mittelstand (ZIM) gefördert.
zu Vorlesungen an Universitäten ̶ wächst rasant.
Dabei sind die akustischen Rahmenbedingungen
From Broadcast to Text
15
Media transcription is an important sector of EML
cessfully archive and analyze these vast treasuries
language technology. With funding from the Klaus
of digital data via automatic scripting.
Tschira Foundation, EML is working on a project for
the automatic transcription of media data. The pro-
This improvement is the fruit of the further develop-
ject follows on from a successfully concluded pilot
ment of algorithms and web-based working environ-
study on the scripting of television broadcasts con-
ments. In this way, the components of the speech
ducted in conjunction with the Bavarian Broadcas-
recognizer can be adjusted and the language port-
ting Corporation.
folio extended. In the latter case, much of the spade-
The first study focused on the largely automatic
work has already been done in connection with the
production of print-ready manuscripts. The new pro-
development of a bilingual prototype (German/Eng-
ject, which began in September 2011, is much more
lish). The work was funded by the Federal Ministry
broadly conceived. The vast range of media data
of Economics and Technology in the framework of
from all kinds of sources and domains – from daily
its Central Innovation Program for Medium-Sized
newscasts to lectures at universities – is growing at
Enterprises (ZIM).
a headlong pace. The acoustical parameters of the
different items can vary widely. Accordingly, improved transcription quality is essential if we are to suc-
„Digitale Datenfluten erfolgreich archivieren und analysieren.”
“To successfully archive and analyze vast treasuries of digital data.”
Die Botschaft kommt an
16
Ein zentrales Anwendungsgebiet der EML-Sprach-
Besucher haben die Möglichkeit, eigene Nachrich-
technologie ist die Umwandlung von Sprachnach-
ten aufzusprechen, die anschließend „live“ ver-
richten in Text. Seine Einsatzmöglichkeiten lassen
schriftet werden.
sich am Beispiel einer vom EML entwickelten Telefonie-Anwendung demonstrieren.
Solche „echten“ Anwendungsdaten
Diese wurde durch ein neues Design der Nutzer-
bei, die Qualität des Spracherkenners kontinuierlich
schnittstelle und eine einfachere Integration in be-
zu optimieren. Ein deutschlandweit tätiger Anbieter
stehende Anwendungen optimiert. Nutzer einer
von Internet-Telefonie setzt das EML-System be-
VoIP-basierten Telefonanlage können dank auto-
reits im Produktionsbetrieb ein.
matischer Verschriftung zum Beispiel Sprachnachrichten ihrer Mailbox per E-Mail erhalten. Ebenfalls
eingebunden wurden dabei die Darstellung und Bearbeitung von Nachrichten, die über Android-Apps
automatisch verschriftet werden.
Auf Messen wie der „CallCenterWorld“ kann sich
das interessierte Fachpublikum von der Leistungsfähigkeit der EML-Spracherkennung überzeugen.
tragen dazu
Voice Messaging
17
One crucial field of application for EML language
“Genuine” application data of this kind help to con-
technology is the transformation of spoken messa-
tinuously upgrade the quality of the speech recog-
ges into text. Its potential can be demonstrated with
nizer. One Internet telephony supplier operating all
reference to a telephony application developed by
over Germany is already using the EML solution as
EML.
a routine factor in the production process.
It has been optimized by redesigning the user interface and making it easier to integrate it into existing
applications. Thanks to automatic scripting, users
of a VoIP-based phone system, for example, can
receive messages spoken onto their mailbox via
e-mail. Also new are the display and processing of
messages automatically scripted by Android apps.
At fairs like CallCenterWorld, special-interest audiences can test the potential of EML’s speech recognition systems for themselves. They can voice
their own messages and watch them being scripted
“live” immediately afterwards.
„Sprachnachrichten per E-Mail dank automatischer Transkription.”
“Voice mails via e-mail, thanks to automatic transcription.”
Mobiles Diktat und Sprachsuche
18
Durch die immer größere Verbreitung von Smart-
musste die Erkennungsinfrastruktur erweitert wer-
phones und Tabletcomputern ist die Spracherken-
den. Der Nutzer erwartet eine prompte und korrekte
nung noch näher an den Nutzer gerückt. Daher hat
Reaktion auf seine Äußerungen. Zu diesem Zweck
das EML zwei Applikationen auf Basis des Android-
wurde ein Mechanismus entwickelt, der eine „ge-
Betriebssystems entwickelt.
streamte“ Spracherkennung erlaubt. Noch während
Die „EML Sprachsuche“ gestattet es dem Nutzer,
der Nutzer spricht, kann er auf dem Display seines
Suchanfragen wie zum Beispiel eine Suche im Web
Geräts schon erste Ergebnisse der Spracherken-
via Sprache auszuführen. Die zweite Anwendung,
nung sehen.
„EML Voice“, ermöglicht es, beliebige Textnachrich-
Damit es auch anderen Anwendungen ohne großen
ten zunächst zu diktieren und dann mit dem bevor-
Aufwand möglich ist, auf den Spracherkennungsser-
zugten Medium, beispielsweise per SMS, E-Mail
vice des EML zuzugreifen, wurde der Mechanismus
oder Twitter, zu versenden.
mit einer einheitlichen Schnittstelle und einer Client-
Beide Anwendungen basieren auf EML-Technologie
Bibliothek versehen. Partnern steht diese Technolo-
und greifen auf die am EML entwickelte Serverin-
gie offen, um ihre eigenen Client-Anwendungen auf
frastruktur zurück. Damit allerdings die Sprache in
einfache Weise mit der EML-Spracherkennung zu
einer für den Nutzer angemessen erscheinenden
versehen.
Reaktionszeit in Text umgewandelt werden kann,
Mobile Dictation and Talk Search
19
With the increasing popularity of smart phones and
makes “streamed” speech recognition possible. As
tablet computers, speech recognition is becoming
the user speaks, he/she will see the initial results of
more user-oriented all the time. Accordingly, EML
the speech recognition process on the display.
has developed two applications based on the An-
To enable other applications to access the EML
droid operating system.
speech recognition service without too much trouble,
“EML Talk Search” enables users to carry out search
the mechanism was given a unified interface and a
requests, say, on the Web via speech. With “EML
client library. EML’s partners have unrestricted ac-
Voice” they can first dictate text messages of any
cess to this technology, which gives them a simple
kind and then transmit them via the medium of their
way of equipping their own client applications with
choice, for example text message, e-mail, or twitter.
EML´s speech recognition facilities.
Both applications rest on EML technology and operate on the basis of EML’s server infrastructure. For
speech to be turned into text within a period of time
a user would consider appropriate, the recognition
infrastructure had to be expanded. Users expect a
prompt and accurate response to their utterances.
To this end a mechanism has been developed that
„Textnachrichten diktieren und dann beispielsweise per SMS oder Twitter versenden.“
“First dictate text messages and then transmit them via SMS, or twitter.”
Im Zentrum: Der Mensch
20
Wir sind heute von zahlreichen technischen Gerä-
Zuhause kann der Nutzer an einem zentralen Ter-
ten umgeben, die in vielen modernen Haushalten
minal die Heizungssteuerung programmieren oder
installiert sind – von Beleuchtung und Rollläden bis
auf dem Nachhauseweg über das Mobiltelefon die
hin zur Klima- oder Alarmanlage. Diese Geräte ver-
Sauna vorheizen lassen. Für die Sprachsteuerung
fügen über Benutzerschnittstellen, die manchmal
von Haustechnik und Geräten gibt es mehrere Ein-
einfach, manchmal weniger einfach zu bedienen
gabemöglichkeiten: Entweder werden die bereits
sind und den Menschen oft überfordern.
vorhandenen Steuerungsterminals durch Mikrofone
Moderne Bussysteme zur Gebäudesteuerung, wie
erweitert, und die Spracherkennung läuft auf dem
zum Beispiel KNX/EIB, können die einzelnen Ge-
vorhandenen Terminal ab. Oder die Spracheingabe
räte über einen zentralen Server steuern. Dadurch
erfolgt über das Mikrofon eines Handys, Haustele-
bieten sich neue Möglichkeiten der Bedienung der
fons oder auch über im Raum platzierte Mikrofone.
Geräte, beispielsweise über einen Webbrowser
In diesem Fall läuft die Spracherkennung auf einem
oder ein Smartphone. Moderne Mobiltelefone sind
zentralen Server, der idealerweise auch die Gebäu-
meist auch mit einer Schnittstelle für drahtlose Netz-
desteuerung übernimmt.
werkverbindungen (W-LAN) ausgestattet und können so als eine ständig verfügbare Fernbedienung
genutzt werden.
Interactive User Interfaces
Modern homes are equipped with a large number
21
speech commands becomes a feasible and natural
of technical devices, from lighting and automatic
way of controlling devices in the house. Various
blinds to air conditioning and alarm systems. These
options are conceivable. Either the existing control
devices have user interfaces that are more or less
terminals are supplemented by microphones, and
easy to handle and sometimes overburden people.
speech recognition is dealt with by the terminal it-
With modern bus systems like KNX/EIB, many of
self, or spoken commands are passed on via the
the appliances can be connected to a home server
microphone of a mobile phone or a house phone, or
and controlled centrally, which significantly simpli-
by microphones installed in the house. In this case,
fies their use. Then they can be operated by way of
the speech recognition unit is located on a central
a web browser or a smart phone (Android or iPho-
server that ideally is also in charge of controlling the
ne). Most of today’s mobile phones are also equip-
devices in the home.
ped with a W-LAN interface and can thus be used as
a permanently available remote control unit.
At home, the user can program the heating system at a central terminal. On the way back home
after work, he/she can use a mobile phone to preheat the sauna. With this infrastructure, the use of
„Licht und Heizung durch Sprache steuern.”
“Using speech commands to control heating and lighting.”
Natürlich mit Technik umgehen
22
In der modernen Unterhaltungselektronik lösen sich
Sprachkommandos kann der Nutzer zwischen den
die Grenzen zwischen Unterhaltungsmedien und
einzelnen Titeln hin- und herwechseln und kann so
Computern zunehmend auf. Wurden Musik- und
jederzeit das gewünschte Lied aus der großen Zahl
Videotitel bisher in DVD-, CD- und Schallplatten-
von Musikstücken gezielt auswählen ̶ ohne sich
regalen aufbewahrt, stehen sie heute über digitale
erst durch Menüstrukturen arbeiten zu müssen.
Medienserver im heimischen Computernetz bereit.
Das EML nimmt die Herausforderung an, für fremd-
Der Zugriff und die Auswahl gestaltet sich jedoch
sprachige Musik- und Filmtitel zu jeder Zeit die
ungleich komplizierter: Der Nutzer muss zuerst
passende Aussprachevariante zu erzeugen, damit
mehrere Menüebenen „durchforsten“, bis er beim
das System die Äußerungen des Nutzers korrekt
gewünschten Interpreten, Musikstück oder Film
erkennen kann. Außerdem arbeiten die EML-Ent-
angelangt ist. Außerdem besteht ein solches Sys-
wickler daran, das komplexe Netzwerk von Geräten
tem zumeist aus mehreren, miteinander vernetzten
nutzerfreundlich zu gestalten. Ein erster Prototyp
Geräten. Der Nutzer kennt die technischen Details
eines „UPnP Controlpoints“ für Mobiltelefone – je-
dieser Geräte zumeist nicht – sie sollen einfach
doch noch ohne Spracherkennung – wurde für die
funktionieren!
Android-Plattform bereits veröffentlicht.
Hier bietet der Einsatz von Spracherkennung eine
elegante und schnelle Alternative. Durch einfache
Multimodal Voice User Interfaces
23
In present-day entertainment electronics, the bound-
sal without having to work your way through menu
aries between entertainment media and computers
structures.
are becoming more and more difficult to identify.
EML is presently engaging with the challenge of
Instead of shelves and shelves of DVDs, CDs, and
devising a speech recognition system that can pro-
LPs, we now have media servers with thousands of
duce the appropriate pronunciation variant for song
songs and videos filed away on the home computer
and movie titles in foreign languages. This way, the
network. The only trouble is that getting at them has
system can correctly interpret the user’s utteran-
become so much more complicated. Users have
ces at all times. EML’s developers are also working
to burrow their way through different menu levels
flat out to make the complex network of devices as
before they finally come up with the artist, song, or
user-friendly as they can. An initial prototype versi-
movie they were looking for. Most users have no
on of our UPnP control point for mobile phones (with-
idea of the technical niceties of these gadgets. They
out speech recognition as yet) has already been pu-
just want them to work!
blished for the Android platform.
This is where speech recognition provides a quick
and elegant solution. By just saying what you want,
you can switch back and forth between individual titles and select from the vast repertory at your dispo-
„Spracherkennung: eine elegante und schnelle Alternative.“
“Speech recognition provides a quick and elegant solution.”
Technik zur Sprache gebracht
24
Sprachsynthese-Systeme
(auch
Text-to-Speech
Dank neu eingefügter Werkzeuge im TTS-Editor ist
(TTS) genannt) setzen Text in Sprache um, zum
es jetzt möglich, einen Film in den Arbeitsplatz zu
Beispiel bei elektronischen Lesegeräten, Museums-
importieren und mittels der Spracherkennungsinfra-
führern oder Filmbeschreibungen für Blinde.
struktur zu analysieren. Dies ergibt zum einen eine
EML hat in den vergangenen Jahren einen TTS-
grobe Transkription des Filmes und zum anderen
Editor entwickelt, um die Erstellung von sogenann-
Hinweise auf eventuelle Pausen, in die eine Au-
ten Audiodeskriptionen zu ermöglichen. Dies sind
diodeskription eingefügt werden kann. Es ist auch
Informationen, die beispielsweise einem Film hin-
möglich, den Filmausschnitt zu betrachten, der zum
zugefügt werden, damit Blinde einen Eindruck einer
jeweiligen Abschnitt gehört, um die passende De-
Handlung oder Szenerie bekommen, die nicht mit
skription zu erstellen. Danach kann das gesamte
Dialogen belegt wurde.
Skript mit Hilfe der Sprachsynthese aufgenommen
Audiodeskriptionen müssen kurz genug sein, da-
schließend mit dem Film verknüpft zu werden. Bei
mit sie in die vorhandenen Zeitfenster passen, und
der Synthese kann der Nutzer sämtliche Funktionen
und aus dem TTS-Editor exportiert werden, um an-
gleichzeitig aussagekräftig genug, um die Szenerie
verwenden, die über den TTS-Editor zur Verfügung
zu beschreiben. Das stellt besondere Anforderun-
stehen, um auf möglichst intuitive Weise ein gutes
gen an diejenigen, die diese Deskriptionen erstellen.
Ergebnis zu erhalten.
Voice User Interfaces Output
25
Speech synthesis systems (also referred to as Text-
cess. It is now possible, for example, to upload a mo-
to-Speech (TTS)) convert text into speech, for in-
vie and pre-process it using the available speech re-
stance in electronic reading devices, museum gui-
cognition tools. This produces a rough transcrip-
des or movie descriptions for blind persons.
tion of the movie, and it also gives information about
Within the last few years, EML developed a TTS
pauses where audio descriptions can be inserted.
Editor to allow for the creation of so-called audio
The interface shows these pauses to the describer
descriptions. These are information that can be
and also enables him/her to watch the relevant seg-
added for example to movies so that blind persons
ment of the movie and subsequently create a suita-
will get a notion of the story line or of scenes with-
ble description.
out dialogues. Accordingly, audio descriptions are
As soon as the description has been completed, it
subject to a number of constraints. They have to fit
can be synthesized and exported from the editor to
into a specific time slot and at the same time be
be mixed with the movie. During synthesis, the de-
expressive enough to give a graphic impression of
scriber can draw upon all the functionalities supplied
the scenery. This calls for special skills on the part
by the TTS Editor in order to achieve excellent re-
of persons creating audio descriptions.
sults as intuitively as possible.
To make life easier for them, the TTS Editor has been
upgraded with tools designed to facilitate the pro-
„Audiodeskriptionen: Eine Hilfe für Sehbehinderte.”
“Audio descriptions help the blind to watch movies.”
Die Lücke schließen
26
Das EML will Nutzer im IT-Umfeld unterstützen, ihre
terverarbeitbar zu machen. Gemeinsam mit der
Fähigkeiten intuitiv und natürlich einzusetzen. Dazu
artec technologies AG entwickelte das EML ein
ist es notwendig, die Lücke zwischen Forschung
prototypisches,
und Produkt zu überbrücken.
korder-System zur automatischen Transkription
netzwerkbasiertes
Interview-Re-
Das EML-Forschungsteam besteht aus Wissen-
von Beratungsgesprächen, Konferenzen und Par-
schaftlern und Software-Entwicklern mit großer
lamentsdebatten. Im zweiten Projekt entwickelte
Erfahrung in den Bereichen Mensch-Technik-In-
das EML ein multilinguales Transkriptionssystem für
teraktion, Personalisierung von Anwendungen aus
Podcasts, Radio- und Fernsehbeiträge. Beide Pro-
Nutzerverhalten und automatischer Sprachverar-
jekte wurden im Oktober 2011 erfolgreich abge-
beitung. Mit dieser Expertise führt das EML auch
schlossen. Seit November 2011 ist das EML am
Forschungsprojekte durch. Im Jahr 2010 erteilte
internationalen und von der EU geförderten Projekt
das Bundesministerium für Wirtschaft und Techno-
„TransLectures“ beteiligt. Ziel ist die Erarbeitung
logie dem EML die Förderzusage für zwei Projekte
eines Systems, welches im Internet verfügbare Vi-
im Rahmen des Zentralen Innovationsprogramms
deos von Vorträgen und Vorlesungen automatisch
Mittelstand (ZIM).
transkribiert und übersetzt. Das Projekt mit Partnern
In beiden Projekten ging es darum, die Aufzeich-
aus Spanien, England, Frankreich, Slowenien und
nung von gesprochener Sprache einfacher wei-
Deutschland läuft bis Herbst 2014.
Closing the Gap
27
EML has set itself the task of helping users in the
work-based interview recorder system for automatic
IT environment to make natural and intuitive use
transcription of consultations, conferences, and par-
of their abilities. To that end, the gap between re-
liamentary debates. In the other project, EML has
search and end-product has to be bridged.
developed a multilingual transcription system for
The EML research team is made up of scientists and
podcasts and radio and TV broadcasts. Both pro-
software developers with long years of experience
jects were successfully concluded in October 2011.
in man-machine interaction, personalization of applications from user behavior, and automatic speech
Since November 2011, EML has been involved in
processing. EML also draws upon this expertise in
the international, EU-funded project “TransLec-
its research projects. In 2010, the Federal Ministry
tures.” Its objective is to elaborate a system for the
of Economics and Technology confirmed funding for
automatic transcription and translation of talks and
two EML projects in the framework of the ministry’s
lectures available on the Internet in video form. The
Central Innovation Program for Medium-Sized
project is conducted in conjunction with partners
Enterprises (ZIM).
from Spain, the UK, France, Slovenia, and Germany
Both projects are designed to facilitate further pro-
and will continue until fall 2014.
cessing of recorded speech. With artec technologies AG, EML has developed the prototype for a net-
„Die Lücke zwischen Forschung und Produkten schließen.”
“We are closing the gap between research and product development.“
Aufgezeichnet!
28
Aufgezeichnete Interviews, Konferenzmitschnitte
die die Transkripte nach bestimmten Stichwörtern
und Verhöre können zwar in Archiven gespeichert
durchsuchen und die Aufzeichnung sekundengenau
werden, wer das Material jedoch weiterverarbei-
abspielen. Das ursprünglich für Verhöre konzipier-
ten will, musste bisher die Gesprächsaufzeichnun-
te System lässt sich auch für Beratungsgespräche
gen von Hand transkribieren – ein mühsamer und
einsetzen, beispielsweise in Banken. Gut geeignet
langwieriger Prozess. In zwei Projekten hat das
ist es außerdem für Parlamentsdebatten oder Kon-
EML Prototypen entwickelt, um diesen Prozess mit
ferenzen. In einem zweiten Projekt entwickelte das
Sprachtechnologie zu vereinfachen. Gemeinsam
EML ein multilinguales Transkriptionssystem für
mit der artec technologies AG entwickelte das EML
Podcasts, Radio- und Fernsehbeiträge. Neben ei-
ein netzwerkbasiertes Interview-Rekorder-System.
nem Modul zur manuellen Kontrolle von automa-
Durch die Anwendung von sprecherunabhängiger
tisch generierten Transkripten wurde auch ein Mo-
Spracherkennung erstellt der digitale Interview-Re-
dul zur Anpassung der Modelle an neue Daten und
korder unmittelbar nach der Aufzeichnung vollauto-
Themen entwickelt.
matisch eine Schriftfassung des Gesagten. Dieses
Beide Projekte wurden durch das Zentrale Innovati-
Transkript
steht dann zur weiteren Analyse und
onsprogramm Mittelstand (ZIM) des Bundesministe-
Bearbeitung direkt zur Verfügung. Für die Analyse
riums für Wirtschaft und Technologie gefördert und
setzt das EML Methoden zur Inhaltsanalyse ein,
im Oktober 2011 erfolgreich abgeschlossen.
EML Technology for Digital Recording Systems
Recorded interviews, conference proceedings, and
keywords and play the recording with to-the-second
interrogations can be stored in archives. But up to
accuracy. The system was originally conceived for
now, anyone wanting to process this material further
interrogations but is equally suitable for consulta-
had to transcribe the records of these encounters
tions, for example in banks. It can also be used for
by hand, a lengthy and laborious business. In two of
conferences and parliamentary debates.
its projects, EML has developed prototypes desig-
In its other project in this field, EML has developed
ned to simplify this process via language technology.
a multilingual transcription system for podcasts
With artec technologies AG, EML has come up with
and radio and TV broadcasts. It features a mod-
a solution for a network-based interview recorder
ule for manual control of automatically generated
system.
transcripts and another for adapting the models to
By means of speaker-independent speech recogni-
new data and topics.
tion, the digital interview recorder produces a fully
Both projects were funded through the Central Inno-
automatic written version of what the participants
vation Program for Medium-Sized Enterprises (ZIM)
have said once the recording is over. This transcript
of the Federal Ministry of Economics and Techno-
is immediately available for further analysis and
logy and were successfully completed in October
processing. On the analytic side, EML uses content
2011.
analysis methods that scan through the transcript for
„Ein multilinguales Transkriptionssystem für Podcasts, Radio- und TV-Beiträge.“
“A multilingual transcription system for podcasts and radio and TV broadcasts.”
29
TransLectures: Hörsaal ohne Sprachgrenzen
30
Online-Multimediadatenbanken
wachsen
rasant
erreichen, forscht das EML an der Anpassung der
und fungieren mehr und mehr als reichhaltige Wis-
verwendeten Sprachmodelle an die Themen der
sensquellen. Eines der bekanntesten Webportale
Vorlesungen mit zusätzlichen Informationen wie
im Bildungsbereich ist VideoLectures.NET, wel-
zum Beispiel Folien. Sind alle Videos verschriftet
ches auf die Open-Source-Plattform „Matterhorn“
und übersetzt, können die Inhalte leichter durch-
aufsetzt und bereits über 14 000 Videos von Vor-
sucht, kategorisiert und analysiert werden. Für die
lesungen und Vorträgen zur Ansicht bereitgestellt
Transkription liegt der Fokus auf den Sprachen Spa-
hat. Durch die Verschriftung und Übersetzung der
nisch, Englisch und Slowenisch. Übersetzt werden
Videos könnten sie einem breiten internationalen
spanische und slowenische Beiträge ins Englische
Publikum sowie Menschen mit Behinderungen zur
sowie englische Beiträge ins Französische, Deut-
Verfügung stehen. Allerdings sind die meisten Vi-
sche, Slowenische und Spanische.
deos bisher weder verschriftet noch übersetzt.
Partner des Projekts sind neben dem EML Universi-
Das von der EU geförderte Projekt „TransLectures“
täten, Forschungsinstitute und Firmen aus Spanien,
arbeitet an technischen Lösungen, um die Videoin-
Frankreich, Slowenien, England und Deutschland.
halte automatisch zu transkribieren und in verschie-
„TransLectures“ startete im November 2011 und läuft
dene Sprachen zu übersetzen. Um eine ausreichende Qualität der Transkripte und Übersetzungen zu
bis Oktober 2014.
TransLectures: Obliterating Language Boundaries
Online multi-media databases are growing at a
tures by drawing on additional information such as
headlong pace and increasingly making a name for
foils or slides. Once all the videos have been scrip-
themselves as rich sources of knowledge. One of
ted and translated, it is easier to search, categorize,
the best-known web portals in the education sector
and analyze the content. For transcription purposes,
is VideoLectures.NET, established on the Matter-
the focus is on the languages Spanish, English, and
horn open-source platform. To date, it has laid on
Slovenian. There will be translations of Spanish and
over 14,000 videos of lectures and talks for view-
Slovenian lectures into English and of English lec-
ing. Scripting and translation of these videos would
tures into French, German, Slovenian, and Spanish.
make them available to a much wider international
Alongside EML, the partners to the project are uni-
audience and to disabled people. Most of them,
versities, research institutions, and firms from Spain,
however, have been neither scripted nor translated.
France, Slovenia, the UK, and Germany. “TransLec-
The EU-funded project “TransLectures” is working
tures” started in November 2011 and will continue
on technical solutions for the automatic transcription
until October 2014.
of video content and translation into various languages. To assure adequate transcription and translation quality, EML is investigating the adaptation of
the language models used to the topics of the lec-
„Videoinhalte automatisch transkribieren und in verschiedene Sprachen übersetzen.“
“Automatic transcription of video content and translation into various languages.”
31
Beratung, Service und Hilfe
32
Sprechen zu lernen ist kinderleicht, Sprachtechno-
in ihre eigenen technischen Abläufe zu integrieren.
logie zu beherrschen hingegen nicht. Dies erfordert
Als weiteren Service bietet das EML die Entwicklung
eine Kombination aus linguistischer, informatischer
von Sprachmodellen für „neue“ Sprachen an. Wenn
und ingenieurwissenschaftlicher Kompetenz – eine
das Sprachmodell an die entsprechende Domäne
nicht alltägliche Kombination.
angepasst ist, funktioniert die Sprachtechnologie
Die European Media Laboratory GmbH bietet spezi-
sprecherunabhängig und robust in wechselnden
elle Workshops für Sprachspezialisten an, um sie im
Umgebungen.
Umgang mit den Sprachtechnologie-Werkzeugen
Die Beratungsleistungen des EML umfassen darü-
zu schulen. Die Workshop-Teilnehmer lernen, ein
ber hinaus auch die kundenspezifische Anpassung
Sprachmodell für eine „neue“ Sprache zu entwi-
eines Sprachmodells an eine neue Domäne.
ckeln, ein Sprachmodell auf eine neue Anwendung
anzupassen oder Sprachtechnologie in die eigene
Anwendung zu integrieren.
Im Jahr 2011 haben mehrere SprachtechnologieUnternehmen diese Möglichkeit genutzt und in einem EML-Workshop gelernt, Sprachmodelle zu entwickeln und die EML-Sprachtechnologiewerkzeuge
Consulting, Services and Help
33
Learning to talk is child’s play, mastering speech
Another service EML provides is the development
technology is not. It requires a combination of skills
of language models for “new” languages. When the
ranging from linguistics and computer science to
language model has been adapted to the relevant
engineering – not exactly a very common combina-
domain, the speech technology automatically ad-
tion. The European Media Laboratory GmbH offers
apts to the speaker and maintains its robustness in
special workshops for language specialists to train
changing surroundings.
them in working with speech technology tools. Here
The range of services offered by EML also encom-
participants learn how to develop a language model
passes client-specific adaptation of a language mo-
for a “new” language, to adapt language models to
del to a new domain.
new applications, or to integrate speech technology
into an application of their own.
In 2011 a number of speech technology enterprises took advantage of this opportunity to learn how
to develop language models and integrate EML
speech technology tools into their own technical
processes.
„Sprachmodelle für ,neue‘ Sprachen und Workshops für Sprachspezialisten.“
“Language models for ‘new‘ languages and workshops for speech specialists.”
Partner-Netzwerk | Partner Network
34
Die European Media Laboratory GmbH verfügt über
The European Media Laboratory is part of a con-
ein ständig wachsendes, internationales Netzwerk
stantly growing international network of partners
von Partnern in den Bereichen Sprachnachrichten,
in the fields of voice messaging, location-based
ortsbasierte Dienste, Inhaltsanalyse, Medientran-
search, speech analytics, media transcription, and
skription und „Assisted Living“.
assisted living.
Die Zusammenarbeit reicht vom Einsatz der EML-
Collaborations range from the use of EML speech
Sprachtechnologie zur Erweiterung von Mobilfunk-
technology to enhance services in the mobile phone
diensten bis hin zu Medientranskriptionen, zum
area to media transcription of court proceedings or
Beispiel von Gerichtsverhandlungen oder Fernseh-
television broadcasts.
sendungen.
Partners operating on an international scale use the
International agierende Partner nutzen dabei die
collaboration opportunity to transfer EML solutions
Möglichkeit, die EML-Lösungen auch in andere
into further languages.
Sprachen zu übertragen.
„Ein internationales, ständig wachsendes Netzwerk.“
“A constantly growing international network of partners.“
35
Tim Mois & Thilo Salmon
nections for private individuals and supremely func-
Geschäftsführer, sipgate GmbH
tional, low-cost cloud telephony solutions for com-
„Mit mehreren Hunderttausend Kunden in Deutsch-
panies to VoIP hardware and services. Thanks to
land, Österreich und Großbritannien sind wir einer
EML language technology we are the only supplier
der größten VoIP-Anbieter Europas. Vom grundge-
in Germany to be able to offer our customers a spe-
bührenfreien Telefonanschluss für Privatleute über
cial voicemail service.”
funktions- und kostenüberlegene Cloud-Telefonielösungen für Firmen bis zu VoIP Hardware und Ser-
Ingo Hoffmann
vices decken wir das gesamte Spektrum der Inter-
Geschäftsführer, artec technologies AG
nettelefonie ab. Durch die EML-Sprachtechnologie
„Wir entwickeln und produzieren innovative Software-
können wir als einziger Anbieter in Deutschland un-
und Systemlösungen für die Übertragung, Auf-
seren Kunden einen besonderen Voicemail-Service
zeichnung und Auswertung von Video-, Audio- und
bieten.“
Metadaten in Netzwerken und im Internet. Unsere
“With several hundred thousand customers in Ger-
XentauriX Produktplattform wird zur netzwerk-ba-
many, Austria, and the UK, we are one of the big-
sierten Aufzeichnung und Übertragung von TV- und
gest VoIP suppliers in Europe. We cover the entire
Hörfunksendungen sowie für IPTV Applikationen
range of Internet telephony, from free phone con-
verwendet. Gemeinsam mit dem EML arbeiten wir
Tim Mois & Thilo Salmon
Ingo Hoffmann
Partner-Netzwerk | Partner Network
36
an digitalen Interview-Rekordern mit sprecherunabhängiger Spracherkennung.“
bereichen der Marketingkommunikation, Medienproduktion, Syndikation und des Wissenstransfers
“We develop and produce innovative software and
erfolgreich zu managen. Die EML-Sprachtech-
system solutions for the transmission, recording,
nologie gibt uns nun die Möglichkeit, unsere Soft-
and evaluation of video, audio, and meta-data in net-
ware mit transkribierten Audio- und Videodateien
works and on the Internet. Our XentauriX production
in höchster Qualität zu erweitern und diese Daten
platform is used for the network-based recording
leicht auffindbar und vermarktbar zu machen.“
and transmission of TV and radio broadcasts and for
“Since 1993 we have been successfully deploying
IPTV applications. In conjunction with EML we are
software solutions that enable our customers to ma-
working on digital interview recorders with speaker-
nage their multi-media data in the important sectors
independent speech recognition.”
marketing communication, media production, and
sales and knowledge transfer. With EML speech
Herbert Wirth
technology, we are in a position to significantly en-
Geschäftsführer, Picturesafe GmbH
hance our software. It now encompasses high-qua-
„Seit 1993 entwickeln wir Software-Lösungen, die
lity transcribed audio and video data and can make
unsere Kunden in die Lage versetzen, ihre multime-
this data easily retrievable and marketable.”
dialen Daten in den bedeutenden Unternehmens-
Herbert Wirth
37
Messen und Veranstaltungen
38
CallCenterWorld
Tag der offenen Tür
Das EML war auf der CallCenterWorld in Berlin im
Im Rahmen der „Innovation Stars“-Kampagne öff-
Februar 2011 zum zweiten Mal mit einem eigenen
nete das EML im April 2011 seine Pforten für das
Stand vertreten. Die CallCenterWorld ist die größ-
breite Publikum. Unter dem Motto „Technik zur
te europäische Messe für Call Center und Custo-
Sprache gebracht“ zeigten die EML-Mitarbeiter am
mer Management. In Berlin stellte das EML seine
Firmensitz in der Heidelberger Villa Reiner, was
„Speech Analytics Platform“ vor. Die Messebesucher
Sprachtechnologie leisten kann. Die Besucher er-
konnten selbst „live“ testen, wie ihre Anrufe durch
lebten „live“, wie ihre Anrufe zu SMS wurden. Sie
automatische Transkription zu Text werden. Au-
konnten Haustechnik mit Sprache steuern, etwa um
ßerdem klassifiziert die Transkriptionslösung die
die Rollläden zu schließen oder Licht anzuschalten.
Anrufe automatisch nach Kategorien, Mustern und
Auch die automatisch erzeugten Untertitel für TV-
Gesprächsmerkmalen, analysiert die Anrufe nach
Nachrichtensendungen erweckten bei den Gästen
neu auftretenden Begriffen und verknüpft diese mit-
großes Interesse.
einander. Die Resonanz bei Besuchern und Medien
war durchgehend positiv.
Fairs and Events
39
CallCenterWorld
Open Day
In February 2011 EML was back for the second time
In the framework of the “Innovation Stars” campaign,
with a stand of its own at CallCenterWorld in Berlin.
EML opened its doors to the public at large in April
It is the biggest European trade fair for call centers
2011. The motto was “Giving Technology a Voice.”
and customer management. In Berlin EML show-
Under that heading the staff of EML demonstra-
cased its “speech analytics platform.” Visitors were
ted what language technology is capable of to an
able to check out “live” how their phone calls were
interested audience in the EML offices in the Villa
transformed into text by automatic transcription. In
Reiner, Heidelberg. Visitors experienced “live” how
addition, the transcription solution automatically
their phone calls were transformed into text messa-
classifies the calls in accordance with categories,
ges. They were given the run of the building to see
patterns, and discourse features, analyzes them for
how mod cons can be made to obey human speech
any new concepts turning up, and links these with
and spent hours raising and lowering the shutters
one another. Visitors and media were equally en-
and turning the lights on and off. Their imagination
thusiastic.
was also stimulated by the automatic subtitles for
TV newscasts.
EML: Von den Anfängen bis heute
40
Gründung der Leiner & Wolff GmbH
1997 Gründung des EML in der Villa Bosch
1999 Daten von der tesa-Rolle: Start des „tesa-
2005
EML leitet Koordinationsprojekt für den „D-Grid“-
ROM“-Projekts, Kooperation mit der Bei-
Forschungsverbund; Erstes „Heidelberger Innova-
ersdorf
„C-Star“-Forschungsprojekt
tionsforum“ im Tagungszentrum Studio Villa Bosch
demonstriert ein computerbasiertes Dolmet-
2006 „Kick-Off“ von „Heidelberg Mobil“, Deutschlands
schersystem für 6 Sprachen und tragbare
erstem WLAN-basierten Stadtinformationsportal
AG;
elektronische
Touristenführer;
2000 Mitarbeit
in
Großprojekten
für mobile Geräte
„Goldener
Computer“-Preis für tesa als Datenspeicher
des
2007 Ausgründung der Heidelberg Mobil International
GmbH, Neuausrichtung von ortsbasierten Syste-
BMBF
men hin zur Sprachtechnologie
(Smartkom, EMBASSI)
2001 Start des EU-Projekts „Crumpet“ zu ortsba-
2008
CeBIT
sierten Informationsportalen
2002 Ausgründung der tesa scribos GmbH; Filmportrait des EML in „nano“ auf 3sat
2003 Präsentation des „Hortus Palatinus“ in einer
digitalen Rekonstruktion im Kurpfälzischen
Museum Heidelberg
Haustechnik mit Sprache steuern: EML auf der
2010
Messestand auf der CallCenterWorld: Automatische Transkription und Analyse von Anrufen; Umzug des EML in die Villa Reiner, Schloss-Wolfsbrunnenweg 35
2012 15 Jahre EML
EML Historical Review
41
dens, at the Kurpfälzisches Museum Heidelberg;
1997 Foundation of EML at the Villa Bosch
Establishment of the Leiner & Wolff GmbH
1999 Data from adhesive tape: start of the “tesaROM” project, cooperation with Beiersdorf
2005
EML masterminds coordination project for the “DGrid” integrated research network; First “Heidel-
AG; “C-Star” research project demonstrates
computer-based interpreting system for 6
berg Innovation Forum” at the Villa Bosch Confe-
languages and a portable electronic tourist
rence Center
guide; “Golden Computer” prize for tesa ad-
2006
vices
2000 Cooperation on major projects run by the
Federal Ministry for Research and Education
2007 Spin-off company “Heidelberg Mobil International
GmbH” established, adjusting local-based sys-
(Smartkom, EMBASSI)
tems to language technology
2001 Start of the EU project “Crumpet” on localbased information portals
2008 Telling mod cons what to do: EML at the CeBIT
exhibition
2002 Spin-off company “tesa scribos GmbH”; EML
featured on TV program “nano” (3sat)
2003 Presentation of the “Hortus Palatinus,” a digital reconstruction of the former Castle gar-
Kick-off for “Heidelberg Mobil,” Germany’s first
WLAN-based city information portal for mobile de-
hesive tape as data carrier
2010
EML
stand
at
CallCenterWorld:
automatic
transcription and analysis of phone calls
2012 15 years EML
Erfolgreicher Transfer | Successful Transfer
42
Seit 2005 veranstaltet die EML European Media La-
Starting in 2005 the EML European Media Labora-
boratory GmbH in Kooperation mit der MFG Innova-
tory GmbH, in cooperation with MFG Baden-Würt-
tionsagentur Baden-Württemberg das „Heidelber-
temberg, organizes the “Heidelberg Innovation
ger Innovationsforum“. Bei dieser Veranstaltung
Forum”. This is an event where inventors can pitch
können Forscher ihre Ideen in einer sehr kompakten
their ideas to VCs and decision makers in industri-
Form vor VCs und Entwicklungsleitern von Firmen
al R&D in a very compact form. In total more than
präsentieren. Seit Beginn der Veranstaltungsreihe
250 business ideas were presented; 20% resulted
wurden mehr als 250 Geschäftsideen vorgestellt; in
in actual technology transfer. Of those 44% were
20% der Fälle kamen konkrete Transfergeschäfte
joint development projects, 39% were spin-offs, and
zustande. Von diesen entfielen 44% auf die Finan-
17% were licensing agreements.
zierung von Entwicklungsprojekten, 39% auf Spin-
In 2011 the Heidelberg Innovation Forum was nomi-
offs und 17% auf Lizenzabkommen.
nated for the Diesel Medal.
Im Jahr 2011 wurde das Heidelberger Innovationsforum für die Diesel-Medaille nominiert.
Impressum / Imprint
EML European Media Laboratory GmbH
Villa Reiner
Schloss-Wolfsbrunnenweg 35
D-69118 Heidelberg
Kontakt/Contact
Dr. Siegfried Kunzmann
R & D Manager
Phone: +49-6221-533206
Fax: +49-6221-533298
kunzmann@eml.org
Managing Partner (geschäftsführender Gesellschafter)
Dr. h. c. Dr.-Ing. E. h. Klaus Tschira
Scientific and Managing Director (Geschäftsführer)
Prof. Dr.-Ing. Dr. h.c. Andreas Reuter
HRB 335719, Amtsgericht Mannheim
All rights reserved.
© EML European Media Laboratory GmbH 2012
Images: EML; Bernhard Kreutzer; Rüdiger Nehmzow; artec technologies; Picturesafe;
MFG Baden-Württemberg; Fotolia: Arahan, kabliczech, psdesign1, pressmaster
www.eml-development.de