Eine Sprachassistenzplattform
»Made in Germany«
Werden Sie assoziierter Partner dieses Projekts
Eine Partnerschaft bietet Ihnen die Möglichkeit, Ihre marktspezifischen Anforderungen an ein natürlichsprachliches Assistenzsystem zu realisieren.
Sprachassistenten sind eine Kerntechnologie für die Mensch-Maschine-Kommunikation und bieten einen natürlichsprachlichen Zugang zu Produktangeboten und Dienstleistungen. Der Markt für Sprachassistenzlösungen wird bisher von US-amerikanischen und asiatischen Unternehmen dominiert. Der Bedarf der deutschen Industrie und Wirtschaft an Sprachassistenzlösungen ist enorm, besonders hinsichtlich Datensouveränität besteht die Notwendigkeit, personenbezogene Daten besser zu schützen und sicher auszutauschen. Mit einer deutschen Sprachassistentenlösung ist dies möglich, da europäische Standards der Datensicherheit umgesetzt werden. Gleichzeitig wird ein neuer Grad der Qualität in der Mensch-Maschine-Kommunikation möglich, der weit über die semantischen Fähigkeiten aktueller Systeme hinausgeht und dadurch um einiges nutzerfreundlicher wird.
Hierzu haben sich mit dem Fraunhofer IIS und dem Fraunhofer IAIS institutsübergreifend Experten aus den Bereichen Sprachsignalverarbeitung, Sprachverstehen, künstlicher Intelligenz und Software-Engineering zusammengeschlossen. Das Fraunhofer IIS hat auf dem Gebiet der akustischen Signalverarbeitung bereits eine weltmarkführende Position inne. Die Technologie ist Grundlage für hohe Zuverlässigkeit und Robustheit von Sprachverarbeitung. Das Fraunhofer IAIS hat führende Algorithmen im Bereich der Spracherkennung und der automatisierten Beantwortung von Fragen entwickelt. Ziel ist es, diese technologische Führerschaft weiter auszubauen und in eine skalierbare, mehrsprachige und offene Sprachassistentenplattform zu integrieren. Fraunhofer Technologie kann dann unternehmensspezifisch angepasst werden und die Datensouveränität von Industrie und Wirtschaft unterstützen.
Fraunhofer erarbeitet im Rahmen des Innovationswettbewerbs »Künstliche Intelligenz als Treiber für volkswirtschaftlich relevante Ökosysteme« ein Konzept für das groß angelegte Forschungs- und Entwicklungsprojekt SPEAKER unter Förderung des Bundesministeriums für Wirtschaft und Energie.
Überblick
Ziel des SPEAKER-Projektes ist der Aufbau einer führenden Sprachassistenzplattform „Made in Germany“ für Business-to-Business-Anwendungen (B2B). Die Plattform soll offen, modular und skalierbar sein und Technologien, Dienste und Daten über Serviceschnittstellen bereitstellen. Die SPEAKER-Plattform wird eingebettet in ein umfassendes Ökosystem bestehend aus Großindustrie, mittelständischen Unternehmen, Start-Ups und Forschungspartnern, die eine hohe Innovationsfähigkeit sicherstellen. Der Aufbau der Plattform und des Ökosystems wird durch das Fraunhofer Institut für Intelligente Analyse- und Informationssysteme (IAIS) und das Fraunhofer Institut für Integrierte Schaltungen (IIS) gewährleistet, die bereits über entsprechende Technologien und Erfahrungen im Bereich Sprachassistenztechnologien, Plattformen (z. B. AI4EU – European AI Plattform on Demand) und weltweite Vermarktungsstrategien für Sprach- und Audiotechnologien (z. B. MP3) verfügen.
Die beiden Fraunhofer Institute IIS und IAIS haben Workshops mit zahlreichen Unternehmen durchgeführt, um Anforderungen, Hemmnisse und Handlungsempfehlungen zu erarbeiten, die als Grundlage für die Konzeption und den Aufbau der Plattform dienen. Die wichtigsten Argumente für eine Sprachassistenzplattform „Made in Germany“ sind Datenschutz, Sicherheit, Privacy und Vertrauen. Besonders durch die kürzlich gemeldeten Vorfälle bei der nicht DSGVO-konformen Gesprächsauswertung bei Google, Alexa und Siri ist dieser Missstand offenkundig geworden. Dies gilt in noch stärkerem Maße für das B2B-Umfeld, in dem unternehmensinterne Daten geschützt werden müssen. Daher adressiert die SPEAKER-Plattform die Themen Daten- und Technologiesouveränität auf diesem wichtigen Zukunftsfeld der Mensch-Maschine-Kommunikation. Darüber hinaus wurden Anforderungen zu den Themen domänenspezifische Anpassbarkeit, Flexibilität bei der Auswahl und Nutzung der Module, offene Schnittstellen zu Datenbanken und Anwendungen, Multilingualität, Paralinguistik (z. B. Erkennung von Emotionen in Stimmlagen) und Beteiligung sowie Aufbau einer Nutzergemeinschaft identifiziert. Parallel zu den Anforderungserhebungen wurden aktuelle Marktstudien ausgewertet, die ein starkes Marktwachstum von Sprachassistenten prognostizieren. Durchschnittlich wird eine 25-prozentige jährliche Zunahme von Geräten mit Sprachassistenzfunktion in den kommenden vier Jahren erwartet.
Ziel der SPEAKER-Plattform ist es, offene, transparente und sichere Sprachassistenzanwendungen bereitzustellen. Dazu gilt es, führende Technologien der Audiovorverarbeitung, Spracherkennung, Natural-Language-Understanding (NLU), Question Answering (QA), Dialogmanagement und Sprachsynthese mittels künstlicher Intelligenz (KI) und Machine Learning zur einfachen und unkomplizierten Nutzung verfügbar zu machen. Aus diesen Schlüsselmodulen werden industrielle Sprachassistenzanwendungen entwickelt, die wiederum über die Plattform in Form von fertigen Skills anderen Marktteilnehmern zur Verfügung gestellt werden können.
Im Vergleich zu bestehenden Sprachassistenzumgebungen (Alexa, Google Assistant) sind folgende wichtigen Eigenschaften gewährleistet und hervorgehoben: Modularität, Datenschutz und Privacy, Offenheit hinsichtlich Technologien, Vernetzung und Verbreitung durch ein offenes Ökosystem und Innovationsfähigkeit. Außerdem wird Datenvielfalt für B2B-Anwendungen durch die Bereitstellung einer Datenplattform und Einbeziehung von Daten- und Anwendungspartnern ermöglicht. Über die Infrastruktur der SPEAKER-Plattform wird ein Austausch von Daten ermöglicht (Community-Ansatz). Außerdem besteht über internationale Netzwerke (MetaNet, European Language Grid) der Zugang zu zahlreichen Sprachkorpora. Die SPEAKER-Plattform wird industrielle Skalierungsmechanismen (z.B. Docker, Kubernetes, Redis) nutzen. Hierzu arbeitet SPEAKER mit dem deutschen Unternehmen Cloud&Heat zusammen. Diese Kooperation ermöglicht uns neben der Gewährleistung von Skalierbarkeit auch Datensicherheit nach DSGVO-Grundsätzen sicherzustellen. Nach Übergabe der Plattform an die Betreibergesellschaft, wird der öffentliche Start der Plattform eine frühzeitige Etablierung der Plattform ermöglichen und so SPEAKER nachhaltig aufstellen. SPEAKER wird zu vergleichbaren Kosten wie etablierte Plattformen angeboten werden und sich vor allem auf B2B-Anwendungen fokussieren.
Konsortialführer
Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.
Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.
Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.
Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.
Verbundpartner
Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.
Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.
Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.
Assoziierte Partner
Veranstaltungen
Aktuelle Events
Vergangene Events
Hub.Berlin am 18. und 19.04.2021 in Berlin
Fachseminar „Smart Living – intelligent, vernetzt, energieeffizient“
am 16. und 17.09.2020 in Nürnberg
Hannover Messe 2020 vom 13.07. bis zum 27.07.2020 in Hannover
1st International Workshop on Language Technology Platforms (IWLTP 2020)
am 16.05.2020 in Marseille
Voice Connected Business am 14. und 15.05.2020 in Frankfurt
Start der Umsetzungsphase des SPEAKER Projekts am 01.04.2020
ITG-Fachgruppentreffen „Signalverarbeitung und maschinelles Lernen“
am 06.03.2020 in Sankt Augustin
ITG Workshop Sprachassistenten am 03.03.2020 in Magdeburg
Einreichung der Gesamtvorhabensbeschreibung am 15.10.2019
Eröffnungsfeier Forum Digitale Technologien & Bekanntgabe der Gewinner des
KI-Innovationswettbewerbs am 19.09.2019 in Berlin
Vorlesungsreihe am Fraunhofer IIS zu Natural Language Processing mit Dr. Xin Wang
am 13.09.2019 in Erlangen
Abgabe des Umsetzungskonzepts für die Durchführungsphase am 16.08.2019
Projektinterne Workshops
30.07.2020 Voice UX Workshop
08.10.2020 Erstes Meilensteinmeeting
13.11.2020 Data Annotation Workshop
26.11.2020 Plattform Workshop
09.12.2020 Modell-Workshop Spracherkennung
23.02.2021 Wikispeech-Workshop
04.03.2021 Workshop Dialogmanager, Dialogeditor und NLU
16.03.2021 Multimodality Workshop
18.03.2021 Workshop Text-to-Speech
15.04.2021 Zweites Meilensteinmeeting
Legende:
Fördergeber, Projektträger, Verbundpartner | Verbundpartner & assoziierte Partner | Verbundpartner
Publikationen
WoS - Open Source Wizard of Oz for Speech Systems
A Comparison of Recent Neural Vocoders for Speech Signal Reconstruction
Segmenting multi-intent queries for spoken language understanding
Privacy in Speech Interfaces
User Experience of Alexa, Siri and Google Assistant when controlling music – comparison of four questionnaires
User Experience of Alexa when controlling music – comparison of face and construct validity of four questionnaires
Aufbau einer führenden Sprachassistenzplattform 'Made in Germany'
Message Passing for Hyper-Relational Knowledge Graphs
Language Model Transformers as Evaluators for Open-domain Dialogues
Towards an interoperable ecosystem of AI and LT platforms: A roadmap for the implementation of different levels of interoperability
User Preference and Categories for Error Responses in Conversational User Interfaces
Crowdsourcing Ecologically-Valid Dialogue Data for German
New Domain, Major Effort? How Much Data is Necessary to Adapt a Temporal Tagger to the Voice Assistant Domain
Perceptions and reactions to conversational privacy initiated by a conversational user interface
Success is not Final; Failure is not Fatal – Task Success and User Experience in Interactions with Alexa, Google Assistant and Siri
Design Implications for Human-Machine Interactions from a Qualitative Pilot Study on Privacy
Fraunhofer - A Lightweight Neural TTS System for High-quality German Speech Synthesis
Not So Fast, Classifier – Accuracy and Entropy Reduction in Incremental Intent Classification
Small Data in NLU: Proposals towards a Data-Centric Approach
Möchten Sie assoziierter Partner werden
oder haben Sie Fragen zum Projekt?
Nehmen Sie gerne mit mir direkt per Telefon Kontakt auf
oder nutzen Sie eine der weiteren Kontaktmöglichkeiten:
E-Mail: johannes.fischer@iis.fraunhofer.de oder speaker@iais.fraunhofer.de
Johannes Fischer
+49 (0) 9131 / 776 – 6297