Skip to content
4 min read

Was ist ein Large Language Model (LLM) und wie kann es im Hinblick auf Datenschutz sicher genutzt werden?

Featured Image

Große Sprachmodelle (engl. Large Language Models (LLM)) sind ein leistungsfähiges Werkzeug und spätestens durch die Einführung von ChatGPT von OpenAI im November 2022 zu einem der Hot-Topics in der Welt der Technologie geworden. 

 

ChatGPT = Ein großes Sprachmodell, basierend auf Künstlicher Intelligenz (KI), mit Hauptzweck, menschenähnliche Texte zu verstehen und je nach Eingabeaufforderung zu generieren. Das Modell kann auf Textdaten bis September 2021 zugreifen und in verschiedenen Sprachen und über verschiedene Themen hinweg Informationen und Antworten bereitstellen.

 

 

Diese Modelle verändern die Art und Weise, wie mit Texten und Informationen interagiert werden kann, fundamental. Sie haben die Fähigkeit, natürliche Sprache zu verstehen, zu verarbeiten und zu generieren. Dadurch entstehen breite Anwendungsfälle, wie beispielsweise die Beantwortung komplexer Aufgaben, Unterstützung und Generierung kreativer Texte und sogar das Programmieren von Software. Ihre Informationen entnehmen die Large Language Models aus riesigen Datensätzen.

 

Definition Large Language Model (LLM): LLMs sind fortschrittliche KI-Algorithmen, die auf neuronalen Netzwerken basieren und speziell für die Verarbeitung natürlicher Sprache entwickelt wurden. Die Modelle werden durch maschinelles Lernen trainiert, indem sie riesige Mengen an Textdaten analysieren und Muster in der Sprache erkennen. Weiter werden sie auf bestimmte Aufgaben und Anwendungsfälle spezialisiert.

 

Diese Large Language Models zählen zu den aktuell bekanntesten:

  • ChatGPT-3 und ChatGPT-4 von OpenAI 
  • LaMDA und PaLM von Google
  • Gopher von DeepMind

 

Wie funktionieren Large Language Models?

Die Funktionsweise von LLMs beruht auf zwei Hauptkomponenten: Dem Training und der Anwendung.

Training: Um ein Large Language Model zu trainieren, benötigt man riesige Mengen an Datensätzen. Diese Daten werden dem Modell vorgestellt, sodass es Muster, Syntax, Semantik und Kontext in der Sprache lernen und erkennen kann. Dieser Trainingsprozess kann Wochen oder sogar Monate dauern und erfordert leistungsstarke Computerressourcen.

Anwendung: Nach dem Training kann das Sprachmodell für verschiedene Aufgaben eingesetzt werden. Es kann Texte generieren, Übersetzungen durchführen, Fragen beantworten, Texte zusammenfassen und vieles mehr. Die Fähigkeit, menschenähnliche Texte zu produzieren, macht das Modell äußerst vielseitig in der Anwendung.



Einsatzmöglichkeiten von Large Language Models

LLMs haben eine breite Palette von Anwendungsmöglichkeiten. Wichtig zu beachten ist hierbei, dass diese zwar sehr nützlich sein können, datenschutzrechtliche und ethische Aspekte jedoch stets zu berücksichtigen sind.

Hier einige Beispiele für Anwendungsfälle:

1. Natürliche Sprachverarbeitung (NLP):
  • Textgenerierung: LLMs können menschenähnliche Texte u.a. für Artikel, Berichte und Geschichten generieren.
  • Übersetzungen: Sie können Texte zwischen verschiedenen Sprachen übersetzen.
  • Sentimentanalyse: LLMs können analysieren, ob ein gegebener Text positiv, negativ oder neutral ist.
  • Zusammenfassungen: Sie können lange Texte zusammenfassen und die wichtigsten Informationen extrahieren.

 

2. Kundenservice und Chatbots:
  • Automatisierter Kundenservice: LLMs können Kundenanfragen beantworten und häufig gestellte Fragen behandeln.
  • Chatbots: Sie können in der Kundenkommunikation eingesetzt werden, um menschenähnliche Interaktionen durchzuführen.



3. Gesundheitswesen:
  • Medizinische Berichte: Sie können bei der Erstellung von medizinischen Berichten und Dokumentationen unterstützen.
  • Gesundheitsberatung: LLMs können allgemeine Gesundheitsfragen beantworten und Informationen zu Gesundheitsthemen bereitstellen.



4. Finanzwesen:
  • Finanzberichte: LLMs können Finanzberichte analysieren und erstellen.
  • Finanzberatung: Sie können Finanzfragen beantworten und Informationen zu Investitionen und Finanzmärkten liefern.




Anwendungsfall “Fragetyp Liste” in der VITAS Plattform für virtuelle Telefonassistenten

Im neuesten Update der VITAS Plattform steht Kund:innen nun der intelligente Fragetyp Liste zur Verfügung. Dieser kann an jeder Stelle des Gesprächsverlaufes zwischen dem Telefonassistenten und den Anrufenden eingefügt werden, um bestimmte Informationen abzufragen. In der Liste können bis zu 15 Antwortmöglichkeiten hinterlegt werden, die die Anrufenden geben können.

 

Bei diesem Fragetyp wird das Large Language Model von OpenAI verwendet, um die Erkennung der Antworten der Anrufenden noch besser zu erkennen und dadurch den Gesprächsfluss flexibler und natürlicher zu gestalten. 

 

Beispiel für einen Gesprächsverlauf in der Gesundheitsbranche mit dem Fragetyp Liste:
(Hinterlegt wurden häufige Krankenkassen, wie beispielsweise die TK, IKK und AOK)

Telefonassistent: Bei welcher Krankenkasse sind Sie versichert?
Patient: Ich bin bei der Allgemeinen Ortskrankenkasse.

 

Dank der verbesserten Fähigkeit durch OpenAI, natürliche Sprache zu verstehen und dabei auf riesige Datensätze zugreifen zu können, versteht der VITAS Telefonassistent bei der gegebenen Antwort, dass es sich um die AOK handelt. Anrufende müssen also nicht mehr exakt das hinterlegte Schlüsselwort nennen, damit der Telefonassistent dieses zuordnen kann.

 

Weitere Anwendungsbeispiele für diesen neue Fragetyp sind z.B.: Mitarbeitende, Abteilungen oder Standorte 

 

Wie gewährleistet VITAS dabei die Sicherheit der Daten?

Ein besonderes Anliegen ist es uns, dass Kund:innen die volle Entscheidungsfreiheit haben, wie und wo ihre Daten verarbeitet werden. Deshalb ist es grundsätzlich möglich, die VITAS Plattform ganz ohne ausländische Drittanbieter zu nutzen. Damit wird gewährleistet, dass alle Daten nur auf deutschen Servern verarbeitet werden.

Bestimmte Funktionen, bei denen auf externe Anbieter gesetzt wird, wie etwa der Fragetyp Liste, sind entsprechend in der VITAS Plattform gekennzeichnet. Kund:innen können somit jederzeit frei entscheiden, ob sie von der Funktion Gebrauch machen möchten und dem Einsatz dieser Unterauftragnehmer zustimmen.

Wichtig zu nennen ist außerdem, dass die Datenübertragung an OpenAI sehr kontrolliert stattfindet. Das heißt, dass keine Stimmaufzeichnung, sondern lediglich der Text der gegebenen Antworten übertragen wird. OpenAI speichert die Daten außerdem nur maximal 30 Tage und verwendet diese nicht zu Trainingszwecken, sondern überprüft damit lediglich einen möglichen Missbrauch der Anwendung. Nach Ablauf der 30 Tage werden die Daten vollständig gelöscht.

 

Lesen Sie hier unseren aktuellen AVV.

 

Große Sprachmodelle sind zweifellos ein großer Meilenstein im Bereich der Künstlichen Intelligenz. Sie haben das Potenzial, unsere Interaktion mit Computern und Informationen grundlegend zu verändern. Nicht zu vernachlässigen ist jedoch auch weiterhin die notwendige menschliche Komponente. Durch die geschickte Verknüpfung der Potenz großer Sprachmodelle mit menschlicher Expertise können wir jedoch eine Vielzahl an Herausforderungen in der heutigen datengesteuerten Welt meistern. 

Trotz der Vorteile, die sich durch die Nutzung ergeben können, ist es entscheidend, die Large Language Models verantwortungsbewusst und transparent zu nutzen, um die größtmöglichen Vorteile für die Gesellschaft zu erzielen.