Artwork

Konten disediakan oleh assono GmbH - Thomas Bahn, Johannes Göttsch, Assono GmbH - Thomas Bahn, and Johannes Göttsch. Semua konten podcast termasuk episode, grafik, dan deskripsi podcast diunggah dan disediakan langsung oleh assono GmbH - Thomas Bahn, Johannes Göttsch, Assono GmbH - Thomas Bahn, and Johannes Göttsch atau mitra platform podcast mereka. Jika Anda yakin seseorang menggunakan karya berhak cipta Anda tanpa izin, Anda dapat mengikuti proses yang diuraikan di sini https://id.player.fm/legal.
Player FM - Aplikasi Podcast
Offline dengan aplikasi Player FM !

#54 - Die Zukunft von LLMs: Retrieval Augmented Generation mit Sam Nündel, Teil 2

23:12
 
Bagikan
 

Manage episode 458495310 series 3630083
Konten disediakan oleh assono GmbH - Thomas Bahn, Johannes Göttsch, Assono GmbH - Thomas Bahn, and Johannes Göttsch. Semua konten podcast termasuk episode, grafik, dan deskripsi podcast diunggah dan disediakan langsung oleh assono GmbH - Thomas Bahn, Johannes Göttsch, Assono GmbH - Thomas Bahn, and Johannes Göttsch atau mitra platform podcast mereka. Jika Anda yakin seseorang menggunakan karya berhak cipta Anda tanpa izin, Anda dapat mengikuti proses yang diuraikan di sini https://id.player.fm/legal.

In „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz.

Hinweis: Zum Zeitpunkt der Aufnahme, habe ich das Interview mit meiner Kollegin Tanja Nündel geführt. Meine Kollegin Tanja ist inzwischen mein Kollege Sam. Den Titel der Folge und das Titelbild haben wir schon mit Sams neuen Namen versehen, nur die Folge selbst können wir leider nicht so leicht im Nachhinein ändern. Deswegen spreche ich Sam in dieser Folge noch mit seinem alten Namen an.

Thema der heutigen Folge: Wenn Unternehmen heute ein großes Sprachmodell wie ChatGPT produktiv einsetzen wollen, gibt es eine Reihe von Herausforderungen, die gelöst werden müssen, um zuverlässige, vertrauenswürdige, sichere und gesetzeskonforme Ergebnisse zu erzielen. Ein großer Bereich, in dem derzeit geforscht und gearbeitet wird, ist die Richtigkeit und Sicherheit der Daten, insbesondere die folgenden drei Punkte: Halluzinationen, Datentrennung und Datenschutz. Einer der vielversprechendsten Lösungsansätze ist die sogenannte Retrieval Augmented Generation (RAG), die verspricht, die aktuellen Probleme der LLMs kostengünstig und zuverlässig zu lösen.

Im zweiten Teil des Interviews mit Sam Nündel geht es darum, wie Retrieval Augmented Generation die Probleme der Halluzination, der Datenkapselung und des Datenschutzes lösen kann, welche Voraussetzungen dafür z.B. in einem KMU erfüllt sein müssen und wie dies konkret in einem Chatbot-Projekt aussehen könnte.

Zeitstempel: 00:00:00 Intro 00:01:32 Wie wird das Problem der Datenrichtigkeit durch Retrieval Augmented Generation gelöst? 00:03:11 Datenkapselung in großen Sprachmodellen
00:06:49 Große Sprachmodelle selbst hosten
00:08:26 Datenschutz gewährleisten 00:10:47 Wissensmanagement als Voraussetzung für Retrieval Augmented Generation 00:12:36 Retrieval Augmented Generation mit einem Chatbot kombinieren 00:16:56 Ausblick: Retrieval Augmented Generation als Standardmethode 00:23:06 Outro

Weitere Informationen:

Oliver Schonschek, Aug 2023 "Lässt sich ChatGPT datenschutzgerecht nutzen?" https://www.security-insider.de/laesst-sich-chatgpt-datenschutzgerecht-nutzen-a-8db9b6e37c1762d7135dd06c5e61b6bf/

Najeeb Nabwani, Sept 2023 "Full Fine-Tuning, PEFT, Prompt Engineering, and RAG: Which One Is Right for You?" https://deci.ai/blog/fine-tuning-peft-prompt-engineering-and-rag-which-one-is-right-for-you/

Cobus Greyling, Jan 2024 "Large Language Model Hallucination Mitigation Techniques" https://cobusgreyling.medium.com/large-language-model-hallucination-mitigation-techniques-a75b6f873318

Patrick Lewis et al. "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" https://arxiv.org/abs/2005.11401v4

Siqing Huo et al., 2023 "Retrieving Supporting Evidence for LLMs Generated Answers" (preprint) https://arxiv.org/abs/2306.13781v1

Cobus Greyling, Oct 2023 "Emerging RAG & Prompt Engineering Architectures for LLMs" https://cobusgreyling.medium.com/updated-emerging-rag-prompt-engineering-architectures-for-llms-17ee62e5cbd9

Oded Ovadia et al. "Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs" (preprint) https://arxiv.org/abs/2312.05934

Heute zu Gast: Sam Nündel ist Experte auf dem Gebiet der KI-gestützten Langtext- und Dokumentenanalyse sowie der KI-gestützten Suche und arbeitet seit über drei Jahren bei assono. Derzeit forscht er zum Thema Retrieval Augmented Generation (RAG). https://www.linkedin.com/in/sam-nuendel/

Über Thomas Bahn: Thomas Bahn ist Geschäftsführer, Mitgründer und Gesellschafter der assono GmbH. Seit mehr als 20 Jahren berät er deutschlandweit erfolgreich Unternehmen rund um die Themen Software und Digitalisierung. Als Host des Podcasts „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz. https://www.linkedin.com/in/thomasbahn/

Produktion: Johannes Göttsch ist Mediengestalter und Conversational Designer bei der assono GmbH. https://www.linkedin.com/in/johannes-goettsch/

Bei Fragen oder Anmerkungen freuen wir uns auf Ihre Nachricht an podcast@assono.de

Der Podcast wird präsentiert von assono - Wir entwickeln Chatbots, mit denen sich Menschen gerne unterhalten.

In 3 Schritten zum eigenen KI-Chatbot-Projekt

  1. Informieren Sie sich über das Chatbot-Angebot von assono
  2. Vereinbaren Sie ein kostenloses Beratungsgespräch oder nehmen Sie an einer unserer Live-Demos teil
  3. Starten Sie Ihr Chatbot-Projekt innerhalb weniger Wochen
  continue reading

Chapter

1. Intro (00:00:00)

2. Wie wird das Problem der Datenrichtigkeit durch Retrieval Augmented Generation gelöst? (00:01:32)

3. Datenkapselung in großen Sprachmodellen (00:03:11)

4. Große Sprachmodelle selbst hosten (00:06:49)

5. Datenschutz gewährleisten (00:08:26)

6. Wissensmanagement als Voraussetzung für Retrieval Augmented Generation (00:10:47)

7. Retrieval Augmented Generation mit einem Chatbot kombinieren (00:12:36)

8. Ausblick: Retrieval Augmented Generation als Standardmethode (00:16:56)

9. Outro (00:23:06)

72 episode

Artwork
iconBagikan
 
Manage episode 458495310 series 3630083
Konten disediakan oleh assono GmbH - Thomas Bahn, Johannes Göttsch, Assono GmbH - Thomas Bahn, and Johannes Göttsch. Semua konten podcast termasuk episode, grafik, dan deskripsi podcast diunggah dan disediakan langsung oleh assono GmbH - Thomas Bahn, Johannes Göttsch, Assono GmbH - Thomas Bahn, and Johannes Göttsch atau mitra platform podcast mereka. Jika Anda yakin seseorang menggunakan karya berhak cipta Anda tanpa izin, Anda dapat mengikuti proses yang diuraikan di sini https://id.player.fm/legal.

In „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz.

Hinweis: Zum Zeitpunkt der Aufnahme, habe ich das Interview mit meiner Kollegin Tanja Nündel geführt. Meine Kollegin Tanja ist inzwischen mein Kollege Sam. Den Titel der Folge und das Titelbild haben wir schon mit Sams neuen Namen versehen, nur die Folge selbst können wir leider nicht so leicht im Nachhinein ändern. Deswegen spreche ich Sam in dieser Folge noch mit seinem alten Namen an.

Thema der heutigen Folge: Wenn Unternehmen heute ein großes Sprachmodell wie ChatGPT produktiv einsetzen wollen, gibt es eine Reihe von Herausforderungen, die gelöst werden müssen, um zuverlässige, vertrauenswürdige, sichere und gesetzeskonforme Ergebnisse zu erzielen. Ein großer Bereich, in dem derzeit geforscht und gearbeitet wird, ist die Richtigkeit und Sicherheit der Daten, insbesondere die folgenden drei Punkte: Halluzinationen, Datentrennung und Datenschutz. Einer der vielversprechendsten Lösungsansätze ist die sogenannte Retrieval Augmented Generation (RAG), die verspricht, die aktuellen Probleme der LLMs kostengünstig und zuverlässig zu lösen.

Im zweiten Teil des Interviews mit Sam Nündel geht es darum, wie Retrieval Augmented Generation die Probleme der Halluzination, der Datenkapselung und des Datenschutzes lösen kann, welche Voraussetzungen dafür z.B. in einem KMU erfüllt sein müssen und wie dies konkret in einem Chatbot-Projekt aussehen könnte.

Zeitstempel: 00:00:00 Intro 00:01:32 Wie wird das Problem der Datenrichtigkeit durch Retrieval Augmented Generation gelöst? 00:03:11 Datenkapselung in großen Sprachmodellen
00:06:49 Große Sprachmodelle selbst hosten
00:08:26 Datenschutz gewährleisten 00:10:47 Wissensmanagement als Voraussetzung für Retrieval Augmented Generation 00:12:36 Retrieval Augmented Generation mit einem Chatbot kombinieren 00:16:56 Ausblick: Retrieval Augmented Generation als Standardmethode 00:23:06 Outro

Weitere Informationen:

Oliver Schonschek, Aug 2023 "Lässt sich ChatGPT datenschutzgerecht nutzen?" https://www.security-insider.de/laesst-sich-chatgpt-datenschutzgerecht-nutzen-a-8db9b6e37c1762d7135dd06c5e61b6bf/

Najeeb Nabwani, Sept 2023 "Full Fine-Tuning, PEFT, Prompt Engineering, and RAG: Which One Is Right for You?" https://deci.ai/blog/fine-tuning-peft-prompt-engineering-and-rag-which-one-is-right-for-you/

Cobus Greyling, Jan 2024 "Large Language Model Hallucination Mitigation Techniques" https://cobusgreyling.medium.com/large-language-model-hallucination-mitigation-techniques-a75b6f873318

Patrick Lewis et al. "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" https://arxiv.org/abs/2005.11401v4

Siqing Huo et al., 2023 "Retrieving Supporting Evidence for LLMs Generated Answers" (preprint) https://arxiv.org/abs/2306.13781v1

Cobus Greyling, Oct 2023 "Emerging RAG & Prompt Engineering Architectures for LLMs" https://cobusgreyling.medium.com/updated-emerging-rag-prompt-engineering-architectures-for-llms-17ee62e5cbd9

Oded Ovadia et al. "Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs" (preprint) https://arxiv.org/abs/2312.05934

Heute zu Gast: Sam Nündel ist Experte auf dem Gebiet der KI-gestützten Langtext- und Dokumentenanalyse sowie der KI-gestützten Suche und arbeitet seit über drei Jahren bei assono. Derzeit forscht er zum Thema Retrieval Augmented Generation (RAG). https://www.linkedin.com/in/sam-nuendel/

Über Thomas Bahn: Thomas Bahn ist Geschäftsführer, Mitgründer und Gesellschafter der assono GmbH. Seit mehr als 20 Jahren berät er deutschlandweit erfolgreich Unternehmen rund um die Themen Software und Digitalisierung. Als Host des Podcasts „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz. https://www.linkedin.com/in/thomasbahn/

Produktion: Johannes Göttsch ist Mediengestalter und Conversational Designer bei der assono GmbH. https://www.linkedin.com/in/johannes-goettsch/

Bei Fragen oder Anmerkungen freuen wir uns auf Ihre Nachricht an podcast@assono.de

Der Podcast wird präsentiert von assono - Wir entwickeln Chatbots, mit denen sich Menschen gerne unterhalten.

In 3 Schritten zum eigenen KI-Chatbot-Projekt

  1. Informieren Sie sich über das Chatbot-Angebot von assono
  2. Vereinbaren Sie ein kostenloses Beratungsgespräch oder nehmen Sie an einer unserer Live-Demos teil
  3. Starten Sie Ihr Chatbot-Projekt innerhalb weniger Wochen
  continue reading

Chapter

1. Intro (00:00:00)

2. Wie wird das Problem der Datenrichtigkeit durch Retrieval Augmented Generation gelöst? (00:01:32)

3. Datenkapselung in großen Sprachmodellen (00:03:11)

4. Große Sprachmodelle selbst hosten (00:06:49)

5. Datenschutz gewährleisten (00:08:26)

6. Wissensmanagement als Voraussetzung für Retrieval Augmented Generation (00:10:47)

7. Retrieval Augmented Generation mit einem Chatbot kombinieren (00:12:36)

8. Ausblick: Retrieval Augmented Generation als Standardmethode (00:16:56)

9. Outro (00:23:06)

72 episode

همه قسمت ها

×
 
Loading …

Selamat datang di Player FM!

Player FM memindai web untuk mencari podcast berkualitas tinggi untuk Anda nikmati saat ini. Ini adalah aplikasi podcast terbaik dan bekerja untuk Android, iPhone, dan web. Daftar untuk menyinkronkan langganan di seluruh perangkat.

 

Panduan Referensi Cepat

Dengarkan acara ini sambil menjelajah
Putar