Der Chat-Modus in RightFind Navigate – ein Blick hinter die KulissenBy Joel DiMambro4 Dezember 2024Dieser Blogpost wurde übersetzt vom Velocity of Content Blog des CCCCCC freut sich, die Beta-Einführung eines Chat-Modus mit generativer KI (kurz „genAI“) für RightFind Navigate bekannt zu geben. Dies ist ein Meilenstein bei der Verwirklichung unserer Vision, Forscher*innen eine Schnittstelle in natürlicher Sprache für wissenschaftliche Entdeckungen zu bieten, die den Erkenntnisgewinn beschleunigt, dabei aber – und das ist entscheidend – die Verantwortung anerkennt, Vertrauen in KI-Systeme aufzubauen. Das bietet Chat-Modus in RightFind Navigate: Natürliche Sprachschnittstelle zur Durchführung von Suchen mit einer Antwort, die von einem Large Language Model (LLM) basierend auf den fünf besten Ergebnissen für die Abfrage generiert wird. Konversationskontext, der es Benutzer*innen ermöglicht, basierend auf vorherigen Antworten Folgefragen zu stellen. Integration mit Navigate-Kernfunktionen, einschließlich „Zur Bibliothek hinzufügen“ und „Inhalt abrufen“ von RightFind, um den vollständigen Text zu erhalten. Eine vollständige Liste der Suchergebnisse basierend auf der Abfrage, damit Benutzer*innen die Quellen für die vom System erzeugten Antworten sehen können. Warum ein Chat-Modus? Die Entscheidung, einen genAI-Chat-Modus in RightFind Navigate einzuführen, war wohl überlegt. CCC hat bereits eine starke Erfolgsbilanz bei der Anwendung fortschrittlicher Techniken wie maschinelle Lernmodelle, Wissensgraphen und Named Entity Recognition, um wissenschaftliche Entdeckungen zu verbessern und die Erforschung von Konzepten mithilfe von Wissensgraphen zu erleichtern. Aber wir wollten nicht überstürzt auf den Markt kommen und uns als weiterer Anbieter einreihen, der auf den KI-Zug aufspringen will, ohne die Bedürfnisse der Benutzer*innen zu berücksichtigen. GenAI-Implementierungen sind mit erheblichen Herausforderungen verbunden und es gibt wichtige Überlegungen in Bezug auf das Urheberrecht. Wir wissen, dass unsere Kund*innen von uns erwarten, dass wir eine solche Implementierung sorgfältig angehen. Durch iterative Diskussionen mit unseren Kund*innen haben wir Anwendungsfälle identifiziert, bei denen wir helfen können. Ein zentraler Fall ist die Unruhe, die Forscher*innen verspüren, wenn sie in (noch einem) Discovery-Tool ein Suchfeld sehen. RightFind Navigate ist extrem leistungsstark bei der Integration unterschiedlicher öffentlicher und lizenzierter Datenquellen und der Erstellung einer personalisierten verknüpften Datenebene, aber wir wissen, dass Endbenutzer*innen immer noch vor der Hürde stehen, die richtige Suchsyntax zu entwickeln, um die effektivste Abfrage zu entwickeln, die ihrer Frage entspricht. Auf diese Herausforderung haben wir unsere Betaversion zugeschnitten: Benutzer*innen können in natürlicher Sprache interagieren und eine narrative Antwort erhalten, die es ihnen ermöglicht, auf eine breitere Palette von Ergebnissen zuzugreifen, die für ihr Thema relevant sind. Ein großartiges Beispiel hierfür sind Forscher*innen in der frühen Zielidentifizierung, die eine Konversation mit dem System führen können: Ich möchte alles über Krankheit X wissen. Womit ist sie verbunden? Gibt es relevante Zellmodelle? Welche Unternehmen arbeiten bereits daran? Für jede Antwort auf die obigen Fragen können Benutzer*innen eine Reihe von Artikeln markieren, um tiefer zu graben, mehr zu erfahren und ihr Verständnis zu bestätigen. Verantwortung und KI-Systeme CCC ist ein Branchenführer in den Diskussionen über GenAI und urheberrechtlich geschützte Materialien und hat Lizenzen für die interne KI-Nutzung eingeführt. Bei unserem Ansatz zur Einführung KI-gestützter Funktionen haben wir diese Verantwortung stets im Blick. Diese Betaversion des Chat-Modus verwendet einen Retrieval Augmented Generation (RAG)-Ansatz, der PubMed-Abstracts/-Zitate und Open Access CC BY-Volltextliteratur verwendet, um die Reaktion des Systems zu untermauern. In kommenden Versionen wird eine Ebene zur Rechtewahrnehmung zusätzliche wissenschaftliche Volltextliteratur enthalten, auf die Kund*innen Zugriff haben und die durch die neuen internen KI-Nutzungsrechte im Rahmen der Annual Copyright License von CCC abgedeckt ist, was die Erfahrung für CCC-Lizenznehmer*innen bereichert. Einschränkungen Jedes System hat Einschränkungen, und KI-Systeme bilden da keine Ausnahme. Wir wissen, dass viele unserer Benutzer*innen von den allgemeinen Haftungsausschlüssen ermüdet sind, die in allgemeinen genAI-Chatsystemen zum „Überprüfen der Fakten“ zu finden sind. Die menschliche Validierung bleibt ein wesentlicher Aspekt guter Wissenschaft, und die Verknüpfung der narrativen Chat-Antwort mit der zugrunde liegenden Literatur unterstützt diese Praxis. Um die Risiken in bestimmten Bereichen zu reduzieren, filtert CCC die LLM-Antworten in bestimmten Bereichen, um fragwürdige Informationen zu vermeiden. Zum Beispiel: Eingabeaufforderungen, die nach personenbezogene Informationen suchen (z. B. „Erstellen Sie eine Liste der fünf besten Forscher*innen in x“) Eingabeaufforderungen, die nach qualitativen Meinungen fragen (z. B. „Was ist das beste Medikament zur Gewichtsabnahme?“) Eingabeaufforderungen, die nach Assistentenaktionen fragen (z. B. „Erstellen Sie eine Liste der Top-Artikel in der Domäne x, erstellen Sie dann eine Bibliothek und füllen Sie sie mit diesen Artikeln; teilen Sie sie mit den Kollegen a, b und c“) Nutzer*innen, die diese Art von Fragen stellen, erhalten eine Erklärung, dass die Eingabeaufforderung außerhalb des Rahmens liegt, für den der Chat konzipiert ist. Wir möchten Möglichkeiten erkunden, in diesen Bereichen Unterstützung zu bieten, indem wir weitere Untersuchungen, Forschungen und Entwicklungen zu dieser Art von Anfragen durchführen. Zukunftspläne Mit der Leitvision, ein leistungsstarkes GenAI-Erlebnis in einem Workflow bereitzustellen, in dem wissenschaftliche Forschung im Vordergrund steht und Kund*innen eine integrierte Achtung des Urheberrechts erwarten, sind wir gespannt, wie sich der Chat-Modus weiterentwickeln wird. Wir werden die Roadmap in enger Absprache mit unseren Kund*innen erstellen und haben bereits mehrere andere Beta-Bereitstellungen durchgeführt. Diese haben es uns ermöglicht, Feedback aus der Praxis zu sammeln (unter Wahrung der Privatsphäre), Eingabetechniken und Antworten zu überwachen, das Verständnis der Benutzer zu klären und einen Rückstand an Verbesserungen zusammenzustellen, um das System für unsere Benutzer*innen noch besser zu machen.
Von der Herausforderung zur Chance: Verbesserung der Literaturrecherche für Medical Affairs30 Juli 2024
Daten besser finden: Wie RightFind Navigate die 20 Millionen Synonyme von SciBite nutzt12 Dezember 2024