Mikä ihmeen RAG?
Tekoälytoteutuksien yhteydessä monesti esiin tulee termi RAG (rägi) ja se on mielestäni sen verran tärkeä aihe että tässäpä lyhyt intro aiheesta.
RAG tulee sanoista Retrieval-Augmented Generation. Tämä ei ainakaan itselleni kertonut mitään kun tuon ensimmäisen kerran kuulin. Rägi tarkoittaa käytännössä sitä että chätti-botille annetaan pääsy tiedostoihisi ja se pystyy referoimaan/hakemaan tietoa näistä.
Eli kun kysyt ChatGPT:ltä että mitä myyntitapahtumia oli viime kuussa, se ei pysty vastaamaan tähän ilman rägiä.
Mitenkä se sitten toimii?
Ensin yrityksesi dokumentit (PDF:t, Word-tiedostot, sähköpostit, mitä tahansa tekstiä) syötetään järjestelmään. Ne pilkotaan pienempiin osiin ja tallennetaan hakukelpoiseen muotoon. Kun kysyt kysymyksen, järjestelmä etsii dokumenteistasi ne kohdat, jotka todennäköisimmin liittyvät kysymykseesi. Tekoäly saa käyttöönsä löydetyt dokumenttien kohdat ja muodostaa vastauksen niiden perusteella.
RAG ei korvaa tietokantaa. Jos tarvitset tarkkoja lukuja, laskutoimituksia tai reaaliaikaista dataa, perinteinen tietokanta tai BI-työkalu on parempi valinta. RAG on parhaimmillaan tekstimuotoisen tiedon kanssa.
Yksinkertaisimmillaan voit antaa ChatGPT:lle tiedostosi ja kysyä suoraan siitä kysymyksiä. Mikäli tekstitiedostoja on paljon, on perusteltua luoda räätälöity RAG ratkaisu. Tämä voidaan toteuttaa helposti pilvessä esimerkiksi Azuren Document Intelligence ja AI Foundry työkaluja hyödyntäen. Tai sitten omalla palvelimella esimerkiksi Haystack tai LangChain ohjelmistoja hyödyntäen.
Mikäli aihe kiinnostaa, ota yhteyttä 🙂
-JPu