1. Szövegfeldolgozás és Tokenizálás (Text Processing & Tokenization)
Amikor megnyomod a küldés gombot, a szöveges kérésed számítógép számára érthetővé kell tenni. Az első lépés tehát a tokenizálás, vagyis a szöveg felbontása kisebb részekre, úgynevezett "tokenekre". Egy token lehet egy teljes szó (pl. "macska"), egy szógyök (pl. "szeret"), egy toldalék (pl. "-ett") vagy akár egyetlen karakter is (pl. írásjel). A tokenizálás nyelvefüggő és a modell betanításakor megtanult szabályok alapján történik.
Példa: A "Szia, hogy vagy?" kérdés felbontható így: ["Szia", ",", " hogy", " vagy", "?"]
2. Embedding (Beágyazás) – A Szavak Térképe
A tokenek még mindig csak szimbólumok. Ahhoz, hogy a modell megértsen jelentést, ezeket a tokeneket többdimenziós vektorokká (számok sorozatává) kell alakítani. Ez az embedding réteg feladata. Képzeld el, hogy minden szónak van egy helye egy hatalmas, több száz dimenziós térképben. A hasonló jelentésű szavak (pl. "macska" és "kutya") egymáshoz közel helyezkednek el. Ez a lépés ad hozzá "jelentést" a szavakhoz a modell számára.
3. Transzformer Architektúra és a Figyelemmechanizmus (Attention Mechanism)
4. Kiértékelés és Szűrés
A modell nem csak egyetlen választ generál, hanem rengeteg lehetséges folytatást számol ki valószínűségi értékekkel. Ezt a listát különböző algoritmusokkal szűri és mérlegeli, hogy a legjobb, leglogikusabb, legkevésbé toxikus választ adhassa vissza. Erre szolgálnak pl. a top-k vagy top-p mintavételezési technikák.
5. Detokenizálás – Vissza az Emberi Nyelvre
6. Válasz elküldése
Végül a teljesen kiformált, olvasható szöveges válasz visszakerül a felületre (pl. a böngésződbe vagy az alkalmazásba), ahol te meg is láthatod.