Előzmények

Alan TuringA mesterséges intelligencia (MI) története egészen az ókorig nyúlik vissza, amikor az emberek már álmodoztak intelligens gépek létrehozásáról. Az első komolyabb lépések a 20. század közepén történtek, különösen Alan Turing munkássága révén, aki 1935-ben bemutatta a számítógép elméletét, amely később alapjául szolgált a MI fejlődésének

Ebben a témában a legnagyobb publicitást a Dartmouth College campusán 1956 nyarán tartott workshop kapta. Ennek résztvevői évtizedekig az AI-kutatás vezetőivé váltak. Sokan azt jósolták, hogy egy generáción belül léteznek olyan intelligens gépek, mint az emberek. Az Egyesült Államok kormánya több millió dollárt biztosított ennek az elképzelésnek a megvalósításához.

MI 1.0 – Szabályalapú rendszerek

A korai MI rendszerek előre meghatározott szabályok alapján működtek, gyakran úgynevezett „szakértői rendszerekként”. Ezek a rendszerek nem voltak képesek tanulni vagy alkalmazkodni, hanem előre megadott szabályok szerint adtak válaszokat.

MI 2.0 – Gépi tanulás

A gépi tanulás (ML) előretörésével az MI rendszerek már képesek voltak adatból tanulni, előre nem látott mintákat felismerni és azok alapján döntéseket hozni. Ezek a rendszerek nagy mennyiségű adatból tanulnak, például képeken vagy szövegen, és felügyelet mellett (szupervízióval) vagy anélkül is tudnak tanulni.

MI 3.0 – Mély tanulás

A mély tanulás (deep learning) korszakában az MI modellek neurális hálózatokon alapulnak, amelyek több rétegben (ún. „deep” rétegek) képesek komplex minták felismerésére. A képfelismerés, beszédfelismerés, szövegfeldolgozás és más, összetett feladatok ezen technológiák alkalmazásával váltak megoldhatóvá.

MI 4.0 – Generatív AI

A legújabb technológiai fejlődést a generatív mesterséges intelligencia jelenti, mint amilyen a ChatGPT, DALL-E és más, nagy nyelvi modelleken (LLM-eken) alapuló rendszerek. Ezek a modellek nagy mennyiségű szöveges és képi adat alapján képesek új tartalmakat létrehozni, szöveget generálni, képeket készíteni, programozni, és különböző kreatív feladatokat megoldani. A generatív MI rendszerek az úgynevezett transzformer architektúrákra épülnek, amely lehetővé teszi a gyors tanulást és a skálázhatóságot.