2025 - Dr. Ekler Péter – Alkalmazott mesterséges intelligencia körkép, valamint annak hatásai az oktatásra és a munkaerőpiacra

Napjainkban a mesterséges intelligencia (MI) a technológiai szférából kilépve a mindennapjaink szerves részévé vált. Már nemcsak a kutatólaboratóriumokban találkozunk vele, hanem a zsebünkben lévő okostelefonokon és a tantermekben is. Előadásom célja az volt, hogy mérnöki szemmel, de közérthetően mutassam be, mi zajlik a „motorháztető alatt”, hogyan működnek ezek az eszközök a valóságban, és miként alkalmazhatjuk őket a pedagógiai gyakorlatban anélkül, hogy túlzott érzelmeket vagy felesleges misztikumot társítanánk hozzájuk. Fontos látnunk: ez egy mérnöki eszköz, nem pedig egy érző lény, még akkor sem, ha néha emberi tulajdonságokat vélünk felfedezni a válaszaiban.

Multimodális forradalom: A „töltött káposzta” daltól a kódgenerálásig

A generatív mesterséges intelligencia fejlődése elképesztő sebességre kapcsolt. Míg korábban csak szöveges válaszokat vártunk, a mai modellek már multimodálisak, azaz képesek képet, hangot, videót és programkódot is értelmezni, illetve létrehozni.

Az előadáson bemutatott demók során láthattuk, hogy a határok elmosódnak:

Képgenerálás: Számos eszköz (pl. Gemini) segítségével másodpercek alatt készíthetünk illusztrációkat, például egy bibliai jelenetet a Jelenések könyvéből. Bár az eredmények lenyűgözőek, a technológia még nem tévedhetetlen – a generált képeken felbukkanó apró hibák (anomáliák) észrevétele kiváló feladat a diákok vizuális és kritikai készségeinek fejlesztésére.
Zenealkotás: A Suno nevű eszközzel élőben demonstráltam, hogyan lehet egy egyszerű szöveges utasításból („komponálj dalt magyar ételekről”) percek alatt stúdióminőségű dalt generálni. A „töltött káposzta” témájú dal nemcsak szórakoztató példa, hanem rámutat arra is, milyen könnyen hozhatunk létre egyedi multimédiás segédanyagokat.
Kódgenerálás: Talán az egyik legizgalmasabb terület, hogy a természetes nyelv segítségével programokat írathatunk. Példaként egy angol nyelvtanulást segítő, gyümölcsöket felismerő webes játékot készítettem el a modellel anélkül, hogy egy sor kódot írtam volna kézzel. Ez új távlatokat nyit az informatikaoktatásban és a digitális pedagógiában.

A generált tartalmak minősége rohamosan javul – a „B” kép egy generált fotó, míg az „A” a valós.
A különbségtétel egyre nehezebb.

Mi történik a háttérben? Tokenek és valószínűségek

Sokan hajlamosak varázslatként tekinteni a ChatGPT-re, pedig a működése tisztán matematikai alapokon nyugszik. A modell nem „érti” a szöveget úgy, ahogy mi, hanem token-ekkel (szótöredékekkel) dolgozik. Amikor beírunk egy mondatot, a rendszer statisztikai valószínűségek alapján számítja ki a következő legvalószínűbb szót.

Például, ha a bemenet az, hogy „A Nap egy...”, a modell a betanított hatalmas adatmennyiség alapján tudja, hogy a legnagyobb valószínűséggel a „csillag” szó következik (pl. 70%), és nem a „bolygó” (20%).

A felhasználók számára elérhető paraméterekkel – mint a temperature (hőmérséklet) – szabályozhatjuk a modell kreativitását. Alacsony értéken a modell determinisztikus, mindig a legvalószínűbb választ adja (jó, tényalapú kérdéseknél), míg magas értéken „kreatívabb”, változatosabb, de olykor pontatlanabb válaszokat generál.

Prompt Engineering: Az utasításadás művészete

A nyelvi modellek hatékony használatának kulcsa a prompt engineering, ami az oktatásban egyfajta új kompetenciaként jelenik meg. A „Garbage in, garbage out” (szemét be, szemét ki) elv itt fokozottan érvényes: rossz kérdésre általános, semmitmondó választ kapunk.

Egy professzionális prompt felépítése négy fő pilléren nyugszik:

Szerepkiosztás: „Te egy tapasztalt biológiatanár vagy a 7. osztályban.”
Feladat/Cél: „Írj egy magyarázatot a fotoszintézisről, és a végére készíts három kvízkérdést.”
Közönség: „A nyelvezet legyen egyszerű, 12 évesek számára érthető.”
Formátum és korlátok: „Használj felsorolást, és ne legyen hosszabb 200 szónál.”

Nem szabad félni az iterálástól: ha az első eredmény nem megfelelő, pontosítsunk, kérjünk új verziót, vagy adjunk példát a modellnek („few-shot prompting”), hogy milyen stílust várunk el.

RAG: Hogyan tegyük okossá a modellt saját tananyaggal?

Az oktatásban gyakori probléma, hogy a nyilvános modellek hallucinálnak, vagy nem ismerik a specifikus tananyagot. Erre kínál megoldást a RAG (Retrieval-Augmented Generation) technológia, ami lényegében a modell „memóriabővítése”.

Ennek során feltölthetjük saját dokumentumainkat (PDF-ek, jegyzetek, szabályzatok) egy tudásbázisba. A rendszer ezeket a szövegeket vektorokká (számsorokká) alakítja, és egy vektoradatbázisban tárolja. Amikor kérdezünk, a rendszer először megkeresi a releváns információt a saját anyagainkban, és ezt a kontextust adja át a nyelvi modellnek. Így létrehozhatunk például egy „Saját tanársegédet” vagy „Programozás oktatót”, amely kizárólag a feltöltött tananyag alapján válaszol, drasztikusan csökkentve a tévedés lehetőségét.

Kutatások és jövőkép a BME-n

A generatív AI mellett a BME Villamosmérnöki és Informatikai Karán számos egyéb alkalmazott AI kutatás zajlik:

Jelnyelv-felismerés: Kamerakép alapján, valós időben fordítja a jelnyelvet szöveggé, segítve a kommunikációt.
Deepfake detektálás: A manipulált videók és hanganyagok felismerése kritikus fontosságúvá válik a dezinformáció elleni küzdelemben.
Orvosi XR megoldások: Műtétek támogatása kiterjesztett valóság (XR) és MI segítségével, ahol a CT felvételek alapján 3D modellek segítik az orvos munkáját.

Kutatási irányok a BME-n: jelnyelv felismerés

Összegzés és útravaló

A diákjaink már együtt élnek a technológiával, a tiltás helyett a helyes használat megtanítása a cél. Ahogy az előadáson is elhangzott: „Az AI adhat tudást, de az ember ad értelmet.”

A technológia lehetőséget ad a differenciálásra és az adminisztráció csökkentésére (pl. 400 különböző variációjú ZH generálása percek alatt), de a tanár szerepe megkerülhetetlen marad a folyamatban. Ne féljünk kísérletezni, kezdjük kicsiben, és tekintsünk ezekre a rendszerekre úgy, mint hatékony mérnöki segédeszközökre, amelyek segítenek felkészíteni a diákokat a jövő munkaerőpiacára.