10. A kompetenciafejlesztéstől a mesterséges intelligenciáig az oktatásban

2025 - Dr. habil. Buda András – Imposztor szindróma: tanárok vélekedése az integrált természettudomány tanításáról

Bevezetés

Napjainkban sok szó esik a mesterséges intelligenciáról (MI), sőt olykor már azt is érezheti valaki, hogy bizonyos kérdésekben mintha már egy kicsit utána is lennénk a történéseknek. A mostani szakértői konferencián is többen hivatkoztak arra, hogy bizonyos gondolatokat nem mondanak el, mert tavaly, vagy éppen tavalyelőtt már szó volt róluk. Ennek ellenére úgy gondolom, hogy vannak azért olyan elemek, melyek egyáltalán nem biztos, hogy mindenki számára teljesen egyértelműek.

Az egyik például az, hogy a mesterséges intelligencia – bár sokan úgy gondolják – egyáltalán nem az elmúlt évek találmánya. Azon persze lehet vitatkozni, hogy az 1950-ben elkészített Turing tesztet vagy az 1956-ban Dartmouth College-ban tartott workshopot tekinti valaki az MI születési időpontjának, de a lényeg mindenképpen az, hogy már az 50-es évektől, azaz kb. 70 éve már egészen biztosan van mesterséges intelligencia. Sőt az MI oktatási alkalmazásával kapcsolatban már 1997-ben megalakult egy nemzetközi szervezet (International Artificial Intelligence in Education Society – IAIED), mely konferenciasorozatot és folyóiratot is indított e témában. A mesterséges intelligencia tehát egyáltalán nem a közelmúlt fejlesztése.

Egy másik tévképzet, hogy sokan a ChatGPT-vel azonosítják a mesterséges intelligenciát, pedig nem csak egyetlen egy mesterséges intelligencia létezik, hanem nagyon sok van. Minden bizonnyal valóban a ChatGPT a legismertebb nyelvi modell és biztos, hogy sokan használják, de ugyanilyen lehetőségeket biztosít a regisztráció nélkül is használható Copilot, vagy a Gmail-es e-mail címmel könnyen elérhető Gemini is.

Az előadásom címéből már kiderült, hogy az MI mérési-értékelési alkalmazásával kapcsolatban kívánok most ötleteket bemutatni, ezen belül pedig pontosan az előbb említett generatív mesterséges intelligenciák használatára mutatok majd példákat, és ehhez kapcsolódóan beszélek majd arról is, hogy milyen problémákkal találkoztam. Ugyanakkor – mivel a fejlődés rendkívül gyors – nem biztos, hogy ezek közül mindegyik jelentkezni fog, amikor kipróbálják majd a bemutatott lehetőségeket.

Mérés

A mérés-értékelés folyamatának első mozzanata a mérőeszköz-készítés. Ma már minden feladatlap számítógéppel készül, de az előfordul, hogy nem találunk egy korábban elkészített anyagot, nem áll (már) rendelkezésünkre a megfelelő fájl. A nyomtatott változat viszont elérhető, bár lehet, hogy csak kitöltött állapotban. Ennek felhasználható módon történő digitalizálásában is segíthet nekünk a mesterséges intelligencia. A bal oldaliképen egy kitöltött, kijavított dolgozat látható, melyet szándékoltan nem a legjobb minőségben szkenneltem be. Ezzel azt szeretném érzékeltetni, hogy a digitális világba belépve nem kell megriadni az első problémáktól.

image269.png

A generatív mesterséges intelligenciát megkérhetjük arra, hogy hagyja ki a javításokat és a tanuló válaszait, csak a feladatokat vegye ki a képből. Ezt éppen Copilottal próbáltam ki, mely a feladatok jelentős részét hibátlanul beolvasta (erre látunk példát a jobb oldali képen), igaz, a 2. kérdésnél van egy kis eltérés: pontosan ismerte fel a feladatokat, de nem tartotta meg konzekvensen az eredeti sorrendet.

image270.png

A mesterséges intelligencia még a táblázat készítését is megspórolja nekünk.

image271.png

A számsorozatokkal azonban nem boldogult a program. Nem tudta beazonosítani az előre megadott és a tanuló által beírt számokat, sőt az első sorozatból még el is hagyott egy előre megadott számot.

Képernyőkép 2026-01-26 2322592045456.png

A hiba ellenére az alkalmazott megoldás jelentős segítséget jelent, hiszen sok időt, energiát spórolhatunk meg azzal, hogy nem kell mindent újra begépelni.

Ha nem korábbi feladatokat akarunk felhasználni, hanem újakat akarunk készíteni valamilyen témakör számonkéréséhez, akkor is segítségül hívhatjuk az MI-t. Az alábbi prompt a 2025-ös érettségi egyik feladatának parafrazeált változata. Megfogalmazása némileg hiányos (erre később majd még visszatérünk), ami kihat a generált válasz minőségére is.

„16 éves tanulókkal fogok dolgozatot íratni abból, hogyan jelentkezik az egyén fenyegetettségének és kiszolgáltatottságának érzése Kosztolányi Dezső és József Attila alkotásaiban. Kérek a dolgozathoz kérdéseket, feladatokat!”

Erre a promptra a nyílt hozzáférésű Copilot három fajta kérdést fogalmazott meg:

  1. Elemző kérdések (például: Hogyan jelenik meg az egyén kiszolgáltatottsága Kosztolányi Dezső és József Attila verseiben? Hasonlítsd össze legalább két művüket!).
  2. Összehasonlító kérdések (például: Hasonlítsd össze Kosztolányi „Édes Anna” című regényének és József Attila „Levegőt!” című versének világát az egyén kiszolgáltatottsága szempontjából!).
  3. Értelmező kérdések (például: Milyen szerepet játszik a magány és az elszigeteltség az egyén fenyegetettségének megjelenítésében?).

Hogy ezek közül melyik kérdést lenne célszerű felhasználni egy dolgozatban, vagy valamilyen más célból lehetne hasznosítani, azt természetesen a szakos kollégák tudják legjobban megítélni, de úgy gondolom, hogy ezekből a feladatokból – változatlan formában vagy kevés változtatással – többet is fel lehetne használni, bár egy teljes dolgozatot – minden bizonnyal - nem lehetne belőlük összeállítani.

A feladatok elkészítése után a Copilot saját maga ajánlotta fel, hogy szívesen készít a kérdésekhez értékelési szempontsort vagy dolgozati struktúrát.

image273.png

A szempontsor megfelelőségét lehet vitatni, mert elég elnagyolt, pontatlan, de azért kiindulási alapot adhat egy helyi feltételrendszernek, szokásoknak megfelelő javítókulcs elkészítéséhez. A javasolt dolgozati struktúra viszont nem jelent segítséget a tanár számára, mivel azt a diákok számára készítette el a program.

image274.png

A használt nyelvi modell ezt követően is felajánlott különböző választható lehetőségeket, egészen odáig, hogy javaslatot tett még a dolgozathoz tartozó fájl nevére is.

image275.png

image276.png

image277.png

image278.png

 

Meglepő módon a Copilot teljesen más választ adott akkor, ha regisztrált felhasználóként belépve adtam meg a korábban bemutatott promptot. A generatív mesterséges intelligencia ebben az esetben öt darab, egyszerű választásos, zárt kérdésből álló feladatsort készített el.

image279.png

Egy ilyen rövid, zárt kérdéssor természetesen alkalmatlan a számonkérésre, de gyakorláshoz fel tudják használni a tanulók, mert a kérdéssor egy link segítségével bárki számára elérhetővé tehető. Az összes kérdés megválaszolása után a diákok válaszait a program ki is értékeli, a hibás válaszokhoz pedig magyarázatot is fűz:

image280.png

A ChatGPT ugyanarra a promptra (16 éves tanulókkal fogok dolgozatot íratni …) a nyílt Copilotos válaszhoz hasonlóan három feladatcsoportot generált:

  1. Ráhangoló, rövid válaszos kérdések (ismeretellenőrzés) (például: Mely történelmi és társadalmi változások hatottak Kosztolányi és József Attila világképére?).
  2. Elemző, értelmező kérdések (rövidebb esszé jellegű, 5–8 mondatos válaszok) (például: Hasonlítsd össze, hogyan jelenik meg a magány és a világgal szembeni kiszolgáltatottság Kosztolányinál és József Attilánál!).
  • Szintézis és személyes reflexió (hosszabb esszéfeladatok, választható címekből) (például: „Az ember magánya nem a csöndben, hanem a világ zajában a legnagyobb.” – Fejtsd ki, mit jelent ez a gondolat Kosztolányi és József Attila verseinek fényében!)

A két különböző nyelvi modell által generált feladatcsoportok mutatnak hasonlóságot, de jelentős különbség, hogy a ChatGPT megadja azt is, mennyi időt és milyen terjedelmű válaszokat javasol az egyes kérdésekhez. (Ráhangoló: kb. 10 perc, 1–2 mondatos válaszok; Elemző: kb. 20 perc, 5–8 mondatos válaszok; Szintetizáló: kb. 30 perc, 15–20 sor). Ezek a számértékek megmutatják, hogy pusztán ezek alapján – a javasolt kérdésekből – nem nagyon lehet összeállítani egy érdemi feladatsort. Ugyanakkor ezek a javaslatok felhívják arra a figyelmet, hogy nemcsak a tanulók életkorát, hanem a feladatlapra és az egyes kérdések megválaszolásához szükséges időkorlátokra vonatkozó utasításokat is célszerű beépíteni a kiindulási promptba.

További eltérés a Copilot válaszához képest, hogy a ChatGPT kérés nélkül javasolt értékelési szempontokat és hozzájuk tartozó pontszámokat, de ezek a szempontok rendkívül elnagyoltak, ebben a formában teljesen használhatatlanok egy dolgozat objektív értékeléséhez.

Képernyőkép 2026-01-27 013624.png

Szintén külön kérés nélkül kapunk javaslatokat olyan feladatokra is, melyek nem a dolgozathoz, hanem az órai munkához, vagy éppen a házi feladathoz használhatók. Ugyanakkor felhívom a figyelmet arra, hogy egy ilyen házi feladat elkészítéséhez maguk a tanulók is igénybe vehetik valamelyik generatív nyelvi modell segítségét, így sokszor nem a tanulók kreativitását fejlesztjük vele, hanem a képernyőidejüket növeljük.

Képernyőkép 2026-01-27 013637.png

A bevezetőben említett harmadik nyelvi modellt, a Geminit is segítségül hívtam feladatok generálásához. Az összehasonlíthatóság érdekében itt is a korábban használt promptot adtam meg a kiinduláshoz.

image282.png

Két hasábba tördelt választ generált a rendszer. A jobb oldali hasábban zárt kérdésből (10 db) álló kérdéssor került megjelenítésre. Mindegyik kérdés az egyszerű választásos típusba tartozik, a tanulóknak négy lehetőség közül kell kiválasztaniuk a helyes megoldást. A program minden egyes kérdéshez szerkesztett egy tippet is, melyet megjelenítve a tanuló segítséget kap a megfelelő válasz megtalálásához.

A Gemini válasza azonban nemcsak a tanulót segítő tippek megfogalmazásával és a kérdések magasabb számával tér el a Copilot hasonló outputjától, hanem abban is, hogy minden egyes kérdést azonnal értékel a rendszer és hibás válasz esetén is igyekszik támogató visszajelzést adni a tanuló számára.

image283.png

A Gemini válaszának bal hasábján be lehet jelölni, ha nem zárt kérdéseket (= interaktív kvíz) szeretnénk. Ebben az esetben az MI új választ generál, melyben négy típusba sorolja a javasolt kérdéseket. A korábbi nyelvi modellek válaszaihoz képest eltérés, hogy minden típushoz csak egyetlen kérdést generált a rendszer és nem ajánlott fel magától semmiféle folyatást (nem volt javaslata értékelési szempontokra, nem akart a kérdésekből feladatlapot összeállítani stb.).

image284.png

Ebből a négy kérdésből természetesen nem lehetne összeállítani egy dolgozatot, hiába irányult erre a promptban megfogalmazott kérés. A Gemini és a többi nyelvi modell által megfogalmazott válaszok azonban úgy is hasznosíthatók, hogy a tanulságokat levonva megfogalmazhatunk egy új promptot, mely olyan választ eredményez, melyet sokkal nagyon mértékben tudunk hasznosítani egy dolgozat összeállításához.

Az átfogalmazott, kiegészített prompt például lehetne az alábbi:

16 éves tanulókkal fogok dolgozatot íratni abból, hogyan jelentkezik az egyén fenyegetettségének és kiszolgáltatottságának érzése Kosztolányi Dezső és József Attila alkotásaiban. Kérek egy átlagos képességű tanuló számára 45 perc alatt megoldható témazáró feladatlapot. A dolgozat egy-két könnyebb feladattal kezdődjön, legyenek benne zárt és nyitott kérdések is. Kérek a dolgozathoz pontos javítókulcsot mely alapján minden kérdést objektívan ki lehet javítani és tartalmazza a részpontszámokat is.

Értékelés

A fentebb bemutatott példák egyértelművé teszik, hogy a nagy nyelvi modellek – bár vétenek hibákat, de – jól használhatók különböző feladatok generálásához. Adódik tehát a kérdés, hogy az elkészült feladatok, feladatlapok értékeléséhez milyen mértékben, hogyan használható a mesterséges intelligencia, párosul-e pontossággal is a program vitathatatlan gyorsasága?

Zárt kérdések esetén teljesen egyértelműen igen a válasz, sőt ezt a feladatot már az MI-mentes programok is meg tudták oldani. Minden bizonnyal Önök közül is többen használták már a Redmenta, a Wordwall, a Learningapps, a Kahoot!, a Quizizz vagy éppen a Socrative programokat, melyek nemegyszer nem csak kijavítják a zárt kérdésekre adott válaszokat, hanem az értékelésnél figyelembe veszik a válaszadás gyorsaságát is. A valódi kérdés tehát inkább az, hogy az MI tudja-e javítani, értékelni a nyitott kérdésekre adott válaszokat?

Ennek a kérdésnek a megválaszolásához először a már korábban bemutatott, 3. osztályos matematika dolgozat értékelésére kértem a nyelvi modelleket, természetesen a feltöltött képből a korábbi tanári jelzések törlésre kerültek. A felhasznált prompt a következő volt: „Javítsd ki a dolgozatot! Minden jól beírt szám és minden aláhúzás egy pontot ér. Feltöltöm a dolgozatot:” A továbbiakban csak az első három feladat gépi értékelését fogom bemutatni.

A Copilot az első feladat kétharmadát jól javította ki, de a számok rendezésére csak egy pontot adott, pedig a tanuló hat számot írt le növekvő sorrendben. A részfeladatokat újraszámozta (az 1. feladat „a” részét 2. feladatnak, a „b” részt 3. feladatnak jelölte), így az eredeti feladatlapon 2. feladatot már 4. feladatnak jelölte. Ez nem jelent nagy problémát, az viszont már igen, hogy a dolgozat 2. feladatát – amit egyébként az első prompt esetén tökéletesen olvasott be – a program nem tudta értelmezni.

Képernyőkép 2026-01-27 014042.png

Magyarázat után a Copilot megértette a jelöléseket, de meglepő módon kreált még két új szabályt is és ezek alapján végezte el a feladat javítását.

A kitalált szabályokra azért volt szüksége, mert a nyelvi modell nem ismerte fel helyesen a karaktereket, sőt nem egyszer még a karakterek számában is tévesztett. Ez azért különösen meglepő, mert – ahogy korábban láttuk – amikor a feladatokat kellett szerkeszthető formában kinyerni a tanári javítást is tartalmazó dolgozatból, akkor még hibátlanul ismerte fel a karaktereket a Copilot. Mindezek következtében a hat számolás közül végül csak egyet minősített jónak a nyelvi modell, pedig csak az egyik részfeladatot rontotta el a tanuló.

image287.png

Ennél a feladatnál még beazonosítható volt a hiba oka, a számsorozatok folytatását kérő 3. feladatnál azonban nekem nem sikerült a problémát beazonosítani. Eleve érthetetlen, hogy a két sorozatból hogyan lett négy? Bár a szabályokat jól írta fel a program, nem mindig törődött a tanuló által beírt számokkal (például 49 helyett 50-et „ismert fel”), hallucinált nem létező számokat (például -20) és nem tartotta be a kért pontozási szabályt, mivel 4 pontot adott a feladatra.

Képernyőkép 2026-01-27 014221.png

A ChatGPT ezzel szemben az első két feladatot teljesen pontosan, a leírt szabálynak megfelelően értékelte ki. A számsorozatok javításánál azonban több hibát is vétett a program.

image290.png

A jól megállapított szabályok ellenére a számolási hibát egyik sorozatban sem ismerte fel a nyelvi modell és minden számot úgy vett, mintha azt a tanuló írta volna be, ezért adott 8 pontot mindkét esetben. Felhívtam a Copilot figyelmét az egyik számolási hibára:

image291.png

Ezek után a javítást már valamivel jobban végezte el a program, mert a számszaki hibákat felismerte. A pontozásban azonban ismételten hibázott. Nem ismerte fel az előre megadott számokat, csak a sorozat első értékét tekintette annak. Másrészt a humán értékelők sem adnának pontot a 42 + 4 = 45 lépésre, de a következő számokra már igen, mert a 45 után ismét jó a számolás.

Gemini – a ChatGPT-hez hasonlóan – az első két feladatot hibátlanul értékelte ki, de a számsorozatok javításánál szintén hibázott, minden hibás szám helyére jó számot hallucinált. A vizsgált nyelvi modellek közül azonban a Gemini volt az egyetlen, mely felismerte és a pontozás során figyelembe is vette, hogy három szám előre meg volt adva.

image292.png

Az elkövetett hibára a következő prompttal kapott figyelmeztetést: „A 3. feladat javítása hibás, a tanuló nem pontosan ezeket a számokat írta!” Ezt követően az MI már jól végezte el a javítást, de ez a nyelvi modell sem vette figyelembe a pontozásnál, hogy a hibázás (42 + 4 ≠ 45) után a tanuló már jól végezte el az összeadást.

image293.png

A bemutatott példa alapján kijelenthető, hogy a mesterséges intelligencia – bár korlátokkal, de – használható kézzel írt, számolásos feladatok javításához, értékeléséhez, de az igazi segítséget az jelentené a pedagógusok számára, ha szöveges válaszok javításához is használni lehetne az MI-t. Ha a tanulók a válaszukat digitálisan írják, akkor ez már most sem lehetetlen, de a kézírás felismerésével még sok gond lehet, különösen, ha a válaszban satírozás, nyilazás, betoldások vannak.

Javítás szempontjából a legidőigényesebb és legnehezebb feladat mindig az esszék javítása. Erre is hoztam egy példát, a 2025-ös középszintű történelem érettségi írásbeli vizsgájának egyik feladatán keresztül nézhetjük meg, mennyire végzik jól a nyelvi modellek az ilyen kérdések javítását, értékelését. Egy ilyen feladat végrehajtásához meglehetősen hosszú promptot kell megfogalmazni, mely a javítással kapcsolatos minden szempontot, elvárást magába foglal. Jelen esetben a prompt a következő volt:

„Gimnáziumi tanár vagy. A tanulók ezt a feladatot kapták: „Mutassa be a forrás és ismeretei segítségével a liberalizmus legfőbb politikai és gazdasági célkitűzéseit! Térjen ki röviden a liberalizmus és a nacionalizmus korabeli közös céljára is! A forrás: >>Húsz-huszonötmilliós nép vagyunk, melyet emberemlékezet óta ugyanazzal a névvel illetnek, az olasz névvel, melyet az Isten által valaha húzott legpontosabb természetes határok zárnak körül, mely ugyanazon nyelvet beszéli, ugyanazon hitet vallja, melynek ugyanazok a szokásai és hagyományai, amely büszke Európa-szerte ismert politikai, tudományos és művészeti múltjára. […] Nincs zászlónk, nincs állami nevünk, nincs rangunk az európai nemzetek között. Nincs közös központunk, közös [társadalmi] szerződésünk, közös piacunk. Hét államra vagyunk feldarabolva.<< (Giuseppe Mazzini politikus, 1845)”

Értékeld a tanuló válaszát a következő szempontok alapján! Határozd meg az egyes szempontokra járó pontszámot és az összpontszámot is. A szempontok:

  1. A tanuló alapvetően a liberalizmus politikai és gazdasági céljait mutatja be. A válasz a forrás felhasználásával lényegi összefüggéseket tár fel. 0–2 pont
  2. A tanuló válaszában utal arra, hogy a liberalizmus a francia forradalmat/a felvilágosodást követően/a 19. század első felében alakult ki, és utal arra, hogy az európai/amerikai államokban terjedt el. 0–2 pont
  3. Szakszerűen használja a tanuló a következő általános és konkrét történelmi fogalmakat: liberalizmus, alkotmány/nemzetállam/polgári nemzet, szabadverseny/kapitalizmus, jogegyenlőség/hatalmi ágak megosztása/népfelség. 0–2 pont
  4. A kifejtés mondatokból áll, és a szöveg logikusan felépített. A válasz nem tartalmaz súlyos nyelvhelyességi vagy helyesírási hibát. 0–2 pont
  5. A tanuló rögzít egy lényeges összekötő kapcsot vagy célkitűzést a szöveg alapján (például közös nyelv/terület/kultúra/történelem vagy alkotmány/nemzetgazdaság), és ezzel kapcsolatban megállapítja, hogy a liberalizmus és a nacionalizmus közös célja a nemzetállam/polgári nemzet létrehozása volt. 0–3 pont
  6. A tanuló rögzíti, hogy a liberalizmus legfőbb politikai célja az alkotmányosság/népfelség/jogegyenlőség megvalósítása, és ezzel kapcsolatban lényegi megállapítást tesz (például ennek megfelelően bővítené a választójogot; ezzel megvalósulna a népképviseleti rendszer; így érvényesülne a hatalmi ágak szétválasztása; ez biztosítaná a szabadságjogokat/az emberi jogokat; ezzel ellentétes az abszolutizmussal; ez a kiváltságok megszüntetését is jelentené). 0–3 pont
  7. Rögzíti, hogy a liberalizmus legfőbb gazdasági célja a szabadversenyes/kapitalista rendszer megvalósítása, és ezzel kapcsolatban lényegi megállapítást tesz (például: ez egyeztethető össze a szabadságjogokkal; így érvényesülne a vállalkozás/munkavállalás szabadsága; az állam gazdasági szerepét minimalizálná; megszüntetné a monopóliumokat/céheket/nemesi földtulajdont/jobbágyságot). 0–3 pont

Az értékelésnél vedd figyelembe, hogy ugyanaz a válaszelem nem fogadható el két külön tartalmi elem (forráshasználat, történelmi gondolkodás és történelmi ismeretek) pontozásánál is!”

Egy tanulói válasz a következő volt: „A liberalizmus a 19. században az egyéni szabadságjogokat, a törvény előtti egyenlőséget és a parlamenti rendszert akarta megvalósítani. Gazdaságban a szabad versenyt és a piac szabadságát támogatta, kevés állami beavatkozással. A forrásban Mazzini az olasz nép egységét hangsúlyozza: közös nyelvük és kultúrájuk van, mégis több államra vannak szétszakadva. Ez mutatja a nacionalizmus célját, vagyis a nemzetállamok létrehozását. A liberalizmus és a nacionalizmus közös célja az volt, hogy az emberek szabadon élhessenek, és a nemzetek önálló, egységes államokban szerveződjenek.”

Ezt a választ értékelték a korábban is használt nyelvi modellek, a következő pontszámokat adták:

az egyes szempontoknál
elérhető pontszám

Copilot
(nyílt hozzáféréssel)

Copilot (regisztrált felhasználóként)

ChatGPT

Gemini

0-2

2

2

2

2

0-2

0

1

1

2

0-2

2

2

2

2

0-2

2

2

2

2

0-3

3

3

3

3

0-3

1

2

1

3

0-3

2

2

1

3

Összesen

12

14

12

17

Három olyan szempont volt a hét közül, melyet a nyelvi modellek eltérően értékeltek. Ezek közül egyet, a másodikat nézzük meg részletesebben. Ez a szempont az vizsgálta, hogy a tanuló térben és időben jól helyezte-e el a forrásban megfogalmazottakat. Az egyes MI megoldások válaszait a képernyőképek vonatkozó részletein keresztül mutatjuk be:

Copilot (nyílt hozzáféréssel) által generált válasz:

image294.png

Copilot (regisztrált felhasználóként) által generált válasz:

image295.png

ChatGPT által generált válasz:

image296.png

Gemini által generált válasz:

image297.png

Laikusként is könnyen megállapítható, hogy a nyílt hozzáférésű Copilot értékelése hibás, hiszen a tanuló válasza tartalmazza az időpont megjelölését. Sőt a Gemini ezt a dátumot olyan fontosnak tartja, hogy a maximális pontszámot megadja erre a szempontra, pedig el is ismeri, hogy a térbeli elhelyezés hiányzik a szövegből.

Ez az anomália jól érzékelteti, hogy – bármennyire gondolják azt sokan, hogy a gép tévedhetetlen és teljesen objektív – jelenleg még egy részletesen megfogalmazott prompt alkalmazásával sem alkalmasak a nyelvi modellek esszé jellegű írások jó színvonalú értékelésére. Pontosabbá lehet tenni azonban ezt a folyamatot, például oly módon, hogy mi tanítjuk be értékelésre a mesterséges intelligenciát, akár saját magunk korábbi értékeléseinek a segítségével. Minél több példát mutatunk meg az MI-nek, annál pontosabb lesz a végeredmény, annál inkább hasonlít majd a program értékelési stílusa a saját stílusunkhoz, ugyanakkor az MI könnyen felfedezhet a mintaként betáplált javításokban létező, sőt nemlétező mintázatokat, így előítéletek, torzítások (bias) jelenhetnek meg az értékelésében, például tendenciaszerűen jobbra vagy éppen rosszabbra értékel bizonyos tanulói típusokat, csoportokat.

Személyes élményként el tudom mondani, hogy hallgatókkal végeztünk olyan feladatot, melynek során motivációs leveleket értékeltettünk nyelvi modellekkel, és nagy meglepetésünkre az egyik modell negatívan elfogultnak mutatkozott a férfi jelentkezők motivációs levelével szemben.

Zárásként

Előadásomban példákat kívántam bemutatni azzal kapcsolatban, hogyan lehet különböző, generatív mesterséges intelligencia alapú megoldásokat a mérés-értékelés folyamatába bevonni. Arra is igyekeztem rámutatni, hogy a használt nyelvi modellek milyen hibákat követnek el, miért nem lehet még automatikussá tenni a feladatlap készítését, illetve a kitöltött dolgozatok javítását. Éppen ezért megnyugodhat mindenki, a közeljövőben még nem fogják leváltani a humán pedagógusokat az MI alapú robot tanárok, hiába mondják ezt a technopesszimista nézőpont képviselői. Ez még akkor is igaz, ha már több országban is munkába álltak az első android tanárok, sőt már Magyarországon is vehet bárki olyan humanoid robotot, melyet oktatásra is alkalmasnak gondolnak a fejlesztők.

A másik szélsőséges nézőpont, a technooptimista megközelítés szerint viszont az MI alapú gépek mintegy modern rabszolgaként végeznek majd el minden olyan feladatot, amire utasítást kapnak, a pedagógusoknak pedig így több idejük marad tanítványaikra. Lesz idejük beszélgetésekre, a tehetségek felfedezésére, kibontakoztatására, jobban tudják majd segíteni a szocializációs folyamatokat.

A (közel)jövő valósága minden bizonnyal a két szélsőség között fog elhelyezkedni, de az nem kérdéses, hogy a mesterséges intelligencia egyre erőteljesebben lesz jelen a pedagógusok munkájában. Előbb-utóbb megjelennek majd az iskolákban a robot asszisztensek is, és ismét sokan fogják majd idézni Arthur C. Clarke kijelentését, mely szerint „Bármely tanárt, akit egy gép helyettesíteni tud, helyettesítsen is.” A mesterséges intelligencia alapú technológia viszont erre már sok tekintetben képes is lesz.