A mesterségesintelligencia-alapú szoftverek verbális intelligenciáját vizsgálták az Eötvös Loránd Tudományegyetem Pedagógiai és Pszichológiai Karán. A kutatás nyomán kiderült, hogy szóismeretükben még a doktori fokozattal rendelkező anyanyelvi beszélőket is maguk mögé utasítják a gépek.
A nagy nyelvi modellek, mint például a ChatGPT, az emberi szövegekhez hasonló tartalmak létrehozására képes mesterségesintelligencia-típusok. Az ilyen modellek komoly áttörést hoztak a mesterséges intelligencia világában, és egyre inkább képesek emberi képességeket élethűen utánozni.
Szakértők régóta foglalkoznak azzal a kérdéssel, hogy a gépek mennyire intelligensek az emberekhez viszonyítva. A klasszikus tesztek, mint a Turing-teszt, azonban csak azt vizsgálják, hogy a gépek mennyire képesek utánozni az emberi kommunikáció univerzális aspektusait. Ezzel szemben az emberi intelligencia mérése az egyéni különbségekre koncentrál, és az IQ-t is mások teljesítményéhez viszonyítjuk.
Egyes kutatók szerint az MI intelligenciájának mérésére a pszichometriai tesztek a legalkalmasabbak. Kovács Kristóf, az ELTE PPK Kognitív Képességek Kutatócsoport vezetője és Klein Balázs, a tesztplatformok szakértője egy tanulmányukban a ChatGPT és a Bing mesterséges intelligenciáinak verbális intelligenciáját hasonlították össze több mint 9000 emberével. A kutatásban egy adaptív szókincstesztet használtak, amely során a tesztalanyoknak két, jelentésben hasonló szót kellett kiválasztaniuk kilenc közül. A nehézségi szintet a teszt során egy algoritmus igazította az alany képességeihez.
Mindkét nyelvi modell rendkívüli eredményt mutatott: az emberek 95%-ánál, beleértve a doktori fokozattal rendelkező anyanyelvi beszélőket is, jobban teljesítettek. Ha ezek a gépek emberek lennének, kiemelkedő tehetségnek számítanának. A kutatók szerint az is valószínűsíthető, hogy hamarosan a mesterséges intelligenciák szókincse minden emberénél fejlettebb lesz.
A gépek magas teljesítményük ellenére hibáztak is. A kérdések ismétlődésekor az esetek 42%-ában eltérő válaszokat adtak, ami embereknél nem fordul elő. Ezen kívül előfordult, hogy olyan szavakkal válaszoltak, amelyek nem voltak a megadott lehetőségek között, bár korábban már helyesen megoldották az adott kérdést. Ezek a hibák azonban nem az MI gyengeségére utalnak, hanem arra, hogy az emberek számára tervezett pszichometriai tesztek bizonyos korlátokkal bírnak az MI esetében.
A kutatás eredményei felvetik a kérdést, hogyan tudjuk megkülönböztetni a mesterséges intelligencia által generált tartalmat az emberitől, ha a gépek ilyen fejlett verbális képességekkel rendelkeznek. A kutatók szerint érdemes gyanút fogni, ha egy szöveg túlságosan szofisztikált – előfordulhat, hogy MI dolgozik mögötte, gazdagabb szókincset használva, mint az átlagember.