Óriási a verseny a mesterségesintelligencia-modelleket építő világvállalatok között. Mindenki szeretne a másikénál jobb, okosabb, pontosabb rendszert alkotni, hisz végső soron az emberek is ezeket a megoldásokat választják. A versenynek valószínűleg sosem lesz vége, időnként azonban vehetünk róla lenyomatot, hogy épp hol tartanak a szereplők.
Ennek vizsgálatát végezte el áprilisban a Mensa Norway, azaz a világ elismerten legintelligensebb embereinek klubjának norvég része. Lényegében nem csináltak mást, mint egy IQ-tesztet kitöltettek a különböző MI-rendszerekkel, melyek kiértékeléséből kijött az intelligenciahányadosuk, vagyis az IQ-számuk.
Egy átlagember IQ-ja 100, míg akiket valódi géniuszoknak szoktunk nevezni, általában 130-as IQ-val rendelkeznek. Több rendszer ezt a szintet lazán megugrotta, míg másoknak azonban az átlagemberi szint sem jött össze.
Nézzük is az eredményeket:
| Grok-4.20 Expert Mode | 145 |
| OpenAI GPT 5.4 Pro (Vision) | 145 |
| Gemini 3.1 Pro Preview | 141 |
| OpenAI GPT 5.4 Thinking (Vision) | 139 |
| OpenAI GPT 5.3 | 136 |
| Grok-4.20 Expert Mode (Vision) | 133 |
| OpenAI GPT 5.4 Thinking | 133 |
| Meta Muse Spark | 133 |
| Gemini 3.1 Pro Preview (Vision) | 132 |
| Qwen 3.5 | 130 |
| Claude-4.6 Opus | 130 |
| Kimi K2.5 | 127 |
| Manus | 115 |
| DeepSeek R1 | 112 |
| DeepSeek V3 | 111 |
| Gemini 3.1 Flash Preview | 110 |
| Llama 4 Maverick | 110 |
| OpenAI GPT 5.3 (Vision) | 109 |
| Claude-4.6 Sonnet | 106 |
| Bing Copilot | 101 |
| Perplexity | 97 |
| Mistral Medium 3.1 | 96 |
| Claude-4.6 Sonnet (Vision) | 94 |
| Claude-4.6 Opus (Vision) | 82 |
| Llama 4 Maverick (Vision) | 79 |
| OpenAI GPT 5.4 Pro | 73 |
Mint látható, a prímet az Elon Musk-féle xAI egyik fejlettebb változata vitte a ChatGPT-t készítő OpenAI egyik legújabb, 5.4-es programverziójával. Utóbbi mellett a Vision szócska is ott szerepel zárójelben, de több másik rendszernél is olvashatjuk ezt – ez azt jelenti, hogy ezek a rendszerek felfognak a szövegesen túl képi információt is, pl. ki tudnak rakni egy puzzle-t. A dobogóra a Google-féle Gemini 3.1-es Pro változatának előnézeti verziója fért fel.
Mezei felhasználói szempontból az ingyenes verziók tudása lehet igazán érdekes. Az OpenAI esetében a GPT 5.3 használható cikkünk megjelenésekor ingyen, mely mellett 136-os IQ-érték szerepel. A Grok önbevallása szerint “simán a Grok 4” a csevegőpartnerünk, olyan pedig nincs is szerinte, hogy Grok 4.20. A Gemini esetében webböngészőből a 3 Flash verzió érhető el ingyenesen, melynek külön szintén nem mérték le az IQ-szintjét.
És te okosabb vagy a mesterséges intelligenciánál? Itt kiderítheted!