Magic Kovács Miklós 2023. 05. 17.

A Terminator-filmekre emlékeztető trükköt fejleszt az Apple

A hangszintetizálás új szintjét tudja majd az iOS operációs rendszer következő generációja, ami a mesterséges intelligenciával párosítva gyakorlatilag helyettesíthet minket a telefonbeszélgetések során.

1991-ben a Terminátor 2: Az ítélet napja még csak egy zseniális sci-fi-akciófilmnek tűnt. 2023-ból nézve viszont inkább tűnik próféciának. Mert lehet, hogy az évszámokat nem találták el a forgatókönyvírók, de ma már van olyan humanoid robot, ami cikázva, szaltózva képes tereptárgyak között szaladni, sőt a rácsokon átfolyó mesterséges anyag fejlesztése is zajlik, a hangunkat, személyiségünket átvevő programok pedig már nem csupán prototípusok, hanem lassan a mindennapok részét képezik.

Mindenki emlékszik az ikonikus jelenetre a filmből, amikor Arnold Schwarzenegger, vagyis a T-800 101-es modell egy telefonfülkéből hívja fel John Connor nevelőszüleinek házát, hogy kiderítse, élnek-e még. A robot a film szerint tökéletesen utánozza más emberek hangját, és ez akkoriban döbbenetes, jövőbe mutató elképzelésnek tűnt. 

Erre most, 2023-ban jön az Apple, és csak úgy mellesleg, egy konferencián bejelenti, hogy az új operációs rendszer, az iOS 17 rendelkezni fog egy ilyen funkcióval. Természetesen kizárólag jó célok vezérelték a fejlesztést, ezt a megoldást azoknak szánja az Apple, akik elvesztették hangjukat, valamilyen betegség miatt nehézséget okoz nekik a beszéd. 

A Personal Voice elnevezésű alkalmazás bármelyik iPhone és iPad eszközön futhat majd, amire előzőleg feltelepítették az új operációs rendszert. Az applikáció tulajdonképpen digitális változatot készít a felhasználók hangjáról, a funkció használható lesz személyes beszélgetések, telefonhívások, FaceTime-videohívások során is.

Akár videótelefonálás közben is lehet majd használni a funkciót, a beírt üzenetet felolvassa az applikáció (Fotó: Apple)

Akár videótelefonálás közben is lehet majd használni a funkciót, a beírt üzenetet felolvassa az applikáció (Fotó: Apple)

A rendszer olyan szintetizált hangot hoz létre, amely megtartja a felhasználó sajátos stílusát. A legfrissebb információk szerint a beírt szöveget az alkalmazás automatikusan fel fogja olvasni. A szintetizált hangot a CNBC szerint nagyon egyszerű lesz majd létrehozni, mindössze hogy egy 15 perces hanganyagot kell rögzíteni, a többit elintézi az eszköz processzora és az algoritmus. 

Bár a szándék nemes, azért nem nehéz elképzelni, hogy valaki egy unalmas online munkabeszélgetésen átadja a helyét a robotpilótának.

Forrás: CNBC
Kép(ek) forrása: Apple, Getty Images