Egyre több AI-eszközt használunk nemcsak gépelve, hanem beszéddel is: élő voice módban vagy egyszerűen úgy, hogy bediktáljuk a promptot. A nagyobb asszisztensek ma már mind kínálnak valamilyen hangalapú használatot, de a nyelvi támogatás és a működés módja termékenként eltér. A ChatGPT, a Gemini és a Microsoft Copilot esetében a magyar és az angol is támogatott, míg a Claude esetében a voice mód jelenleg angol nyelvű. A Perplexitynél pedig a voice funkció dokumentált, de a hivatalos nyelvi támogatás kevésbé egyértelműen van összefoglalva.
A lényeg azonban nemcsak az, hogy lehet-e beszélni az AI-hoz, hanem az, hogy beszéd közben máshogy promptolunk, mint írásban. Amikor gépelünk, általában már a beküldés előtt tömörítünk, szerkesztünk, pontosítunk. Amikor beszélünk, sokkal természetesebben adunk több kontextust, javítjuk magunkat menet közben, és hangosan gondolkodunk. Ez nem hátrány — sőt, sok helyzetben éppen ez segít. Egy félkész gondolatot, egy összetettebb helyzetet vagy egy döntési dilemmát gyakran könnyebb elmondani, mint elsőre jól leírni.
A legpraktikusabb különbség talán ez:
írásnál tömörebben kérdezünk, beszédnél bővebben magyarázunk. Ezért a beszédes prompting akkor működik jól, ha nem próbáljuk „szóban legépelni” a promptot, hanem adunk neki egy egyszerű szerkezetet
A legtöbb hétköznapi üzleti helyzetben elég ez a négy elem:
Feladat → Kontextus → Korlát → Kimenet
Vagyis:
Ez gépelve is működik, de diktálásnál különösen hasznos, mert rendet tesz a természetesen hosszabb, lazább bemondott promptokban.
Egy kevésbé hatékony, spontán diktált prompt például így hangzik:
„Segíts kérlek összerakni a holnapi megbeszélést, mert most még nincs teljesen összeállva a fejemben. Több nyitott témám is van, és azt érzem, hogy ha csak simán végigmegyek rajtuk, akkor nem lesz elég világos, mi a lényeg. Valahogy azt szeretném, hogy legyen egy logikus íve, emelje ki a fontos pontokat, és az is látszódjon, hol kellene döntést kérni vagy továbbmenni. Nem kell hosszúra, inkább legyen jól követhető és könnyen elmondható.”
Ugyanez strukturáltabban:
„Feladat: segíts felkészülni egy holnapi megbeszélésre. Kontextus: három nyitott témát kell röviden összefoglalnom, és szeretném kiemelni a döntési pontokat. Korlát: legyen tömör, világos és könnyen elmondható. Kimenet: adj egy rövid napirendet, három talking pointot és egy 30 másodperces nyitó összefoglalót."
A különbség nem az, hogy a második prompt rövidebb. Hanem az, hogy jobban szervezett. Beszédnél ez sokszor fontosabb, mint a tömörség.
A tapasztalat szerint főleg ezekben a helyzetekben hasznos:
Ilyenkor a beszéd természetesebb, gyorsabb és kevésbé „szerkesztett”, ami kifejezetten előny lehet.
Beszédes promptingnál érdemes mindig egy utolsó, formázó mondattal zárni a kérést. Például:
Ez segít abban, hogy a természetes, bővebb bemondott inputból gyorsan használható kimenet legyen.
| Eszköz | Beszédes használat típusa | Angol | Magyar | Rövid megjegyzés |
| ChatGPT | Élő hangbeszélgetés + diktálás | Igen | Igen | A ChatGPT támogatott nyelvei között szerepel a magyar; voice használat elérhető. |
| Gemini, Gemini Live | Élő hangbeszélgetés + mikrofonos bevitel | Igen | Igen | A Gemini nyelvi beállítása a beszélt használatra is kihat; a magyar támogatott nyelv. |
| Microsoft Copilot | Copilot Voice | Igen | Igen | A Microsoft hivatalosan felsorolja a magyart és az angolt a támogatott hangnyelvek között. |
| Claude | Voice mode + diktálás | Igen | Nem hivatalos / korlátozott | A voice mode jelenleg angolul érhető el, a diktálási nyelvek között a magyar nem szerepel. |
| Perplexity | Voice Assistant / hangalapú asszisztens | Igen / nem egyértelműen részletezett | Nem egyértelműen részletezett | A voice funkció elérhető, de a hivatalos nyelvi lista nem ennyire világos. |
Válassz egy egyszerű, hétköznapi feladatot — például:
Ezután ugyanazt a feladatot kétszer add oda az AI-nak:
Feladat → Kontextus → Korlát → Kimenet
Például:
„Feladat: írj egy rövid összefoglalót egy vezetői update-hez. Kontextus: több párhuzamos feladat fut, és szeretném kiemelni, hol van szükség döntésre. Korlát: legyen világos, tárgyilagos és tömör. Kimenet: egy rövid bekezdés és három bullet."
A két eredményt érdemes egymás mellé tenni. Sokszor azt fogod látni, hogy a gépelt változat feszesebb, a diktált változat pedig több használható kontextust ad. A legjobb eredmény gyakran abból jön, ha a kettőt tudatosan kombináljuk.
Egyetlen apró kísérlet is elég ahhoz, hogy kiderüljön: nálad mikor jobb az írás, és mikor ad többet a beszéd.
Források: OpenAI Help Center (Voice Mode FAQ; ChatGPT language settings), Google Gemini Support és Google Blog (Gemini language settings; Gemini Live language expansion), Microsoft Support (Copilot supported regions and languages), Anthropic Support (Claude voice mode and dictation), Perplexity Help Center (iOS Voice Assistant; Android Assistant).
