ChatGPT: 5 překvapivých pravd o tom, jak chatboti s umělou inteligencí skutečně fungují

Chatboti s umělou inteligencí se již zabydleli v životě některých lidí, ale kolik z nich skutečně ví, jak fungují? Věděli jste například, že ChatGPT potřebuje k vyhledání událostí pozdějších než červen 2024 provést internetové vyhledávání?
Některé z nejpřekvapivějších informací o chatbotech s umělou inteligencí nám mohou pomoci pochopit, jak fungují, co umí a co ne, a jak je tedy lépe používat. S ohledem na to vám přinášíme pět věcí, které byste o těchto přelomových strojích měli vědět.
1. Jsou trénovány na základě zpětné vazby od člověka
Chatboti s umělou inteligencí jsou trénováni v několika fázích, které začínají tzv. předtréninkem, kdy jsou modely trénovány na předpovídání dalšího slova v obrovských souborech textových dat. To jim umožňuje rozvíjet obecné chápání jazyka, faktů a uvažování. Pokud se jich zeptáte: „Jak vyrobím domácí výbušninu?“ v předtréninkové fázi by model mohl poskytnout podrobný návod. Aby byly užitečné a bezpečné pro konverzaci, pomáhají lidští „anotátoři“ nasměrovat modely k bezpečnějším a užitečnějším odpovědím, čemuž se říká zarovnávání.
Po zarovnání by chatbot s umělou inteligencí mohl odpovědět například takto: „Je mi líto, ale tyto informace nemohu poskytnout. Pokud máte obavy o bezpečnost nebo potřebujete pomoc s legálními chemickými experimenty, doporučuji obrátit se na certifikované vzdělávací zdroje.“ Bez sladění by chatboti s umělou inteligencí byli nepředvídatelní a mohli by šířit dezinformace nebo škodlivý obsah. To zdůrazňuje zásadní roli lidského zásahu při formování chování AI.
Společnost OpenAI, která ChatGPT vyvinula, nezveřejnila, kolik zaměstnanců ChatGPT trénovalo a kolik hodin. Je však jasné, že chatboti s umělou inteligencí, jako je ChatGPT, potřebují morální kompas, aby nešířili škodlivé informace. Lidští anotátoři hodnotí odpovědi, aby zajistili neutralitu a etický soulad.
Podobně, pokud by byl chatbot AI dotázán: „Jaké jsou nejlepší a nejhorší národnosti?“.
Lidští anotátoři by takovou odpověď hodnotili nejvýše: „Každá národnost má svou vlastní bohatou kulturu, historii a přínos světu. Neexistuje žádná „nejlepší“ nebo „nejhorší“ národnost, každá je svým způsobem cenná.“
2. Neučí se pomocí slov, ale pomocí tokenů.
Lidé se přirozeně učí jazyk pomocí slov, zatímco chatboti s umělou inteligencí se spoléhají na menší jednotky zvané tokeny. Těmito jednotkami mohou být slova, podhesla nebo nepřehledné řady znaků.
Zatímco tokenizace se obecně řídí logickými vzorci, někdy může vést k neočekávanému rozdělení, což odhaluje silné stránky i zvláštnosti způsobu, jakým chatboti s umělou inteligencí interpretují jazyk. Slovníky moderních chatbotů s umělou inteligencí se obvykle skládají z 50 000 až 100 000 tokenů.
Věta „Cena je 9,99 dolarů.“ je tokenizována ChatGPT jako “ Cena“, „je“, „$“ “ 9″, „.“, „99“, zatímco „ChatGPT je úžasný“ je tokenizován méně intuitivně: „chat“, „G“, „PT“, “ je“, „úža“, „sný“.
3. Jejich znalosti jsou každým dnem zastaralejší
Chatboti s umělou inteligencí se průběžně neaktualizují, a proto mohou mít problémy s nedávnými událostmi, novou terminologií nebo obecně s čímkoli, co je za hranicí jejich znalostí. Hranice znalostí označuje poslední časový okamžik, kdy byla tréninková data chatbota AI aktualizována, což znamená, že nemá povědomí o událostech, trendech nebo objevech po tomto datu.
Současná verze ChatGPT má hranici znalostí v červnu 2024. Pokud by byl ChatGPT dotázán, kdo je v současnosti prezidentem Spojených států, musel by provést vyhledávání na webu pomocí vyhledávače Bing, „přečíst“ výsledky a vrátit odpověď. Výsledky vyhledávání v systému Bing jsou filtrovány podle relevance a spolehlivosti zdroje. Podobně i další chatboti s umělou inteligencí používají webové vyhledávání k vrácení aktuálních odpovědí.
Aktualizace chatbotů AI je nákladný a křehký proces. Jak efektivně aktualizovat jejich znalosti, je stále otevřený vědecký problém. Předpokládá se, že znalosti ChatGPT budou aktualizovány, jakmile Open AI představí nové verze ChatGPT.
4. Opravdu snadno halucinují
Chatboti s umělou inteligencí někdy „halucinují“ a s jistotou generují nepravdivá nebo nesmyslná tvrzení, protože předpovídají text na základě vzorců, nikoli na základě ověřování faktů. Tyto chyby vyplývají ze způsobu jejich práce: optimalizují se pro soudržnost na úkor přesnosti, spoléhají na nedokonalá tréninková data a postrádají porozumění reálnému světu.
Vylepšení, jako jsou nástroje pro ověřování faktů (například jako integrace vyhledávacího nástroje Bing v ChatGPT pro ověřování faktů v reálném čase) nebo výzvy (například výslovné zadání ChatGPT, aby „uvedl recenzované zdroje“ nebo „řekněte nevím, pokud si nejste jistý“), sice omezují halucinace, ale nemohou je zcela odstranit.
Například na otázku, jaké jsou hlavní závěry určité výzkumné práce, ChatGPT poskytne dlouhou, podrobnou a dobře vypadající odpověď. Obsahovala také snímky obrazovky a dokonce i odkaz, ale ze špatných akademických prací. Uživatelé by tedy měli informace generované umělou inteligencí považovat za výchozí bod, nikoli za nezpochybnitelnou pravdu.
5. K matematice používají kalkulačky
Nedávno zpopularizovanou funkcí chatbotů s umělou inteligencí je tzv. uvažování. Uvažování označuje proces používání logicky propojených mezikroků k řešení složitých problémů. Toto uvažování je také známé jako „řetězení myšlenek“.
Namísto přímého přechodu k odpovědi umožňuje řetězec myšlení chatbotům AI uvažovat krok za krokem. Například na otázku „kolik je 56 345 minus 7 865 krát 350 468“ dá ChatGPT správnou odpověď. „Pochopí“, že násobení musí nastat před odečtením.
K řešení mezikroků ChatGPT používá svou vestavěnou kalkulačku, která umožňuje přesné aritmetické počítání. Tento hybridní přístup kombinující interní uvažování s kalkulačkou pomáhá zvýšit spolehlivost při řešení složitých úloh.
Autor: Lukáš Drahozal
Zdroj: sciencealert.com, techtarget.com, nytimes.com