Umělé inteligence (AI) jsou neuvěřitelně všestranné nástroje, které v závislosti na svém výcviku mohou nabývat různých osobností a stylů. To umožňují jazykové modely, což jsou algoritmy určené k pochopení a generování textu na základě velkého množství dat. Fascinujícím příkladem této všestrannosti je projekt Hayka Grigoriana, studenta informatiky na Muhlenberg College v Pensylvánii. Grigorian úspěšně vycvičil svou umělou inteligenci, aby psala jako autor viktoriánské éry, a to na základě londýnských textů z let 1800 až 1875.
O tomto příběhu jsme se v redakci dozvěděli prostřenictvím příspěvku na Redditu, kde Grigorian vysvětluje, že k tréninku své umělé inteligence použil přibližně 7 000 textů z této doby. Kromě toho vyvinul vlastní tokenizér, aby ze souboru dat odstranil moderní slovní zásobu.
My LLM trained from scratch on only 1800s London texts brings up a real protest from 1834
byu/Remarkable-Trick-177 inLocalLLaMA
Celkem vytrénoval tři různé modely: dva s nanoGPT a jeden s Phi 1.5. Tyto modely umožnily umělé inteligenci osvojit si hantýrku, slovní zásobu a kulturní odkazy viktoriánské éry.
Grigorian vypráví překvapivou zkušenost: „Po tréninku jsem si pohrával s několika podněty a použil tento: Byl rok Páně 1834.“ Odpověď umělé inteligence obsahovala odkazy na protesty v Londýně v tomto roce a končila biblickým citátem, což odráželo vliv textů použitých při jejím tréninku. AI také zmínila lorda Palmerstona, skutečnou historickou postavu. „Překračuje rámec napodobování textů z 19. století a dokáže si vybavit skutečné historické události.“
Grigorianovo překvapení se ještě zvětšilo, když dále zkoumal odkazy AI a zjistil, že k protestům v roce 1834 skutečně došlo. Navíc lord Palmerston, kterého AI zmiňuje, byl klíčovou politickou osobností, jejíž činy protesty vyvolaly. To ukazuje, že AI nejen napodobuje styl 19. století, ale dokáže si vybavit i skutečné historické události. Grigorian se zamýšlí nad potenciálem svého projektu: „To vše s pouhými 5–6 GB dat – představte si výsledky s 30 GB nebo více.“
Palmerston se stal premiérem, ale v roce 1834 byl britským ministrem zahraničí. Za jeho působení byl novelizován zákon o chudinské pokladně, který chudým zrušil právo na obživu, což vedlo k protestům, o nichž se zmiňuje Grigorianův AI.

Zdroj: Youtube.com
Projektům, jako je Grigorianův, říká HLLM neboli Historical Large Scale Language Models. Tyto modely umožňují zkoumat historii inovativním způsobem. Mezi další příklady patří MonadGPT, trénovaný na textech z let 1400 až 1700, a XunziALLM, který generuje klasickou čínskou poezii podle starých pravidel.
Takové projekty nám nejen umožňují kreativním způsobem oživit minulost, ale nabízejí také nové způsoby studia a pochopení historie. Trénováním jazykových modelů na historických textech můžeme objevit zákonitosti a souvislosti, které dříve nebyly patrné, a otevřít tak nové možnosti historického a literárního výzkumu.