Umělá inteligence zažívá proměnu – nehoní se už za kvanty dat, ale hledá kvalitu a lidskou zkušenost. Startupy jako Turing mění způsob tréninku AI: místo internetu používají skutečný svět, nahraný z pohledu těch, kdo tvoří, vaří nebo opravují.
Na vrcholu rozmachu umělé inteligence se nejcennějším zdrojem stala data. Výkonné modely nebo masivní infrastruktura už nestačí; to, co skutečně rozhoduje, je kvalita informací, z nichž se tyto stroje učí. Při tomto hledání se některé technologické společnosti opět obracejí na lidi, tentokrát ne jako na pouhé anotátory, ale jako na protagonisty jejich vlastní každodenní práce, zaznamenané na kameru a proměněné v surový materiál pro novou generaci modelů umělé inteligence.
Taylor (umělkyně, se kterou Tech Crunch vedl rozhovor a která požádala o nezveřejnění svého příjmení) byla součástí tohoto nového experimentu. Po celý letní týden měla se svou spolubydlící na čele připevněné kamery GoPro, když malovala, sochala nebo drhla nádobí. Vše, co dělaly, bylo pečlivě synchronizováno, aby se vytrénoval model počítačového vidění od startupu Turing, jehož cílem je naučit stroje chápat složité lidské úkoly z reálných videí.
„Vstali jsme, synchronizovali kamery a šli jsme vařit nebo tvořit,“ řekl Taylor. „Ale nakonec to bylo vyčerpávající. Pásky vám zanechávaly červené stopy na kůži a nakonec vás bolela hlava.“
Cílem Turing nebylo naučit model malovat, ale něco abstraktnějšího: dát umělé inteligenci vizuální a sekvenční pochopení fyzického světa, od toho, jak nakrájet cibuli, po to, jak namíchat cement nebo opravit zástrčku. Za tímto účelem společnost najímá umělce, kuchaře, dělníky a techniky. Jak vysvětlil Sudarshan Sivaraman, ředitel AGI (umělé obecné inteligence) ve společnosti Turing, manuální přístup je jediným způsobem, jak dosáhnout skutečně rozmanité databáze: „Zaznamenáváme všechny druhy manuálních prací, aby model pochopil, jak se daný úkol provádí. Různorodost je v předtréninkové fázi nezbytná.“
Od hladových algoritmů k hodnotě lidských odborných znalostí
To, co dělá společnost Turing, odráží hlubokou změnu v odvětví umělé inteligence. V prvních letech rozmachu společnosti plnily své modely daty získanými z internetu (webové stránky, fóra, sociální sítě) téměř bez jakýchkoli filtrů nebo kontroly kvality. Dnes jsou naopak přední společnosti ochotny platit značné částky za přesné, čisté a exkluzivní soubory dat.
Zdůvodnění je jednoduché: hrubé síly modelů již bylo dosaženo; konkurenční výhoda nyní spočívá v soukromých, dobře vyškolených datech. Namísto zadávání práce anonymním platformám dává mnoho společností přednost shromažďování vlastních dat nebo přímé kontrole jejich tvorby.

Zdroj: Youtube.com
Příkladem je společnost Fyxer, která využívá umělou inteligenci k třídění e-mailů a sestavování odpovědí. Zakladatel Richard Hollingsworth vysvětlil, že po několika zkouškách zjistili, že výkonnost jejich systému nezávisí ani tak na množství dat, jako na jejich kvalitě. „To, co skutečně určuje výkon, není objem, ale přesnost souboru dat,“ řekl.
V praxi to znamenalo něco kuriózního: v prvních měsících byli inženýři a manažeři v převaze nad výkonnými asistenty, odborníky, kteří byli zodpovědní za školení modelu v nuancích firemní pošty. Potřebovali jsme odborníky na lidské vztahy, lidi, kteří věděli, kdy si e-mail zaslouží odpověď a kdy ne. „Je to hluboce lidský problém,“ vysvětlil Hollingsworth.
Postupem času se proces stal selektivnějším: méně objemu, více kontroly. Stejně jako u Turing nahradila posedlost kurátorstvím dat nadšení pro masivní rozsah. V případě vizuálního modelu Sivaraman odhaduje, že 75-80 % dat, která Turing používá, je syntetických, generovaných z původních nahrávek. To však jen zvyšuje důležitost výchozího materiálu: „Pokud předtrénování nezačne na kvalitních datech, vše, co z nich odvodíte, bude chybné,“ vysvětlil.
Tento přístup má také strategickou logiku. V prostředí, kde může kdokoli používat modely s otevřeným zdrojovým kódem, spočívá skutečná odlišnost ve vlastních datech. Pro společnosti, jako je Fyxer, se práce člověka při sběru a anotaci stává pro konkurenty obtížně prolomitelnou zdí. „Věříme, že nejlepší cesta vpřed vede přes data: personalizované modely, lidské školení a vysokou kvalitu,“ shrnul Hollingsworth.
Na první pohled se tato metoda může zdát jako krok zpět v době automatizace: lidé zaznamenávají každý svůj pohyb, aby mohli učit stroje. Ve skutečnosti však připomíná, že umělá inteligence se stále potřebuje učit z přímé lidské zkušenosti. Bez těchto hodin pozorování (kartáčů, drátů a pánví) by modely byly pouhými sběrači statistických vzorců bez praktického významu.
Zatímco se tedy svět ptá, kdy přijde umělá obecná inteligence, Turing a další společnosti investují do jejího možná nejcennějšího základu: skutečného pochopení toho, jak se chovají lidské ruce. Možná, že budoucnost umělé inteligence nebude budována v uzavřených laboratořích, ale v domácnostech a dílnách, kde lidé jako Taylor den co den pokračují v učení strojů, co to znamená žít a tvořit ve fyzickém světě.
Úloha etiky při sběru dat
Přístup společnosti Turing a dalších firem také vyvolává důležité otázky týkající se etiky sběru dat. Zaznamenávání každodenních činností sice může poskytnout bohatý zdroj informací pro trénování modelů umělé inteligence, ale může také vyvolat obavy ohledně ochrany soukromí a souhlasu. Společnosti musí zajistit, aby účastníci plně rozuměli tomu, jak budou jejich údaje použity, a musí zavést opatření na ochranu soukromí jednotlivců.
Kromě toho je zásadní, aby tyto společnosti udržovaly rovnováhu mezi shromažďováním údajů a respektováním práv pracovníků. Účast by měla být dobrovolná a účastníci by měli být za svůj čas a úsilí spravedlivě odměněni. Transparentnost při využívání údajů a účelu školení v oblasti umělé inteligence je zásadní pro zachování důvěry veřejnosti.
Úspěch těchto projektů bude v konečném důsledku záviset nejen na kvalitě shromážděných údajů, ale také na schopnosti společností tyto etické problémy aktivně a odpovědně řešit.
Budoucí vývoj umělé inteligence
Strategie společnosti Turing a dalších společností využívat data z reálného světa k trénování modelů umělé inteligence by mohla znamenat významný posun ve způsobu vývoje technologií umělé inteligence. Tím, že se tyto společnosti zaměřují na hluboké porozumění lidským činnostem, pokládají základy pro umělou inteligenci, která bude nejen přesnější, ale také užitečnější a relevantnější pro každodenní život.

Zdroj: Youtube.com
Tento přístup by mohl otevřít nové příležitosti pro umělou inteligenci v oborech, jako je robotika, kde je schopnost pochopit a napodobit složité lidské úkoly klíčová. Kromě toho by tyto společnosti mohly zlepšením kvality tréninkových dat přispět ke snížení zkreslení v modelech AI, což by zase mohlo vést ke spravedlivějším a rovnějším aplikacím.
Shromažďování reálných dat pro trénování modelů umělé inteligence sice představuje výzvu, ale zároveň nabízí slibnou cestu k pokročilejší umělé inteligenci, která bude více zohledňovat potřeby člověka. Časem by toto úsilí mohlo změnit způsob, jakým komunikujeme s technologiemi a jak technologie komunikují s námi.