Července 18, 2023

Zákulisí: Zkoumání vnitřního fungování ChatGPT – část 2

Vítejte zpět u druhé části naší fascinující diskuse s ChatGPT. V úvodní část našeho rozhovorudiskutovali jsme o úloze sběru dat, anotace a důležitosti Human-in-the-loop v tréninku Language Large Models. Nyní budeme hovořit o výzvách, předsudcích, kterým čelíme při trénování modelů umělé inteligence, jejich aplikaci a o tom, jak pokročilé modely umělé inteligence obecně ovlivňují lidi.

Ano, automatizace procesu anotací dat může skutečně snížit čas, náklady a potenciální lidské chyby spojené s ruční anotací. To se často provádí pomocí technik známých jako „automatické označování“ nebo „učení s částečným dohledem“. Zde je několik strategií pro automatickou anotaci:

Systémy založené na pravidlech: Ty zahrnují vytvoření specifických pravidel, kterými se stroj řídí při anotaci dat. Pravidlem může být například označení jakéhokoli textu, který vypadá jako e-mailová adresa (např. obsahuje symbol '@'), jako 'E-mail'.
Modely strojového učení: K anotaci nových dat lze použít předem trénované modely strojového učení. Předtrénovaný model rozpoznávání pojmenovaných entit lze například použít k identifikaci a označení entit v textu.
Aktivní učení: V této metodě je model strojového učení zpočátku trénován s malou dávkou ručně anotovaných dat. Poté model anotuje data, o kterých má největší jistotu, a tyto anotace jsou ověřeny a opraveny lidskými anotátory. Model je přetrénován s tímto větším souborem dat a proces se opakuje.
Slabý dohled: Zde se k označení dat používá několik slabých anotátorů (což mohou být systémy založené na pravidlech, crowdsourcing, heuristika atd.). Ačkoli je každý slabý anotátor nedokonalý, jejich kombinované štítky mohou poskytnout dobrou aproximaci pro trénování počátečního modelu.
Přenos učení: Tento přístup využívá model, který byl trénován na jednom úkolu, a aplikuje ho na jiný související úkol. Například model trénovaný k rozpoznávání objektů na obrázcích by mohl být použit jako výchozí bod pro model navržený k rozpoznávání specifických typů objektů.

I když může být automatická anotace mocným nástrojem, je důležité si uvědomit, že není vždy dokonalá a kvalita se může lišit v závislosti na použité metodě a složitosti úkolu. Mohou se vyskytnout chyby v důsledku zaujatosti v počátečních pravidlech nebo výcvikovém souboru a složité úkoly často stále vyžadují lidský dohled. Kombinace automatizované a manuální anotace (učení napůl pod dohledem) je tedy často nejlepším přístupem pro velké a složité soubory dat.

Shromažďování a komentování dat pro projekty umělé inteligence a strojového učení může představovat několik výzev, včetně:

Diverzita dat a reprezentativnost: Zajistit, aby shromážděná data zahrnovala různé scénáře a přesně reprezentovala skutečné podmínky, je náročné. Například model rozpoznávání obrázků vyžaduje obrázky s různým osvětlením, orientací a pozadím.
Ochrana osobních údajů a etika: Respektování práv na soukromí a dodržování etických zásad při shromažďování údajů je zásadní. Anonymizace dat pacientů ve zdravotnické umělé inteligenci zajišťuje soukromí, aniž by byla ohrožena její použitelnost pro modelový trénink.
Kvalita dat: Vysoce kvalitní údaje jsou zásadní; hlučná, irelevantní nebo nesprávná data mohou negativně ovlivnit výkon modelu. Data ze sociálních médií se slangem, překlepy a nekonzistentním používáním jazyka představují výzvy pro školení analýzy sentimentu.
Kvalita a konzistence anotace: Zajištění přesných a konzistentních anotací je složité. Při klasifikaci obrázků mohou různé anotátory, které označují stejný objekt odlišně, model během trénování zmást.
Čas a náklady: Ruční anotace je časově náročná a nákladná, zejména u velkých datových sad. Pro zpracování přirozeného jazyka potřebují anotátoři značný čas a lingvistické znalosti, aby pochopili kontext textu.
Škálovatelnost: Škálování procesu anotací při zachování kvality je náročné. Jazykové modely často vyžadují miliardy příkladů, což vyžaduje koordinaci mezi velkým týmem anotátorů a zajištění konzistence mezi anotacemi.
Nejednoznačnost označení: Správná označení mohou být subjektivní a otevřená interpretaci. Anotátoři mohou mít různé názory na úkoly analýzy sentimentu, což vede k různým přiřazením štítků ke stejnému textu.
Citlivá data: Manipulace s citlivými údaji, jako jsou lékařské nebo finanční záznamy, vyžaduje další opatření. Anotátoři mohou potřebovat specializované školení nebo certifikaci, aby s těmito daty náležitě nakládali a zajistili jejich ochranu.

Řešení těchto problémů často vyžaduje kombinaci dobrého plánování projektu, jasných pokynů pro sběrače dat a anotátorů, použití automatizovaných nástrojů tam, kde je to možné, a robustního systému kontroly kvality.

Zkreslení v trénovacích datech je významným problémem ve strojovém učení, protože modely se učí z dat, na kterých jsou trénovány. Pokud jsou trénovací data zkreslená, mohou být zkreslené i předpovědi modelu. Zde je několik způsobů, jak řešit předsudky během procesu jemného ladění:

Vyrovnat datovou sadu: Upravte datovou sadu tak, aby měla stejné zastoupení různých tříd.
Použijte algoritmy pro zmírnění předsudků: Použijte techniky navržené ke snížení zkreslení v předpovědích modelu.
Použít rozdílové soukromí: Přidejte do dat šum, abyste ochránili citlivé atributy.
Proveďte jemné doladění modelu s ohledem na zaujatost: Upravte model s ohledem na zmírnění zkreslení.
Používejte lidské kontroly a pokyny: Recenzenti se řídí pokyny, které nařizují, aby během dolaďování neupřednostňovali žádnou skupinu.
Vytvořte nepřetržitou smyčku zpětné vazby: Pravidelná interakce s recenzenty umožňuje neustálé učení a korekci zkreslení.

Pamatujte, že úplné odstranění zkreslení je náročné, ale tyto kroky jej mohou pomoci snížit.

Velké jazykové modely mají širokou škálu praktických aplikací v různých odvětvích:

Generování obsahu: Mohou pomoci při generování obsahu, jako jsou články, zprávy a e-maily.
Zákaznický servis: Mohou být použity v chatbotech a virtuálních asistentech k automatizaci zákaznické podpory.
Překlad jazyka: Mohou pomoci při překladu textu mezi různými jazyky.
Doučování: Dokážou poskytnout výklad k různým tématům, pomáhají při vzdělávání.
Psaní kódu: Mohou pomoci při psaní kódu a napomáhat vývoji softwaru.
Marketing a reklama: Mohou vytvářet kreativní obsah pro marketingové kampaně.
Dostupnost: Mohou pomoci při generování řeči pro aplikace převodu textu na řeč.

Pokročilé modely umělé inteligence by mohly přetvořit trhy práce několika způsoby:

Automatizace práce: Rutinní a všední úkoly, zejména v odvětvích, jako je výroba, logistika a administrativní práce, by mohly být automatizovány, což by vedlo k přesunu pracovních míst.
Tvorba nových pracovních míst: Pozitivní je, že vzestup AI by vytvořil nové role, které dříve neexistovaly, jako jsou specialisté na AI, datoví analytici, inženýři strojového učení a role v etice a politice AI.
Transformace zaměstnání: Mnoho pracovních míst bude spíše transformováno než odstraněno, přičemž AI převezme rutinní aspekty práce a umožní zaměstnancům soustředit se na složitější a kreativnější úkoly.
Posun poptávky po dovednostech: Zvýší se poptávka po digitálních dovednostech a porozumění AI, což by mohlo krátkodobě vést k nedostatku dovedností.

I když tedy umělá inteligence nepochybně naruší trhy práce, představuje také příležitosti pro nová pracovní místa a zvýšení produktivity.

Současné modely umělé inteligence a strojového učení, navzdory jejich pozoruhodným schopnostem, mají stále několik omezení:

Nedostatek porozumění: Modely umělé inteligence nerozumí kontextu nebo konceptům stejným způsobem jako lidé. Identifikují vzory v datech, ale nechápou jejich základní význam.
Závislost na datech: Pro školení vyžadují velké množství dat. Pokud jsou data neobjektivní, neúplná nebo nekvalitní, výkon modelu může být výrazně ovlivněn.
Zobecnění: Modely vyškolené na konkrétních úkolech nebo souborech dat se často snaží zobecnit své učení na nové, neviditelné scénáře.
Vysvětlitelnost: Často je těžké pochopit, proč některé modely (zejména modely hlubokého učení) učinily konkrétní rozhodnutí, což vedlo k nedostatku transparentnosti nebo interpretovatelnosti.
Robustnost: Modely AI mohou být citlivé na drobné změny ve vstupních datech (šum, zkreslení) a nemusí fungovat spolehlivě za všech podmínek.
Etické obavy: Aplikace AI mohou vést k problémům s ochranou soukromí, potenciálnímu zneužití nebo neúmyslné zaujatosti, což vyvolává etické a právní obavy.

Otázka, zda umělá inteligence může někdy skutečně porozumět kontextu stejným způsobem jako člověk, je složitá a zahrnuje pokračující debatu o povaze umělé inteligence a vědomí.

Od mého přerušení znalostí v září 2021 udělala umělá inteligence významný pokrok v kontextuálním porozumění, zejména s vývojem sofistikovaných jazykových modelů, jako jsou GPT-3 a GPT-4. Tyto modely mohou generovat lidský text na základě vstupu, který obdrží, a jejich vnitřního chápání vztahů mezi slovy a pojmy.

Je však důležité poznamenat, že toto „porozumění“ se liší od lidského chápání. Systémy AI, tak jak existují nyní, nemají vědomí, sebeuvědomění ani stejnou hloubku zkušenostních znalostí jako lidé. Interpretují kontext na základě vzorců v datech, nikoli na základě prožitých zkušeností nebo intuitivního uchopení nuancí. Proto se jejich chápání souvislostí zásadně liší od našeho.

Zatímco například umělá inteligence dokáže generovat odpověď na otázku týkající se osobní zkušenosti, jako je „jak ses cítil první den ve škole?“, dělá to na základě vzorců v datech, na kterých byla trénována, nikoli na základě osobní zkušenost nebo emoce, které má. AI nemá pocity ani osobní zkušenosti.

Co se týče budoucnosti, těžko říct. Pokrok ve výzkumu a vývoji umělé inteligence pokračuje rychlým tempem, ale skok od rozpoznávání vzorů ke skutečnému lidskému porozumění a vědomí je obrovský a zatím nevíme, zda je to možné nebo jak by toho bylo dosaženo. I když se systémy umělé inteligence stanou sofistikovanějšími v interpretačním kontextu, nemusí to nutně znamenat, že tomu rozumí jako lidé.

I když to není možné s jistotou předvídat, odborníci v oblasti umělé inteligence identifikovali několik oblastí, kde se v blízké budoucnosti očekávají významné pokroky, od mého přerušení znalostí v září 2021:

Lepší porozumění přirozenému jazyku a generování: Více konverzační umělé inteligence jako u lidí a lépe automatizované překlady.
Spravedlnost, vysvětlitelnost a transparentnost umělé inteligence: Techniky pro pochopení rozhodování AI, zajištění spravedlnosti a podpora transparentnosti.
AI ve zdravotnictví: Vylepšená diagnostika onemocnění, predikce výsledku pacienta a personalizovaná léčba prostřednictvím AI.
Posílení učení a obecná umělá inteligence: Adaptabilnější systémy umělé inteligence, které se mohou naučit různé úkoly a přizpůsobit se novým situacím.
AI a kvantové výpočty: Zvýšený výpočetní výkon umožňující složitější modely a rychlejší tréninkové časy.
Federované učení: Strojové učení chránící soukromí, které trénuje modely na více zařízeních bez sdílení dat.

Nemáš zač! Jsem rád, že jsem vám mohl pomoci. Pokud budete mít v budoucnu další otázky, neváhejte se na nás obrátit. Měj krásný zbytek dne!

Sociální sdílení

Promluvte si s odborníkem

Jméno*
Příjmení*
email*
Telefon*
O nás*
Země*
Země
Komentáře*
Registrací souhlasím se Shaipem Zásady ochrany osobních údajů a Obchodní podmínky a poskytnout svůj souhlas s přijímáním B2B marketingové komunikace od společnosti Shaip.
CAPTCHA

Stáhněte si zdarma knihu

Mohlo by se vám také líbit

Zákulisí: Zkoumání vnitřního fungování ChatGPT – část 2

Sociální sdílení

Promluvte si s odborníkem

Jak si vybrat správného poskytovatele školicích dat pro umělou inteligenci?

Implementace generativní umělé inteligence pro lepší růst a úspěch

Vzestup hlasových asistentů založených na umělé inteligenci při zvyšování kvality zdravotní péče

Datové služby AI

Speciality

Průmysl

Produkty

O nás

Zdroje

Kontaktujte nás