De unde obține IA informații

De unde își ia IA informațiile?

Ai stat vreodată acolo scarpinându-te în cap, întrebându-te... de unde vin chestiile astea de fapt ? Adică, IA nu scotocește prin stive prăfuite de biblioteci și nu se uită pe furiș la scurt timp la scurtmetraje de pe YouTube. Și totuși, cumva, găsește răspunsuri la orice - de la trucuri cu lasagna la fizica găurilor negre - ca și cum ar avea un fișet fără fund înăuntru. Realitatea este mai ciudată și poate mai interesantă decât ai bănui. Hai să o deslușim puțin (și da, poate să demontăm câteva mituri pe parcurs).


Este vrăjitorie? 🌐

Nu e vrăjitorie, deși uneori așa pare. Ceea ce se întâmplă sub capotă este practic predicția de tipare . Modelele lingvistice mari (LLM) nu stochează fapte așa cum creierul tău reține rețeta de prăjituri a bunicii tale; în schimb, sunt antrenate să ghicească următorul cuvânt (token) pe baza a ceea ce a fost înainte [2]. În practică, asta înseamnă că se agață de relații: ce cuvinte se leagă între ele, cum prind de obicei contur propozițiile, cum sunt construite idei întregi ca o schelă. De aceea, rezultatul sună corect, chiar dacă - sincer - este mimetism statistic, nu înțelegere [4].

Deci, ce face ca informațiile generate de inteligența artificială să fie utile ? Câteva lucruri:

  • Diversitatea datelor - extragerea din nenumărate surse, nu dintr-un flux îngust.

  • Actualizări - fără cicluri de reîmprospătare, se deteriorează rapid.

  • Filtrare - în mod ideal, prinderea conținutului nedorit înainte ca acesta să se infiltreze (deși, să fim realiști, plasa are găuri).

  • Verificare încrucișată - bazarea pe surse autoritare (de exemplu, NASA, OMS, universități importante), care este o necesitate în majoritatea manualelor de guvernanță a IA [3].

Totuși, uneori inventează - cu încredere. Acelea așa-numite halucinații ? Practic, prostii șlefuite, spuse cu o față serioasă [2][3].

Articole pe care ți-ar putea plăcea să le citești după acesta:

🔗 Poate inteligența artificială să prezică numerele la loterie?
Explorând miturile și realitățile despre predicțiile loteriei bazate pe inteligență artificială.

🔗 Ce înseamnă să adopți o abordare holistică a inteligenței artificiale
Înțelegerea inteligenței artificiale din perspective echilibrate asupra eticii și impactului.

🔗 Ce spune Biblia despre inteligența artificială
Examinarea perspectivelor biblice asupra tehnologiei și creației umane.


Comparație rapidă: De unde provine inteligența artificială 📊

Nu fiecare sursă este egală, dar fiecare își joacă rolul. Iată o imagine de ansamblu.

Tipul sursei Cine îl folosește (IA) Cost/Valoare De ce funcționează (sau nu...)
Cărți și articole Modele lingvistice mari Neprețuit (cam) Cunoștințe dense, structurate - pur și simplu îmbătrânesc repede.
Site-uri web și bloguri Aproape toate IA-urile Gratuit (cu zgomot) Varietate sălbatică; un amestec de strălucire și gunoaie absolute.
Lucrări academice IA-uri cu ax mare pe cercetare Uneori cu plată Rigor + credibilitate, dar formulate într-un jargon greu.
Date utilizator IA-uri personalizate Foarte sensibil ⚠️ Croială elegantă, dar dureri de cap din belșug legate de intimitate.
Web în timp real IA-uri legate de căutare Gratuit (dacă este online) Păstrează informațiile proaspete; dezavantajul este riscul de amplificare a zvonurilor.

Universul datelor de antrenament 🌌

Aceasta este faza de „învățare din copilărie”. Imaginați-vă că i-ați da unui copil milioane de cărți cu povești, decupaje din ziare și găuri de pe Wikipedia, toate deodată. Așa arată pre-antrenamentul. În lumea reală, furnizorii combină date disponibile publicului, surse licențiate și text generat de instructor [2].

Suprapuse: exemple umane atent selecționate - răspunsuri bune, răspunsuri proaste, îndemnuri în direcția corectă - chiar înainte ca întărirea să înceapă [1].

Avertisment privind transparența: companiile nu dezvăluie fiecare detaliu. Unele bariere de siguranță sunt secrete (proprietate intelectuală, probleme de siguranță), așa că obțineți doar o perspectivă parțială asupra situației reale [2].


Căutare în timp real: Toppingul suplimentar 🍒

Unele modele pot acum să vadă în afara bulei lor de antrenament. Aceasta este generarea augmentată prin recuperare (RAG) - practic, extragerea de fragmente dintr-un index sau un depozit de documente live, apoi integrarea lor în răspuns [5]. Perfectă pentru informații care se schimbă rapid, cum ar fi titlurile de știri sau prețurile acțiunilor.

Problema? Internetul este în egală măsură genialitate și aruncare de gunoaie. Dacă filtrele sau verificările de proveniență sunt slabe, riști să se strecoare înapoi datele nedorite - exact despre care avertizează cadrele de risc [3].

O soluție obișnuită: companiile conectează modelele la propriile baze de date interne, astfel încât răspunsurile să citeze o politică de resurse umane actuală sau un document de produs actualizat în loc să improvizeze. Gândiți-vă: mai puține momente de „uh-oh”, răspunsuri mai de încredere.


Reglaj fin: Etapa de lustruire a inteligenței artificiale 🧪

Modelele brute pre-antrenate sunt greoaie. Așadar, acestea sunt reglate fin :

  • Învățându-i să fie de ajutor, inofensivi, onești (prin învățare prin consolidare din feedback-ul uman, RLHF) [1].

  • Șlefuirea marginilor nesigure sau toxice (aliniere) [1].

  • Ajustarea tonului - fie că este prietenos, formal sau sarcastic în joacă.

Nu este vorba neapărat de șlefuirea unui diamant, ci mai degrabă de a atrage o avalanșă statistică pentru a te comporta mai mult ca un partener de conversație.


Loviturile și eșecurile 🚧

Să nu ne prefacem că e impecabil:

  • Halucinații - răspunsuri clare care sunt complet greșite [2][3].

  • Prejudecată - oglindește modele integrate în date; le poate chiar amplifica dacă nu este controlată [3][4].

  • Fără experiență directă - poate vorbi despre rețete de supă, dar nu a gustat niciodată una [4].

  • Exces de încredere - proza ​​curge ca și cum ar ști, chiar și atunci când nu curge. Cadrele de risc pun accentul pe ipotezele de semnalare [3].


De ce te simți ca și cum ai ști 🧠

Nu are credințe, nu are memorie în sensul uman și cu siguranță nu are sine. Totuși, pentru că leagă propozițiile cu ușurință, creierul tău o citește ca și cum ar înțelege . Ceea ce se întâmplă este doar o predicție la scară largă a următorului token : calcularea a trilioane de probabilități în fracțiuni de secundă [2].

Atmosfera de „inteligență” este un comportament emergent - cercetătorii îl numesc, puțin ironic, „papagalului stochastic” [4].


Analogie pentru copii 🎨

Imaginează-ți un papagal care a citit toate cărțile din bibliotecă. Nu înțelege poveștile, dar poate remixa cuvintele în ceva care pare înțelept. Uneori este perfect; alteori este o prostie - dar cu suficient talent, nu poți observa întotdeauna diferența.


În concluzie: De unde provin informațiile inteligenței artificiale 📌

În termeni simpli:

  • Date masive de antrenament (publice + licențiate + generate de antrenor) [2].

  • Reglarea fină cu feedback uman pentru a modela tonul/comportamentul [1].

  • Sisteme de recuperare atunci când sunt conectate la fluxuri de date în timp real [5].

IA nu „știe” lucruri - ea prezice text . Aceasta este atât superputerea sa, cât și călcâiul lui Ahile. Concluzia? Verificați întotdeauna lucrurile importante cu o sursă de încredere [3].


Referințe

  1. Ouyang, L. și colab. (2022). Antrenarea modelelor lingvistice pentru a urma instrucțiuni cu feedback uman (InstructGPT) . arXiv .

  2. OpenAI (2023). Raport tehnic GPT-4 - o combinație de date licențiate, publice și create de oameni; obiectivul și limitările predicției next-token. arXiv .

  3. NIST (2023). Cadrul de gestionare a riscurilor în domeniul inteligenței artificiale (AI RMF 1.0) - proveniență, credibilitate și controale ale riscurilor. PDF .

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Despre pericolele papagalilor stochastici: Pot fi modelele lingvistice prea mari? PDF .

  5. Lewis, P. și colab. (2020). Generare augmentată prin recuperare pentru NLP intensivă în cunoștințe . arXiv .


Găsește cea mai recentă tehnologie AI în Magazinul oficial de asistenți AI

Despre noi

Înapoi la blog