#realIT. Tendințe tehnologice pentru media în 2018. Sistemele AI scriu azi știrile de mâine
Lumea se schimbă pretutindeni în jurul nostru în ritm accelerat. Multe dintre noile tehnologii clamează că aduc revoluții în diferite domenii pentru ca după o scurtă perioadă de timp să lase locul unor tehnologii și mai performante care aduc alte și alte revoluții. Ritmul dezvoltării tehnologice devine din ce în ce mai rapid, iar jurnalismul este o profesie care se zbate să facă față schimbărilor și să se adapteze la lumea modernă și la instrumentele de diseminare a informației care îi asigură practic oricărui om cu un telefon mobil în buzunar o platformă în care să se exprime și să intre în legătură cu orice, fără limite geografice, culturale sau de vârstă.
Capacitatea de a disemina informația într-o fracțiune de secundă, oriunde pe glob este poate cel mai important vector cultural al globalizării. Jurnalismul, dotat cu noile tehnologii din era digitală, este o victimă a propriului succes și este condamnat să se adapteze sau să dispară, scrie Agerpres.ro.
Institutul american Future Today (FTI), înființat în 2006, își propune să-i ajute pe lideri și organizațiile pe care aceștia le conduc să se pregătească de azi pentru provocările cu care se vor confrunta mâine. FTI se concentrează exclusiv asupra modului în care noile tehnologii și ultimele descoperiri ale științei influențează sau afectează anumite domenii de afaceri, cum transformă forța de muncă și cum poate aprinde schimbări la nivel geopolitic.
In fiecare an FTI publică câte un raport al tendințelor cu care se va confrunta plaja media în cursul anului următor. Dacă aceste tendințe se vor dovedi oportunități sau se vor transforma în amenințări pentru actorii media și consumatorii de media, rămâne de văzut. Lista FTI pentru anul viitor cuprinde 75 de tendințe.
Tendințe 1 — 15. Inteligența artificială (AI)
Inteligența artificială se află pentru al 8-lea an consecutiv pe lista de tendințe observate de FTI, fiind de departe cea mai constantă dintre tendințele identificate. Multiplele fațete ale inteligenței artificiale sunt discutate de FTI încă din primul an în care această instituție a început să-și publice rapoartele. În sine, domeniul AI nu poate fi considerat un trend pentru că este o zonă mult prea vastă. Din acest motiv, FTI a identificat diferite teme în cadrul domeniului general AI care reprezintă tendințele pentru anul 2018.
Simplist, inteligența artificială reprezintă o ramură a informaticii în care calculatoarele sunt programate să facă activități pentru care, de obicei, este nevoie de inteligență umană. Aceste programe fac calculatoarele capabile să învețe din experiențe, să facă raționamente, să rezolve probleme, să înțeleagă diferite limbi și să perceapă o anumită situație sau mediu de interes. Există două categorii diferite de AI: slabă (sau îngustă) și puternică (sau generală). Cea slabă este folosită pentru anumite nișe de activitate și pentru anumite funcții specifice. Atunci când un robot jurnalist scrie o știre pornind de la datele structurate de care dispune, este un caz de AI slab. În afara jurnalismului, exemplele sunt multiple: filtrele de spam folosite de serviciul de e-mail, motoarele care oferă recomandări pe YouTube sau Amazon etc.
FTI remarcă 9 tendințe specifice care își trag seva din domeniul larg al inteligenței artificiale.
1. Mașini care învață în timp real
A devenit recent posibil să folosim un flux constant de date tranzacționale pentru a modifica, în timp real, modelele computerizate folosite de programele de tranzacționări pe burse. În domeniul media, această tehnologie poate fi folosită pentru a le oferi consumatorilor de presă un produs personalizat, cât mai apropiat de nevoile sale de consum. În plus, acest sistem promite să detecteze fraudele în timp real și face posibilă implementarea unor măsuri de securitate mult mai stricte, cum ar fi identificarea cuiva doar și după modul în care scrie pe internet.
2. Mașini care înțeleg ceea ce citesc (Machine Reading Comprehension — MRC)
Pentru cercetătorii din domeniul AI, programarea unor mașini să înțeleagă ceea ce citesc a reprezentat o provocare de mult timp, pentru că miza este una importantă. Atunci când operăm o căutare pe un motor, să spunem pe Google, nu ne-am dori să primim un răspuns cât mai exact și la obiect, spre deosebire de lista de adrese de internet pe care trebuie să le examinăm una după alta pentru a căuta ceea ce ne interesează? Dar dacă ni s-ar arăta și paragraful cel mai relevant din pagina pentru informația căutată? Aceasta este promisiunea făcută de MRC. Sistemul MRC nu se concentrează doară pe identificarea cuvintelor cheie. În viitorul apropiat, un sistem MRC va putea citi, înțelege și instantaneu va oferi doar răspunsul dorit.
MRC este un pas necesar în obținerea inteligenței artificiale puternice sau generale, însă pe termen scurt are capacitatea de a transforma site-ul unei agenții de știri într-o adevărată bază de date personalizată nevoilor oricărui utilizator. Această funcție ar putea deveni și mai utilă odată ce interfețele de recunoaștere a conținutului exprimat prin viu grai vor deveni mai răspândite.
3. Înțelegerea limbii native (Natural Language Understanding — NLU)
Suntem înconjurați de mesaje text nestructurate — fie că este vorba despre postări pe social media, de postări pe bloguri, pe site-urile de internet ale unor companii, pe site-urile autorităților ș.a.m.d. NLU le permite cercetătorilor să cuantifice și să structureze toate aceste texte extrăgând concepte, identificând relații și analizând feedback-ul primit. Tehnologia NLU le va permite organizațiilor media să parcurgă întregi baze de date de documente și să obțină informația căutată mult mai rapid decât ar putea să o facă un singur redactor.
4. Generarea de limbaj (Natural Language Generation — NLG)
Algoritmi pot transfera date în corpul unei știri folosind tehnologie de generare de limbaj (NLG). Zeci de agenții de presă și alte organizații media, printre care Bloomberg și Associated Press, folosesc Automated Insights, un program care adună singur date și este capabil să scrie peste 2.000 de știri pe secundă pe subiecte variate.
5. Algoritmi care generează voce, sunet și video
Cercetători de la Institutul Tehnologic din Massachusetts (MIT) studiază modul în care copiii învață noi cuvinte pentru a pregăti computerele să recunoască în mod automat vorbirea. De asemenea, programatori pregătesc computere pentru a identifica ce sunete trebuie să se audă din interacțiunea unor obiecte pe care le văd pe imagini video. Spre exemplu ce sunet se produce dacă lovim cu un băț de tobe o canapea? Dar un geam? Obiectivul acestor studii este de a "ajuta" sistemele AI să înțeleagă cum interacționează obiectele în realitate. Viitoare versiuni ale acestor algoritmi vor putea fi folosite pentru a produce în mod automat sunete și efecte sonore pentru filme și emisiuni de televiziune. În cursul acestui an, cercetători de la Universitatea din Washington au folosit un astfel de program pentru a-l prezenta pe președintele Barack Obama susținând un discurs pe care, de fapt, nu l-a susținut niciodată.
6. Completarea imaginii
Dacă un calculator dispune de acces la suficient de multe imagini — de ordinul milioanelor — poate genera fragmentele lipsă din aceste fotografii. Acest sistem are aplicații practice în special pentru fotojurnaliști — dacă imaginea din fundal a unui munte este neclară, calculatorul poate suprapune în mod automat o altă versiune clară a aceluiași munte, rezultând fotografia perfectă. Astfel de sisteme AI pot fi folosite și pentru identificarea unor persoane sau obiecte care apar în fotografii.
7. Sisteme AI cu vedere predictivă
Cercetătorii de la MIT au reușit să conceapă algoritmi care nu doar că identifică conținutul video, dar pot prezice și ce vor face în continuare oamenii care apar în respectivul conținut. Antrenat pe videoclipurile de pe YouTube dar și pe seriale precum "The Office" sau "Desperate Housewives", un astfel de algoritm poate prezice dacă protagoniștii conținutului video se vor săruta, se vor îmbrățișa, își vor strânge mâinile sau se vor certa. Acest tip de algoritm le va permite roboților de mâine să navigheze mai ușor în mediul uman și să interacționeze cu noi ținând cont de indicii precum limbajul corpului. În presă, acest tip de program poate fi folosit pentru a concepe conținut personalizat pentru fiecare consumator în parte.
8. Piețe pentru algoritmi
Majoritatea organizațiilor media nu-și pot permite înființarea unor departamente speciale de programatori care să dispună de timp nelimitat pentru a crea, testa și perfecționa astfel de algoritmi. Prin urmare, comunitățile de programatori își oferă produsele în noile piețe pentru algoritmi. Algorithmia este similară Amazon, doar că este dedicată exclusiv algoritmilor. Aici programatorii își salvează programele în cloud și sunt plătiți atunci când cineva le accesează creațiile. DataXu oferă de asemenea o piață pentru algoritmii săi. La fel și PrecisionHawk și alte câteva, iar în cursul anului viitor numărul acestor piețe ale programatorilor va crește.
9. Consolidarea AI
Există voci care trag un semnal de alarmă asupra ecosistemelor AI, aducând în discuție faptul că viitorul acestui domeniu se află la discreția unui număr redus de companii foarte mari: Google, Amazon, Tencent, Baidu, IBM, Facebook, Apple și Microsoft. Alte câteva companii mari, precum Intel Capital, Google Ventures, GE Ventures, Samsung Ventures, Tencent și In-Q-Tel investesc în domeniu. La fel cum s-a întâmplat și până acum, atunci când doar o mână de companii domină un domeniu, ele vor monopoliza atât noile talente cât și proprietatea intelectuală. Atunci când se discută viitorul inteligenței artificiale, trebuie să ne întrebăm dacă această consolidare a domeniului în portofoliul unui număr limitat de companii va avea efecte benefice.
Sistemele AI sunt create însă de oameni și pot "moșteni" de la aceștia, intenționat sau în mod neintenționat, "prejudecăți" în ceea ce privește modul de abordare, sortare și analizare a datelor, precum și în soluțiile pe care le propun — ceea ce ne trimite la următoarea tendință identificată de FTI:
10. Prejudecățile ascunse în AI
Pentru al treilea an pe lista tendințelor se află prejudecățile care pot fi ascunse în AI. Nu mai este niciun secret că unele dintre modelele actuale de învățare pentru mașini sunt programate părtinitor, la fel cum și programatorii care scriu acești algoritmi au prejudecățile lor, mai mult sau mai puțin conștiente. În 2016 ProPublica.org a publicat o investigație excepțională despre așa-numitul concept de "machine bias" și asupra problemelor generate de folosirea sistemelor AI pentru a-i identifica pe viitorii infractori. Ei au descoperit că așa-numitele programe de "evaluare a riscurilor", ce sunt din ce în ce mai comune în instanțele de judecată americane și sunt folosite pentru a stabili cuantumul unei amenzi sau durata unei sentințe, sunt părtinitoare și oferă sentințe mai grele pentru americanii de culoare decât pentru albi.
11. Jurnalism Computațional
Tot pentru al treilea an pe lista tendințelor se află și conceptul de Jurnalism Computațional. Care sunt modurile în care algoritmii și datele pot îmbunătăți meseria reporterilor? Jurnalismul Computațional este construit pe fundația veche de 25 de ani a Reportajului Asistat de Calculator (Computer Assisted Reporting — CAR) și este o tehnică a jurnalismului de investigație. Reporterii adună documente publice, le examinează cu instrumentele oferite de Jurnalismul Computațional și descoperă (uneori) povești ascunse. Printre instrumentele Jurnalismului Computațional se numără indexarea surselor în mai multe limbi, raportarea automată a informațiilor de interes, vizualizarea algoritmică, analiza multidimensională a seturilor de date etc. Aceste instrumente le permit jurnaliștilor să combine datele de care dispun și să descopere eventualele conexiuni dintre acestea, identificând relații obscure între persoane și organizații, relații care altfel ar fi fost imposibil sau foarte greu de descoperit.
12. I-Teams pentru algoritmi și date
Pentru prima oară pe lista de trenduri apare un tip nou de echipă pentru operațiuni speciale de care ar putea avea nevoie organizațiile media: reporteri de investigații specializați în analiza datelor și algoritmilor pentru a preveni soluțiile părtinitoare pe care acestea ar putea să le aplice. Spre exemplu, sistemul PredPol folosit de poliția americană suferă din cauza prejudecăților celor care au adunat datele și le-au introdus în acest sistem. Astfel, modul în care sunt centralizate datele despre arestări și felul în care fiecare departament de poliție își desfășoară activitatea pot afecta întregul sistem. Reporteri de la New York Times, Wall Street Journal, ProPublica și Washington Post au aplicat metodologia jurnalistică pentru a investiga astfel de algoritmi.
13. Crowdlearning
Suntem deja familiarizați cu conceptul de "crowdsourcing", prin care jurnaliștii solicită publicului larg să contribuie cu conținut sau să participe la procesul jurnalistic cu materiale trimise de la fața locului, cu prilejul diferitelor evenimente. Pentru al doilea an pe lista tendințelor se află și conceptul de "crowdlearning", o tehnică a jurnalismului computațional care analizează datele pasive — activitatea online și offline a cuiva, dosarul său medical, locațiile frecventate etc, pentru a înțelege ceva nou despre respectiva persoană și pentru a identifica, posibil, un subiect de presă.
14. Adversarial Machine Learning (AML)
Pe scurt, un conținut adversarial — o fotografie, un clip video sau un fișier audio — are codificată în el o mică modificare, de obicei una care este imperceptibilă oamenilor, ce este inserată pentru a-i ajuta pe programatori să ajusteze modelele folosite în procesul de învățare al mașinilor (machine learning). Hackerii pot profita de conținut adversarial pentru a ataca un anumit model, provocându-l să greșească.
Pentru ca sistemele de învățare a mașinilor să poată învăța, ele trebuie să recunoască și cele mai subtile diferențe. Informația adversarială poate fi ca o iluzie optică imperceptibilă pentru ochiul uman. Poate fi un singur pixel dintr-un milion care are culoarea greșită sau nu este aliniat. Pentru un om, ansamblul tuturor pixelilor formează o imagine clară, chiar dacă unul dintre ei este adversarial. Pentru un calculator, un singur pixel adversarial dintr-un milion poate face ca respectiva imagine să fie de neînțeles. AML se află pentru al doilea an pe lista de tendințe a FTI.
15. Fotografia computațională
Fotografia computațională se află pentru al treilea an pe listă și reprezintă convergența dintre capacitatea de a vedea a computerelor, grafica pe calculator, internet și fotografie. În loc să se bazeze doar pe procese optice, fotografia computațională apelează la tehnologii de captare și procesare digitală pentru a reda imagini din viața reală. În prezent, oricine are în buzunar un smartphone are acces la instrumente ce țin de fotografia computațională. Noi programe de cercetare derulate de Nvidia și de University of California din Santa Barbara propun o nouă tehnică de zoom computațional ce le permite fotografilor să modifice compoziția fotografiilor lor în timp real. Alte exemple sunt folosirea acestor instrumente pentru a adăuga sau exclude obiecte din fotografie, pentru a schimba umbre sau reflexii etc.
Google a dezvoltat o tehnologie care retușează și îmbunătățește automat calitatea fotografiilor realizate cu telefonul mobil. Aici apar implicații de ordin etic pentru jurnaliști. Cât de mult poate fi modificată fotografia unui fotoreporter și în ce circumstanțe? Astfel, jurnaliștii ar trebui să găsească o modalitate prin care să dezvăluie cât de mult a fost editată o fotografie și prin ce mijloace, dacă editarea a fost făcută de ei sau în mod automat, înainte de a folosi respectiva fotografie pentru a ilustra o știre.
- Poliţiştii au primit 54 autovehicule noi. Cum arată maşinile de poliţie şi ce dotări au (FOTO)
- Incendiu într-un magazin de gadget-uri din Bălţi! Toată tehnica, făcută scrum în câteva minute
- Tehnică dentară de peste patru mii de lei, reţinută la vamă. Proprietara nu a putut demonstra provenienţa mărfii