Automatizarea: viitorul științei datelor și al învățării automate?

Învățarea automată a fost unul dintre cele mai mari progrese din istoria calculelor și este acum văzută ca fiind capabilă să joace un rol important în domeniul datelor mari și al analizei. Analiza datelor mari este o provocare imensă din perspectiva unei întreprinderi. De exemplu, activități precum înțelegerea numărului mare de diferite formate de date, analiza pregătirii datelor și filtrarea datelor redundante pot necesita resurse mari. Recrutarea specialiștilor în științe de date este o propunere costisitoare și nu un mijloc de finalizare pentru fiecare companie. Experții consideră că învățarea automată poate automatiza multe dintre sarcinile asociate analizei - atât de rutină, cât și complexe. Învățarea automată automată poate elibera resurse semnificative care ar putea fi utilizate pentru o muncă mai complexă și inovatoare. Învățarea automată pare să se miște tot timpul în această direcție.

Automatizarea în contextul tehnologiei informației

În IT, automatizarea este conectarea diferitelor sisteme și software, permițându-le să îndeplinească sarcini specifice fără nicio intervenție umană. În IT, sistemele automate pot realiza atât lucrări simple, cât și complexe. Un exemplu de lucru simplu ar putea fi integrarea formularelor cu PDF-urile și trimiterea documentelor către destinatarul corect, în timp ce furnizarea de copii de rezervă în afara site-ului ar putea fi un exemplu de activitate complexă.

Pentru a vă face treaba corect, trebuie să programați sau să dați instrucțiuni clare sistemului automat. De fiecare dată când este necesar un sistem automatizat pentru a-și modifica domeniul de activitate, programul sau setul de instrucțiuni trebuie actualizat de către cineva. Deși sistemul automat este eficient în activitatea sa, pot apărea erori din mai multe motive. Când apar erori, cauza principală trebuie identificată și corectată. În mod clar, pentru a-și face treaba, un sistem automat este complet dependent de oameni. Cu cât natura lucrării este mai complexă, cu atât este mai mare probabilitatea de erori și probleme.

Un exemplu comun de automatizare în industria IT este automatizarea testării interfețelor de utilizator bazate pe web. Cazurile de testare sunt introduse în scriptul de automatizare și interfața cu utilizatorul este testată în consecință. (Pentru mai multe despre aplicația practică a învățării automate, consultați Învățarea automată și Hadoop în Detecția fraudei de generația următoare.)

Argumentul în favoarea automatizării este că îndeplinește sarcini de rutină și repetabile și îi eliberează pe angajați pentru a face sarcini mai complexe și creative. Cu toate acestea, se susține, de asemenea, că automatizarea a exclus un număr mare de sarcini sau roluri îndeplinite anterior de oameni. Acum, odată cu învățarea automată care intră în diferite industrii, automatizarea poate adăuga o nouă dimensiune.

Viitorul învățării automate automate?

Esența învățării automate este capacitatea unui sistem de a învăța continuu din date și de a evolua fără intervenția umană. Învățarea automată este capabilă să acționeze ca un creier uman. De exemplu, motoarele de recomandări de pe site-urile de comerț electronic pot evalua preferințele și gusturile unice ale utilizatorului și pot oferi recomandări cu privire la cele mai potrivite produse și servicii din care să aleagă. Având în vedere această capacitate, învățarea automată este văzută ca fiind ideală pentru automatizarea sarcinilor complexe asociate cu big data și analize. A depășit limitele majore ale sistemelor automate tradiționale care nu permit intervenția umană în mod regulat. Există mai multe studii de caz care demonstrează capacitatea învățării automate de a efectua sarcini complexe de analiză a datelor, care vor fi discutate mai târziu în această lucrare.

După cum sa menționat deja, analiza datelor mari este o propunere provocatoare pentru companii, care poate fi parțial delegată sistemelor de învățare automată. Din perspectiva afacerii, acest lucru poate aduce multe beneficii, cum ar fi eliberarea resurselor științei datelor pentru sarcini mai creative și cu misiune critică, sarcini de lucru mai mari, mai puțin timp pentru finalizarea sarcinilor și rentabilitate.

Studiu de caz

În 2015, cercetătorii MIT au început să lucreze la un instrument de știință a datelor care poate crea modele de date predictive din cantități mari de date brute folosind o tehnică numită algoritmi de sinteză a caracteristicilor profunde. Oamenii de știință susțin că algoritmul poate combina cele mai bune caracteristici ale învățării automate. Potrivit oamenilor de știință, aceștia l-au testat pe trei seturi de date diferite și extind testarea pentru a include mai multe. Într-o lucrare care va fi prezentată la Conferința internațională despre știința și analiza datelor, cercetătorii James Max Kanter și Kalyan Veeramachaneni au spus: „Folosind un proces de reglare automatizată, optimizăm întreaga cale fără implicarea umană, permițându-i să se generalizeze la diferite seturi de date”.

Să ne uităm la complexitatea sarcinii: algoritmul are ceea ce este cunoscut sub numele de capacitate de auto-ajustare, cu ajutorul căruia informații sau valori pot fi obținute sau extrase din date brute (cum ar fi vârsta sau sexul), după care datele predictive se pot crea modele. Algoritmul folosește funcții matematice complexe și o teorie a probabilității numită Gaussian Copula. Prin urmare, este ușor de înțeles nivelul de complexitate pe care îl poate gestiona algoritmul. Această tehnică a câștigat și premii în competiții.

Învățarea automată ar putea înlocui temele

Se discută în întreaga lume că învățarea automată ar putea înlocui multe locuri de muncă, deoarece îndeplinește sarcini cu eficiența creierului uman. De fapt, există o anumită îngrijorare că învățarea automată va înlocui oamenii de știință a datelor și pare să existe o bază pentru o astfel de îngrijorare.

Pentru utilizatorul mediu care nu are abilități de analiză a datelor, dar are diferite grade de nevoi analitice în viața de zi cu zi, nu este fezabil să se utilizeze computere care pot analiza volume imense de date și pot furniza date de analiză. Cu toate acestea, tehnicile de procesare a limbajului natural (NLP) pot depăși această limitare învățând computerele să accepte și să proceseze limbajul uman natural. În acest fel, utilizatorul mediu nu are nevoie de funcții sau abilități analitice sofisticate.

IBM consideră că nevoia de oameni de știință a datelor poate fi redusă la minimum sau eliminată prin intermediul produsului său, platforma Watson Natural Language Analytics. Potrivit lui Marc Atschuller, vicepreședinte de analiză și business intelligence la Watson, „Cu un sistem cognitiv precum Watson, pur și simplu îți pui întrebarea - sau dacă nu ai o întrebare, îți încarci datele și Watson se poate uita la ea și deduceți ce ați putea dori să știți. ”

Concluzie

Automatizarea este următorul pas logic în învățarea automată și deja experimentăm efectele în viața noastră de zi cu zi - site-uri de comerț electronic, sugestii de prieteni Facebook, sugestii de rețea LinkedIn și clasamente de căutare Airbnb. Având în vedere exemplele date, nu există nicio îndoială că acest lucru poate fi atribuit calității rezultatului produs de sistemele automate de învățare automată. Pentru toate calitățile și beneficiile sale, ideea învățării automate care provoacă un șomaj uriaș pare cam prea exagerată. Mașinile înlocuiesc oamenii în multe părți ale vieții noastre de zeci de ani, dar oamenii au evoluat și s-au adaptat pentru a rămâne relevanți în industrie. Potrivit punctului de vedere, învățarea automată pentru întreaga sa perturbare este doar un alt val la care oamenii se vor adapta.


Ora postării: 03-Aug-2021