Ajutam specialistii in date sa va imbunatateasca viteza si inteligenta proceselor
7/7729
calendar_month 16 Sep 2021, 09:56
Cand IT-ul a lansat o platforma de Enterprise Data Science în 2020, pentru a ajuta specialistii în date sa construiasca procese bazate pe inteligenta artificiala (IA) si machine learning (ML) în cadrul Dell, principala provocare era ca cei 1.800 de angajati din companie deja implicati în stiinta datelor (data science) sa adopte aceste procese.
Anul trecut, platforma era utilizata în proportie de 50%, iar utilizarea sa este în crestere; între timp, se înregistreaza si o crestere a cererii de capabilitati în domeniul stiintei datelor, iar în acest context, Dell IT continua sa investeasca în IA si ML. Acum avem în perspectiva o provocare mai ampla: toate aplicatiile Dell sa se foloseasca de inteligenta artificiala si machine learning.
Un aspect fundamental pentru realizarea acestei viziuni este îmbunatatirea proceselor de date si a vitezei acestora, îmbunatatind astfel experienta end-to-end a specialistilor în date.
Ce am învatat
Într-un articol anterior, descriam crearea platformei de Enterprise Data Science - Democratizing Data Science, A Federated Approach to Supporting AI and ML. Aceasta platforma suporta în prezent peste 650 de utilizatori si va atinge pragul de 1.000 de utilizatori, pana la finalul anului. În consecinta, echipa Enterprise Data Science a adoptat o abordare mai holistica a stiintei datelor. Am descoperit cateva aspecte-cheie, care ne ajuta sa investim în directia corecta.
În primul rand, am descoperit ca nu exista o solutie unica pentru toate provocarile, în domeniul stiintei datelor. Exista trei tipuri de utilizatori de date – echipele în curs de formare, echipele proaspat formate care au înregistrat primele lor reusite si echipele mature, care sunt în cautare de capabilitati avansate. Daca prima categorie de utilizatori are nevoie de o solutie simpla si usor de folosit, a treia categorie îsi doreste o solutie customizabila, care o va ajuta sa acceseze resurse ample de date sau modele de implementare si integrare.
Depunem eforturi sa satisfacem aceste nevoi diverse, folosindu-ne de standardizare, planuri de executie si automatizari. Le satisfacem si punand la dispozitia specialistilor în date o echipa IT la care pot apela direct pentru sfaturi si ajutor.
Exista profiluri diferite de utilizatori de date, dar exista si nevoi comune. Toate încep cu datele – cu nevoia de a le descoperi, de a le obtine, de a le procesa în siguranta si de a le analiza pentru a obtine tipare si informatii utile. De obicei, lucreaza în mod iterativ, adica obtin datele, le analizeaza, le interpreteaza si valideaza rezultatele, apoi o iau de la început si obtin alte date. E un ciclu urmat de utilizatori pentru a obtine datele care le sustin ipotezele. De obicei, aceste ipoteze se nasc din oportunitati de afaceri identificate de un expert în domeniu si preluate de ingineri si specialisti în date. Cu cat ciclul valideaza ipoteza mai rapid, cu atat sunt mai bune rezultatele pe care le poate livra echipa de stiinta datelor.
Echipa responsabila pentru platforma Enterprise Data Science lucreaza la instrumente care sporesc viteza acestor procese repetitive, în special a automatizarii accesului la date si a procesarii de date, arie asupra careia specialistii în date se concentreaza cel mai mult.
În prezent, specialistii în date trebuie sa descopere singuri unde sunt datele de care au nevoie în bazele de date Dell si cum sa le acceseze. E posibil sa caute prin tabele si sa întrebe în stanga si în dreapta, pana gasesc ce cauta. Imaginati-va sute de oameni care fac asta în mod repetat si izolati. Activitatea lor le permite sa descopere si sa creeze în mod efectiv valoare din informatii, definind datele cele mai utile pentru optimizarea unui proces.
Obiectivul nostru este de a ajuta specialistii în date sa se miste mai repede si sa extraga datele valoroase pe care le creeaza. Pentru a atinge acest obiectiv, colaboram cu specialistii nostri în date, pentru a identifica ariile de top din care colecteaza datele si pentru a oferi o solutie care standardizeaza procesul de descoperire, colectare si procesare a datelor din aceste locatii. Ideea este sa le permitem sa acceseze datele instantaneu si în siguranta, în data lake-ul Dell si în multe alte depozite de date din companie.
Cand specialistii în date obtin datele dorite, le oferim suport pentru a versiona, documenta, testa si cataloga noile seturi de date pe care le creeaza si le pun la dispozitia altor echipe specializate în date.
Toate capabilitatile noastre se bazeaza pe API-uri (Application Programming Interfaces) pe care le combinam în pachete de tip SDK (Software Development Kit) si le punem la dispozitia specialistilor în date. Acestea îi ajuta sa ne utilizeze tehnologia mai usor, folosind limbajul preferat (ex. Python), într-o maniera foarte simpla si eficienta.
Ne apropiem mai rapid de modelele IA
Dincolo de aspectele legate de date, specialistii în date au în comun nevoi legate de alti pasi ai procesului de dezvoltare, inclusiv utilizarea algoritmilor pentru a rezolva o problema si apoi construirea si antrenarea modelului care livreaza rezultatul dorit.
Pe masura ce am adaptat suportul acordat specialistilor în date, echipa noastra a realizat ca majoritatea specialistilor în date îsi configureaza algoritmi foarte similari, pentru functii specifice în cadrul modelelor si ca, în mod invariabil, îsi încep munca folosind cantitati mici de date. Apoi, îsi cresc modelele în timp. Totusi, observam ca fiecare membru al echipei noastre îsi începe fiecare proiect de la zero.
Echipa Enterprise Data Science include o sub-echipa specializata în DevOps pentru IA si ML, care asigura template-uri si configurari de infrastructura, pentru a ajuta specialistii sa îsi puna modelele în functiune mai rapid si sa le creasca în mod mai eficient. Obiectivul nostru este de a facilita proiecte mai rapide, de la design, pana la productie. Cu acest scop, echipa noastra de software engineering lucreaza împreuna cu specialistii în date, în primul rand pentru a întelege si executa o serie de cazuri de utilizare, apoi pentru a identifica punctele în care procesul este repetitiv si pentru a crea solutii.
Activitatea noastra initiala ne-a ajutat sa cream algoritmi de baza, ceea ce înseamna ca specialistii în date nu vor fi nevoiti sa porneasca de la zero, de fiecare data cand îsi creeaza modele. În mod similar, specialistii în date pot folosi planurile de executie care îi ajuta sa ruleze sarcini de lucru în paralel, sa foloseasca instante de calcul specializate (de tipul GPU-urilor), sa antreneze si sa re-antreneze algoritmii la scara. Primele noastre template-uri sunt incluse în fiecare spatiu de lucru de pe platforma noastra IA/ML, iar utilizatorii trebuie doar sa le deschida si sa-si faca modificarile ca sa se apuce de treaba. Datele initiale indica faptul ca utilizatorii pot progresa de la idee la productie de 6 pana la 10 ori mai repede, cu ajutorul acestor instrumente.
Reglaje fine, pe ultima suta de metri
Din punctul de vedere al clientului si al afacerii, cel mai important pas în stiinta datelor este „ultima suta de metri” a procesului – cand modelele de IA si ML sunt implementate în aplicatiile Dell, pentru a obtine valoare din noile observatii si inovatii pe care le genereaza. si aici, echipa responsabila pentru platforma Enterprise Data Science lucreaza sa sporeasca viteza si eficienta, adaugand template-uri, instruire si suport.
Pentru a accelera aceste task-uri, echipa se concentreaza asupra transferului de abilitati si asupra instruirii. Pe de-o parte, trebuie sa antrenam specialistii în date sa construiasca modele mai bine pregatite pentru deployment, folosind tehnologie standardizata, pe care inginerii nostri o pot întelege si o pot implementa rapid în aplicatii. Pe de alta, trebuie sa ajutam echipele de engineering sa se familiarizeze cu tehnologiile bazate pe stiinta datelor, pentru a finisa deployment-urile la nivel de productie.
Momentan, echipa lucreaza la 7 cazuri de engagement în productie, pentru a implementa modele noi de date în aplicatiile IT. Acestea îi vor ajuta pe ingineri sa defineasca tipare de standardizare si sa creeze o arhitectura comuna. Pana la jumatatea lui 2021, speram sa reducem durata implementarilor de acest gen de la mai multe luni, pana la 6-8 saptamani.
stiinta datelor, IA si ML sunt arii ale tehnologiei care se schimba cel mai mult si, în acelasi timp, reprezinta o oportunitate uriasa pentru noi de a îmbunatati experienta clientilor si rezultatele comerciale. Am facut progrese uriase în îmbunatatirea proceselor de stiinta datelor care sustin inovatia în toate diviziile Dell si vom continua sa dezvoltam capabilitati standard si automate, pentru a îmbunatati eficienta.
Totusi, poate cel mai mare succes al nostru este faptul ca oferim suport într-o maniera mai directa si mai ne-automatizata. Cand specialistii în date si inginerii au nelamuriri, ne pot contacta, cineva de la IT va raspunde, iar noi învatam din fiecare interactiune. Asta defineste echipa noastra de Enterprise Data Science.



Despre autor: Francisco Garcia

Francisco este membru Dell Digital si conduce Centrul de Excelenta IA, care se concentreaza asupra cresterii ratei de adoptare a proceselor IA si ML, ajutand diviziile sa identifice, sa dezvolte si sa implementeze modele care îmbunatatesc experienta clientilor si le optimizeaza performanta de business. Francisco s-a alaturat diviziei Dell IT în 2010, dupa finalizarea studiilor la Universitatea Stanford. În cadrul Dell IT, a ocupat pozitii în Product Management and Leadership, ocupandu-se de experientele Dell în vanzari si commerce: Dell.com, Electronics & Accessories Online, B2B Online