Data Mining in mediul R. Teorie si aplicatii

Data Mining in mediul R. Teorie si aplicatii

Autori: Stelian Stancu

Anul aparitiei: 2022

ISBN: 978-606-34-0433-7

Format: 17/24 cm

Numar pagini: 191

43,50 lei In stoc: DA
Livrare prin Posta Romana

 La achizitia acestei carti de pe site-ul Editurii ASE se va aplica un discount de 16% pentru toti cei care au conturi de site cu adrese de e-mail din domeniul @ase.ro.

 

Procedura recunoscuta sub denumirea de Data Mining se poate defini, in sens larg, drept o activitate ce presupune cautarea, colectarea si analiza datelor.

Cantitati insemnate de date pot fi colectate din surse variate, precum diverse baze de date sau site-uri web. Forma sub care sunt regasite aceste date poate fi aceea a unor corelatii sau pattern-uri, iar odata cu inovatiile si progresul tehnologic, extragerea acestor date a devenit din ce in ce mai simpla.

La nivel de companie sau de industrie, datele au devenit o resursa extrem de importanta. Extragerea unor informatii utile din surse de date neorganizate constituie o activitate din ce in ce mai populara, gratie tehnicilor actuale de Data Mining, care permite transformarea datelor primare in informatii valoroase.

Lucrarea Data Mining în mediul R. Teorie și aplicații este structurata pe 11 capitole, fiind conceputa cu scopul de a constitui un ghid util atat pentru cercetatori, cat si pentru practicieni, in vederea cunoasterii unor aspecte mai mult sau mai putin analitice referitoare la domeniul Data Mining.

Primul capitol al acestei carti este dedicat prezentarii unei scurte introduceri in latura analizei de text (Text Mining) si implementarii acesteia in mediul de programare R. Ulterior, o etapa extrem de importanta in contextul analizei de tip Text Mining, respectiv preprocesarea datelor este detaliata in cadrul celui de-al doilea capitol. Capitolele 3 si 4 urmaresc expunerea analizei de tip cluster, respectiv analizei de sentiment in contextul Text Mining. In cel de-al cincilea capitol este tratata problematica arborilor de regresie si arborilor de clasificare. Capitolul 6 este dedicat prezentarii unor metode populare si extrem de utile de Data Mining, respectiv metodelor de tip ansamblu: bagging, boosting si stacking. In cadrul celui de-al saptelea capitol este evidentiata comparatia dintre metodele de tip ansamblu bagging și boosting. Modelele de tip ansamblu vor fi abordate si în capitolele 8, respectiv 9, în contextul clasificarii, respectiv regresiei. Procedurile bagging și AdaBoost vor fi detaliate astfel atat in cazul clasificarii, cat si în contextul regresiei. Penultimul capitol urmăreste detalierea construirii unor modele precum C5.0, Stochastic Gradient Boosting, Bagged CART, respectiv Random Forest in mediul R, in timp ce capitolul 11 expune o serie de aplicatii utilizand metodele de tip ansamblu, constituite pe baza unor tehnici precum: analiza in componente principale (ACP), Retelele Neuronale Artificiale, arborii de decizie, Random Forest sau SVM.

In consecinta, lucrarea Data Mining in mediul R. Teorie si aplicatii este recomandata atat studentilor care au în planul de invatamant disciplinele Analiza Datelor, Data Mining sau Retele neuronale artificiale (RNA), cat si cercetatorilor, doctoranzilor si celor interesati de aspecte cat mai variate legate de explorarea datelor.

Produse asemanatoare

Altii au mai cumparat