Topic outline

  • General

  • Tema 1. Introducere în Analiza Statistică și Vizualizarea Datelor

    Analiza statistică și vizualizarea datelor sunt componente esențiale ale științei datelor. Ele permit transformarea datelor brute în informații utile pentru luarea deciziilor. Analiza statistică implică aplicarea metodelor matematice pentru a descrie, sumariza și interpreta datele, iar vizualizarea datelor oferă un mijloc eficient de comunicare a acestor informații prin reprezentări grafice.

    De exemplu, analiza unui set de date privind vânzările lunare ale unei companii poate dezvălui tendințe sezoniere, iar un grafic de tip linie poate evidenția clar aceste variații. Integrarea analizei și vizualizării permite identificarea tiparelor, detectarea anomaliilor și formularea ipotezelor.

    • Tema 2. Colectarea și Preprocesarea Datelor

      Colectarea datelor reprezintă prima etapă în procesul analitic, implicând obținerea informațiilor din surse variate: baze de date, fișiere CSV, API-uri, senzori etc. Calitatea analizelor depinde direct de calitatea datelor colectate.

      Preprocesarea este etapa de pregătire a datelor și include: curățarea (eliminarea valorilor lipsă sau eronate), transformarea (normalizarea, codificarea variabilelor categorice), agregarea și reducerea dimensionalității. 

      • Tema 3. Statistici Descriptive

        Statistica descriptivă se ocupă cu sumarizarea datelor prin indicatori numerici (media, mediana, moda, dispersia, deviația standard) și reprezentări grafice (histograme, diagrame de tip cutie, grafice de bare).

        • Tema 4. Probabilitate și Distribuții de Probabilitate

          Teoria probabilității stă la baza multor metode statistice. Distribuțiile de probabilitate, precum distribuția normală, binomială sau Poisson, modelează comportamentul variabilelor aleatoare.

          • Tema 5. Analiza Regresiei

            Analiza regresiei permite modelarea relației dintre o variabilă dependentă și una sau mai multe variabile independente. Cea mai simplă formă este regresia liniară, unde se caută o linie care aproximează legătura dintre variabile.

            • Tema 6. Analiza Factorială

              Analiza factorială este o tehnică de reducere a dimensionalității, utilizată pentru identificarea variabilelor latente care explică corelațiile dintre variabilele observate.

              • Tema 7. Analiza de Grupare (Clustering)

                Clustering-ul presupune gruparea observațiilor în funcție de similarități, fără o variabilă dependentă. Algoritmi precum K-means sau hierarhic sunt frecvent utilizați în acest scop.

                • Tema 8. Tehnici de Vizualizare a Datelor

                  Vizualizarea datelor permite reprezentarea grafică a informațiilor, facilitând înțelegera și comunicarea acestora. Printre tehnicile utilizate se numără graficele de tip bară, linie, punct (scatter plot), boxplot, heatmap etc.

                  • Tema 9. Vizualizarea datelor spațiale și temporale

                    Vizualizarea geospațială implică reprezentarea datelor în context geografic, folosind hărți tematice, coropletice sau hărți de densitate.

                    • Tema 10. Vizualizarea datelor în contexte interactive și BI. Proiecte

                      Proiectele de vizualizare presupun aplicarea integrată a competențelor dobândite, de la colectarea datelor până la prezentarea interactivă a rezultatelor. Acestea pot include dashboard-uri interactive, aplicații web sau rapoarte vizuale.