Metodi e modelli per Data Science a.a. 2024-2025

  • Il corso di studio punta ad integrare un'ampia preparazione di base nei settori della matematica e dell'informatica più rilevanti per la Data Science, con una preparazione fortemente interdisciplinare e volta anche a familiarizzare gli studenti con alcune delle discipline in cui le applicazioni possono essere più rilevanti.

    Le tecniche di Data Science che vengono introdotte non sono considerate dal punto di vista meramente applicativo, ma ci si pone l'obiettivo di comprenderne in profondità i fondamenti matematici e la logica del loro sviluppo, nella prospettiva di formare laureati che siano in grado di innovare le procedure esistenti sia dal punto di vista teorico che in funzione del loro utilizzo in particolari ambiti.

    L'obiettivo del corso di studio è quindi quello di formare laureati con competenze fortemente spendibili sul mercato del lavoro, ma contemporaneamente con una preparazione che permetta ulteriori studi specialistici in tutti i campi in cui la Data Science sta mostrando la sua efficacia.

    Più specificamente i laureati in Metodi e Modelli per Data Science avranno buone conoscenze di base nell'area matematica con particolare riguardo alle metodologie di previsione ed agli aspetti computazionali.

    A queste si affiancano, parimenti rilevanti, buone conoscenze di base nell'area informatica con particolare riguardo tecniche di programmazione avanzate e all'utilizzo di strutture dati.

    Conoscenze di base concernenti l'apprendimento automatico e l'analisi di sistemi complessi, insieme ad adeguate capacità comunicative negli ambiti tecnici di riferimento, completano il quadro formativo che gli studenti matureranno al termine del percorso.

    In dettaglio, nella prima parte del percorso formativo, gli studenti sono tenuti ad acquisire le conoscenze e competenze di base dei seguenti argomenti: algebra lineare, probabilità, statistica, informatica e tecniche di programmazione, gestione di database, calcolo differenziale e integrale per funzioni di una e più variabili reali, fisica.

    Successivamente, per fornire basi estremamente solide per i vari aspetti della Data Science, il percorso formativo punta a far acquisire conoscenze e competenze più avanzate nell'ambito dell'analisi, della probabilità e della statistica dell'analisi numerica, dell'ottimizzazione, degli algoritmi e strutture dati nonché degli aspetti introduttivi del machine learning e dell'analisi economica, considerando che tali ambiti applicativi possono senz'altro accrescere notevolmente l'attrattività degli studenti per il mondo del lavoro.

    A questa preparazione fa da complemento un'ampia possibilità di scelta di crediti formativi affini e integrativi volta a consentire la declinazione delle attitudini e degli interessi dello studenti sia attraverso l'approfondimento di ulteriori aspetti metodologici relativi all'apprendimento automatico, alle tecniche di previsione ed alla modellistica numerica, sia tramite l'acquisizione di conoscenze in ulteriori ambiti applicativi, in particolare tra le scienze fisiche o la finanza o l'informatica.

    Il percorso formativo si conclude con la prova finale, per la preparazione della quale si fornisce un'apposita assistenza didattica.

    Questa prova non risulta particolarmente onerosa in termini di crediti formativi, e può riguardare sia l'approfondimento di aspetti teorici già incontrati durante i corsi, sia lo sviluppo di applicazioni, anche in collaborazione con le aziende con il quale il corso di laurea è in contatto.

  • Sono ammessi al corso di laurea gli studenti in possesso di un diploma di scuola secondaria superiore o di altro titolo di studio conseguito all'estero riconosciuto idoneo.

    È richiesta una buona conoscenza degli argomenti di base di matematica usualmente presentati nel ciclo di studi secondario (un syllabus dettagliato sarà reso disponibile on line sul sito del CdS).

    La consuetudine con il ragionamento matematico completa un'adeguata preparazione iniziale.

    Il regolamento didattico del corso di laurea descrive in dettaglio le conoscenze di base richieste per l'acquisizione di un'adeguata preparazione iniziale, precisa le modalità con cui la struttura didattica competente verifica tali conoscenze e indica gli eventuali obblighi formativi aggiuntivi, da assolvere entro il primo anno di corso, nel caso la verifica non risulti soddisfacente.

  • Il corso di studio punta ad integrare una ampia preparazione di base nei settori della Matematica e dell'Informatica più rilevanti per lo studio, la gestione e l'analisi dei dati (per brevità Data Science), con una formazione fortemente interdisciplinare nella quale gli studenti possano acquisire familiarità in alcuni degli ambiti applicativi in cui la Data Science ha già mostrato la sua grande rilevanza, quali ad esempio l'Ingegneria, l'Informatica e la Finanza.

    Le metodologie che vengono introdotte non sono considerate dal punto di vista meramente applicativo, ma ci si pone l'obiettivo di comprenderne in profondità i fondamenti matematici e la logica di sviluppo, nella prospettiva di formare laureati che siano in grado di innovare le procedure esistenti sia dal punto di vista teorico sia in funzione del loro specifico utilizzo.

    L'obiettivo del corso di studio è quindi quello di formare laureati con competenze fortemente spendibili sul mercato del lavoro, ma contemporaneamente con conoscenze che permettano ulteriori studi specialistici in tutti i campi in cui la Data Science sta mostrando la sua efficacia.

    Gli studenti acquisiranno nell'ambito dei corsi di base le conoscenze e competenze necessarie nei seguenti argomenti, svolti in insegnamenti fondamentali: Algebra Lineare e Calcolo Matriciale, Calcolo Differenziale e Integrale per funzioni di una e più variabili reali, Probabilità, Statistica, Informatica e Tecniche di Programmazione, Gestione di Basi di Dati, Fisica.

    A questi corsi si aggiungono un insieme di esami caratterizzanti che coprono ulteriori sviluppi nell'ambito dell'Analisi, della Probabilità e della Statistica e soprattutto Analisi Numerica, Ottimizzazione, Calcolo Matriciale anche da un punto di vista computazionale, Algoritmi e Strutture Dati, Machine Learning; l'insieme di questi corsi è in grado di fornire basi estremamente solide per tutti gli aspetti della Data Science.

    I corsi affini permettono di acquisire competenze nell'ambito della Programmazione Avanzata e Parallela; fra essi è presente anche un esame introduttivo all'Analisi Economica, in considerazione del fatto che tale ambito applicativo, di sicura rilevanza per Data Science, contribuirà ad accrescere l'attrattività per il mondo del lavoro delle competenze di laureate e laureati del CdS.

    Sono presenti quindi una grande varietà di corsi per crediti formativi affini e integrativi, con l'opportunità per gli studenti sia di approfondire ulteriori aspetti metodologici relativi all'Intelligenza Artificiale, al Machine Learning, alla Statistica/Probabilità ed ai Metodi Numerici, sia di conoscere sin dal percorso formativo triennale ulteriori ambiti applicativi, in particolare tra le Scienze Fisiche o la Finanza.

    Una larga parte dei corsi, ed in particolare tutti quelli relativi alla Programmazione, sono ampiamente supportati da attività laboratoriale.

    Il percorso formativo si conclude con la prova finale, per la preparazione della quale si fornisce un'apposita assistenza didattica; il lavoro di tesi può riguardare sia l'approfondimento di aspetti teorici già incontrati durante i corsi, sia lo sviluppo di applicazioni, anche in collaborazione con le imprese con il quale il corso di laurea è in contatto.

    Ogni insegnamento prevede esercitazioni ed una verifica finale che avviene, di norma, attraverso la valutazione di un elaborato scritto e/o un colloquio orale.

    In tutto il percorso formativo sono previste attività tutoriali e seminariali mirate, in particolare, ad affinare la capacità di risolvere problemi, a sviluppare autonomia di giudizio e abilità comunicative.

    Sbocchi occupazionali: I laureati in Metodi e Modelli per Data Science potranno potenzialmente trovare impiego in ambiti aziendali (presso aziende ad alta tecnologia sia nei settori dell'Information and Communication Technology, sia in ambito fisico ed ingegneristico in cui si svolgano attività legate ai Big Data ed all'Intelligenza Artificiale); in attività di consulenza industriale e scientifica in tutti i campi della ricerca pura e applicata che richiedono la gestione di grandi moli di dati; in attività di consulenza in ambito Medico e Biologico, incluse le aziende di ricerca farmaceutica e biotecnologica, nella misura in cui esse utilizzino tecniche di Machine Learning ed Intelligenza Artificiale; presso banche e compagnie d'assicurazione per consulenza in ambito finanziario ed assicurativo nel settore pubblico e nel settore privato Oltre al diretto ingresso nel mondo del lavoro, il laureato in Metodi e Modelli per Data Science potrà proseguire gli studi nelle Lauree Magistrali, o più in generale in studi di secondo livello, di ambito matematico, statistico, informatico ma anche di ambiti applicativi specifici ove la solida preparazione matematica e statistica e la robusta competenza informatica risultano rilevanti

  • Sono ammessi al corso di laurea gli studenti in possesso di un diploma di scuola secondaria superiore o di altro titolo di studio conseguito all'estero riconosciuto idoneo.

    Per l'ammissione al Corso è, altresì, richiesto il possesso ovvero l'acquisizione di una adeguata preparazione iniziale, la quale viene verificata attraverso una prova obbligatoria da svolgere prima dell'immatricolazione.

    Possono essere esonerati dallo svolgimento della prova gli studenti che hanno superato l'esame di stato conclusivo della scuola secondaria di secondo grado con un voto pari o superiore ad una soglia annualmente riportata nel Bando.

    La prova consiste in un test che si compone di quesiti di matematica di base (oggetto di insegnamento nei programmi delle scuole superiori) e di logica: la struttura del test (numero di domande), i criteri di attribuzione del punteggio e la soglia di punteggio per il superamento del test sono annualmente definiti nel Bando.

    Qualora la verifica non fosse positiva, saranno assegnati obblighi formativi aggiuntivi che dovranno essere assolti entro il primo anno.

    Per colmare le lacune riscontrate gli studenti potranno frequentare un Corso intensivo di Matematica di base (detto 'Matematica 0') e dovranno necessariamente superare un esame del primo anno di corso tra quelli riferiti ai settori “MAT” (sul sito del Corso di studio è pubblicata annualmente la lista di tali insegnamenti), prima di poter sostenere ulteriori esami.

  • La prova finale per il conseguimento della Laurea in Metodi e Modelli per Data Science richiede la preparazione e redazione di una tesi, frutto di un lavoro del laureando svolto sotto la guida di un relatore e una dissertazione conclusiva.

    La tesi richiede, da parte dello studente, un adeguato approfondimento di un argomento che può riguardare aspetti teorici già incontrati durante i corsi, sia lo sviluppo di applicazioni, anche in collaborazione con le imprese con il quale il corso di laurea è in contatto.

    La tesi, che può essere redatta anche in lingua inglese, previo consenso del relatore e approvazione del Coordinatore, viene discussa e valutata nella seduta di laurea.

    Durante la discussione orale il candidato dovrà mostrare, oltre alla padronanza dell'argomento trattato, autonomia e capacità espositiva e di sintesi.

    Possono essere relatori di tesi i docenti universitari di Tor Vergata o di altri Atenei italiani, nonché i ricercatori di enti di ricerca accreditati.

    Nel caso di docenti universitari esterni all'Ateneo o di ricercatori appartenenti ad enti di ricerca accreditati, il Coordinatore designerà un correlatore scelto tra i docenti dei dipartimenti associati al CdS.

    In relazione ad obiettivi specifici, e nel quadro di convenzioni che lo prevedano esplicitamente, lo svolgimento della tesi può essere effettuato mediante tirocini formativi presso aziende, strutture della pubblica amministrazione ed enti esterni, oltre che nell'ambito di soggiorni di studio presso altre università italiane ed estere, anche nel quadro di accordi internazionali.

    In questi casi viene assegnato al laureando un tutor esterno che assume il ruolo di correlatore mentre il Coordinatore designerà come relatore un docente interno ai dipartimenti associati al CdS.

    Il Coordinatore assegna ad ogni laureando un docente di uno dei dipartimenti associati al CdS con funzione di controrelatore.

    Relatore, controrelatore ed eventuale correlatore, se non presenti alla seduta di laurea, inviano una relazione scritta sull'elaborato del candidato.

    Le sedute di laurea si svolgono di norma in cinque appelli annuali, nell'arco di tre sessioni (estiva, autunnale, invernale), fissati ogni anno dal corso di studio e adeguatamente pubblicizzati.

    Venti giorni prima dell'appello scelto per l'esame di laurea lo studente deve presentare domanda presso le segreterie studenti della Macroarea di Scienze dove adempirà alle formalità amministrative.

    La commissione per la valutazione dell'esame di laurea è composta da 5 docenti ed almeno 1 supplente.

    Di norma i docenti sono afferenti ai dipartimenti associati al CdS e comunque devono essere docenti interni all'Ateneo.

    La commissione è nominata dal Direttore del Dipartimento di riferimento, su proposta del Coordinatore.

    Il Presidente della commissione di laurea è di norma il professore con maggiore anzianità di servizio tra i docenti della Commissione.

    La Commissione esprime un voto in centodecimi, con eventuale lode decisa all'unanimità.

    Per la formazione del voto di laurea, la commissione calcola, anzitutto, la media dei voti, valutati in trentesimi e pesati secondo i crediti, delle attività formative che prevedono valutazione di profitto.

    Il punteggio derivante da tale media, convertito in centodecimi, può essere incrementato di al più 7 punti per la tesi, la relativa discussione e la carriera didattica dello studente.

Metodi e modelli per Data Science a.a. 2024-2025

Anno 1

  • ANALISI MATEMATICA I Didattica Web

    Docente:

    Lucio Damascelli

    Programma

    Insiemi, funzioni, numeri. Limiti e derivate di funzioni di una variabile reale e loro proprietà. Teoremi del calcolo differenziale e loro applicazioni. Calcolo di limiti con l' aiuto del Teorema di de l'Hospital e della formula di Taylor. Studio di funzioni. Integrali definiti di una funzione continua in un intervallo limitato. Teorema e formula fondamentale del calcolo integrale. Integrali indefiniti, regole di sostituzione immediata e di integrazione per parti. Integrali impropri. Equazioni differenziali a variabili separabili, lineari a coefficienti costanti del primo e secondo ordine. Vettori, matrici e operazioni su di essi. Determinanti e loro calcolo. Rango di una matrice e suo calcolo. Sistemi lineari. Regola di Cramer. Teorema di Rouchè-Capelli e applicazioni. Cenno sulle applicazioni lineari. Autovalori e autovettori di matrici quadrate, autospazi di un autovalore, molteplicit\`a algebrica e geometrica di un autovalore, matrici diagonalizzabili.

    Numero crediti

    9

    Obbligatorio

    Lingua

    ITA
  • FONDAMENTI DI PROGRAMMAZIONE E LABORATORIO CALCOLO I Didattica Web

    Docente:

    Gianluca Rossi

    Programma

    Verranno trattari i seguenti temi: risoluzione automatica dei problemi; algoritmi e programmi; modelli di calcolo; linguaggi di programmazione; tipi di linguggi, struttura di un programma; tipi di dati semplici e strutturati; variabili; strutture di controllo; puntatori; funzioni; ricorsione; operazioni di input/output; strutture di dati elementari. Introduzione al linguaggio di programmazione Python. Algoritmi elementari di ricerca e ordinamento.

    Numero crediti

    9

    Obbligatorio

    Lingua

    ITA
  • PROBABILITA' I Didattica Web

    Docente:

    Barbara Pacchiarotti

    Programma

    Introduzione e generalità. Spazi di probabilità, assiomi fondamentali, probabilità condizionata, indipendenza, formula di Bayes. Variabili aleatorie: valore atteso, varianza, densità discreta, funzione di ripartizione. Variabili aleatorie discrete: Bernoulli, Binomiale, Poisson, ipergeometrica, geometrica, binomiale negativa. Variabili aleatorie continue: funzione di densità. Variabile aleatoria uniforme, esponenziale, Gamma, Gaussiana. Disuguaglianze fondamentali. Convergenza e teoremi limite: legge dei grandi numeri e teorema del limite centrale. Cenni alle catene di Markov. Simulazione e metodi Monte Carlo.

    Numero crediti

    9

    Obbligatorio

    Lingua

    ITA
  • BASI DI DATI Didattica Web

    Docente:

    Paola Vocca

    Programma

    Introduzione - Modelli Relazionali - Algebra Relazionale - Calcolo Relazionale - Flusso di progetto di un DB - Modello Concettuale dei Dati - Schema logico di un DB - Entity-relationship Schema - Schema fisico di un DB - Forme Normali - Query language e MySQL - DML - SQL - Organizzazione Fisica dei Dati - Ottimizzazione degli indici - Normalizzazione vs Denormalizzazione - Ottimizzazione delle Query - MySQL e ottimizzazione - Transazioni - Protocolli Two Phases Locking, Timestamp, MVCC - MySQL e Storage Engine - Active Databases - Trigger e Stored Procedure - Cursor, Trigger e Stored Procedure in MySQL - GIS - Distributerd Architectures - Protocollo Two Phases Commit - Data Warehouse - Data Mining - Evoluzione dei Database - Basi di dati NoSQL- MongoDB - CRUD operations - Simulazione Progetto

    Numero crediti

    9

    Obbligatorio

    Lingua

    ITA
  • ALGEBRA E GEOMETRIA Didattica Web

    Docente:

    Niels Kowalzig

    Programma

    Vettori in R^n, somma di vettori e prodotto per scalare. Prodotto scalare, distanza. Eliminazione di Gauss, matrici a scala. Soluzione di un sistema lineare. Matrici e sistemi lineari. Spazi vettoriali, sottospazi vettoriali. Combinazioni lineari, basi, dimensioni, coordinate. Esistenza delle basi. Somma diretta e formula di Grassmann. Equazioni parametriche e cartesiane. Applicazioni lineari e matrici associate. Nucleo, immagine, teorema della dimensione. Matrici invertibili, matrice inversa con l’algoritmo di Gauss simultaneo. Matrice di cambiamento di base. Determinante, teorema di Binet, formula di Cramer. Inversa col metodo dell’aggiunta. Rango, teorema di Rouche-Capelli. Caratterizzazioni equivalenti delle matrici invertibili. Basi ortogonali e ortonormali, procedimento di Gram-Schmidt. Proiezioni ortogonali, ortogonale di un sottospazio. Matrici ortogonali. Autovalori e autovettori, diagonalizzazione.

    Numero crediti

    6

    Obbligatorio

    Lingua

    ITA
  • FISICA E ANALISI DATI Didattica Web

    Docente:

    Giuseppina Nigro

    Programma

    Classi e funzioni definite dall’utente in Python. Classe di regressione lineare. Analisi e manipolazione di base di dati. Dataframe. Numpy. Pandas. Visualizzazione di Dati. Manipolazione di matrici e dati. Manipolazione dei frame di dati. Metriche di distanza e matrici di distanza. Distribuzioni usando Scipy. Elementi di Calcolo vettoriale. Le unità di misura. Cinematica: posizione, spostamento, velocità e accelerazione di un punto materiale. Dinamica: Leggi di Newton. Lavoro ed energia cinetica. Energia potenziale. Conservazione dell'energia meccanica. Sistemi di punti materiali e corpo rigido. Quantità di moto. Urti. Rotazione e variabili angolari. Momento di inerzia, momento torcente, e momento angolare. Termodinamica. Temperatura. Quantità di calore. Trasformazioni reversibili e irreversibili. Il primo e secondo principio della termodinamica. L'entropia. Elettricità e magnetismo. Forza di Coulomb. Campo elettrico. Legge di Gauss. Corrente elettrica. Legge di Ohm ed effetto Joule. Campo Magnetico. Forza di Lorentz. Legge di Laplace, di Biot-Savart, di Ampère e legge di Faraday.

    Numero crediti

    9

    Obbligatorio

    Lingua

    ITA
  • ANALISI MATEMATICA II Didattica Web

    Docente:

    Roberto Tauraso

    Programma

    Limiti e calcolo differenziale per funzioni di più variabili reali. Funzioni definite implicitamente. Integrali curvilinei e forme differenziali Integrali multipli Equazioni differenziali

    Numero crediti

    6

    Obbligatorio

    Lingua

    ITA

Anno 2

Anno 3

Info
Scheda Corso
  • Titolo: Metodi e Modelli per Data Science
  • Anno Accademico: 2024/2025
  • Tipo: Corso di Laurea
  • Manifesto: 3655cc0a-c638-4bb7-9e64-fefa70e2807c
  • ISCED: 0541