E' nato un nuovo servizio che permette di visualizzare, in modo semplice, dati sperimentali di interazioni proteiche. Sulla rivista Nature Methods il consorzio IMEX (International Molecular Exchange) descrive come sarà possibile per i ricercatori, utilizzando un set non ridondante di dati sperimentali, comprendere la complessità delle interazioni proteiche di una cellula. L'obiettivo è quello di ridurre la duplicazione dei dati dovuta alla annotazione di stessi articoli da parte di più database. Tra i partner del consorzio Imex l'Università Roma Tor Vergata che dal 2004 mette a disposizione dei ricercatori il Molecular INTeraction Database (MINT), una banca dati che permette di ricercare, visualizzare e scaricare dati di interazione proteica.
Oggi una delle maggiori sfide della biologia è comprendere la complessità dei suoi sistemi. L'interattoma (la rete di tutte le possibili interazioni proteina-proteina) di una cellula è un sistema molecolare estremamente dinamico e per questo motivo difficilmente analizzabile nella sua interezza. Lo studio delle interazioni proteiche e della loro organizzazione ci consente di capire meglio i meccanismi cellulari.
Gli scienziati dell'Istituto Europeo di Bioinformatica (EMBL-EBI) insieme ad altri colleghi che lavorano in diversi paesi del mondo, hanno dato vita al consorzio IMEx (Molecular Internazionale Exchange) con l'intento di offrire ai ricercatori una interfaccia grafica per la ricerca libera e gratuita di dati di interazione sperimentali. I partner di IMEx, tra cui c'è anche l'università Roma Tor Vergata, descrivono su "Nature Methods" i vantaggi del loro servizio e invitano altri scienziati d unirsi al loro sforzo. "Ci sono oltre 100 banche dati di interazione tra proteine disponibili in rete, ma nessuna da sola, contiene le informazioni sufficienti a descrivere l'intero interattoma di un organismo ", spiega Sandra Orchard dell' Istituto Europeo di Bioinformatica (EMBL-EBI) nel Regno Unito. "Oltre al problema dei dati ripetuti presenti nelle varie banche dati, bisogna considerare anche che soltanto circa l'1% delle 151 milioni di coppie binarie presenti nei database proviene da dati sperimentali pubblicati ed è quindi attendibile." I restanti dati sono teorici, o il prodotto di text mining, e di conseguenza sono di gran lunga meno affidabili.
Il consorzio IMEx utilizza sin dal 2004 uno standard unico che permette a tutte le banche dati del consorzio di avere dei dati standardizzati. Questo lavoro consente agli scienziati di identificare quali interazioni proteiche sono supportate da maggiori prove sperimentali, e, ai bioinformatici, di lavorare su dati disponibili in formati standard, in XML o in tabelle delimitate da tab.
"E' finalmente possibile avere informazioni su proteine che interagiscono con altre molecole, e confrontare questi dati con quelli ottenuti sperimentalmente nei nostri laboratori" - riferisce Giovanni Cesareni, ordinario di Genetica Molecolare dell'Università degli Studi Roma Tor Vergata.
L'obiettivo è quello di ridurre la duplicazione dei dati dovuta alla annotazione di stessi articoli da parte di più database, come spiega Peter Uetz del Centro per lo Studio della complessità biologica alla Virginia Commonwealth University negli Stati Uniti "Gli IMEx web service - sottolinea il prof. Uetz - permettono di visualizzare dati sperimentali curati da diverse banche dati e di avere un quadro più chiaro delle interazioni proteina-proteina", -
"Siamo veramente ansiosi che le persone utilizzino il nostro servizio liberamente e gratuitamente" dice Henning Hermjakob - capo gruppo del Proteomics Services all'EMBL-EBI -. "Speriamo inoltre che altre banche dati si uniscano al consorzio".
Attualmente sono partner di IMEx le banche dati: DIP, IntAct, MINT, MatrixDB, MPIDB, Molecular Connections, I2D, InnateDB, observer BioGRID e il gruppo di SwissProt (Swiss Institute of Bioinformatics), il membro più recente. Si tratta di un risultato di PSIMEx, che è finanziato nell'ambito del Settimo Programma Quadro (Health Theme of the European Commissions Seventh Framework Programme).
Il consorzio IMEx
Il consorzio IMEx (International Molecular Exchange) è una collaborazione internazionale tra le maggiori banche dati di interazione molecolare che hanno accettato di unire i loro sforzi di curazione. Ogni partener IMEx si occupa di una risorsa distinta: database di interazione molecolare (es. IntAct, MINT, DIP), risorse che si occupano di organismi specifici (es. BioGrid or MPIDB) o di particolari domini biologici (es. MatrixDB). I partner scambiano le diverse informazioni sulle interazioni, che vengono annotate seguendo degli standard di curazione comuni a tutti i membri del consorzio; l'informazione, non ridondante, viene quindi resa pubblica e consultabile. Quando uno dei database rilascia una nuova release, il dataset viene automaticamente aggiornato. Le informazioni sono rese disponibili in formati standard, tabelle delimitate da tab o in formato XML. Ciò garantisce all'utente di visualizzare successivamente le informazioni con strumenti informatici come Cytoscape e R Bioconductor. La ridondanza dei dati annotati è evitata assicurando che ogni partner annoti informazioni provenienti solamente da un set di giornali assegnati, o per sottomissione diretta degli autori durante il processo di pubblicazione. E' stato sviluppato un sistema interno di gestione e ripartizione delle informazioni che permette la copertura di un ampio numero di pubblicazioni scientifiche. http://www.imexconsortium.org/about-imex
MINT
MINT, o Molecular INTeraction Database, è una banca dati di interazione tra proteine ed è disponibile al sito http://mint.bio.uniroma2.it/mint. I dati di interazione presenti in MINT, vengono estratti da riviste scientifiche altamente revisionate. MINT contiene circa 235.000 interazioni binarie, estratte da più di 4750 pubblicazioni. L'interfaccia di rete permette all'utente di ricercare, visualizzare e scaricare dati di interazione proteica. Dal 2004 MINT è membro del consorzio IMEx (the International Molecular Exchange) e adotta lo standard PSI-MI (Molecular Interaction Ontology of the Proteomics Standard Initiative) sia per la cura che per lo scambio dei dati. I dati in MINT sono accessibili liberamente e gratuitamente e sono scaricabili presso l'indirizzo http://mint.bio.uniroma2.it/mint/download.do.
EBI
L'EBI (European Bioinformatics Institute) fa parte dell' European Molecular Biology Laboratory (EMBL) e si trova nel Wellcome Trust Genome Campus in Hinxton vicino Cambridge nel Regno Unito. L'EBI nasce come un progetto dell'EMBL per fornire alla comunità scientifica un insieme di banche dati biologiche; ora gestisce alcune delle più importanti collezioni di dati biologici a livello mondiale: sequenze di DNA (ENA), sequenze proteiche (UniProt), genomi (Ensembl), strutture molecolari 3D (the Protein Databank in Europe), dati ottenuti da esperimenti di espressione genica (ArrayExpress), interazioni proteina-proteina (IntAct) e interi pathway (Reactome). L' EMBL-EBI ospita diversi gruppi di ricerca e i suoi ricercatori sviluppano continuamente nuovi strumenti per la comunità bioinformatica. www.ebi.ac.uk
EMBL
L'EMBL (European Molecular Biology Laboratory) è un istituto di ricerca di base creato con i fondi per la ricerca messi a disposizioni da 20 stati membri (Austria, Belgio, Croazia, Danimarca, Finlandia, Francia, Germania, Grecia, Islanda, Irlanda, Israele, Italia, Lussemburgo, Paesi Bassi, Norvegia, Portogallo, Spagna, Svezia, Svizzera e Regno Unito) e dall'Australia come paese associato. Le attività di ricerca all'EMBL sono portate avanti da 85 gruppi indipendenti che coprono tutti gli aspetti della biologia molecolare. La sezione sperimentale consta di 5 unità: il laboratorio principale è sito ad Heidelberg, mentre le altre sedi sono dislocate a Grenoble, Hamburg, Hinxton e Monterotondo (vicino Roma). I capisaldi della missione dell'EMBL sono: portare avanti la ricerca di base nel campo della biologia molecolare, formare scienziati, studenti e visitatori, offrire servizi fondamentali ai ricercatori di tutti gli stati membri, sviluppare nuovi metodi e strumenti e portare avanti attivamente attività di "technology transfer". Circa 190 studenti sono attualmente coinvolti nel programma internazionale di dottorato organizzato dell'EMBL. Il Laboratorio inoltre offre una piattaforma di confronto tra il pubblico e la comunità scientifica, organizzando seminari, programmi per visitatori e divulgando successi scientifici www.embl.org.
Roma, 28 marzo 2012
Contatti:
Ufficio Stampa Università Roma Tor Vergata, Italia, Tel. +39 06 72592709 - 06 72592059 ufficio.stampa@uniroma2.it
Mary Todd-Bergman, Outreach Programme Project Leader, Hinxton, UK, Tel: +44 1223 494 665, www.ebi.ac.uk/information/news
Katrina Pavelin, EMBL-EBI Scientific Outreach Officer - Hinxton, UK, Tel: +44 1223 494 452, www.ebi.ac.uk/information/news
Sonia Furtado Neves, EMBL Press Officer, Heidelberg, Germany, Tel: +49 6221 387 82 63, www.embl.org