DYANA
Dynamics Algorithm for NMR Applications
Manuale utente

Eddi Bindi, Michela Tabacco, Luca Giancarlini
Corso di Biochimica Applicata 1999/2000
C.d.L. Chimica

Università degli studi di Siena

 

INTRODUZIONE

Lo scopo principale del programma DYANA (“Dynamics Algorithm for Nmr Applications”) è quello di riuscire a valutare e soprattutto a calcolare, sulla base di vincoli conformazionali derivanti da esperimenti NMR, le strutture tridimensionali di acidi nucleici e proteine. DYANA sostituisce il precedente programma di calcolo computazionale chiamato DIANA (; Guntert & Wuthrich, 1991 Guntert et al., 1991a), incorporando tutte le precedenti funzionalità di DIANA, e in più, diverse estensioni, tra cui un nuovo efficiente metodo di calcolo strutturistico: le dinamiche nello spazio degli angoli di torsione.

 

Negli ultimi anni, la crescita del limite di grandezza (o peso molecolare) delle strutture di macromolecole, che possono diventare oggetto di studio NMR, ha richiesto un notevole miglioramento e una maggior efficienza dei metodi di calcolo computazionale. Il programma DIANA si basava sulla minimizzazione ai gradienti coniugati di una funzione bersaglio variabile nello spazio degli angoli di torsione (Braun & Go, 1985) con lo scopo di trovare strutture tridimensionali che soddisfacessero i vincoli conformazionali. Questa minimizzazione era molto efficiente (si ottenevano cioè strutture aventi valori della funzione bersaglio relativamente bassi) nel caso particolare di grandi proteine con struttura secondaria a foglietto b. Tuttavia questo processo era spesso ostacolato dal fatto che la minimizzazione ai gradienti coniugati della funzione bersaglio poteva rimanere intrappolata in diversi minimi locali della stessa. In altre parole durante tale processo computazionale il valore della funzione bersaglio assume valori sempre minori, non può crescere (poiché il programma effettua una convergenza verso il valore minimo), quindi, una volta trovato un minimo locale, l’algoritmo non può più uscirne e convergerà su di esso. Il valore minimizzato così ottenuto in output, non è accurato, poiché potrebbe non corrispondere al minimo assoluto della funzione stessa, che è il valore ottimale che stiamo cercando di calcolare poiché rappresenta la conformazione a più basso valore energetico e quindi più probabile. Un decisivo miglioramento di questa situazione poteva nascere solo se si fossero sviluppati algoritmi di calcolo strutturale che avessero la capacità di superare il problema dei minimi locali. Per questo motivo è nato DYANA (Guntert et al., 1997), un nuovo programma di calcolo strutturale che sfrutta i dati sperimentali forniti dalla spettroscopia NMR, attuando un annealing simulato combinato con le dinamiche molecolari nello spazio degli angoli di torsione, che porta al calcolo della soluzione numerica dell’equazione del moto della meccanica classica (equazioni di Lagrange) dove le coordinate generalizzate (ed è questo il grande vantaggio) sono gli angoli di torsione. Adesso la funzione bersaglio prende il posto dell’energia potenziale, e il sistema è accoppiato ad un bagno termostatico che viene raffreddato lentamente partendo dalla sua temperatura massima iniziale, così da permettere al sistema di superare le barriere tra i diversi minimi locali della funzione bersaglio.

La principale differenza tra l’algoritmo di calcolo strutturale delle dinamiche dell’angolo di torsione e gli altri (Brunger, 1992), anch’essi utilizzanti la simulazione dell’annealing, è che il primo lavora con coordinate generalizzate interne mentre gli altri con quelle cartesiane. Questo permette di utilizzare nei calcoli un minor numero di variabili, a vantaggio della rapidità di computazione. I valori della struttura covalente (lunghezze di legame, angoli di legame, chiralità e planarità) sono sempre fissati con il loro valore ottimale. I forti potenziali richiesti dalle dinamiche molecolari nello spazio cartesiano per mantenere la struttura covalente, e in concomitanza, l’alta frequenza dei moti da loro causati, sono trascurati nelle dinamiche dell’angolo di torsione. Questo comporta l’ottenimento di una funzione di energia potenziale più semplice da manipolare e permette, nell’integrazione numerica delle equazioni del moto, intervalli di tempo più lunghi, con conseguente aumento dell’efficienza dell’algoritmo.

Per dimostrare a pieno i grandi vantaggi delle dinamiche dell’angolo di torsione, è richiesta un’accurata considerazione della sua implementazione, poiché le equazioni del moto di Lagrange, nelle quali gli angoli di torsione sono i gradi di libertà, sono molto più complesse delle equazioni del moto di Newton in coordinate cartesiane. Una semplicistica implementazione delle dinamiche dell’angolo di torsione (Mazur et al., 1991) comporterebbe per ogni intervallo di tempo di risolvere un sistema di N equazioni lineari (essendo N il numero dei gradi di libertà), e ciò richiederebbe uno sforzo computazionale proporzionale a N3. Invece DYANA usa una veloce implementazione ricorsiva delle equazioni di moto – originariamente sviluppata per simulazioni di dinamiche a scopo spaziale (Jain et al., 1993) – con uno sforzo computazionale proporzionale a N.

 

 

Questo nuovo sistema di calcolo strutturale può essere eseguito in maniera interattiva su qualsiasi tipo di workstation, non gravando in modo eccessivo sulla CPU. Il programma DYANA é eseguibile esclusivamente su sistemi operativi UNIX ("%" é il prompt Unix) digitando:

 

% dyana 

   

Apparirà il seguente messaggio:

  

DYANA, version 1.5 (sgi, double precision)

Copyright (c) 1996-98 ETH Zurich

dyana>

 

che  mostra il numero di versione del programma, l'architettura del computer per il quale é stato compilato e un indicatore di singola (32 bit) o doppia (64 bit) precisione matematica che sarà utilizzata. Se il prompt "dyana>" non viene visualizzato dopo il lancio del programma, vorrà dire che quest'ultimo non é stato installato correttamente.

 

 

APPLICAZIONE

 

In questo capitolo si illustreranno i comandi più comunemente utilizzati nel programma DYANA nel corso di una determinazione strutturale partendo da dati in input ricavati da tecniche NMR e già presenti come esempio in forma di file testo nella directory example/er2 all’interno della directory di installazione del programma stesso. Utilizzeremo questi stessi file per chiarire le procedure di comando essenziali per un'utilizzazione ottimale del programma.

In questa applicazione si utilizzano i dati sperimentali ottenuti dall’analisi spettroscopica NMR del feromone Er-2 dell’Euplotes raikovi.

Questi dati devono essere trascritti come file di testo (utilizzando un qualsiasi editor installato nel computer) con una specifica sintassi che vedremo di seguito, e poi salvati con estensioni standard rappresentanti altrettante differenti informazioni sperimentali in modo che il programma riesca a riconoscerli.  Essendo i seguenti file di input standard (escludendo i diversi accorgimenti che si posso maturare solo con l’esperienza), possono essere utilizzati come esempio per qualsiasi altra applicazione futura.

Essi sono:

   

er2.seq

Sequenza amminoacidica

er2.prot

Lista dei chemical shift

er2_h2o.peaks

Lista dei picchi NOESY in H2O

er2_d2o.peaks

Lista dei picchi NOESY in D2O

er2.cco

Costanti di accoppiamento scalari vicinali

  

Da notare che dei due file .peaks può bastarne anche uno solo.

Descriviamo ora più specificatamente cosa rappresentano questi file e in che modo devono essere editati. Solo successivamente descriveremo i comandi che li compilano per darci le informazioni che a noi interessano. Naturalmente i seguenti file dovranno essere salvati ognuno con la sua estensione predefinita, poiché altrimenti il programma al momento della computazione non sarà in grado di riconoscerli. Per facilitare l’utente verrà segnalato in grassetto tutto ciò che non può essere omesso e in semplice corsivo tutto ciò che può variare a piacere dell’utilizzatore stesso del programma.

 

CREARE I FILE DI INPUT

Creare il file di sequenza amminoacidica (er2.seq)

 

In questo file devono essere riportate le informazioni relative alla sequenza dei residui costituenti la proteina o il peptide in studio. Queste informazioni possono essere ricavate sia per via spettroscopica NMR, sia per via analitica, attraverso i cosiddetti “sequenziatori automatici”. Una volta aperto il programma di editor la sequenza amminoacidica dovrà essere scritta nel seguente modo:

 

# sequenza dell’er2

1   ASP-

    PRO

    MET

    THR

    CYSS

    GLU-

    GLN

    ALA

    MET

    ALA

    SER

    CYSS

    GLU-

    HIS

    THR

    MET

    CYSS

    GLY

    TYR

    CYSS

    GLY

    TYR

    CYSS

    GLN

    GLY

    PRO

    LEU

    TYR

    MET

    THR

    CYSS

    ILE

    GLY

    ILE

    THR

    THR

    ASP-

    PRO

    GLU-

    CYSS

    GLY

    LEU

    PRO

   

    LINK SG 5 SG 12

    LINK SG  17 SG 20

 

L’eventuale numero, precedente la sigla del primo residuo, può indicare la collocazione di questo nella sequenza amminoacidica dell’intera struttura proteica. In questo caso abbiamo assegnato al primo residuo il numero 1, ma potevamo anche ometterlo, poiché in questo caso il programma assegnerà al primo residuo il numero 1. I residui successivi hanno numerazione sequenziale crescente calcolata e non visualizzata dal programma e per tale motivo anche il numero di sequenza degli altri residui può essere omesso. 

Il simbolo #, detto anche “hash”, inserito come primo carattere ad inizio di una qualsiasi riga, permette di fare dei commenti di chiarimento all’interno del file stesso, facendo sì che al momento della compilazione il programma trovando il simbolo #, non legga le righe che lo contengono, evitando quindi di mandare in errore il processo. Ogni residuo deve essere inserito con il suo codice convenzionale di 3 lettere, fatta eccezione per la cisteina (CYS) nel caso in cui formi un ponte a disolfuro (CYSS), che sono le stesse di quelle contenute nel file “dyanalib” (libreria dei residui standard). I codici degli amminoacidi possono essere seguiti (senza alcuna spaziatura) o da un + o da un – a seconda che il residuo abbia rispettivamente una carica positiva o negativa. La lista della sequenza amminoacidica può essere editata non solo in colonna, ma anche per righe con la notazione del numero del primo residuo come fatto in precedenza, con la differenza di posporlo alla sigla stessa sempre separato da uno spazio. Es:

 

# sequenza dell’er2

1 ASP- PRO MET THR CYSS GLU- GLN ALA MET ALA SER CYSS GLU- HIS THR MET CYSS GLY TYR CYSS GLN GLY PRO LEU TYR MET THR CYSS ILE GLY ILE THR THR ASP- PRO GLU- CYSS GLY  LEU PRO

 

Un particolare tipo di legame covalente (proteine con ponte disolfuro, peptidi ciclici o anelli prolinici flessibili) è indicato dalla parola chiave LINK seguita dal nome del primo atomo, dal numero del primo residuo, dal nome del secondo atomo e dal numero del secondo residuo, in formato libero. Questa informazione sarà usata in DYANA per escludere le coppie di atomi che influiscono sulla conformazione sterica della proteina. Per esempio, un ponte disolfuro tra CYSS 5 e CYSS 12 della nostra proteina è dichiarato dal file di input di sequenza con la riga:

 

LINK SG 5 SG 12

 

Per di più, la presenza di questo legame disolfuro è fissato direttamente con vincoli di distanza, ad esempio con l’imposizione di un intervallo da 2.0 a 2.1 Angstrom per la distanza S-S, e da 3.0 a 3.1 Angstrom per la distanza S-C attraverso il ponte usando espliciti limiti superiori e inferiori di distanza. Poiché i ponti disolfuro sono frequenti nelle proteine, non è necessario (ma possibile) dichiararli esplicitamente nel file sequenza. Se gli atomi di zolfo dei residui CYSS non sono esplicitamente legati ad altri atomi attraverso il comando LINK nel file er2.seq, il programma riconosce legami covalenti tra tutti  gli atomi di zolfo dei residui CYSS, per esempio nelle interazioni di Van der Waals esso riconosce potenzialmente ponti disolfuro tra due qualsiasi residui CYSS nella molecola. Un altro caso frequente in cui il programma genera un particolare legame covalente avviene implicitamente se il legame è presente nella lista dei legami covalenti delle annotazioni atomiche nella libreria anche se non è compatibile con il diagramma di Ramachandran degli angoli diedri. Questo avviene per esempio negli anelli flessibili degli zuccheri del DNA. Tuttavia, i vincoli espliciti dei limiti superiori e inferiori delle distanze sono ancora richiesti per applicare angoli e lunghezze di legame esatti. In assenza di diverse indicazioni, il programma DYANA assume che tutti gli angoli diedri definiti nella parte residua della libreria sono rotabili, e sono in effetti gradi di libertà durante la minimizzazione.

L’unica eccezione sono gli angoli chiamati OMEGA i quali sono, in mancanza di diverse indicazioni, fissati a 180° o 0°. Per ottenere differenti possibilità di angoli diedri fissi o rotabili, le definizioni degli angoli devono essere inserite nel file er2.seq. Quindi per creare un angolo diedro rotabile si deve usare la sintassi

 

angle=free

 

dove angle sta per il nome dell’angolo. Per fissare un angolo diedro al valore della conformazione d’immissione che sarà letta, si usa

 

angle=fixed”.

 

Questo tipo di dichiarazione non può essere usata se le conformazioni di partenza sono generate casualmente all’interno del programma. Per fissare un angolo diedro ad un dato valore (sempre da inserire nel file er2.seq), si usa

 

angle=value”.

 

Il valore value deve essere dato in gradi. Il nome dell’angolo può contenere il simbolo * per inserirvi più caratteri e il simbolo ? per inserirvi solamente un carattere. Se la definizione di un angolo dovesse applicarsi solamente ad una parte della sequenza, la definizione e la parte corrispondente della sequenza devono essere racchiuse tra parentesi graffe. La parentesi graffa di sinistra può precedere più di una definizione angolare, inoltre le parentesi graffe possono raggruppare parti della sequenza amminoacidica.

Nel seguente esempio di sequenza (che esula dal nostro),  tutti gli angoli w saranno fissati al valore di 180° (in assenza di opportune indicazioni), tutti gli angoli y eccetto il terzo saranno fissati al valore di -47°, e tutti gli altri angoli diedri sono rotabili (in assenza di diverse indicazioni). In pratica:

 

{PSI=-47

ARG+  29  ARG+   {PSI=free ARG+}

ARG+  ILE  GLU-  ILE  ALA  HIS  ALA  LEU}

 

 

Creare il file degli spostamenti chimici  (er2.prot)

 

Le liste dei chemical shift (tradizionalmente chiamate “liste dei protoni”) seguono il formato usato dal programma XEASY (Bartles e altri, 1995). Per ogni chemical shift, la lista contiene una linea con i seguenti dati in formato libero: 1) il numero atomico, 2) il chemical shift, 3) l’errore sul chemical shift (attualmente non usato da DYANA), 4) il nome dell’atomo, e 5) il numero del residuo a cui appartiene l’atomo. Il numero atomico è fornito dalle assegnazioni dei picchi nelle liste dei picchi (si veda il prossimo paragrafo) e può essere differente dal numero atomico nei file delle coordinate. I chemical shift sono misurati in ppm (parti per milione) e annotazioni che cadono a valori superiori a 900 ppm non vengono prese in considerazione. Di seguito viene proposto parte del file dell’applicazione in esame er2.prot:

 

         1)    2)    3)   4)     5)

     2   4.455 0.000 HA      1

     3   2.499 0.000 HB2     1

     4   2.783 0.000 HB3     1

     5   4.334 0.000 HA      2

     6   1.787 0.000 HB2     2

     7   2.261 0.000 HB3     2

     8   1.979 0.000 QG      2

    ..   ..... ..... ...    ..

    ..   ..... ..... ...    ..

    ..   ..... ..... ...    ..

    ..   ..... ..... ...    ..

    ..   ..... ..... ...    ..

   201   1.710 0.000 HB3    39

   202   1.561 0.000 HG     39

   203   0.866 0.000 QD1    39

   204   0.918 0.000 QD2    39

   205   4.228 0.000 HA     40

   206   1.864 0.000 HB2    40

   207   2.187 0.000 HB3    40

   209   1.959 0.000 HG2    40

   210   3.613 0.000 HD2    40

   211   3.789 0.000 HD3    40

 

Creare il file dei picchi NOESY in H2O e quando è necessario in D2O per risolvere picchi sovrapposti (er2_h2o.peaks; er2_d2o.peaks)

 

Le liste dei picchi seguono il formato usato dal programma XEASY (Bartles e altri, 1995). Il programma DYANA può manipolare liste di picchi omonucleari bidimensionali e liste di picchi eteronucleari tridimensionali. Un file lista dei picchi inizia con una linea “# Number of dimension n”, dove n è 2 o 3, possibilmente seguita da linee addizionali di commento che iniziano con “#”. Per ogni picco, è presente una linea di dati, possibilmente seguita da una linea di commento che contiene il commento definito dall’utente per il picco dato. Ogni linea di dati contiene le seguenti annotazioni: 1) il numero del picco, 2) 2 o 3 spostamenti chimici (a seconda del numero di dimensioni), 3) il codice del colore del picco (intero), 4) il tipo di spettro (non usato da DYANA), 5) il volume del picco, 6) l’errore sul volume del picco (non usato da DYANA), 7) il codice del metodo di integrazione (un carattere), 8) un intero (non usato da DYANA), 9) 2 o 3 numeri atomici che identificano gli atomi nella corrispondente lista degli spostamenti chimici (un numero atomico zero indica una mancata assegnazione) e possibilmente 10) dati addizionali che non sono usati da DYANA. La nostra lista dei picchi in H2O è:

 

# Number of dimensions 2

 

   1)    2)      2)  3)4)             5)       6)     7)  8) 9)   9) 10)

   3   8.129   0.522 4 U          2.531e+03  0.00e+00 e   0  156  155 0

   9   8.126   0.692 2 U          5.450e+04  0.00e+00 e   0  156  152 0

  13   7.981   0.841 4 U          2.001e+04  0.00e+00 e   0  159  165 0

  14   7.740   0.872 4 U          3.698e+04  0.00e+00 e   0  198  203 0

  15   7.603   0.884 4 U          6.649e+04  0.00e+00 e   0  120  125 0

  20   7.730   0.904 3 U          3.111e+04  0.00e+00 e   0   73   76 0

  23   7.741   0.919 4 U          5.200e+04  0.00e+00 e   0  198  204 0

  27   8.462   0.978 4 U          9.368e+04  0.00e+00 e   0  166  162 0

  28   7.981   0.979 4 U          4.246e+04  0.00e+00 e   0  159  162 0

  33   8.613   1.041 4 U          2.509e+04  0.00e+00 e   0  102  126 0

  34   7.602   1.043 4 U          4.751e+04  0.00e+00 e   0  120  126 0

  35   7.799   1.045 4 U          1.000e+01  0.00e+00 e   0  127  126 0

  37   7.542   1.178 4 U          1.564e+05  0.00e+00 e   0  170  173 0

  ..   .....   ..... . .          .........  ........ .   .  ...  ... .

  ..   .....   ..... . .          .........  ........ .   .  ...  ... .

  ..   .....   ..... . .          .........  ........ .   .  ...  ... .

  ..   .....   ..... . .          .........  ........ .   .  ...  ... .

  ..   .....   ..... . .          .........  ........ .   .  ...  ... .

  ..   .....   ..... . .          .........  ........ .   .  ...  ... .

  ..   .....   ..... . .          .........  ........ .   .  ...  ... .

  ..   .....   ..... . .          .........  ........ .   .  ...  ... .

 977   3.952   8.443 1 U          1.000e+01  0.00e+00 e   0   33   43 0

 978   3.863   8.444 1 U          1.000e+01  0.00e+00 e   0   27   43 0

 979   3.960   7.564 1 U          1.000e+01  0.00e+00 e   0   41   49 0

 980   8.537   4.447 1 U          1.000e+01  0.00e+00 e   0   40   19 0

 981   2.351   7.761 1 U          1.540e+05  0.00e+00 e   0   31   32 0

 984   3.926   8.442 1 U          3.000e+04  0.00e+00 e   0  142  149 0

 985   4.768   7.730 1 U          1.000e+01  0.00e+00 e   0   61   73 0

 

 

Il codice del metodo di integrazione è “e” per i picchi che sono stati integrati, o “-“ per i picchi che non sono stati integrati.

La nostra lista dei picchi in D2O è:

 

 # Number of dimensions 2

 #FORMAT xeasy2D

     1   2.969   0.520 4 U  8.550E+05  0.00E+00 e 0    68   155

     3   1.177   0.521 4 U  2.527E+05  0.00E+00 e 0   173   155

     5   0.691   0.522 4 U  1.467E+06  0.00E+00 e 0   152   155

     6   2.838   0.522 4 U  4.752E+05  0.00E+00 e 0    85   155

     8   3.454   0.522 4 U  1.452E+06  0.00E+00 e 0   150   155

     9   2.892   0.522 4 U  3.992E+05  0.00E+00 e 0    86   155

    10   7.379   0.523 4 U  1.271E+05  0.00E+00 e 0    71   155

    11   4.782   0.523 4 U  2.097E+05  0.00E+00 e 0    67   155

    12   7.092   0.524 4 U  4.014E+04  0.00E+00 e 0   134   155

    13   2.008   0.524 4 U  2.250E+05  0.00E+00 e 0   151   155

    14   0.924   0.525 4 U  1.071E+06  0.00E+00 e 0   153   155

    15   3.979   0.525 4 U  3.400E+01  0.00E+00 e 0    74   155

    17   1.019   0.526 4 U  7.966E+05  0.00E+00 e 0   154   155

    19   4.484   0.526 4 U  2.669E+03  0.00E+00 e 0    84   155

    22   4.453   0.690 4 U  3.400E+01  0.00E+00 e 0   171   152

    23   2.969   0.690 4 U  1.323E+05  0.00E+00 e 0    68   152

    24   2.062   0.692 4 U  1.261E+05  0.00E+00 e 0   215   152

    25   4.785   0.691 4 U  2.627E+04  0.00E+00 e 0    67   152

    ..   .....   ..... . .  .........  ........ . .   ...   ...

    ..   .....   ..... . .  .........  ........ . .   ...   ...

    ..   .....   ..... . .  .........  ........ . .   ...   ...

    ..   .....   ..... . .  .........  ........ . .   ...   ...

    ..   .....   ..... . .  .........  ........ . .   ...   ...

    ..   .....   ..... . .  .........  ........ . .   ...   ...

    ..   .....   ..... . .  .........  ........ . .   ...   ...

  1172   1.562   3.613 4 U  2.500E+05  0.00E+00 e 0   202   210

  1173   1.562   3.790 4 U  6.573E+04  0.00E+00 e 0   202   211

  1174   7.501   4.339 4 U  3.400E+01  0.00E+00 e 0    97     5

  1177   1.377   3.844 4 U  2.060E+06  0.00E+00 e 0   169    44

  1178   3.844   1.375 4 U  1.700E+06  0.00E+00 e 0    44   169

  1180   0.980   3.845 4 U  2.106E+05  0.00E+00 e 0   162    44

  1181   0.838   3.845 4 U  5.000E+04  0.00E+00 e 0   165    44

  1182   1.864   1.393 4 U  3.400E+01  0.00E+00 e 0    28    51

  1183   1.374   1.848 4 U  4.869E+05  0.00E+00 e 0   169   161

  1185   3.427   4.563 4 U  4.200E+04  0.00E+00 e 0    59   167

  1187   0.522   3.138 4 U  2.622E+04  0.00E+00 e 0   155   147

  1188   0.927   2.837 4 U  3.400E+01  0.00E+00 e 0   153    85

  1193   2.117   4.327 4 U  3.400E+01  0.00E+00 e 0   105   112

  1196   4.159   2.178 4 U  3.400E+01  0.00E+00 e 0    50    46

  1199   3.138   3.492 4 U  3.400E+01  0.00E+00 e 0    58   194

  1200   0.521   4.311 4 U  3.400E+01  0.00E+00 e 0   155   172

  1201   0.522   3.828 4 U  3.400E+01  0.00E+00 e 0   155   128

  1204   0.868   4.389 4 U  3.400E+01  0.00E+00 e 0   203   186

  1209   3.847   4.562 1 U  3.400E+01  0.00E+00 e 0    44   167

  1211   2.335   7.501 1 U  3.400E+01  0.00E+00 e 0    36    97

  1212   4.486   6.518 1 U  3.400E+01  0.00E+00 e 0    84   133

  1214   1.557   4.388 1 U  9.770E+04  0.00E+00 e 0   200   186

  1215   2.830   3.921 1 U  1.500E+05  0.00E+00 e 0   176   183

  1217   1.792   4.287 1 U  4.165E+04  0.00E+00 e 0     0     0

  1221   1.329   0.877 1 U  3.440E+05  0.00E+00 e 0     0     0

 

 

 

Creare il file delle costanti di accoppiamento scalare (er2.cco)

 

I file delle costanti di accoppiamento scalare specificano i valori, e, in opzione, le serie di tolleranza e i fattori di peso per le costanti di accoppiamento scalare vicinali:

 

   1) 2)   3)   4)    5)   6)

   1 ASP- HA   HB2   9.5  2.0           

   1 ASP- HA   HB3   3.8  2.0           

#  3 MET  HA   HB2   6.6  2.0         

#  3 MET  HA   HB3   6.9  2.0         

   4 THR  HA   HB    2.9  1.5           

   5 CYSS HA   HN    3.8  1.5      

   5 CYSS HA   HB3  11.3  2.0                   

   5 CYSS HA   HB2   6.2  2.0           

   6 GLU- HA   HN    4.0  1.5      

   6 GLU- HA   HB2   5.9  2.0           

   6 GLU- HA   HB3   9.2  2.0           

   7 GLN  HA   HN    5.0  1.5      

   7 GLN  HA   HB3   3.6  2.0           

   8 ALA  HA   HN    5.2  2.0            

   9 MET  HA   HN    4.5  1.5      

   9 MET  HA   HB3   4.0  2.0           

  10 ALA  HA   HN    7.6  2.0                    

# 11 SER  HA   HN                  

# 12 CYSS HA   HN                  

  13 GLU- HA   HN   10.1  2.0               

  

Ogni linea specifica, in quest’ordine, i seguenti dati: 1) il numero del residuo, 2) il nome del residuo, 3) il nome del primo atomo, 4) il nome del secondo atomo, 5) il valore J della costante di accoppiamento (in Hertz), 6) la tolleranza DJ della costante di accoppiamento (in assenza di indicazioni il valore è 2.0 Hz), e 7) il peso relativo (in assenza di indicazioni il valore è 1.0). L’intervallo permesso di una costante di accoppiamento è [J  -  DJ,  J  +  DJ].

 

 

 

PROCEDURE DI CALCOLO

 

Dopo aver creato i file indispensabili al programma per poter svolgere il suo compito, si può iniziare a studiare quelle procedure di calcolo, racchiuse in un insieme specifico di comandi chiamato MACRO, che produrranno quei risultati da noi desiderati. Gli step di righe di comando che seguiranno sono proposti in ordine sequenziale. 

Quindi, ricapitolando, una volta prodotti i file di input, si digita al prompt di DYANA:

 

dyanalib

Legge la libreria dei residui (la standard ne contiene 56)

read seq er2.seq                             

Legge la sequenza della nostra proteina

 

Poi si procede alla calibrazione degli integrali dei picchi, cioè la conversione dell’intensità dei picchi in vincoli di legame. La calibrazione può essere eseguita sia in modo automatico (più semplice) che manuale (più complesso). La calibrazione automatica è eseguita nel seguente modo:

read prot er2.prot

Legge la lista dei protoni

read peaks er2_h2o.peaks assigned integrated

Legge la lista dei picchi in H2O

caliba

Calibra la lista dei picchi in H2O

read peaks er2_d2o.peaks assigned integrated

Legge la lista dei picchi in D2O

caliba

Calibra la lista dei picchi in D2O

distance unique

Prende i vincoli più forti per ogni distanza

write upl caliba.upl

Salva i limiti superiori prima di modificarli 

(Vedi in Appendice la descrizione del file)

 

La macro caliba definisce una calibrazione standard dei picchi correnti usando 3 differenti classi di calibrazione :

1)  la calibrazione dei picchi NOE assegnati ai protoni del backbone;

2)  la calibrazione dei picchi NOE assegnati ai protoni delle catene laterali ;

3)  la calibrazione dei picchi NOE assegnati ai gruppi metilici.

Le funzioni di calibrazione usate per queste 3 classi sono rispettivamente:

 

V=A/r6 ;  V=B/r4 ;  V=C/r4

 

dove V è il volume dei picchi e r è la distanza corrispondente.

I parametri A, B e C sono calcolati automaticamente. Il programma pone il parametro A tale che il limite superiore della distanza media per la classe di calibrazione backbone diventi 3.6 Angstrom. I parametri B e C sono calcolati in modo che le curve di calibrazione intersechino nei limiti superiori di minima distanza permessa (2.4 Angstrom). I punti di intersezione a più alta distanza non avrebbero senso, come le funzioni di calibrazione “non fisiche” del tipo 1/r4. Nel caso in cui l’utente abbia a disposizione strutture preliminari della sua proteina, può inserire i valori di tali parametri utilizzando la seguente calibrazione manuale. 

 

La seguente trattazione esula dalle conoscenze dell’utente inesperto, che non ha ancora sviluppato quelle metodiche di lavoro derivanti da una applicazione assidua nell’utilizzo del programma stesso; per questo motivo si consiglia il suddetto di passare direttamente al seguitodel manuale.

 

Nella calibrazione manuale l’utente potrà selezionare i picchi riportati nel file er2_h2o.peaks e er2_d2o.peaks con alcuni criteri (comando peak select) e poi calibrarle con alcune funzioni monotone decrescenti (comando calibrate). Potrà inoltre definire le proprie classi e le funzioni di calibrazione migliorandole rispetto a quelle date dalla calibrazione automatica. Ad esempio, per cambiare la calibrazione per la classe di calibrazione backbone dal valore determinato automaticamente A=2.2E+8 a A=1.2E+8, si usa il seguente comando:

             

caliba bb=1.2E+8   

 

se sono dati un volume del picco il corrispondente limite di distanza, i picchi della classe di calibrazione backbone possono essere calibrati secondo la macro caliba .

           

volume=0.6E+6

d=2.4

caliba bb=volume*d**6

 

Per la calibrazione delle liste di picchi multipli ci sono due differenti approcci.

Il primo tratta ogni lista di picchi separatamente :

         

read prot first

read peak first assigned integrated

caliba

read prot second

read peak second assigned integrated

caliba

.......

 

Nel secondo approccio le liste dei picchi sono lette differentemente, definiti dall’utente i pesi relativi per i volumi dei picchi e poi calibrati simultaneamente :

            

read prot first

read peak first assigned integrated

read prot second

read peak second weight=0.3 / assigned integrated append

caliba

...…..

 

Grazie all’opzione append nel secondo comando read peaks, la seconda lista di picchi è aggiunta alla prima lista di picchi.

Questo approccio ha uno svantaggio ossia i pesi relativi devono essere specificati dall’utente.

Un utente esperto di DYANA può voler creare una propria classe di calibrazione o usare una differente funzione di calibrazione. Due esempi illustrano ciò :

Per usare “uniform average model” (Braun et al. 1981) per tutti i picchi NOE dei gruppi metilici coinvolti, prima si devono selezionare i picchi corrispondenti  e poi applicare la funzione di calibrazione media pesando il parametro C (dato dall’utente) :

  

peak select METHYL, *

calibrate C*(1.9**(-5)-d**(-5))/(d-1.9)

Per calibrare i picchi del HN-HN con una funzione A1/d6 con eccezione dei picchi NOE osservati in un lungo e flessibile loop  da 12 residui  o 26 residui (che sono calibrati con A2/d4), si usa :

             

peak select HN 12....26, HN

calibrate A1/d**4

peak select HN,HN xor

calibrate a27d**6

 

l’operatore logico xor è usato nel secondo comando peaks select per selezionare tutti i picchi eccetto quelli che sono già selezionati.

 

Il seguente step è una analisi sistematica della conformazione locale attorno all’atomo di Ca di ogni residuo. Sulla base di vincoli di distanza locali del file caliba.upl e delle costanti di accoppiamento scalare del file er2.cco le conformazioni permesse dagli angoli diedri f, y, c1 e c2 di ogni residuo sono determinate dalla macro habas:

                  

read prot er2.prot

Legge la lista dei chemical shift

read peaks er2_h2o.peaks

Legge la lista dei picchi NOESY in H2O

read peaks er2_d2o.peaks

(se disponibile)

read upl  caliba.upl

Legge i limiti di distanza superiore dei picchi NOE

read cco er2.cco

Legge il file delle costanti di accoppiamento scalare

atoms stereo HB2 2 5  

Questo comando definisce gli assegnamenti

stereospecifici se conosciuti

atoms stereo QD1 39   

habas angles=”CHI1 CHI2*” tfcut=0.05

Attua le ricerche di rete per tutti i residui amminoacidici includendo gli angoli diedri f, y, c1 e c2. Permette le conformazioni con valori di funzioni target locali sopra a 0.05 Angstrom2.

gridplot habas.ps

 

Crea un diagramma di angoli permessi

Vedi Capitolo “Fare Grafici con Diana”

atom stereo list

Lista degli assegnamenti stereospecifici

distance modify

Modifica i vincoli di distanza

write upl er2.upl

Salva i limiti superiori

write aco er2.aco

Salva le costrizioni sugli angoli

(Vedi in Appendice la descrizione del file)

 

Il comando atoms stereo riduce, se sono conosciuti gli assegnamenti sterospecifici tra atomi della struttura in esame, i gradi di libertà nel calcolo conformazionale della nostra proteina rendendo quindi i calcoli più veloci e accurati. Tuttavia questo comando non è indispensabile poiché gli algoritmi di DYANA possono sopperire alla mancanza dei dati di stereospecificità.

Il comando distance modify rimuove i vincoli irrilevanti ( vincoli che coinvolgono distanze fisse e vincoli che non possono essere violati), mantenendo al massimo una distanza limite per ogni coppia di atomi e introducendo correzioni per i vincoli con sostituenti diastereoisotopici per i quali gli assegnamenti stereospecifici non sono disponibili. Il risultato di questo step è di modificare i limiti di distanza superiore nel file er2.upl, i vincoli degli angoli nel file er2.aco e gli assegnamenti stereospecifici.

 

Il passo seguente rappresenta il cuore di calcolo del programma stesso chiamato annealing simulato. La dinamica molecolare nello spazio degli angoli di torsione è il metodo di calcolo della struttura preferito per tutte le proteine eccetto per piccoli peptidi a elica. Il calcolo delle strutture è eseguito con le seguenti righe di comando:

             

read aco er2.aco

 

ssbond 5-12 17-20 23-31

 

call_all 30

 

overview er2 structures=20 ang cor pdb hbond vdw full

 

 

Dopo aver letto i file dei dati in input vengono generati i vincoli per i 3 legami solfurici 5-12, 17-20 e 23-31 con la macro ssbond e calcolati 30 conformeri con l’annealing simulato nello spazio degli angoli di torsione, usando la macro calc_all. Per proteine più lunghe può essere necessario aumentare il numero di intervalli di tempo e/o il numero dei conformeri.

Infine vengono scritti nel file overview er2.ovw, nel file degli angoli er2.ang e nei file delle coordinate er2.cor e er2.pdb i risultati finali. Questi ultimi due file permettono attraverso l’uso di opportuni programmi di visualizzare la struttura della proteina. Mentre i file .cor sono uno per struttura considerata (in questo caso 20), il file .pdb è unico, ma contenente tutte e 20 le strutture. Il file .ang di angoli contiene tutti i 20 conformeri, ordinati in base al valore crescente della funzione target. Per un’analisi successiva tutti i 20 conformeri possono essere caricati nel programma con il comando:

           

read ang er2.ang

 

Approfondimento: il calcolo delle strutture è eseguito con la macro calc_all, la quale richiama  il comando anneal, usando le dinamiche degli angoli di torsione (TAD). Il protocollo di annealing simulato standard, che è usato se la macro calc_all è chiamata senza parametri, consiste di 4000 TAD steps. Il primo quinto di questi è effettuato a temperatura iniziale elevata, seguito dai restanti passi effettuati in condizione di  lento raffreddamento (il processo di annealing appunto).

Vari parametri del protocollo di annealing standard possono essere cambiati dall’utente. Per esempio 6000 TAD steps possono essere assegnati con il comando

          

call_all 30 anneal steps=6000      

 

sono calcolate 30 strutture con il protocollo standard anneal, per 30 conformeri iniziali con angoli di torsione random. I conformeri risultanti sono immagazzinati nelle memorie 1-30 delle strutture. 

 

Un file overview (“er2.ovw”), un file di angoli (“er2.ang”) e un file di coordinate (“er2.cor”) di 20 conformeri con valori di funzione target inferiori possono essere generati dopo il calcolo della struttura con il comando .

            

overview er2 structures=20 ang cor pdb

 

 

 

FARE GRAFICI CON DYANA

 

GRAF, una parte di INCLAN, è uno strumento versatile per produrre grafici in formato Postscript (.ps). DYANA fornisce molti comandi per creare grafici. Per esempio, il seguente comando crea un grafico Ramachandran per il gruppo di strutture (20) calcolate:

 

readdata er2

 

read_all er2*.cor

 

ramachandran rama.ps

 

        

Il file risultante compilato da un opportuno programma di lettura esterno dà come risultato il seguente grafico (rama.ps):

 



  Fig. 1 – Grafico di Ramachandran che illustra i valori consentiti di f e y per i residui in questione

 

Il comando :

 

readdata er2

dcostat dco

 

crea due grafici della distribuzione dei vincoli di distanza come una funzione del loro range (cioè la differenza del numero del residuo) e dei loro numeri di residuo. Ciò viene salvato in un file Postscript “dco.ps”. Nel grafico b), limiti di distanza superiore sono classificati secondo il loro range, R :

 

bianco

vincoli intraresidui (R=0)

grigio chiaro

vincoli seguenziali (R=1)

grigio scuro

range medio (R<5)

Nero

range lungo (R>5 ; non presenti nell' esempio)


Fig.2 – Grafico rappresentante il numero di vincoli in funzione della distanza dei residui

interagenti lungo la sequenza amminoacidica (alto) e numero dei vincoli in funzione della sequenza (basso).

 

Si può inoltre creare un grafico di limiti di distanza superiore di piccolo e medio range in ordinate con la sequenza in ascisse. Questo è spesso usato per identificare gli elementi di struttura secondaria ed è creato nel seguente modo :

            

readdata er2

seqplot seq.ps

 

così creando un file .ps.

Le prime tre righe dopo la sequenza amminoacidica rappresentano le restrizioni degli angoli di torsione del backbone f e y e quello delle catene laterali c. Per f e y, il simbolo a triangolo con vertice verso l’alto, indica una restrizione compatibile con la struttura ideale di un a-elica (f= -57 e y= -47); il simbolo a triangolo con vertice rivolto verso il basso indica una restrizione compatibile con una struttura ideale del foglietto b parallelo o antiparallelo (f= -119 e y=113 o f= -139 e y=135); la stella indica possibilità di compatibilità con struttura secondaria di tipo a e b; il cerchio indica compatibilità con strutture non aventi alcuna regolarità di struttura secondaria. Per quel che concerne c, i simboli rappresentati da quadrati di 3 differenti e decrescenti grandezze indicano la possibilità di ottenere a seconda dell’angolo di torsione della catena laterale uno, due o tutti e tre rotameri di valori c= -60, 60, 180. Quegli angoli di torsione che escludono tutti e 3 i rotameri sono indicati da un cerchio. I limiti di distanza superiori per distanze sequenziali e a medio range sono mostrati da linee orizzontali che connettono le posizioni dei due residui coinvolti. Lo spessore delle linee per le distanze sequenziali dNN(i,i+1), daN(i,i+1) e dbN(i,i+1) è inversamente proporzionale al quadrato del legame di distanza superiore.

 

Fig. 3 – Grafico che indica i diversi tipi di legame (intra o extra residuo) e i diversi vincoli degli angoli di torsione.

 



 Fig. 4 – Grafico rappresentante il range degli angoli f e y permessi per ogni residuo (riproduzione parziale).

 

ALLEGATI

 FILE .UPL

 

Questi tipi di file, come si è già visto, sono generati dal comando caliba. Nel caso in cui si hanno già da altri software le distanze interprotoniche, allora si può omettere le procedure di calibrazione ed introdurre direttamente come input il file.upl I file dei limiti delle distanze superiori e inferiori sono usati per registrare i vincoli delle distanze all’interno del programma DYANA. Per ogni vincolo di distanza esiste una riga con i seguenti campi: 1) 4) numero del residuo, 2) 5) nome del residuo e 3) 6) il nome atomico rispettivamente del primo e del secondo atomo, 7) il limite di distanza in angstrom, e, volendo, 8) il peso relativo (l’importanza relativa) del vincolo. In assenza di indicazioni il peso relativo è 1. I pesi relativi dovrebbero essere positivi. Il peso di un  vincolo nella funzione target eguaglia il peso relativo per il fattore di peso per i corrispondenti tipi di vincoli.

Mostriamo in esempio parte del file caliba.upl:

 

  1) 2)  3)      4) 5)   6)      7)               8)

 

  1 ASP- HA      1 ASP- HB3     3.45   # peak    528

  1 ASP- HA      2 PRO  HD2     4.20   # peak    681

  1 ASP- HA      2 PRO  HD3     3.21   # peak    722

  1 ASP- HA     19 TYR  QE      7.63   # peak   1079

  1 ASP- HB2     1 ASP- HB3     2.40   # peak    494

  1 ASP- HB2     2 PRO  HD2     5.50   # peak    492

  1 ASP- HB2     2 PRO  HD3     5.50   # peak    491

  1 ASP- HB3     2 PRO  HD2     3.89   # peak    530

  1 ASP- HB3     2 PRO  HD3     5.38   # peak    529

  2 PRO  HA      2 PRO  HB2     3.83   # peak    270

  2 PRO  HA      2 PRO  HB3     3.14   # peak    447

  2 PRO  HA      2 PRO  QG      6.38   # peak    913

  2 PRO  HA      2 PRO  HD2     5.50   # peak    914

  2 PRO  HA      2 PRO  HD3     4.94   # peak    915

    ...  ...     . ...  ..      ....   . ....    ...

    ...  ...     . ...  ..      ....   . ....    ...

    ...  ...     . ...  ..      ....   . ....    ...

    ...  ...     . ...  ..      ....   . ....    ...

    ...  ...     . ...  ..      ....   . ....    ...

 40 PRO  HA     40 PRO  HB2     3.67   # peak    295

 40 PRO  HA     40 PRO  HB3     3.24   # peak    427

 40 PRO  HA     40 PRO  HG2     5.16   # peak    879

 40 PRO  HB2    40 PRO  HD2     5.50   # peak    702

 40 PRO  HB2    40 PRO  HD3     5.50   # peak    739

 40 PRO  HB3    40 PRO  HD2     5.50   # peak    706

 40 PRO  HB3    40 PRO  HD3     5.25   # peak    428

 40 PRO  HG2    40 PRO  HD2     3.45   # peak    321

 40 PRO  HG2    40 PRO  HD3     3.36   # peak    322

 40 PRO  HD2    40 PRO  HD3     2.40   # peak    703

 

Se in una linea di input il numero e il nome del primo residuo sono assenti, vengono utilizzati i dati corrispondenti alla precedente linea di annotazioni. In altro modo, il numero e il nome del primo residuo possono stare da soli su di una linea in modo tale che la parte seguente è una forma equivalente dell’esempio sopra citato del file dei vincoli delle distanze:

 

  1 ASP- HA      1 ASP- HB3     3.45   # peak    528

    ASP- HA      2 PRO  HD2     4.20   # peak    681

    ASP- HA      2 PRO  HD3     3.21   # peak    722

    ASP- HA     19 TYR  QE      7.63   # peak   1079

    ASP- HB2     1 ASP- HB3     2.40   # peak    494

    ASP- HB2     2 PRO  HD2     5.50   # peak    492

    ASP- HB2     2 PRO  HD3     5.50   # peak    491

    ASP- HB3     2 PRO  HD2     3.89   # peak    530

    ASP- HB3     2 PRO  HD3     5.38   # peak    529

  2 PRO  HA      2 PRO  HB2     3.83   # peak    270

    PRO  HA      2 PRO  HB3     3.14   # peak    447

    PRO  HA      2 PRO  QG      6.38   # peak    913

    PRO  HA      2 PRO  HD2     5.50   # peak    914

    PRO  HA      2 PRO  HD3     4.94   # peak    915

    ...  ...     . ...  ..      ....   . ....    ...

    ...  ...     . ...  ..      ....   . ....    ...

    ...  ...     . ...  ..      ....   . ....    ...

    ...  ...     . ...  ..      ....   . ....    ...

    ...  ...     . ...  ..      ....   . ....    ...

 40 PRO  HA     40 PRO  HB2     3.67   # peak    295

    PRO  HA     40 PRO  HB3     3.24   # peak    427

    PRO  HA     40 PRO  HG2     5.16   # peak    879

    PRO  HB2    40 PRO  HD2     5.50   # peak    702

    PRO  HB2    40 PRO  HD3     5.50   # peak    739

    PRO  HB3    40 PRO  HD2     5.50   # peak    706

    PRO  HB3    40 PRO  HD3     5.25   # peak    428

    PRO  HG2    40 PRO  HD2     3.45   # peak    321

    PRO  HG2    40 PRO  HD3     3.36   # peak    322

    PRO  HD2    40 PRO  HD3     2.40   # peak    703

 

 

 

FILE .ACO

 

 

Questo file viene generato dal comando habas ed è un file d’imposizione degli angoli diedri che contiene vincoli diretti sui singoli angoli diedri nella forma di un intervallo permesso [f1, f2] con   f1 < f2 < f1+360°. Questo implica che l’intervallo permesso non deve ridursi a un punto. Ogni riga di dati contiene: 1) il numero del residuo, 2) il nome del residuo, 3) il nome dell’angolo diedro, 4) il salto in gradi dal limite inferiore al limite superiore dell’intervallo permesso, e, in opzione, 5) il peso relativo del vincolo. In assenza di indicazioni il peso relativo è 1. I pesi relativi dovrebbero essere positivi. Il peso di un vincolo nella funzione target eguaglia il peso relativo per il fattore di peso per i corrispondenti tipi di vincoli. Si veda parte del seguente file er2.aco come esempio:

 

      1)    2)        3)              4)             5)

 

   1 ASP-  CHI1   -275.0    35.0

   1 ASP-  CHI1   -155.0   135.0

   1 ASP-  CHI1   -105.0   235.0

   1 ASP-  CHI1     -5.0   285.0

   1 ASP-  PSI      95.0   175.0

   2 PRO   PSI      45.0   205.0

   3 MET   PHI    -335.0   -25.0

   3 MET   PHI    -205.0    95.0

   3 MET   CHI1     25.0   315.0

   3 MET   CHI1   -215.0   105.0

   3 MET   CHI2   -325.0   -35.0

   3 MET   PSI      45.0   185.0

   4 THR   PHI    -315.0   -35.0

   4 THR   PHI    -165.0    55.0

   4 THR   CHI1      5.0    65.0

   4 THR   CHI21  -345.0   -15.0

   . ...   .....   .....   .....

   . ...   .....   .....   .....

   . ...   .....   .....   .....

   . ...   ...     .....   .....

   . ...   ...     .....   .....

  38 GLY   PHI    -325.0   -35.0

  38 GLY   PHI    -135.0   135.0

  38 GLY   PSI    -285.0    45.0

  38 GLY   PSI     -95.0    95.0

  38 GLY   PSI     -45.0   285.0

  39 LEU   PHI     -95.0   -65.0

  39 LEU   CHI1   -145.0   -95.0

  39 LEU   CHI1   -115.0   235.0

  39 LEU   CHI2     25.0   325.0

  39 LEU   CHI2   -105.0   195.0

  39 LEU   PSI     115.0   175.0

 

Come per i file dei vincoli delle distanze, il numero e il nome del residuo non necessitano di essere ripetuti su ogni riga di dati; se essi sono mancanti verranno assunti i dati corrispondenti alla precedente riga di annotazioni.

 

 

 

FILE .OVW

 

Questo file è creato dalla macro overview e contiene le prime n miglior strutture calcolate in ordine crescente del valore della loro funzione bersaglio. Un file overview strutturato come segue.

Questa prima tabella indica: 1) numero di struttura, 2) il valore della funzione bersaglio, 3a) e 3b) rispettivamente la somma e il massimo delle violazioni delle distanze superiori, 4a) e 4b) rispettivamente  la somma e il massimo delle violazioni  delle distanze inferiori, 5a) e 5b) la somma e il massimo delle violazioni di Van der Waals , 6a) e 6b) la somma e il massimo delle violazioni degli angoli di torsione, 7a) e 7b) la somma e il massimo delle violazioni delle costanti di accoppiamento, 8) la media delle diverse voci su citate, 9) la deviazione standard  delle stesse voci,  e 10) e 11) rispettivamente il minimo e il massimo delle stesse voci.

 

 

     Structural statistics:

 

     1)     2)         3a)    3b)       4a)    4b)       5a)    5b)       6a)    6b)        7a)   7b)

 

     str  target      upper limits     lower limits    van der Waals    torsion angles     J-couplings

         function  #   sum    max   #    sum   max   #   sum    max   #   sum    max   #    sum   max

      1   131.46  50   29.2  1.50   2    0.7  0.32  28   23.4  0.72   0   14.6  2.64   5    9.2  1.92

      3   205.89  73   54.7  1.90   1    0.4  0.42  77   43.1  1.20   0   17.9  2.02  17   27.8  3.09

      4   211.51  75   42.7  1.54   1    0.8  0.75  59   34.2  0.92   0   23.5  2.53  16   26.4  2.64

      5   222.36  74   45.7  1.16   2    1.2  0.85  56   30.7  1.50   0   25.3  2.39  15   21.2  2.30

      6   232.78  76   51.7  1.94   1    0.5  0.38  80   46.3  1.01   0   22.7  2.66  18   29.7  2.86

      7   236.74  81   59.1  2.70   4    2.5  1.26 177  112.9  1.59   0   11.0  1.75  10   19.0  2.66

      8   247.00  96   79.0  3.04   2    1.5  0.79 114   62.3  1.24   0   14.4  2.41  13   17.9  2.52

      9   253.56  91   64.6  3.25   3    1.3  0.55  94   50.0  0.99   0   22.0  2.71  16   25.5  2.84

     10   315.42 109   87.7  2.36   3    1.8  0.99 205  119.4  1.89   0   17.8  2.15  14   20.8  2.40

 

 8) Ave   223.02  80   56.2  2.06   2    1.1  0.66  94   55.1  1.26   0   18.8  2.35  13   21.1  2.52

 9) +/-    46.47  15   16.4  0.71   1    0.6  0.31  54   32.5  0.35   0    4.4  0.29   4    6.1  0.36

10) Min   131.46  50   29.2  1.16   1    0.4  0.27  28   23.4  0.72   0   11.0  1.75   5    9.2  1.92

11) Max   315.42 109   87.7  3.25   4    2.5  1.26 205  119.4  1.89   0   25.3  2.71  18   29.7  3.09

 

 

   

 

 

La seguente tabella indica : 1) tipo di constraint violato, segue poi la struttura nella quale è violato ossia 2) e 3) tipi di atomi tra cui vi è il legame, 2a) e 3a) sigla degli amminoacidi a cui appartengono gli atomi, 2b) e3b) il numero degli amminoacidi, 4) il valore del file upl, 5) la media dei constraint violati, 6) il massimo constraint violato, 7) con il simbolo “+”quale struttura ha violato il constraint  e con “*”  quella che l’ha violato con il valore massimo.

 

 

    Constraints violated in 3 or more structures:

 

      1)  2)    2a)   2b)  3)    3a)   3b)   4)         5)     6)      7)   

    

                                                   #   mean   max. 1   5   10

    Upper HA    PRO    2 - QD    TYR   19   7.64   3   0.09   0.30   +*     +

    Upper HA    MET    3 - QG2   THR    4   5.60   4   0.18   0.48 ++      +*

    Upper QG    MET    3 - HB    THR    4   6.38   5   0.31   0.88   ++ ++*

    Upper HA    THR    4 - HN    ALA    8   5.50   5   0.21   0.72  *++   + +

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    Upper HB2   GLU-  36 - HN    CYSS  37   3.73   5   0.27   0.70 +  ++  +*

    Upper HA1   GLY   38 - HN    LEU   39   3.42   3   0.11   0.21   +   * +

    Upper HN    LEU   39 - HB3   LEU   39   3.17   6   0.20   0.34   + +*+ ++

    Upper HN    LEU   39 - QB    LEU   39   2.91   7   0.17   0.27   +++*+ ++

    Lower SG    CYSS   5 - CB    CYSS  20   3.00   6   0.30   0.85 ++  * + ++

    Lower SG    CYSS  12 - CB    CYSS  37   3.00   3   0.17   0.64       *++

    Lower SG    CYSS  12 - SG    CYSS  37   2.00   4   0.13   0.37 +     + *+

    Lower SG    CYSS  17 - CB    CYSS  28   3.00   6   0.46   1.26   +++ *+ +

    Angle CHI1  THR    4            5.00   65.00   5  59.16 125.65 +*   +  ++

    Angle CHI1  CYSS   5          145.00  175.00   4  42.45 136.92 *   +   ++

    Angle CHI1  GLU-   6          145.00  165.00   3  27.19  91.23     +*  +

    Angle PHI   MET    9          285.00  315.00   3  23.00  77.43  ++  *

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........   

    Angle PSI   PRO   35          265.00  355.00   5  23.01  62.95 +  +*   ++

    Angle PHI   GLU-  36          255.00  275.00   7  63.75 155.47 +++++  +*

    Angle PSI   GLU-  36            5.00   15.00   8  13.36  33.96 + ++++ +*+

    Angle CHI1  LEU   39          215.00  265.00   7  60.15  86.55   +++*+ ++

    Coupl HA    THR    4 - HB    THR    4   2.90   5   0.51   1.62 ++   *  ++

    Coupl HA    GLU-   6 - HB2   GLU-   6   5.90   3   0.52   1.46     +*  +

    Coupl HA    GLU-   6 - HB3   GLU-   6   9.20   3   0.73   2.44     ++  *

    Coupl HN    GLN    7 - HA    GLN    7   5.00   3   0.43   1.69    *    ++

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    ..... ..    ....   . . ...   ...    .   ....   .   ....   .... ..........

    Coupl HA    THR   32 - HB    THR   32   3.20   3   0.60   2.66   +   *+

    Coupl HN    THR   33 - HA    THR   33   8.70   3   0.47   2.19   +   *+

    Coupl HN    GLU-  36 - HA    GLU-  36   7.90   4   0.73   2.55 +  *   ++

    Coupl HA    LEU   39 - HB2   LEU   39   3.80   7   0.69   1.08   +++++ *+

    133 violated distance constraints.

    37 violated angle constraints.

    25 violated coupling constant constraints.

 

 

 

BIBLIOGRAFIA

 

1-     P. Guntert, C. Mumenthaler and K. Wuthrich, Torsion Angle Dynamics for NMR Structure Calculation with the New Program Dyana, J. Mol. Biol. 1997

2-     W. Braun and N. Go, Calculation of Protein Conformation by Proton-Proton Distance Constraints a New Efficient Algorithm, J. Mol. Biol. 1985

3-     P. Guntert, Manuale di DYANA

 

 


HOME