ARTêCULO

Aplicaci—n de la topolog’a molecular en la bœsqueda de nuevos compuestos derivados del 4-nitro-imidazol activos frente al Tripanosoma brucei

Boris Guzm‡n Fern‡ndez, Riccardo Zanni, Marina Pellicer, Maria Galvez-Llompart, Ram—n Garcia-Domenech *.

Departamento de Qu’mica F’sica, Facultad de Farmacia, Universitat de Valencia. Avda. V. A. Estelles, s/n, 46100-Burjassot, Valencia, Spain.

e-mail: ramon.garcia@uv.es

Recibido el 10 de octubre de 2012

An. R. Acad. Farm. 78, 4, 2012, 511-526

RESUMEN

La Tripanosomiasis Humana Africana, causada por el par‡sito protozoario de la especie Trypanosoma brucei, est‡ caracterizada por un proceso infectivo cr—nico discapacitante que afecta a millones de personas en todo el mundo. El arsenal terapŽutico frente a esta enfermedad, requiere generalmente suministraci—n por v’a parenteral, lo que dificulta la adhesi—n y accesibilidad del paciente al tratamiento. Se ha desarrollado un modelo topol—gico-matem‡tico encaminado a buscar nuevos compuestos derivados del 1-aril-4-nitro-1H-imidazol con potencial actividad anti-tripanos—mica. Utilizando el an‡lisis lineal discriminante se ha obtenido un modelo capaz de predecir correctamente la actividad del 93% de los compuestos estudiados. Se ha sometido al modelo a una validaci—n interna por medio del test de Jack-knife y de una validaci—n cruzada. Tras realizar un cribado molecular virtual se proponen diez nuevos derivados imidaz—licos con potencial actividad anti-tripanos—mica.

Palabras clave: Trypanosoma brucei; An‡lisis QSAR; Topolog’a molecular.


ABSTRACT

Molecular topology application in the search for new active compounds derived from 4-nitro-imidazol against Trypanosoma brucei

Human African Trypanosomiasis, caused by the protozoan parasite Trypanosoma brucei, is characterized by a disabling chronic infectious process affecting millions of people worldwide. The therapeutic arsenal against this disease usually requires intravenous suministraci—n, hindering accessibility and adherence to therapy. It has developed a topological mathematical model aimed to finding new compounds derived from 1-aryl-4-nitro-1H-imidazol with potential anti-trypanosome activity. Using linear discriminant analysis (LDA) was obtained a model capable of predicting correctly the activity of 93% of the studied compounds. The model has been subjected to an internal validation using the jack-knife test or leave-one-out and an internal cross-validation. Following a virtual sweep or virtual screening ten new imidazole derivatives are proposed, with potential anti-trypanosome activity.

Keywords: Trypanosoma brucei; QSAR analysis; Molecular Topology.

1. introducCIîn

La Tripanosomiasis Humana Africana (THA) est‡ causada por el par‡sito protozoario de la especie Trypanosoma brucei sensu lato, y pertenece a las enfermedades tropicales desatendidas, un grupo de infecciones cr—nicas discapacitantes que afectan a m‡s de un mill—n de personas en todo el mundo. çfrica es el continente m‡s afectado por esta enfermedad, siendo las zonas rurales, urbanas pobres o zonas en conflicto donde mayor presencia tiene (1). Se calcula que tiene un impacto econ—mico estimado de m‡s de 1.300 millones de d—lares por a–o en pŽrdidas en cuanto a recursos para los pa’ses en v’as de desarrollo.

La transmisi—n de la tripanosomiasis animal se produce principalmente a travŽs de su vector natural, la mosca tse-tsŽ, aunque tambiŽn puede darse la transmisi—n mec‡nica por picadura de otros insectos.

La THA (o enfermedad del sue–o) es causada por el Trypanosoma brucei gambiense o bien Trypanosoma brucei rhodesiense; se calcula que se dan m‡s de 10.000 casos al a–o de infecci—n en humanos. T. b. gambiense, presente comœnmente en çfrica occidental y central, es la causa del 90% de los casos reportados de THA. Se desarrolla como una enfermedad cr—nica que se caracteriza por una progresi—n lenta. En la etapa tard’a suele presentarse un cuadro de encefalitis que puede derivar incluso en la muerte.

En contraste, T. b. rhodesiense, presente en çfrica oriental y meridional, es responsable de las infecciones agudas con un r‡pido inicio sumado a una progresi—n m‡s veloz de la enfermedad.

Todos los tripanosomiasis infecciosas humanas son transmitidos por la mosca tse-tsŽ (Glossina sp) en una regi—n claramente definida de çfrica, llamada tse-tsŽ belt (2).

La enfermedad se limita a la zona del çfrica subsahariana y se solapa con la distribuci—n de la mosca tse-tsŽ, que actœa como vector.

La epidemiolog’a de THA es heterogŽnea, caracteriz‡ndose por dos etapas definidas. La primera etapa implica la presencia de tripanosomas en el sistema hemo-linf‡tico. En este momento, los s’ntomas son bastante inespec’ficos, incluyendo malestar general, fiebre, y dolor de cabeza. La segunda etapa comienza una vez que los par‡sitos llegan al cerebro y provocan alteraci—n de las funciones neurol—gicas, incluyendo cambios psicol—gicos y trastornos del sue–o, lo que da lugar al tŽrmino comœnmente empleado para definir la THA, "enfermedad del sue–o"(3).

La realidad es que THA es todav’a una enfermedad olvidada que requiere mayor investigaci—n en la prevenci—n, diagn—stico y estrategias de tratamiento. En las œltimas dŽcadas, la THA ha vuelto a ser una enfermedad reemergente, volviendo a la cr’tica situaci—n vivida a principios del siglo XX. En el a–o 2000, se calcula que 300.000 personas estaban infectadas. Sin embargo, ya que s—lo el 10-15% de los 60 millones de personas que viven en zonas de riesgo est‡n bajo control, se puede considerar que el nœmero de personas infectadas est‡ probablemente muy subestimada (1).

El tratamiento de esta enfermedad es complejo. Si analizamos el arsenal terapŽutico frente a la THA, podemos observar como los f‡rmacos empleados requieren generalmente suministraci—n por v’a parenteral, lo que dificulta la adhesi—n y accesibilidad del paciente al tratamiento.

Adem‡s de lo citado anteriormente, el tratamiento actual presenta problemas de eficacia y seguridad (3).

Por todo lo expuesto, se genera una necesidad real de encontrar un mejor y eficaz tratamiento para contener los brotes de infecci—n a travŽs de mŽtodos de bœsqueda econ—micamente sostenibles.

Uno de los mŽtodos que reœnen este requisito de sostenibilidad y eficacia son las tŽcnicas Òin silicoÓ en el campo de la investigaci—n cient’fica. La introducci—n de ordenadores cada vez m‡s eficientes ha permitido lograr grandes avances en el campo bioinform‡tico, hasta el punto de que hoy en d’a estas tŽcnicas representan una herramienta b‡sica en el campo de la investigaci—n (4).

Los llamados estudios de relaci—n cuantitativa estructura-actividad o quantitative structure–activity relationship (QSAR) pueden reducir los costosos fallos en la selecci—n de compuestos candidatos a f‡rmacos en los ensayos cl’nicos, mediante el filtrado de bibliotecas combinatorias.

El cribado virtual o virtual screening permite identificar a los compuestos que presentan toxicidad y/o malas caracter’sticas farmacocinŽticas (5), al principio de la fase de desarrollo del f‡rmaco.

Por œltimo, aplicando esta metodolog’a se logra cribar los muchos compuestos que suelen mostrar actividad inespec’fica en varios ensayos y que rara vez resultan ser verdaderamente eficaces o activos (6).

En la bœsqueda de relaciones cuantitativas estructura-actividad, la topolog’a molecular (TM), se ha convertido en la actualidad en una herramienta muy œtil para caracterizar estructuralmente a una molŽcula y por tanto predecir de forma r‡pida y precisa diversas propiedades fisicoqu’micas y biol—gicas de la misma (7-14).

Con ayuda de TM las molŽculas son caracterizadas estructuralmente a travŽs de los ’ndices topol—gicos (IT) (15). Estos IT son capaces de caracterizar las propiedades fisicoqu’micas y biol—gicas de una determinada molŽcula (tama–o molecular, presencia de ciclos, ramificacionesÉetc.). El c‡lculo de IT no es complejo, y tiene muchas ventajas. Una de las principales ventajas, reside en el hecho de que los descriptores topol—gicos no est‡n atados a su disposici—n dentro de la molŽcula. Es decir, son valores invariables de la molŽcula y no depende de la conformaci—n de la misma en un determinado momento.

Por medio de diversos enfoques estad’sticos llegamos a la obtenci—n de un modelo topol—gico, es decir una ecuaci—n matem‡tica basada en estos IT para una determinada propiedad f’sico-qu’mica o biol—gica. DespuŽs de la obtenci—n del modelo topol—gico para la predicci—n de una determinada actividad farmacol—gica, un cribado virtual, se lleva a cabo con el fin de rastrear e identificar nuevos compuestos con la actividad farmacol—gica deseada (15, 16).

Los ’ndices topol—gicos se han utilizado para la predicci—n de diversas propiedades fisicoqu’micas y biol—gicas en grupos de compuestos con una amplia diversidad estructural (15,17).

El mŽtodo topol—gico ha sido aplicado por la ÒUnidad de Dise–o de F‡rmacos y Conectividad MolecularÓ de la Universitat de Valencia, para la bœsqueda de nuevos compuestos anti-protozoarios (18), anti-mal‡ricos (19, 20), los anti-microbianos (21, 22), anti-fœngicos (23), anti-neopl‡sicos (24), agentes broncodilatadores (25, 26), citost‡ticos (27), anti-inflamatorios (7,16,28), anti-virales VIH-1 (29), compuestos activos frente a Colitis ulcerosa (30) y compuestos antihistam’nicos (31).

Varias patentes se han derivado del empleo de TM para la bœsqueda de nuevos f‡rmacos en el tratamiento de la malaria (20), c‡ncer de pulm—n (32, 33), y la enfermedad de Alzheimer por nuestro grupo de investigaci—n (34).

En cuanto al estado actual del desarrollo cl’nico de nuevos compuestos frente a THA, cabe destacar la aparici—n en escena del compuesto fexinidazol. Este compuesto es un 5-nitroimidazol activo frente al T. b. gambiense y al T. b. rhodesiense, presentando un perfil de seguridad favorable adem‡s de ser suministrado por v’a oral (35).

Los nitro-imidazoles son derivados conocidos por su actividad antibacteriana y anti-protozoaria. En el trabajo de Bourdin B. et al. se describe la actividad de 49 compuestos derivados del 1-aril-4-nitro-1H-imidazol frente a tripanosomiasis africana aguda y cr—nica en modelos experimentales en ratones (36).

El objetivo del presente trabajo, es la elaboraci—n de un modelo topol—gico-matem‡tico encaminado a buscar nuevos compuestos derivados del 1-aril-4-nitro-1H-imidazol con potencial actividad anti-tripanos—mica.

2. MATERIAL Y MƒTODOS

Compuestos analizados

Para este estudio se seleccionaron un grupo de 49 compuestos derivados del 1-aril-4-nitro-1H-imidazol recogidos en el trabajo publicado por Bourdin et al., los cuales mostraron cierta actividad anti-tripanos—mica (36).

La Tabla 1 recoge la estructura qu’mica y la actividad antiparasitaria frente a Trypanosoma en tŽrminos de concentraci—n inhibitoria 50, CI50 (µM) para cada compuesto (la numeraci—n seguida es la misma que aparece en el trabajo original) Bourdin et al. (36).

Descriptores topol—gicos empleados

Los ’ndices topol—gicos empleados en este trabajo fueron los siguientes: ’ndices de conectividad tipo Randic (37) y Kier-Hall (38) hasta el orden cuarto (mχt, mχtv ) e ’ndices topol—gicos de carga, ICT (39) hasta el orden quinto, (Jm, Gm, Jmv , Gmv ). En total, cada compuesto fue caracterizado con una serie de 62 ’ndices. Todos los descriptores han sido obtenidos gracias al programa DESMOL11 (disponible v’a e-mail).

Tabla1.- Estructura qu’mica, actividad experimental (CI50 (μM) ), valor de los descriptores presentes en FD as’ como la clasificaci—n obtenida para cada compuesto analizado en base a la funci—n discriminante seleccionada.

Compuesto

Sustituyente

CI50expa

4χpc

G2v

J5

Clasexp

Prob(act)b

FDb

Clascalcb

1-aril-4-nitro-2H-imidazoles monosustituidos en el anillo benzŽnico

1

H

4.49

1.0739

3.6631

0.0396

A

0.994

5.10

A

2

2-F

2.85

1.3700

4.1082

0.0553

A

0.476

-0.09

I

3

3-F

0.72

1.2460

3.7370

0.0407

A

0.998

6.01

A

4

4-F

2.53

1.2663

3.9592

0.0447

A

0.981

3.92

A

5

2-Cl

n.a.

1.3700

4.3677

0.0553

I

0.319

-0.76

I

6

3-Cl

0.72

1.2460

3.9965

0.0407

A

0.995

5.35

A

7

4-Cl

0.72

1.2663

4.2187

0.0447

A

0.963

3.26

A

8

2-Br

n.a.

1.3700

4.4310

0.0553

I

0.285

-0.92

I

9

3-Br

0.9

1.2460

4.0598

0.0407

A

0.994

5.19

A

10

4-Br

0.97

1.2663

4.2820

0.0447

A

0.957

3.10

A

11

3-NO2

0.77

1.6959

4.1582

0.0512

A

0.990

4.56

A

12

3-CF3

1.45

2.2723

5.2190

0.0621

A

0.924

2.51

A

13

4-CF3

0.7

2.2861

5.4413

0.0621

A

0.888

2.07

A

14

2-CF3O

20.76

1.8537

4.1339

0.0789

I

0.003

-5.84

I

15

3-CF3O

1.76

1.7827

3.7626

0.0614

A

0.882

2.01

A

16

4-CF3O

0.16

1.7992

3.9848

0.0614

A

0.832

1.60

A

17

3-Me

1.82

1.2460

4.9965

0.0407

A

0.942

2.80

A

18

4-Me

11.96

1.2663

5.2187

0.0447

I

0.670

0.71

A

19

3-MeO

1.92

1.3113

4.0190

0.0463

A

0.970

3.48

A

20

4-MeO

3.19

1.3278

4.2412

0.0500

A

0.812

1.47

A

21

4-CO2Bu

28.03

1.5207

7.8516

0.0583

I

0.000

-9.54

I

1-aril-4-nitro-2H-imidazoles disustituidos en el anillo benzŽnico

22

2,3-diF

2.18

1.7549

4.4043

0.0554

A

0.937

2.71

A

23

2,4-diF

n.a.

1.5384

4.1821

0.0591

I

0.419

-0.33

I

24

2,5-diF

1.64

1.5431

4.1821

0.0554

A

0.788

1.31

A

25

2,6-diF

n.a.

1.6255

4.3311

0.0690

I

0.015

-4.19

I

26

3,4-diF

0.76

1.6773

4.2552

0.0454

A

0.999

6.66

A

27

3,5-diF

0.49

1.3923

3.5886

0.0417

A

0.999

7.32

A

28

2,3-diCl

1.9

1.7549

4.9233

0.0554

A

0.799

1.38

A

29

2,4-diCl

n.a.

1.5384

4.7011

0.0591

I

0.161

-1.65

I

30

2,5-diCl

n.a.

1.5431

4.7011

0.0554

I

0.497

-0.01

I

31

3,4-diCl

0.1

1.6773

4.7742

0.0454

A

0.995

5.33

A

32

3,5-diCl

0.7

1.3923

4.1076

0.0417

A

0.998

5.99

A

33

3-Cl-4-F

0.7

1.6773

4.5147

0.0454

A

0.998

6.00

A

34

2-Br-4-Me

n.a.

1.5384

5.7644

0.0591

I

0.013

-4.36

I

35

3-Me-4-Br

0.99

1.6773

5.8375

0.0454

A

0.932

2.62

A

36

3-Br-4-Me

1.99

1.6773

5.8375

0.0454

A

0.932

2.62

A

37

2,4-diMe

n.a.

1.5384

6.7011

0.0591

I

0.001

-6.75

I

38

3,4-diMe

2.12

1.6773

6.7742

0.0454

A

0.557

0.23

A

39

2,4-diMeO

n.a.

1.6114

4.7461

0.0733

I

0.001

-7.24

I

Compuesto

Sustituyente

CI50expa

4χpc

G2v

J5

Clasexp

Prob(act)b

FDb

Clascalcb

40

3,4-diMeO

n.a.

1.6427

4.8193

0.0548

I

0.704

0.87

A

41

3,4-O2-CH2

0.94

1.5829

4.7359

0.0376

A

1.000

7.93

A

42

3-CO2Bu-4-Cl

141.32

1.7803

8.4071

0.0599

I

0.000

-9.21

I

43

3-CO2H-4-Cl

95.54

1.7689

7.5295

0.0515

I

0.030

-3.47

I

1-aril-2-metil-4-nitro-imidazoles mono o disustituidos en el anillo benzŽnico

44

4-CF3O

11.89

2.1018

6.3913

0.0643

I

0.046

-3.02

I

45

4-CF3

11.28

2.5887

7.8478

0.0652

I

0.068

-2.61

I

46

2-Br-4-Me

124.6

1.8430

8.1709

0.0627

I

0.000

-9.27

I

47

3-Cl-4-F

27.03

1.9799

6.9212

0.0534

I

0.311

-0.79

I

48

4-Br-3-Me

20.16

1.9799

8.2440

0.0534

I

0.015

-4.17

I

49

3-Br-4-Me

23.54

1.9799

8.2440

0.0534

I

0.015

-4.17

I

F‡rmacos de referencia

Fexinidazol

 

2.57

             

Megazol

 

0.1

             

Melarsoprol

 

0.009

             

Eflornitine

 

3.8

             

a Datos de actividad anti-tripanos—mica CI50 experimental obtenidos del trabajo publicado por Bourdin et al. (36). b Obtenido a partir de la ecuaci—n 1. c n.a.: no presenta actividad anti-tripanos—mica. Estructura base:

Algoritmo QSAR: An‡lisis lineal discriminante

La bœsqueda de un modelo topol—gico-matem‡tico capaz de identificar compuestos con actividad anti-tripanos—mica, se ha realizado aplicando la tŽcnica estad’stica del an‡lisis lineal discriminante ALD, por medio de la cual, es posible obtener funciones lineales capaces de clasificar los compuestos estudiados en categor’as o grupos y discriminar entre compuestos activos e inactivos (15).

En nuestro caso, el ALD se ha aplicado a dos series de compuestos:

La primera serie formada por compuestos con probada actividad inhibitoria frente a Trypanosoma (en nuestro caso, compuestos con CI50<5μM) y la segunda, por compuestos considerados inactivos (CI50>5μM).

La capacidad discriminante fue expresada por medio del porcentaje de clasificaci—n correcta para cada grupo. El ALD se realiz— con la ayuda del paquete estad’stico StatSoft STATISTICA, versi—n 8.0. (40) La selecci—n de los ’ndices en la funci—n discriminante se basa en el par‡metro F-Snedecor, y el criterio de clasificaci—n empleado es la menor distancia de Mahalanobis. La calidad de la funci—n de discriminaci—n se evalœa con el par‡metro lambda de Wilks empleando el test de igualdad de las medias de grupo para las variables de la funci—n de discriminaci—n (41-42).

La raz—n principal por la cual hemos escogido la tŽcnica ALD, se debe a que de 10 de los 49 compuestos estudiados (20 % de los compuestos estudiados) no dispon’amos del valor de CI50 y mediante el ALD se pueden tratar valores discretos de la propiedad a diferencia de lo que ocurre con otras tŽcnicas como puede ser la regresi—n multilineal (43).

Diagramas de distribuci—n de la actividad farmacol—gica, DDAF

Una vez obtenida la funci—n discriminante, es interesante realizar el correspondiente diagrama de distribuci—n de la actividad farmacol—gica (DDAF), para cada una de ellas.

Estos gr‡ficos son œtiles para determinar el intervalo de la funci—n discriminante en el que la expectativa, E, o probabilidad de encontrar compuestos activos,  es m‡xima. Los DDAF son histogramas en los que se representa en  ordenadas la E y en el eje de abscisas, el valor de la funci—n discriminante, FD. Para un intervalo arbitrario de FD, se puede definir la expectativa de actividad, Ea, como: Ea = a/(i+1), en donde a representa el nœmero de compuestos activos en el intervalo dividido por el nœmero total de compuestos activos, e i representa el nœmero de compuestos inactivos en el intervalo dividido por el nœmero total de compuestos inactivos.

La probabilidad de inactividad viene definida de una manera simŽtrica como Ei=i/(a+1). Esta representaci—n nos da una buena visualizaci—n de las regiones de m’nimo solapamiento, y permite la selecci—n de intervalos de FD en los que la probabilidad de encontrar compuestos activos es m‡xima (44).

An‡lisis de validaci—n

La calidad predictiva y robustez del modelo de predicci—n seleccionado debe evaluarse por medio de un test de validaci—n interna. En este caso se han adoptado dos estrategias:

¥          La primera validaci—n ha consistido en aplicar el mŽtodo Jack-knife (45), el cual puede definirse como un procedimiento estad’stico de re-muestreo para estimar el error est‡ndar de una magnitud. Este mŽtodo consiste en extraer un compuesto de la serie y volver a calcular el modelo utilizando como conjunto de entrenamiento N-1 compuestos de forma que la propiedad es entonces predicha para el elemento eliminado. Este proceso se repite para todos los compuestos de la serie, obteniendo una predicci—n para cada uno.

¥          La segunda validaci—n o validaci—n cruzada, consiste en dividir la data en varios subgrupos (5 en nuestro caso con 11 compuestos cada uno). Cuatro de los subgrupos formar‡n el grupo de entrenamiento y el quinto el grupo test. El proceso se repite cinco veces cambiando los subgrupos de entrenamiento y test. La divisi—n de los subgrupos fue llevada a cabo aleatoriamente.

El objetivo de este test de validaci—n cruzada es determinar la robustez del modelo, garantizando que el porcentaje de acierto del modelo no depende exclusivamente de unos pocos compuestos empleados para su elaboraci—n, sino que los compuestos que conforman la data tienen similar peso a la hora de elaborar el modelo.

3. RESULTADOS y discusi—n

El an‡lisis de discriminaci—n lineal se realiz— con los 49 compuestos que formaban la data y los 62 descriptores topol—gicos que describen los aspectos topol—gicos y estructurales de cada molŽcula.

Tabla 2.- Matriz de clasificaci—n obtenida con la funci—n discriminante seleccionada y el test de validaci—n cruzada.

     

Grupo de entrenamiento

Grupo test

FD

l

% Activos

% Inactivos

%  Activos

% Inactivos

(lambda de Wilks)

Modelo seleccionado

0.349

100

86

-

-

CV1

0.292

100

88

100

60

CV2

0.309

100

81

83

80

CV3

0.376

95

88

100

80

CV4

0.368

100

81

100

80

CV5

0.330

100

88

100

60

Media CV

0.335

99

85

97

72

La separaci—n del grupo activo y del inactivo, se hizo en base al valor de CI50=5mM. La funci—n discriminante seleccionada est‡ formada por los descriptores 4cpc, G2v y J5 (evaluando el primero el grado de ramificaci—n de cada compuesto y los dos restantes la distribuci—n de carga intramolecular).

FD = 21,54 + 9,26 4χpc - 2,55 G2V – 430,62 J5                                             Ecuaci—n 1

N=49; F=28,007;    l(WilksÕ lambda)=0,349

En base a esta funci—n, un compuesto ser‡ clasificado como activo ÒAÓ  si presenta un valor de FD>0, en caso contrario, ser‡ catalogado como inactivo ÒIÓ (ver Tabla 1).

La matriz de clasificaci—n obtenida para el modelo matem‡tico-topol—gico seleccionado (ver Tabla 2), es muy significativa: el 100% de los compuestos activos (28 de 28 compuestos) son clasificados correctamente, as’ como el 85,7% del grupo inactivo (18 de 21 compuestos) lo que representa un porcentaje de acierto medio del 93%.

     El modelo fue sometido a dos an‡lisis de validaci—n interna: mŽtodo de Jack-knife o leave-one-out, as’ como una cross-validation o  validaci—n cruzada. El primero tal y c—mo explicamos en p‡rrafos anteriores, consisti— en una validaci—n interna con pŽrdida de un compuesto y posterior predicci—n del mismo por el modelo. 

La validaci—n del modelo siguiendo el mŽtodo de Jack-knifed, para el grupo de entrenamiento, muestra una matriz de clasificaci—n en la que 26 de 28 compuestos activos son clasificados correctamente (93%) y 18 de 21 compuestos inactivos fueron correctamente dispuestos por el modelo (86%). Obteniendo por tanto, un porcentaje de correcta clasificaci—n global del 90 %. Por lo que la FD (Ec.1) para la bœsqueda de compuestos con actividad anti-tripanos—mica supera claramente este primer test de validaci—n interna, demostrando ser un modelo robusto.

Asimismo, se realiz— una segunda prueba de validaci—n interna al modelo (Ec.1).

Para llevar a cabo este test de validaci—n cruzada, se dividi— el grupo estudiado en cinco subgrupos (CV1-CV5): serie CV1 (1, 5, 7, 13, 20, 21, 28, 30, 36, 40, 45), serie CV2 (2, 8, 9, 15, 22, 23, 31, 34, 38, 42, 46), serie CV3 (3, 10, 14, 16, 24, 25, 32, 37, 41, 43, 47), serie CV4 (4, 11, 17, 18, 26, 29, 33, 39, 44, 48), serie CV5 (6, 12, 19, 21, 27, 30, 35, 40, 45, 49). Estas series corresponden en el estudio de validaci—n cruzada al grupo de test (es decir, no participan en la elaboraci—n del modelo), mientras que los compuestos restantes se asignan al grupo de entrenamiento.

En la Tabla 2, se muestran los valores de λ (lambda de Wilks) y la matriz de clasificaci—n para los compuestos pertenecientes tanto al grupo de entrenamiento como al grupo test.

La variabilidad de λ es peque–a para cada serie y el valor promedio de λ tras cinco ensayos de validaci—n cruzada, es muy similar al obtenido con el modelo seleccionado (0,349). Por lo que podemos afirmar que el modelo seleccionado para la bœsqueda de compuestos con actividad anti-tripanos—mica es robusto.

La Figura 1, muestra el diagrama de distribuci—n de la actividad anti-trypanos—mica obtenido a partir del an‡lisis lineal discriminante realizado. 

Las barras negras y blancas corresponden con el grupo activo e inactivo, respectivamente. Como puede verse, los compuestos activos se reagrupan preferentemente dentro del intervalo de la FD comprendido entre  -1,5 y 8. Por tanto, un compuesto activo mostrar‡ un valor de FD preferiblemente dentro de ese intervalo. TambiŽn puede observarse en el diagrama que pr‡cticamente no se aprecia solapamiento entre compuestos activos e inactivos con valores de FD>0.

Descripci—n: WEBTRABAJO:RANF:Edicion digital:Anales:2012:Vol4:Guzman:1353-5167-1-SP.png

Figura 1.- Diagrama de distribuci—n de la actividad anti-trypanos—mica obtenido tras el an‡lisis lineal discriminante realizado.

            Por œltimo, se realiz— un cribado molecular virtual encaminado a buscar nuevas estructuras qu’micas derivadas del 4-nitro-imidazol que pudiesen ser potencialmente activas frente a T. b. rhodesiense. Se dibujaron 21 molŽculas y se les aplic— el modelo discriminante seleccionado.

La Tabla 3 muestra los resultados obtenidos. Como puede observarse, 10 de las 21 molŽculas analizadas se pueden considerar potencialmente activas.

El siguiente paso a realizar ser’a sintetizarlas u obtenerlas v’a comercial y proceder a ensayarlas en el laboratorio para comprobar la actividad predicha por el modelo discriminante aplicado.

La principal ventaja del mŽtodo topol—gico seguido ser’a el ahorro en tiempo y dinero invertido en la bœsqueda de nuevos compuestos activos frente a T. b. rhodesiense.


Tabla 3.- Resultados obtenidos del cribado molecular realizado con nuevos derivados del 4-nitro-imidazol utilizando el an‡lisis lineal discriminante.

N0.

R1

R2

R3

4χpc

G2v

J5

Prob.(A)

FD

Clascalc

1

CH3

H

Ph

1.345

6.182

0.041

0.614

0.47

A

2

H

H

1.577

6.720

0.042

0.755

1.13

A

3

H

H

1.677

4.515

0.045

0.998

5.99

A

4

H

H

1.342

4.552

0.041

0.990

4.62

A

5

H

H

1.342

4.552

0.039

0.995

5.39

A

6

H

H

Ph

1.369

6.182

0.044

0.359

-0.57

I

7

H

H

1.879

7.747

0.031

0.997

5.70

A

8

H

H

1.374

4.390

0.064

0.012

-4.37

I

9

H

H

1.543

4.182

0.055

0.788

1.31

A

10

H

H

1.625

4.850

0.069

0.004

-5.51

I

11

H

H

1.543

4.701

0.055

0.497

-0.01

I

12

H

H

1.755

4.664

0.055

0.885

2.04

A

13

H

H

1.538

5.764

0.059

0.013

-4.36

I

14

CH3

H

2.085

6.169

0.067

0.020

-3.87

I

N0.

R1

R2

R3

4χpc

G2v

J5

Prob.(A)

FD

Clascalc

15

CH3

H

2.575

7.626

0.065

0.102

-2.17

I

16

H

H

1.707

4.456

0.071

0.010

-4.61

I

17

H

H

1.711

4.380

0.055

0.933

2.64

A

18

H

H

2.228

5.590

0.077

0.004

-5.45

I

19

H

H

1.370

5.368

0.055

0.035

-3.31

I

20

CH3

H

2.013

6.787

0.058

0.090

-2.31

I

21

H

H

1.074

4.181

0.040

0.978

3.78

A

Estructura base:

4. conclusioneS

Los resultados obtenidos en este trabajo, ponen de manifiesto la eficacia de la topolog’a molecular en la predicci—n de la actividad anti-tripanos—mica.

A travŽs de este mŽtodo topol—gico se pueden buscar compuestos con actividad frente a T. b. rhodesiense mediante la aplicaci—n de una funci—n discriminante (Ecuaci—n 1), capaz de diferenciar compuestos activos de inactivos. La funci—n discriminante obtenida se ha aplicado a otros compuestos estructuralmente similares, a modo de cribado virtual para la bœsqueda de nuevos compuestos potencialmente activos frente a T. b. rhodesiense.

De forma que podemos decir que la topolog’a molecular es eficaz en el descubrimiento de agentes terapŽuticos para esta enfermedad que afecta a gran parte de çfrica.

Aplicando el mŽtodo topol—gico, podemos descubrir nuevas molŽculas con te—rica actividad anti-tripanos—mica, con un coste m’nimo y optimizar las probabilidades de Žxito con nuevos tratamientos frente a T. b. rhodesiense.

5. agradecimientos

Este trabajo ha sido realizado gracias al apoyo del  Ministerio de Econom’a y Competitividad, Espa–a (proyecto SAF2009-13059-C03-02). El presente estudio se deriva de la colaboraci—n de la ÒUnidad de dise–o de f‡rmacos y conectividad molecularÓ perteneciente al departamento de Qu’mica-f’sica de Facultad de Farmacia (Universitat de Valencia) con el Master Internacional en Enfermedades Parasitarias Tropicales (curso 2011/2012).

Una de los autores, M. Galvez Llompart es beneficiaria del programa ÒAtracci— de talentÓ de formaci—n de personal investigador de car‡cter predoctoral concedido por la  Universitat de Valencia.

6. REFERENCIAS

1.     Geigera A.,  Simob G., GrŽbauta P.,  Peltierc J.B., Cunya G.,  Holzmullera P. (2011). Transcriptomics and proteomics in human African trypanosomiasis: Current status and perspectives J. Proteomics 74(9), 1625-1643.

2.     La Greca F., & Magez S. (2011). Vaccination against trypanosomiasis. Can it be done or is the trypanosome truly the ultimate immune destroyer and escape artist?  Hum Vaccin 7(11), 1225-1233.

3.     Brun R., Don R., Jacobs R.T., Wang M.Z., Barrett M.P. (2011). Development of novel drugs for human African trypanosomiasis. Future Microbiol 6(6), 677-691.

4.     Hansch C., & Fujita T. (1964) p-tau-pi analysis. A method for the correlation of biological activity and chemical structure. J Am Chem Soc 86(8), 1616-1626.

5.     van de Waterbeemd H., & Gifford E. (2003) ADMET in silico modelling: towards prediction paradise? Nat Rev Drug Discov 2(3), 192-204.

6.     Roche O., Schneider P., Zuegge J., et al. (2002) Development of a virtual screening method for identification of Òfrequent hittersÓ in compound libraries. J Med Chem 45(1), 137-142.

7.     Galvez-Llompart M., Giner M., Recio C., et al.(2010) Application of molecular topology to the search of novel NSAIDs: experimental validation of activity. Lett Drug Des Discov 7(6),438-445.

8.     de Julian-Ortiz J.V., Galvez J., Munoz-Collado C., et al.(1999) Virtual combinatorial syntheses and computational screening of new potential anti-herpes compounds. J Med Chem 42(17),3308-3314.

9.     Bruno-Blanch L., Galvez J., Garcia-Domenech R.(2003) Topological virtual screening: A way to find new anticonvulsant drugs from chemical diversity. Bioorg Med Chem Lett 13(16), 2749-2754.

10.  Rios-Santamarina I., Garcia-Domenech R., Galvez J. (1998) New bronchodilators selected by molecular topology. Bioorg Med Chem Lett 8(5),477-482.

11.  Galvez J., Garcia-Domenech R., de Julian-Ortiz J., et al. (1995) Topological approach to drug design. J Chem Inf Comput Sci 35(2), 272-284.

12.  Duart M., Garcia-Domenech R., Anton-Fos G., et al. (2001) Optimization of a mathematical topological pattern for the prediction of antihistaminic activity. J Comput Aided Mol Des 15(6), 561-572.

13.  Galvez J., Garcia-Domenech R., Gomez-Lechon M., et al. (2000) Use of molecular topology in the selection of new cytostatic drugs. J Mol Struct Theochem 504(1-3), 241-248.

14.  de Gregorio Alapont C., Garcia-Domenech R., Galvez J., et al.(2000) Molecular topology: A useful tool for the search of new antibacterials. Bioorg Med Chem Lett 10(17), 2033-2036.

15.  G‡lvez J., G‡lvez-Llompart M., Garc’a-Domenech R.(2012) Molecular topology as a novel approach for drug discovery. Expert Opin Drug Discov 7(2), 133-153.

16.  Galvez-Llompart M., Zanni R., Garcia-Domenech R. (2011) Modeling Natural Anti-Inflammatory Compounds by Molecular Topology. Int J Mol Sci 12(12), 9481–9503.

17.  Garc’a-DomŽnech R., G‡lvez J., Juli‡n-Ortiz J.V., Pogliani L. (2008) Some new trends in chemical graph theory. Chem Rev 108(3), 1127-1169.

18.  Garcia-Domenech R., Domingo-Puig C., Esteve-Martinez M.A., Schmitt J., Vera-Martinez J., Chindemi A., Galvez J. (2008) Aplicacion de la Topologia Molecular en la busqueda de nuevos agentes activos frente a Leishmania. An. R. Acad. Nac. Farm. 74, 345-367.

19.  Mahmoudi N., de Julian-Ortiz J.V., Ciceron L., et al.(2006) Identification of new antimalarial drugs by linear discriminant analysis and topological virtual screening. J Antimicrob Chemother 57(3), 489-97.

20.  Mahmoudi N., Garcia-Domenech R., Galvez J., et al.(2008) New active drugs against liver stages of plasmodium predicted by Molecular Topology. Antimicrob Agents Chemother 52(4), 1215-1220.

21.  de Gregorio Alapont C., Garcia-Domenech R., Galvez J., et al. (2000) Molecular Topology: A useful tool for the search of new antibacterials. Bioorg Med Chem Lett 10(17), 2033-2036.

22.  Mishra R.K., Garcia-Domenech R., Galvez J. (2001) Getting discriminant functions of antibacterial activity from physicochemical and topological parameters. J Chem Inf Comput Sci 41(2), 387-393.

23.  Pastor L., Garcia-Domenech R., Galvez J., et al. (1998) New antifungals selected by Molecular Topology. Bioorg Med Chem Lett 8(18), 2577-2582.

24.  Galvez J., Garc’a-Domenech R., de Julian-Ortiz J.V. (1998) Design of new antineoplastic lead drugs by molecular topology. Expert Opin Drug Discov 2(2), 265-268.

25.  Rios-Santamarina I., Garcia-Domenech R., Galvez J.(1998) New bronchodilators selected by Molecular Topology. Bioorg Med Chem Lett 8(5),477-482.

26.  Rios-Santamarina I., Garcia-Domenech R., Galvez J., et al.(2004) Getting new bronchodilator compounds from Molecular Topology. Eur J Pharm Sci 4, 271−277.

27.  Galvez J., Garcia-Domenech R., Gomez-Lechon M., et al. (2000) Use of Molecular Topology in the selection of new cytostatic drugs. J Mol Struct Theochem 504(1-3), 241-248.

28.  Pla-Franco J., G‡lvez-Llompart M., G‡lvez J., Garc’a-Domenech R. (2011) Application of Molecular Topology for the Prediction of Reaction Yields and Anti-Inflammatory Activity of Heterocyclic Amidine Derivatives. Int J Mol Sci 12, 1281-1292.

29.  Garcia-Domenech R., Montealegre M.C., Nagham E.G., Sandoval N., Santana M., Galvez J. (2010) Aplicacion de la topologia molecular para la prediccion de la actividad anti-VIH-1 de un grupo de compuestos analogos del acyclovir y ganciclovir. An. R. Acad. Nac. Farm 76(1), 45-57.

30.  G‡lvez-Llompart M., Recio M.C., Garc’a-Domenech R. (2011) Topological virtual screening: a way to find new compounds active in ulcerative colitis by inhibiting NF-κB. Mol Divers 15(4), 917-26.

31.  Casab‡n-Ros E., Ant—n-Fos G.M., G‡lvez J., et al. (1999) Search for New Antihistaminic Compounds by Molecular Connectivity. Quant Struct-Act Relat  18, 35-42.

32.  Jasinski P., Welsh B., Galvez J., et al. (2008) A novel quinoline, MT477: Suppresses cell signaling through ras molecular pathway, inhibits PKC activity, and demonstrates in vivo anti-tumor activity against human carcinoma cell lines. Invest New Drugs 26(3),223-232.

33.  Jasinski P., Zwolak P., Isaksson V.R., et al. (2011) MT103 inhibits tumor growth with minimal toxicity in murine model of lung carcinoma via induction of apoptosis. Invest New Drugs 29(5),1-7.

34.  Galvez J., Llompart J., Land D., et al. (2010) Mount Sinai School of Medicine of New York University, USA, Medisyn Technologies I, assignees. Compositions for treatment of AlzheimerÕs disease using Abeta-reducing and/or Abeta-anti-aggregation compounds. WO/2010/114636; PCT/US2010/001041.

35.  Lutje V., Seixas J., Kennedy A.(2010) Chemoterapy for second-stage Human African trypanosomiasis. Cochrane Database of Systematic Reviews. Issue 8. Art. No.: CD006201. DOI:10.1002/14651858.CD006201.

36.  Bourdin B., Jedrysiak R., Tweats D., Brun R., Kaiser M., Suwinski J., Torreele E. (2011)1-Aril-4-nitro-1H-imidazoles, a new promising series for the treatment of human African trypanosomiasis. Eur J Med Chem 46, 1524-1535.

37.  Randic, M. (1975) On characterization of molecular branching. J Am Chem Soc 97, 6609-6615.

38.  Kier L.B., Hall L.H. (1986) Molecular Connectivity in Structure-Activity Analysis. Research Studies Press, Letchworth, UK.

39.  G‡lvez J., Garc’a-DomŽnech R., Salabert M.T., Soler R. (1994) Charge Indices. New topological descriptors. J Chem Inf Comput Sci 34, 520-525.

40.  Statistica (data analysis software system), version 9.0(2009) Statsoft: Tulsa, OK.

41.  Wold S., Eriksson L., Clementi S. (2008) Statistical validation of QSAR results, in Chemometric Methods in Molecular Design (ed H. van de Waterbeemd), Wiley-VCH Verlag GmbH, Weinheim, Germany. doi: 10.1002/9783527615452.ch5.

42.  Dixon W.J. (1990) BMDP statistical software manual: to accompany the 1990 software release. Univ of California Pr; San Francisco.

43.  Roy P.P., Leonard J.T., Roy K. (2008) Exploring the impact of size of training sets for the development of predictive QSAR models. Chem Intell Lab Syst 90(1), 31-42.

44.  Galvez J., Garcia-Domenech R., de Gregorio Alapont C., et al. (1996) Pharmacological distribution diagrams: a tool for de novo drug design. J Mol Graph 14(5), 272-276.

45.  Lachenbruch P.A., Mickey M.R. (1968) Estimation of error rates in discriminant analysis. Technometrics 10(1), 1-11.