Download - TESIS DOCTORAL: DESARROLLO DE NUEVAS …

TESIS DOCTORAL:

DESARROLLO DE NUEVAS METODOLOGIAS DE ESPECTROSCOPÍA NIR EN APLICACIONES INDUSTRIALES.

ESTUDIO Y APLICACIÓN DE TÉCNICAS DE IMAGEN QUÍMICA (NIR-CI)

JORDI CRUZ SANCHEZ

Director: Marcelo Blanco Romía

PROGRAMA DE DOCTORADO DE QUÍMICA Departamento de Química

Facultad de Ciencias 2010

Memòria presentada per aspirar al Grau de Doctor per Jordi Cruz Sanchez

Jordi Cruz Sanchez

Vist i plau

Dr. Marcelo Blanco Romía

Catedràtic de Química Analítica

Bellaterra, 27 de Setembre de 2010

AGRAÏMENTS

Aquesta tesi doctoral s’ha realitzat gràcies a les següents ajudes institucionals:

Ministerio de Educación y Ciencia, Madrid.

Projectes: “LA ESPECTROSCOPIA NIR: UNA HERRAMIENTA PARA LA TECNOLOGIA

ANALITICA DE PROCESOS (PAT)” (CTQ2006-12923). y "DESARROLLO DE NUEVAS

METODOLOGIAS ESPECTRALES PARA EL CONTROL ANALITICO DE PRODUCTOS Y

PROCESOS " (CTQ2009-08312).

Grup de Quimiometria Aplicada

Unitat de Química Analítica

Departament de Química

Universitat Autònoma de Barcelona

Edifici Cn, 08193 Bellaterra

Aquesta tesi doctoral s’ha realitzat gràcies a les següents ajudes privades:

Cray Valley Ibérica,

E-08470 Sant Celoni,

Barcelona, Spain

Esteve Farma,

C/ Sant Martí, s/n.

08107 Martorelles,

Barcelona. Spain

El concepto es el concepto... a los hechos me repito...

Quan hom escriu aquestes paraules és perquè està arribant al final d'una etapa de la seva vida, una etapa de moltes hores passades al laboratori... són 12 anys en aquesta universitat i quasi 6 anys entre la meva època de col·laboració i com a becari compartint vivències en el grup d'investigació. Potser aquestes son les paraules més complicades d’escriure, sobretot després de gairebé 10 anys en aquesta universitat dels quals he conviscut 3 i mig en aquest grup d’investigació. Vull agrair sincerament al Doctor Marcelo Blanco per haver confiat en mi per a incorporar-me en el Grup de Quimiometria Aplicada, quan un bon dia a mitjans de 2005, vaig aparèixer per la planta a mans de la Doctora Hortènsia Iturriaga, a qui l'hi dec moltíssim, perquè sense ella no estaria aquí en aquest lloc en el que m’he format realment com a l’investigador i la persona que soc a dia d’avui. Dins d’aquest grup he tingut la sort de compartir feina i hores amb companys que, a més de bons investigadors, han estat bons amics durant aquest viatge: Manel A i Manel B, José, Anna Peguero, Anna Palou, Armenta, David, Chacho, Lisi, Ricardo, Juan, Ruben Cueva, Ruben Jimenez, Dámarith, Miguel, Mari, Miriam, Antonio, Quim.... Segur que em deixaré gent, quelcom inevitable després de tants i tants anys en el grup. Vull agrair també als altres professors del grup per tot el suport que m'han donat durant aquest temps. Voldria agrair als amics que m'han ajudat no específicament en la feina del doctorat però si amb el seu suport moral, Miguel, David, Johnny, Tere, Pep, "la Garcia" , Miquel, Aleix i altres companys d'entrenament, i molta altra gent, que com abans m'ha passat amb els companys de la universitat, m'hauré deixat. La meva família, ha estat una peça clau en el meu creixement tant con a persona , com a investigador m'han hagut d'aguantar tots aquests anys, Pares, Oriol, Josep Manel, Lola, Rosa, Barrachines etc... Amb les vostres experiències personals i les viscudes junts també n'he après. Gràcies pel vostre suport. Però si per a algú va dedicada aquesta tesi, és per a l'Aurora sempre omnipresent de qui tantes i tantes coses n'he après i segueixo aprenent malgrat que ja no hi sigui. Perquè ja de ben petit va ser un far posar en bell mig de la meva vida que m'ha guiat quan m'he sentit perdut. També la dedico especialment a l'avi Amadeu i a la iaia Maria, perquè per mi han estat uns avis especials i m'hauria encantat compartir aquests moments de joia personal. I per acabar Anna no tinc paraules per a tu, perquè no els agraïments serien eterns, gràcies per ser com ets i per entendre'm com ho fas! Podria seguir escrivint sense parar... perquè per sort, estic envoltat de gent que sempre m'han atansat la mà quan els ho he demanat, mil gràcies a tots de debò i de tot cor!!! I com diu aquella cançó del mestre Sisa... Qualsevol nit pot sortir el sol...

Gracies a tots

INDICE

RESUMEN...................................................................................................1

1. INTRODUCCIÓN.....................................................................................9

1.1 ESPECTROSCOPIA NIR..............................................................11

1.1.1 INTRODUCCIÓN ............................................................11

1.1.2 FUNDAMENTOS DE LA TÉCNICA..................................14

1.1.3 INSTRUMENTACIÓN.....................................................19

1.1.4 APLICACIONES DE LA ESPECTROSCOPIA NIR...........22

1.2 ESPECTROSCOPIA NIR IMAGEN................................................24

1.2.1 INTRODUCCIÓN A LA ESPECTROSCOPIA DE IMAGEN.24

1.2.2 TIPOS DE CÁMARA .......................................................26

1.2.3 APLICACIONES DE LA ESPECTROSCOPIA NIR DE

IMAGEN...................................................................................................28

2. HERRAMIENTAS PARA EL ANÁLIS DE DATOS. QUIMIOMETRÍA......31

2.1 HERRAMIENTAS QUIMIOMÉTRICAS USADAS PARA LA

EXTRACCIÓN DE INFORMACIÓN CUALITATIVA....................................36

2.1.1 ANÁLISIS EN COMPONENTES PRINCIPALES (PCA)....36

2.1.2 COEFICIENTE DE CORRELACIÓN (CC).........................37


EXTRACCIÓN DE INFORMACIÓN CUANTITATIVA..................................39

2.2.1 CALIBRACIÓN UNIVARIANTE MEDIANTE

COEFICIENTES DE CORRELACIÓN (CC).................................................40

2.2.2 CALIBRACIONES MULTIVARIANTES...........................41

2.3 OTROS ALGORITMOS...............................................................44

2.3.1 ALGORITMO DE KENNARD & STONE...........................44

2.3.2 PIECEWISE DIRECT STANDARDISATION (PDS)...........45

2.4 MODELADO Y CONTROL..........................................................47

2.4.1 SELECCIÓN DEL CONJUNTO DE CALIBRACIÓN..........47

2.4.2 MÉTODOS DE REFERENCIA .......................................48

INDICE

2.4.3 OBTENCIÓN DE LA SEÑAL ANALÍTICA........................48

2.4.4 PRETRATAMIENTOS ESPECTRALES............................48

2.4.5 CONSTRUCCIÓN DEL MODELO DE CALIBRACIÓN......50

2.4.6 EVALUACIÓN DE RESULTADOS...................................50

2.5 HERRAMIENTAS PARA EL ANÁLISIS DE IMAGEN..................52

2.5.1 CLASSICAL LEAST SQUARES (CLS)...............................53

2.5.2 MULTIVARIATE CURVE RESOLUTION– ALTERNATING

LEAST SQUARES (MCR-ALS) ...................................................................54

2.5.3 ISYS-PLS1.......................................................................59

3. OBJETIVOS...........................................................................................61

4. METODOLOGÍA Y DISCUSIÓN DE LOS RESULTADOS.........................67

4.1 PROCESOS DE FABRICACIÓN...................................................69

4.1.1 RESINA DE POLIÉSTER................................................69

4.1.2 ENANTYUM COMPRIMIDOS.........................................70

4.2 METODOLOGÍA EXPERIMENTAL.............................................71

4.2.1 RESINA DE POLIESTER.................................................71

4.1.2 ENANTYUM COMPRIMIDOS.........................................72

4.2.3 COMPRIMIDOS COMERCIALES DE ÁCIDO

ACETILSALICÍLICO..................................................................................72

4.2.4 COMPRIMIDOS EN FASE EXPERIMENTAL................. 73

4.3 METODOLOGÍA INSTRUMENTAL............................................74

4.3.1 INSTUMENTACIÓN EMPLEADA...................................75

4.3.2 ADQUISICIÓN DE LOS ESPECTROS DE

LAS MUESTRAS........................................................................................81

4.3.3 MÉTODOS DE REFERENCIA........................................85

4.4 TRATAMIENTO DE DATOS ......................................................88

4.5 CONSTRUCCIÓN DE LOS MODELOS DE CALIBRACIÓN..........90

5. RESULTADOS Y DISCUSIÓN ................................................................93

5.1 ESTUDIOS CON ESPECTROSCOPIA NIR CONVENCIONAL.......95

5.1.1 DETERMINACIÓN DE PARÁMETROS DE CONTROL DE

UN PROCESO DE FABRICACIÓN DE RESINAS POLIÉSTER.....................95

INDICE

5.1.2 DETERMINACIÓN DE API DE UN FÁRMACO MEDIANTE

CALIBRACIÓN UNIVARIANTE................................................................107

5.2 ESTUDIO MEDIANTE NIR-CI DE MUESTRAS

FARMACÉUTICAS..........................................................................113

5.2.1 APLICACIÓN DEL ALGORITMO MCR-ALS AL ANÁLISIS

DE IMÁGENES DE COMPRIMIDOS COMERCIALES DE ÁCIDO

ACETILSALICÍLICO (ASA).............................................................114

5.2.2 ESTUDIO DE UNIFORMIDAD DE CONTENIDO EN

COMPRIMIDOS COMERCIALES DE ÁCIDO ACETILSALICÍLICO

(ASA) ............................................................................................124

5.2.3 ESTUDIO CUANTITATIVO Y DE LA DISTRIBUCIÓN DE

API, EXCIPIENTES Y GROSOR DE RECUBRIMIENTO DE

COMPRIMIDOS.......................................................................................131

6. CONCLUSIONES..................................................................................143

7. ARTÍCULOS ACEPTADOS PARA LA TESIS DOCTORAL.......................153

7.1 CONTROL PRODUCTION OF POLYESTER RESINS BY NIR

SPECTROSCOPY......................................................................................157

7.2 DEVELOPMENT OF A UNIVARIATE CALIBRATION MODEL FOR

PHARMACEUTICAL ANALYSIS BASED ON NIR SPECTRA.....................165

7.3 NIR-CHEMICAL IMAGING STUDY OF ACETYLSALICYLIC ACID

IN COMMERCIAL TABLETS....................................................................173

8. ANEXO................................................................................................181

8.1 UNIFORMITY STUDIES OF COMMERCIAL ASPIRIN TABLATS

BY NIR-CI................................................................................................185

8.2 DISTRIBUTION STUDY OF COMPONENTS AND FILM COATING

IN PHARMACEUTICAL TABLATS BY NIR-CI..........................................203

8.3 NIR-CI STUDY OF ASPIRIN COMMERCIAL TABLETS.............223

RESUMEN

1

RESUMEN

Conseguir una elevada calidad en los productos es un reto cada día más importante en

la industria moderna y estos productos no solo deben satisfacer al usuario sino también

cumplir normativas para que puedan llegar al mercado.

La Espectroscopia NIR es una técnica de reciente implantación que presenta

numerosas ventajas respecto a otras técnicas: es no invasiva, no destructiva de la

muestra, es un sistema rápido de medida y de obtención de resultados, de bajo coste,

medioambientalmente compatible, etc. que han impulsado su aplicación en diferentes

campos de la actividad industrial.

En la Memoria se realiza un estudio de la aplicación de la Espectroscopia NIR a la

determinación de parámetros de interés en la fabricación de resinas de poliéster y en el

campo farmacéutico se propone un nuevo método de calibración para determinar API

en muestras procedentes de las distintas etapas del proceso productivo; el objetivo

último es proponer nuevas metodologías más rápidas y eficaces que sean alternativas

de los métodos convencionales y que permitan realizar un control rápido para mejorar

la calidad de los productos.

Se han realizado estudios de imagen química NIR (NIR-CI), una técnica de creciente

interés en el análisis de productos farmacéuticos y que permite ampliar y mejorar el

conocimiento de las muestras para asegurar el cumplimiento de las exigentes

necesidades de calidad en el análisis farmacéutico y que constituye un complemento

versátil a la espectroscopia NIR convencional.

El análisis directo de la muestra mediante el uso de técnicas de imagen, proporcionan un

espectro NIR en cada píxel de la imagen, y mediante un tratamiento quimiométrico

adecuado de la gran cantidad de información que esto representa se puede obtener

información imposible de conseguir en la espectroscopia NIR convencional tales como

RESUMEN

2

la determinación de API y/o excipientes de uno o varios comprimidos farmacéuticos

con una sola imagen química de forma rápida y sin alterar la muestra.

En uno de los estudios de esta memoria se ha realizado un trabajo de imagen química

en el que se propone un método cuantitativo para analizar comprimidos de ácido

acetilsalicílico de diferentes marcas comerciales (de las que únicamente se posee la

información sobre su composición obtenida en el vademecum), mediante el uso del

algoritmo Multivariate Curve Resolution - Alternative Least Squares (MCR-ALS). Este

algoritmo no exige definir un modelo de calibración, no necesita valores de referencia y

solamente precisa los espectros de los componentes puros. Se ha demostrado la bondad

del método a través de la correcta cuantificación del API y a la vez se ha estudiado su

distribución en el comprimido mediante los histogramas de los mapas de concentración.

Se han estudiado 10 marcas comerciales distintas y en todos los casos se han obtenido

resultados conformes con las especificaciones del fármaco.

Se ha ampliado el estudio anterior con el desarrollo de la metodología apropiada para

establecer la homogeneidad de distribución del API y del excipiente mayoritario así

como la determinación de uniformidad de contenido (definido por la European

Pharmacopoeia) que se establece a partir del acceptance value (AV) mediante

cuantificación del valor individual de cada comprimido de una única imagen

hiperespectral de 10 comprimidos. Esta determinación supone un ahorro de tiempo

considerable frente a los métodos convencionales ya que es una determinación esencial

para la liberación de un lote de producción.

Se ha realizado también una estudio comparativo de dos software MCR-ALS e Isys-PLS1

(un algoritmo que el software comercial de Malvern Isys 5.0 llama PLS1) para la

determinación del contenido de API y excipientes a partir de las imágenes

hiperespectrales, con el objeto de seleccionar el más adecuado para su aplicación a

RESUMEN

3

posteriores estudios. Los resultados obtenidos indican que ambos son igualmente

válidos con esta finalidad ya que los resultados no difieren significativamente.

La experiencia con los comprimidos comerciales de ácido acetilsalicílico, ha sido

aplicada, en un nuevo estudio, a un fármaco en proceso de desarrollo. Se han analizado

cuantitativamente la concentración y la distribución del API y excipientes de

comprimidos farmacéuticos en diferentes comprimidos que presentan distinto grosor

de recubrimiento. La información que se ha extraído de las imágenes hiperespectrales

se han tratado por un lado con Isys-PLS1, permitiendo determinar la concentración de

todos los constituyentes del fármaco y establecer la uniformidad de distribución de los

mismos. Por otro lado se ha creado un modelo PLS1 con espectros promedio de

imágenes hiperespectrales de comprimidos de diferente grosor de recubrimiento.

Aplicando este modelo PLS1 a comprimidos de producción se determina el grosor de

recubrimiento así como su distribución en los comprimidos. Los estudios realizados,

principalmente los de imagen hiperespectral, nos han permitido cumplir los objetivos

propuestos y establecer de forma clara y contundente la adecuación del NIR en la

realización de medidas aptas para la mejora de la calidad de productos tanto de la

industria química como farmacéutica.

RESUMEN

4

ABSTRACT

5

ABSTRACT

The obtaining of the highest quality products is a challenge in the modern industry with

increasingly importance. These products should satisfy the user, but also accomply the

strict regulations before the marketing.

NIR spectroscopy is a technique recently introduced that has several advantages over

other techniques: non invasive, non destructive, fast, low cost and environmental-

friendly. These advantages have increased its application in different industrial fields.

In this thesis, the application of NIR spectroscopy for the determination of parameters

of interest in the manufacture of polyester resins has been performed and, additionally, a

new calibration method for the determination of API in samples from different

production stages have been proposed for the pharmaceutical field. The main goal has

been provide new methodologies that can be summarized as rapid and effective

alternatives to conventional methods that allow a quality control of the manufactured

products.

NIR chemical imaging (NIR-CI) is a technique of increasing interest in the analysis of

pharmaceutical products and represents a versatile complement to conventional NIR

spectroscopy. Different studies have been done to increase and improve the knowledge

of the samples assessing the compliance of the quality demands in pharmaceutical

analysis. Direct analysis of the sample by using imaging techniques provides a NIR

spectrum for each pixel of the image, and by appropriate chemometric treatment of the

large amount of information, different results can be achieved, such as the determination

of API and excipients of single or multiple tablets only by the obtaining of a single

image.

Moreover, a methodology based on NIR-CI and Multivariate Curve Resolution -

Alternating Least Squares (MCR-ALS) algorithm is proposed for the quantitative

ABSTRACT

6

analysis of acetylsalicylic acid tablets of different commercial brands. The composition

information was obtained from the Vademecum. This algorithm does not require

defining a calibration model and it does not need reference values. It only needs the

spectra of the pure components of the formulation. The capability of the methodology

has been demonstrated through the accurate quantification of API and also providing

information about the spatial distribution in the tablet surface, using the concentration

histograms. 10 different commercial brands have been studied and, in all the cases, the

obtained results are in accordance with the specifications of the drug.

An extension of the previous study has been done. The appropriate methodology has

been developed in order to establish the API and major excipient distribution

homogeneity. The determination of content uniformity (defined by the European

Pharmacopoeia) is established from Acceptance Value (AV) by quantifying the

individual value of each tablet of a single hyperspectral image of 10 tablets. This

determination is essential to release a production batch to the market and represents a

significant time saving compared to conventional methods.

It has been performed a comparative study of the two used software Isys-PLS1 (an

algorithm that commercial software called PLS1 Malvern Isys 5.0) and MCR-ALS for

the determination of API and excipients in hyperspectral images, in order to select the

most suitable for its application to future studies. The results indicate that both are

equally valid for this purpose because the results do not differ significantly.

The obtained results from the studies of commercial tablets of aspirin have been applied

to a formulation during the development stage. The concentration and distribution of

API and excipients in tablets with different coating thickness have been quantitatively

determined. Initially, the information extracted from hyperspectral images has been

analyzed with Isys-PLS1, that allowed to determine the concentration and the

ABSTRACT

7

uniformity of distribution of all constituents of the drug. Moreover, PLS1 model was

created with the mean spectra of different coating thickness tablet images. Applying this

PLS1 model to production tablets the coating thickness and its distribution in the tablets

can be determined.

The applications based on hyperspectral imaging have allowed us to achieve the initial

objectives and to establish effective strategies for improving the quality of products of

both the chemical and pharmaceutical industry using NIR spectroscopy.

ABSTRACT

8

INTRODUCCIÓN

9

1. INTRODUCCIÓN

INTRODUCCIÓN

10

INTRODUCCIÓN

11

1. INTRODUCCIÓN

1.1 ESPECTROSCOPIA NIR

1.1.1 INTRODUCCIÓN

La región del infrarrojo está comprendida entre las longitudes de onda de 700 a 106 nm.

Tanto por razones instrumentales como por les características de la interacción de la

radiación con la materia, la región del infrarrojo se divide en tres zonas (tabla 1.1):

infrarrojo cercano (NIR, Near Infrared), infrarrojo medio (MIR, Middle Infrared) e

infrarrojo lejano (FIR, Far Infrared).

Tabla 1.1. División de la región del infrarrojo.

A pesar del temprano descubrimiento de la radiación en la región del infrarrojo cercano

(NIR, Near-Infrared) por William Herschel en 1800 [1], el desarrollo de esta

espectroscopia para la resolución de problemas en el ámbito de la química analítica ha

sido lento. Tuvo que pasar casi un siglo hasta que Abney y Festing registraran

[1] W.Herschel. Investigation of the powers of prismatic colours to heat and illuminate objects; with remarks that prove the different refrangibility of radiant heat. Phil. Trans. Roy. Soc. London 2 (1800) 255-283.

Región Longitud de onda

(nm) Origen de la absorción

NIR 700-2500 Sobretonos y bandas de combinación de las

vibraciones moleculares fundamentales.

MIR 2500-50000 Vibraciones moleculares fundamentales.

FIR 50000-106 Rotaciones moleculares.

INTRODUCCIÓN

12

fotográficamente el espectro de líquidos orgánicos en la región espectral entre 700 y 1200

nm [2]. Posteriormente, durante la primera mitad del siglo XX, el interés de los

espectroscopistas por la región infrarroja se centraba en la región del infrarrojo medio,

prestando poca atención a la zona vecina al visible, convencidos del poco interés de esta

región para fines analíticos.

En la década de los 50, con la aparición de los primeros espectrofotómetros

comerciales equipados con detectores fotoeléctricos capaces de registrar espectros en la

zona del infrarrojo cercano, se desarrollaron las primeras aplicaciones en las que

intervenía esta espectroscopia.

Una etapa muy importante para la técnica fue la década de los 50; un grupo del

Ministerio de Agricultura de los EEUU, USDA (United States Department of Agriculture),

liderado por Karl Norris empezó a utilizar esta metodología para el estudio de muestras en

el ámbito de la agroalimentación [3-4]. A partir de ese momento, el interés por la

espectroscopia NIR experimentó un cambio substancial. Hasta finales de los años 70 los

instrumentos comerciales fueron principalmente instrumentos de filtros diseñados para

aplicaciones específicas. Después de esta etapa inicial y con la llegada de la era digital, los

avances en el diseño y desarrollo de nueva instrumentación, con una electrónica más

estable y con ópticas mejoradas, permitieron registrar espectros de manera rápida y

altamente reproducible (instrumentos de barrido, interferómetros, etc.) [5-6]. Igualmente,

el desarrollo de equipos informáticos cada vez más potentes y a precios razonables fue una

pieza clave para el progreso e implantación de la técnica.

[2] W. Abney , E.R. Festing. On the Influence of the Atomic Grouping in the Molecules of Organic Bodies on Their Absorption in the Infra-Red Region of the Spectrum. Phyl., Trans. Roy. Soc. 172 (1881) 887.

[3] K.H. Norris, J.R. Hart. Direct spectrophotometric determination of moisture content of grain and seeds.Proceedings of the 1963 Intl. Symp. on Humidity and Moisture, Washington D.C. 4 (1965) 19-25.

[4] K.H. Norris, J.R. Hart, C. Golumbie. Determination of the moisture content of seeds by near-infrared spectrophotometry of their methanol extracts. Cereal Chemistry 39 (1962) 94-99.

[5] D. Noble. Analyzing on the INTERNET: Finding analytical chemistry on the Internet is still a challenge, but new resources and search tools are coming on line. Anal. Chem 67 (1995) 255A-259A.

[6] C.M. Henry. Near-IR gets the job done. Anal. Chem. 71 (1999) 625A-628A.

INTRODUCCIÓN

13

Gracias a estos avances tecnológicos los espectroscopistas empezaron a mostrar

interés por la técnica. En 1983 Wetzel la definía como “Sleeper among Spectroscopic

Techniques” [7], indicando que la técnica tenía un gran potencial aunque hasta aquel

momento no había sido utilizada como técnica de análisis habitual.

Los motivos que hacen esta técnica atractiva son diversos:

Permite registrar el espectro de muestras sólidas, líquidas o gaseosas.

El tratamiento previo de la muestra es prácticamente nulo.

El registro de los espectros es rápido.

Es una técnica no destructiva.

Se pueden realizar el análisis de múltiples parámetros a partir de un mismo

espectro.

Una vez establecida la calibración, el análisis de rutina es rápido.

Los análisis pueden ser realizados en la misma línea de producción.

Es una técnica barata.

Poco a poco la técnica NIR se ha ido introduciendo como técnica de análisis en

diferentes áreas, encontrándose actualmente numerosas aplicaciones en el sector de la

petroquímica [8], en el análisis de alimentos [9], de productos farmacéuticos [10], de

fibras textiles [11] y muchas otras aplicaciones en ámbitos muy diversos [12]. Finalmente

la espectroscopia NIR ha sido aceptada como un método analítico, implementándose, en

algunos casos, bajo normativas de garantía de calidad [13].

[7] D.L. Wetzel. Near Infrared Analysis. Anal. Chem. 55 (1983) 1165A-1176A.

[8] S. Macho, M.S. Larrechi. Near-infrared spectroscopy and multivariate calibration for the quantitative determination of certain properties in the petrochemical industry. Trends Anal Chem 21 (2002) 799–806.

[9] M.E. Lafargue, M.H. Feinberg, J.J. Daudin, D.N. Rutledge. Homogeneity check of agricultural and food industries samples using near infrared spectroscopy. Anal Bioanal Chem. 375 (2003) 496–504.

[10] M. Blanco, M. Bautista, M. Alcala. Preparing calibration sets for use in pharmaceutical analysis by NIR-spectroscopy J Pharm Sci. 97 (2008) 1236–1245.

[11] E. Cleve, E. Bach, E. Schollmeyer. Using chemometric methods and NIR spectrophotometry in the textile industry. Analytica Chimica Acta. 420 (2000) 163–167.

[12] P.Geladi, T Lillhonga, J.Burger. The Proceeding of NIR-2007. Ed. NIR publications 2008.

[13] Jensen J.L. Acceptance of NIR as an analytical method. Process Control and Qual. 9 (1997) 161-166.

INTRODUCCIÓN

14

Como el estado de desarrollo en el que se encuentra la tecnología NIR se ha producido

fundamentalmente en los últimos 25 años podría esperarse que, hoy por hoy, fuese una

técnica madura próxima a alcanzar una fase de estancamiento. Sin embargo, éste no es el

caso.

Dadas las ventajas de la espectroscopia NIR frente a otras técnicas instrumentales, puede

considerarse como una técnica de relevancia dentro de la Tecnología Analítica de

procesos.

El desarrollo de nuevas herramientas quimiométricas para el tratamiento de datos, la

miniaturización de los componentes instrumentales que facilitan la portabilidad de los

equipos para trabajar in-situ y la reciente combinación de la Espectroscopia NIR con

técnicas de imagen, hacen que esta técnica esté en plena fase de auge y

expansión [12, 13,14,15].

1.1.2 FUNDAMENTOS DE LA TÉCNICA

Origen de la absorción

El origen de la absorción de las bandas en el Infrarrojo cercano es el mismo que para las

bandas del IR medio: una molécula absorbe radiación electromagnética en esta región si la

energía de la radiación corresponde a la diferencia energética entre 2 niveles

vibracionales, además de producirse un cambio en el momento bipolar de la molécula.

Cuando se dan estas dos circunstancias, ocurre una transferencia neta de energía que da

lugar a un cambio en la amplitud de la vibración molecular y como consecuencia absorbe

la radiación [16] El fenómeno espectroscópico que provoca la absorción de energía por

[14] T. Davies. The history of near infrared spectroscopic analysis: past, present and future from sleeping technique to the morning star of spectroscopy. Analusis. 26 (1998) 17-19.

[15 ] E.N. Lewis, J.E.Carroll, and F.C. Clarke. A near infrared view of pharmaceutical formulation analisys.NIR News. 12 (2001) 16-18.

[16] D.A. Skoog, F.J. Holler, T.A. Nieman. Principios de análisis instrumental,. 5ª ed. (2001) McGraw- Hill.

INTRODUCCIÓN

15

parte de la materia es debido: a las rotaciones moleculares en el IR lejano, a bandas

fundamentales de vibración en el IR medio, y finalmente a bandas de combinación de las

bandas fundamentales y a sobretonos en el IR cercano. [17, 18]

Cuando se trata de especies homonucleares como O2, N2 o Cl2, el momento bipolar no se

altera durante la vibración o la rotación y, en consecuencia, este tipo de compuestos no

absorben radiación en el infrarrojo.

Los movimientos vibratorios que presenta una molécula pueden ser básicamente de dos

tipos:

Estiramiento. Se produce un cambio en la distancia interatómica a lo largo del eje

del enlace de dos átomos durante la vibración.

Flexión. Además de la modificación en la distancia interatómica se produce un

cambio en el ángulo de enlace.

A diferencia del Infrarrojo medio, en la región del NIR no aparecen las bandas de

vibración fundamentales ( =±1 ). Las bandas debidas a los sobretonos corresponden a

transiciones energéticas en las cuales >1 , aunque siendo los sobretonos con

=±1 ,2, 3 y 4, los únicos con probabilidad de ser observados en esta región. Los

sobretonos aparecen a frecuencias ligeramente menores que las teóricas como múltiplos

de las frecuencias fundamentales, debido al diferente espaciado entre los niveles

energéticos.

Las bandas de combinación se producen exclusivamente en moléculas poliatómicas y son

debidas a cambios simultáneos en la energía de dos o más modos de vibración. La

[17] J.J. Workman. Review of process and non-invasive near infrared and infrared spectroscopy: 1993-1999. Appl. Spectrosc. Reviews. 34 (1999) 1-89.

[18] R.F. Goddu, D.A. Delker. Spectra-Structure Correlations for Near-Infrared Region. Anal. Chem. 32 (1960) 140-141.

INTRODUCCIÓN

16

interacción entre ambos modos da lugar a las bandas de combinación, cuya frecuencia es

combinación lineal de las frecuencias fundamentales que interaccionan:

1 1 2 2 3 3n n n .....comb (1)

donde n1, n2,… son números enteros.

Las transiciones no fundamentales son menos probables que las transiciones entre niveles

consecutivos. Por esta razón las bandas NIR son de menor intensidad que las que

aparecen en la región del Infrarrojo medio. Además, son bandas más anchas y no están

bien definidas debido al solapamiento de los sobretonos y bandas de combinación. [19].

Las bandas más frecuentes en la región del NIR son debidas a enlaces que contienen

átomos con elevadas diferencias en el peso atómico (por ejemplo C-H, O-H, N-H,..), lo

cual provoca un aumento en la anarmonicidad del enlace.

En la figura 1.1 se muestran las regiones NIR donde absorben los diferentes enlaces. Las

bandas de los grupos C=O, C-C, C-F, C-Cl, en general son muy débiles o no aparecen en la

región NIR. Las vibraciones fundamentales de estos grupos tienen bajas frecuencias en la

región IR y por tanto, los primeros sobretonos también aparecen en esta región.

Una característica de la zona del infrarrojo cercano es que las interacciones entre

moléculas, como puentes de hidrógeno, afectan al espectro NIR, por lo que un espectro

NIR también incorpora información sobre la estructura cristalina de la sustancia.

[19] E.W. Ciurczak. Principles of Near-Infrared Spectroscopy. Handbook of Near-Infrared Analysis In D.A. Burns and E.W. Ciurczak (eds)., 2nd Edn (2001) Marcel Dekker, Inc. pp 9-18.

INTRODUCCIÓN

17

Figura 1.1. Representación gráfica de las zonas del espectro NIR donde se manifiestan los

principales grupos funcionales.

Tipos de medida en la región NIR

La espectroscopia NIR es una técnica que destaca por la versatilidad y adaptabilidad que

presenta para analizar muestras de distinta naturaleza. Para las muestras en forma sólida,

la medida efectuada es por reflectancia difusa. En cambio, muestras líquidas suelen

medirse por transmisión de radiación. Un caso intermedio es el de muestras que se miden

por transflectancia, en el que parte de la luz incidente es reflejada en la muestra y otra

parte la atraviesa, para ser reflejada por un dispositivo transflectante, diseñado de tal

forma, que también delimita el camino óptico. En la figura 1.2 se muestran los tres modos

de interacción de la radiación NIR con la materia.

INTRODUCCIÓN

18

Figura 1.2. Diferentes modos de interacción de la materia con la radiación NIR. Imagen extraída

de la Tesis Doctoral de Antonio Peinado (2005)

Medidas por reflectancia

La espectroscopia de reflectancia estudia la radiación reflejada por una muestra que ha

estado irradiada. Consta de dos componentes: La difusa y la especular. La componente

especular descrita por las leyes de Fresnel, aporta poca o nula información acerca de la

composición de la muestra. El detector se coloca en un ángulo determinado frente a la

muestra de manera que se minimizan las radiaciones especulares.

La componente difusa se genera en todas las direcciones y predomina cuando la superficie

irradiada es débilmente absorbente a la longitud de onda incidente y la penetración de la

radiación es mayor en relación a la longitud de onda. La señal analítica medida se expresa

como absorbancia aparente:

c a R

1 log Aap (2)

siendo R la reflectancia relativa ( R = Rmuestra / Restandard ), a una constante de

proporcionalidad y c la concentración.

INTRODUCCIÓN

19

Medida por transmisión

La absorción de la radiación NIR sigue la ley de Lambert-Beer por lo que las medidas por

transmisión pueden ser utilizadas con finalidad cuantitativa. La absorbancia puede ser

definida:

c b I

I log

T

1 log A 0 (3)

siendo T la transmisión, I0 la intensidad de radiación incidente, I la intensidad de la

radiación transmitida, la absortividad molar, b el camino óptico y c la concentración.

No obstante, de manera análoga a las regiones del visible y el MIR, se pueden producir

desviaciones del comportamiento de la ley, debido a cambio en los enlaces por puentes de

hidrógeno, formación de complejos, u otros procesos químicos.

Medida por transflectancia

La muestra, generalmente líquida o semi-líquida, se coloca en una cubeta junto con una

superficie reflectante por una de las caras. El haz de radiación incidente entra por la cara

transparente de la cubeta, atraviesa la muestra y se refleja en la otra cara de la cubeta. Así

retorna de nuevo atravesando la muestra y la radicación es captada por el detector.

Por la naturaleza de las muestras que se han registrado en el trabajo de esta tesis (sólidos

opacos), las medidas realizadas tanto en NIR clásico como en NIR de imagen han sido

realizadas por reflectancia.

1.1.3 INSTRUMENTACIÓN

Debido a la baja intensidad de las bandas NIR, el nivel de exigencia de los

espectrofotómetros NIR, en términos de nivel de ruido permisible y estabilidad

INTRODUCCIÓN

20

instrumental, debe ser mayor que en otros instrumentos, sobre todo si se pretende aplicar

al análisis cuantitativo. Ésta es una de las causas de la tardía aparición de los primeros

espectrofotómetros NIR, qué empezaron a comercializarse sólo cuando los avances

tecnológicos permitieron obtener niveles adecuados de sensibilidad, reproducibilidad y

ruido.

El esquema básico de un instrumento NIR no difiere de cualquier espectrofotómetro. Sus

componentes básicos son: fuente de radiación, sistema de selección de longitud de onda,

compartimento de muestra y detector.

Fuente de radiación

La fuente de radiación más utilizada es la lámpara halógena de filamento de tungsteno con

ventana de cuarzo, capaz de proporcionar un espectro continuo en la región de 320-

2500nm. Otras fuentes de radiación que pueden utilizarse son los denominados LEDs

(Light Emiting Diodes) [20-21], que dependiendo de su composición pueden llegar a

emitir hasta los 1600 nm. Los instrumentos que incorporan este último sistema de fuente

de radiación no requieren un sistema de selección de longitudes de onda.

Sistemas de selección de longitudes de onda

A excepción de los instrumentos basados en LED's como fuente de radiación, es necesario

un sistema que descomponga el haz de luz policromática en longitudes de onda discretas,

proporcionando un ancho de banda estrecho y una elevada intensidaden todo el intervalo

de longitudes de onda. Los dispositivos de selección de longitudes de onda se pueden

clasificar en dos tipos: dispersivos y no dispersivos.

Los sistemas dispersivos se basan principalmente en la aplicación de monocromadores.

Los monocromadores son dispositivos que descomponen la luz policromática que

[20] A.S. Bonanno, P.R. Griffiths. Discrimination of organic solvents using an infrared-emitting diode-based analyzer. Part I: Feasibility. Appl. Spetrosc. 49 (1995) 1590-1597.

[21] United States Patent. Patent Number 4.286.327 (1981)

INTRODUCCIÓN

21

proviene de la fuente de radiación en longitudes de onda discretas. La radiación entra en

forma de haz estrecho y un elemento dispersante, que puede ser un prisma o una red de

difracción, la separan en las distintas longitudes de onda. Los más utilizados actualmente

son los que incorporan una red de difracción, ya que son más baratos, proporcionan mejor

separación de longitudes de onda y dispersan linealmente la radiación [22].

El conjunto de sistemas no dispersivos es más amplio debido a su mayor utilización

actualmente. Dispone de equipos con filtros adicionales, con filtros optoacústicos (AOTF)

e instrumentos de transformada de Fourier (FT), ambos con características bastante

diferentes entre sí. La selección de longitudes de onda mediante filtros se realiza

interponiendo materiales específicos entre la muestra y la fuente de radiación,

permitiendo el paso de longitudes de onda selectivas.

Compartimiento de la muestra

El compartimiento de muestra es la parte del espectrofotómetro que más variaciones

presenta en función de la aplicación. La espectroscopia NIR tiene una gran versatilidad y

adaptabilidad para el análisis de muestras de diversa naturaleza, ya sean sólidas, líquidas

o gaseosas, debido a la existencia de múltiples módulos de medida adaptados a cada tipo

de muestra. Los 3 tipos de medida ya se mostraron en la figura 1.2 donde ya se puede

observar las diferentes disposiciones en función del tipo de muestra.

Detector

Los detectores empleados en espectroscopia NIR son construidos con materiales

semiconductores como InGaAs, InAs, InSb, PbS o Si. El material más utilizado en la

región 1100 – 2500 nm es el PbS, mientras que en la región más próxima al visible

(780 – 1100 nm) se emplea generalmente el silicio. Los detectores de InGaAs son buenas

[22 ] D.A. Skoog. Principles of Instrumental Analysis. Ed. Brooks Cole (1997).

INTRODUCCIÓN

22

alternativas a los detectores de PbS ya que ofrecen mayor respuesta, pero con el

inconveniente de que la temperatura de trabajo óptima es de -40ºC [23].

1.1.4 APLICACIONES DE LA ESPECTROSCOPIA NIR

El campo agroalimentario centra una gran cantidad de las aplicaciones de la

espectroscopia NIR y abarcando desde la determinación de parámetros (proteína,

humedad, azúcar, almidón etc... ) de distintos cereales [24], la identificación de

transgénicos [25], control de calidad de carne [26] a la monitorización del control de

calidad de bebidas [27] entre otras.

Pero la espectroscopia NIR ha sido aplicada a ámbitos tan diferentes del agroalimentario y

dispares el de la industria química [28] y petroquímica [29], aplicaciones médicas [30], e

incluso biotecnológicas [31] entre otras.

Un ámbito en el que la espectroscopía NIR ha tomado gran importancia es el

farmacéutico. Prueba de ello es el elevado número de aplicaciones desarrolladas tanto

[23] E. Stark and K. Luchter. Diversity in NIR instrumentation. Proceedings of the 11th International Conference on Near Infrared spectroscopy. NIR Publications (2004) 13.

[24] Z. Schmilovitch, A. Hoffman, H. Egozi, R. Ben-Zvi, Z. Bernstein, V. Alchanatis. Maturity determination of fresh dates by near Infrared Spectrometry. J Sci Food Agric. 79 (1999) 86–90.

[25] A. Alishahi, H. Farahmand,N. Prieto,D. Cozzolino. Identification of transgenic foods using NIR spectroscopy. Spectrochimica Acta, Part A: Molecular and Biomolecular Spectroscopy. 75A (2010) 1-7.

[26] N. Prieto,R. Roehe,P. Lavin,G. BattenS. Andres. Application of near infrared reflectance spectroscopy to predict meat and meat products quality. Meat Science. 83 (2009) 175-186.

[27] Y. Huang, Haibo, X. Haiyan, Y.Y. Huirong. Near infrared spectroscopy for on/in-line monitoring of quality in foods and beverages. Journal of Food Engineering. 87 (2008) 303-313.

[28] A.M Brearley. Applications of near-infrared spectroscopy (NIR) in the chemical industry. Ed. K. Bakeev.Process Analytical Technology (2005) 392-423.

[29] B. Buchanan,. Recent advances in the use of near-IR spectroscopy in the petrochemical industry. Practical Spectroscopy Handbook of Near-Infrared Analysis. 3rd Edition. 35 (2008) 521-527.

[30] Y. Ozaki,H. ShinzawaK. Maruo,Y.P. Du.S. Kasemsumran. In vivo nondestructive measurement of blood glucose by near-infrared diffuse-reflectance spectroscopy. Ed Tuchin, Valery Viktorovich. Handbook of Optical Sensing of Glucose in Biological Fluids and Tissues (2009) 205-236.

[31] A.E. Cervera, N. Petersen,A.E. Lantz,A. Larsen,K.V. Gernaey. Application of near-infrared spectroscopy for monitoring and control of cell culture and fermentation. Biotechnology Progress. 25 (2009) 1561-1581.

INTRODUCCIÓN

23

para el control de producto final como para controlar el producto en las distintas etapas

del proceso.

En la bibliografía se encuentran aplicaciones relacionadas con los parámetros químicos de

la muestra analizada como, cuantificación de como el active principal ingredient (API) de

un preparado farmacéutico [32], determinación de API en comprimidos [33],

determinación de humedad [34], análisis de la uniformidad de contenido [35], análisis de

la homogeneidad de mezclas farmacéuticas [36], identificación del API y excipientes [37],

etc…

También hay aplicaciones de espectroscopía relacionadas con los parámetros físicos de la

muestra analizada como densidad del producto [38], tamaño de partícula de un

granulado [38], transformación polimórfica [39], dureza del comprimido [40], test de

disolución de un comprimido [41], etc…

[32] M. Blanco, M. Alcalà.. Simultaneous quantitation of five active principles in a pharmaceutical preparation: Development and validation of a near infrared spectroscopic method. Eur J Pharm Sci. 27 (2006) 280–286.

[33] J. Colón, C. Peroza, W. Caraballo, C. Conde, T. Li, K.R. Morris, R.J. Romañach.. On line non-destructive determination of drug content in moving tablets using near infrared spectroscopy. Proc Anal Tech. 2 (2005) 8–15.

[34] A. Gupta,G.E. Peck,R.W. Miller,K. Morris. Journal of Pharmaceutical Sciences. 94 (2005)1589-1597.

[35] J.L. Ramirez,M.K. Bellamy,R.J. Romanach. A novel method for analyzing thick tablets by near infrared spectroscopy. AAPS PharmSciTech. 2 (2001).

[36] I. Storme-Paris,I. Clarot,S. Esposito,J.C. Chaumeil,A. Nicolas,F. Brion, A. Rieutord,P. Chaminade. European Journal of Pharmaceutics and Biopharmaceutics. 72(2009) 189-198.

[37] M. Blanco, M.A. Romero. Near-infrared libraries in the pharmaceutical industry: a solution for identity confirmation. Analyst. 126 (2001) 2212-2217.

[38] M.Alcala,M. Blanco,M. Bautista,J.M. Gonzalez. On-line monitoring of a granulation process by NIR spectroscopy. Journal of Pharmaceutical Sciences. 99 (2009) 336-345.

[39] H.G. Britain Polymorphishm in Pharmaceutical Solids. Ed by H.G. Britain. Marcel Dekker Inc. (1999).

[40] M. Otsuka,I. Yamane. Prediction of tablet properties based on near infrared spectra of raw mixed powders by chemometrics: Scale-up factor of blending and tableting processes. Journal of Pharmaceutical Sciences. 98 (2009) 4296-4305.

[41] M. Blanco,M. Alcala,J.M. Gonzalez,E. Torras,. Determination of dissolution profiles in intact pharmaceutical tablets by NIR spectroscopy. PAT--The Journal of Process Analytical Technology. 3 (2006) 25-29.

INTRODUCCIÓN

24

1.2 ESPECTROSCOPIA NIR IMAGEN

1.2.1 INTRODUCCIÓN A LA ESPECTROSCOPIA DE IMAGEN

Una imagen puede ser definida como la representación gráfica de un objeto real. En

función del número y tipo de canales utilizados para obtener una imagen pueden

obtenerse imágenes en escala de grises, imágenes RGB, imágenes hiperespectrales, etc.

como se muestra en la figura 1.3 . Una imagen química puede ser definida como la

representación de una imagen de la que se obtiene información química, como es el caso

de la técnica de NIR imagen (NIR-CI).

La fracción más pequeña de la imagen que contiene información se denomina píxel, y su

tamaño depende de la resolución de la cámara y de la forma de registro de las imágenes.

La espectroscopia NIR-CI, combina la espectroscopia convencional con el tratamiento

digital de la imagen. La información espectral y espacial se registran simultáneamente

proporcionando un espectro NIR por cada píxel de la imagen de la muestra. El resultado

consiste en un conjunto de datos tridimensional (M, N, λ), que se denomina cubo de datos

hiperespectral (figura 1.3). Los ejes M y N representan la información espacial, mientras

que el eje λ se corresponde con el eje de la longitud de onda (medida espectral).

INTRODUCCIÓN

25

Figura 1.3. Representación de diferentes clases de obtención de imágenes: escala de grises, RGB y

hiperespectral.

El uso de imágenes químicas es un nuevo enfoque analítico ya que no solamente permite

la identificación cuantitativa sino que permite una identificación espacial de las especies

químicas en una muestra.

En términos muy sencillos se puede considerar como un mapa de un producto químico.

Mediante la combinación de espectroscopia infrarroja tradicional con las propiedades de

imágenes microscópicas y macroscópicas.

Una sola medición rápida permite a los analistas obtener información espacial y espectral

con gran facilidad sin estudios previos. La posibilidad de registrar un espectro en un

amplio intervalo de longitudes de onda para cada píxel de la imagen de una muestra está

enfocada al desarrollo de nuevas metodologías más robustas y fiables para extraer la

información más relevante de los datos obtenidos.

Es sobradamente conocido, que la distribución espacial de los componentes en materiales

complejos influye fuertemente en las propiedades físicas y químicas, siendo de gran

INTRODUCCIÓN

26

importancia en la mayoría de procesos farmacéuticos donde uno de los objetivos

principales es conseguir una correcta distribución de todos los analitos en los lotes de

producción. Las técnicas de Imagen Química han encontrado muchos usos en la industria

farmacéutica, las ciencias de polímeros, ciencia de materiales, medicina forense, patología,

clínica y diagnóstico, así como la calidad industrial y control del proceso.

La utilización de las técnicas de NIR Imagen Química como metodología de trabajo en

análisis farmacéutico esta en expansión, ya que esta técnica permite la adquisición de

información espectral y espacial de una muestra en un período corto de tiempo; una sola

imagen contiene miles de espectros con lo que supera ampliamente la capacidad del NIR

convencional. Esta capacidad de adquisición de datos, unida a la amplia variedad de

herramientas para el tratamiento de las imágenes obtenidas, es la base del gran potencial

de la técnica [42].

1.2.2 TIPOS DE CÁMARA

Figura 1.4. Las tres formas de registro de imágenes hiperespectrales: a)Imagen de registro por

puntos, b) Imagen de registro por líneas, c) Imagen de registro por plano.

Una cámara espectroscópica diseñada para obtener imágenes hiperespectrales está

formada por los dispositivos necesarios para obtener la información espectral y espacial

de la muestra. La información espacial se puede obtener utilizando tres configuraciones

[42] A. de Juan, R. Tauler, R. Dyson, C. Marcolli, M. Rault, M. Maeder. Spectroscopic imaging and

chemometrics: a powerful combination for global and local sample analysis. Trends in Analytical Chemistry, 23 (2004) 70-79.

INTRODUCCIÓN

27

distintas: registro por puntos (scan point), registro por líneas (line scan) y registro por

plano (focal plane scan).

Imagen de registro por puntos

La configuración de la cámara de registro por puntos es la que se muestra en la figura 1.4.

Con esta disposición se puede obtener un espectro de una pequeña región de muestra. La

muestra debe ser posicionada nuevamente, a través de un sistema mecánico-electrónico,

para obtener un nuevo espectro. Del desplazamiento sistemático de la muestra en dos

dimensiones se obtiene una imagen hiperespectral. Este sistema permite obtener

espectros muy estables en alta resolución. Sin embargo, el desplazamiento de la muestra,

que debe ser muy preciso para asegurar la repetitividad de la medida, hace que el tiempo

de adquisición de imagen sea realmente alto (del orden de horas o incluso días).

Imagen de registro por líneas

Esta configuración, mostrada en la figura 1.4, se denomina de registro por líneas (line scan

o push broom en inglés) y utiliza un detector de dos dimensiones perpendicular al plano

de la superficie escaneada. La muestra es iluminada por una estrecha línea de radiación o

bien la radiación pasa por un hueco del tamaño de línea de camino a los detectores. Las

imágenes hiperespectrales se generan al mover la muestra en la dirección del plano de la

muestra perpendicular a la línea de detectores. El tiempo de adquisición de imagen se

reduce de forma significativa, ya que la velocidad viene limitada únicamente por la

capacidad de lectura de la cámara. Existen instrumentos comerciales disponibles con

frecuencias de imagen superiores a los 90 Hz y de 320 x 256 píxeles por imagen. Estos

valores hacen que se pueda obtener imágenes, en función del número de longitudes de

onda escaneadas, en cuestión de minutos o incluso segundos.

INTRODUCCIÓN

28

Imagen de registro por plano

La configuración del registro por planos o imágenes implica el posicionamiento del

detector en un plano paralelo a la superficie de la muestra. Se obtiene una imagen para

cada longitud de onda y se forma la imagen hiperespectral por la combinación de todas

ellas a lo largo de la zona del espectro elegida. El tiempo de adquisición de imagen es

relativamente corto, entre 1 y 5 minutos. Los problemas más importantes de esta

configuración se derivan del hecho de que la muestra debe ser iluminada completamente

durante el tiempo de adquisición, provocando su calentamiento, hecho que limita sus

aplicaciones en proceso biológicos y en muestras termosensibles. Además, en función de

las propiedades de los sólidos escaneados, este hecho puede producir problemas de

resolución lateral. Los instrumentos comerciales disponibles permiten obtener imágenes

de 256x320 píxeles a resoluciones ópticas que alcanzan hasta los 10 µm por píxel, aunque

normalmente se trabaja con resoluciones del orden de 30-100 µm.

1.2.3 APLICACIONES DE LA ESPECTROSCOPIA NIR DE IMAGEN

Las técnicas de imagen hiperespectral tienen como objetivo no solo cubrir aspectos que el

NIR convencional no podía abordar, sino también mejorar y también desarrollar nuevas

aplicaciones que amplíen el conocimiento de las muestras. Prueba de ello son las diferentes

aplicaciones que abarcan campos tan dispares como la industria alimentaria [43], medicina

forense [44], patrimonio cultural [45], etc. proporcionando información de interés en todos

los casos.

[43] E.N. Lewis,J. Dubois,L.H. Kidder. NIR imaging and its applications to agricultural and food engineering. Eds: Y. Ozaki,W.F. McClure, A. Christy. Wiley-Interscience (2006) Chapter 4.3.

[44] C. Petibois, G. Deleris. Chemical mapping of tumor progression by FT-IR imaging : towards molecular histopathology. Trends in Biotechnology. 24 (2006) 455-462.

[45] G. Verhoeven,. Imaging the invisible using modified digital still cameras for straightforward and low-cost archaeological near-infrared photography. Journal of Archaeological Science. 35 (2008) 3087–3100.

INTRODUCCIÓN

29

Pero es en aplicaciones en la industria farmacéutica donde focalizaremos las posibilidades

de las técnicas de imagen hiperespectral.

La imagen hiperespectral, ha sido aplicada con éxito en la producción de distintos

productos farmacéuticos. La evaluación de la calidad del producto [46], análisis de

comprimidos “high-throughput” [47], medidas de espesor de recubrimiento de un

comprimido [48], información sobre la composición de un fármaco [49], homogeneidad

de mezclas [50] y comprimidos [51], y la identificación de fármacos falsificados [52], son

algunos ejemplos de aplicaciones de la espectroscopia NIR de imagen en este campo.

[46] B.J. Westenberger, C.D. Ellison, A.S. Fussner, S. Jenney, R.E. Kolinski, T.G. Lipe, R.C. Lyon, T.W. Moore, L.K. Revelle, A.P. Smith, J.A. Spencer, K.D. Story, D.Y. Toler, A.M. Wokovich, L.F.Buhse. Quality assessment of internet pharmaceutical products using traditional and non-traditional analytical techniques. Int. J. Pharm. 306 (2005) 56–70.

[47] E. Lee, W.X. Huang, P. Chen, E.N. Lewis, R.V. Vivilecchia, Highthroughput analysis of pharmaceutical tablet content uniformity by near-infrared chemical imaging. Spectroscopy 21 (2006) 24–32.

[48] E.N. Lewis, L.H. Kidder, E. Lee. NIR Chemical Imaging - Near-Infrared Spectroscopy on Steroids. NIR News 16 (2005) 2.

[49] S. Sặsĭc. An in-depth analysis of Raman and near-infrared chemical images of common pharmaceutical tablets. Appl. Spectrosc. 61 (2007) 239–250.

[50] N. Jovanovic,, A. Gerich,A. Bouchard,W. Jiskoot. Near-infrared imaging for studying homogeneity of protein–sugar mixtures. Pharmaceutical Research. 23 (2006) 2002–2013.

[51] R.C. Lyon, D.S. Lester, E.N. Lewis, E. Lee, L.X. Yu, E.H. Jefferson, A.S. Hussain. Near-infrared spectral imaging for quality assurance of pharmaceutical products: analysis of tablets to assess powder blend homogeneity. AAPS Pharm Sci. Tech. 3 (2002) 17.

[52] M.B. Lopes, J. ClaudeWolff J.M. Bioucas-Dias, M.A.T. Figueiredo. Determination of the composition of counterfeit Heptodin tablets by near infrared chemical imaging and classical least squares estimation. Analytica Chimica Acta. 641 (2009) 46–51.

INTRODUCCIÓN

30

HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA

31

2. HERRAMIENTAS

PARA EL ANÁLISIS DE

DATOS.

QUIMIOMETRÍA


32


33

2. HERRAMIENTAS PARA EL ANÁLISIS DE DATOS.

QUIMIOMETRÍA

El aumento progresivo en complejidad de la instrumentación analítica permite obtener

cada vez un mayor volumen de datos. La conversión de estos datos en información útil

requiere el uso de herramientas matemáticas y estadísticas, que han dado lugar a una

disciplina denominada Quimiometría [53, 54]. La Quimiometría fue definida en 1975 [55]

como el conjunto de métodosutilizados para extraer información química útil de un

conjunto de datos originales.Massart et al. [31] dan una definición más completa y precisa

de este término: “La Quimiometría es la parte de la química que se sirve de las

matemáticas, estadística y lógica formal para diseñar o seleccionar procedimientos

experimentales óptimos, proporcionar información química relevante a partir del análisis

de señales analíticas y, finalmente, adquirir conocimiento de los sistemas químicos”.La

complejidad de la señal NIR hace imprescindible la utilización de técnicas quimiométricas

que nos permitan interpretar, entender y modelar grandes conjuntos de datos. Este

apartado presenta la base teórica de las herramientas quimiométricas utilizadas en la

presente tesis. En un primer lugar, se introduce el proceso de desarrollo de modelos de

calibración cuantitativos. Posteriormente, se comentan los pretratamientos espectrales y

de técnicas de modelado utilizadas. Finalmente, se describe el cálculo de límites de

detección para la evaluación de modelos de calibración PLS.

[53] D.L. Massart, B.G.M. Vandegiste, L.M.C. Buydens, S. De Jong, P.J. Lewi and J.Smeyers. Handbook of chemometrics and qualimetrics. Elsevier. Amsterdam. (1997).

[54] K.R. Beebe, R.J. Pell and M.B. Seasholtz. Chemometrics. A practical guide, John Wiley & sons. New York. (1998).

[55] B.R. Kowalski. Chemometrics: views and propositions. Journal of Chemical Information and Computer Sciences. 15 (1975) 201-203.


34

Tabla 2.1 Características principales de las herramientas y pretratamientos quimiométricos

utilizadas en la presente memoria.

HERRAMIENTA OBJETIVOS NECESIDAD

CALIBRADO BENEFICIOS DESVENTAJAS

PCA

Selección de

muestras.

Modelado y

control de

procesos.

NO

Información directa.

Muy útil en

selección de

muestras, previa

calibración.

Solo información cualitativa.

Difícil interpretación.

MCR-ALS

Identificación.

Determinación

cuantitativa

NO (pero sí es

conveniente

información previa)

Obtención de

información

cualitativa y

cuantitativa de

forma sencilla.

Ambigüedades.

Selectividad.

PLS-DA

Identificación.

Determinación

cuantitativa

NO

Método directo de

cuantificación.

Requiere espectros puros.

PLS Determinación

cuantitativa SI

Modelos de

cuantificación

robustos

Obtener calibrado robusto.

Método de referencia

KENNARD

&

STONE

Selección de

muestras para

un conjunto de

calibración.

Selección de

muestras, previa

calibración de

forma rápida.

No viene incorporado en el

software empleado.

PIECEWISE DIRECT

STANDARDISATION

Transformación

de espectros

para realizar una

transferencia de

calibración.

SI Transformación

rápida.

La transformación a veces no es lo

suficientemente buena para poder

transferir la calibración.

COEFICIENTES

CORRELACIÓN

Identificación.

Determinación

cuantitativa.

SI Cálculo sencillo

Requiere espectros puros.

Alta correlación espectral en la

región NIR. Requiere muestras

perfectamente homogéneas para

realizar un modelo cuantitativo.


35

La Quimiometría ha sido utilizada en esta memoria para desarrollar modelos empíricos y

aplicarlos para el análisis de muestras obtenidas en procesos de la industria química y

farmacéutica [56,57]. Existen numerosos textos y publicaciones que contienen

información extensa sobre la teoría y práctica de la Quimiometría en la industria

farmacéutica. Por ello en esta memoria únicamente se han recogido aquellos puntos más

significativos que han sido utilizados para el desarrollo de los métodos propuestos. En la

tabla 2.1 se muestra una breve descripción las herramientas utilizadas, en la presente

[56] C.E. Miller. Chemometrics in Process Analytical Chemistry. In. Ed. K. Bakeev .Process Analytical Technology. Blackwell publishing, Oxford, (2005) pp 226-227.

[57] E.W. Ciurczak, J.K. Drennen. Pharmaceutical and Medical Applications of Near-lnfrared Spectroscopy. Eds. E.W. Ciurczak, J.K. Drennen. Marcel Dekker. New York. (2001).

PRETRATAMIENTO OBJETIVOS BENEFICIOS DESVENTAJAS

STANDARD NORMAL

VARIATE

Corrige efectos de

scattering provocados

por diferencias físicas

entre muestras

Aplicado en la

mayoría de

software comercial

DERIVADAS DE

SAVITZKY-GOLAY

La 1ª derivada elimina

desplazamientos de

línea base constantes, la

2ª derivada elimina

desplazamientos que

varían linealmente con

la longitud de onda

Aplicado en la

mayoría de

software comercial

Exalta el ruido del espectro.

Es necesario optimizar el

tamaño de ventana

SUAVIZADO DE

SAVITZKY-GOLAY

Reducen

matemáticamente el

ruido aleatorio e

incrementan la relación

señal/ruido

Aplicado en la

mayoría de

software comercial

Puede eliminar información

relevante. Es necesario

optimizar el tamaño de

ventana


36

Tesis. A partir del tipo de información que puede ser extraída de muestras farmacéuticas

se han clasificado las herramientas.

Todas estas herramientas descritas en los siguientes apartados pueden ser aplicadas a las

técnicas de Imagen, previo desdoblamiento del cubo hiperespectral en una matriz

bidimensional.


EXTRACCIÓN DE INFORMACIÓN CUALITATIVA

2.1.1 ANÁLISIS EN COMPONENTES PRINCIPALES (PCA)

Uno de los métodos de reducción de variables más utilizado es el Análisis en Componentes

Principales (PCA, Principal Component Analysis) que permite, entre otros objetivos,

reducir la correlación espectral y englobar las muestras analizadas en función de la

variabilidad que contienen [58].

Consideremos la matriz de datos espectroscópicos X, donde cada una de las I filas

corresponde al espectro de una muestra, y cada columna es la absorbancia a la longitud de

onda J. El objetivo del PCA es explicar la misma información original de la matriz X en un

número inferior de ejes o dimensiones, que corresponden a las variables de la matriz de

datos. Estos nuevos ejes se llaman componentes principales. Su característica principal es

que el primero recoge la máxima variabilidad espectral del conjunto de muestras, el

segundo recoge una variabilidad inferior al primero y es ortogonal a él, y así

sucesivamente. El número de componentes principales se ha de seleccionar de forma que

[58] D.L. Massart, B.G.M Vandeginste, L.M.C. Buydens, S.P. De Jong, J. Lewi,S. Smeyers-Verbeke.Eds. B.G.M Vandeginste and S.C Rutan. Handbook of Chemometrics and Qualimetrics: Part A,Elsevier (1997) pp. 1-20.


37

contengan información relativa a las muestras y no contengan información relativa al

ruido.

La matriz X se descompone en el producto de dos matrices, una de scores T y otra de

loadings P, quedando una matriz de residuales E, con la información no recogida

por T y P:

tX = TP + E (4)

T son las coordenadas de cada punto respecto a los nuevos ejes (componentes principales)

y P son los cosenos de los ángulos entre los nuevos ejes y los ejes originales. El conjunto de

datos X, descrito inicialmente por variables correlacionadas, queda ahora definido por un

nuevo conjunto de variables no correlacionadas entre sí en un sistema de ejes ortogonales.

La interpretación de los resultados obtenidos con el PCA para una clasificación, se lleva a

cabo a partir de una representación de los scores de las muestras de un PC frente a los

scores de otro(s) PC. Si existe una relación entre las muestras, en el gráfico de los scores,

los puntos aparecerán agrupados; mientras que si las muestras no se asemejan entre si, los

puntos aparecerán dispersos entre si. Esta característica permite realizar una selección de

muestras que sean representativas del conjunto global de muestras y que posteriormente

sean utilizadas en calibraciones. Además del estudio de datos, y la observación de

diferencias entre muestras, el análisis en componentes principales puede ser utilizado

para filtrar el ruido en matrices de datos espectroscópicos, reconstruyendo la matriz con

los A PC’s que recogen las principales fuentes de variación, excluyendo los PC’s poco

significativos, que típicamente tienen una relación señal/ruido baja.

2.1.2 COEFICIENTE DE CORRELACIÓN (CC)

La medida de la semejanza entre dos vectores o conjuntos de datos se define como el

producto de las desviaciones de dos conjuntos de sus valores esperados, esto es la

covarianza de n pares de puntos (xi,yi) que se expresa como:


38

n

i

ii

n

yyxxCov

1 1

))((

(5)

Donde x es la media de valores xi e y es la media de valores yi. Un valor positivo indica

que valores altos de x están asociados con valores altos de y y cuando el valor de x

aumenta también lo hace el de y. Un valor negativo indica que valores altos de x están

asociados con valores bajos de y; cuando el valor de x aumenta el de y disminuye.

Debido a que x e y pueden tener distintas unidades y distinta dispersión, el valor de la

covarianza nos da una indicación pobre de la asociación entre las variables y no es un buen

parámetro para comparar situaciones diversas, por lo que se suele utilizar el coeficiente de

correlación.

El coeficiente de correlación es un índice estadístico que mide el grado de relación entre

dos variables cuantitativas y se define como la relación entre la covarianza y las

desviaciones estándar de cada una de las variables.

yx SS

yxCovr

),(

(6)

Cuando x e y representan las absorbancias frente a la longitud de onda (espectros) de dos

compuestos, el valor de r es una medida de la semejanza entre ellos; se puede escribir de

forma abreviada como:

22 )()(

))((

yyxx

yyxx

r

o bien

22 yx

yxr

(7)

Donde xλ e yλ son los valores de absorbancia de los espectros que se comparan a la

longitud de onda λ y x e y son los valores promedio de x e y, respectivamente.

El coeficiente de correlación puede tener valores en el rango de 1 a -1. No existe relación

entre las variables cuando el coeficiente es de 0, aunque no significa que sean totalmente


39

independientes la una de la otra, ya que ambas variables podrían estar relacionadas con

otra función matemática [59].

A pesar de ser un parámetro de aplicación para describir el grado de semejanza de dos

conjuntos de datos y de tener usos como a herramienta discriminante de clasificación en

bibliotecas espectrales [60], el coeficiente de correlación se utilizado entre otras cosas, en

estudios de homogeneidad [61], en la diferenciación de formas polimórficas [62]. Una de

las aplicaciones más interesantes del CC es la de two dimension correlation spectroscopy

[63] que permite exaltar las pequeñas diferencias que experimentan los espectros

sometidos a una perturbación experimental.


EXTRACCIÓN DE INFORMACIÓN CUANTITATIVA

La información espectroscópica puede correlacionarse con magnitudes físicas o químicas,

obteniéndose ecuaciones o modelos de calibración. El fundamento de cualquier

calibración es establecer una relación entre la señal instrumental y la propiedad a

determinar, y posteriormente predecir esta propiedad a partir de la señal medida en una

muestra desconocida. Es posible utilizar calibraciones univariables cuando la señal es

selectiva a la propiedad estudiada.

[59] A.G. Asuero, A. Sayago, A.G. Gonzalez. The Correlation Coefficient: An Overview Crit Rev Anal Chem 36 (2006) 41–59.

[60] S.H. Frasson Scafi, C. Pasquini C . Identification of counterfeit drugs using near-infrared spectroscopy Analyst. 126 (2001) 2218–2224.

[61] J.J. Moes, M.M. Ruijken, E. Gout, H.W. Frijlink,M.I. Ugwoke. Application of process analytical technology in tablet process development using NIR spectroscopy: Blend uniformity, content uniformity and coating thickness measurements. Int J Pharm. 357 (2008) 108–118.

[62] A.D. Patel, P.E. Luner, M.S. Kemper. Low-level determination of polymorph composition in physical mixtures by near-infrared reflectance spectroscopy. J Pharm Sci. 90 (2001) 360–370.

[63] Y. Peng, P. Wu. A two dimensional infrared correlation spectroscopic study on the structure changes of PVDF during the melting process. Polymer. 45 (2004) 5295–5299.


40

Sin embargo la Espectroscopia NIR proporciona un gran número de variables respuesta

para cada muestra, variables que en general no pueden ser asignadas a un solo analito.

Esto ha propiciado el desarrollo de métodos de calibración capaces de relacionar múltiples

variables con la propiedad a determinar. Estos métodos son conocidos como métodos de

calibración multivariantes. Las características principales de estos métodos son:

Trabajan con un gran número de medidas de cada muestra, normalmente con el

espectro completo.

Son necesarios los valores de la propiedad a determinar para cada muestra.

Es posible determinar de forma independiente cada una de las propiedades que se

desea cuantificar.

2.2.1 CALIBRACIÓN UNIVARIANTE MEDIANTE COEFICIENTES DE

CORRELACIÓN (CC)

Los espectros de dos compuestos semejantes presentarán coeficiente de correlación

próximo a 1 y cuanto más diferentes sean menor será el valor de CC; la aplicación de este

concepto a mezclas de dos o más compuestos nos da la idea de que cuanto mayor sea el

contenido de un compuesto en la mezcla mayor será el CC del espectro de la mezcla con el

del compuesto puro; así, el CC aumenta a medida que aumenta la proporción del

compuesto en la mezcla. La relación matemática que puede existir entre el CC de una

mezcla con respecto al componente puro y la concentración del mismo, puede expresarse

tal y como se muestra en la ecuación (8), como lineal siempre y cuando se trabaje en un

intervalo estrecho de concentraciones.

r= K(A-A’) Ca+ K’ (8)

donde K y K’ son dos constantes que contienen términos relacionados con la absorbancia

del analito y el promedio de las concentraciones de las muestras usadas en la calibración.

A y A’ son los coeficientes de proporcionalidad absorbancia/concentración para el analito

y la matriz respectivamente.


41

Esta ecuación constituye la base de un método para determinar la concentración, pues

permite realizar una calibración lineal univariable entre los CC de un conjunto de

espectros NIR de una serie de muestras y uno de sus componentes y la concentración del

mismo. Para aplicar este modelo es necesario disponer del espectro del compuesto puro.

2.2.2 CALIBRACIONES MULTIVARIANTES

Regresión lineal múltiple (MLR)

La regresión lineal múltiple es expresada en notación matricial como:

Y = XB+ E (9)

Las dimensiones de las matrices hacen referencia a m el número de muestras, p el

número de propiedades analíticas estudiadas o variables dependientes y n el número de

canales, longitudes de onda o variables independientes. Desde un punto de vista formal,

MLR es la generalización del problema de mínimos cuadrados univariantes o regresión

lineal simple (n=1 ; p=1) a un estado multivariable en el cual p≥1, n>1. Al aplicar MLR a

datos espectroscópicos, Y es la matriz de datos de referencia de la propiedad analítica que

se quiere modelar, X es la matriz de datos espectrales, B es la matriz de parámetros de

regresión estimados, m es el número de muestras, p es igual al número de longitudes de

onda utilizado. La solución de mínimos cuadrados a la ecuación (9) viene dada por la

expresión (10):

B=(XTX)-1XTY (10)

MLR proporciona los mejores parámetros lineales insesgados (BLUE). Sin embargo, este

método tiene dos importantes restricciones:

El número de muestras debe ser superior al número de canales o longitudes de

onda empleado.


42

La información espectral no debe estar correlacionada ya que la matriz XTX sería

singular y su inversa inestable. Matemáticamente, decimos que el problema está

mal condicionado (ill-conditioned).

Al trabajar con espectroscopia NIR nos encontramos con estás dos restricciones,

usualmente el número de muestras es inferior al número de longitudes de onda. Además,

el espectro NIR está altamente correlacionado ya que la absorción debido a un enlace se

manifiesta de forma repetida a lo largo del espectro NIR en forma de bandas de

combinación y sobretonos.

Regresión en componentes principales (PCR)

PCR es una técnica de calibración multivariante que consta de dos pasos. El primero de

ellos consiste en un Análisis de Componentes Principales (PCA) sobre la matriz de datos X

[64,65,66]. Este análisis genera un conjunto de vectores ortogonales no correlacionados

(scores o componentes principales (PCs)). La nueva

matriz de datos centrados puede escribirse:

X = TPt + E (11)

Donde T es la matriz de los scores de los A componentes principales más dominantes, Pt

la correspondiente matriz de loadings y e la matriz de residuos que representa el ruido o

la información no relevante.

El segundo paso consiste en una Regresión Lineal Múltiple (MLR) [67] entrelas nuevas

variables obtenidas y el parámetro de referencia Y que se desea modelar.

Y = Tb+ e (12)

donde T es la matriz de los scores, b es la matriz de los coeficientes y e los residuos.

[64] J.E. Jackson. A user's guide to principal components. Ed. John Wiley. New York. (1991).

[65] E.R. Malinowski. Factor analysis in chemistry. 2nd. Ed. John Wiley New York. (1991).

[66] S. Wold, K. Esbensen, P. Geladi. Principal Component Analysis. Chemom.Intell. Lab. Syst. 2 (1987) 37-52.

[67] D.L. Massart,B.G.M. Vandeginste,S.N. Deming,Y. Michotte,L. Kaufman. Data Handling in Science and Technology, volume 2. Chemometrics: a textbook. ElsevierScience Publishers. Amsterdam, The Netherlands. (1988).


43

El análisis de componentes principales maximiza la varianza explicada del sistema, sin

embargo, no maximiza necesariamente la calidad de los resultados de predicción del

parámetro modelado para muestras desconocidas.

Regresión parcial por mínimos cuadrados (PLS)

La regresión por mínimos cuadrados parciales (PLS) es una técnica de calibración

multivariable inversa, lo que hace posible calibrar únicamente el componente deseado sin

necesidad de conocer el resto de fuentes de variación.

PLS fue desarrollado entre 1975 y 1982 por Herman Wold y colaboradores [68] y desde

entonces, este modelo ha sido ampliamente estudiado, aplicado, contrastado y divulgado

[69, 70, 71, 72, 73]. Éste basa en que la información contenida en las variables medidas se

puede concentrar en un número menor de variables sin pérdida de información relevante,

de forma similar al PCA, haciendo máxima la matriz de varianza-covarianza. La regresión

se realiza sobre las nuevas variables, eliminando así los problemas de colinealidad que

puedan tener los datos originales.

Para el PLS, se dispone de una matriz de datos espectrales X y una matriz Y que contiene

los datos de la propiedad a determinar. La regresión PLS se basa en un cálculo de

reducción de variables, donde las matrices X (espectral) e Y (analito) se descomponen

simultáneamente según:

X = TPT +E (13)

Y = UQT +F (14)

[68] H. Wold. Soft Modeling. The Basic Design and Some Extensions. in Systems Under Indirect Observation. Eds. K.G. Jöreskog, H. Wold.Amsterdam. (1982).

[69] P. Geladi. Notes on the history and nature of partial least squares (PLS) modelling. J. Chemom. 2 (1988) 231-246.

[70] A. Höskuldsson. PLS regression methods. J. Chemom. 2 (1988) 211-228.

[71] S. De Jong. SIMPLS: an alternative approach to partial least squares regression. Chemom. Intell. Lab. Syst. 18 (1993) 251-263.

[72] A. Phatak,S. De Jong. The geometry of partial least squares. J. Chemom. 11 (1997) 311-338.

[73] A.J. Burnham,J.F. MacGregor,R. Viveros. A statistical framework for multivariate latent variable regression methods based on maximum likelihood. J. Chemom. 13 (1999) 49-65.


44

Donde las matrices T y U son, respectivamente, las matrices de scores de los bloques X e

Y. Las matrices PT y QT son las matrices de loadings de los bloques X e Y, y E y F son las

matrices de residuales del bloque X y del bloque Y respectivamente.

En PLS, al igual que en PCA, se han de seleccionar el número de factores adecuado al

sistema, recogiendo información cuantitativa pero sin recoger ruido o información

espectral relativa a otros parámetros no relacionados con la calibración.

La descomposición de las dos matrices no se hace por separado, sino de forma simultánea.

La principal característica de esta descomposición es que busca la máxima correlación

entre los espectros y la propiedad a determinar. Esta descomposición implica perdida de

ortogonalidad entre los factores pero mejora la capacidad predictiva del modelo de

calibración.

Una vez se ha establecido el modelo de calibración correcto, es posible predecir el

resultado para una nueva muestra o para un conjunto de muestras externo a la

calibración. La correcta predicción de las nuevas muestras dependerá de la buena

capacidad predictiva del modelo de calibración.

2.3 OTROS ALGORITMOS

2.3.1 ALGORITMO DE KENNARD & STONE

Kennard y Stone propusieron un método secuencial que debe cubrir la región

experimental de manera uniforme que es lo que se pretende al utilizar un diseño de

experimentos [74]. El procedimiento consiste en seleccionar como siguiente muestra

(objeto candidato) aquel que se encuentra a mayor distancia de los objetos previamente

seleccionados (objetos de calibración). La distancia utilizada normalmente es la distancia

Euclidea aunque es también posible, y probablemente es mejor, utilizar la distancia de

[74] R.W. Kennard,L.A. Stone. Computer aided design of experiments. Technometrics. 11(1969) 137-148.


45

Mahalanobis. En un primer momento, se seleccionan los dos objetos que se encuentran a

mayor distancia dentro del espacio experimental. De todos los puntos candidatos, se

selecciona aquel que esté más alejado de los dos primeros previamente seleccionados y se

añade al conjunto de las muestras de calibración. Para ello, se determina la distancia entre

cada punto candidato i0 y cada punto i que ha sido ya seleccionado

y se determina cuál es la menor distancia (min i (d i,i0 )) .

De entre estos valores se selecciona aquel para el que la distancia sea máxima

dseleccionado = maxi0(min i (d i,i0 )) (15)

En ausencia de fuertes irregularidades en el factor espacio, el procedimiento comienza con

la selección del conjunto de puntos próximos a aquellos seleccionados mediante el método

D-optimal, i.e., en los límites del conjunto de datos (más el punto central). Entonces se

procede a rellenar el espacio de calibración. Kennard y Stone denominaron a su

procedimiento “algoritmo de trazado uniforme”; proporciona una distribución plana de

datos que, como se explicó antes, es la más adecuada para el modelo de regresión.

2.3.2 PIECEWISE DIRECT STANDARDISATION (PDS)

El método PDS [75] relaciona de forma multivariante las respuestas de las muestras del

subconjunto de estandarización. La técnica considera que existen correlaciones entre los

valores de la respuesta por grupos de variables. Así, las respuestas en la variable i de las

muestras en las primeras condiciones, r1i, se relacionan con una ventana de respuestas,

centrada en la variable i, para las mismas muestras pero en las segundas

condiciones.r1i=XTi fi +f0i (16)

[75] Y. Wang, D. J. Veltkamp,B.R. Kowalski. Multivariate instrument standardization. Anal. Chem. 63 (1991) 2750.


46

Donde fi son los coeficientes de corrección y f0i el término independiente o corrección

aditiva de fondo (additive background correction, ABC) [76] y se obtienen por una

regresión multivariante PCR o PLS. Para una regresión multivariante (J variables), se

obtendrán J vectores fi y J valores foi, que se pueden agrupar en la matriz F:

F= diag (f 1, f 2,... , f i, , f J ) (17)

f0T=(f 01, f 02,... , f 0i, , f 0J ) (18)

Las respuestas en las nuevas condiciones, rT2,un se estandarizan según:

(rT2,un)std= rT

2,unF+ f0T (19)

y el vector de respuestas estandarizado, (rT2,un)std , se utiliza en el modelo para obtener las

predicciones finales.

Esta técnica consigue corregir cambios más complejos que otras más simples, como la

corrección de la pendiente y el sesgo, aunque tiene la desventaja del mayor número de

parámetros que se deben establecer: el tamaño de la ventana, el número de factores que

intervienen en los modelos locales (ventanas) o el número demuestras de estandarización

a utilizar. Si estos parámetros se escogen incorrectamente se pueden producir errores en

la transferencia, o artefactos [77], producidos por una selección de muestras poco

representativas o por una incorrecta selección del número óptimo de factores en los

modelos locales. Tanto en la técnica de transferencia PDS, como en la corrección de la

pendiente y el sesgo, hay que seleccionar un subconjunto de muestras para realizar la

transferencia. Un método de asegurar la representatividad de las muestras seleccionadas

[76] Z. Wang, T. Dean, B. R. Kowalski. Additive Background Correction in Multivariate Instrument Standardization. Anal. Chem. 67 (1995) 2379.

[77] O,de Noord. Multivariate calibration standardization. Chemom Intell Lab Syst 25 (1994) 85.


47

es utilizar un algoritmo de selección de muestras como el de Kenard-Stone [74], que

selecciona secuencialmente las muestras de forma que se extiendan

uniformente en el espacio experimental.

2.4 MODELADO Y CONTROL

El proceso de desarrollo y evaluación de un modelo quimiométrico, ya sea destinado al

análisis cualitativo o cuantitativo, consta de una serie de etapas básicas. De modo general,

estas etapas tienen una seria de características comunes. A continuación se describen más

ampliamente cada una de ellas [78].

2.4.1 SELECCIÓN DEL CONJUNTO DE CALIBRACIÓN

El primer paso es disponer de un número de muestras suficiente para la creación y

validación del modelo. Las muestras utilizadas para el desarrollo de un modelo de

calibración deben ser representativas de la variabilidad que pueda darse durante el

proceso, y también entre procesos. Así, las muestras, además de cubrir todo el intervalo de

la propiedad a determinar, han de incorporar la variabilidad debida a otras variables del

proceso, como puede ser el origen de la materia prima o la temperatura de reacción, entre

otros. Herramientas útiles para la selección demuestras son el análisis en componentes

principales (PCA) y el algoritmo de Kennard & Stone.

[78] M. Blanco, M. Alcala. Use of Near-Infrared Spectroscopy for Off-line Measurements in the Pharmaceutical Industry. Ed. K. Bakeev. Process Analytical Technology. Blackwell publishing. Oxford (2005) pp 362-391.


48

2.4.2 MÉTODOS DE REFERENCIA

El desarrollo de modelos cuantitativos requiere el conocimiento previo de las variables que

van a ser determinadas. Para ello se utilizan los métodos de referencia que deben

proporcionar valores precisos y exactos, ya que de ello dependerá la calidad del modelo a

desarrollar. En el apartado de metodología se describen los métodos de referencia

utilizados en la presente memoria.

2.4.3 OBTENCIÓN DE LA SEÑAL ANALÍTICA

Registro de la información analítica primaria que se va a utilizar en la construcción del

modelo de calibración, siendo en nuestro caso el espectro NIR.

2.4.4 PRETRATAMIENTOS ESPECTRALES

En los datos espectroscópicos pueden aparecer contribuciones no deseadas (debido al

proceso de registro, a la naturaleza de la muestra o al ruido instrumental), que causan no

linealidades u otros efectos que pueden afectar negativamente al desarrollo del modelo de

calibración. Los pretratamientos espectrales tienen como objetivo, entre otros, minimizar

las contribuciones espectrales no deseadas, simplificando los modelos y mejorando los

resultados.La selección del pretratamiento espectral adecuado suele realizarse a posteriori

teniendo en cuenta un estudio estadístico de los resultados obtenidos encada caso.

Hacerlo a priori puede resultar erróneo ya que su selección no sólo depende del tipo de

muestra o del modo de registro espectral, sino también de contribuciones desconocidas.

A continuación se presentan los pretratamientos más habituales utilizados en este trabajo.

Suavizado de espectros (Smoothing Average): Los métodos de suavizado son

utilizados para reducir matemáticamente el ruido aleatorio e incrementar la


49

relación señal/ruido [79]. Estos métodos utilizan una ventana de puntos para

determinar un valor central, desplazando la ventana a lo largo de todo el espectro.

Sin embargo, el incorrecto uso del tamaño de ventana podría eliminar información

relevante, por lo que es necesario optimizar el tamaño de ventana.

El más utilizado en la presente memoria es el de Savitzky-Golay [80].

SNV (Standard Normal Variate) [81]: corrige efectos de scattering provocados

por diferencias físicas entre muestras. El método se aplica individualmente a cada

espectro, y se obtiene un espectro de absorbancia media y desviación estándar. La

ecuación para el cálculo del SNV es:

jSNVj

Abs AbsAbs

S

(20)

donde Absj es la absorbancia original a la longitud de onda j, Abs es la

absorbancia media del espectro y S es la desviación estándar.

Derivadas: Es uno de los pretratamientos más utilizados en espectroscopia NIR

por su capacidad de solventar los problemas característicos de esta técnica: el

solapamiento de bandas y los desplazamientos de línea base. La primera derivada

elimina desplazamientos de línea base constantes, la segunda derivada elimina

desplazamientos que varían linealmente con la longitud de onda. El método de

derivación más utilizado es el de Savitzky-Golay [84]. Las derivadas por Savitzky-

Golay incorporan un suavizado previo, por lo que el tamaño de ventana es un

[79] K.R. Beebe, R.J. Pell, M.B. Seasholtz. Chemometrics. A practical guide,. Ed.John

Wiley & sons. New York (1998).

[80] A. Savitzky, M.J.E. Golay. Smoothing and differentiation of data by simplified least

squares procedures. Anal. Chem. 36 (1964) 1627-1639.

[81] R.J. Barnes, M.S. Dhanoa, S.J. Lister. Standard Normal Variate Transformation and De-trending of Near-Infrared Diffuse Reflectance Spectra. Appl. Spectrosc. 113 (1989) 1849.


50

parámetro crítico, si es pequeño la derivada tendrá un elevado ruido y si es grande

la información espectral resultará demasiado suavizada [83].

2.4.5 CONSTRUCCIÓN DEL MODELO DE CALIBRACIÓN

Una vez, pretratados los datos y seleccionada la herramienta quimiométrica idónea para

modelar los datos, se construye el modelo de calibración evaluando distintos parámetros

implicados en el cálculo: intervalo espectral, pretratamiento espectral, muestras

anómalas, número de componentes o factores, errores de calibración, entre otros. Una vez

obtenido el modelo, su capacidad predictiva es evaluada mediante un segundo grupo de

muestras, de las que se conoce la propiedad a determinar, pero que no han sido utilizadas

en la etapa de construcción del modelo. Si los resultados no son satisfactorios, el modelo

ha de ser recalculado.

Una vez construido y validado, el modelo de calibración puede ser aplicado para la

determinación de la propiedad en nuevas muestras.

2.4.6 EVALUACIÓN DE RESULTADOS

Tanto si se emplea PCR, PLS, como modelos lineales usando coeficientes de correlación,

es necesario algún sistema que, a parte de saber si una calibración proporciona una

capacidad predictiva apropiada, permita evaluar la conveniencia de utilizar más o menos

componentes principales en una determinada calibración.

En los modelos de calibración multivariante, la determinación del número de

componentes se llevó a cabo utilizando como criterios de decisión el análisis del aumento

de la varianza explicada al añadir un nuevo componente al modelo y a través de la

comparación de la representación gráfica del RMSE, error cuadrático medio (Root Mean

Square Error), (18) frente al número de componentes tanto para calibración RMSEC,

como para validación RMSEP. El RMSEC disminuye paulatinamente al aumentar el


51

número de componentes, en cambio, el RMSEP presenta un mínimo o bien una

disminución relativa significativamente menor a partir del número óptimo de

componentes, siendo m el número de muestras, REFy los valores de referencia e ˆ

PLSy los

valores predichos por el modelo PLS. El RMSE puede ser considerado como el error medio

obtenido en el proceso de modelado y está expresado en las mismas unidades que los

datos de referencia.

m

2

PLS REFi=1

(y -y )

RMSE=m

ˆ

(18)

Otros estadísticos básicos, además del RMSE, utilizados para determinar la bondad

del modelo y su habilidad predictiva fueron: los obtenidos a través del análisis de

residuales (estadístico-t), el coeficiente de determinación entre los valores de referencia y

los predichos por el modelo (R2) y el RSE, error estándar relativo (Relative Standard

Error) (19), calculado tanto para calibración RSEC, como para validación externa RSEP.

m2

PLS REFi=1

m

REFi=1

2

(y -y )

RSE(%)= x100

(y )

ˆ

ˆ

(19)

El RSE es un estadístico menos optimista, o más realista, que el RMSE para

determinar la bondad de un modelo ya que en su determinación se ha tenido en cuenta el

ámbito de aplicación del modelo, al dividir el bias por los valores de referencia.


52

2.5 HERRAMIENTAS PARA EL ANÁLISIS DE IMAGEN

Una de las principales características de las imágenes hyperespectrales es la gran cantidad

de información recogida de una muestra. En NIR Imagen, por ejemplo, un espectro NIR

se puede medir en un amplio rango de longitud de onda en cada píxel de la superficie. Esta

información se estructura en forma de un cubo de datos tridimensional X (M x N x λ)

(figura 2.4), donde M y N representan los ejes espaciales y el eje λ corresponde al patrón

espectral. Atendiendo a la estructura de tridimensional de los datos X obtenidos, puede

ser definida como cubo tridimensional (3-way array)[82], pero también es común para

referirse a este tipo de datos como imagen hiperespectral [41]. Esas estructuras de datos

pueden estar compuestas por miles de espectros. Por lo que hace evidente que esta

cantidad de información espectral, normalmente muy correlacionados entre sí, necesite de

los tratamientos matemáticos de gran alcance para extraer la información conveniente de

los datos primarios.

Pero previamente a la aplicación de cualquier pretratamiento o algoritmo para extraer la

información, es necesario desdoblar la matriz de datos (unfolding) pasando de un cubo de

datos a una matriz de 2 dimensiones ya que ni los pretratamientos ni los distintos

algoritmos pueden ser aplicados directamente a matrices tridimensionales. Como ya se ha

comentado anteriormente, cuando se registran imágenes se obtiene un cubo

tridimensional X (M × N × λ). Cuando se realiza el desdoblamiento (unfolding) se obtiene

una matriz X con dimensiones (MN × λ) (Figura 2.1). Esta etapa es crucial para la

posterior aplicación de algoritmos bidimensionales como Coeficiente de Correlación, PCA,

CLS, PLS, PLS-DA o MCR.

[82] J.B. MacQueen. Some Methods for Classification and Analysis of Multivariate Observations. University of California Press. Berkeley USA. (1967).


53

Figura 2.1 Representación del desdoblamiento del cubo de datos tridimensional

2.5.1 CLASSICAL LEAST SQUARES (CLS)

La regresión Clásica de mínimos cuadrados es un método de cuantificación ampliamente

conocido que supone que cada medición es la suma ponderada de señales linealmente

independientes [83].

CLS es un método directo que requiere un total conocimiento de todos los componentes

de las muestras, en el caso de la Espectroscopia NIR, los espectros de todos los

componentes, de las muestras de calibración, y funciona correctamente en sistemas muy

sencillos.[84]. El modelo CLS asume que el espectro de cada muestra es la combinación

lineal de los espectros de los componentes puros, ponderado por su concentración. En

esencia, la matriz X se descompone como sigue:

X=PST (20)

donde P es la concentración de la matriz para cada componente puro y S corresponde a

los espectros. El verdadero interés en CLS se basa en calcular por método directo la

[83] K.L.A. Chan, N. Elkhider, S.G. Kazarian, Chem. Eng. Res. Des. 83(2005) 1303.

[84] Martens, H. and Næs, T. (1991) Multivariate Calibration; Wiley; New York.

3D Array Bidimensional Matrix

UNFOLDING


54

concentración de nuevas muestras a partir de los espectros puros de los componentes. De

esta forma, P se puede calcular fácilmente como sigue:

P = XS+ (21)

donde S+ corresponde a la pseudo-inversa de la matriz S:

S+ = ST(SST)-1 (22)

A pesar de la facilidad de cálculo de esta concentración de la matriz, el CLS tiene dos

principales inconvenientes: la señal puede verse afectada por variaciones no sistemáticas

que influyen en el patrón espectral, y que no siempre se dispone de los espectros puros de

todos los componentes. En el caso de muestras naturales (por ejemplo agroalimentarias)

no puede utilizarse este método, ni tampoco en muestras farmacéuticas de las que no se

disponga y se conozca la totalidad de sus espectros puros.

2.5.2 MULTIVARIATE CURVE RESOLUTION–ALTERNATING LEAST

SQUARES (MCR-ALS)

La resolución multivariante de curvas es una de las técnicas quimiométricas de más

reciente aplicación en NIR-CI. Su desarrollo teórico se ha producido a lo largo de la

década de los 70, y no ha sido hasta finales de los 90, cuando se ha aplicado en diferentes

campos de la química analítica [85, 86].

Hasta finales de los 90, MCR-ALS estaba considerada como una técnica cualitativa donde

el interés se centraba en obtener información espectral de los compuestos de las muestras

estudiadas. Actualmente, MCR-ALS empieza a considerarse como una técnica con

capacidad para obtener información cuantitativa del sistema estudiado, siendo interesante

respecto a otras técnicas quimiométricas, anteriormente comentadas, porque es capaz de

[85] R.Tauler, A.Smilde, B.R.Kowalski. Selectivity, Local Rank, Three-Way Data Analysis and Ambiguity in Multivariate Curve Resolution. Journal of Chemometrics. 9 (1995) 31–58

[86] R.Tauler, B.R.Kowalski, S.Flemming. Multivariate Curve resolution Applied to Spectral Data from Multiple Runs of an Industrial Process. Analytical Chemistry.65 (1993) 2040–2047.


55

resolver cualitativa y cuantitativamente sistemas químicos con un mínimo de información

externa.

La resolución multivariante de curvas asume que los datos experimentales siguen un

modelo lineal que de forma matricial, se representa como [87]:

D = CS +E (23)

Donde D corresponde a la matriz espectral, C es la matriz calculada correspondiente a las

concentraciones de los analitos involucrados en la matriz de espectros inicial, S

corresponde a la matriz de espectros recalculada de los analitos y finalmente E

corresponde a una matriz de residuales y representa toda la información no explicada por

las matrices C y S y que está presente en la matriz D.

Gráficamente, la ecuación 23 se puede representar como:

Figura 2.2. Representación gráfica de MCR aplicado en una imagen hiperespectral desdoblada.

Donde MxN es el número de píxeles que posee la imagen desdoblada.

[87] R. Tauler. Anàlisi de mescles mitjançant resolució multivariant de corbes. Institut d’estudis catalans. (1997).


56

El objetivo de los métodos multivariantes de resolución de curvas es resolver el sistema

representado en la ecuación 23 utilizando solo la matriz D, es decir, obtener información

cualitativa y cuantitativa solo a partir de datos espectroscópicos.

La matriz de datos D se descompone mediante la metodología de Mínimos Cuadrados

Alternados (ALS). La solución de la descomposición no es única ya que se pueden obtener

una gran número de combinaciones de C y S, que multiplicadas entre sí permitan obtener

la misma matriz D.

Estas ambigüedades pueden ser corregidas mediante la aplicación restricciones en el

cálculo, para evitar soluciones ilógicas experimentalmente aunque lógicas

matemáticamente, como pueden ser concentraciones negativas o espectros negativos (lo

cual dependerá del sistema de registro o de los pretratamientos utilizados). También

existen problemas de ambigüedad en las soluciones de la ecuación 23, que aumentan aún

más el número de soluciones al sistema:

Ambigüedad rotacional: ocurre cuando no existe selectividad y cuando hay dos o

más componentes con una elevada correlación. El espectro calculado para

cualquiera de ellos será una combinación lineal desconocida de los verdaderos

espectros. Teniendo en cuenta que la absorción en el infrarrojo próximo está

formada por bandas anchas y solapadas, donde prácticamente no existen regiones

de absorción selectivas, la ambigüedad rotacional es uno de los problemas más

importantes en la resolución de estos sistemas.

Ambigüedad de intensidad: Esto significa que los espectros y los perfiles de

concentración calculados pueden estar multiplicados por cualquier número. No es

un problema serio en análisis cualitativo pero sí en análisis cuantitativo. En ambos

casos de ambigüedades es necesaria aportar información adicional a la matriz D

para resolver esta ambigüedad.


57

Restricciones aplicadas durante el proceso de iteración

Restricción de no negatividad: las concentraciones de las especies químicas

siempre han de ser positivas o cero. Los espectros generalmente son positivos,

excepto si se han utilizado pretratamientos espectrales como las derivadas o el

SNV. Esta restricción se suele aplicar forzando a los valores negativos a ser cero

para continuar con el proceso de iteración.

Restricción de unimodalidad: esta restricción es aplicable a perfiles espectrales o

de concentración que solo posean un máximo. En primer lugar se encuentra el

valor máximo, y los valores a un lado y otro del máximo han de disminuir de forma

monótona.

Closure: aplicable en sistemas químicos cerrados de forma que la suma de

concentraciones de todas las especies químicas en cada punto de la reacción es

constante.

Convergencia: el proceso de iteración se para cuando se cumple el criterio de

convergencia establecido o cuando se alcanza un número de iteraciones máximo.

Versión aumentada de MCR-ALS

Cuando una matriz espectral no puede ser correctamente descompuesta debido a

deficiencias espectrales, una de las opciones puede ser aportar información directamente a

la matriz espectral [88]. Si se disponen las matrices una encima de la otra, con las

columnas en común, se obtiene una matriz D aumentada:

[88] A. de Juan, R. Tauler. MCR from 2000: progress in concepts and applications Crit. Rev. Anal. Chem. 36 (2006) 163.


58

Figura 2.3. Representación gráfica de la versión aumentada de MCR.

La matriz C calculada corresponde a los perfiles de concentración de las especies

presentes en las submatrices de D, es decir, el sistema no fuerza a que los perfiles de

concentración sean iguales, una misma especie puede tener diferentes perfiles espectrales

en cada matriz Ci.

No ocurre lo mismo para la matriz S. Los espectros calculados para cada especie han de

ser iguales para las diferentes matrices.

El tratamiento conjunto de matrices aporta ventajas en el cálculo de MCR-ALS:

El número de soluciones de la ecuación 23 disminuye.

Se puede resolver la ambigüedad de intensidad utilizando varias matrices con

diferentes condiciones iniciales de concentración en un cálculo conjunto.

MCR-ALS en imagen hiperespectral

Para datos de imagen hiperespectral, previamente a la aplicación del algoritmo se ha

realizado un desdoblado del cubo de datos espectrales, obteniéndose una matriz de

dimensiones MNxλ tal y como se muestra en la figura 2.2, una vez se han obtenido los

perfiles de concentración de cada componente C1, C2, C3… Cn (vectores de dimensión

MNx1 ). Estos vectores realizando un refold se transforman en mapas de concentración


59

para cada componente de dimensiones MxN. Estos mapas de concentración permiten ver

la distribución del componente estudiado en la imagen hiperespectral teniendo

aplicaciones entre otros campos en la industria farmacéutica, tanto para asegurar la

calidad de los productos intermedios como para asegurar la calidad del producto final, en

la elaboración de un fármaco.

2.5.3 ISYS-PLS1

Isys-PLS1 es un método que aparentemente es parecido a Partial Least Squares

Discriminant Analysis (PLS-DA), un método usado en NIR clásico, como método de

clasificación, y consiste en la creación de un modelo PLS donde la variable de respuesta es

una variable categórica, que expresa la clase perteneciente de la observación realizada.

Como consecuencia, todas las variables medidas juegan el mismo papel con respecto a la

asignación de clase. El modelo PLS describe el conjunto de variables observadas y predice

su respuesta asignando a cada observación una categoría.

Algunos estudios de NIR-CI en aplicaciones farmacéuticas aplican un método PLS

alternativo para cuantificar muestras, que utiliza solamente los espectros puros de los

componentes como datos de calibración [89, 90, 91]. Este algoritmo se usa en el software

Isys 5.0 de Malvern y viene denominado como PLS1, en otras publicaciones se le ha

denominado como, PLS, PLS-CLassification, PLS-Class, PLS-DA etc.

Este modelo Isys-PLS1 define una matriz de espectros de los componentes puros y una

matriz de respuestas '1' y '0' que indican la pertenencia o no, respectivamente, a la clase de

[89] S.Chevallier, D. Bertrand, A. Kohler, P. Courcoux. Application of PLS-DA in multivariate image analysis. J. Chemometrics. 20 (2006) 221–229.

[90] L.J. Makein,L.H. Kidder,E.N. Lewis,M. Valleri. Non-Destructive Evaluation of Manufacturing Process Changes using Near Infrared Chemical Imaging. NIR News. 19 (2008) 11-15.

[91] T. Puchert,D. Lochmann,J.C. Menezes,G. Reich. Near-infrared chemical imaging (NIR-CI) for counterfeit drug identification--a four-stage concept with a novel approach of data processing. Journal of Pharmaceutical and Biomedical Analysis. 51 (2010) 138–145.


60

cada componente puro. El algoritmo aplicado a los espectros que componen una imagen

proporciona un mapa de concentraciones de cada uno de los componentes modelados de

la muestra, que junto a sus histogramas constituyen herramientas muy útiles para el

conocimiento de la distribución de cada componente.

OBJETIVO DE LA TESIS

61

3. OBJETIVO DE LA

TESIS


62


63

3. OBJETIVO DE LA TESIS

La industria química y farmacéutica tiene por objetivo proporcionar productos con

unas condiciones de un nivel de calidad que satisfagan al usuario y cumplan las

normativas establecidas para estos parámetros. Para asegurar la calidad de un producto

final en la industria química y farmacéutica, se usan una gran variedad de métodos

analíticos, que en determinados casos pueden destruir la muestra a analizar o bien

necesitar un pretratamiento de ésta para realizar el análisis, implicando lentitud y

costes económicos en el análisis.

Por lo tanto el desarrollo de metodologías de análisis rápidas, sencillas y fiables es una

de las demandas actuales de la industria química para mejorar la eficiencia de los

procesos de producción.

La espectroscopia en el infrarrojo cercano (NIR) y para determinadas aplicaciones la

espectroscopia de imagen en el infrarrojo cercano (NIR-CI), al ser técnicas rápidas, no

invasivas, sin preparación de muestra y de coste de análisis muy reducido, reúnen las

características que las hacen adecuadas para satisfacer estas demandas.

Es por ello que estas técnicas fueron seleccionadas para el estudio de distintos

productos industriales y farmacéuticos.

El objetivo de esta tesis es desarrollar nuevas metodologías para la industria química y

farmacéutica, utilizando la espectroscopía NIR y NIR-Chemical Imaging en tándem con

las técnicas quimiométricas.

Este objetivo general se puede describir en los siguientes apartados:

1. Desarrollo de modelos de calibración multivariables basados en las medidas

espectroscópicas. Los modelos desarrollados han de ser robustos y con adecuada

capacidad predictiva para poder ser utilizados en el control del proceso industrial.

Capacidad de clonar dos o más equipos NIR mediante una transformación de


64

espectros, para de esta forma usar los mismos modelos de calibración en los distintos

equipos.

2. Desarrollo de un único modelo de calibración que sea lo suficientemente robusto

para permitir la correcta predicción del contenido de API de un preparado

farmacéutico en todas y cada una de las etapas de su proceso productivo hasta alcanzar

el producto final.

3. La extracción de toda la información relevante contenida en las imágenes

hiperespectrales obtenidas, para determinación de API, excipientes y grosor de

recubrimiento, así como de su distribución en comprimidos comerciales.

4. Establecer la uniformidad de contenido de API de un lote de comprimidos

comerciales con una sola imagen hiperespectral.

OBJECTIVES

65

3. OBJECTIVES

The chemical and pharmaceutical industry aim to provide products with a level of

quality that meets the user conditions and accomplish the desired for those quality

parameters.

To assure the quality of a final product in the chemical and pharmaceutical industry, a

large variety of analytic methods have been used. Those analytic methods, in certain

cases need a pre-treatment of the sample and can destroy the analyzed sample,

involving a slow and expensive analysis.

Therefore the development of fast, simple and reliable analysis methodologies is one of

the current demands of the chemical industry to improve the efficiency of production

processes.

Near infrared (NIR) and near infrared chemical imaging spectroscopy (NIR-CI) for

certain applications, are fast, non invasive, with no preparation of the sample and low

analysis cost techniques, meeting features that make them appropriate to meet these

demands.

For those reasons, those techniques were selected for the study of various industrial

and pharmaceutical products.

The main objective of this thesis is the development of new methodologies for the

chemical and pharmaceutical industries, using NIR and NIR-Chemical Imagine

spectroscopy combined with chemometric techniques.

This general objective may be described in the following sections:

1. The development of multivariate calibration models based on the spectroscopic

measurements. The developed models must be robust and with the appropriate

predictive capacity to be used in the industrial process control. The ability to clone two

OBJECTIVES

66

or more NIR instruments by using a transformation of spectra, by in this way to use

the same calibration models in the different instruments.

production plant instruments located next to the reactor to do an in situ analysis.

2. Development of an unique calibration model that allows the correct prediction of the

API content of a pharmaceutical preparation in all stages of its production process to

final product.

3. The extraction of all the information contained in the obtained hyperspectral images,

for the determination of API, excipients and coating thickness, as well as their

distribution in commercial tablets.

4. Determine the content uniformity of API from a 10 commercial tablets batch with the

acquisition of an unique hyperspectral image.

METODOLOGÍA EXPERIMENTAL

67

4. METODOLOGÍA

EXPERIMENTAL


68


69

4. METODOLOGÍA

A continuación se describen las características más relevantes de la metodología

utilizada en el desarrollo de los métodos propuestos, esta descripción comprende los

procesos aplicados en la obtención de las muestras de los procesos en estudio, la

metodología experimental que describe los métodos de preparación de muestras y sus

principales características, además de la metodología instrumental empleada:

características de los instrumentos, forma de registro de los espectros y/o imágenes y

finalmente el tratamiento de los datos espectroscópicos que nos conduce a los

resultados analíticos de interés.

4.1. PROCESOS DE FABRICACIÓN

4.1.1 RESINA DE POLIÉSTER

El proceso de fabricación de la resina consta de tres etapas: en la primera etapa la

mezcla de neopentilglicol y etilenglicol y ácido tereftálico, junto con un catalizador y un

antioxidante (ver tabla 4.1) se calienta hasta 240ºC en atmósfera de nitrógeno a una

presión de 4 atm hasta la fusión de las materias primas e inicio de la condensación y se

mantiene el tiempo necesario para que los índices alcancen los valores deseados. Este

inicio de la esterificación es más difícil y lento y necesita una mayor temperatura de

reacción.

En una segunda etapa se reduce la temperatura hasta 210ºC y se ajustan las cantidades

de ácido tereftálico y neopentilglicol si los valores de IA i IOH neto no están entre el

intervalo deseado y se añaden el resto de ácidos (ác. isoftálico, ác. adípico y/o anhídrido

trimetílico).


70

En la tercera etapa del proceso se ajustan las cantidades de ácido tereftálico y

neopentilglicol de la misma forma que en la etapa 2 y se realizan posteriormente

distintas rampas de vacío, manteniéndose la misma temperatura de la segunda etapa,

para eliminar el agua formada en la reacción y alcanzar los índices deseados para el

producto final.

Tabla 4.1. Principales materias primas usadas para la obtención de resinas de poliéster.

4.1.2 ENANTYUM COMPRIMIDOS

El producto final está constituido por un comprimido lacado que contiene 135 mg/g de

dexketoprofeno trometamol (equivalente a 93.3 mg/g de dexketoprofeno), celulosa

microcristalina PH101 (500 mg/g) como excipiente mayoritario y otros tres en menor

proporción: almidón de maíz, carboximetilalmidón y diestearato de glicerol (estos dos

últimos se añaden al producto granulado).

Reactivo Fórmula Propiedad Contenido

(%)

Ácido tereftálico

Propiedades mecánicas 65-90

Ácido isoftálico

Resistencia a exteriores 10-25

Diácidos

Ácido adípico

Flexibilidad, alta reactividad en el final de cadena

polimérica

1-10

Neopentilglicol

Resistencia a exteriores 80-100

Etilenglicol

Flexibilidad 0-20

Dioles

Dietilenglicol

Flexibilidad 0-20


71

El proceso de fabricación del preparado se realiza en dos etapas que consisten en una

granulación húmeda de la mezcla de API y de los excipientes mayoritarios, celulosa

microcristalina PH101 y almidón de maíz, y a continuación una posterior adición al

producto granulado de los excipientes restantes; la mezcla final se homogeneiza, se

comprime para obtener las tabletas y finalmente se recubren los comprimidos con una

fina película de laca (compuesta por laca OPADRY (85 %) y propilenglicol (15%)

diluido en agua desionizada. Los comprimidos tienen forma cilíndrica y un peso medio

de 270 mg. Durante el proceso de fabricación se han extraído muestras que se han

utilizado tanto para preparar el modelo de calibración como para establecer su

capacidad predictiva. Además se han preparado muestras en el laboratorio para

ampliar el rango de concentraciones de las muestras que constituirán el conjunto de

calibración.

4.2 METODOLOGÍA EXPERIMENTAL

A continuación se detalla la preparación de las muestras usadas en la presente memoria.

4.2.1 RESINA POLIÉSTER

Se ha utilizado un conjunto de 105 muestras de resina de poliéster, pertenecientes a

cada una de las 3 etapas de fabricación. La composición de las muestras depende de la

etapa y del momento en que han sido extraídas.

Cada muestra se ha molturado durante aproximadamente 30 segundos en un molinillo

eléctrico y se ha introducido en una capsula de vidrio y se ha procedido al registro del

espectro.


72

4.2.2 ENANTYUM COMPRIMIDOS

Las muestras de Enantyum comprimidos de subdividen en dos conjuntos el de las

muestras de calibración y el de muestras de predicción.

Muestras de calibración

Las muestras que constituyen el conjunto de calibración son muestras procedentes de

la etapa de granulación. Estas muestras presentan un estrecho rango de

concentraciones de API por lo que algunas fueron dopadas con el objetivo de ampliar

este rango hasta un intervalo de ± 20% del valor nominal (93 mg/g), con API (muestras

sobredosificadas) y con placebo (muestras subdosificadas) .

Muestras de predicción

El conjunto de predicción está constituido por muestras de las diferentes etapas del

proceso de fabricación: muestras granuladas pertenecientes a lotes que no se han

incluido en la calibración, comprimidos sin recubrimiento (cores) y comprimidos

recubiertos (coated tablets). Además, se incluyeron en el set de predicción comprimidos

recubiertos molturados hasta un tamaño de partícula similar al de las muestras

granuladas.

Todos los componentes y las muestras del preparado han sido proporcionados por los

Laboratorios Menarini, S.A. (Badalona, Spain).

4.2.3 COMPRIMIDOS COMERCIALES DE ÁCIDO ACETILSALICÍLICO

Las muestras utilizadas en estos estudios son comprimidos comerciales de ácido

acetilsalicílico, adquiridos en la farmacia. La concentración de ácido acetilsalicílico

(ASA) de todos los comprimidos ha sido calculada dividiendo el contenido nominal por

el peso promedio de cada comprimido. Las concentraciones nominales de los


73

comprimidos usados en los estudios cubren un amplio rango que va del 82% al 12% en

contenido de ASA.

4.2.4 COMPRIMIDOS EN FASE EXPERIMENTAL

Por razones de confidencialidad no se nombran ni API ni excipientes que componen

estos comprimidos ya que es un fármaco que se encuentra en fase experimental.

Se han usado tres tipos diferentes de muestras: (a) núcleos (cores, comprimidos sin

recubrimiento), (b) comprimidos recubiertos con distintos grosores de capa y (c)

comprimidos procedentes del proceso de producción. Los comprimidos recubiertos

(grupo b) incluyen muestras con grosores de recubrimiento entre el 50% y el 300%

respecto del grosor de recubrimiento nominal del proceso de producción (100%).

Todos los núcleos tienen la misma composición en API y excipientes, con valores

nominales de concentración del 35% de principio activo (API) y 65% de la suma de

excipientes, de los cuáles: 40% de excipiente #1, 20% de excipiente #2, 2% de

excipiente #3, 1.5% de excipiente #4 y 1.5% de excipiente #5. El API y los 2 excipientes

mayoritarios representan un 95% del total del comprimido. En el caso de los

comprimidos recubiertos, hay que tener en cuenta que el aumento de peso de la laca

implica una disminución de la concentración de API y excipientes. Los porcentajes de

los diferentes componentes disminuyen ligeramente a medida que aumenta el grosor

del recubrimiento y su variación para los componentes mayoritarios se recoge en la

tabla 4.2.


74

Tabla 4.2. Composición (en %) de API excipientes de los comprimidos en función del grosor

del recubrimiento.

Composición (% w/w) de las muestras usadas (%)

Grosor de recubrimiento(%)

Núcleo 50% 100% 200% 300%

API 35.0 34.4 33.9 33.0 32.0

E #1 40.0 39.3 38.8 37.7 36.6

E #2 20.0 19.7 19.4 18.8 18.3

E #3 2.0 2.0 1.9 1.9 1.8

E #4 1.5 1.5 1.5 1.4 1.4

E #5 1.5 1.5 1.5 1.4 1.4

Los grupos de muestras a y b se han utilizado para la determinación de la

concentración de los distintos componentes (API y excipientes) de los comprimidos.

Las muestras del grupo b se han utilizado como conjuntos de calibración y validación

de los modelos PLS para la determinación del recubrimiento que, posteriormente, se ha

aplicado a las muestras de producción (grupo c).

4.3 METODOLOGÍA INSTRUMENTAL

A continuación se detallan la instrumentación empleada para el desarrollo de esta

memoria, así como el software necesario para adquirir los espectros y las imágenes.

Además de los distintos equipos utilizados, también se describe el registro de las

muestras empleadas y los métodos de referencia aplicados en la realización de los

estudios de esta memoria.


75

4.3.1 INSTUMENTACIÓN EMPLEADA

Perkin Elmer Spectrum ONE NTS

El espectrofotómetro Perkin-Elmer Spectrum One NTS (Norwalk, CT), es un equipo de

transformada de Fourier y trabaja en un rango espectral de 10000-4000 cm-1, con una

resolución espectral máxima de 2 cm-1.Las muestras se han registrado con un accesorio

que es un modulo de reflectancia NIR (NIRA). Este accesorio que mide por reflectancia

consiste de una esfera integradora a temperatura estabilizada y detector de arseniuro

de Indio y Galio (InGaAs). Como se muestra en la figura 4.1, la muestra se coloca en

un vial encima del instrumento, se ilumina la muestra por debajo con una lámpara de

tungsteno y el equipo registra el espectro.

El Previo a la adquisición de cada muestra el equipo realiza un blanco con una placa

cerámica interna.

La adquisición de datos con el equipo Perkin-Elmer se controla mediante el software

Spectrum V.3.02.01.

Figura 4.1. Imagen del Espectrofotómetro con el módulo de NIRA.


76

Bruker Multi Purpose Analyzer (MPA)

El espectrofotómetro de la marca Bruker, modelo MPA (Bruker Optics (Ettlingen,

Germany and The Woodlands, USA ), funciona con transformada de fourier y esta

equipado con un detector de arseniuro de Indio y Galio (InGaAs).

Trabaja sobre un rango espectral de 12500-3750 cm-1, con una resolución espectral

máxima de 2 cm-1.

Las muestras, líquidas y sólidas, se han registrado por transmisión en un

compartimento termostatizado. Para el registro de espectros se coloca en el

compartimiento de transmisión, un vial con la muestra ya molturada de forma que el

haz de luz producido por la lámpara de tungsteno pasa por la muestra y se lleva al

detector mediante el uso de espejos. El equipo realiza un blanco previo a la adquisición

de la muestra con una placa cerámica interna.

El Bruker MPA se controla con el software OPUS v. 6.0 de Bruker Optics (Ettlingen,

Germany and The Woodlands, USA ).

Figura 4.2. Imagen del Espectrofotómetro con los diferentes accesorios para medir distintos

tipos de muestra


77

NIR FOSS 6500

El espectrofotómetro NIR Foss 6500, es un equipo dispersivo, que registra los

espectros mediante un barrido de longitudes de onda (cada espectro es el promedio de

32 barridos), utiliza como fuente de luz una lámpara halógena de filamento de

tungsteno. El monocromador está constituido por una red de difracción cóncava que al

girar permite enfocar cada longitud de onda en la rendija del instrumento; el sistema

permite un registro rápido del espectro (menos de 1 seg) con un intervalo espectral de 2

nm. El detector es de PbS y permite el registro de espectros en el rango de 1100-

2500nm.

Los espectros han sido registrados con un módulo RCA (Rapid Content Analyzer) que

permite registrarlos en modo reflectancia y por transflectancia.

Como se puede observar en la figura 4.3 a) el RCA consiste de una caja metálica dentro

de la cual hay la ventana del instrumento donde se coloca la muestra. Una vez

depositada la muestra, se puede ajustar el iris para controlar la apertura de la ventana. La

ventana (figura 4.3 b) ) consta de una parte central por donde pasa el haz de luz hacia

muestra, la luz reflectada llega a los 6 detectores que están dispuestos alrededor del

haz de luz formando un ángulo de 45º respecto el haz de luz. Las muestras en polvo o

granuladas se han registrado por triplicado en modo reflectancia en una cubeta de

cuarzo o cristal como soporte de la muestra. Antes de cada medida el sólido se removió

con una espátula dentro de la cubeta.

El espectro de comprimidos fue obtenido mediante el registro directo sobre la ventana

del instrumento en modo reflectancia.

Previamente al registro de las muestras se registra un blanco constituido por una placa

de cerámica.

La adquisición de datos con el equipo NIR FOSS 6500, se controla mediante el

software VISION v2.51 (FOSS NIRSystems, Silver Spring, USA). Permite el registro de

los espectros así como su visualización, aplicando los pretratamientos espectrales más

habituales.


78

Figura 4.3. a) Imagen del Espectrofotómetro y accesorio RCA. b) Ventana del equipo. 6

detectores y haz de luz de radiación NIR.

Cámara hiperespectral NIR Roda 25

La cámara hiperespectral NIR “Think Spectrally Roda-25” (Think Spectrally, Valencia,

Spain) es un prototipo diseñado por la empresa Think Spectrally (Valencia, España) en

colaboración con el grupo de quimiometría de la Universidad Autónoma de Barcelona.

Este instrumento es un Focal Plane Array (FPA) provisto de un detector de Mercurio

Cadmio Telurio (MCT) que permite registrar imágenes en un rango espectral de 1200-

2400 nm con resolución espectral de 7 nm. Dependiendo del estudio realizado se ha

configurado la cámara para que el tamaño de cada píxel sea aproximadamente de entre

60x60 µm, y 2oox2oo μm obteniendo un área de imagen aproximada de 32.0 x 25.6

mm para la primera resolución espacial y de 65.0 x 50.0 mm para la segunda.

Este instrumento mide en modo de reflectancia difusa de espectro continuo con un

tiempo total aproximado de 2 minutos por imagen. La iluminación de la muestra es un

parámetro relevante en la obtención de imágenes de calidad. Por ello, 4 lámparas

halógenas están colocadas enfocando a la muestra con una orientación de unos 45 º

(figura 4.4).

Previo al registro de una o un conjunto de muestras es necesaria una calibración del

instrumento, con el registro y modelado de las imágenes hiperespectrales de seis


79

standards AP-0200 NIR de 99, 80, 40, 20, 10 y 0,2 % de reflectancia FOSS (Silver

Springs, MD).

Una vez registradas cada una de las imágenes de las muestras, la imagen es

transformada, mediante el uso del calibrado del instrumento, a valores de Absorbancia,

además de corregir las imágenes de posibles interferencias en la iluminación.

El calibrado se deberá repetir cada vez que se cambien las condiciones de la cámara.

La adquisición de imágenes con el equipo NIR Roda 25, se controla mediante el

software TS-Capture (Think Spectrally, Valencia). La calibración de las imágenes así

como su visualización global como de espectros en píxeles puntuales, se realiza con la

graphic user interface de plataforma Matlab TS-GUI.

Figura 4.4. Cámara hyperespectral RODA NIR 25


80

Cámara hiperespectral Malvern SyNIRgi

Para la adquisición de las imágenes se ha utilizado la cámara hiperespectral SyNIRgyTM

Chemical Imaging System de Malvern (Malvern Instruments, Malvern, UK), este

instrumento es un Focal Plane Array (FPA) equipado con un detector de tipo InSb de

320x256 píxeles.

Las muestras se colocan en la pletina, se iluminan con las lámparas halógenas situadas

alrededor en un ángulo apropiado (figura 4.5) y se ajusta la distancia del objetivo según

el tamaño del objeto. En las condiciones seleccionadas, las imágenes tienen una

resolución de 40μm (cada píxel tiene un área de 40 x 40 µm). El tiempo de adquisición

de una imagen de reflectancia, cubriendo un rango de longitudes de onda comprendido

entre 1200-2400nm, se realiza en unos 3 minutos. Previamente a la adquisición de la

muestra (S), el software requiere el registro de las imágenes del background (B) (placa

cerámica de referencia del 99% de reflectancia) y de la Dark reference (D) (espejo). Una

vez adquirida la muestra (S), los datos obtenidos se usan para transformar los espectros

en modo de reflectancia (R), aplicando la siguiente ecuación: R=(S−D)/(B−D). Este

cálculo se ha aplicado a todos los píxeles de cada una de las imágenes registradas. La

imagen es transformada posteriormente a unidades de absorbancia.

La adquisición de imágenes con el equipo NIR Roda 25, se controla mediante el

software Pixys® 1.1 software (Malvern Instruments, Malvern, UK).


81

Figura 4.5. Cámara hyperespectral Malvern SyNIRgi

4.3.2 ADQUISICION DE LOS ESPECTROS DE LAS MUESTRAS

A continuación se describe la adquisición de los espectros de cada tipo de muestras

usadas para la presente tesis así como el software utilizado en esta memoria para la

adquisición de los espectros e imágenes NIR.

Resina de poliéster

Cada muestra se ha molturado durante aproximadamente 30 segundos en un molinillo

eléctrico y se ha introducido en una capsula de cristal y ha procedido al registro del

espectro .

El registro de los espectros se ha realizado por reflectancia con una resolución de 2 cm−1

en el rango de números de onda de 4000 hasta 10000 cm−1 y cada espectro es el

promedio de 60 barridos en el equipo Perkin-Elmer y 30 barridos en el equipo Bruker.

Se obtienen tres espectros de cada muestra, revolviendo entre medidas, y el espectro

promedio de los tres replicados se usa en todos los estudios posteriores.


82

Se registra el espectro en capsulas de cuarzo y con las opciones interleaved (realiza

automáticamente la diferencia entre espectro registrado y el espectro de la referencia) y

spinner (donde se va rotando la capsula de medida sobre el haz de luz al mismo tiempo

que se registran los espectros que es útil para minimizar efectos en el espectro de

muestras no homogéneas) en el equipo Perkin-Elmer. Con el equipo Bruker se

registran las muestras con la opción Straylight Correction activada (realiza

automáticamente la diferencia entre espectro registrado y el espectro de la referencia).

Enantyum comprimidos

Los espectros NIR fueron registrados en un espectrofotómetro FOSS NIRSystems

Modelo 6500 (Siver Springs, MD) equipado con un modulo RCA (Rapid Content

Analyzer) y controlado con el software Vision 2.51, programa diseñado para el control

del espectrofotómetro NIR FOSS. Permite el registro de los espectros así como su

visualización, aplicando los pretratamientos espectrales más habituales. Su entorno

permite diseñar rutinas de análisis sencillas para el análisis tanto cualitativo como

cuantitativo.

Cada espectro es el resultado de 32 scans en el rango espectral 1100-2498 nm, con una

resolución espectral 2 nm; se utilizó una placa cerámica para registrar el espectro de

referencia previo al registro de los espectros.

El registro de los espectros de las muestras granuladas (producción y sub/sobre

dosificadas) se ha realizado colocando alícuotas de las muestras en una cubeta de

cuarzo y se registra su espectro de reflectancia por triplicado; la muestra fue removida

entre los sucesivos registros espectrales. El espectro promedio, calculado a partir de los

tres replicados de cada muestra, fue utilizado en los estudios siguientes.

Los comprimidos de producción, no lacados y lacados, se registraron por ambas caras,

colocando directamente el comprimido sobre la ventana de cuarzo del módulo de

registro; el espectro utilizado en los tratamientos posteriores es el espectro promedio

de ambas caras.


83

Comprimidos comerciales de Aspirina.

A continuación se detalla la forma en que se han registrado las imágenes de los

comprimidos comerciales en el caso que querer registrar un comprimido individual o

bien 10 comprimidos a la vez.

Registro de comprimidos individuales

El registro de la imagen de los comprimidos individuales se ha realizando colocando el

comprimido en el soporte de las muestras y enfocando el objetivo para obtener una

adecuada resolución espacial. En estas condiciones de trabajo el tamaño de cada píxel

es de aproximadamente 100 x 100 μm2, siendo la totalidad de la imagen de un tamaño

de 48.0 x 38.4 mm2. Las imágenes se registraron en un rango espectral de 1200-2100

nm. con una resolución de 7 nm. Se utilizaron tres ajustes de la imagen diferentes en

función del tamaño de los comprimidos: 15 x 15 (tamaño grande), 8 x 8 (tamaño

mediano) y 5 x 5 mm2 (tamaño pequeño).

El registro de la imagen de los componentes puros: acido acetil salicílico y celulosa

microcristalina (excipiente mayoritario en las 4 formulaciones) se ha realizado

colocando la muestra en polvo en una cubeta circular de vidrio de unos 3.8 cm de

diámetro y presionando la superficie con un disco de metal para obtener una superficie

plana.

Registro de 10 comprimidos

Para registrar los 10 comprimidos en una sola imagen (disposición mostrada en las

figuras 4 y 5) se ha alejado la pletina donde se coloca la muestra del objetivo de la

cámara, y se realiza un nuevo enfoque de éste para obtener la mejor resolución óptica

en las imágenes tomadas. Después de los cambios se obtiene una imagen de una

resolución espacial de 200x200 μm2 y una imagen de tamaño total de 65x50 mm2.

Al alejar las muestras para ampliar el campo, cambia el ángulo de iluminación de las


84

lámparas y la potencia lumínica sobre la muestra, por lo que ha sido necesario

recalibrar nuevamente la cámara.

Comprimidos en fase experimental

Se han registrado 6 imágenes de cada núcleo: 4 de cada una de las caras exteriores (A-

D) y 2 de las caras interiores (E-F) obtenidas por partición de los comprimidos tal como

se muestra en la figura 4.6a. En el caso de las muestras de producción se han registrado

sólo las 4 caras exteriores de los comprimidos, denominadas de la misma forma que en

los núcleos (A-D). Para la determinación del grosor del recubrimiento (comprimidos

del grupo b) se han registrado 2 imágenes de cada comprimido, pertenecientes a dos

caras exteriores opuestas. En este último caso, cada imagen incluye 2 caras homólogas

de 2 comprimidos de iguales características (mismo grosor de lacado), tal como se

muestra en la figura 4.6b. Estas imágenes no han sido consideradas en su totalidad,

sino que sólo se han tenido en cuenta porciones rectangulares interiores de cada

comprimido con el fin de evitar las distorsiones producidas por la luz en los bordes de

los comprimidos de la imagen.

A

D

C

B

A

C

F

E

a) b)

A A

BB

Comprimido 1 Comprimido 2

Figura 4.6. Esquema de las diferentes caras de análisis de un comprimido: a) núcleos y

comprimidos lacados estándar; b) comprimidos con distintos porcentajes de recubrimiento con

las áreas seleccionadas para la determinación marcadas en gris.


85

Las imágenes de los compuestos puros se han obtenido colocando la cantidad suficiente

de los mismos en una cubeta de vidrio, comprimiendo ligeramente su superficie y

adquiriendo la imagen a continuación.

4.3.3 METODOS DE REFERENCIA

En los trabajos que se presentan en esta tesis, se han utilizado varios métodos de

referencia para el análisis cuantitativo de API y la determinación de otros parámetros

químicos, como índice de ácido y de hidroxilo para hacer seguimiento de las muestras

de resina.

Las muestras de laboratorio se han preparado por pesada de los diferentes

componentes antes de su mezclado, por ello no se requiere la aplicación de un método

de referencia.

Las muestras en polvo o granuladas sub y sobre dosificadas (muestras dopadas del

proceso de fabricación de enantyum comprimidos) se han preparado añadiendo

cantidades pesadas de API y excipientes a una cantidad conocida de muestra; por

cálculo se establece el valor de referencia de API para estas muestras.

La concentración de API en los comprimidos de acido acetilsalicílico ha sido calculada

dividiendo el contenido nominal por el peso de cada comprimido.

Índice de ácido de las resinas

El índice de acido de una resina poliéster se define como el numero de miligramos de

hidróxido potásico necesarios para neutralizar 1 gramo de muestra. Se determina

aplicando la norma ASTMD-465-01 [92], basado en la valoración de los grupos

carboxílicos libres con una base estándar.

[92] Annual Book of ASTM Standards, Section 06.03, American Society for Testing and Materials, Philadelphia, (2005)


86

El método se basa en una valoración ácido-base que utiliza hidróxido de potasio como

agente valorante. La muestra se disuelve enetanol : xileno 1:1 y se valora con KOH 0.1

M, detectando el punto final con fenolftaleína. El índice de ácido

(en mg KOH/g muestra) se calcula según la fórmula:

W

xVxMIA

1.56 (25)

Donde:

V: volumen de KOH gastados en la valoración en ml.

M: concentración de la solución de KOH en M.

W: peso de muestra en g.

56.1: factor de conversión mol KOH/ g KOH.

Índice de hidroxilo de las resinas

El índice de hidroxilo de una resina poliéster se define como el número de miligramos

de hidróxido potásico necesarios para neutralizar el acido acético formado durante la

acetilación de 1 gramo de muestra. Se determina siguiendo la norma ASTM D-1957-86

[92].

El método se basa en la acetilación de los grupos hidroxilo con una cantidad conocida, y

en exceso, de anhídrido acético en piridina, utilizando 4-dimetilaminopiridina (DMAP)

como catalizador:

R-OH + (CH3CO)2O R-OOC-CH3 + CH3COOH (26)

El anhídrido acético en exceso que no ha reaccionado se hidroliza:

(CH3CO)2O + H2O 2 CH3COOH (27)

El ácido acético formado por ambas reacciones se determina por valoración con KOH.

El IOH se calcula teniendo en cuenta el volumen de KOH gastado para neutralizar los


87

moles de acético generados por las reacciones (26) y (27) para la muestra, y el volumen

de KOH necesario para neutralizar los moles de acético que se generan en un blanco

(solo reacción de hidrólisis). La diferencia entre ambos volúmenes es una medida de la

concentración de grupos OH en la muestra, ya que a mayor concentración de grupos

OH, menor será la cantidad de anhídrido a hidrolizar.

Debido a que en la valoración con KOH para la muestra se determina tanto el ácido

acético como cualquier otro ácido que pueda contener la muestra, es necesario

determinar también el IA y tenerlo en cuenta en el cálculo del IOH (25).

El índice de hidroxilo (en mg KOH/g muestra) se determina según la fórmula:

IAW

xMVVxIOH

)(1.56 21 (28)

Donde:

V1: volumen de KOH gastados en el blanco en ml.

V2: volumen de KOH gastados en la muestra en ml.

M: concentración de la disolución de KOH en M.

W: peso de la muestra en gramos.

IA: índice de ácido.

56,1: factor de conversión mol KOH/g KOH.

No obstante el parámetro que será útil i del cual se hará la cuantificación, no es el

índice de hidroxilo definido anteriormente, sino el índice de hidroxilo neto. El índice de

hidroxilo neto es un parámetro indicativo de los grupos hidroxilo que hay en exceso. Se

calcula tal y como se indica en la ecuación 29, haciendo la diferencia entre el índice de

hidroxilo y el índice de ácido.

IOHnet= IOH-IA (29)


88

Espectroscopía UV-Visible

El contenido de API (Dexketoprofeno) en el producto Enantyum Comprimidos fue

determinado a partir de 0.25 g de muestra triturada añadidos a 90 mL de agua Milli-Q.

Se aplican ultrasonidos a la solución durante 15 minutos a 37 ºC. Una alícuota de 2 mL

es diluida a 5 mL de una solución Metanol/Agua 3:1 de la cual se registra el espectro

UV-Vis. El contenido de API se calcula mediante una regresión lineal múltiple (MLR)

en la región 210-400 nm.

4.4 TRATAMIENTO DE DATOS

Una vez registrados los datos ya sea con un equipo NIR o tomando una imagen

hiperespectral, primeramente es necesario aplicar un pretratamiento quimiométrico a

los datos con el objeto de eliminar contribuciones no deseadas en los espectros;

posteriormente se aplica la herramienta quimiométrica idónea para modelar los datos y

extraer la información deseada en función de nuestras necesidades. A continuación se

describe el software utilizado en esta memoria para tratar los datos una vez éstos han

sido adquiridos con el software de cada equipo.

The Unscrambler 9.5 (CAMO Process S.A., Trondheim, Norway)

Es el software quimiométrico más utilizado en nuestro grupo y permite trabajar con

conjuntos de datos multivariantes con la posibilidad de utilizar pretratamientos de los

datos aplicando SNV (Standard Normal Variate), Mean Centering, correcciones de

línea base y derivadas (usando el algoritmo de Savitzky-Golay). Además permite aplicar

algunas de las herramientas quimiométricas más habituales para la reducción de

variables y análisis de clasificación no supervisado (PCA) y también para el modelado

necesario en el análisis cuantitativo (PLS ).


89

OPUS 6.0 (Bruker Optics, Ettlingen, Germany)

Como anteriormente se ha comentado este software es el encargado de controlar el

equipo Bruker MPA y que además de la adquisición de los espectros, permite utilizar

pretratamientos de los datos aplicando SNV (Standard Normal Variate), correcciones

de línea base y derivadas (usando el algoritmo de Savitzky-Golay), etc... Permite aplicar

algunas de las herramientas quimiométricas de clasificación, como clusters, redes

neuronales y herramientas quimiométricas para el análisis cuantitativo (PLS ). Opus

dispone de otras herramientas quimiométricas para tratar los espectros, en el trabajo

presentado Opus 6.0 se ha utilizado para transferir los espectros usando el algoritmo

de Kowalski and Yang (University of Washington) Piecewise Direct Standardisation

(PDS) [74] descrito en la introducción de esta tesis.

Microsoft Excel( Microsoft, Redmond, Washington, USA)

Microsoft Excel, es una aplicación para manejar hojas de cálculo. Este programa es

desarrollado y distribuido por Microsoft, y es utilizado normalmente en tareas

financieras y contables. Se ha aplicado en esta memoria para el cálculo del coeficiente

de correlación entre espectros y realización de gráficas y tablas.

MATLAB V7.0 (The Mathworks, Massachusets, USA)

Permite trabajar con datos multivariantes. A través de diferentes rutinas creadas por

autores se han utilizado: PLS Toolbox 4.5 (Eigenvector Research, WA, USA) para la

aplicación de los algoritmos de PCA y CLS; ALS 2004 de Roma Tauler para la

aplicación de MCR-ALS.

Isys 5.0 (Malvern Instruments, Worcestershire, UK)

Este software es el encargado de controlar el equipo Malvern

SyNIRgi y que además de la adquisición de los espectros, permite utilizar


90

pretratamientos de los datos aplicando SNV (Standard Normal Variate), derivadas

(usando el algoritmo de Savitzky-Golay), etc...

Este software permite hacer múltiples tratamientos de la imagen, como eliminar

fondos, píxeles en los que el espectro no se ha registrado correctamente, estudio de

distribuciones, PCA para datos cualitativos de la imagen, Isys-PLS1 para realizar

cuantificaciones en la imagen entre otras funciones.

En el trabajo presentado Isys 5.0 se ha utilizado para eliminar el fondo, y usar el

algoritmo Isys-PLS1 con las imágenes.

4.5 CONSTRUCCIÓN DE LOS MODELOS DE

CALIBRACIÓN

A continuación se realiza una breve descripción de como se han elaborado los

diferentes modelos utilizados en la tesis.

PLS

Para construir los diferentes modelos PLS, se ha seguido siempre el mismo protocolo

de actuación: en primer lugar se elige un conjunto de calibración adecuado, se optimiza

el pretratamiento espectral y finalmente se optimiza el rango espectral y número de

factores que mejor capacidad predictiva dan al modelo.

Modelos de calibración univariante

Para construir un modelo de calibración univariante mediante coeficientes de

correlación lo suficientemente robusto como para predecir muestras de distinta

naturaleza física, es necesario elegir un conjunto de muestras calibración

perfectamente homogéneas, seleccionar y optimizar el pretratamiento y rango espectral


91

de forma que el rango de valores de correlación de la recta de calibrado sea lo más

amplia posible para minimizar los errores de interpolación.

MCR-ALS

La utilización del método MCR se realizó aplicando las restricciones naturales, no

negatividad de concentraciones y closure, y fue necesario introducir espectros del API

y excipiente mayoritario y en determinados casos otros excipientes minoritarios como

estimaciones iniciales para facilitar la iteración. Para una buena cuantificación de las

imágenes es necesario optimizar los pretratamientos.

Isys-PLS1

La utilización del algoritmo PLS1 incluido en el software Isys 5.0, requiere la previa

creación de una biblioteca espectral con uno o más espectros de cada componente que

se quiere cuantificar en la imagen. Para ello se registran imágenes de los componentes

puros y se selecciona un área de la imagen para introducirla en la biblioteca. Una vez

construida la biblioteca se optimizan el threshold y número de factores con los que se

obtenga una mejor capacidad predictiva.


92

RESULTADOS Y DISCUSIÓN

93

5. RESULTADOS Y

DISCUSIÓN


94


95

5. RESULTADOS Y DISCUSIÓN

Se presentan de manera resumida y crítica los resultados más relevantes obtenidos en

los estudios realizados en la presente Tesis. Los resultados se presentan organizados en

función del tipo de muestra analizada. Se han clasificado en: 1) estudios realizados

utilizando la espectroscopia NIR convencional que han conducido a la determinación

de parámetros de control de un proceso de fabricación de resinas de poliéster y a la

determinación de API a lo largo de las etapas de producción de un fármaco. 2) estudio

mediante NIR-CI de muestras farmacéuticas.

5.1 ESTUDIOS CON ESPECTROSCOPIA NIR

CONVENCIONAL

A continuación se presentan los estudios realizados con NIR convencional que

consisten en la preparación de los modelos para determinación de los parámetros de

interés analítico

5.1.1 DETERMINACION DE PARÁMETROS DE CONTROL DE UN

PROCESO DE FABRICACION DE RESINAS POLIÉSTER

La producción de las resinas poliéster se realiza en tres etapas a lo largo de las cuales

tiene lugar la condensación entre poliácido y poliol (esterificación), corrección de

composición y finalmente el acabado de la resina que debe tener unas características

tanto físicas como químicas determinadas. En la figura 5.1 se muestran espectros de la

misma resina en cada una de las etapas de proceso de producción. Estos espectros

muestran una gran semejanza entre si, lo que indica que el transcurso de la reacción, a


96

pesar de la reducción de los valores de los índices de ácido y de hidroxilo durante el

proceso, causan solamente pequeños cambios espectrales.

Figura 5.1. Espectros NIR de muestras de distintas etapas del proceso productivo.

Para la construcción de los distintos modelos se han usado únicamente muestras

procedentes del proceso que fueron registradas con el equipo Perkin-Elmer. En la

figura 5.2 se muestra un gráfico de dispersión de scores de un análisis en componentes

principales (PCA) de espectros de resinas correspondientes a las tres etapas; se

observan claras diferencias entre los espectros de las tres etapas, lo que indica la

evolución del sistema con el tiempo. Estas diferencias nos llevaron a construir un

modelo para cada uno de los parámetros de control (Índice de Ácido e Índice de

Hidroxilo) y para cada una de las etapas del proceso.


97

Figura 5.2. Gráfico de dispersión de scores obtenido de un PCA de los espectros en primera

derivada en el rango de 4000-10000 cm-1 en las tres etapas de producción.

En la figura 5.2 se observa que los scores de las muestras de la 2ª etapa son próximos a

los de las muestras de la 3ª etapa, por ello se estudia la construcción de un único

modelo para muestras de ambas etapas tanto para índice de ácido como el de hidroxilo.

Para obtener un modelo de calibración con adecuada capacidad predictiva es necesario

que el conjunto de calibración incluya todas las fuentes de variabilidad del conjunto de

muestras que se quieren determinar; para seleccionar las muestras que cumplan esta

condición se ha aplicado el algoritmo de Kennard-Stone a los conjuntos de muestras

disponibles para cada una de las etapas. La figura 5.3 muestra un grafico de dispersión

de scores (PC1 vs. PC2) de un análisis en componentes principales (PCA) de las

muestras disponibles pertenecientes a la primera etapa del proceso y se observa que la

selección realizada por aplicación de este algoritmo recoge la variabilidad espectral de

las muestras seleccionadas para la calibración.


98

Figura 5.3. Gráfico de dispersión de scores obtenido de un PCA de los espectros en primera

derivada en el rango de 4000-10000 cm-1 en la primera etapa de producción.

Se comprueba que las muestras seleccionadas por el algoritmo cubren todo el rango de

IA o IOH; cuando no es así, se amplia el número de muestras que el algoritmo

Kennard-Stone debe seleccionar hasta que el numero de muestras cubra completa y

uniformemente el rango de valores de los índices. El conjunto de muestras no

seleccionadas por el algoritmo Kennard-Stone constituirán el conjunto de validación

que se utilizará para comprobar la capacidad predictiva del modelo construido.

En el estudio para obtener el mejor modelo se han ensayado distintos rangos

espectrales y distintos pretratamientos espectrales (SNV y primera derivada). La

selección del rango espectral del modelo se ha realizado con la ayuda del criterio de


99

Jack-Knifing [93] que proporciona una indicación de las longitudes de onda que tienen

una mayor influencia en el modelo.

La aplicación del criterio conduce a la selección de los rangos recogidos en la tabla 5.1 y

que coinciden con las bandas más significativas de los espectros de las resinas. En los

modelos de calibración las muestras que presentaban elevados valores de residuales o

desviaciones importantes de la población han sido consideradas muestras anómalas

(outlier) y se han eliminado del modelo.

Se han desarrollado modelos para determinar los valores de índice de ácido e índice de

hidroxilo para cada etapa, excepto para índice de hidroxilo de muestras de 2ª y 3ª

etapas para las que se ha construido un solo modelo. La tabla 5.1 muestra los

parámetros significativos de cada modelo y así como los errores de calibración y de

predicción; puede verse que 4 ó 5 factores PLS son suficientes para la construcción de

modelos de adecuada capacidad predictiva para ambos parámetros como lo

demuestran los valores de RSEP que no superan el 3.5 % en ninguno de los modelos

construidos.

Tabla 5.1. Características de los modelos de calibración para el control de valores de índice de

ácido e hidroxilo.

Parámetro Etapa Pretratamiento espectral

Rango espectral

(cm-1)

Factores PLS

Varianza Y explicada

%

RSEC%

RSEP%

1 1ª Derivada

6550-5316 5206-4970 4926-4578 4418-4000

4 98.27 1.52 2.58

2 1ª Derivada 7000-4000 5 98.4 0.69 1.48

IA

3 SNV 8200-5000 4 95.8 0.35 1.27

1 1ª Derivada

7182-6870 6106-5302 5224-4566 4418-4158

4 98.18 2.82 2.39 IOH neto

2+3 1ª Derivada 7118-5448 5132-4000

5 96.3 1.61 3.41

[93] H. Martens, M. Martens. Modified Jack-knife estimation of parameter uncertainty in bilinear modelling by partial least squares regression (PLSR). Food Qual Prefer. 11 (2000) 5– 16.


100

La semejanza entre las muestras de la 2ª y 3ª etapas ha permitido construir un único

modelo para el índice de hidroxilo que es simple (5 factores) y con buena capacidad

predictiva; en cambio no se obtienen resultados satisfactorios para el índice de ácido y

se ha preferido construir modelos separados para las dos etapas que son más simples y

adecuados que uno único.

Tabla 5.2. Figuras de mérito de los modelos de calibración para las muestras de calibración y

predicción.

Parámetro Etapa Conjunto de muestras

Nº de muestras

Rango del parámetro (mg KOH/g)

Pendiente Ordenada en el origen

R2

Calibración 19 13.6 - 22.0 0.98±0.07 0.30±1.17 0.99 1

Predicción 23 14.9 - 19.3 0.95±0.13 0.64±3.83 0.95

Calibración 22 42.3 - 56.6 0.98±0.06 0.80±2.95 0.99 2

Predicción 28 46.9 - 53.6 0.93±0.17 3.75±8.47 0.91

Calibración 16 33.1 - 35.5 0.96±0.11 1.44±3.98 0.96

IA

3 Predicción 6 34.9 - 35.4 - - -

Calibración 46 16.1 - 36.0 0.98±0.04 0.47±1.07 0.98 1

Predicción 27 19.4 - 34.4 1.02±0.06 -0.83±1.73 0.98

Calibración 49 (-19.2) - (-39.0) 0.96±0.05 1.08±1.61 0.96 IOH neta

2+3 Predicción 40 (-21.2) - (-33.3) 1.07±0.13 1.57±3.84 0.85

Nota: ± Intervalo de confianza para el nivel de significancia (p = 0.05).

La tabla 5.2 recoge los parámetros estadísticos más relevantes de los modelos tanto de

calibración como de predicción. Los valores de pendiente y ordenada en el origen con

sus correspondientes intervalos de confianza de las rectas de regresión obtenidas de

valor NIR v.s. valor de referencia, comprenden el 1 y el 0 respectivamente para todos

los modelos construidos. Estas características, junto con los valores de los coeficientes

de determinación para las rectas de los conjuntos de calibración tanto para índice de

ácido como de hidroxilo, que son cercanos a 1 (entre 0.99-0.96), demuestran la buena

calidad de los modelos obtenidos. Asimismo, los coeficientes de determinación para las

muestras de validación se alejan más de 1 que los coeficientes de determinación de las

de calibración, pero no obstante son correctos (0.96-0.85). El reducido número de

muestras disponibles para verificar la capacidad predictiva del modelo del índice de


101

ácido de la 3ª etapa unido al estrecho rango de IA que cubre hace inadecuado este

criterio de calidad de las predicciones y este se evalúa mediante un ensayo t de las

diferencias. La tabla 5.3, muestra los tests-t (con un nivel de significación del 95%) de

los residuales de calibración y predicción que demuestran que para los cinco modelos

PLS no había diferencias significativas entre los resultados obtenidos por NIR y los

valores de referencia.

Tabla 5.3 Test t de residuales (p = 0.05) para las muestras de calibración y predicción.

Parámetro Etapa Conjunto de muestras

Nº de muestras Promedio S.D. texp tcrit

Calibración 19 0.00 0.31 0.00 2.08 1

Predicción 23 -0.51 0.38 0.28 2.07

Calibración 22 0.00 0.36 0.00 2.08 2

Predicción 28 0.16 0.66 0.05 2.05

Calibración 16 0.00 0.12 0.00 2.13

IA

3 Predicción 6 -0.27 0.39 0.29 2.57

Calibración 46 0.00 0.75 0.00 2.01 1

Predicción 27 -0.27 0.59 0.08 2.05

Calibración 49 0.00 0.64 0.00 2.01 IOH neto

2+3 Predicción 40 0.28 0.98 0.05 2.02

Transferencia de espectros/modelos

Los modelos se han construido con espectros registrados con el equipo Perkin-Elmer y

posteriormente a la construcción de los modelos se adquirió, un equipo NIR Bruker

MPA, que presenta características similares a las del equipo Perkin-Elmer. Las ligeras

diferencias entre los espectros de las muestras registradas en ambos equipos impiden

utilizar los modelos creados en el nuevo instrumento. Los espectros registrados con el

equipo Bruker presentan un desplazamiento del valor de absorbancia y un espaciado

distinto entre valores de número de onda.

Con el objeto de no tener que rehacer todos los modelos se utiliza una transformación

de espectros, Piecewise Direct Standardisation, desde una aplicación contenida en el

software OPUS de Bruker, en que los espectros del equipo Perkin-Elmer (equipo


102

maestro) se transforman en espectros equivalentes a los registrados por el equipo

Bruker (equipo esclavo).

Para ello es necesario registrar un cierto número de muestras con ambos equipos. Las

muestras que se utilizaran para la transformación de los espectros han sido

seleccionadas con el algoritmo de Kennard y Stone.

Se ha considerado que 20 muestras es un número adecuado para realizar una correcta

transformación de espectros. En la figura 5.4 se muestra un espectro registrado con el

equipo Perkin-Elmer, un espectro Perkin Elmer transferido y un espectro registrado

con el equipo Bruker; puede observarse que los espectros Perkin-Elmer transferidos

presentan una gran similitud con los de Bruker.

Figura 5.4. Espectros NIR registrados en los instrumentos Perkin-Elmer, Bruker instruments,

y un espectro transferido.

En la tabla 5.4 se muestran los valores de correlación entre espectros Perkin

transferidos, espectros registrados con el equipo Perkin-Elmer y espectros registrados

con el equipo Bruker de unas pocas muestras representativas del proceso que


103

corroborarán el grado de semejanza entre espectros. Las correlaciones entre los

espectros Perkin-Elmer los Bruker inferiores, alrededor de 0.91-0.92, lo que muestra

una poca semejanza entre los espectros de las mismas muestras registrados con ambos

equipos.

Tabla 5.4. Tabla de coeficientes de correlación entre espectros en absorbancia Perkin Elmer

transferidos, espectros registrados con el equipo Perkin-Elmer y espectros registrados con el

equipo Bruker.

Número de muestra 1 2 3 4 5 6 7

Correlación Perkin-Elmer vs.

Bruker 0.9165 0.9114 0.9124 0.9148 0.9107 0.9100 0.9080

Correlación Perkin-Elmer transferidos

vs. Bruker 0.9998 1.0000 1.0000 0.9991 1.0000 0.9999 0.9997

Correlación Perkin-Elmer originales vs.

transferidos 0.9165 0.9110 0.9124 0.9126 0.9101 0.9138 0.9080

Se observan unos coeficientes de correlación prácticamente iguales a 1 para espectros

Perkin-Elmer transferidos y Bruker, lo que confirma lo observado en la figura 5.4, una

gran similitud entre los espectros transferidos con el algoritmo PDS y los registrados

con el equipo Bruker.

Una vez creado el conjunto de transferencia con el algoritmo PDS, este se aplica para

transferir tanto a los espectros Perkin-Elmer que se utilizaran para construir el modelo

de calibración como a los espectros que se utilizaran para la validación del modelo.

Para la construcción de los nuevos modelos se utilizan las mismas condiciones de los

modelos originales, tanto pretratamientos espectrales y rango de números de onda

como el número de factores, y el nuevo modelo construido se aplica para predecir, tanto

los espectros transferidos del conjunto de validación del modelo original como


104

espectros registrados con el equipo Bruker, para ver la calidad de los modelos después

de la transferencia de espectros.

En la tabla 5.5 se muestran los valores de error (RSEC y RSEP para índice de ácido e

índice de hidroxilo) de los modelos originales (construidos con espectros Perkin-Elmer)

y los modelos construidos con espectros transferidos. Se muestran también los valores

de RSEP de un conjunto de muestras independiente registrado con el equipo Bruker

(equipo esclavo) calculados con los modelos creados con espectros Perkin-Elmer

transferidos.

Tabla 5.5. Comparativa entre los modelos construidos con espectros originales de la Etapa 1 y

los obtenidos con espectros transferidos.

Parámetro Modelo con espectros Perkin-Elmer originales

Modelo con espectros Perkin-Elmer transferidos

Varianza explicada Y %

RSEC% RSEP% Varianza explicada Y %

RSEC% RSEP% RSEP% Muestras Bruker

IA 98.27 2.82 2.39 92.32 3.20 3.12 4.33 (n=53)

IOH net 98.18 2.82 2.39 97.78 3.11 4.08 4.37 (n=88)

Se observa que tanto para IA como para IOH los errores de predicción en los modelos

creados con espectros Perkin-Elmer transferidos, son ligeramente más elevados que en

los modelos originales para IA, y en torno a 1.5% más elevados para IOH.

La varianza que explican los modelos construidos con espectros Perkin-Elmer

transferidos, es inferior a la explicada por los modelos originales (97.34% vs. 92.32%)

para IA y sólo ligeramente inferior (98.18% vs. 97.78%) para IOH.

El valor de RSEP para las muestras Bruker es ligeramente superior que para muestras

Perkin-Elmer transferidas (3.82% vs. 4.33%) para IA y (3.82% vs. 4.33%) para IA. Sin


105

embargo, los resultados de la aplicación del nuevo modelo están dentro de la

especificación aceptada para los mismos.

Con el objeto de intentar mejorar la predicción de nuevas muestras, se han construido

nuevos modelos con los espectros transferidos, utilizando las mismas muestras que en

los modelos originales y ensayando distintos rangos y pretratamientos espectrales

(SNV y primera derivada). Con ellos se predecirá tanto los espectros transferidos del

conjunto de validación del modelo original, como espectros registrados con el equipo

Bruker.

La tabla 5.6 resume las características de cada modelo y muestra los errores de

calibración y de predicción de los modelos. La mejoría obtenida respecto a los modelos

obtenidos con los espectros transferidos, reproduciendo las condiciones del modelo

original, no es muy significativa (en el mejor de los casos, para IA esta no llega al 1%),

sin embargo el modelo del índice de hidroxilo es más simple (3 factores frente a 4 que

tenía el modelo original).

Tabla 5.6. Características de los modelos de calibración realizados con espectros Perkin-Elmer

transferidos de las resinas de la etapa 1 para mejorar los modelos originales .

Parámetro Pretratamiento espectral

Rango espectral (cm-1)

Factores PLS

Varianza Y explicada %

RSEC%

RSEP%

RSEP% Muestras Bruker

IA 1ª Derivada

6550-5316 5206-4970 4926-4578 4418-4204

4 97.24 1.92 2.74 3.27

IOH net 1ª Derivada 5352-4600 3 98.55 2.75 3.98 4.10

La tabla 5.7 muestra las figuras de mérito de los modelos transferidos que demuestran

la no existencia de errores sistemáticos en las nuevas predicciones: los valores de

pendiente y ordenada al origen para tanto de las rectas de calibración como para las de

predicción son próximos a 1 y 0 respectivamente, conteniendo estos dos valores en sus

intervalos de confianza.


106

Tabla 5.7. Figuras de mérito de la calibración y predicción de los modelos de calibración

realizados con espectros de la etapa 1 Perkin-Elmer transferidos.

Parámetro Conjunto de muestras

Nº de muestras

Rango del parámetro (mg KOH/g)

Pendiente Ordenada al origen

R2

Calibración 19 13.6 - 22.0 0.97±0.08 0.48±1.47 0.97

Predicción 23 14.9 - 19.3 1.05±0.17 -1.08±3.06 0.88 IA Predicción Bruker

53 13.6 - 22.0 0.92±0.09 1.35±1.63 0.88

Calibración 46 16.1 - 36.0 0.98±0.04 0.45±1.07 0.98

Predicción 27 19.4 - 34.4 1.07±0.10 -1.51±2.80 0.95 IOH neto Predicción Bruker

88 16.1 - 36.0 1.08±0.09 -1.17±2.06 0.97

Como se puede observar comparando los valores de RSEP de los modelos para índice

de ácido e hidroxilo (tablas 5.5 y 5.7), la mejora de los modelos respecto a los modelos

con los rangos espectrales y pretratamiento espectral original, pero construido con los

espectros transferidos, no es significativa. Esto corrobora que la confección de modelos

nuevos para la mejora de las predicciones de los modelos originales con espectros

transferidos no es necesaria.


107

5.1.2 DETERMINACIÓN DE API DE UN FÁRMACO MEDIANTE

CALIBRACIÓN UNIVARIANTE

El objetivo del presente trabajo es explorar la construcción de un modelo de calibración

univariante de aplicabilidad general en muestras farmacéuticas de las diferentes etapas

del proceso de fabricación (comprimidos sin recubrir, comprimidos lacados y mezclas

granuladas), mediante la aplicación del coeficiente de correlación como variable

predictora. El método se basa en el calculo del coeficiente de correlación entre los

espectros de mezclas de tipo sintético, preparadas en el laboratorio por pesada, de

composición conocida de los componentes de la formulación farmacéutica, y el espectro

del API puro; a continuación se calcula la ecuación de regresión por mínimos

cuadrados entre los coeficientes de correlación calculados y la concentración de API.

Para realizar la determinación de una muestra desconocida se calcula el coeficiente de

correlación de su espectro con el del API puro y este valor se interpola en la recta

definida anteriormente.

El cálculo del coeficiente de correlación entre espectros se puede realizar con los

espectros en sus diferentes modos: absorbancia, SNV, derivadas, etc.

En la figura 5.5 se muestran los espectros en absorbancia (a) y en 2ª derivada (b) de

una muestra de granulado y del API.

Para obtener una recta de calibración con adecuada capacidad predictiva es necesario

que el valor del coeficiente de correlación entre las muestras con concentraciones

extremas sea lo más amplio posible ya que un amplio rango de valores de CC nos

permitirá distinguir entre concentraciones semejantes.

Se ensayaron diferentes pretratamientos espectrales y se calcularon los CC entre los

espectros de las muestras de concentraciones extremas y el API.


108

Figura 5.5. Espectros de muestras de producción (granulada y comprimidos lacados y no

lacados) y el espectro del API en absorbancia (a) y segunda derivada (b)

La tabla 5.8 muestra los intervalos de coeficientes de correlación obtenidos con los

diferentes pretratamientos. La gran semejanza entre los espectros de las muestras y el

API explica el elevado coeficiente de correlación en modo absorbancia (r = 0.920). Sin

embargo, la aplicación de derivadas produce una disminución del valor del CC y un

aumento significativo de las diferencias de CC entre los espectros de las muestras

extremas. Como resultado del estudio se seleccionó el modo de 2ª derivada para

calcular el CC.


109

Tabla 5.8. Rango de coeficiente de correlación entre la muestra con una mayor y menor

concentración de API.

Pretratamiento Rango de coeficiente de correlación Diferencia

Absorbancia 0.904-0.920 0.016

SNV 0.904-0.920 0.016

1ª Derivada 0.136-0.245 0.109

2ª Derivada 0.228-0.369 0.141

También se ensayo la búsqueda de un intervalo espectral en que aumentará el intervalo

del CC, pero no se encontró ninguno que mejorara los resultados de la utilización del

espectro completo.

En consecuencia se seleccionó el rango completo de longitudes de onda y el modo

espectral de 2ª derivada como los más adecuados tratamientos para construir el

modelo de calibración.

Se prepararon 15 muestras que cubren el rango de concentraciones de API de 73.7–

123.2 mg/g para construir por mínimos cuadrados el modelo de calibración. Este rango

de concentraciones corresponde a ± 20% del valor etiquetado de API en el preparado y

es lo suficientemente amplio para poder realizar la determinación de uniformidad de

contenido (los valores deben estar comprendidos en ± 15% del valor etiquetado) con el

modelo desarrollado.

El espectro NIR de las muestras se ha obtenido registrándolas por triplicado, colocando

una alícuota de la muestra en una cubeta de cuarzo y removiendo la muestra entre

registros sucesivos.

En la tabla 5.9 se dan los parámetros más relevantes del modelo de regresión obtenido:

pendiente y ordenada al origen con sus intervalos de confianza, coeficiente de

determinación, etc.


110

Tabla 5.9. Figuras de mérito del modelo de calibración.

Dado que disponemos de los espectros triplicados de cada muestra, se ha realizado un

ANOVA de la recta de regresión para comprobar el modelo lineal propuesto; en la tabla

5.9 se dan también los resultados de este análisis que indica que el modelo lineal es

válido.

Se ha estudiado la capacidad predictiva del modelo construido con la predicción de

muestras procedentes de las diferentes etapas del proceso de fabricación: comprimidos

sin recubrir, comprimidos lacados y mezclas granuladas.

Un gráfico de residuales (figura 5.6) muestra valores aceptables y distribuidos

aleatoriamente lo que indica la ausencia de un error sistemático en el mismo.

Modelo de calibración

Pretratamiento 2ª Derivada S-G

Rango espectral (nm) 1110-2490

Rango de concentraciones (mg/g) 73.7–123.2

Muestras de calibración 15

Ecuación (CC vs. concentración) CC=[(360±1)x10-5 x Conc. API] - (356±90) x10-4

RSEC 0.61

SSLOF SS PE SS REG SStotal

2.917E-04 3.778E-04 2.636 2.637

F exp F tab

ANOVA TEST LOF (falta de ajuste)

0.59 2.59


111

Figura 5.6. Gráfico de residuales absolutos de las muestras de predicción aplicando los

modelos univariable y PLS.

Los espectros de estas muestras son muy semejantes y las diferencias espectrales

debidas al scattering se reducen aún más en los espectros de 2ª derivada; la predicción

de estas muestras con el modelo desarrollado muestra que los resultados no son

significativamente distintos de los valores de referencia.

En la tabla 5.10 se muestran los parámetros de la predicción de este tipo de muestras y

en la figura 5.6 se muestran los residuales de las predicciones frente al valor de

referencia determinado por espectrofotometría UV. Este estudio indica que la calidad

de los resultados es adecuada (valores de RSEP inferiores al 2%) para utilizar el modelo

en el control del proceso de fabricación y que el modelo está exento de error sistemático

(residuales aleatorios), por lo que podemos usarlo para monitorizar el proceso de

producción farmacéutica.


112

Tabla 5.10. Errores de predicción para distintos tipos de muestras usando los modelos de

calibración univariable y PLS. Test t de diferencias entre predicciones de ambos modelos.

Tipo de muestra

Granulado Comprimidos sin recubrir

Comprimidos lacados

Nº Muestras

8 10 13

Rango de API (mg/g)

79.0 – 110.0 90.7 – 92.9 90.4 – 93.5

C.C. PLS C.C. PLS C.C. PLS RSEP (%) 1.08 1.56 1.91 1.57 1.43 0.91

Test t (n =31)

t tab t exp

2.03 1.98

En un estudio anterior se han desarrollado modelos de calibración PLS para este

mismo preparado y se demostró que eran necesarios modelos distintos para la correcta

predicción de cada tipo de muestra [94].

Las mismas muestras, de los mismos tipos, se predijeron con modelos PLS construidos

previamente para cada tipo de muestra; en la tabla 5.10 se muestran los valores de

RSEP correspondientes a la aplicación de estos modelos y en la figura 5.6 se muestran

los residuales obtenidos en la predicción de las muestras de validación. Los resultados

indican que las predicciones y los residuales obtenidos por aplicación del modelo

univariante no son significativamente distintos de los obtenidos en los modelos

multivariables como lo demuestra un test t realizado a los residuales entre los métodos;

esto indica que el modelo univariable es una alternativa adecuada a los modelos

multivariables en la predicción de muestras del proceso, por lo que se han obtenido

buenos parámetros de predicción con el uso de un único modelo univariante en lugar

de 3 modelos multivariantes.

[94] API Determination by NIRS Across Pharmaceutical Production Process. Blanco M, Bautista M, Alcalà M (2008) AAPS Pharm Sci Technol. Vol. 9, No. 4


113

5.2 ESTUDIO MEDIANTE NIR-CI DE MUESTRAS

FARMACÉUTICAS

El desarrollo en los últimos años de las técnicas de imagen que son capaces de

proporcionar una mayor información de las muestras, ha llevado a su introducción en

el campo farmacéutico con el objetivo de completar la información que no puede

obtenerse mediante el NIR convencional.

La elevada cantidad de información que proporcionan las imágenes hiperespectrales (1

espectro cada píxel) permite obtener más de 80000 espectros por cada imagen y se

requieren herramientas quimiométricas adecuadas que permitan tratar tal cantidad de

datos para extraer la información relevante.

Los objetivos propuestos en este estudio son la determinación de la concentración de

cada analito en cada píxel que nos permitirá, además de calcular la concentración

media de la muestra, visualizar mediante un mapa de concentraciones la distribución

de los analitos en la muestra .

Para que estas técnicas sean aplicables en un laboratorio de control es fundamental

disponer de algoritmos matemáticos eficientes y rápidos para tratar la enorme cantidad

de datos que aportan y por tanto seleccionar los más adecuados a cada una de las

diferentes situaciones que exige el análisis farmacéutico es imprescindible para su

aplicación en rutina.

En este estudio se han ensayado los algoritmos Isys-PLS1, PLS1, y MCR-ALS.

Para cuantificar mediante PLS1 es necesario disponer de un conjunto de muestras de

calibración de concentración conocida, establecida generalmente por la aplicación de

un método de referencia. Así y todo, no se conoce la concentración de los analitos en

cada píxel de la imagen, por lo que la calibración debería realizarse a partir del valor

promedio de la imagen. Estas limitaciones reducen su aplicabilidad a algunas

situaciones concretas.


114

Isys-PLS1 y MCR-ALS, en cambio, no requieren datos de concentración previos para

realizar la calibración, ni conocer la concentración en cada píxel. Requieren, sin

embargo, de los espectros puros de los analitos para la construcción de los modelos.

En un primer estudio se realiza la aplicación de MCR-ALS a la resolución de imágenes

hiperespectrales de comprimidos comerciales de ácido acetilsalicílico (ASA).

Posteriormente, se compara este algoritmo con el Isys-PLS1 en su aplicación a la

determinación de API en comprimidos comerciales de ASA. En un último trabajo se

estudia la aplicación de Isys-PLS1 a la cuantificación de API y excipientes en

comprimidos de un preparado farmacéutico en fase de estudio.

5.2.1 APLICACIÓN DEL ALGORITMO MCR-ALS AL ANÁLISIS DE

IMÁGENES DE COMPRIMIDOS COMERCIALES DE ÁCIDO

ACETILSALICÍLICO (ASA)

MCR-ALS es un algoritmo iterativo, que ha sido aplicado con éxito para la

monitorización de reacciones químicas y bioquímicas, en datos medioambientales y

hasta en datos de proteómica.

En el estudio realizado se pretendía demostrar la aplicabilidad de MCR-ALS y su

versión aumentada para obtener información cuantitativa de calidad de imágenes

hiperespectrales de muestras farmacéuticas comerciales.

La composición de las formulaciones de los comprimidos es desconocida, y la única

información que se dispone es la incluida en las cajas de los comprimidos o en la guía

Vademecum. En la tabla 5.11 se muestran los nombres comerciales y las principales

características de cada uno de los comprimidos.


115

Tabla 5.11. Descripción de los 10 comprimidos comerciales analizados de ASA.

Marca comercial

Cont. nominal de ASA (mg)

Diámetro (mm)

Peso del comprimido

(g)

Concentración calculada (%)

Excipiente mayoritario

A.A.S 100 100 8.2 0.227 44.13 Manitol

A.A.S 500 500 13.4 0.864 57.88 Manitol

Bayer 500 500 12.0 0.609 82.06 MCC

Adiro 100 100 7.2 0.135 73.86 MCC

Adiro 300 300 10.2 0.409 73.28 MCC

Aspirina C* 400 25.8 3.235 12.37 --

Dolmen* 500 24.2 3.399 14.71 --

Aspirine Nicholas

500 12.0 0.624 80.13 MCC

Bioplak 250 250 7.0 0.348 71.84 MCC

Bioplak 125 125 10.0 0.173 72.09 MCC

La celulosa microcristalina (MCC) es el excipiente mayoritario en 6 de los

comprimidos, mientras que el manitol es el excipiente mayoritario en otros 2

comprimidos. Los comprimidos de Dolmen y Aspirina C son comprimidos

efervescentes y contienen acido ascórbico también como principio activo y otros

excipientes como ácido cítrico y carbonato y bicarbonato de sodio anhidros.

En la Figura 5.7, se muestran los espectros de los diferentes comprimidos comerciales

de ASA ensayados en este estudio. Se observan diferencias importantes entre los

espectros como ya puede esperarse por diferente composición; sin embargo, se puede

observar la banda espectral de ASA (alrededor de 1680 nm) en todos los espectros.


116

Figura 5.7. Espectro promedio de un comprimido de cada marca comercial después de aplicar

SNV.

Nota: Los espectros han sido desplazados para evitar la superposición y observar mejor las

diferencias.

En esta figura se puede observar como los comprimidos de AAS, Adiro, y Bioplak,

presentan espectros muy similares entre sus diferentes dosificaciones, lo que indica una

composición muy semejante de ambas formulaciones, pero existen diferencias

significativas entre los espectros de comprimidos de marcas distintas lo que se explica

por las diferencias en la formulación.

Por otro lado Dolmen y Aspirina C tienen perfiles espectrales muy similares entre ellos,

a pesar que provienen de diferentes fabricantes y a la vez muy distintos del resto;

ambos son comprimidos efervescentes y presentan espectros muy semejantes y a la vez

muy diferentes a los del resto de marcas.

Longitud de onda

Inte

nsid

ad

Longitud de onda

Inte

nsid

ad


117

El algoritmo MCR, descompone la matriz desdoblada (D) mediante la metodología

iterativa de Mínimos Cuadrados Alternados (ALS), en un producto de dos matrices

perfiles de concentración (C ) y perfiles espectrales de cada componente (S),

permitiendo con el perfil de concentración obtener mapas de concentración de las

imágenes hiperespectrales estudiadas.

Antes de empezar las iteraciones, para facilitar la descomposición se pueden introducir

estimaciones iniciales al algoritmo. El uso de espectros de los componentes puros que

componen la muestra (siempre que se disponga de ellos) como estimaciones iniciales es

una forma de introducir información de la muestra al algoritmo.

El algoritmo finaliza las iteraciones cuando la diferencia entre los valores de falta de

ajuste (% Lack of Fit (%LOF)) de dos iteraciones sucesivas es menor de un valor que

prefijamos previamente (criterio de convergencia que por defecto el software fija a 0.1).

N

nmn

M

m

N

nmn

M

m

x

exLOF

2

2

100%

(30)

Donde 2mne y 2

mnx representan a cada píxel de la imagen el valor de los residuales y del

cubo de datos respectivamente.

Pero la solución obtenida tras la descomposición no única, ya que se pueden obtener

una gran número de combinaciones de C y S, que multiplicadas entre sí permitan

obtener la misma matriz D. Estas ambigüedades, pueden ser corregidas mediante la

aplicación restricciones en el cálculo, para evitar soluciones ilógicas experimentalmente

aunque lógicas matemáticamente. Las restricciones usadas de forma más frecuente en

MCR-ALS son: 1) no negatividad de concentraciones y/o espectros impone que los

espectros de la matriz de datos y/o perfiles de concentración de los componentes

tengan siempre valores positivos; 2) unimodalidad en la que se asume que los espectros

solamente presentan un único máximo; 3) con la restricción de closure se supone que


118

en cada píxel se debe cumplir un balance de masa de 1, representando la totalidad de la

concentración.

Tanto las restricciones como el funcionamiento del algoritmo están más

detalladamente explicados en el capítulo de quimiometría de esta tesis.

En la aplicación de MCR-ALS a los comprimidos de acido acetilsalicílico, se incluyeron

los espectros puros de los componentes mayoritarios como estimaciones iniciales y se

ha usado la misma metodología cuando se ha aplicado la versión aumentada de MCR-

ALS, donde para mejorar la descomposición de la matriz, se han incluido 10 espectros

de ambos analitos (ASA y excipiente mayoritario) a la matriz de datos desdoblada. Se

aplicaron las restricciones de no negatividad para los perfiles de concentración y de

closure para el principio activo (ASA) y para el excipiente mayoritario (MCC o manitol)

en 8 de los 10 comprimidos y a la formulación completa para Dolmen y Aspirina C.

Se han ensayado varios pretratamientos espectrales para ver el que mejor predecía la

concentración de ASA en los diferentes comprimidos y mejor descomposición del cubo

de datos desdoblado obtenía. La combinación de SNV y smoothing con un tamaño de

ventana de 7 puntos son los pretratamientos que proporcionaron los mejores

resultados.

Para comprobar la correcta descomposición realizada por MCR-ALS, se ha usado el

%LOF y el coeficiente de correlación entre los perfiles espectrales obtenidos con los

espectros de los componentes puros.

A modo de ejemplo, el % LOF del modelo MCR-ALS aplicado a Aspirine Nicholas de

500 mg, ha sido del 2.79%, explicando el 99% de la varianza, siendo parámetros

indicativos de la bondad del modelo calculado.

Si se compara el valor obtenido y el porcentaje de formulación (77.5% para ASA,

mientras que el valor teórico es el 80.1%), se puede considerar la cuantificación de este

comprimido como buena. Sin embargo, el coeficiente de correlación entre el perfil


119

espectral obtenido para ASA y MMC con el espectro puro es lejano a 1, el valor optimo

(0.76 y 0.51 respectivamente).

Para mejorar la descomposición de la matriz desdoblada, se aplicó la versión

aumentada de MCR-ALS. El aumento se realiza incluyendo información selectiva (10

puros espectros) para cada componente de la imagen. Se aplicaron los mismos

pretratamientos y restricciones que para aplicación de MCR-ALS sin aumento de la

matriz desdoblada.

Los resultados obtenidos con MCR-ALS aumentando la matriz desdoblada mostraron

valores bastante similares de % LOF (3.55) y varianza explicada (99.87%), y

proporcionaron también buenos resultados en el análisis cuantitativo (ver tabla 5.12).

Como puede observarse en la figura 5.8 a y b, los perfiles espectrales que se obtienen

aumentando la matriz desdoblada, tienen un perfil perfectamente coincidente con los

espectros puros de cada compuesto. Esto queda corroborado con el coeficiente de

correlación entre los perfiles espectrales y los espectros puros de ASA y MCC que se

muestran en la tabla 5.12 ya que ambos son cercanos a 1.

En la figura 5.8 c se muestra el mapa de concentración para ASA obtenido a partir de la

matriz desdoblada aumentada, donde se muestra la distribución de ASA en la superficie

del comprimido. A primera vista, viendo el mapa de colores correspondientes al

principio activo (ASA), parece que éste no está bien distribuido en la superficie del

comprimido, sin embargo observando la escala de color de la imagen, ésta muestra un

rango estrecho de entre 0.70 y 0.78. Por lo tanto, el contenido de ASA en cada píxel de

la imagen, es similar, quedando reafirmado en el estrecho histograma del mapa de

concentraciones (figura 5.8 d), que presenta una distribución cercana a una

distribución gaussiana.


120

Figura 5.8. Resultados para MCR-ALS aumentado de un comprimido comercial (Aspirine

Nicholas 500). a) Perfiles espectrales para ASA; b) Perfiles espectrales para MMC; c) Mapa de

concentración para ASA; d) Histograma de concentraciones de ASA.

Resultados para todos los comprimidos comerciales

Tras el análisis del comprimido de Aspirine Nicholas de 500 mg. se han analizado los 9

comprimidos restantes. En la tabla 5.12 se muestran los resultados de la cuantificación

de ASA mediante MCR-ALS de todos los comprimidos comerciales. La concentración

de ASA en la superficie de los distintos comprimidos, es similar al valor teórico

confirmando la bondad del análisis cuantitativo. Se obtuvieron buenos resultados para

la mayoría de muestras (la correlación espectral entre espectro puro de ASA y el perfil

espectral calculado para ASA en todas las muestras fue cercano a 1, confirmando la

bondad de la aplicación de MCR-ALS aumentado).

Sin embargo, con los comprimidos que contienen Manitol como excipiente mayoritario,

no se obtienen tan buenos resultados en la determinación del contenido de ASA.


121

Mirando los valores del coeficiente de correlación entre espectro puro y perfil espectral,

se observa que para Manitol estos no son tan cercanos a 1 como para MCC. La causa

de esto podría ser la influencia de otro excipiente con una alta relevancia espectral, éste

proporciona información a la imagen, evitando la correcta descomposición los datos.

Tabla 5.12. Resultados obtenidos para 10 tipos de comprimidos comerciales usando MCR-

ALS.

Comprimido Concentración

nominal (%)

Concentración obtenida con MCR-ALS (%)

Residual (%)

Correlación ASA

Correlación MCC

Correlación Manitol

A.A.S 100 44.13 53.32 9.19 0.984 -- 0.946

A.A.S 500 57.88 54.87 -3.01 0.966 -- 0.926

Bayer 500 82.06 81.57 -0.49 0.988 0.998 --

Adiro 100 73.86 76.47 2.61 0.948 0.994 --

Adiro 300 73.28 70.91 -2.37 0.949 0.977 --

Aspirina C* 12.37 12.95 0.58 0.97 -- --

Dolmen* 14.71 16.44 1.73 0.951 -- --

Aspirine Nicholas

80.13 76.96 -3.17 0.963 0.997 --

Bioplak 250 71.84 71.34 -0.5 0.993 0.997 --

Bioplak 125 72.09 67.84 -4.25 0.986 0.994 --

Por otro lado, se podría esperar que en las muestras, de menor concentración de ASA

(comprimidos efervescentes) presentaran unos peores resultados predictivos. Pero el

uso de todos los espectros puros, tanto en estimaciones iniciales como aumentando la

matriz desdoblada de datos, permitió la obtención de muy buenos resultados.

Al haberse aplicado la restricción de closure y que en estas muestras el principio activo

no es el compuesto espectral más relevante, la descomposición de la imagen podría no

haber sido satisfactoria.

A pesar de utilizar los espectros puros de todos los componentes en el análisis de

Dolmen y Aspirina C, los valores del coeficiente de correlación entre perfil espectral y

espectro puro, no fueron tan buenos, y en algún caso se alejan bastante de 1. Para

Aspirina C los coeficientes de correlación obtenidos fueron 0.97 para ASA, 0.851 para

ácido cítrico, 0.957 de ácido ascórbico y 0.995 para carbonato. Para Dolmen los


122

coeficientes obtenidos fueron 0.951 para ASA, 0.856 para el ácido ascórbico y 0.823

para carbonato. Sin embargo, a pesar no obtener unos buenos coeficientes de

correlación, la predicción de la concentración de ASA para dichos comprimidos es

buena, con valores cercanos a los nominales.

Los mapas de concentración para ASA de todas las marcas comerciales se muestran en

la figura 5.9. Como se ha descrito anteriormente para Aspirine de Nicholas 500 mg, la

primera impresión de estos mapas, podría ser engañosa, debido a la escala de color de

éstos.

Figura 5.9. Mapas de concentración de ASA obtenidos usando MCR-ALS aumentado.

Para una mejor interpretación de los mapas de concentración, se ha representado el

histograma de cada mapa de concentración de ASA en la figura 5.10. Idealmente, se

esperaría un histograma cuyos valores fueron alrededor de los valores de predicción y


123

con una variación estrecha, lo que implica que todos los píxeles de la imagen contienen

una cantidad de ASA muy próxima entre ellos.

Figura 5.10. Histogramas de la distribución de ASA en la superficie de los diferentes

comprimidos.

Mirando los histogramas de forma detenida, es posible visualizar los comprimidos con

una mejor distribución de ASA. Los comprimidos con una distribución de ASA más

estrecha son: Aspirina C, Dolmen, Bayer 500 (de acuerdo a la conclusión de la

anterior). Si se comparan a éstas 3 muestras, los histogramas de AAS 100 y 500

presentan la variación de concentración más amplia, a pesar de ello, la distribución de

principio activo, esta cerca de una distribución normal. Para las otras muestras, tanto la

inspección visual de los mapas de concentración como la representación de

histogramas confirman una distribución regular para la ASA en la superficie.


124

5.2.2 ESTUDIO DE UNIFORMIDAD DE CONTENIDO EN COMPRIMIDOS

COMERCIALES DE ÁCIDO ACETILSALICÍLICO (ASA)

Se ha ampliado el estudio sobre los comprimidos comerciales de aspirina,

determinando el contenido de ASA a través del registro de 10 comprimidos en una

única imagen, para determinar otros parámetros como la homogeneidad de contenido

o el valor medio de lote.

Como ya se ha indicado en el estudio anterior, se desconoce la composición completa de

la formulación de los comprimidos usados, la única información que se ha usado en el

estudio ha sido la obtenida en la guía Vademecum. En dicha guía se indica que el

excipiente mayoritario en los cuatro casos es la celulosa microcristalina.

En la tabla 5.13 se recogen las principales características de cada tipo de comprimidos.

Tabla 5.13. Descripción de los 4 tipos de comprimidos comerciales de ASA analizados.

Marca comercial

Cont. nominal

(mg)

Diámetro (mm)

Peso promedio del comprimido

(g) *

Concentración calculada

(%)*

Excipiente mayoritario

Bayer 500 500 12.0 0.6037 82.82

Adiro 100 100 7.2 0.1368 73.13

Bioplak 250 250 7.0 0.3427 73.02

Bioplak 125 125 10.0 0.1751 71.41

MCC

* 10 comprimidos por marca comercial

A cada una de las diferentes imágenes de los comprimidos se le han aplicado los

algoritmos de calibración MCR-ALS y Isys-PLS1 (indicados en la introducción)

considerando las características de las muestras y la información disponible. Se han

obtenido las imágenes de ASA y MCC en polvo con la misma cámara y estos espectros

se han tomado como estimaciones iniciales en los dos algoritmos de cálculo usados. Se

han ensayados diferentes pretratamientos espectrales, siendo la combinación de SNV y

Savitzky-Golay smoothing con una ventana de 7 puntos es con el que se obtienen los

mejores resultados para ambos algoritmos.


125

La cuantificación de API se ha realizado de dos formas distintas: Aplicando los

algoritmos cuantitativos a la imagen completa de 10 comprimidos (determinación de

valor medio de lote) o seleccionando la parte de la imagen correspondiente a cada

comprimido individual (estudio de la uniformidad de contenido).

La estructura de las imágenes se muestra en la figura 5.11, con 10 comprimidos

distribuidos espacialmente; la imagen hiperespectral contiene también tanto los

espectros de los comprimidos como el espectro del fondo. Este fondo puede afectar al

cálculo de las concentraciones y por ello se ha procedido a su eliminación. La

eliminación del fondo se realiza con el software Isys 5.0 que deja la imagen lista para la

aplicación de Isys-PLS1. Para la aplicación de MCR-ALS es necesario obtener primero

la matriz desdoblada de la imagen hiperespectral únicamente de los espectros de los

comprimidos, mediante la aplicación de una rutina de Matlab [95].

En los cálculos con el algoritmo MCR-ALS se han aplicado las restricciones de no

negatividad en la concentración y de closure. A pesar de que los comprimidos están

constituidos por diferentes componentes, la restricción de closure ha sido aplicada

considerando únicamente los componentes API (ASA) y el excipiente mayoritario

(MCC). No se ha obtenido un buen ajuste con la matriz desdoblada original por lo que

se ha aumentado con 50 espectros de ambos analitos, ASA y MCC; con ello se ha

obtenido un mejor ajuste y una determinación exacta de los dos componentes.

Para aplicar Isys-PLS1, a las imágenes hiperespectrales, ha creado una librería de

espectros con las imágenes de ASA y MCC puros, seleccionando el área central de cada

una de las imágenes que contiene aproximadamente 100x100 píxeles. Con esta librería

se crea el modelo Isys-PLS1, usando diferente número de factores PLS, entre 4 y 8

factores dependiendo del analito a cuantificar, y posteriormente el modelo construido

se aplica a las imágenes hiperespectrales. Se obtienen mapas de concentración donde la

[95] http://www.models.life.ku.dk/~jose/


126

intensidad de cada píxel, se determina por el grado de semejanza (escalado de 0 a 1)

entre el espectro de ese píxel y los espectros de referencia. Un valor de 0 significa que el

componente no esta presente y un valor de puntuación de 1 significa que el componente

esta presente al 100 % en dicho píxel. Para las imágenes presentadas, el color rojo

significa una mayor concentración de componente.

Después de aplicar estos algoritmos, se ha calculado el valor medio de 10 comprimidos

de un lote: los valores obtenidos aplicando los dos algoritmos se muestran en la tabla

5.13. Los valores medios calculados con Isys-PLS1 y MCR-ALS dan resultados muy

similares a pesar de que para MCR-ALS son ligeramente más cercanos a los valores

nominales. Sólo los valores calculados para Bioplak 125 muestran discrepancias, pero

éstas no superan el 2%.

Tabla 5.13. Resultados de cuantificación de valor medio de ASA de una imagen de un lote de 10

comprimidos para MCR-ALS y Isys-PLS1.

Comprimidos Concentración nominal (%)

Valor medio de lote con

Isys-PLS1

Valor medio de lote con

MCR-ALS

Bayer 500 82.8 83.6 82.7

Adiro 100 73.1 73.5 73.9

Bioplak 250 73.0 73.8 72.7

Bioplak 125 71.4 73.4 69.4

Una alternativa para determinar la concentración es mediante el análisis individual de

comprimidos cuyas concentraciones han sido calculadas seleccionando y recortando

cada una de los comprimidos y eliminando el fondo. La eliminación del fondo de cada

imagen recortada se ha echo de la misma forma que para el análisis global de 10

comprimidos, que se ha explicado anteriormente.

La aplicación de ambos modelos a comprimidos comerciales de las 4 marcas

comerciales distintas ha proporcionado resultados similares (ver tabla 5.14); no

obstante, los valores de rango de concentración calculados ─y sus respectivas

desviaciones estándar─ son más estrechos con Isys-PLS1 que con MCR-ALS.


127

Los valores promedio proporcionados por ambos algoritmos están dentro del

intervalo de confianza del valor nominal usado como referencia (± 5%).

El tamaño de los comprimidos es un parámetro importante para el enfoque de los 10

comprimidos en el campo visual de la cámara hiperespectral; tamaños de medida

distintos requieren distancia entre muestra y lentes distintas para obtener una imagen

correctamente enfocada. Esta configuración óptica puede afectar a la intensidad de la

luz incidente en los 10 comprimidos, pudiendo afectar a la calidad de las imágenes y

por consiguiente a su cuantificación.

Distribución de ASA y MCC en los comprimidos

En la figura 5.11 se muestra el mapa de concentración calculado con MCR-ALS para

ASA y MCC juntamente con los histogramas de un comprimido de aspirina Bayer 500,

tomado de la imagen de 10 comprimidos. Se observa una homogénea distribución de

ambos componentes en toda la imagen y no se aprecian en el comprimido zonas con

agregados de API o del excipiente mayoritario. Asimismo, los histogramas, tanto para

ASA como para MCC, muestran una muy estrecha distribución de los valores de

concentración y con un máximo en la distribución próximo al valor medio de

predicción; todos estos datos son indicativos de la homogénea distribución del ASA en

el comprimido.

Sin embargo, la figura muestra deficiencias en la distribución en los bordes de la

imagen, que se atribuyen a la deficiente iluminación de la muestra de 10 comprimidos,

y a su vez son el origen de una imagen hiperespectral deficiente con una mala

resolución en los contornos de los comprimidos cuando se aplican los algoritmos de

cuantificación.


128

Figura 5.11. Mapas de concentración y histogramas de ASA y MCC para un comprimido de una

imagen de 10 comprimidos.

Este efecto no se observa en las imágenes hiperespectrales de comprimidos

individuales, como muestra en la figura 5.12, obtenidas en mejores condiciones de

resolución e iluminación; este hecho es muy importante en las imágenes de 10

comprimidos grandes (comprimidos de Bayer 500 o Bioplak 250) menos importantes

en comprimidos pequeños(comprimidos de Adiro 100 o Bioplak 125).

Este fenómeno, se elimina mediante la utilización de un instrumento con una mejor

resolución espacial y una iluminación más homogénea del objeto.

Figura 5.12. Mapa de concentración y histograma de ASA para un comprimido registrado

individualmente.

Para Isys-PLS1, se han obtenido mapas de concentración, prácticamente idénticos a los

obtenidos con MCR-ALS, respecto a la distribución espacial de ASA y de MCC en el

50 150 250100 200 300

50

150

250

100

200

Píxeles

Píx

eles

84

80

76

82

78

86

50 150 250100 200 300

50

150

250

100

200

Píxeles

Píx

eles

84

80

76

82

78

86

55 65 7560 70 80 85 90 95

2500

1500

500

2000

1000

3000

Intensidad

Núm

ero

de P

íxel

es

55 65 7560 70 80 85 90 95

2500

1500

500

2000

1000

3000

Intensidad

Núm

ero

de P

íxel

es

50 150 250100 200 300

50

150

250

100

200

Píxeles

Píx

eles

84

80

76

82

78

86

50 150 250100 200 300

50

150

250

100

200

Píxeles

Píx

eles

84

80

76

82

78

86

55 65 7560 70 80 85 90 95

2500

1500

500

2000

1000

3000

Intensidad

Núm

ero

de P

íxel

es

55 65 7560 70 80 85 90 95

2500

1500

500

2000

1000

3000

Intensidad

Núm

ero

de P

íxel

es


129

comprimido y los histogramas presentan una distribución de valores muy estrecha y

con un máximo cercano al valor medio de predicción.

Uniformidad de contenido

El estudio de homogeneidad de contenido se ha realizado, siguiendo las normas de la

Farmacopea Europea, utilizando la imagen de los 10 comprimidos de cada marca

comercial.

Los resultados obtenidos en la determinación de cada comprimido aplicando MCR-ALS

y Isys-PLS1 de una misma marca se muestran en la tabla 5.14. En dicha tabla se

muestra para Isys PLS1 y MCR-ALS, el valor promedio de ASA de los 10 comprimidos

aplicando el algoritmo de calculo a cada comprimido individualmente, el rango de

valores de concentración calculados para los comprimidos individuales, la desviación

estándar de las concentraciones y el valor del Acceptance Value definido por la

farmacopea europea.

Tabla 5.14. Resultados de MCR-ALS para el test de uniformidad de contenido (10 comprimidos analizados individualmente).

Isys-PLS1 MCR-ALS

Marca comercial

Valor Medio

Rango de

valores

Desv. Estándar

Acceptance value

Valor Medio

Rango de

valores

Desv. Estándar

Acceptance value

Bayer 500 83.3 84.8-82.1 0.8 1.1 82.4 84.0-79.3 1.2 1.5

Adiro 100 73.5 77.1-70.3 2.0 2.6 72.6 75.6-68.1 2.9 5.1

Bioplak 250 73.7 76.1-71.2 1.9 4.7 72.7 77.9-68.7 3.3 2.3

Bioplak 125 72.6 74.9-69.4 2.2 8.8 69.7 74.7-67.2 2.3 13.5

El A.V. límite para n=10 es 15.

La European Pharmacopoeia para uniformidad de contenido, define un Acceptance

Value (AV) computado y comparado con un limite para el rango de aceptación [96]. El

AV se calcula aplicando la ecuación siguiente:

AV=|M − X |+k·s (31)

[96] European Council (Ed.), European Pharmacopeia 6th edition, 2008b. Uniformity of dosage units. Vol 1 (2008) Ch. 2.9.40, pp.327–330.


130

Donde M es el valor de referencia, X el valor medio de los comprimidos individuales, k

es una constante (k=2.4 para n=10) y s la desviación estándar.

El requisito de uniformidad contenido se cumple si el valor de AV de las 10 primeras

unidades de dosificación tomadas es igual o inferior a 15.

Los resultados obtenidos para 4 marcas se muestran en la tabla 5.14; todos los valores

de AV calculados son inferiores a 15 lo que indica el cumplimiento de los requisitos de

la farmacopea a pesar de que para Bioplak 125 las concentraciones calculadas con

MCR-ALS se obtiene un acceptance value (A.V.) un tanto elevado (13.5) aunque no

supera el valor limite de 15.

A pesar de obtenerse unos resultados ligeramente mejores usando Isys-PLS1, el estudio

realizado no es lo suficientemente amplio como para decir que algoritmo es mejor para

la cuantificación. Con ambos algoritmos, se obtienen unos resultados de similar valor

tanto en los valores de predicción, como en los valores de desviación estándar y de A.V.

Los resultados indican que una sola imagen puede usarse para certificar la

homogeneidad de contenido de un lote.


131

5.2.3 ESTUDIO CUANTITATIVO Y DE LA DISTRIBUCIÓN DE API,

EXCIPIENTES Y GROSOR DE RECUBRIMIENTO DE COMPRIMIDOS

La experiencia con los comprimidos comerciales de ASA, en los dos estudios anteriores

en el que se ha cuantificado el API, ha sido aplicada a un fármaco en proceso de

desarrollo.

El objetivo de este estudio consiste entonces en establecer un método cuantitativo para

la determinación de los distintos componentes así como su distribución en la superficie

de un comprimido farmacéutico a partir de los datos obtenidos mediante NIR-CI.

Los comprimidos estudiados están compuestos de un API y 5 excipientes, 2 de los

cuales son mayoritarios y el resto minoritarios. Por razones de confidencialidad estos

nombres no serán citados en el estudio.

Este estudio se ha realizado con comprimidos sin lacar comprimidos de producción y

comprimidos lacados de diferente grosor de laca.

En la figura 5.13a se muestran los espectros de los distintos componentes puros (API y

sus 5 excipientes). Se observan diferencias claras entre la mayoría de los espectros de

los distintos componentes puros. Estas diferencias, quedan confirmadas por los valores

de los coeficientes de correlación entre pares de componentes puros mostrados en la

Tabla 5.15.


132

Figura. 5.13. Espectros NIR medios obtenidos a partir de los espectros de todos los píxeles de

una CI. a) Comparación de los espectros NIR medios de API y los distintos excipientes puros,

desplazados para evitar superposición; b) Comparación de los espectros NIR medios de un

comprimido sin recubrir y un comprimido de producción.

0,00

0,20

0,40

0,60

0,80

1,00

1,20

1200 1400 1600 1800 2000 2200 2400

Longitud de onda (nm.)

Un

idad

es d

e ab

sorb

anci

a

Núcleo

Lacado

-0,10

0,10

0,30

0,50

0,70

0,90

1,10

1200 1400 1600 1800 2000 2200 2400


Un

idad

es d

e ab

sorb

anci

a

API Excipiente #1

Excipiente #2 Excipiente #3


a)

b)

0,00

0,20

0,40

0,60

0,80

1,00

1,20

1200 1400 1600 1800 2000 2200 2400


Un

idad

es d

e ab

sorb

anci

a

Núcleo

Lacado

-0,10

0,10

0,30

0,50

0,70

0,90

1,10

1200 1400 1600 1800 2000 2200 2400


Un

idad

es d

e ab

sorb

anci

a

API Excipiente #1



a)

b)

-0,10

0,10

0,30

0,50

0,70

0,90

1,10

1200 1400 1600 1800 2000 2200 2400


Un

idad

es d

e ab

sorb

anci

a

API Excipiente #1



a)

b)


133

Tabla 5.15. Coeficientes de correlación entre los espectros NIR medios de los distintos

componentes puros de los comprimidos (API y excipientes). Los espectros NIR medios se han

obtenido a partir de los espectros de todos los píxeles de una imagen del comprimido.

Coeficientes de correlación

API E #1 E #2 E #3 E #4 E #5

API 1.000

E #1 0.810 1.000

E #2 0.621 0.601 1.000

E #3 0.693 0.603 0.849 1.000

E #4 0.640 0.588 0.984 0.903 1.000

E #5 0.823 0.693 0.669 0.847 0.740 1.000

Destaca el elevado coeficiente de correlación entre los espectros de los excipientes #2 y

#4 (0.984) lo cual implicará un mayor esfuerzo en el desarrollo de los modelos de

calibración de estos dos componentes dada su mayor semejanza espectral.

En la figura 5.13b, se comparan los espectros promedio de un área registrados de un

comprimido sin recubrir y un comprimido lacado. Se observa como las diferencias

espectrales son mínimas, ya que la contribución espectral introducida por la capa de

lacado suele ser baja. En este caso, la laca provoca un ligero aumento de la línea base

del espectro medio.

Cuantificación de API y excipientes

Comprimidos sin recubrir

Se han registrado, tal y como se explica en el capítulo de metodología, 6 imágenes de

cada núcleo: 4 de cada una de las caras exteriores (A-D) y 2 de las caras interiores (E-F)

obtenidas por partición de los comprimidos tal como se ha mostrado en la figura 4.6a.

Se ha estudiado la construcción de un modelo para la determinación de la

concentración del principio activo y de los 5 excipientes que componen el comprimido

sin recubrir, y para ello se han ensayado modelos de calibración Isys-PLS1 para cada


134

uno de los analitos que componen el comprimido sin recubrir. Para la construcción de

los modelos se ha creado una librería con los distintos componentes puros a cuantificar

y, a continuación, se ha aplicado el algoritmo Isys-PLS1. Se han empleado un número

de factores comprendido entre 3 y 8, según el analito a modelar. Los valores de

concentración calculados para cada una de las caras de un comprimido sin recubrir se

observan en la tabla 5.16.

En todas las caras de los comprimidos sin recubrir analizados, la concentración

predicha por el modelo, es muy próxima al valor nominal, tanto para el API y los

excipientes mayoritarios, como para los excipientes minoritarios, mostrando un valor

muy pequeño de desviación estándar en todos los casos, indicativo de la buena

homogeneidad de la mezcla de los componentes. Destaca el hecho que la suma de los

porcentajes de los componentes para cada cara, se aproxima al 100% en todos los casos,

lo cual es un indicativo de la correcta capacidad predictiva de los modelos de

calibración. Sin embargo, se detectan pequeñas diferencias de composición entre las

caras del comprimido para algunos de los componentes: así, la concentración de los dos

componentes mayoritarios (API y excipiente #1) en las caras interiores (E y F) del

comprimido muestran desviaciones respecto a los valores nominales y del resto de las

caras, descenso notable del contenido en API y, en menor grado, del de excipiente #2 y

un aumento del contenido en excipiente #1, que también se refleja en un aumento en el

valor de la desviación estándar. Este comportamiento se repite en los distintos

comprimidos sin recubrir analizados. Este comportamiento se puede explicar por la

mayor rugosidad superficial que presenta la superficie resultante del corte que a su vez

afecta a la calidad de la imagen obtenida y también a su cuantificación.


135

Tabla 5.16. Concentraciones (en %) de API y excipientes de las diferentes caras de un mismo

comprimido sin recubrir calculadas mediante modelos de calibración Isys-PLS1.

Componentes del comprimido sin recubrir (%)

API E #1 E #2 E #3 E #4 E #5 Suma

Cara A 35.51 38.93 20.15 1.97 1.48 1.47 99.51

Cara B 35.45 39.46 21.12 1.98 1.48 1.51 101.00

Cara C 37.11 38.45 19.69 1.99 1.53 1.53 100.30

Cara D 37.45 40.38 20.14 1.95 1.53 1.51 102.96

Cara E 31.66 44.16 18.62 1.95 1.48 1.51 99.38

Cara F 31.47 43.38 19.31 1.97 1.55 1.53 99.21

Promedio 34.78 40.79 19.84 1.97 1.51 1.51 100.40

Desv. Std 2.62 2.41 0.85 0.02 0.03 0.02 5.95

En la figura 5.14, se pueden observar los mapas de concentración de los distintos

componentes para una de las caras exteriores de un comprimido sin recubrir, obtenidos

con el modelo Isys-PLS1. Como se puede ver, la distribución del excipiente #2 y del API

son muy similares, con áreas de mayor concentración localizadas en las mismas zonas

de la superficie del comprimido. Por el contrario, las áreas de mayor concentración del

excipiente #1 son complementarias a las del API. Esta distribución se explica por que el

API y el excipiente #2 son mezclados en una primera etapa y después se añaden el resto

de excipientes. Por lo que respecta a los excipientes minoritarios, el reparto es uniforme

en toda la imagen. La distribución de API y excipientes, observada para el resto de

caras del mismo comprimido sin recubrir y para otros comprimidos sin recubrir

analizados, no presenta diferencias significativas respecto a la cara descrita

anteriormente y sigue las mismas tendencias que ésta. Este comportamiento se cumple

tanto para las caras externas, como para las internas, como se puede observar en la

tabla 5.16. En la misma figura 5.14 se muestran también los histogramas para cada uno

de los componentes del comprimido sin recubrir.


136

API (35%) Excipiente #2 (20%)Excipiente #1 (40%)

Excipiente #5 (1.5%)Excipiente #4 (1.5%)Excipiente #3 (2%)

Figura. 5.14. Mapas de concentración de API y excipientes para la cara A (exterior) de un

comprimido sin recubrir, obtenidos mediante modelos de calibración Isys-PLS1, y sus

correspondientes histogramas. Entre paréntesis se indica la concentración nominal de cada

componente.

Para los excipientes minoritarios, la distribución de los histogramas no se aleja de la

normalidad, ya que estos son bastante simétricos y con bases estrechas, lo que reduce la

importancia de las heterogeneidades observadas en los mapas de concentración. En

cambio, los histogramas para los excipientes mayoritarios presentan bases más anchas,

hecho indicativo de la presencia de zonas del comprimido con valores de concentración

alejadas del valor nominal (central). Los histogramas del API y del excipiente #2

presentan una forma muy similar, con colas notables a la izquierda, hecho que implica

abundancia de píxeles con concentraciones inferiores a las nominales; mientras que las


137

colas en el histograma del excipiente #1 son a la derecha, indicando un número mayor

de píxeles con valores de concentración significativamente superiores a las esperadas. A

pesar de ello, las distribuciones no se alejaban significativamente de la normalidad por

lo que se puede deducir que la distribución de API y excipientes en los comprimidos es

homogénea para todos los componentes.

Comprimidos lacados

Se han registrado los espectros de los comprimidos recubiertos tal y como se explica en

el capítulo de metodología experimental. Se registran comprimidos de distinto grosor

de recubrimiento, tomando 2 imágenes de cada comprimido, pertenecientes a dos caras

exteriores opuestas. Cada imagen incluye 2 caras homólogas de 2 comprimidos de

iguales características (mismo grosor de lacado), tal como se ha mostrado en la figura

4.6b. En el caso de las muestras de producción se han registrado sólo las 4 caras

exteriores de los comprimidos, denominadas de la misma forma que en los

comprimidos sin recubrir (A-D).

La determinación de API y excipientes también se ha realizado en los comprimidos con

distintos grosores de lacado. Para ello se han construido modelos de calibración Isys-

PLS1, con un número de factores que oscila entre 3 y 6 dependiendo del analito a

modelar y del grosor de recubrimiento de la muestra. Los resultados obtenidos para

dos caras, A y B, de un mismo comprimido, pero con distintos espesores de

recubrimiento se muestran en la tabla 5.17. Estos resultados corresponden a la media

de los valores obtenidos para los dos comprimidos de una misma imagen (comprimidos

con igual porcentaje de recubrimiento). En la tabla 5.17 no se han incluido los

resultados de los componentes minoritarios porque presentan desviaciones

importantes respecto a los valores de referencia (para comprimidos lacados de 50% a

300%). Para los tres componentes mayoritarios, los porcentajes calculados son muy

próximos a los valores nominales (tabla 4.2) y, siguiendo la misma tendencia que estos,

disminuyen gradualmente con el aumento del grosor del lacado. Es evidente que las


138

desviaciones respecto los valores de referencia aumentan notablemente en los

comprimidos con mayor grosor de recubrimiento (200 y 300%) y, sobretodo, en el caso

del excipiente #2, el menos abundante de los tres.

De estos resultados se puede concluir que las desviaciones observadas en los cálculos

de concentración son debidas principalmente al recubrimiento de laca (coating), que

afecta de manera importante a la determinación de la concentración en el caso de

componentes minoritarios y, en menor grado, a la de los componentes mayoritarios.

Tabla 5.17. Concentraciones (en %) de API y los dos excipientes mayoritarios de

comprimidos con diferentes porcentajes de recubrimiento, calculadas mediante

modelos de calibración Isys-PLS1.

Componentes del comprimido (% w/w) Grosor de

laca (%) Cara del

comprimido API E #1 E #2

A 35.25 40.74 20.20 0%

B 35.67 39.46 21.34

A 35.85 40.30 19.67 50%

B 35.31 40.27 20.36

A 34.56 40.80 20.79 100%

B 35.20 40.18 21.64

A 33.15 39.15 17.95 200%

B 32.95 42.40 15.31

A 30.85 38.51 12.65 300%

B 29.65 39.78 14.03

Cuantificación del coating

Determinar el espesor de la capa de laca de recubrimiento, es un parámetro importante

ya que puede afectar a la velocidad de disolución y también a la calidad de los

resultados de cuantificación de los diferentes componentes. Para ello se ha construido

un modelo de calibración PLS1 utilizando el espectro promedio de las caras de cada


139

comprimido frente al tiempo de recubrimiento. Al recubrimiento nominal se le ha

asignado el valor 100 y los recubrimientos modificados han sido del 50%, 200% y

300% del grosor nominal.

Se han utilizado 10 imágenes de comprimidos lacados con diferentes grosores de

recubrimiento (con dos comprimidos cada una). Se han promediado los espectros de

estas imágenes, dando lugar a un total de 4 espectros por nivel de recubrimiento (2

comprimidos por imagen y 2 caras por comprimido). De los 20 espectros finales, 3 se

han descartado como outliers, 12 han servido para construir el modelo de calibración y

5 para validarlo. A cada espectro promedio del conjunto de calibración se le ha

asignado el valor nominal de concentración de recubrimiento del comprimido: 0, 50,

100, 200 o 300%. Estos porcentajes de recubrimiento han sido determinados por el

aumento de peso de los comprimidos después de ser recubiertos.

Para la construcción del modelo PLS1, se han ensayado distintos pretratamientos

(derivadas de Savitzky-Golay, SNV) y rangos espectrales, con el fin de conseguir el

modelo que mejor se ajusta al conjunto de validación. Los mejores resultados se han

obtenido pretratando los datos con SNV y trabajando con el rango espectral completo,

con un modelo que solamente necesita un factor para explicar el 99.3% de la varianza.

Este modelo PLS1, descrito en la tabla 5.18, es el que se aplica a las muestras de

producción.


140

Tabla 5.18. Características del modelo PLS1 creado para la cuantificación del recubrimiento de

comprimidos.

Características del modelo PLS1

Número de muestras incluidas en el modelo 12

Rango espectral (nm) 1200-2500

Pretratamiento espectral SNV

Factores 1

Varianza-Y (%) 99.31

Número de muestras usadas para la validación 5

RMSEP 14.04

RSEP (%) 8.32

En la figura 5.15, se muestran los mapas de concentración de recubrimiento para las

imágenes de las cuatro caras exteriores de un mismo comprimido de producción

(comprimido 1), a las que se les ha aplicado el modelo PLS descrito anteriormente.

De la comparación de los cuatro mapas de concentración se puede deducir que la

distribución del material de recubrimiento es bastante homogénea en todas las caras,

aunque se observan puntos dónde la concentración predicha es superior al resto de la

superficie. Este efecto puede ser debido a la presencia de agregados de laca producidos

en el mismo proceso de recubrimiento. En la misma figura 5.15 se muestran también

los histogramas para facilitar el análisis de la distribución de la capa de lacado. A pesar

de presentar bases anchas y con pequeñas colas a ambos lados, en todos los casos, los

gráficos se acercan a la normalidad y mantienen la simetría.


141

Cara A

Recubrimiento medio = 108.15%

Cara B


Cara D


Cara C


Recubrimiento medio (4 caras) = 94.64%

Figura. 5.15. Mapas de concentración de recubrimiento (%) para las cuatro caras de un

comprimido de producción, con los valores medios obtenidos mediante el modelo de calibración

PLS1 y sus correspondientes histogramas.


142

Tabla 5.19. Concentraciones (en %) de recubrimiento para las distintas caras de dos

comprimidos (1 y 2) de producción, calculadas mediante modelos de calibración PLS1.

Recubrimiento promedio de laca (%)

Comprimido 1 Comprimido 2

Cara A 108.15 113.84

Cara B 98.86 113.83

Cara C 78.81 107.94

Cara D 92.74 118.73

Promedio 94.64 113.58

Los valores medios de recubrimiento para cada una de las cuatro caras de los

comprimidos de producción 1 y 2, obtenidos mediante el mismo modelo PLS1 descrito

arriba, se muestran en la tabla 5.19. Tanto para el comprimido 1 (mostrado en la figura

5.15), como para el 2 se observan diferencias en el contenido de laca de las diferentes

caras de hasta el 10% respecto el valor teórico, pero realizando el promedio de los

valores de las 4 caras del comprimido, se obtienen valores cercanos a los nominales

para todas las muestras estudiadas.

CONCLUSIONES

143

6. CONCLUSIONES

CONCLUSIONES

144

CONCLUSIONES

145

6. CONCLUSIONES

Se han propuesto nuevas estrategias para el desarrollo de métodos de análisis en la

industria química y farmacéutica, aplicando espectroscopía NIR, NIR-CI y técnicas

quimiométricas multivariables i univariables.

De los estudios realizados se extraen las siguientes conclusiones:

1) Determinación de parámetros de control de un proceso de fabricación de resinas

poliéster

Se demuestra que la espectroscopia NIR es una alternativa a las técnicas

analíticas convencionales para el control industrial de la reacción de

condensación para la producción de resinas de poliéster. Los modelos PLS

desarrollados permiten determinar correctamente los parámetros utilizados en

el control del proceso: índice de ácido y de hidroxilo.

Los modelos de calibración permiten realizar el control de los parámetros

relevantes del proceso, que incluyen desde la carga de materias primas en el

reactor (indicando la conveniencia/necesidad de corregir esta carga añadiendo

ácidos o glicoles), de las primeras etapas del proceso (obteniendo información

fiable de la evolución del mismo) hasta el final del mismo asegurando la calidad

final de la resina.

Se ha demostrado la posibilidad de transferir calibraciones entre instrumentos

utilizando un número reducido de muestras registradas en los dos

instrumentos; los modelos de calibración construidos en uno de ellos se

pueden aplicar, sin una perdida significativa de capacidad predictiva respecto a

los modelos originales, en el otro instrumento con el consiguiente ahorro en

tiempo, esfuerzo y coste.

CONCLUSIONES

146

2) Determinación de la composición a lo largo de las etapas de producción de un

fármaco.

Se propone una nueva metodología de preparación de modelos de calibración

basada en la utilización del coeficiente de correlación (CC) como la variable a

modelar. La metodología propuesta proporciona un modelo de calibración

univariable, lo que supone una importante ventaja frente a los modelos

multivariables en cuanto a simplicidad y facilidad de preparación; sólo es

necesario utilizar una hoja de cálculo para la construcción del modelo.

El coeficiente de correlación, en ausencia de interacciones entre los componentes

de la muestra, no es afectado por propiedades físicas, tales como el tamaño de

partícula o la presión de compactación de los comprimidos, con lo que se

elimina su influencia en los modelos de calibración. Por ello un único modelo es

válido para la predicción de muestras sometidas a diferentes tratamientos

físicos, lo que simplifica la construcción de los modelos ya que no es necesario

usar muestras del mismo tipo que las que se van a predecir en la construcción

de los modelos; esta es una exigencia de los modelos multivariables.

Sin embargo esta metodología presenta algunas limitaciones que limitan la

aplicación universal a cualquier tipo de muestras: requiere disponer del

espectro puro de cada compuesto a determinar -que por lo general no

representa un problema en análisis de productos farmacéuticos-, una alta

concentración de API a fin de garantizar diferencias suficientes en los valores de

CC entre las muestras del rango de concentraciones de API seleccionado y un

espectro del analito tan diferente como sea posible del espectro de la matriz

CONCLUSIONES

147

(placebo). Los modelos son sensibles a pequeñas variaciones en el registro de

los espectros.

La metodología propuesta puede ser de gran utilidad en el campo farmacéutico

ya que algunas de sus restricciones son superables permitiendo con un único

modelo el control de API en diferentes etapas del proceso de producción.

3) Aplicación de las técnicas de imagen hiperespectral (NIR-CI) al análisis de

comprimidos comerciales de ácido acetilsalicílico (ASA) y comprimidos de un fármaco

en proceso de desarrollo.

Se ha demostrado la capacidad de obtener información cualitativa y cuantitativa

de comprimidos comerciales de aspirina mediante técnicas de imagen química

sin necesidad de información química de referencia. Los modelos construidos

con el algoritmo MCR-ALS y su versión aumentada (que aumenta la calidad de

los resultados) permiten el cálculo de la concentración en cada uno de los

pixeles de la imagen y consiguientemente de la concentración media y de la

distribución de API.

La técnica de NIR-CI no altera la muestra, tiene un tiempo de análisis corto y

ofrece unos resultados prometedores; todo ello la convierte de gran importancia

en el inmediato futuro para el control de calidad de los fármacos acabados.

El estudio comparativo de los algoritmos MCR-ALS y Isys-PLS1 demuestra que

ambos proporcionan resultados semejantes (los valores de Isys-PLS1 son

ligeramente mejores que los aportados por MCR-ALS) en cuanto a la calidad de

los resultados en la determinación de API y de los excipientes.

CONCLUSIONES

148

La información obtenida permite obtener imágenes de distribución de los

componentes en los comprimidos individuales y por tanto establecer la

homogeneidad de distribución; el histograma de los valores de las

concentraciones es un indicativo esencial para esta confirmación.

Una imagen única de 10 comprimidos permite, no solo determinar la

concentración de API de cada uno de ellos, sino también determinar la

uniformidad de contenido de un lote de producción siguiendo la normativa de la

European Pharmacopoeia; esto supone una gran ventaja en rapidez y

simplicidad frente a las técnicas convencionales.

Se ha evaluado la capacidad de la técnica del NIR-CI en el estudio y desarrollo

de nuevos fármacos facilitando la determinación de la composición de cada uno

de los componentes, la distribución de los mismos – con y sin recubrimiento-y

también la determinación del grosor y homogeneidad del recubrimiento.

También se ha demostrado la capacidad del algoritmo Isys-PLS1 para obtener

una información cuantitativa de calidad de imágenes hiperespectrales sin

necesidad de una calibración con valores de referencia, de API y todos los

excipientes (mayoritarios y minoritarios) así como establecer la distribución de

éstos.

Los estudios realizados demuestran el gran potencial de la técnica NIR-CI y de

las grandes posibilidades que ofrecen diferentes algoritmos de cálculo para

extraer información analítica de calidad sin necesidad de información analítica

de referencia y de la posibilidad de su aplicación en los ensayos at-line en el

control de procesos de producción en la industria farmacéutica.

CONCLUSIONS

149

6. CONCLUSIONS

New strategies for the development of analysis methods in the chemical and

pharmaceutical industries have been proposed based on conventional NIR

spectroscopy and NIR-CI in combination with univariate and multivariate chemometric

methods for treatment of spectral information.

From all the studies that have been done the following conclusions can be extracted:

1) Determination of parameters for controlling a manufacturing process of polyester

resins

It has been demonstrated that NIR spectroscopy is an alternative to

conventional analytical techniques for the industrial control of the condensation

reaction in the production of polyester resins. The developed PLS models can

effectively quantify the process control parameters: acid and hydroxyl indexes.

Calibration models allow the control of relevant parameters of the

manufacturing process, which include the loading of raw materials into the

reactor (eventually correct acids or glycols concentration), intermediate steps of

the process (obtaining reliable information) and the end (ensuring the final

quality of the resin).

It has been demonstrated the ability to transfer calibration models between

instruments using a small number of samples acquired in the two instruments;

the calibration models calculated for one instrument can be successfully applied

to the other with good predictive ability thereby saving time, effort and cost.

CONCLUSIONS

150

2) Determining the composition along the production steps of a drug.

A new methodology is proposed for the calculation of calibration models based

on the use of the correlation coefficient (CC) as the variable to be modelled. The

proposed methodology provides a univariate calibration model, which

represents a significant advantage over multivariate models in terms of

simplicity and easiness of preparation, being only necessary to use a

spreadsheet for model building.

The correlation coefficient, in the absence of interactions between components

of the sample, is not affected by physical properties such as particle size or

compaction pressure of the tablets, thereby eliminating their influence on the

calibration models. Therefore, one model is valid for the prediction of samples

subjected to different physical processes. It simplifies the construction of the

models because it is not necessary to use samples with the same physical

characteristics for calibration and prediction, which is a requirement of

multivariate models.

However, this methodology presents some limitations which do not allow its

universal application to all types of samples. It requires a) having the pure

spectrum of each compound to be determined (which is usually not a problem

in pharmaceutical analysis), b) high concentration of API to ensure sufficient

differences in the CC values between the samples in the selected range of

concentrations and a spectrum of the analyte as different as possible from the

spectrum of the matrix (placebo). The models are sensitive to small changes in

the spectra registration.

The proposed methodology may be useful in the pharmaceutical field as some of

their restrictions can be overcome, allowing the API monitoring in the different

stages of production with only one model.

CONCLUSIONS

151

3) Application of hyperspectral imaging (NIR-CI) to the analysis of commercial tablets

of acetylsalicylic acid (ASA) and tablet drugs in the development stage.

The capability to obtain qualitative and quantitative information from

commercial tablets of aspirin by chemical imaging techniques has been

demonstrated. The information has been obtained without any chemical

information used as reference. The model built with the MCR-ALS algorithm

and its augmented version (which improves the quality of results) allows the

quantification of API content in each pixel of the image and therefore the

average concentration and distribution of API.

NIR-CI does not destroy the sample, has a short analysis time and offers

promising results; all this makes NIR-CI a technique of great importance in the

immediate future for the quality control of final product.

The comparative study of algorithms of MCR-ALS and Isys-PLS1 shows that

both provide similar results (the calculated values provided by Isys-PLS1 are

slightly better than those provided by MCR-ALS) in terms of the quality of the

results in the determination of API and excipients.

This method allows us to obtain images of the distribution of the components in

individual tablets and, therefore, to establish the uniformity of distribution. The

histogram of the concentration values of each pixel is an essential indicator for

this confirmation.

A single image of 10 tablets can not only determine the concentration of API in

each of them, but also establish the content uniformity of a production batch,

according to the regulations of the European Pharmacopoeia. This is a great

advantage in terms of speed and simplicity compared with the conventional

techniques.

The ability of NIR-CI is evaluated for the study and development of new drugs,

facilitating the determination of each component of the tablet, and its

CONCLUSIONS

152

distribution - with and without coating- and also the determination of coating

thickness and uniformity.

It has also been demonstrated the ability of Isys-PLS1 algorithm to obtain

quantitative information with appropriate quality using hyperspectral images

without calibration reference values of API and all excipients (major and minor)

and to establish their distributions.

Our studies show the great potential of NIR-CI and the great possibilities

offered by different algorithms to extract analytical information without any

chemical information used as reference and the possibility of its application at-

line in the control of production processes in the pharmaceutical industry.

ARTÍCULOS

153

7. ARTÍCULOS

ARTÍCULOS

154

ARTÍCULOS

155

7. ARTÍCULOS

Este capítulo recoge los artículos publicados aceptados por la Comissió de Doctorat

para la presentación de la tesis como compendio de publicaciones.

1) Control production of polyester resins by NIR spectroscopy. M.Blanco,

J.Cruz, M. Armengol. Microchemical Journal 90 (2008) 118–123. Impact factor: 2.505

2)Development of a univariate calibration model for pharmaceutical

analysis based on NIR spectra. M.Blanco, J.Cruz, M. Bautista. Analytical and

bioanalytical chemistry 392 (2008) 1367–1372. Impact factor: 3.328

3)NIR-Chemical Imaging study of acetylsalicylic acid in commercial tablets.

J.Cruz, M. Bautista, J.M Amigo, M.Blanco Talanta 80 (2009) 473–478. Impact factor:

3.290

ARTÍCULOS

156

ARTICULOS

157

7.1)CONTROL PRODUCTION OF

POLYESTER RESINS BY NIR

SPECTROSCOPY

M.Blanco, J.Cruz, M. Armengol

Microchemical Journal 90 (2008) pp. 118–123

ARTICULOS

158

Microchemical Journal 90 (2008) 118–123

Contents lists available at ScienceDirect

Microchemical Journal

j ourna l homepage: www.e lsev ie r.com/ locate /microc

Control production of polyester resins by NIR spectroscopy

M. Blanco a,⁎, J. Cruz a, M. Armengol b

a Departament de Química, Unitat de Química Analítica, Universitat Autònoma de Barcelona, E-08193 Bellaterra, Barcelona, Spainb Powder Coatings Department, Cray Valley Ibérica, S.A. E-08470 Sant Celoni, Barcelona, Spain

⁎ Corresponding author. Tel./fax: +34 93 581 1367.E-mail address: [email protected] (M. Blanco).

0026-265X/$ – see front matter © 2008 Elsevier B.V. Adoi:10.1016/j.microc.2008.04.004

A B S T R A C T
A R T I C L E I N F O
Article history:
The control of the esterifica Received 25 March 2008Accepted 17 April 2008Available online 25 April 2008
Keywords:NIR spectroscopyMultivariate calibrationPLSRAcid valueHydroxyl valueModel transfer

tion reaction for production of polyester saturated resins is followed usually bydetermination of the acid value (AV) and hydroxyl value (OHV).These parameters are determined bytitrimetry, but these methods are slow, intensity working and produce waste. In this paper an alternativemethodology is proposed, based in the construction of multivariate models on NIR spectroscopic data anddifferent models are constructed in order to apply to different steps of the production process. The ensuingmethodology provides models of good predictive ability and constitute an advantageous alternative toexisting titrimetric reference methods as regards expeditiousness and environmentally compatible. Themultivariate calibration models established were also used with a different instrument; to this end, thespectra recorded with the original equipment were subjected to Piecewise Direct Standardization (PDS) inorder to make them equivalent to those provided by the new equipment. Also, PLS calibration wasreproduced by using the same samples, spectral treatment, wavenumber range and number of factors as inthe original model, and the AV and OHV results thus obtained were similarly good.

© 2008 Elsevier B.V. All rights reserved.

1. Introduction

Polyester resins are polymers resulting from the condensation ofone or more dicarboxylic acids with one or more dialcohols and thecharacteristics and physical properties of which can be modified byaltering the reactant proportions; this allows a variety of resinsranging from solid to semi-fluid in texture that are insoluble in waterbut soluble in organic solvents to be obtained.

The earliest synthetic resins were obtained in the 1940s and usedas reinforcements for fibreglass in the production of the firstcomposite plastics. Although their market and uses have grownsubstantially since then, synthetic resins continue to be used largely inthis manufacturing in order to obtain layered composites known as“fibreglass-reinforced plastics” (FRPs).The most widely used polyesterresin is polyethylene terephthalate (PET), which is obtained bycondensing terephthalic acid with ethyleneglycol; PET is a thermo-plastic the mechanical and chemical properties of which make itespecially suitable for food and drink packaging.

In addition, polyester resins arewidely used tomanufacture plasticpaint [1] and these resins are used to prepare reticulated powderedpaint for electrostatic coating. The development of this kind of resinshas always been very influenced by the environmental factors,because of the absence of solvents and it is an agreed alternativewith the ecological principles. This type of paintings has had a fastgrowth from their introduction for 35 years due to their fast cured and

ll rights reserved.

the optimal qualities of the formed covering, with very goodmechanical properties, resistance and durability.

The plastic paint polyester resins studied are obtained bycondensation of neopentyl glycol and terephthalic acid, but addition-ally contain minor amounts of other acids and diols intended tofacilitate specific uses. Table 1 lists some of the more usualcomponents of these resins.

The American Society for Testing and Materials (ASTM) [2]recommends using the acid value (AV) and hydroxyl value (OHV) tomonitor esterification reactions. Determining these two parameters(particularly OHV) involves long analysis times that lengthen theproduction cycle and result in increased costs and decreasedproductivity as a result. The production process and the quality ofthe end product can be improved by using rapid, effective analyticaltechniques to ensure appropriate, efficient analytical control of thedifferent steps of the manufacturing process.

A variety of techniques have so far been used for the analysis andcharacterization of resins [3–5] all of which, however, involve labour-intensive, time-consuming analyses. Near infrared spectroscopy (NIR)is a novel, effective alternative in his respect as it allows the spectra foruntreated solid and liquids samples to be expeditiously recorded andaffords the simultaneous determination of physical and chemicalparameters from a single spectrum. In addition, it lends itself readilyto at-line and in-line implementation (with fibre-optic probes in thelatter case), which makes it suitable for process control purposes [6].The nature of NIR spectra, however, requires the use of multivariateregression techniques to construct effective calibration models themost widely employed among which is Partial Least-Squares

mailto:[email protected]

http://dx.doi.org/10.1016/j.microc.2008.04.004

http://www.sciencedirect.com/science/journal/0026265X

Table 1Main raw materials used to obtain the polyester resins

Reagent Formula Property Content(%)

Diacids Terephthalicacid

Mechanicproperties

65–90

Isophthalicacid

OutdoorResistance

10–25

Adipic acid Flexibility,highreactivity inthe end of thechain

1–10

Diols Neopentylglycol

OutdoorResistance

80–100

Ethyleneglycol

Flexibility,low cost

0–20

Diethyleneglycol

Flexibility,low cost

0–20

Table 2Final net hydroxyl and acid values for the polyester resins in each production step

Value Step 1 Step 2 Step 3

IOH net (mg KOH/g) 24 to 26 −28 to −32 −28 to −32IA (mg KOH/g) 13 to 23 45 to 50 33 to 36

Fig. 1. NIR spectra for the samples in the different production steps.

119M. Blanco et al. / Microchemical Journal 90 (2008) 118–123

Regression (PLSR) [7–10]. A number of calibration methods for NIR-based determinations using non-linear models such as non-linear PLS[11] and ANN [12] have to date been reported. In this work, we usedNIR spectroscopy as an alternative to the classical volumetricdetermination methods for the acid value and hydroxyl valueinvolving the construction of calibration models which afford muchmore expeditious and simplicity of the analyses. The models allowboth parameters to be determined in the different steps of the resinproduction process and hence any corrections required to be timelyintroduced.

Transferring the calibration results from the master equipment(viz. that used to construct the calibration models) to any other, slaveequipment, allows substantial time and economic resources to besaved.When a calibrationmodel is applied to spectra registeredwith adifferent instrument, deviations in the results can be produced.

A number of methods exist for transferring models betweeninstruments [13]; the most simple choice, however, is based ontransforming the spectra from the slave instrument as required foradaptation to the characteristics of master instrument. One of themost frequently used algorithms for this purpose is Piecewise DirectStandardization (PDS) [14].

In this work, we constructed PLS calibration models of goodpredictive ability for the at-line determination of the acid value andhydroxyl value in samples withdrawn during the process of polyesterresin manufacturing. Also, we assessed the transferability of themodels between instruments.

2. Experimental

2.1. Resin synthesis

The resin production process involves three steps. In the first,which is the most complicated and slow — and also that requiringthe highest temperatures — the esterification begins and they takepart mainly neopentylglycol and terephthalic acid, a catalyst and ananti-oxidant. Water formed during the esterification is separated bydistillation, until an elevated percentage of the initial acid is reacted. Inthe second step, the temperature is lowered and the concentrations ofterephthalic acid and glycol are re-adjusted if the net acid value orhydroxyl value falls outside the desired range (see Table 2); also, theother reaction ingredients used (viz. isophthalic acid, adipic acid and/or trimellitic anhydride) are added. In the third step, the concentra-tions of terephthalic acid and glycol are re-adjusted as in the previousstep and several successive vacuum ramps are performed at the sametemperature as in the second step in order to remove water formed in

the reaction and obtain the desired acid value and hydroxyl value inthe end product.

2.2. Samples

A total of 105 polyester resin samples from the three productionsteps were extracted and analysed by the ASTM methods. Theircompositionwas found to depend on the particular step and time theywere withdrawn from the process. All were ground in an electric millprior to recording of their NIR spectra.

2.3. Hardware and software

Near infrared reflectance spectra were recorded on two differentinstruments, namely: a Perkin-Elmer Spectrum One NTS modelequipped with a reflectance accessory (NIRA) that was governedwith the software Spectrum v. 3.02.01 and Bruker Multi PurposeAnalyzer that was controlled with Opus v. 6.0 from Bruker Optics(Ettlingen, Germany). Spectral measurements were made at 2 cm−1

intervals over the wavenumber range 4000–10000 cm−1 and eachspectrum was the average of 30 scans.

The software Opus v. 6.0 was used to transfer spectra, using thePDS algorithm of Kowalski and Yang (University of Washington) [11].Multivariate calibration models were constructed with the softwareThe Unscrambler v. 9.2 from CAMO (Trondheim, Norway).

2.4. Reference methods

2.4.1. Acid valueThe acid value (AV) is defined as the number of milligrams of

potassium hydroxide required to neutralize 1 g of sample and isdetermined in accordance with ASTM D-465-01 [2] by titrating thenon-volatile acid fraction of the sample with a standardized alkalinesolution.

2.4.2. Hydroxyl valueThe hydroxyl value (OHV) is defined as the number ofmilligrams of

potassium hydroxide needed to neutralize the acetic acid formed inthe acetylation of 1 g of sample and is determined in accordance with

Fig. 2. Scores plot obtained from a PCA of the first-derivative spectra over the 4000–10000 cm−1 range for resin samples in the three production steps.

120 M. Blanco et al. / Microchemical Journal 90 (2008) 118–123

ASTM D-1957-86 [2]. The recommended method involves acetylatinghydroxyl groups with acetic anhydride in pyridine containing 4-dimethylaminopyridine (DMAP) as catalyst. After the reaction, excessacetic anhydride is hydrolyzed with water and titrated with astandardized alkaline solution. The difference between the volumesof base needed to neutralize the sample and a blank provides thehydroxyl value. The net hydroxyl value is a measure of excess hydroxylgroups and is calculated as the difference between the hydroxyl valueand acid value: OHVnet=OHV−AV.

2.5. Recording of spectra

The spectra recorded with the Perkin-Elmer and Bruker instru-ments were obtained by using powdered samples held in quartz cellsand glass vials, respectively. Each spectrum was the average of 30scans and both instruments were set to apply blank/baselinecorrection. Each sample was used to record three spectra the averageof which was used for subsequent processing.

2.6. Construction of models

The spectral treatments used to construct themodels included firstderivatives as obtained by using the Savitzky–Golay algorithm withsecond-order polynomial fitting and a 21-point window [15], andStandard Normal Variate (SNV) [16].

Calibration models were constructed by using the PLS1 algo-rithm as implemented by cross-validation (leave-one-out method).The optimum number of factors to be included was determinedfrom a plot of explained variance against number of factors. Theinitial model thus obtained was refined by selecting those factorsresulting in the lowest RSEP for the validation set.

Table 3Characteristics of the calibration models for control of acid and hydroxyl values

Parameter Step Spectral pretreatment Spectral range (cm−1)

IA 1 1st derivative 6550–5316, 5206–4970, 4926–4572 1st derivative 7000–40003 SNV 8200–5000

IOH net 1 1st derivative 7182–6870, 6106–5302, 5224–4562+3 1st derivative 7118–5448, 5132–4000

The quality of calibration and validation models is usuallymeasured in terms of a relative standard error, RSE, which isdesignated (RSEC) for calibration and (RSEP) for prediction:

RSE kð Þ ¼ 100

ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiPmi¼1

ypred � yref� �2

Pmi¼1

yrefð Þ2

vuuuuuut

where m is the number of samples used, yref the parameter valueprovided by the reference method and ypred that provided by the NIRmethod.

The sample selection method used was the algorithm of Kennardand Stone [17].

3. Results and discussion

The production of polyester resins involves three steps startingwith an esterification reaction that is followed by adjustment of thecomposition of the medium in order to obtain the desired propertiesand by a finishing step. Fig. 1 shows the spectra obtained for a selectedresin sample in the three steps. As can be seen, they are highly similar,which suggests that spectral changes during the process are quitesmall despite the oscillations in AV and OHV.

Only the spectra recorded on the Perkin-Elmer instrument wereused to construct the calibration models. Fig. 2 shows the results of aprincipal component analysis (PCA) for the resins in the threeproduction steps; while spectral differences between steps werevery small (Fig. 1), those between the first three scores in the scatterplot were quite apparent (particularly those between the first step andthe other two). This led us to construct a different model for each stepand control parameter (AV and OHV).

As can be seen from Fig. 2, the scores for the samples in the secondstep were close to those in the third; this led us to consider using asingle model for AV and OHV in both steps.

In order to ensure accurate predictions, the calibration modelshould encompass all possible variability sources for the body ofsamples to be determined; in order to identify the samples meetingthis criterion, we applied the Kennard–Stone algorithm to the samplesets available for each step. Fig. 3 show the scores of the scatter plot(PC1 vs PC2) obtained from a PCA of samples for the first step; as canbe seen, the selected samples encompassed the whole spectralvariability in those used for calibration.

The selected samples were checked to span the whole concentra-tion range. Otherwise, the Kennard–Stone algorithm was used toselect additional samples until this criterion was met. The body ofsamples not selected by the algorithmwas used for validation in orderto assess the predictive ability of the model.

Models were constructed by using various spectral ranges andtreatments (SNV and first derivative). The optimum spectral rangewas identified by using the jack-knifing criterion [18], whichprovides an indication of the particular wavelengths most stronglyinfluencing the performance of a model. Application of the criterionprovided the ranges listed in Table 3, which coincided with thosecontaining the major bands in the spectra for the resins. Thosesamples exhibiting high residuals or substantial deviations from the

PLS factors Y explained variance % RSEC% RSEP%

8, 4418–4000 4 98.27 1.52 2.585 98.40 0.69 1.484 95.80 0.35 1.27

6, 4418–4158 4 98.18 2.82 2.395 96.30 1.61 3.41

Table 4Figures of merit of the models for the calibration and prediction samples

Parameter Step Set samples Number of samples Parameter range(mg KOH/g)

Slope Offset R2

IA 1 Calibration 19 13.6–22.0 0.98±0.07 0.30±1.17 0.99Prediction 23 14.9–19.3 0.95±0.13 0.64±3.83 0.95

2 Calibration 22 42.3–56.6 0.98±0.06 0.80±2.95 0.99Prediction 28 46.9–53.6 0.93±0.17 3.75±8.47 0.91

3 Calibration 16 33.1–35.5 0.96±0.11 1.44±3.98 0.96Prediction 6 34.9–35.4 0.22±0.49 13.26±14.76 0.12

IOH net 1 Calibration 46 16.1–36.0 0.98±0.04 0.47±1.07 0.98Prediction 27 19.4–34.4 1.02±0.06 −0.83±1.73 0.98

2+3 Calibration 49 (−19.2)−(−39.0) 0.96±0.05 1.08±1.61 0.96Prediction 40 (−21.2)–(−33.3) 1.07±0.13 1.57±3.84 0.85

Note: ± Confidence level for means (p=0.05).


others in the set were deemed outliers and excluded from thecalibration models.

We developedmodels for AV and OHV in each step; by exception, asingle model was constructed for the hydroxyl value in the second andthird step. Table 3 shows the most salient calibration parameters foreach model, as well as the calibration and prediction errors obtained.As can be seen, using 4 and 5 PLS factors sufficed to obtain modelswith adequate predictive ability for both parameters; in fact, theresulting RSEP values were less than 3.5% with all models.

The similarities between the second and third step allowed a singlemodel to be used for OHV in both. The model was simple (only 5 PLSfactors) and exhibited good predictive ability; however, it providedpoor results for AV, which thus required using independent, simplermodels for the two steps.

Table 4 shows the statistical figures of merit of the models asregards calibration and prediction. The slopes and intercepts of theNIR value vs reference value regression lines were close to 1 and 0,respectively, and contained both values in their confidence intervals.This, together with the coefficients of determination of the linesobtained with the calibration models for both AV and OHV (0.96–0.99), testify to their good quality.

The coefficients of determination of the validation lines departedmore markedly from unity than did those of the calibration lines, butwere still acceptable (0.85–0.96). The small number of samplesavailable to assess the predictive ability of the model for AV in thethird step, together with the narrow concentration range theyspanned, made this prediction quality criterion useless and entailedusing a t-test to assess differences. Table 5 shows the calibration andprediction residuals obtained at the 95% significance level. Based onthem, the five PLS models resulted in no significant differencesbetween the NIR results and reference values.

3.1. Transfer of spectra and models

The above-described models were constructed from spectrarecorded on the Perkin-Elmer instrument and, subsequently, fromothers obtained on the Bruker spectrophotometer. Although bothinstruments are similar, they exhibited slight differences between

Table 5Significance test (p=0.05) of residuals for the calibration and prediction samples

Parameter Step Set samples Number of samples Average SD texp tcrit

IA 1 Calibration 19 0.00 0.31 0.00 2.08Prediction 23 −0.51 0.38 0.28 2.07

2 Calibration 22 0.00 0.36 0.00 2.08Prediction 28 0.16 0.66 0.05 2.05

3 Calibration 16 0.00 0.12 0.00 2.13Prediction 6 −0.27 0.39 0.29 2.57

IOH net 1 Calibration 46 0.00 0.75 0.00 2.01Prediction 27 −0.27 0.59 0.08 2.05

2+3 Calibration 49 0.00 0.64 0.00 2.01Prediction 40 0.28 0.98 0.05 2.02

spectra which precluded using the original models with the Brukerspectrophotometer. Thus, the samples analysed with the Brukermodel exhibited a positive shift in absorbance and a disparate distancebetween absorbance values.

In order to avoid the need to reconstruct the models, we usedPiecewise Direct Standardization (PDS) as implemented in thesoftware Opus, from Bruker, to convert the spectra recorded on thePerkin-Elmer equipment (master instrument) into equivalent spectraon the Bruker equipment (slave instrument). The spectra to betransformed were obtained from resins in the first production step.The goodness of the results was found to depend on the appropriate-ness of the samples used in the transference; also, accurate transfer ofspectrawas found to require analysing aminimumnumber of sampleswith both instruments. The specific samples used were selected byapplying the Kennard–Stone algorithm to the calibration set employedto construct the original model for OHV (Fig. 3).

A set of 20 samples was deemed adequate to ensure correcttransformation of the original spectra. Fig. 4 shows a selectedspectrum recorded on the Perkin-Elmer spectrophotometer, onetransferred from this instrument and another recorded on the Brukerspectrophotometer. As can be seen, the transferred spectrumwas verysimilar to the Bruker spectrum (the correlation coefficient betweenthe two was very close to 1); this enabled the use of the originalcalibration models with spectra recorded on the Bruker instrument.

Once the calibration transfer model was established with the PDSalgorithm, it was applied to the Perkin-Elmer spectra used to constructthe original multivariate calibrationmodel and also to those employed

Fig. 3. Scores plot obtained from a PCA of the first-derivative spectra over the 4000–10000 cm−1 range for resin samples in the first production step.

Fig. 4. NIR spectra for a sample as recorded on the Perkin-Elmer and Brukerinstruments, and transferred spectrum obtained from the original spectrum recordedon the former.

122 M. Blanco et al. / Microchemical Journal 90 (2008) 118–123

in its validation. This was done under the same conditions as regardsspectral treatments, wavenumber ranges and number of factors aswith the original model. The new model was used for prediction withboth the transferred spectra for the validation set of the original modeland spectra recorded on the Bruker instrument in order to assess thequality of the models upon transfer of the original spectra.

Table 6 shows the RSEC and RSEP for the acid value and hydroxylvalue as obtained by using the original models constructed fromPerkin-Elmer spectra and those established from transferred spectraand the same parameter values as in the original models. Also, thetable lists RSEP for an independent set of samples analysed with theBruker (slave) equipment and predicted by using the modelsestablished from transferred spectra. As can be seen, the prediction

Table 7Characteristics of the calibration models obtained from spectra for the resins in step 1 reco

Parameter Step Spectral pretreatment Spectral range (cm−1) PLS fact

IA 1 1st Derivative 6550–5316 45206–49704926–45784418–4204

IOH net 1 1st Derivative 5352–4600 3

Table 8Figures of merit of calibration and prediction with the calibration models obtained by usiinstrument

Parameter Step Set samples Number of samples C

IA 1 Calibration 19 1Prediction 23 1Prediction Bruker 53 1

IOH net 1 Calibration 46 1Prediction 27 1Prediction Bruker 88 1

Table 6Comparison of the models obtained from the original spectra and those constructed from t

Step Parameter Model with original Perkin-Elmer spectra

Y explained variance % RSEC% RSEP%

1 IA 98.27 2.82 2.39IOH net 98.18 2.82 2.39

(Samples of the first phase of the condensation process).

errors in AV and OHV obtained with the models based on transferredspectra exceeded those provided by the original models (slightly forAV and by 1.5% for OHV).

The explained variance of the models constructed from transferredspectra was substantially lower than that of the original models for AV(92.32% vs 97.34%) and only slightly lower (97.78% vs 98.18%) for OHV.

The RSEP value for the samples analysed on the Bruker equipmentwas slightly higher than that obtained by using transferred spectrafrom the Perkin-Elmer equipment (viz. 4.33% vs 3.12% for AV and 4.37%vs 4.08% for OHV.

In any case, the results provided by the new models met theaccepted specifications.

We constructed new models intended to improve the resultsobtained by using transferred spectra under the same conditions aswith the original model. To this end, we used the same samples as inthe original models in combination with various spectral ranges andspectral treatments (SNV and first derivative) in order to obtainpredictions with both the transferred spectra for the validation set ofthe original model and others recorded on the Bruker instrument.Table 7 shows the figures of merit of each model, and the calibrationand prediction errors for the models. The improvement obtained withrespect to the models based on transferred spectra under the sameconditions as in the original model was insubstantial — less than 1%for AV at best; however, the OHV model was simpler (three factorsinstead of the four used in the original model).

Table 8 shows the figures of merit of the models based ontransferred spectra. As can be seen, there were no systematic errors inthe new predictions: the slope and intercept of the calibration andprediction lines were all close to 1 and 0, respectively, and containedboth values in their confidence intervals.

4. Conclusions

Near infrared spectroscopy is a simple, rapid alternative to conven-tional analytical techniques for industrial control of the production ofpolyester resins. ThePLSmodelsdeveloped in thisworkallowtheaccurate

rded on the Perkin-Elmer instrument and transferred to the Bruker instrument

ors Y explained variance % RSEC% RSEP% RSEP% Bruker samples

97.24 1.92 2.74 3.27

98.55 2.75 3.98 4.10

ng transformed spectra obtained from those originally recorded on the Perkin-Elmer

oncentration range (mg KOH/g) Slope Offset R2

3.6–22.0 0.97±0.08 0.48±1.47 0.974.9–19.3 1.05±0.17 −1.08±3.06 0.883.6–22.0 0.92±0.09 1.35±1.63 0.886.1–36.0 0.98±0.04 0.45±1.07 0.989.4–34.4 1.07±0.10 −1.51±2.80 0.956.1–36.0 1.08±0.09 −1.17±2.06 0.97

ransferred spectra

Model with transferred Perkin-Elmer spectra

Y explained variance % RSEC% RSEP% RSEP% Bruker samples

92.32 3.20 3.12 4.33 (n=53)97.78 3.11 4.08 4.37 (n=88)


determination of two key chemical parameters for the resins, namely: theacid value and the hydroxyl value, which are usually employed to controlthe manufacturing process.

The PLS models studied were found to possess a good predictiveability and to result in insignificant differences from reference values.

Therefore, the proposed calibration models can facilitate controlof the amounts of raw materials loaded into the reactor, expose theneed to add more acid or glycols — by reference to a previouslytabulated range of acid values and hydroxyl values — at the earlystages of the process and provide accurate information about itsdevelopment.

The spectral transfer algorithm used allows one to rapidlytransform models based on spectra recorded on a given instrumentfor use on another with no appreciable loss of predictive ability; thiscan save much time and expense.

References

[1] K. Othmer, Encyclopedia of Chemical Technology, 4th ed.Willey, 2001 (CD ROM),(Vol 19).

[2] Annual Book of ASTM Standards, American Society for Testing and Materials,Philadelphia, 2005 (Section 06.03).

[3] T. Kobayashi, M. Nakamura, Y. Uchiya, S. Yoshida, DIC Tech. Rev. 8 (2002) 13–18.[4] O. Laine, P. Vainiotalo, H. Osterholm, H. Jarvinen, Eur. J. Mass Spectrom. 7 (1) (2001)

15–23.[5] S.M. Hunt, M.M. Sheil, P.J. Derrick, Eur. Mass Spectrom. 4 (6) (1998) 475–486.[6] M. Blanco, V. Villaescusa, Talanta 71 (2007) 1333–1338.[7] H. Martens, T. Naes, Multivariate Calibration,Wiley, London,1989 (chapters 2 and 7).[8] D. Kleinbaum, L. Kupper, K. Muller, Applied Regression Analysis and other

Multivariate Methods, 2nd ed.Pws-Kent, Boston, 1988.[9] D.L. Massart, B.G.M. Vandeginste, L.M.C. Buydens, S. De Jong, P.J. Lewi, S. Smeyers-

Verbeke, Handbook of Chemometrics and Qualimetrics: Part B, Elsevier, TheNetherlands, 1998 349 pp.

[10] O.E. De Noord, Chemometr. Intell. Lab. Syst. 25 (1994) 85–97.[11] R.A. Heikkaa, K.T. Immonena, P.O. Minkkinen, E.Y.O. Paateroa, T.O. Salmib, Anal.

Chim. Acta 349 (1997) 287–294.[12] E. Marengo, M. Bobba, E. Robotti, M. Lenti, Anal. Chim. Acta 511 (2004) 313–322.[13] T. Fearn, J. Near Infrared Spectrosc. 9 (4) (2001) 229–244.[14] Y. Wang, D.J. Veltkamp, B.R. Kowalski, Anal. Chem. 63 (1991) 2750–2756.[15] A. Savitzky, M.J.E. Golay, Anal. Chem. 36 (1964) 1627.[16] R.J. Barnes, M.S. Dhanoa, S.J. Lister, Appl. Spectrosc. 113 (1988) 1849.[17] R.W. Kennard, L.A. Stone, Technometrics 11 (1969) 137–148.[18] H. Martens, M. Martens, Food Qual. Prefer. 11 (2000) 5–16.

ARTICULOS

165

7.2) DEVELOPMENT OF A

UNIVARIATE CALIBRATION

MODEL FOR PHARMACEUTICAL

ANALYSIS BASED ON NIR

SPECTRA

M.Blanco, J.Cruz, M. Bautista

Analytical and bioanalytical chemistry 392 (2008).

pp.1367–1372

ARTICULOS

166

ORIGINAL PAPER

Development of a univariate calibration modelfor pharmaceutical analysis based on NIR spectra

M. Blanco & J. Cruz & M. Bautista

Received: 10 July 2008 /Revised: 18 September 2008 /Accepted: 19 September 2008 / Published online: 15 October 2008# Springer-Verlag 2008

Abstract Near-infrared spectroscopy (NIRS) has beenwidely used in the pharmaceutical field because of itsability to provide quality information about drugs in near-real time. In practice, however, the NIRS technique requiresconstruction of multivariate models in order to correctcollinearity and the typically poor selectivity of NIRspectra. In this work, a new methodology for constructingsimple NIR calibration models has been developed, basedon the spectrum for the target analyte (usually the activeprinciple ingredient, API), which is compared with that ofthe sample in order to calculate a correlation coefficient. Tothis end, calibration samples are prepared spanning anadequate concentration range for the API and their spectraare recorded. The model thus obtained by relating thecorrelation coefficient to the sample concentration issubjected to least-squares regression. The API concentra-tion in validation samples is predicted by interpolating theircorrelation coefficients in the straight calibration linepreviously obtained. The proposed method affords quanti-tation of API in pharmaceuticals undergoing physicalchanges during their production process (e.g. granulates,and coated and non-coated tablets). The results obtainedwith the proposed methodology, based on correlationcoefficients, were compared with the predictions of PLS1calibration models, with which a different model is requiredfor each type of sample. Error values lower than 1–2% wereobtained in the analysis of three types of sample using thesame model; these errors are similar to those obtained byapplying three PLS models for granules, and non-coated

and coated samples. Based on the outcome, our methodol-ogy is a straightforward choice for constructing calibrationmodels affording expeditious prediction of new sampleswith varying physical properties. This makes it an effectivealternative to multivariate calibration, which requires use ofa different model for each type of sample, depending on itsphysical presentation.

Keywords NIR spectroscopy . API determination .

Correlation coefficients . PLS calibration

Introduction

Near-infrared spectroscopy (NIRS) is widely used in manyareas in the agrifood [1], petrochemical [2], chemical [3],and pharmaceutical fields [4]. The ability to analyse samplesin a non-destructive, non-invasive manner, in addition to theneed for minor or no sample pretreatment and the expedi-tiousness with which spectral data can be acquired, haveboosted industrial development of NIRS as an advantageousalternative to other instrumental techniques [5].

NIR spectra consist of strongly overlapped, broadabsorption bands and are often highly correlated, whichrequires the use of a powerful chemometric tool to extractrelevant information from them. Chemometrics is so closelyassociated with NIR spectroscopy that this technique wouldnever have progressed to the extent it has without theavailability of effective multivariate techniques for process-ing NIR spectral data. In fact, the joint use of NIRS andsome chemometric algorithms has enabled the developmentof a number of qualitative and quantitative methods ofanalysis. Multivariate calibration methods involving thereduction of variables such as PLS and PCR [6] are amongthe most widely used for processing spectral data and

Anal Bioanal Chem (2008) 392:1367–1372DOI 10.1007/s00216-008-2426-9

M. Blanco (*) : J. Cruz :M. BautistaDepartament de Química, Unitat de Química Analítica,Universitat Autònoma de Barcelona,08193 Bellaterra,Barcelona, Spaine-mail: [email protected]

relating spectroscopic signals (predictor variables) to targetvariables (analyte concentrations, usually). These methods,which share the advantages of least-squares methodology,use inverse, indirect calibration procedures and afford theanalysis of one or more analytes in a mixture without theneed to know all of its components. Also, they use the wholeinformation contained in NIR spectra, which they compressinto a reduced number of variables; this facilitates construc-tion of models, and detection of interferents and outliers.

Identifying specific analytes against a library containingthe spectra for a large number of compounds is possible byusing a correlation coefficient (CC) as discriminatingcriterion; however, discriminating between spectroscopical-ly very similar compounds also requires use of pattern-recognition methods [7]. The ease of calculation ofcorrelation coefficients and the ability to use them withlibraries holding the spectra for large numbers of com-pounds have led to their widespread use. However, exceptfor a chemical imaging study [8], this statistic seems tohave never been used for quantitative purposes in spectro-scopic analysis, even though it provides a measure ofsimilarity between data sets and has been employed inuniformity studies [9] and in distinguishing polymorphs[10]. One of the most interesting uses of correlationcoefficients is two-dimensional correlation spectroscopy[11], which allows the small spectral changes induced by anexperimental perturbation to be magnified.

The spectra for two similar compounds will have a near-unity correlation coefficient; also, the more dissimilar thespectra are, the lower will be their CC [12]. Therefore, thehigher the content of a component in a mixture of two is,the higher will be CC between the spectrum for the mixtureand that for the pure component; in other words, CC willincrease with increasing proportion of the componentconcerned in the mixture. Although no precise mathematicalexpression relating the correlation coefficient between amixture and a pure component to the component concentra-tion exists, one can expect the relationship to be linear over anarrow concentration range; such a range should allow linearunivariate calibration graphs to be constructed by relating theCCs between a set of NIR spectra for a series of samples andone of their components to the concentration of thecomponent in question. Constructing the model, however,will require having the spectrum for the pure component.

The correlation coefficient is a statistic quantifying therelationship between two consecutive variables and isdefined as the ratio of the covariance to standard deviationfor each variable:

CC ¼ Cov x; yð ÞSxSy

ð1Þ

If x and y represent the spectra for two compounds(sample and API, respectively), then CC, which is a mea-

sure of similarity between the two, can be expressed insimplified form as:

CC ¼Pl

xl � xð Þ yl � yð ÞffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiPl

xl � xð Þ2Pl

yl � yð Þ2r

or; alternatively;CC ¼Plxlyl

ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiPlx2lPly2l

rð2Þ

Substituting spectroscopic data into this equation andassuming fulfilment of Beer’s law leads to an expressionreflecting direct proportionality between the spectral con-tribution of the analyte (absorbance) to the sample spectrumand its concentration:

CC ¼ K A� A0ð ÞCaþ K 0 ð3ÞWhere K and K′ are two constants, that contain terms

with the absorbance of the analyte and the averagedconcentration of the samples used in calibration, and Aand A′ are the absorbance/concentration proportionalitycoefficients for the analyte and matrix, respectively.Therefore, similarity between the sample and analyte willincrease with increasing spectral contribution of the analyteand hence with increasing correlation coefficient.

In this work, we assessed the usefulness of univariateanalysis in the form of a linear relationship between theabove described correlation coefficient and concentrationfor determining the API content of pharmaceuticalproducts based on NIR spectral data. The correlationcoefficients between the sample and analyte spectra wereused to establish a linear relationship with API concen-tration via least-squares regression. The predictions thusobtained were compared with the results of multivariate(PLS) calibrations.

Experimental

Pharmaceutical preparation

The end-product was a coated tablet containing 93 mg g−1

API (dexketoprofen), PH101 microcrystalline cellulose(500 mg g−1) as major excipient, and three other, minorexcipients (maize starch, carboxymethyl starch, and glyc-erol distearate, the latter two being added to the granulatedproduct).

The preparation is obtained in two steps involving wetgranulation of a mixture of the API, microcrystallinecellulose, and maize starch, and subsequent addition ofthe other excipients to the granulate. The final mixture ishomogenized, pressed into tablets, and coated with a thin

1368 M. Blanco et al.

film of lacquer. The tablets are cylindrical in shape andweigh an average of 270 mg.

Samples

We used samples collected during the pharmaceuticalproduction process in order to both construct the calibrationmodel and assess its predictive ability. In addition, we usedlaboratory-made samples to expand the concentration rangeof the samples in the calibration set.

Calibration samples

The samples included in the calibration set were granulatesto which the remaining excipients were added. Suchsamples spanned a narrow API concentration range, sosome were underdosed by addition of a placebo and someoverdosed by addition of API. In this way, the initialconcentration range was expanded by ±20% around thenominal API content (93 mg g−1).

Prediction samples

The prediction set consisted of samples obtained in the twosteps of the production process, namely: granulates frombatches not included in the calibration set, uncoated tablets(cores), and coated tablets. In addition, the prediction setincluded coated tablets milled to a particle size similar tothat of the granulated samples.

All preparation samples and components were suppliedby Laboratorios Menarini (Badalona, Spain).

Recording of NIR spectra

NIR spectra were recorded on a model 6500 spectropho-tometer from FOSS NIRSystems (Silver Springs, MD,USA) equipped with a Rapid Content Analyzer (RCA)module and controlled via the software Vision v. 2.51. Eachspectrum was the average of 32scans obtained at 2 nmintervals over the wavelength range 1100–2498 nm. Aceramic plate was used to record a reference spectrum priorto each sample spectrum.

Reflectance spectra for granulated (production, under-dosed, and overdosed) samples were obtained in triplicateby placing appropriate aliquots in a quartz cuvette andturning them over between successive recordings. Anaverage spectrum was obtained from each triplicaterecording for use in subsequent calculations.

The spectra for production tablets, cores, and coatedtablets were recorded on both sides of each sample; to thisend, each tablet was placed directly on the quartz windowof the recording module. The average spectrum for the twosides was used in subsequent calculations.

UV reference spectrum

The API content of the production samples was determinedby ultrasonicating ca. 0.25 g powdered sample in 90 mLMilli-Q water at 37°C for 15 min and diluting to 100 mL. A2-mL aliquot of the supernatant was then diluted to 50 mLwith 3:1 MeOH–water and its spectrum was recorded. TheAPI concentration in the solution was calculated byapplying multiple linear regression (MLR) to the 210–400 nm region of the UV spectrum, using the spectrum forpure dexketoprofen in MeOH–water as standard.

The API content of the underdosed and overdosedsamples were calculated by weighing of the API andplacebo, once the API content of the granulated sampleswere known.

NIR data processing and software

Calibration models were constructed by using variousspectral treatments including the standard normal variate(SNV), and the first and second Savitzky–Golay derivativesas obtained with an 11-point spectral window and a second-order polynomial. The calibration graph was constructedfrom the three replicate measurements of each sample. Spec-tral treatment was performed by use of the software Vision.

The goodness of the calibration curve was assessed byanalysis of variance (ANOVA) and also by analysis of theresidual distribution; if the distribution exhibits randomdispersion, then the function will be linear throughout theconcentration range. The goodness of prediction wasassessed in terms of the relative standard error (RSE):

RSE %ð Þ ¼

ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiPmi¼1

yi � yi� �2

Pmi¼1

yið Þ2

vuuuuut � 100

Correlation coefficients were calculated and linearregression done by using a Microsoft Excel spreadsheet towhich spectra were transferred from the software Vision.

Results and discussion

The primary purpose of this work was to develop aunivariate calibration model based on the correlationcoefficient as predictor variable and amenable to applica-tion to all types of pharmaceutical samples.

Figure 1a shows the absorbance spectra and Fig. 1b thesecond-derivative spectra for a sample of granulate andAPI. We calculated the correlation coefficient (CC) betweenthe spectra for the calibration set and that for the API, and

Development of a univariate calibration model for pharmaceutical analysis based on NIR spectra 1369

then the least-squares regression statistics for the coeffi-cients and the concentration of each sample in the set.

Obtaining a calibration curve capable of providingacceptable predictions entailed ensuring that the correlationcoefficient between the samples with the extreme concen-trations would be as disparate as possible, since a widerange of CCs would facilitate discrimination betweensimilar concentrations.

We studied various spectral treatments and calculated theCCs between the spectra for the samples with the extremeconcentrations and that for the API. Table 1 shows the CCranges spanned by the results obtained with the differenttreatments. The high similarity between the spectra for thesamples and that for the API resulted in a high CC in theabsorbance mode (r = 0.920). However, derivation ofthe spectra reduced CC values and substantially increasedthe difference between the extreme samples. This led us touse second-derivative spectra to calculate CCs in subse-quent tests.

We also sought to identify a particular spectral regionpotentially affording a wider CC range, but none was foundto improve on the results provided by the whole spectrum.Consequently, we chose to use the entire wavelength rangeand second-derivative spectra in order to construct thecalibration model.

To this end, a total of 15 samples spanning the APIconcentration range 73.7–123.2 mg g−1 were used incombination with least-squares methodology. The contentuniformity values accepted by the pharmacopoeias are in arange of label claim ±15%. The concentration range wasspanned to ±20% the label claim value, to ensure that thecalibration model can predict correctly in the whole rangefor content uniformity determination.

Table 2 shows the statistical figures of merit of theregression curve (slope and intercept, their respectiveconfidence ranges, the coefficient of determination, etc.).

The triplicate spectra for each sample were used toconduct an ANOVA on the regression curve in order tovalidate the proposed model. Table 2 shows the results,which testify to the accuracy of the model.

Having samples from different steps of the productionsample allowed us to check the proposed model on them.We assessed the predictive ability of our model bypredicting samples with both chemical and physicalvariability.

Fig. 1 Spectra of production samples (granulated, and coated andnon-coated tablets) and API in absorbance (a) and second derivative(b) modes

Table 1 Correlation coefficient range between spectra of calibrationsamples and API

Pretreatment Correlation coefficient range Difference

None (absorbance) 0.904–0.920 0.016SNV 0.904–0.920 0.0161st Derivative 0.136–0.245 0.1092nd Derivative 0.228–0.369 0.141

Table 2 Figures of merit of univariate calibration model

Calibration model

Spectral pretreatment 2nd DerivativeSpectral range (nm) 1110–2490Concentration range (mg g−1) 73.7–123.2Calibration samples 15Equation (CC vs. concentration)Slope (360±1) × 10−5

Intercept (356±90) × 10−4

r 0.9991Standard error (Sy/x) 0.0023ANOVA testSSLOF SS PE SS REG SStotal2.917 × 10−4 3.778 × 10−4 2.636 2.637F exp F tab0.59 2.59


Figure 1 shows the spectra for uncoated tablets (cores)and coated tablets. As can be seen, the absorbance spectrawere very similar and their second derivatives even moreso; therefore, the predictions of the model were notsignificantly different from the reference values. Table 3shows the prediction results and Fig. 2 the residuals of thepredictions as a function of the reference values as determinedby UV spectrophotometry. As can be seen, predictions werequite acceptable (RSEP was always less than 2%); also, the

model was subject to no systematic errors—residuals wererandomly distributed—so it can be effectively used to monitorthe pharmaceutical production process.

PLS calibration models for the same preparation devel-oped elsewhere were found to be applicable to a single typeof sample only [13]. We used such models with the samesamples and sample types employed in the previous testsand obtained the RSEP values listed in Table 3; theresiduals for the validation samples are shown in Fig. 2.Based on the results of a t-test on the residuals betweenmethods, the predictions and residuals of our univariatemodel were not significantly different from those for themultivariate models. This suggests that the proposedunivariate model is an effective, advantageous alternativeto multivariate methodology for this purpose, whichrequires using one model per sample type.

Conclusions

The proposed methodology provides univariate calibrationmodels capable of predicting API contents of samples from

Fig. 2 Plot of residuals of prediction samples applying both univariate and PLS models

Table 3 Prediction errors for different samples using univariate andPLS models and t test for differences between the results obtainedfrom both models

Sample type Granulated Non-coatedtablets

Coatedtablets

Number of samples 8 10 13API range (mg g−1) 79.0–110.0 90.7–92.9 90.4–93.5RSEP (%) C.C. PLS C.C. PLS C.C. PLS

1.08 1.56 1.91 1.57 1.43 0.91Test t (n=31)t tab t exp2.03 1.98

Development of a univariate calibration model for pharmaceutical analysis based on NIR spectra 1371

different steps of pharmaceutical production processes;also, it is computationally simpler than multivariatemethods as all calculations can be done on an Excelspreadsheet rather than requiring complex software for thispurpose. The CC focuses on the chemical variability insamples, reducing to a large extent the influence of physicalproperties such as particle size or conditions such astableting pressure. In addition, a single univariate modelaffords accurate prediction of samples subjected to dispa-rate physical treatments, which facilitates the use of NIRspectroscopy to monitor pharmaceutical manufacturingprocesses. Moreover, the calibration set need not containany samples of the same type as those to be determined,which simplifies its construction. The consequences ofphysical effects on the samples, which are transferred tospectra (e.g. as scattering differences), require that multi-variate models use production samples in order to ensureacceptable predictions subject to no systematic errors.

However, the proposed method has some disadvantagesthat restrict universal application to all types of sample. Thus,it requires the pure spectrum for the target compound—whichis usually no problem in pharmaceutical analysis, a high con-centration of API in order to ensure large enough differencesin CC between the samples in the selected content range,and an analyte spectrum as different as possible from thatfor the matrix (placebo).

Overall, the proposed methodology should be highlyuseful in the pharmaceutical field as some of its restrictionscan be easily overcome and it affords control of thedifferent steps of the production process by using a singlemodel rather than one per sample type.

Acknowledgements The authors are grateful to Spain’s MCyT forfunding this research within the framework of Project CTQ2006–12923.

References

1. Lafargue ME, Feinberg MH, Daudin JJ, Rutledge DN (2003) AnalBioanal Chem 375:496–504

2. Macho S, Larrechi MS (2002) Trends Anal Chem 21:799–8063. Jiang B, Dong Huang Y (2008) J Reinf Plast Comp 26:1625–16364. Blanco M, Bautista M, Alcala M (2008) J Pharm Sci 97:1236–12455. Blanco M, Vilarroya I (2002) Trends Anal Chem 21:240–2506. Martens H, Naes T (1989) Multivariate calibration. Wiley, London7. Frasson Scafi SH, Pasquini C (2001) Analyst 126:2218–22248. Jovanovic N, Gerich A, Bouchard A, Jiskoot W (2006) Pharm Res

23:2002–20139. Moes JJ, Ruijken MM, Gout E, Frijlink HW, Ugwoke MI (2008)

Int J Pharm 357:108–11810. Patel AD, Luner PE, Kemper MS (2001) J Pharm Sci 90:360–37011. Peng Y, Wu P (2004) Polymer 45:5295–529912. Asuero AG, Sayago A, Gonzalez AG (2006) Crit Rev Anal Chem

36:41–5913. Blanco M, Bautista M, Alcalà M (2008) AAPS Pharm Sci

Technol (in press)


ARTICULOS

173

7.3) NIR-CHEMICAL IMAGING

STUDY OF ACETYLSALICYLIC

ACID IN COMMERCIAL TABLETS

J.Cruz, M. Bautista, J.M Amigo, M.Blanco

Talanta 80 (2009) pp.473–478

ARTICULOS

174

N

Ja

b

a

ARRAA

KNHAAM

1

sastaisss

(md

w

0d

Talanta 80 (2009) 473–478

Contents lists available at ScienceDirect

Talanta

journa l homepage: www.e lsev ier .com/ locate / ta lanta

ir-chemical imaging study of acetylsalicylic acid in commercial tablets

ordi Cruz a, Manel Bautista a, José Manuel Amigo b, Marcel Blanco a,∗

Unidad de Química Analítica, Departamento de Química, Facultad de Ciencias, Universitat Autónoma de Barcelona, 08193 Bellaterra, Barcelona, Espana, SpainDepartment of Food Science, Quality & Technology, University of Copenhagen, Rolighedsvej 30, DK-1958 Frederiksberg-C, Denmark

r t i c l e i n f o

rticle history:eceived 24 March 2009eceived in revised form 30 June 2009ccepted 2 July 2009vailable online 10 July 2009

eywords:IR-CIyperspectral imagingcetylsalicylic acidspirin tabletsCR-ALS

a b s t r a c t

Near Infrared Chemical Imaging (NIR-CI) is demonstrating an increasing interest in pharmaceuticalresearch since it meets the challenging analytical needs of pharmaceutical quality and may serve as aversatile adjunct to conventional NIR spectroscopy in many fields.

The direct analysis of samples by using hyperspectral imaging techniques, which provide a NIR spectrumin each pixel of the image, generates a big amount of information from one sample. Focusing the interest inpharmaceutical research, several chemometric algorithms are demonstrating their usefulness extractingthe relevant information (i.e. quantitative determination of the component in one sample) in tablets withonly one sample and without damaging it.

In this work, a quantitative method to analyze different commercial Acetylsalicylic acid tablets isproposed by using Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) method to thehyperspectral image and without any previous calibration model. For this purpose, a large concentra-tion range of active pharmaceutical ingredient (ASA, Acetylsalicylic acid in this work), between 82% and
12%, was covered depending on the manufacturer. MCR-ALS allowed obtaining a concentration maps foracetylsalicylic acid and therefore, consequent analysis of the ASA distribution in the tablet was developedby using the histograms of the distribution of concentration.
Results certified the good distribution of ASA despite the different origins of the tablets. Moreover, theobtained values of concentration showed a very good concordance with the nominal value of ASA. As amatter of fact, the quality of the results demonstrated the useful of encompassing NIR-CI techniques with

tly, th
MCR-ALS and, consequen
. Introduction

Once conventional spectroscopy techniques have been demon-trated to be a useful tool in pharmaceutical technology providinghigh number of publications praising this technique [1–4], hyper-

pectral imaging techniques have appeared with the aim not onlyo cover weak points in conventional spectroscopic techniques butlso to extend the knowledge in this field [5–8]. Hyperspectralmaging techniques result especially attractive because of the pos-ibility of providing huge spectral and spatial information of oneample (up to 82,000 spectra per sample) in a short time analy-is.

Among all Imaging techniques, Near Infrared-Chemical ImagingNIR-CI) has been confirmed to be an excellent tool to extract infor-

ation of high quality of the sample surfaces, being applied in veryiverse fields [9–14].

The greatest capacity of NIR-CI technique has drawn attentionithin the pharmaceutical field where robust methods are continu-

∗ Corresponding author.E-mail address: [email protected] (M. Blanco).

039-9140/$ – see front matter © 2009 Elsevier B.V. All rights reserved.oi:10.1016/j.talanta.2009.07.008

e well development on the production of Acetylsalicylic acid tablets.© 2009 Elsevier B.V. All rights reserved.

ously demanded to obtain information of the quality of products inall the stages of the manufacturing process. Concerning this aspect,the final assessment of the quality in the final tablet (i.e. obtainingboth quantitative and information about the spatial distribution ofthe components) is becoming a key-point in where NIR-CI is startingto gain importance [15].

Despite the benefits of NIR-CI in pharmaceutical research, thereexists still a gap between the acquisition of the hyperspectral imageand the treatment of such amount of information. In this sensesome multivariate models have been previously used and tested,as Principal Component Analysis (PCA) [5,16,17], providing valu-able initial information that helps to focus the further quantitativeanalysis.

On the other hand, quantitative analysis of pharmaceuticalsamples using NIR-CI has been performed using techniques as Par-tial Least Squares Regression (PLS) or PLS-Discriminant Analysis(PLS-DA) [18–21]. However, these techniques require a complete
calibration set of samples with the corresponding time consuminguntil the calibration model is performed and adequately tested.
Concerning the quantification purposes without needing a pre-vious calibration model, Classical Least Squares (CLS) may bepresented as an alternative, since CLS only requires the pure spectra

http://www.sciencedirect.com/science/journal/00399140

http://www.elsevier.com/locate/talanta

mailto:[email protected]

dx.doi.org/10.1016/j.talanta.2009.07.008

474 J. Cruz et al. / Talanta 80 (2009) 473–478

Table 1Description of the 10 commercial ASA tablets analyzed.

Commercial brand Nominal ASA (mg) Diameter (mm) Tablet weight (g) Calculated concentration (%) Main excipient

A.A.S 100 100 82 0.227 44.13 ManitolA.A.S 500 500 134 0.864 57.88 ManitolBayer 500 500 120 0.609 82.06 MCCAdiro 100 100 72 0.135 73.86 MCCAdiro 300 300 102 0.409 73.28 MCCAspirina C* 400 258 3.235 12.37 –Dolmen* 500 242 3.399 14.71 –Aspirine Nicholas 500 120 0.624 80.13 MCCBioplak 250 250 70 0.348 71.84 MCCB 0

M

omctabv

sRvi[tdtc

ttdptaLdb

ioplak 125 125 100

CC = microcrystalline cellulose.* Effervescent tablets.

f all the components of the tablet. This is not a problem in tabletsanufacturing, in where the pure spectra of the components are

ommonly available. Nevertheless, typical phenomena as interac-ion between analytes, illumination noise or moisture contributionsre important drawbacks that may CLS not to be as robust as it cane expected since the pure analytes do not recover the experimentalariation [20].

One alternative that does not require a specific calibrationet of samples has been recently proposed. Multivariate Curveesolution-Alternating Least Squares (MCR-ALS) and its augmentedersion have been successfully applied to extract quantitativenformation of NIR Chemical Images in pharmaceutical samples20,22,23]. This augmented version consists in providing informa-ion to the initial sample, helping the method to solve the inherentrawbacks of the Chemical Imaging measurement. Therefore, thisechnique presents a welcome alternative to quantify differentomponents in tablets without needing a specific calibration model.

The objective of this paper is demonstrating the capability ofhe NIR-CI to extract information of different samples withouthe application of chemical quantitative information studying theistribution of Acetylsalicylic acid in commercial tablets. For thisurpose, commercial tablets of Aspirin from 10 different manufac-
urers and different content of Acetylsalicylic acid were selectednd studied by means of Multivariate Curve resolution-Alternatingeast Squares. The consequent distribution of ASA content in eachifferent commercial tablet surface was also studied and comparedy using histograms.
Fig. 1. Scheme of MCR-ALS analysis (a) and augmented M

.173 72.09 MCC

2. Experimental

2.1. Reagents and instrumentation

2.1.1. Samples10 commercial tablets of Aspirin were used in this study and

purchased at the pharmacies. The ASA concentration for all thetablets was obtained by dividing the nominal content by the weightfor each tablet. The nominal concentrations of ASA in the differenttablets covered a wide range of concentration, from 82% to 12%.

The composition of the formulations is unknown and only theinformation, indicated in the brochure accompanying the differentpills each box or in the Vademecum guide [24], has been used inthis study. Table 1 shows the main features of each tablet.

Microcrystalline Celullose (MCC) is the main excipient in 6 of thepreparations; whereas manitol is the main excipient in the other 2tablets. Dolmen and Aspirina C are effervescent tablets and also con-tent ascorbic acid as active component and other known excipientsused in the formulation as citric acid, sodium carbonate and sodiumbicarbonate anhydrous.

2.1.2. Instrumentation
All tablets were measured obtaining a hyperspectral image of the
surface for each sample by using a “Think Spectrally Roda-25” NIRHyperspectral Imaging Spectrophotometer (Think Spectrally, Valen-cia, Spain). This instrument is a Focal Plane array (FPA) and it iscomposed by a Liquid Crystal Tunable Filter (LCTF) monochromator

CR-ALS (b) application to the hyperspectral cube.

J. Cruz et al. / Talanta 80

Fbb

aatp

siaiwtwr

where E (MN × �) corresponds to the experimental error matrix.

F(

ig. 2. Average spectra for each tablet after SNV pretreatment. Note: spectra haveeen shifted up or down in intensity in order to observe significant differencesetween them.

nd a Mercury Cadmium Telluride (MCT) detector which providesspectral range between 1000 and 2400 nm with 7 nm of spec-

ral resolution and a spatial resolution of 100 �m × 100 �m eachixel.

Three different areas of image were used depending on theize of the tablets: 15 × 15, 8 × 8 and 5 × 5 mm2. The total time ofmage acquisition was about 2 min. The lighting to the sample isvery relevant parameter in order to obtain quality images avoid-

ng noise related to a bad illumination. Therefore, 4 halogen lamps◦
ere focused to the sample place with a 45 orientation. Prior to
he registration of the images the calibration of the instrumentas performed by using 6 standards (FOSS AP-0200 NIR) covering

eflectance values from 99% to 0.2%.

ig. 3. Augmented MCR-ALS results for one commercial tablet (Aspirine Nicholas 500). (a)d) histogram of ASA concentrations.

(2009) 473–478 475

2.1.3. SoftwareAll the spectral pretreatments were applied by using home-

made routines programmed in MATLAB code (MATLAB v 7.0, TheMatWorks, Massachussetts) [18] and they are available via web [25].MCR-ALS software from the reference [26] working under MATLABwas used.

2.2. Hyperspectral images pretreatment

When a sample is registered with a Hyperspectral image device athree-dimensional array, X (M × N × �) is obtained being the M andN axis the spatial information and the � axis represents the spectralinformation. The three-dimensional structure of the hyperspectraldata cube requires a previous unfolding step to a bi-dimensionalmatrix, adapting the image for further pretreatments or any othermethod.

Once the images were unfolded several spectral pretreatmentswere applied to avoid the influence of undesirable phenomenacommonly found in NIR measurements. Thus, Standard NormalVariation (SNV), 1st and 2nd Savitzky–Golay Derivatives and alsosmoothing were applied.

2.3. MCR-ALS in imaging data

Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) [17,27] decomposes the unfolded matrix X (MN × �) into theproduct of two matrices, C (MN × A), containing the concentrationprofiles and ST (A × �), containing the spectral profiles for each Acomponent (Fig. 1a) (Eq. (1)):

X = CST + E (1)

The ALS optimization stops when the relative difference in lack offit (%LOF) values between consecutive iterations is below than athreshold value where e is each mnth element of the residual matrixE, and x is each mnth element of the X matrix. The threshold value

Spectral profiles for ASA; (b) spectral profiles for MMC; (c) concentration ASA map;

476 J. Cruz et al. / Talanta 80 (2009) 473–478

Table 2Results obtained for the 10 commercial tablets by using augmented MCR-ALS.

Tablet Nominal concentration (%) Augmented MCR-ALS concentration (%) Difference (%) Correlation ASA Correlation MCC Correlation manitol

A.A.S 100 44.13 53.32 9.19 0.984 – 0.946A.A.S 500 57.88 54.87 −3.01 0.966 – 0.926Bayer 500 82.06 81.57 −0.49 0.988 0.998 –Adiro 100 73.86 76.47 2.61 0.948 0.994 –Adiro 300 73.28 70.91 −2.37 0.949 0.977 –Aspirina C* 12.37 12.95 0.58 0.97 – –Dolmen* 14.71 16.44 1.73 0.951 – –ABB

o(

%

witv

hU

spirine Nicholas 80.13 76.96ioplak 250 71.84 71.34ioplak 125 72.09 67.84

* Effervescent tablets.

f LOF should be selected according to the noise in the spectra (Eq.2)):

LOF = 100 ×√∑M

m

∑Nn e2

mn�∑Mm

∑Nn x2

mn�

(2)

here emn� and xmn� represent each point of the residuals and orig-nal three way array, respectively. A very used criterion is to stop
he iterations when the difference between two consecutive %LOFalues is below 0.1%.
Before starting the iterations, initial estimates are required toelp the algorithm to converge to the absolute minimum error.sing the pure spectra of the components (if they are available)

Fig. 4. Concentration maps for ASA obtai

−3.17 0.963 0.997 –−0.5 0.993 0.997 –−4.25 0.986 0.994 –

as initial estimations becomes one of the most attractive ways ofincluding information about the sample. Other constraints can beused to correctly decompose the matrix when chemical images areanalyzed: (1) non-negativity in concentration and/or spectral pro-files, which imposes that concentration profiles of the componentsare supposed to be always positive; and (2) closure, where eachpixel can be supposed to accomplish a constant mass balance of 1,representing the totality of the concentration.

However, the quality of the images, which depends on the spatialand also spectral resolution, could be a disadvantage when MCR-ALS is applied since there could be lack of selectivity in the surfaceof the image. To overcome this problem an alternative has alreadybeen formulated: The augmentation of the original sample with

ned by using Augmented MCR-ALS.

J. Cruz et al. / Talanta 80 (2009) 473–478 477

distri

iaibamht

3

3

tetMdiosf

conwc

Fig. 5. Histograms for the ASA

mages of the pure analytes (Fig. 1b). The original idea consistednalyzing several samples simultaneously by augmenting all themages [17]. In the present work, the augmentation is performedy inserting images of pure components as it is shown in Amigond Ravn [20]. These images of pure components can be easilyeasured in the same way as the commercial tablet. This approach

elps to minimize the problem and offers valuable information tohe algorithm.

. Results and discussion

.1. MCR-ALS and augmented MCR-ALS analysis

Fig. 2 offers a first impression of the main differences betweenablets; these differences are expected since the composition ofach tablet depends on the different excipients; however, the spec-ral band of ASA (around 1680 nm) can be observed in all spectra.

oreover, the tablets AAS, Adiro and Bioplak can be distinguished inepending on the different origins, because they present very sim-

lar spectra between them and can be clearly distinguished fromther formulations. On the other hand, Dolmen and Aspirina C meanpectral profiles are very similar despite the fact that they comerom different manufacturers.

Several pretreatments were tested with the images, and the
ombination of SNV and smoothing average with a window sizef 7 points provided the best results. Prior to apply MCR-ALS,on-negativity of concentration profiles and closure constraintere applied as constraints. Despite the fact that the tablets were
omprised by a different number of components, closure constraint

bution on the surface tablets.

was applied taking into consideration the Active PharmaceuticalIngredient (ASA) and the main excipients for each of the tablet (MCCor Manitol for 8 tablets and the whole formulation for Dolmen andAspirina C). Therefore, the spectral profiles obtained by MCR-ALSwill provide information about the goodness of the decompositionof images. Moreover, ASA and the excipients used in this study pro-vided the highest spectral information and were used to performthe MCR-ALS analysis, while the minor excipients may be relatedwith the residual matrix. The pure spectra of the main componentswere included as initial estimations to start the iterations. The samemethodology has been followed when the augmented version ofMCR-ALS was applied, including 10 spectra for both analytes (ASAand major excipient) to the unfolded matrix in order to improvethe decomposition. To test the MCR-ALS decomposition, %LOF andcorrelation coefficient between pure spectra and obtained spectralprofile were used.

As an example, the %LOF of the MCR-ALS model applied toAspirine Nicholas 500 was 2.79%, explaining 99% of variance, indicat-ing the goodness of the model. Moreover, quantitative results fromthis tablet were accurate compared to the formulation percent-age (77.5% for ASA while theoretical value is 80.1%). Nevertheless,the correlation coefficient between the obtained spectral profile forASA and MMC with the pure spectrum was lower than 1 (0.76 and0.51 respectively).

To overcome this problem, the augmented version of MCR-ALS was applied. The augmentation was developed by includingselective information (10 pure spectra) for each component inthe image. The same pretreatments for the image and restric-tions were applied. The model obtained with Augmented-MCR

4 nta 80

Avtpmct

srctasc

3

bfgfAcMsLnetm

coitt

Aq0a0cv

wdmhbvas

stmrpnoc

[

[

[

[

[[

[

[

[

[

[[[

78 J. Cruz et al. / Tala

LS showed quite similar values for %LOF (3.55) and explainedariance (99.87%), providing also quite good results in the quan-itative analysis. As it can be seen in Fig. 3a and b, the spectralrofiles obtained with the augmented version of MCR-ALS perfectlyatched with the pure spectra of each compound. Correlations

oefficients between these spectra, shown in Table 2, are closedo 1.

The concentration map calculated for ASA using this modelhowed the distribution on the surface of the tablet and someegions with different concentrations of ASA. At first sight, ASAould be thought not to be well distributed in the tablet. However,he colour scale of this image showed a narrow range, between 0.70nd 0.78. Therefore, the ASA content in each pixel was similar ashowed the histogram of the concentration map with a distributionlose to a Gaussian distribution (Fig. 3d).

.2. Results for all the commercial tablets

Table 2 shows the quantitative results for the 10 tablets obtainedy using augmented MCR-ALS. The concentration for ASA in the sur-ace of the tablets was similar to the calculated value confirming theoodness of the quantitative analysis. Good results were obtainedor almost all of the samples (the spectral correlation between pureSA spectrum and the spectral profile for ASA in all samples waslose to 1 confirming the goodness of the application of augmentedCR-ALS). Tablets with Manitol as the main significant excipient

howed not so good results for the determination of ASA content.ooking at their correlation coefficients with Manitol, they wereot so close to 1. It might be caused by the influence of anotherxcipient with a high spectral relevance providing information tohe image, but avoiding the correct decomposition of the data

atrix.On the other hand, samples where the ASA content was lower

ould be waited to show bad predictive results. However, the usef all pure spectra allowed obtaining quite good results. Taking

nto account the fact that closure constraint was applied and inhese samples, ASA is not the most relevant spectral compound,he decomposition of the image could have been less successful.

Despite of using all the compounds in the analysis of Dolmen andspirina C, the correlation coefficients obtained were not of highuality. For Aspirina C the correlation coefficients obtained were.851 for Citric Acid, 0.957 for Ascorbic Acid and 0.995 for Carbon-te whereas for Dolmen the coefficients obtained were 0.856 and.823 for Ascorbic Acid and Carbonate respectively. However, ASAoncentration obtained in both tablets was truly similar with realalues.

All the concentration maps for ASA are depicted in Fig. 4,here different distributions of the ASA were observed. As already

escribed for the Aspirine Nicholas 500, the first impression might beisleading, because of the scale of the colour maps. Therefore, the

istogram for each ASA concentration map was depicted in Fig. 5 foretter interpretation. Ideally, one would expect a histogram whosealues were around the prediction values, and with a narrow vari-tion, implying that the whole surface of the tablet contained theame amount of ASA.

Looking at the histograms of the local concentration it was pos-ible to correctly visualize tablets with best ASA distributions. Thus,he tablets with narrowest ASA distribution were: Aspirine C, Dol-en, Bayer 500 (according to the prior conclusion). Although the

ange for ASA 100 tablet was not as narrow as for the other 3 sam-les, the distribution of concentration values remained close to aormal distribution. For the other samples, the visual inspectionf the concentration maps and the representation of histogramsonfirmed a less regular distribution for the ASA in the surface.

[[[

[

(2009) 473–478

4. Conclusions

Intact commercial tablets were analyzed by NIR-Chemical Imag-ing in order to determine de distribution of ASA and its ASAconcentrations for each tablet using the MCR-ALS decomposition.The quantification results in combination with the spectral profilesobtained provided information about of the 10 commercial tabletsquality.

MCR-ALS decomposition de applied to images to obtain accu-rate information of the surface demonstrated to be an appropriatetool to obtain quantitative information of ASA content on the sur-face of the tablets. In addition, the augmented version of MCR-ALSdemonstrated to be an outstanding methodology to overcome theproblems of MCR-ALS decomposition itself.

The distribution of ASA in the surface and the mean concentra-tion were correctly calculated without needing a calibration modelwith reference values. The quantitative results obtained were ofquality, especially for the tablets whose major ingredient was ASA.

The low time of analysis without altering the sample and thegood results obtained, make the combination of NIR-Imaging andMCR-ALS a very interesting approach in the pharmaceutical fieldfor the quality control assessment of final preparations.

Acknowledgement

The authors are grateful to Spain’s MCyT for funding thisresearch within the framework of Project CTQ2006-12923.

References

[1] J. Luypaert, D.L. Massart, Y.V. Heyden, Talanta 72 (2007) 865.[2] M. Blanco, M. Bautista, M. Alcala, Journal of Pharmaceutical Sciences 97 (2008)

1236.[3] S.S. Sekulic, H.W. Ward, D.R. Brannegan, E.D. Stanley, C.L. Evans, S.T. Sciavolino,

P.A. Hailey, P.K. Aldridge, Analytical Chemistry 68 (1996) 509.[4] O. Berntsson, L.G. Danielsson, B. Lagerholm, S. Folestad, Powder Technology 123

(2002) 185.[5] L. Zhang, M.J. Henson, S.S. Sekulic, Analytica Chimica Acta 545 (2005)

262.[6] F.C. Clarke, M.J. Jamieson, D.A. Clark, S.V. Hammond, R.D. Jee, A.C. Moffat, Ana-

lytical Chemistry 73 (2001) 2213.[7] J. Medendorp, R.A. Lodder, Journal of Chemometrics 19 (2005) 533.[8] F. Clarke, Vibrational Spectroscopy 34 (2004) 25.[9] E.N. Lewis, J. Schoppelrei, E. Lee, Spectroscopy 19 (2004).10] R.C. Lyon, D.S. Lester, E.N. Lewis, E. Lee, L.X. Yu, E.H. Jefferson, A.S. Hussain, AAPS

PharmSciTech 3 (2002) 1.[11] E.N. Lewis, J.D. Carroll, F.M. Clarke, NIR News 12 (2001) 16.12] N. Jovanovic, A. Gerich, A. Bouchard, W. Jiskoot, Pharmaceutical Research 23

(2006) 2002.13] T. Furukawa, H. Sato, H. Shinzawa, I. Noda, S. Ochiai, Analytical Sciences 23

(2007) 871.14] N. Elkhider, K.L.A. Chan, S.G. Kazarian, Journal of Pharmaceutical Sciences 96

(2007) 351.15] E.N. Lewis, L.H. Kidder, E. Lee, Innovations in Pharmaceutical Technology (2006).16] P. Geladi, H. Grahn, Multivariate Image Analysis, John Wiley & Son Ltd., New

York, 1997.17] A. de Juan, R. Tauler, R. Dyson, C. Marcolli, M. Rault, M. Maeder, Trac-Trends in

Analytical Chemistry 23 (2004) 70.18] J.M. Amigo, J. Cruz, M. Bautista, S. Maspoch, J. Coello, M. Blanco, Trac-Trends in

Analytical Chemistry 27 (2008) 696.19] C. Ravn, R. Bro, E. Skibsted, Journal of Pharmaceutical and Biomedical Analysis

48 (2008) 554.20] J.M. Amigo, C. Ravn, European Journal of Pharmaceutical Sciences,

doi:10.1016/j.ejps.2009.01.001 (accepted for publication).21] C. Gendrin, Y. Roggo, C. Collet, Talanta 73 (2007) 733.22] B.O. Budevska, S.T. Sum, T.J. Jones, Applied Spectroscopy 57 (2003) 124.23] K. Awa, T. Okumura, H. Shinzawa, M. Otsuka, Y. Ozaki, Analytica Chimica Acta

619 (2008) 81.
24] http://www.vademecum.es.25] http://www.models.kvl.dk/users/jose manuel amigo/index.htm.26] J. Jaumot, R. Gargallo, A. de Juan, R. Tauler, Chemometrics and Intelligent Labo-
ratory Systems 76 (2005) 101.27] A. de Juan, R. Tauler, Critical Reviews in Analytical Chemistry 36 (2006)

163.

http://dx.doi.org/10.1016/j.ejps.2009.01.001

http://www.vademecum.es/

http://www.models.kvl.dk/users/jose_manuel_amigo/index.htm

ANEXO

181

8. ANEXO

ANEXO

182

ANEXO

183

8. ANEXO

En el anexo se recogen los artículos publicados en fecha posterior a la aceptación

por parte de la Comissió de Doctorat de la presentación de la tesis como compendio

de publicaciones así como artículos pendientes de publicar.

1) Uniformity studies of commercial aspirin tablets by NIR-CI. J. Cruz, M. Blanco.

2) Distribution study of components and film coating in pharmaceutical tablets

by NIR-CI. M. Blanco, A. Palou, J. Cruz, M.Alcalà, J.Tomàs, J. de los Ríos.

3) NIR-CI study of Aspirin commercial tablets. J.Cruz, M. Blanco. Proceedings of

the 14th International Conference on Near infrared spectroscopy (Bangkok, 2009), NIR

Publications. ( pendiente de publicación)

ANEXO

184

ANEXO

185

8.1) UNIFORMITY STUDIES OF

COMMERCIAL ASPIRIN TABLETS

BY NIR-CI

J.Cruz, M.Blanco

ANEXO

186

ANEXO

187

Uniformity studies of commercial aspirin tablets by NIR-CI

J. Cruz, M. Blanco

Unitat de Química Analítica, Facultat de Ciencies, Universitat Autònoma de Barcelona,

08193 Bellaterra, Barcelona, Spain

Abstract

Near Infrared Chemical Imaging (NIR-CI) is arousing increasing interest in pharmaceutical

analysis by virtue of its ability to provide a wealth of information from a single sample.

Among others, NIR-CI has enabled the determination of the quantitative composition and

distribution of acetylsalicylic (ASA) from the analysis of commercial tablets. In this work,

we analysed ASA commercial tablets of four different brands purchased at local chemists.

The nominal ASA concentration for the brands was calculated from the nominal content and

weight of each tablet. The tablets were found to span an ASA concentration range of 71–

82%, and to differ in size and composition between brands.

The API content and its uniformity were determined by applying quantitative algorithms to

to global hyperspectral image and to each one for ten tablets. Multi¬variate Curve

Resolu¬tion–Alternating Least Squares (MCR–ALS) and Isys-PLS1 (commercial Malvern

software named PLS1) were used to quantify each pixel in the images to obtain appropriate

concentration maps. No prior calibration or reference data were needed for quantitation.

Both algorithms provided very similar results that were close to the nominal concentrations

used as references. Application to an image for 10 tablets and an individual tablet

quantita¬tion of the API allowed us to obtain the Accepted Value (AV) as defined by the

European Pharmacopoeia. We conclude all brands were found to meet the specifications.

ANEXO

188

Keywords: NIR-CI; Hyperspectral imaging; Acetylsalicylic acid; Aspirin tablets;

Distribution homogeneity; Content uniformity; MCR–ALS; Isys-PLS1.

1. Introduction

The inception of hyperspectral imaging techniques has facilitated not only addressing some

problems unaffordable by conventional NIR spectroscopy but also developing new

applications to obtain a more comprehensive knowledge about some samples and improving

some existing procedures. The NIR-CI technique has been successfully used in a variety of

fields ranging from the food industry [1] to legal medicine [2] to cultural heritage [3].

The use of NIR-CI as a new operational methodology in pharmaceutical analysis has grown

substantially in recent years and turned the technique become an accurate, robust choice for

pharmaceutical control and the determination of quality-related properties of formulations at

different production stages. The increasing interest aroused by this technique has reflected in

the development of a number of applications including the determination of distribution

homogeneity in tablets [4], mixing homogeneity in powder samples [5], content uniformity

in tablets [6], coating studies [7] and particle size [8], among others.

The ability of NIR-CI to extract quantitative and distribution-related information about

tablet components has turned it into a PAT tool [9] and facilitated quality assurance in the

end-product [10].

A hyperspectral image consists of a three-dimensional data cube where two dimensions are

spatial coordinates (pixels) and the third contains spectral information (wavelengths);

therefore, it provides one spectrum per pixel and hence a vast amount of both spatial and

ANEXO

189

spectral information (usually more than 80.000 spectra per sample) that can be acquired in a

very short time (1–2 min). Such a vast amount of data obviously requires the use of an

efficient chemometric method to extract the physical or chemical information of interest in

each case.

Many of the algorithms used with conventional NIR spectroscopy have also been used to

process 3D data arrays in order to extract qualitative and quantitative information. The

actual usefulness of each algorithm for this purpose depends on the particular problem

addressed and also on the specific information available. Therefore, the optimum algorithm

differs between applications.

The algorithms most frequently used in conventional NIR analysis, PLS and PCR, require

using a set of calibration samples to construct an appropriate prediction model. This sample

preparation is laborious, which constitutes an important limitation for its application.

Nevertheless, some applications for PLS have been described for the API determination in

pharmaceutical samples and components in binary samples (lysozyme and trehalose

mixtures) [11, 12].

Classical Least Squares (CLS) methodology [13] may be an effective, attractive choice here

inasmuch as it requires no calibration set, but only the pure spectra for the sample

components. This, however, may hinder application of NIR-CI when the sample

composition is not accurately known.

Some alternative algorithms requiring no calibration set have proved effective in those cases

where the exact composition of the sample is unknown or the spectrum for some component

is unavailable. Thus, Multivariate Curve Resolution–Alternating Least Squares (MCR–PLS)

methodology [14] and its expanded version have been successfully used to extract

quantitative information from pharmaceutical samples by use of an imaging technique

ANEXO

190

[4,15]. Therefore, MCR–ALS can in theory be an effective tool for quantifying

pharmaceutical components without the need for a calibration model, but simply to use the

spectra for the major components of the product in pure form.

Some authors have used the software Isys 5.0 from Malvern named PLS1 (Isys-PLS1),

which uses the pure spectra for the formulation components as calibration information [16-

18]. This algorithm constructs a spectral matrix for the pure components and a response

matrix consisting of the digits 1 and 0, which are used to indicate membership and non-

membership, respectively, to the class for each pure component (this software act as PLS-

discriminant). Applying the algorithm to the spectra constituting an image provides a

concentration map for each modelled sample component; together with the corresponding

histograms, the concentration maps provide a highly useful tool for establishing the

distribution of each component in the sample.

This article continues an study applied to the resolution of hyperspectral images of

commercial tablets [4], but regarding against other applications, an unique image of 10

tablets has been used. Only the publication of Lee et al [6] undertakes a similar study, but

the purposed quantification method is very simple and its application is restricted to some

particular situations for the determination of API, but it does not make a study on the

distribution of excipients.

This study pretends to compare the analytical quality of the results obtained by the

application of two quantitative algorithms and in its difficulty of application (purposing as a

standard for the treatment of hyperspectral images).

ANEXO

191

The last objective is to define the appropriate method to approach the problem of the

quantitation and distribution studies in pharmaceutical tablets, without previous information

to undertake this study.

The content uniformity tests are used for proving the uniform distribution of the active

content in a production batch. It is performed by measuring the active content of n

individual dosage units.

Additionally the determination of content uniformity, defined by the European

Pharmacopoeia [19], by using a single hyperspectral image of 10 tablets will be studied, as

an alternative to the traditional methods which can be supposed as an important

improvement in the speed and easiness of this test.

2. Materials and methods

2.1. Samples

The samples studied were commercial aspirin tablets of four different brands that were

purchased at local chemists. The acetylsalicylic acid (ASA) concentration in each tablet was

calculated by dividing the nominal content into the average weight of 10 tablets. The

concentrations thus obtained ranged from 71 to 82 wt%. One additional criterion used in

selecting brands for study was tablet size.

The exact composition of each formulation was unknown and the sole information available

in this respect (the nature of the major excipient, which was microcrystalline cellulose in the

four brands) was obtained from the Vademecum [20]. Table 1 summarizes the

characteristics of the studied tablets.

ANEXO

192

Table 1. Features of commercial Aspirin tablets.

Commercial Brand

Nominal ASA (mg)

Diameter (mm)

Mean tablet Weight *(g)

Calculated Concentration (%)

Main Excipient

Bayer 500 500 120 0.6037 82.8

Adiro 100 100 72 0.1368 73.1

Bioplak 250 250 100 0.3427 73.0

Bioplak 125 125 70 0.1751 71.4

MCC

* 10 tablets per commercial brand.

2.2. Instruments

All images were obtained with a Roda-25 focal plane imaging NIR spectrometer from Think

Spectrally (Valencia, Spain), equipped with an MCT 320x256 pixel detector and an LCTF

monochromator spanning the wavelength range 1200–2400 nm with a resolution of 7 nm.

Lighting was provided by four halogen lamps placed around the sample and tilted 45�.

Acquiring a reflectance image spanning the whole wavelength range took about 2 min. The

distance between the camera lens and sample plate was adjusted in accordance with whether

the image to be recorded should contain ten tablets of different size for each brand (see table

1).

2.3. Software

We used the graphical user interface (GUI) software TS_Capture, bundled with the

Hyperspectral TS camera, from Think Spectrally, to control the camera and lighting for the

acquisition of images. The hardware was calibrated by using TS_GUI, a graphical user

interface for MatLab also bundled with the camera.

All spectral treatments were applied by using customized routines developed in MATLAB

code (MATLAB v. 7.0, The MatWorks, Massachussetts) available for download on the

ANEXO

193

Internet [21]. The MCR–ALS software used, which also operates under MATLAB, was

obtained elsewhere [22].

The Isys-PLS1 algorithm was implemented with the software Isys 5.0 from Malvern

Instruments (Malvern, UK).

2.4. Recording of images

The recording of images was preceded by calibration of the instrument with six AP-0200

NIR standards of 99, 80, 40, 20, 10 and 0.2% reflectance from FOSS NIRSystems (Silver

Springs, MD). Images were obtained with 7 nm resolution over the wavelength range 1200–

2100 nm.

Recording the images for 10 tablets at once (Figure 1 ) entailed placing the sample plate at a

greater distance from the camera lens and refocusing it to ensure as high optical resolution

as possible. This allowed a spatial resolution of 200200 μm2 and a total image size of

6550 mm2 to be obtained.

Placing the samples farther from the lens in order to widen the focal field altered the lighting

angle of the lamps and the amount of light impinging on the sample. This required

recalibrating the camera.

The images for pure acetylsalicylic acid and microcrystalline cellulose (the major excipient

in the four formulations) were obtained by placing the powder samples in a cylindrical glass

cell about 3.8 cm in diameter and pressing their surface with a metal disc to obtain a flat

surface.

ANEXO

194

2.5. Processing of hyperspectral images

The hyperspectral image for a sample is a 3D data cube represented by the expression

X = (M x N x λ), where M and N are the spatial dimensions and λ denotes spectral

information. The three-dimensional nature of the image requires its deconvolution into a

two-dimensional matrix in order to facilitate spectral processing or application of a

multivariate model.

The influence of unwanted phenomena frequently affecting NIR spectra was suppressed by

using two different spectral treatments, namely: Standard Normal Variate (SNV), and

Savitzky–Golay smoothing with a 7-point window and fitting to a second-order polynomial.

The treatments were followed by application of the previous chemometric algorithms to the

data matrix.

The theoretical foundation of the Multivariate Curve Resolution–Alternating Least Squares

(MCR–ALS) algorithm and its expanded version, and their application to hyperspectral

images, are widely documented; interested readers can find comprehensive information

about it elsewhere [10, 14, 15]. The unfolded matrix obtained from each image was

expanded with 50 spectra for the API and 50 for microcrystalline cellulose (MCC).

Application of the Isys-PLS1 algorithm to the spectral data, required the prior compilation

of a reference library containing at least one spectrum per target component. The spectra in

the library were used to construct a PLS classification model that was subsequently applied

to the hyperspectral images. The resulting model assigned a classification score ranging

from 0 to 1 to each sample. Application of the Isys-PLS1 model to the image for the tablets

provided a concentration map for each component stored in the library.

ANEXO

195


Each image was processed with the above-described calibration algorithms on the grounds

of the characteristics of the samples and available information. The camera was used to

obtain images for ASA and MCC, and their spectra used as rough estimates for the two

computational algorithms. Spectra were subjected to various treatments, and SNV and

Savitzky–Golay smoothing with a 7-point window found to provide the best results.

Computations with the MCR–ALS algorithm were subjected to concentration non-

negativity and closure restrictions. Although the tablets contained different components, the

closure restriction was applied with provision for the API (ASA) and major excipient

(MCC) alone. Because the original unfolded matrix resulted in poor fitting, it was expanded

with 50 spectra for each analyte (ASA and MCC); this expanded matrix afforded better

fitting and more accurate determination of both components.

The Isys-PLS1 algorithm was used to construct models based on various factors. The

images for pure ASA and MCC were used to compile a library of spectra obtained from a

central zone in each image containing about 100x100 pixels. Such a library was used to

construct Isys-PLS1 models with 4–8 PLS factors depending on the analyte to be quantified

which were subsequently applied to the hyperspectral images. In this way, concentration

maps where the intensity of each pixel was measured by the predicted degree of similarity

(on a scale from 0 to 1) for the spectrum at the pixel in question with respect to the reference

spectra. A similarity of 0 meant that the component was absent, and a value of 1 that the

component was present at a 100% concentration at the pixel concerned. The red color in the

reported images is indicative of an increased concentration of the particular component.

ANEXO

196

The API quantitation has been done by two different ways: by applying the quantitative

algorithm to the complete image of the 10 tablets (mean batch value) or by selecting the part

of the image that corresponds to each individual tablet (study of content uniformity).

The structure of the images is shown in Figure 1, with the 10 tablets spatially distributed;

the hyperspectral image contains apart from the spectra corresponding to each one of the

tablets, the spectra corresponding to the background. These background spectra are a

limitation for the correct calculation of concentrations, the elimination of background

spectra is performed by a routine of Isys 5.0 getting the image ready for the application of

Isys-PLS1. The application of MCR-ALS requires the use of unfolded data matrices, for this

purpose a MatLab routine [22] is applied to the data cube. and the unfolded matrix of

tablets spectra is obtained.

Figure 1. Concentration maps and histograms for ASA and MCC calculate with MCR-ALS.

After these algorithms have been applied, the mean concentration value of 10 tablets of the

batch is obtained; the values obtained by the application of both algorithms are shown in

Table 2. The mean values calculated by Isys batch-PLS1 and MCR-ALS are very similar to

ANEXO

197

each other although the former are more close to the nominal values. Only Bioplak 125

values calculated with MCR-ALS show discrepancies that do not exceed 2%.

Table 2. MCR-ALS and PLS1 results for mean batch ASA concentration

Tablets Nominal concentration (%)

PLS1 Mean Batch Value

MCR-ALS Mean Batch Value

Bayer 500 82.8 83.6 82.7

Adiro 100 73.1 73.5 73.8

Bioplak 250 73.0 73.8 72.7

Bioplak 125 71.4 73.4 69.4

An alternative for determining the concentration, is the individual analysis of each tablet

which concentrations were calculated by cropping the image for each tablet and removing

the background. The elimination of background spectra is performed for each cropped

image from a tablet in the same way that has been explained before for the global analysis of

10 tablets.

Application of both models to commercial tablets of four different brands provided similar

results (see table 3); however, the calculated concentration ranges ─and hence their standard

deviations─ were narrower with PLS than with MCR. The average concentrations provided

by both algorithms were within the confidence interval for the nominal value used as

reference.

The size of the tablets is an important parameter to frame 10 tablets in the visual field of the

hyperspectral camera, the different sizes of tablets require distance changes between the

sample plate to the camera lens to get a correct focused image. These optical configuration

changes also can affect the intensity of incident light on the 10 tablets which can affect the

quality of the images and finally their quantitation.

ANEXO

198

Summarizing, the application of both quantitation algorithms to, both individual and joint,

commercial tablets of four different brands provided similar results.

3.1. ASA and MCC distribution in the tablets

Figure 1 shows the concentration map for and ASA and MCC as calculated with the MCR–

ALS algorithm, as well as the histograms for a Bayer 500 aspirin tablet, obtained from the

image for 10 tablets. As can be seen, both components were evenly distributed throughout

the image and no API or excipient clustering zones were observed. Also, the histograms for

both reveal a very narrow range of concentration values and a maximum close to the

average predicted value. These results suggest that ASA and MCC are uniformly distributed

in the tablets showing an appropriate homogenization of API and main excipient in the

samples. Those observations about homogeneity of distribution can be extended for Adiro

100, Bioplak 250 and Bioplak 125.

However, the figure exposes some deficiencies in distribution at image edges which can be

ascribed to inadequate lighting of the 10 tablet samples; this resulted in a poor hyperspectral

image that hindered proper resolution of tablet edges with the quantitation algorithms. No

similar effect was observed on the hyperspectral images for individual tablets [4], which

were acquired under better lighting and resolution conditions. The effect was especially

marked in the image for the larger tablets (Bayer 500 and Bioplak 250) and less so in that

for the smaller tablets (Adiro 100 and Bioplak 125).

This shortcoming can be avoided by using an instrument with greater spatial resolution and

more uniform lighting of the object.

The concentration maps obtained with Isys-PLS1 were virtually identical with those

provided by MCR–ALS as regards spatial distribution of ASA and MCC in the tablets.

ANEXO

199

Also, the histograms exhibited a very narrow concentration distribution with a maximum

close to the average predicted value.

3.2. Content uniformity

Content uniformity was assessed from the 10 tablet image for each brand, using the

recommendations of the European Pharmacopoeia. Table 3 show the results obtained for

each tablet as obtained by using the two algorithms. The tables list the average nominal

value for the 10 tablets of each brand, the calculated value obtained from the average for the

10 tablets, the standard deviations of the concentrations and the Acceptance Value (AV) as

defined by the European Pharmacopoeia.

Table 3. MCR-ALS and Isys-PLS1 results for content uniformity test

Isys-PLS1 MCR-ALS

Tablets Nominal concentration (%)

Mean Value

Range Values

Std. deviation

Acceptance value

Mean Value

Range Values

Std. deviation

Acceptance value

Bayer 500 82.8 83.3 84.8-82.1 0.9 1.3 82.4 84.0-79.4 1.5 1.9

Adiro 100 73.1 73.5 77.1-70.3 2.0 2.6 72.6 76.5-68.1 2.5 4.4

Bioplak 250 73.0 73.7 76.1-71.2 1.9 4.7 72.7 77.9-68.7 2.7 1.9

Bioplak 125 71.4 72.6 74.9-69.4 1.9 7.6 69.7 74.7-67.2 2.2 12.9

A.V. limit for n=10 is 15

The European Pharmacopoeia recommends assessing content uniformity by computing AV

and comparing it with a previously established limit for the acceptance range [19]. AV is

calculated from the following equation

AV=|M − X |+k•s

ANEXO

200

where M is the reference value, X the average value for individual tablets, k a constant equal

to 2.4 for n = 10 and s the standard deviation. The content uniformity requirement is

assumed to be met if AV for the first dosing units examined is equal to or less than 15.

As can be seen from Table 3, the AV values obtained for the four brands were all below 15,

so the brands can be deemed compliant with the requirements of the European

Pharmacopoeia. Also, the only brand exhibiting a relatively high AV value was Bioplak 125

with the MCR–ALS algorithm; such value (12.9), however, was still below the limit (15).

These results are not conclusive enough to identify the better quantitation algorithm; in fact,

although Isys-PLS1 provided slightly better values, the AV predictions and their standard

deviations were very similar with MCR–ALS. In any case, they confirm that a single image

allows one to certify content homogeneity in a tablet batch.

4. Conclusions

As shown here, NIR-CI affords the analysis of intact tablets by using exclusively

quantitative information about their excipients. The MCR–ALS and Isys-PLS1 algorithms

are effective with a view to extracting quantitative information from images and only

require the spectra for the pure API and major excipient as references.

The procedure used in his work allows one to obtain distribution images for both

components in individual tablets, and hence to assess distribution homogeneity and confirm

it against a concentration histogram. The Isys-PLS1 algorithm provides slightly better

results than the MCR–ALS algorithm in this respect.

A single image for 10 tablets allows one not only to determine the API concentration in

each, but also to assess content uniformity in a production batch as per the

ANEXO

201

recommenda¬tions of the European Pharmacopoeia. This makes the proposed procedure

more simple and expeditious than available alternatives for the same purpose.

In summary, the results of this work further testify to the increasingly prominent role of

chemical imaging techniques as QbD choices and their significance to PAT.

5. Acknowledgements

The authors are grateful to Spain's MICINN for funding this research within the framework

of Project CTQ2009-08312.

6. References

[1] E.N. Lewis, J. Dubois, L.H. Kidder, in Y.Ozaki, W.F. McClure, A. Christy (Eds.), NIR imaging and its applications to agricultural and food engineering, Wiley-Interscience, 2006 Ch. 4.3. [2] C. Petibois, G. Deleris, Trends in Biotechnology. 24 (2006) 455-462. [3] G. Verhoeven, Journal of Archaeological Science. 35 (2008) 3087–3100. [4] J. Cruz, M. Bautista, J.M. Amigo, M. Blanco, Talanta. 80 (2009) 473. [5] J.M. Amigo, J.Cruz, M.Bautista, S.Maspoch, J.Coello, M.Blanco, Trends in Analytical Chemistry. 27 (2008) 696. [6] E. Lee, W.X. Huang, P. Chen, E.N. Lewis, R.V. Vivilecchia, Spectroscopy. 21 (2006) 24-32. [7] C.Cairós, J.M.Amigo, R.Watt, J.Coello, S.Maspoch, Talanta. 79 (2008) 657-664. [8] W. Li, A. Woldu, R. Kelly, J. McCool, R. Bruce, H. Rasmussen, J. Cunningham, D. Winstead, International Journal of Pharmaceutics. 350 (2008) 369–373. [9] E.N. Lewis, L.H. Kidder, E. Lee, Innovations in Pharmaceutical Technology (2006) 17. [10] J.M. Amigo, C. Ravn, European Journal of Pharmaceutical Sciences. 37 (2009) 76–82. [11] N. Jovanovic, A. Gerich, A. Bouchard, W. Jiskoot, Pharm. Res. 23 (2006) 2002–2013. [12] C. Gendrin, Y. Roggo, C. Collet, Talanta. 73 (2007) 733. [13] M. B. Lopes, J. C. Wolff, J. M. Bioucas-Dias, M. A. T. Figueiredo, Analytica Chimica Acta, 641 (2009) 46-51. [14] A. de Juan, R. Tauler, R. Dyson, C. Marcolli, M. Rault, M. Maeder, Trends in Analytical Chemistry. 23 (2004) 70.

ANEXO

202

[15] K. Awa, T. Okumura, H. Shinzawa, M. Otsuka, Y. Ozaki, Analytica Chimica Acta. 619 (2008) 81. [16] L.J. Makein, , L.H. Kidder, E.N. Lewis, M. Valleri, NIR News. 19 (2008) 11-15. [17] T. Puchert, D. Lochmann, J.C. Menezes, G. Reich, Journal of Pharmaceutical and Biomedical Analysis. 51 (2010) 138–145. [18] S. Chevallier, D. Bertrand, A. Kohler, P. Courcoux, J. Chemometrics. 20 (2006) [19] European Council (Ed.), European Pharmacopeia 6 th edition, 2008b. Uniformity of dosage units. Vol 1 (2008) Ch. 2.9.40, pp.327–330. [20] http://www.vademecum.es [21] http://www.models.life.ku.dk/~jose/ [22] J. Jaumot, R. Gargallo, A. de Juan, R.Tauler, Chemometrics and Intelligent Laboratory Systems. 76 (2005) 101.

ANEXO

203

8.2) DISTRIBUTION STUDY OF

COMPONENTS AND FILM

COATING IN PHARMACEUTICAL

TABLETS BY NIR-CI

M. Blanco, A. Palou, J. Cruz, M.Alcalà, J.Tomàs,

J. de los Ríos

ANEXO

204

ANEXO

205

Study of the distribution of drug components and film coatings in pharmaceutical

tablets by NIR-CI

Marcelo Blanco,a Anna Palou,a Jordi Cruz,a Manel Alcalà,a Jaume Tomàs,b Joaquín de los

Ríosb

a Unitat de Química Analítica, Departament de Química, Facultat de Ciències, Universitat

Autònoma de Barcelona, 08193 Bellaterra, Barcelona, Spain

b Esteve Farma, c/ San Martí s/n, 08197 Martorelles, Barcelona, Spain

ABSTRACT

The growing interest of the pharmaceutical industry in Near Infrared-Chemical Imaging

(NIR-CI) is a result of its high usefulness for quality control analyses of drugs throughout

their production process (particularly of its non-destructive nature and expeditious data

acquisition). In this work, we determined the concentration and distribution of the

components of pharmaceutical tablets, in addition to their coating thickness and distribution,

from NIR-CI data. Images were processed to extract the target data and calibration models

constructed by using the Partial Least Squares (PLS) and Isys-PLS1 algorithms. The

component concentrations obtained for uncoated cores were essentially identical with the

nominal values for the pharmaceutical formulation. On the other hand, the predictive ability

of the models used with coated tablets decreased with increasing coating thickness. Based

on the results, the tablet components (API and excipients) are uniformly distributed in the

tablet core and its coating.

Keywords: NIR-CI; Hyperspectral imaging; Component distribution; Tablet coating; Isys-

PLS1; PLS regression.

ANEXO

206

1. Introduction

Near Infrared-Chemical Imaging (NIR-CI) is a technique based on conventional NIR

spectroscopy with the added advantage that it affords recording of a large amount of both

spectral and spatial information in a single image. While the conventional NIR technique

only provides the average spectrum for the surface of each sample, NIR-CI gives one

spectrum per pixel in each acquired image and hence much more information about the

whole sample surface (Gowen et al., 2007). The ease with which such information can be

obtained with NIR-CI has aroused interest in NIR-CI in many fields of study. This is

particularly so with the analysis of pharmaceutical products, which is made especially easy

by NIR-CI by virtue of its ability to acquire a vast amount of information in an expeditious

manner, all without altering the sample. The increasing interest aroused by NIR-CI in the

pharmaceutical field is apparent from the variety of studies based on this technique reported

in recent years. Such studies include the homogeneity of powder samples (Ma et al., 2008),

particle size determinations (Li et al., 2008), product composition (Lopes et al., 2009), the

determination of the concentrations and distribution of components in solid tablets (Cruz et

al., 2009) and content uniformity (Gendrin et al., 2007), among others. Also, the many uses

of NIR-CI in the pharmaceutical industry have been the subject of two interesting reviews

(Gowen et al., 2007; Reich, 2005).

One other important factor influencing the quality of solid pharmaceuticals is their

coating. Lacquer coatings on commercial tablets have been the subject of some study

(Cairós et al., 2009; Maurer et al., 2009), but not so much as pharmaceutical components

despite their significance (Maurer et al., 2008). The coating film applied to a drug tablet is

primarily intended to improve its aesthetics and function. Thus, the coating allows the

unpleasant taste of some APIs to be masked and facilitates swallowing of tablets, in addition

to preserving their integrity and giving them a uniform appearance. Some coatings,

however, are intended to facilitate the controlled or enteric release of the dosage form of a

drug (Hogan, 2004). In any case, the exact function of a coating depends largely on its

ANEXO

207

thickness and distribution on the tablet surface. In fact, too thin or too thick a coating can

alter the effectiveness of a tablet by making the core more vulnerable to external factors or

diminishing the API release rate. Simply measuring the average thickness of the lacquer

film on a tablet is inadequate to ensure that the tablet will meet the specifications; rather,

this requires obtaining more information about the way the coating is distributed throughout

the tablet surface. The capabilities of the NIR-CI technique in this respect make it a suitable

choice for quality control in tablet production processes. However, the vast amount of

information contained in a hyperspectral image requires the use of an effective procedure to

extract it. In fact, hyperspectral data form a three-way cube that must be unfolded and

processed with appropriate two-way multivariate algorithms in order to extract the target

information.

In those cases where some component of a pharmaceutical is unknown or a spectrum

unavailable, algorithms requiring no calibration set are especially useful; such algorithms

include Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) (Zhang,

2005) and its augmented form (Amigo et al., 2008). However, the process involved in

extracting information from chemical images can be slow and cumbersome. One alternative

choice in wide use for the quantitative analysis of CI data is Partial Least Squares (PLS)

(Ravn et al., 2008). This algorithm uses a series of data distributed over a wide enough

range of specific values of the target property to allow the construction of a suitable

calibration model for the samples to be analysed. A faster, easier alternative is provided by

Isys-PLS1 (Makein et al., 2008). With this algorithm, each image is assigned a response

matrix based on the similarity of its spectra with those for the pure components. The choice

of algorithm in each case is dictated by the available and the target information.

The primary purpose of this work was to establish the distribution of components in a

tablet and the thickness and surface distribution of its coating. To this end, individual

calibration models for the components were used to construct their distribution map and a

ANEXO

208

calibration model derived from the NIR-CI hyperspectral image was used to establish the

map for the lacquer film.

2. Material and methods

2.1. Samples

We studied three different types of samples, namely: (a) cores (uncoated tablets), (b) tablets

with a coating of variable thickness and (c) production tablets. The coated tablets (b)

included samples with film thicknesses 50–300% the nominal value for the production

tablets (100%).

All cores had the same API and excipient composition, namely: 35% API and 65%

excipients. The excipient mixture contained 40% of excipient #1, 20% of excipient #2, 2%

of excipient #3, 1.5% of excipient #4 and 1.5% of excipient #5. The API and the two major

excipients in combination accounted for 95% of the tablet content. The presence of the

lacquer in the coated tablets obviously reduced the proportions of API and excipients to a

extent dependent on the coating thickness. Table 1 shows the resulting changes in the major

components.

Table 1.- Composition (% w/w) of API and the two major excipients at different coating levels.

Composition reference values (% w/w)

Coating level (%)

0% 50% 100% 200% 300%

API 35.0 34.4 33.9 33.0 32.0

E #1 40.0 39.3 38.8 37.7 36.6

E #2 20.0 19.7 19.4 18.8 18.3

The samples in groups a and b were used to determine the concentrations of the tablet

components (API and excipients). Those in group b were used as calibration and validation

sets for the PLS models employed to characterize the coating, which were subsequently

applied to the production samples (group c).

ANEXO

209

2.2. Instrumentation

Images were acquired with a SyNIRgyTM Chemical Imaging System hyperspectral camera

from Malvern Instruments (Malvern, UK). The camera was equipped with an InSb detector

with a focal plane array of 320256 pixels and controlled via the software Pixys® 1.1., also

from Malvern. Samples were placed on the plate and lighted with halogen lamps arranged at

appropriate angles around the plate, the lens distance being adjusted according to the object

size. The images obtained under the selected conditions had a resolution of 40 μm (each

pixel covered an area of 40 40 μm). The acquisition time for a reflectance image spanning

the wavelength range 1200–2400 nm was about 3 min. Prior to acquisition of the image for

the sample (S), the camera was used to record one for the background (B, a reference

ceramic plate of 99% reflectance) and another for a dark reference (D, a mirror). The image

for the sample, S, was converted into reflectance data, R, by using the equation R = (S –

D)/(B – D). This calculation was done at every pixel in each image. The data thus obtained

were then converted into absorbance units.

Each core was used to record 6 different images: 4 of each outer side (A–D) and 2 of

the inner sides (E–F) which were establish by breaking the tablets as shown in Figure 1a.

The production samples were used to study the four outer sides only, which were designated

identically with those of the cores (A–D). On the other hand, each tablet in sample group b

was used to record 2 images (one from each of two opposite outer sides); as can be seen in

Figure 1b, each image included two identical sides for 2 tablets of also identical

characteristics (coating thickness). The images were not studied in their entirety, but rather

in selected rectangular areason the inner sides of each tablet in order to avoid image

distortions caused by light impinging on tablet edges.

ANEXO

210

Figure 1.- Schema of the tablet sides analyzed by hyperspectral imaging: a) cores and tablets and b) tablets with higher coating thickness. The selected area for analysis is highlighted with dark grey color.

The images for the pure compounds were obtained by placing an adequate amount of

each in a glass cell and gently pressing its surface prior to recording.

2.3. Data processing

The data in a hyperspectral image are arranged in a three-way data cube X(MNλ) two

dimensions in which (MN) hold spatial information while the third (λ) contains spectral

information.

Prior to application of any spectral treatment or algorithm to extract the required

information, the data cube must be unfolded into a two-dimensional matrix since most

existing treatments and algorithms have been developed for two-way data. The data matrices

thus obtained here from each image were processed with the Standard Normal Variate

(SNV) algorithm, which reduces artifacts arising due to tablet geometry and sample lighting

during the recording of images. All spectral treatments used were applied by using the

software Isys 5.0, from Malvern, with routines developed in MATLAB code (MATLAB v

7.0, The MathWorks, Natick, MA) http://www.models.life.ku.dk/~jose/ .

ANEXO

211

The resulting data matrix was subjected to the PLS1 algorithm in Isys 5.0 in order to

quantify the API and excipients. Application of the Isys-PLS1 model (Puchert et al., 2010)

only required the previous acquisition of the pure spectrum for each component to be

determined. Such a spectrum was used to construct both a library and the Isys-PLS1

classification model. The model was completed by selecting an appropriate thresholds and

number of factors. Using an increased number of factors increased the variance Y explained

by the model, but also the risk of overfitting; a compromise was therefore needed for an

optimal choice. The threshold used, which allows one to adjust the limits for discrimination

between classes, is a function of the similarity between the spectrum for each pure

component to be quantified and those for the other components in addition to the number of

factors previously selected. Application of the resulting model weighted the spectral data in

an image with a factor ranging from 0 to 1 depending on the similarity between the

spectrum for the pure component and the spectral library concerned. The result was

delivered as a concentration map for each component present in the library.

The PLS1 models used to determine the thickness of the tablet coating were

constructed by using the software The Unscrambler v. 9.8 from CAMO (Trondheim,

Norway). The PLS regression algorithm (Ravn et al., 2008) uses a calibration/validation set

of samples spanning the whole range of the target quantity; such samples should be of

identical nature as the prediction samples and have a known value for the property to be

modelled. The PLS1 model thus constructed was validated by cross-validation with jack-

knifing in order to identify the wavelength range most strongly correlated with such a

property. Then, the optimum number of factors was selected under the above-described

criteria.

ANEXO

212


As noted earlier, the aim of this study was to develop a quantitative method for the deter-

mination of tablet components and their distribution in the core and its coating from NIR-CI

data. Figure 2a shows the spectra for the different pure components of the studied pharma-

ceutical (viz. the API and 5 excipients). As can be seen, most of the spectra exhibited

marked differences that are confirmed by the pairwise correlation coefficients shown in

Table 2. The especially high coefficient between the spectra for excipients #2 and #4, 0.984,

required a greater effort in developing calibration models for these two components owing

to their close spectral similarity. Figure 2b compares the average spectra for a selected area

of a core and a coated tablet. As can be seen, spectral differences were minimal as a result of

the usually modest contribution of the coating layer. In our case, the lacquer resulted in a

slightly increased baseline in the average spectrum.

Table 2.- Correlation coeficient between the NIR spectra of the pure components (API and excipients).

Correlation coefficients

API E #1 E #2 E #3 E #4 E #5 API 1.000 E #1 0.810 1.000 E #2 0.621 0.601 1.000 E #3 0.693 0.603 0.849 1.000 E #4 0.640 0.588 0.984 0.903 1.000 E #5 0.823 0.693 0.669 0.847 0.740 1.000

ANEXO

213

Figure 2. Average NIR spectra obtained from all pixels of hyperspectral image. a) NIR spectra of API and excipients; b) Comparison between NIR spectra of a core and a coated tablet. 3.1. Quantitation of the API and excipients

Cores

We constructed a model to determine the concentration of the active principle and five

excipients present in the cores by using a Isys-PLS1 calibration model for each analyte. The

models were constructed by compiling a library containing the spectra for the pure compo-

nents to be quantified and applying the Isys-PLS1 algorithm with a variable number of

factors from 3 to 8 depending on the particular analyte. The concentrations thus obtained for

each core side studied are listed in Table 3.

ANEXO

214

Table 3. API and excipients concentration (% w/w) obteined from different sides of the same core, calculated with the Isys-PLS1 calibration model.

Core components (% w/w)

API E #1 E #2 E #3 E #4 E #5 Sum

Side A 35.51 38.93 20.15 1.97 1.48 1.47 99.51 Side B 35.45 39.46 21.12 1.98 1.48 1.51 101.00 Side C 37.11 38.45 19.69 1.99 1.53 1.53 100.30 Side D 37.45 40.38 20.14 1.95 1.53 1.51 102.96 Side E 31.66 44.16 18.62 1.95 1.48 1.51 99.38 Side F 31.47 43.38 19.31 1.97 1.55 1.53 99.21 Mean 34.78 40.79 19.84 1.97 1.51 1.51 100.40 St. Dev. 2.62 2.41 0.85 0.02 0.03 0.02 5.95

The model-predicted concentrations for each core side were very similar to the

nominal values for the API and the major and minor excipients. The low standard deviations

obtained testify to the high uniformity of the component mixture. Worth special note is the

fact that the combined proportions of the components on each side was close to 100% in all

cases, which suggest that the calibration models used provide accurate predictions.

However, there were slight differences in composition between sides for some components.

Thus, the concentrations of the two major components (API and excipient #1) on the inner

sides (E and F) in the cores departed from both the nominal values and the values for the

other sides; specifically, there was a decreased content in excipient #2 and, especially, the

API, and an increased content in excipient #1 that resulted in an also increased standard

deviation for the inner core sides. This result was observed in all cores and can be ascribed

to the increased roughness of the cut surface, which may influence the appearance of the

acquired images.

Figure 3 shows the concentration maps for the components on one of the outer sides

of a core as obtained with the Isys-PLS1 model. As can be seen, the distributions of

excipient #2 and the API were very similar, with areas of increased concentrations

coinciding with those on the tablet surface. On the other hand, the high-concentration areas

for excipient #1 were complementary with those for the API. This distribution pattern can be

ANEXO

215

ascribed to the fact that the API and excipient #2 are mixed together before the other

components are added. By contrast, the minor excipients were uniformly distributed across

the images. The API and excipient distributions observed on the other sides and cores

exhibited no significant differences from the previous side and exhibited identical patterns.

As can be seen from Table 3, this was so for both the outer and inner sides. Figure 3 shows

the histogram for each core component. The histograms for the minor excipients exhibited

an essentially narrow normal distribution; in fact, they were quite symmetric and sharp,

which reduced the significance of the heterogeneity observed in the concentration maps. On

the other hand, the histograms for the major excipients were much broader, which suggests

the presence of core zones with concentrations departing from the nominal (central) value.

The histograms for the API and excipient #2 were very similarly shaped, with tails on the

left; this is consistent with an abundance of pixels with concentrations below the nominal

value. By contrast, the tails in the histogram for excipient #1 were on the right, which

suggests an abundance of pixels with concentrations significantly exceeding the expected

value. In any case, the distributions were virtually near-normal, so the API and excipients

can be assumed to distribute uniformly in the cores.

ANEXO

216

Figure 3. Concentration distribution maps and histograms for API and excipients for side A of a core calculated by Isys-PLS1 model. In parentesis is showed the nominal concentration (% w/w) of each component.

ANEXO

217

Coated tablets

The API and excipients were also determined in tablets coated with a lacquer film of

variable thickness. To this end, we used Isys-PLS1 models based on an also variable

number of factors (3–6) depending on the particular analyte and coating thickness.

Table 4 shows the results obtained for two sides (A and B) of the same tablet but coated

to a different thickness with a lacquer film. The results are the averages for two tablets

coated with an identical proportion of lacquer and recorded in a single image. The

values for the minor components have been omitted because they exhibited high

deviations (50–30%) from the nominal values. As can be seen, the calculated

proportions for the three major components were very close to their respective nominal

values (Table 1) and, like these, decreased gradually with increasing coating thickness.

Obviously, deviations from the nominal values were especially high in the tablets with

the thickest coatings (200 and 300%); this was particularly so for excipient #2, which

was the least concentrated.

Table 4. Concentrations (% w/w) of API and two major excipients in tablets with different coating thickness, obtained with the Isys-PLS1 calibration model.

Tablet components (% w/w)

Coating level (%)

Tablet side

API E #1 E #2 A 35.25 40.74 20.20

0% B 35.67 39.46 21.34

A 35.85 40.30 19.67

50% B 35.31 40.27 20.36

A 34.56 40.80 20.79

100% B 35.20 40.18 21.64

A 33.15 39.15 17.95

200% B 32.95 42.40 15.31

A 30.85 38.51 12.65

300% B 29.65 39.78 14.03

ANEXO

218

Based on the previous results, the deviations in the calculated concentrations are

mainly the result of the lacquer coating, which affects the determination of the

concentrations of the major components and, especially, the minor ones.

3.2. Quantitation of the thickness of coating

The thickness of the coating is an important variable inasmuch as it can influence the

rate of dissolution of a tablet and also the quality of components quantitation. In this

work, tablet thickness was determined by using a PLS1 model constructed from the

average spectrum for each tablet side as a function of coating time. The nominal coating

time was assigned an arbitrary value of 100% and the modified coating thicknesses one

of 50, 200 or 300%.

A total of 10 images of tablets coated to a variable thickness (two tablets per

image) were used. The resulting spectra were averaged to obtain 4 spectra per thickness

(2 tablets per image and 2 sides per tablet). Three of the 20 spectra thus obtained were

discarded as outliers, 12 were used to construct the calibration set and 5 to validate it.

Each average spectrum in the calibration set was assigned a nominal coating

concentration of 0, 50, 100, 200 or 300%. These coating proportions were determined

from the increase in weight of the tablets upon coating.

The PLS1 model used was constructed by using various spectral treatments

(derivation, Savitzky–Golay, SNV) and ranges in order to ensure optimal fitting to the

validation set. The best results were obtained by processing data with the SNV

algorithm and using the entire spectral range. Under these conditions, a model with a

single factor accounted for 99.3% of the total variance. Such a PLS1 model, which is

described in detail in Table 5, was adopted for application to production samples.

ANEXO

219

Table 5. Figures of merit for the quantification of coating thickness obtained with the PLS1 calibration model.

PLS1 calibration model features

Number of calibration samples included

12

Spectral range (nm) 1200-2500 Spectral pretreatment SNV Factor 1 Y-variance 99.31 Number of validation samples included

5

RMSEP 14.04 RSEP (%) 8.32

Figure 4 shows the concentration maps for the tablet coating on the four outer

sides of a production tablet (table 1), which were processed with the previous PLS

model. A comparison of the four concentration maps reveals that the coating material

was quite uniformly distributed on all sides. There were, however, some points where

the predicted concentration was higher than those on the remainder of the surface. This

may have resulted from the formation of lacquer aggregates during the coating process.

Figure 4 additionally shows the histograms for easier analysis of the coating

distribution. Despite the broad bands and short tails on both sides, the graphs are all

near-normal and symmetric.

ANEXO

220

Figure 4. Concentration maps and histrograms (% w/w) for the four sides of one production tablet.

Table 6 shows the average coating values for each of the four studied sides on

two production tablets calculated with the above-described PLS1 model. Both tablet 1

(Figure 4) and 2 exhibited differences of up to 10% in lacquer content from the nominal

value between sides; however, the average for the four tablet sides was very similar to

the nominal value in all samples.

ANEXO

221

Table 6. Determination of coating thickness (% relative) in two production tablets applying the PLS1 calibration model.

Coating thickness (%) Tablet 1 Tablet 2 Side A 108.15 113.84 Side B 98.86 113.83 Side C 78.81 107.94 Side D 92.74 118.73 Mean (4 sides)

94.64 113.58

4. Conclusions

In this work, we assessed the potential for the NIR-CI technique for determining the

composition of coated and uncoated drug tablets, and the distribution of their

components. We found the Isys-PLS1 algorithm to be effective towards extracting

quality quantitative information from hyperspectral images without the need for

calibration against reference values, and also towards establishing the distribution of

tablet components. Conventional processing of the spectral data contained in an image

allows one to determine the thickness of the coating layer with a view to predicting

some pharmaceutical properties of the tablet. The expeditiousness with which it allows

tablets to be analysed, and the accuracy of its predictions, make the NIR-CI technique a

highly suitable choice for the determination of the quantitative composition of

pharmaceutical tablets, and for assessing uniformity in the distribution of its compo-

nents and surface coating. These advantages testify to the potential of NIR-CI for use in

at-line tests for the control of pharmaceutical production processes.

ACKNOWLEDGEMENTS

The authors are grateful to Spain's MICINN for funding this research within the

framework of Project CTQ2009-08312.

ANEXO

222

REFERENCES

Amigo, J. M., Cruz, J., Bautista, M., Maspoch, S., Coello, J., Blanco, M., 2008. Study of pharmaceutical samples by NIR chemical image and multivariate analysis. Trends in Analytical Chemistry. 27, 696-713. Cairós, C.,Amigo, J.M.,Watt,R., Coello, J., Maspoch, S., 2008. Implementation of enhanced correlation maps in near infrared chemical images: Application in pharmaceutical research. Talanta. 79, 657-664.

Cruz, J., Bautista, M., Amigo, J. M., Blanco, M., 2009. Nir-chemical imaging study of acetylsalicylic acid in commercial tablets. Talanta. 80, 473-478.

Gendrin, C., Roggo, Y., Collet. C., 2007. Content uniformity of pharmaceutical solid dosage forms by near infrared hyperspectral imaging: A feasibility study.Talanta. 73, 733. Gowen, A. A., O’Donnell, C. P., Cullen, P. J., Bell, S. E. J., 2007. Recent applications of Chemical Imaging to pharmaceutical process monitoring and quality control. European Journal of Pharmaceutics and Biopharmaceutics. 69, 10-22. Hogan, J., in: Aulton, M. E., Farmacia la ciencia del diseño de las formas farmacéuticas, Elsevier, Madrid, 2004, pp. 441-448. Li, W., Woldu, A., Kelly,R., McCool, J., Bruce, R., Rasmussen, H., Cunningham, J., Winstead, D., 2008. Measurement of drug agglomerates in powder blending simulation samples by near infrared chemical imaging. International Journal of Pharmaceutics. 350, 369–373.

Lopes M.B., Wolff J.C., Bioucas-Dias J.M., Figueiredo M.A., 2009. Determination of the composition of counterfeit Heptodin tablets by near infrared chemical imaging and classical least squares estimation. Analytica Chimica Acta. 641, 46-51.

Ma, H., Anderson, C. A., 2008. Characterization of Pharmaceutical Powder Blends by NIR Chemical Imaging. Journal of Pharmaceutical Sciences. 97, 3305-20. Makein, L.J., Kidder, L.H., Lewis, E.N., Valleri. M., 2008. Non-Destructive Evaluation of Manufacturing Process Changes using Near Infrared Chemical Imaging. NIR News. 19,7, 11-15. Maurer, L., Leuenberger, H., 2009. Terahertz pulsed imaging and near infrared imaging to monitor the coating process of pharmaceutical tablets. International Journal of Pharmaceutics. 370, 8-16. Puchert, T., Lochmann, D., Menezes, J.C., Reich. G., 2010. Near-infrared chemical imaging (NIR-CI) for counterfeit drug identification--a four-stage concept with a novel approach of data processing. Journal of Pharmaceutical and Biomedical Analysis. 51, 138–145. Ravn, C., Skibsted, E., Bro, R., 2008. Near-infrared chemical Imaging (NIR-CI) on pharmaceutical solid dosage forms—Comparing common calibration approaches. Journal of Pharmaceutical and Biomedical Analysis. 48, 554-561. Reich, G., 2005. Near-infrared spectroscopy and imaging: Basic principles and pharmaceutical applications. Advanced Drug Delivery Reviews. 57, 1109-1143. Zhang, L., Henson, M. J., Sonja, S., 2005. Multivariate data analysis for Raman imaging of a model pharmaceutical tablet. Analytica Chimica Acta. 545, 262-278.

ANEXO

223

8.3) NIR-CI STUDY OF ASPIRIN

COMMERCIAL TABLETS

J.Cruz, M.Blanco. Proceedings of the 14th International

Conference on Near infrared spectroscopy (Bangkok, 2009),

NIR Publications. ( pendiente de publicación)

ANEXO

224

ANEXO

225

NIR-CI study of Aspirin commercial tablets

J.Cruz, M. Blanco,

Unidad de Química Analítica. Departament de Química. Facultat de Ciencies. Universitat Autònoma de

Barcelona. 08193 Bellaterra, Barcelona. Spain.

INTRODUCTION

Near Infrared Chemical Imaging (NIR-CI) is demonstrating an increasing interest in

pharmaceutical field because of its ability to obtain relevant information about

composition and distribution of components from tablets [1]. The analysis of the sample

by NIR-CI provides a single spectrum at each pixel of the image. Each data file contains

a great amount of information. Chemometric algorithms are useful to extract the

relevant information from each image.

Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) has been

successfully applied to extract quantitative information of NIR Images in

pharmaceutical samples[2]. Therefore, this technique presents a alternative to quantify

different components in tablets without needing a specific calibration model (only pure

components spectra are needed).

This work is composed by two different parts. Firstly, MCR-ALS algorithm is proposed

as a quantitative method, to analyse hyperspectral images of different commercial

Aspirin tablets. A large range of API concentration, between 82% and 12%, was

covered for the chosen samples that present different compositions depending on the

manufacturer.

Secondly, content uniformity has been determined by MCR-ALS, from a unique image

of 10 tablets. Tablets from 4 different manufactures were selected.The distribution of

API and the major excipient in the tablet has been evaluated using concentration maps

and pixel histograms.

ANEXO

226

METHODOLOGY

Samples

For the first part of this study 10 different brand of Aspirin commercial tablets were

purchased at pharmacies. The ASA concentration for the tablets was obtained by

dividing the nominal content by the weight of the tablet; the concentration of ASA

cover a range , from 82% to 12% (w/w).

For the second part of this study 4 different tablet brands, has been used (10 tablets per

brand) selected according their diameter. The nominal concentrations of ASA in the

different tablets covered range of concentration from 82% to 71%.

Microcristalline Celullose (MCC) is the main excipient in 6 preparations; whereas

manitol is the main excipient in the other 2. Dolmen and Aspirina C are effervescent

tablets and also content ascorbic acid as active component and other excipients are citric

acid, sodium carbonate and sodium bicarbonate anhydrous. Table 1 shows the main

features of each brand tablets.

Table1. Main features and results obtained for 10 different brands of commercial tablets.

Commercial Brand

Nominal ASA (mg)

Diameter (mm)

Tablet Weight (g)

Nominal concentration (%)

Main Excipient

NIR-CI concentration (%)

A.A.S 100 100 82 0.227 44.1 Manitol 53.3

A.A.S 500 500 134 0.864 57.9 Manitol 54.9

Bayer 500 500 120 0.609 82.1 MCC 81.6

Adiro 100 100 72 0.135 73.9 MCC 76.5

Adiro 300 300 102 0.409 73.3 MCC 70.9

Aspirina C* 400 258 3.235 12.4 -- 12.9

Dolmen* 500 242 3.399 14.7 -- 16.4

Aspirine Nicholas 500 120 0.624 80.1 MCC 77

Bioplak 250 250 70 0.348 71.8 MCC 71.3

Bioplak 125 125 100 0.173 72.1 MCC 67.8

*Effervescent tablets

ANEXO

227

Instrumentation and Software

Hyperspectral images of the tablets were obtained by a “Think Spectrally Roda-25” NIR

Hyperspectral Imaging Spectrophotometer (Think Spectrally, Valencia, Spain). The

dimension image acquires the format of a cube data [256x360x130]( figure 1). The

three-dimensional structure of the hyperspectral data cube requires a previous unfolding

step to a bi-dimensional matrix, adapting the image for further pre-treatments or any

other method.

The spectral pre-treatments were applied by using home-made routines programmed in

MATLAB code (MATLAB v 7.0, The MatWorks, Massachussetts) [3]. Once the images

were unfolded Standard Normal Variation (SNV) and also smoothing were applied.

MCR-ALS software from the reference [4] working under MATLAB was used.

MCR-ALS in Imaging Data

Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) [4] decomposes

the unfolded matrix X (MN λ) into the product of two matrices, C (MN A),

containing the concentration profiles and ST (A λ), containing the spectral profiles for

each A component (Figure 1a) (Eq. 1):

X = CST + E (1)

where E (MN λ) corresponds to the experimental error matrix.

The ALS optimization stops when the relative difference in lack of fit (%LOF) values

between consecutive iterations is below than a threshold value.

The quality of the images, which depends on the spatial and also spectral resolution,

could be a disadvantage when MCR-ALS is applied since there could be lack of

selectivity in the surface of the image. To overcome this problem an alternative has

already been formulated: the augmentation of the original sample with images of the

pure analytes. A scheme of the unfolding and augmentation is showed in figure 1b.

ANEXO

228

Figure 1. Scheme of MCR-ALS analysis (a) application to the hyperspectral cube.

(b) and Augmented MCR-ALS

RESULTS AND DISCUSSION

Different pre-treatments were tested with the images and the combination of SNV and

smoothing average with a window size of 7 points provided the best results. Prior to

apply MCR-ALS, non-negativity of concentration profiles and closure were applied as

constraints. Despite the fact that the tablets were constituted by a different number of

components, closure constraint was applied. ASA and the excipients used in this study

provided the highest spectral information and were used to perform the MCR-ALS

analysis, while the minor excipients spectral contribution may be related with the

residual matrix. The pure spectra of the main components were included as initial

estimations to start the iterations. Augmented MCR-ALS was applied, adding 10 spectra

for both pure analytes (ASA and major excipient) to the unfolded matrix in order to

improve the decomposition.

A tablet hyperespectral image analysis

Table 1 shows also the quantitative results for the 10 brand of tablets obtained by

applying augmented MCR-ALS. The ASA concentration is similar to calculated values

confirming the goodness of the quantitative analysis. Good results were obtained for

almost all of the samples including in samples with lower values of ASA content.

Tablets with Manitol as the main significant excipient showed worse results for the

determination of ASA content.

Concentration map and histogram of the local concentration for ASA and MCC of

Bayer 500 tablet (figure 2a) allow observing the regular distribution with little

ANEXO

229

heterogeneities for the ASA and the MCC in the surface and remaining close to a

normal distribution in the histogram which is the ideal situation. The same behaviour

can be observed for the other samples (not showed in the figure), except for AAS 100

and AAS 500 which concentration range was not as narrow as for the others.

Figure 2. a) Hyperspectral image of a single tablet: Concentration maps and histograms

for ASA and MCC b) Hyperspectral image 10 tables: Concentration maps and

histograms for ASA and MCC

Ten tablets hyperespectral image analysis (Content uniformity test)

The hyperspectral image of 10 tablets has been crop and the area corresponding to each

tablet has been selected. The background around each tablet has been converted in non a

number data and a masking routine [3] has been applied to unfold the tablet spectra

without including the background. Then MCR-ALS algorithm has been applied to the

unfolded spectra applying the same restrictions indicated in the before. This process has

been done for each image of the 10 tablets and the concentration calculated. The

average values for each tablet brand are showed in table 2.

ANEXO

230

Table 2. Results obtained for content uniformity (10 tablets) of 4 commercial brands.

The low spatial resolution of the hyperspectral camera and the deficient illumination of

the sample of 10 tablets, are the origin of a deficient hyperspectral image (bad

resolution in the tablets’ corners). For this reason in order to avoid bad ASA

determinations, the central pixels of each tablet must be selected.

The results obtained for determination of the ASA in 4 different brands of tablets are

showed in table 2 (these values is the average value for 10 tablets from each brand).

The mean concentration for ASA in the surface of the tablets was similar to the

calculated value confirming the goodness of the content uniformity analysis for the 4

brands.

Results of distribution of API (figure 2b), in 10 tablets per image, can be improved with

an instrument with better spectral/spatial resolution.

The histograms for ASA and MCC show values around the prediction values, and with

a narrow variation, implying that the whole surface of the tablets contained a similar

amount of ASA.

For content uniformity, the European Pharmacopoeia defines an acceptance value (AV)

which is computed and compared with a limit for the acceptance range [5].

AV=|M − X |+k·s (2)

Where M is the reference value, X the mean value of the individual tablets, k is a

constant (k=2.4 for n=10) and s the standard deviation.

The requirement of content uniformity is fulfilled if the AV of the first 10 dosage units

is less than or equal to 15.

The results obtained for 4 brands are showed in table 2; and indicate the fulfilment of

the Pharmacopoeia requirements.

Commercial Brand

Nominal concentration (%)

NIR-CI concentration (%)

Standard deviation

Acceptance value (limit A.V.=15, n=10)

Bayer 500 82.8 82.4 1.5 4.0

Adiro 100 73.1 72.6 2.5 6.5

Bioplak 250 72.9 72.7 2.7 6.7

Bioplak 125 71.4 67.8 2.2 8.7

ANEXO

231

CONCLUSIONS

Intact commercial tablets were analysed by NIR-Chemical Imaging in order to

determine de distribution of ASA and its ASA concentrations for each tablet using the

MCR-ALS decomposition.

MCR-ALS is a powerful tool to quantify using Hyper Spectral Images, obtaining

concentration maps only with the requirement of pure spectra and without needing a

calibration model with reference values. The obtaining of the tablet surface’s

concentration map allows establishing the API and the major excipient homogeneity of

distribution.

A unique hyperspectral image of 10 tablets allows assessing content uniformity

according the Pharmacopoeia rules, saving time of analysis respect conventional

methods.

REFERENCES

[1] A.A. Gowen, C.P. O'Donnell, P.J. Cullen and S.E.J. Bell, European Journal of Pharmaceutics and Biopharmaceutics, 69 (2008) 10. [2] J.M. Amigo, C. Ravn, European Journal of Pharmaceutical Sciences, 37 (2009) 76–82. [3] http://www.models.life.ku.dk/~jose/ (Routine created by Jose Manuel Amigo Rubio ) [4] J. Jaumot, R. Gargallo, A. de Juan, R. Tauler, Chemometrics and Intelligent Laboratory Systems, 76 (2005) 101. [5] B. Bánfai , K. Ganzler, S. Kemény, Journal of Chromatography A, 1156 (2007) 206–212.