TESIS DOCTORAL:
DESARROLLO DE NUEVAS METODOLOGIAS DE ESPECTROSCOPÍA NIR EN APLICACIONES INDUSTRIALES.
ESTUDIO Y APLICACIÓN DE TÉCNICAS DE IMAGEN QUÍMICA (NIR-CI)
JORDI CRUZ SANCHEZ
Director: Marcelo Blanco Romía
PROGRAMA DE DOCTORADO DE QUÍMICA Departamento de Química
Facultad de Ciencias 2010
Memòria presentada per aspirar al Grau de Doctor per Jordi Cruz Sanchez
Jordi Cruz Sanchez
Vist i plau
Dr. Marcelo Blanco Romía
Catedràtic de Química Analítica
Bellaterra, 27 de Setembre de 2010
AGRAÏMENTS
Aquesta tesi doctoral s’ha realitzat gràcies a les següents ajudes institucionals:
Ministerio de Educación y Ciencia, Madrid.
Projectes: “LA ESPECTROSCOPIA NIR: UNA HERRAMIENTA PARA LA TECNOLOGIA
ANALITICA DE PROCESOS (PAT)” (CTQ2006-12923). y "DESARROLLO DE NUEVAS
METODOLOGIAS ESPECTRALES PARA EL CONTROL ANALITICO DE PRODUCTOS Y
PROCESOS " (CTQ2009-08312).
Grup de Quimiometria Aplicada
Unitat de Química Analítica
Departament de Química
Universitat Autònoma de Barcelona
Edifici Cn, 08193 Bellaterra
Aquesta tesi doctoral s’ha realitzat gràcies a les següents ajudes privades:
Cray Valley Ibérica,
E-08470 Sant Celoni,
Barcelona, Spain
Esteve Farma,
C/ Sant Martí, s/n.
08107 Martorelles,
Barcelona. Spain
El concepto es el concepto... a los hechos me repito...
Quan hom escriu aquestes paraules és perquè està arribant al final d'una etapa de la seva vida, una etapa de moltes hores passades al laboratori... són 12 anys en aquesta universitat i quasi 6 anys entre la meva època de col·laboració i com a becari compartint vivències en el grup d'investigació. Potser aquestes son les paraules més complicades d’escriure, sobretot després de gairebé 10 anys en aquesta universitat dels quals he conviscut 3 i mig en aquest grup d’investigació. Vull agrair sincerament al Doctor Marcelo Blanco per haver confiat en mi per a incorporar-me en el Grup de Quimiometria Aplicada, quan un bon dia a mitjans de 2005, vaig aparèixer per la planta a mans de la Doctora Hortènsia Iturriaga, a qui l'hi dec moltíssim, perquè sense ella no estaria aquí en aquest lloc en el que m’he format realment com a l’investigador i la persona que soc a dia d’avui. Dins d’aquest grup he tingut la sort de compartir feina i hores amb companys que, a més de bons investigadors, han estat bons amics durant aquest viatge: Manel A i Manel B, José, Anna Peguero, Anna Palou, Armenta, David, Chacho, Lisi, Ricardo, Juan, Ruben Cueva, Ruben Jimenez, Dámarith, Miguel, Mari, Miriam, Antonio, Quim.... Segur que em deixaré gent, quelcom inevitable després de tants i tants anys en el grup. Vull agrair també als altres professors del grup per tot el suport que m'han donat durant aquest temps. Voldria agrair als amics que m'han ajudat no específicament en la feina del doctorat però si amb el seu suport moral, Miguel, David, Johnny, Tere, Pep, "la Garcia" , Miquel, Aleix i altres companys d'entrenament, i molta altra gent, que com abans m'ha passat amb els companys de la universitat, m'hauré deixat. La meva família, ha estat una peça clau en el meu creixement tant con a persona , com a investigador m'han hagut d'aguantar tots aquests anys, Pares, Oriol, Josep Manel, Lola, Rosa, Barrachines etc... Amb les vostres experiències personals i les viscudes junts també n'he après. Gràcies pel vostre suport. Però si per a algú va dedicada aquesta tesi, és per a l'Aurora sempre omnipresent de qui tantes i tantes coses n'he après i segueixo aprenent malgrat que ja no hi sigui. Perquè ja de ben petit va ser un far posar en bell mig de la meva vida que m'ha guiat quan m'he sentit perdut. També la dedico especialment a l'avi Amadeu i a la iaia Maria, perquè per mi han estat uns avis especials i m'hauria encantat compartir aquests moments de joia personal. I per acabar Anna no tinc paraules per a tu, perquè no els agraïments serien eterns, gràcies per ser com ets i per entendre'm com ho fas! Podria seguir escrivint sense parar... perquè per sort, estic envoltat de gent que sempre m'han atansat la mà quan els ho he demanat, mil gràcies a tots de debò i de tot cor!!! I com diu aquella cançó del mestre Sisa... Qualsevol nit pot sortir el sol...
Gracies a tots
INDICE
RESUMEN...................................................................................................1
1. INTRODUCCIÓN.....................................................................................9
1.1 ESPECTROSCOPIA NIR..............................................................11
1.1.1 INTRODUCCIÓN ............................................................11
1.1.2 FUNDAMENTOS DE LA TÉCNICA..................................14
1.1.3 INSTRUMENTACIÓN.....................................................19
1.1.4 APLICACIONES DE LA ESPECTROSCOPIA NIR...........22
1.2 ESPECTROSCOPIA NIR IMAGEN................................................24
1.2.1 INTRODUCCIÓN A LA ESPECTROSCOPIA DE IMAGEN.24
1.2.2 TIPOS DE CÁMARA .......................................................26
1.2.3 APLICACIONES DE LA ESPECTROSCOPIA NIR DE
IMAGEN...................................................................................................28
2. HERRAMIENTAS PARA EL ANÁLIS DE DATOS. QUIMIOMETRÍA......31
2.1 HERRAMIENTAS QUIMIOMÉTRICAS USADAS PARA LA
EXTRACCIÓN DE INFORMACIÓN CUALITATIVA....................................36
2.1.1 ANÁLISIS EN COMPONENTES PRINCIPALES (PCA)....36
2.1.2 COEFICIENTE DE CORRELACIÓN (CC).........................37
2.2 HERRAMIENTAS QUIMIOMÉTRICAS USADAS PARA LA
EXTRACCIÓN DE INFORMACIÓN CUANTITATIVA..................................39
2.2.1 CALIBRACIÓN UNIVARIANTE MEDIANTE
COEFICIENTES DE CORRELACIÓN (CC).................................................40
2.2.2 CALIBRACIONES MULTIVARIANTES...........................41
2.3 OTROS ALGORITMOS...............................................................44
2.3.1 ALGORITMO DE KENNARD & STONE...........................44
2.3.2 PIECEWISE DIRECT STANDARDISATION (PDS)...........45
2.4 MODELADO Y CONTROL..........................................................47
2.4.1 SELECCIÓN DEL CONJUNTO DE CALIBRACIÓN..........47
2.4.2 MÉTODOS DE REFERENCIA .......................................48
INDICE
2.4.3 OBTENCIÓN DE LA SEÑAL ANALÍTICA........................48
2.4.4 PRETRATAMIENTOS ESPECTRALES............................48
2.4.5 CONSTRUCCIÓN DEL MODELO DE CALIBRACIÓN......50
2.4.6 EVALUACIÓN DE RESULTADOS...................................50
2.5 HERRAMIENTAS PARA EL ANÁLISIS DE IMAGEN..................52
2.5.1 CLASSICAL LEAST SQUARES (CLS)...............................53
2.5.2 MULTIVARIATE CURVE RESOLUTION– ALTERNATING
LEAST SQUARES (MCR-ALS) ...................................................................54
2.5.3 ISYS-PLS1.......................................................................59
3. OBJETIVOS...........................................................................................61
4. METODOLOGÍA Y DISCUSIÓN DE LOS RESULTADOS.........................67
4.1 PROCESOS DE FABRICACIÓN...................................................69
4.1.1 RESINA DE POLIÉSTER................................................69
4.1.2 ENANTYUM COMPRIMIDOS.........................................70
4.2 METODOLOGÍA EXPERIMENTAL.............................................71
4.2.1 RESINA DE POLIESTER.................................................71
4.1.2 ENANTYUM COMPRIMIDOS.........................................72
4.2.3 COMPRIMIDOS COMERCIALES DE ÁCIDO
ACETILSALICÍLICO..................................................................................72
4.2.4 COMPRIMIDOS EN FASE EXPERIMENTAL................. 73
4.3 METODOLOGÍA INSTRUMENTAL............................................74
4.3.1 INSTUMENTACIÓN EMPLEADA...................................75
4.3.2 ADQUISICIÓN DE LOS ESPECTROS DE
LAS MUESTRAS........................................................................................81
4.3.3 MÉTODOS DE REFERENCIA........................................85
4.4 TRATAMIENTO DE DATOS ......................................................88
4.5 CONSTRUCCIÓN DE LOS MODELOS DE CALIBRACIÓN..........90
5. RESULTADOS Y DISCUSIÓN ................................................................93
5.1 ESTUDIOS CON ESPECTROSCOPIA NIR CONVENCIONAL.......95
5.1.1 DETERMINACIÓN DE PARÁMETROS DE CONTROL DE
UN PROCESO DE FABRICACIÓN DE RESINAS POLIÉSTER.....................95
INDICE
5.1.2 DETERMINACIÓN DE API DE UN FÁRMACO MEDIANTE
CALIBRACIÓN UNIVARIANTE................................................................107
5.2 ESTUDIO MEDIANTE NIR-CI DE MUESTRAS
FARMACÉUTICAS..........................................................................113
5.2.1 APLICACIÓN DEL ALGORITMO MCR-ALS AL ANÁLISIS
DE IMÁGENES DE COMPRIMIDOS COMERCIALES DE ÁCIDO
ACETILSALICÍLICO (ASA).............................................................114
5.2.2 ESTUDIO DE UNIFORMIDAD DE CONTENIDO EN
COMPRIMIDOS COMERCIALES DE ÁCIDO ACETILSALICÍLICO
(ASA) ............................................................................................124
5.2.3 ESTUDIO CUANTITATIVO Y DE LA DISTRIBUCIÓN DE
API, EXCIPIENTES Y GROSOR DE RECUBRIMIENTO DE
COMPRIMIDOS.......................................................................................131
6. CONCLUSIONES..................................................................................143
7. ARTÍCULOS ACEPTADOS PARA LA TESIS DOCTORAL.......................153
7.1 CONTROL PRODUCTION OF POLYESTER RESINS BY NIR
SPECTROSCOPY......................................................................................157
7.2 DEVELOPMENT OF A UNIVARIATE CALIBRATION MODEL FOR
PHARMACEUTICAL ANALYSIS BASED ON NIR SPECTRA.....................165
7.3 NIR-CHEMICAL IMAGING STUDY OF ACETYLSALICYLIC ACID
IN COMMERCIAL TABLETS....................................................................173
8. ANEXO................................................................................................181
8.1 UNIFORMITY STUDIES OF COMMERCIAL ASPIRIN TABLATS
BY NIR-CI................................................................................................185
8.2 DISTRIBUTION STUDY OF COMPONENTS AND FILM COATING
IN PHARMACEUTICAL TABLATS BY NIR-CI..........................................203
8.3 NIR-CI STUDY OF ASPIRIN COMMERCIAL TABLETS.............223
RESUMEN
1
RESUMEN
Conseguir una elevada calidad en los productos es un reto cada día más importante en
la industria moderna y estos productos no solo deben satisfacer al usuario sino también
cumplir normativas para que puedan llegar al mercado.
La Espectroscopia NIR es una técnica de reciente implantación que presenta
numerosas ventajas respecto a otras técnicas: es no invasiva, no destructiva de la
muestra, es un sistema rápido de medida y de obtención de resultados, de bajo coste,
medioambientalmente compatible, etc. que han impulsado su aplicación en diferentes
campos de la actividad industrial.
En la Memoria se realiza un estudio de la aplicación de la Espectroscopia NIR a la
determinación de parámetros de interés en la fabricación de resinas de poliéster y en el
campo farmacéutico se propone un nuevo método de calibración para determinar API
en muestras procedentes de las distintas etapas del proceso productivo; el objetivo
último es proponer nuevas metodologías más rápidas y eficaces que sean alternativas
de los métodos convencionales y que permitan realizar un control rápido para mejorar
la calidad de los productos.
Se han realizado estudios de imagen química NIR (NIR-CI), una técnica de creciente
interés en el análisis de productos farmacéuticos y que permite ampliar y mejorar el
conocimiento de las muestras para asegurar el cumplimiento de las exigentes
necesidades de calidad en el análisis farmacéutico y que constituye un complemento
versátil a la espectroscopia NIR convencional.
El análisis directo de la muestra mediante el uso de técnicas de imagen, proporcionan un
espectro NIR en cada píxel de la imagen, y mediante un tratamiento quimiométrico
adecuado de la gran cantidad de información que esto representa se puede obtener
información imposible de conseguir en la espectroscopia NIR convencional tales como
RESUMEN
2
la determinación de API y/o excipientes de uno o varios comprimidos farmacéuticos
con una sola imagen química de forma rápida y sin alterar la muestra.
En uno de los estudios de esta memoria se ha realizado un trabajo de imagen química
en el que se propone un método cuantitativo para analizar comprimidos de ácido
acetilsalicílico de diferentes marcas comerciales (de las que únicamente se posee la
información sobre su composición obtenida en el vademecum), mediante el uso del
algoritmo Multivariate Curve Resolution - Alternative Least Squares (MCR-ALS). Este
algoritmo no exige definir un modelo de calibración, no necesita valores de referencia y
solamente precisa los espectros de los componentes puros. Se ha demostrado la bondad
del método a través de la correcta cuantificación del API y a la vez se ha estudiado su
distribución en el comprimido mediante los histogramas de los mapas de concentración.
Se han estudiado 10 marcas comerciales distintas y en todos los casos se han obtenido
resultados conformes con las especificaciones del fármaco.
Se ha ampliado el estudio anterior con el desarrollo de la metodología apropiada para
establecer la homogeneidad de distribución del API y del excipiente mayoritario así
como la determinación de uniformidad de contenido (definido por la European
Pharmacopoeia) que se establece a partir del acceptance value (AV) mediante
cuantificación del valor individual de cada comprimido de una única imagen
hiperespectral de 10 comprimidos. Esta determinación supone un ahorro de tiempo
considerable frente a los métodos convencionales ya que es una determinación esencial
para la liberación de un lote de producción.
Se ha realizado también una estudio comparativo de dos software MCR-ALS e Isys-PLS1
(un algoritmo que el software comercial de Malvern Isys 5.0 llama PLS1) para la
determinación del contenido de API y excipientes a partir de las imágenes
hiperespectrales, con el objeto de seleccionar el más adecuado para su aplicación a
RESUMEN
3
posteriores estudios. Los resultados obtenidos indican que ambos son igualmente
válidos con esta finalidad ya que los resultados no difieren significativamente.
La experiencia con los comprimidos comerciales de ácido acetilsalicílico, ha sido
aplicada, en un nuevo estudio, a un fármaco en proceso de desarrollo. Se han analizado
cuantitativamente la concentración y la distribución del API y excipientes de
comprimidos farmacéuticos en diferentes comprimidos que presentan distinto grosor
de recubrimiento. La información que se ha extraído de las imágenes hiperespectrales
se han tratado por un lado con Isys-PLS1, permitiendo determinar la concentración de
todos los constituyentes del fármaco y establecer la uniformidad de distribución de los
mismos. Por otro lado se ha creado un modelo PLS1 con espectros promedio de
imágenes hiperespectrales de comprimidos de diferente grosor de recubrimiento.
Aplicando este modelo PLS1 a comprimidos de producción se determina el grosor de
recubrimiento así como su distribución en los comprimidos. Los estudios realizados,
principalmente los de imagen hiperespectral, nos han permitido cumplir los objetivos
propuestos y establecer de forma clara y contundente la adecuación del NIR en la
realización de medidas aptas para la mejora de la calidad de productos tanto de la
industria química como farmacéutica.
RESUMEN
4
ABSTRACT
5
ABSTRACT
The obtaining of the highest quality products is a challenge in the modern industry with
increasingly importance. These products should satisfy the user, but also accomply the
strict regulations before the marketing.
NIR spectroscopy is a technique recently introduced that has several advantages over
other techniques: non invasive, non destructive, fast, low cost and environmental-
friendly. These advantages have increased its application in different industrial fields.
In this thesis, the application of NIR spectroscopy for the determination of parameters
of interest in the manufacture of polyester resins has been performed and, additionally, a
new calibration method for the determination of API in samples from different
production stages have been proposed for the pharmaceutical field. The main goal has
been provide new methodologies that can be summarized as rapid and effective
alternatives to conventional methods that allow a quality control of the manufactured
products.
NIR chemical imaging (NIR-CI) is a technique of increasing interest in the analysis of
pharmaceutical products and represents a versatile complement to conventional NIR
spectroscopy. Different studies have been done to increase and improve the knowledge
of the samples assessing the compliance of the quality demands in pharmaceutical
analysis. Direct analysis of the sample by using imaging techniques provides a NIR
spectrum for each pixel of the image, and by appropriate chemometric treatment of the
large amount of information, different results can be achieved, such as the determination
of API and excipients of single or multiple tablets only by the obtaining of a single
image.
Moreover, a methodology based on NIR-CI and Multivariate Curve Resolution -
Alternating Least Squares (MCR-ALS) algorithm is proposed for the quantitative
ABSTRACT
6
analysis of acetylsalicylic acid tablets of different commercial brands. The composition
information was obtained from the Vademecum. This algorithm does not require
defining a calibration model and it does not need reference values. It only needs the
spectra of the pure components of the formulation. The capability of the methodology
has been demonstrated through the accurate quantification of API and also providing
information about the spatial distribution in the tablet surface, using the concentration
histograms. 10 different commercial brands have been studied and, in all the cases, the
obtained results are in accordance with the specifications of the drug.
An extension of the previous study has been done. The appropriate methodology has
been developed in order to establish the API and major excipient distribution
homogeneity. The determination of content uniformity (defined by the European
Pharmacopoeia) is established from Acceptance Value (AV) by quantifying the
individual value of each tablet of a single hyperspectral image of 10 tablets. This
determination is essential to release a production batch to the market and represents a
significant time saving compared to conventional methods.
It has been performed a comparative study of the two used software Isys-PLS1 (an
algorithm that commercial software called PLS1 Malvern Isys 5.0) and MCR-ALS for
the determination of API and excipients in hyperspectral images, in order to select the
most suitable for its application to future studies. The results indicate that both are
equally valid for this purpose because the results do not differ significantly.
The obtained results from the studies of commercial tablets of aspirin have been applied
to a formulation during the development stage. The concentration and distribution of
API and excipients in tablets with different coating thickness have been quantitatively
determined. Initially, the information extracted from hyperspectral images has been
analyzed with Isys-PLS1, that allowed to determine the concentration and the
ABSTRACT
7
uniformity of distribution of all constituents of the drug. Moreover, PLS1 model was
created with the mean spectra of different coating thickness tablet images. Applying this
PLS1 model to production tablets the coating thickness and its distribution in the tablets
can be determined.
The applications based on hyperspectral imaging have allowed us to achieve the initial
objectives and to establish effective strategies for improving the quality of products of
both the chemical and pharmaceutical industry using NIR spectroscopy.
ABSTRACT
8
INTRODUCCIÓN
9
1. INTRODUCCIÓN
INTRODUCCIÓN
10
INTRODUCCIÓN
11
1. INTRODUCCIÓN
1.1 ESPECTROSCOPIA NIR
1.1.1 INTRODUCCIÓN
La región del infrarrojo está comprendida entre las longitudes de onda de 700 a 106 nm.
Tanto por razones instrumentales como por les características de la interacción de la
radiación con la materia, la región del infrarrojo se divide en tres zonas (tabla 1.1):
infrarrojo cercano (NIR, Near Infrared), infrarrojo medio (MIR, Middle Infrared) e
infrarrojo lejano (FIR, Far Infrared).
Tabla 1.1. División de la región del infrarrojo.
A pesar del temprano descubrimiento de la radiación en la región del infrarrojo cercano
(NIR, Near-Infrared) por William Herschel en 1800 [1], el desarrollo de esta
espectroscopia para la resolución de problemas en el ámbito de la química analítica ha
sido lento. Tuvo que pasar casi un siglo hasta que Abney y Festing registraran
[1] W.Herschel. Investigation of the powers of prismatic colours to heat and illuminate objects; with remarks that prove the different refrangibility of radiant heat. Phil. Trans. Roy. Soc. London 2 (1800) 255-283.
Región Longitud de onda
(nm) Origen de la absorción
NIR 700-2500 Sobretonos y bandas de combinación de las
vibraciones moleculares fundamentales.
MIR 2500-50000 Vibraciones moleculares fundamentales.
FIR 50000-106 Rotaciones moleculares.
INTRODUCCIÓN
12
fotográficamente el espectro de líquidos orgánicos en la región espectral entre 700 y 1200
nm [2]. Posteriormente, durante la primera mitad del siglo XX, el interés de los
espectroscopistas por la región infrarroja se centraba en la región del infrarrojo medio,
prestando poca atención a la zona vecina al visible, convencidos del poco interés de esta
región para fines analíticos.
En la década de los 50, con la aparición de los primeros espectrofotómetros
comerciales equipados con detectores fotoeléctricos capaces de registrar espectros en la
zona del infrarrojo cercano, se desarrollaron las primeras aplicaciones en las que
intervenía esta espectroscopia.
Una etapa muy importante para la técnica fue la década de los 50; un grupo del
Ministerio de Agricultura de los EEUU, USDA (United States Department of Agriculture),
liderado por Karl Norris empezó a utilizar esta metodología para el estudio de muestras en
el ámbito de la agroalimentación [3-4]. A partir de ese momento, el interés por la
espectroscopia NIR experimentó un cambio substancial. Hasta finales de los años 70 los
instrumentos comerciales fueron principalmente instrumentos de filtros diseñados para
aplicaciones específicas. Después de esta etapa inicial y con la llegada de la era digital, los
avances en el diseño y desarrollo de nueva instrumentación, con una electrónica más
estable y con ópticas mejoradas, permitieron registrar espectros de manera rápida y
altamente reproducible (instrumentos de barrido, interferómetros, etc.) [5-6]. Igualmente,
el desarrollo de equipos informáticos cada vez más potentes y a precios razonables fue una
pieza clave para el progreso e implantación de la técnica.
[2] W. Abney , E.R. Festing. On the Influence of the Atomic Grouping in the Molecules of Organic Bodies on Their Absorption in the Infra-Red Region of the Spectrum. Phyl., Trans. Roy. Soc. 172 (1881) 887.
[3] K.H. Norris, J.R. Hart. Direct spectrophotometric determination of moisture content of grain and seeds.Proceedings of the 1963 Intl. Symp. on Humidity and Moisture, Washington D.C. 4 (1965) 19-25.
[4] K.H. Norris, J.R. Hart, C. Golumbie. Determination of the moisture content of seeds by near-infrared spectrophotometry of their methanol extracts. Cereal Chemistry 39 (1962) 94-99.
[5] D. Noble. Analyzing on the INTERNET: Finding analytical chemistry on the Internet is still a challenge, but new resources and search tools are coming on line. Anal. Chem 67 (1995) 255A-259A.
[6] C.M. Henry. Near-IR gets the job done. Anal. Chem. 71 (1999) 625A-628A.
INTRODUCCIÓN
13
Gracias a estos avances tecnológicos los espectroscopistas empezaron a mostrar
interés por la técnica. En 1983 Wetzel la definía como “Sleeper among Spectroscopic
Techniques” [7], indicando que la técnica tenía un gran potencial aunque hasta aquel
momento no había sido utilizada como técnica de análisis habitual.
Los motivos que hacen esta técnica atractiva son diversos:
Permite registrar el espectro de muestras sólidas, líquidas o gaseosas.
El tratamiento previo de la muestra es prácticamente nulo.
El registro de los espectros es rápido.
Es una técnica no destructiva.
Se pueden realizar el análisis de múltiples parámetros a partir de un mismo
espectro.
Una vez establecida la calibración, el análisis de rutina es rápido.
Los análisis pueden ser realizados en la misma línea de producción.
Es una técnica barata.
Poco a poco la técnica NIR se ha ido introduciendo como técnica de análisis en
diferentes áreas, encontrándose actualmente numerosas aplicaciones en el sector de la
petroquímica [8], en el análisis de alimentos [9], de productos farmacéuticos [10], de
fibras textiles [11] y muchas otras aplicaciones en ámbitos muy diversos [12]. Finalmente
la espectroscopia NIR ha sido aceptada como un método analítico, implementándose, en
algunos casos, bajo normativas de garantía de calidad [13].
[7] D.L. Wetzel. Near Infrared Analysis. Anal. Chem. 55 (1983) 1165A-1176A.
[8] S. Macho, M.S. Larrechi. Near-infrared spectroscopy and multivariate calibration for the quantitative determination of certain properties in the petrochemical industry. Trends Anal Chem 21 (2002) 799–806.
[9] M.E. Lafargue, M.H. Feinberg, J.J. Daudin, D.N. Rutledge. Homogeneity check of agricultural and food industries samples using near infrared spectroscopy. Anal Bioanal Chem. 375 (2003) 496–504.
[10] M. Blanco, M. Bautista, M. Alcala. Preparing calibration sets for use in pharmaceutical analysis by NIR-spectroscopy J Pharm Sci. 97 (2008) 1236–1245.
[11] E. Cleve, E. Bach, E. Schollmeyer. Using chemometric methods and NIR spectrophotometry in the textile industry. Analytica Chimica Acta. 420 (2000) 163–167.
[12] P.Geladi, T Lillhonga, J.Burger. The Proceeding of NIR-2007. Ed. NIR publications 2008.
[13] Jensen J.L. Acceptance of NIR as an analytical method. Process Control and Qual. 9 (1997) 161-166.
INTRODUCCIÓN
14
Como el estado de desarrollo en el que se encuentra la tecnología NIR se ha producido
fundamentalmente en los últimos 25 años podría esperarse que, hoy por hoy, fuese una
técnica madura próxima a alcanzar una fase de estancamiento. Sin embargo, éste no es el
caso.
Dadas las ventajas de la espectroscopia NIR frente a otras técnicas instrumentales, puede
considerarse como una técnica de relevancia dentro de la Tecnología Analítica de
procesos.
El desarrollo de nuevas herramientas quimiométricas para el tratamiento de datos, la
miniaturización de los componentes instrumentales que facilitan la portabilidad de los
equipos para trabajar in-situ y la reciente combinación de la Espectroscopia NIR con
técnicas de imagen, hacen que esta técnica esté en plena fase de auge y
expansión [12, 13,14,15].
1.1.2 FUNDAMENTOS DE LA TÉCNICA
Origen de la absorción
El origen de la absorción de las bandas en el Infrarrojo cercano es el mismo que para las
bandas del IR medio: una molécula absorbe radiación electromagnética en esta región si la
energía de la radiación corresponde a la diferencia energética entre 2 niveles
vibracionales, además de producirse un cambio en el momento bipolar de la molécula.
Cuando se dan estas dos circunstancias, ocurre una transferencia neta de energía que da
lugar a un cambio en la amplitud de la vibración molecular y como consecuencia absorbe
la radiación [16] El fenómeno espectroscópico que provoca la absorción de energía por
[14] T. Davies. The history of near infrared spectroscopic analysis: past, present and future from sleeping technique to the morning star of spectroscopy. Analusis. 26 (1998) 17-19.
[15 ] E.N. Lewis, J.E.Carroll, and F.C. Clarke. A near infrared view of pharmaceutical formulation analisys.NIR News. 12 (2001) 16-18.
[16] D.A. Skoog, F.J. Holler, T.A. Nieman. Principios de análisis instrumental,. 5ª ed. (2001) McGraw- Hill.
INTRODUCCIÓN
15
parte de la materia es debido: a las rotaciones moleculares en el IR lejano, a bandas
fundamentales de vibración en el IR medio, y finalmente a bandas de combinación de las
bandas fundamentales y a sobretonos en el IR cercano. [17, 18]
Cuando se trata de especies homonucleares como O2, N2 o Cl2, el momento bipolar no se
altera durante la vibración o la rotación y, en consecuencia, este tipo de compuestos no
absorben radiación en el infrarrojo.
Los movimientos vibratorios que presenta una molécula pueden ser básicamente de dos
tipos:
Estiramiento. Se produce un cambio en la distancia interatómica a lo largo del eje
del enlace de dos átomos durante la vibración.
Flexión. Además de la modificación en la distancia interatómica se produce un
cambio en el ángulo de enlace.
A diferencia del Infrarrojo medio, en la región del NIR no aparecen las bandas de
vibración fundamentales ( =±1 ). Las bandas debidas a los sobretonos corresponden a
transiciones energéticas en las cuales >1 , aunque siendo los sobretonos con
=±1 ,2, 3 y 4, los únicos con probabilidad de ser observados en esta región. Los
sobretonos aparecen a frecuencias ligeramente menores que las teóricas como múltiplos
de las frecuencias fundamentales, debido al diferente espaciado entre los niveles
energéticos.
Las bandas de combinación se producen exclusivamente en moléculas poliatómicas y son
debidas a cambios simultáneos en la energía de dos o más modos de vibración. La
[17] J.J. Workman. Review of process and non-invasive near infrared and infrared spectroscopy: 1993-1999. Appl. Spectrosc. Reviews. 34 (1999) 1-89.
[18] R.F. Goddu, D.A. Delker. Spectra-Structure Correlations for Near-Infrared Region. Anal. Chem. 32 (1960) 140-141.
INTRODUCCIÓN
16
interacción entre ambos modos da lugar a las bandas de combinación, cuya frecuencia es
combinación lineal de las frecuencias fundamentales que interaccionan:
1 1 2 2 3 3n n n .....comb (1)
donde n1, n2,… son números enteros.
Las transiciones no fundamentales son menos probables que las transiciones entre niveles
consecutivos. Por esta razón las bandas NIR son de menor intensidad que las que
aparecen en la región del Infrarrojo medio. Además, son bandas más anchas y no están
bien definidas debido al solapamiento de los sobretonos y bandas de combinación. [19].
Las bandas más frecuentes en la región del NIR son debidas a enlaces que contienen
átomos con elevadas diferencias en el peso atómico (por ejemplo C-H, O-H, N-H,..), lo
cual provoca un aumento en la anarmonicidad del enlace.
En la figura 1.1 se muestran las regiones NIR donde absorben los diferentes enlaces. Las
bandas de los grupos C=O, C-C, C-F, C-Cl, en general son muy débiles o no aparecen en la
región NIR. Las vibraciones fundamentales de estos grupos tienen bajas frecuencias en la
región IR y por tanto, los primeros sobretonos también aparecen en esta región.
Una característica de la zona del infrarrojo cercano es que las interacciones entre
moléculas, como puentes de hidrógeno, afectan al espectro NIR, por lo que un espectro
NIR también incorpora información sobre la estructura cristalina de la sustancia.
[19] E.W. Ciurczak. Principles of Near-Infrared Spectroscopy. Handbook of Near-Infrared Analysis In D.A. Burns and E.W. Ciurczak (eds)., 2nd Edn (2001) Marcel Dekker, Inc. pp 9-18.
INTRODUCCIÓN
17
Figura 1.1. Representación gráfica de las zonas del espectro NIR donde se manifiestan los
principales grupos funcionales.
Tipos de medida en la región NIR
La espectroscopia NIR es una técnica que destaca por la versatilidad y adaptabilidad que
presenta para analizar muestras de distinta naturaleza. Para las muestras en forma sólida,
la medida efectuada es por reflectancia difusa. En cambio, muestras líquidas suelen
medirse por transmisión de radiación. Un caso intermedio es el de muestras que se miden
por transflectancia, en el que parte de la luz incidente es reflejada en la muestra y otra
parte la atraviesa, para ser reflejada por un dispositivo transflectante, diseñado de tal
forma, que también delimita el camino óptico. En la figura 1.2 se muestran los tres modos
de interacción de la radiación NIR con la materia.
INTRODUCCIÓN
18
Figura 1.2. Diferentes modos de interacción de la materia con la radiación NIR. Imagen extraída
de la Tesis Doctoral de Antonio Peinado (2005)
Medidas por reflectancia
La espectroscopia de reflectancia estudia la radiación reflejada por una muestra que ha
estado irradiada. Consta de dos componentes: La difusa y la especular. La componente
especular descrita por las leyes de Fresnel, aporta poca o nula información acerca de la
composición de la muestra. El detector se coloca en un ángulo determinado frente a la
muestra de manera que se minimizan las radiaciones especulares.
La componente difusa se genera en todas las direcciones y predomina cuando la superficie
irradiada es débilmente absorbente a la longitud de onda incidente y la penetración de la
radiación es mayor en relación a la longitud de onda. La señal analítica medida se expresa
como absorbancia aparente:
c a R
1 log Aap (2)
siendo R la reflectancia relativa ( R = Rmuestra / Restandard ), a una constante de
proporcionalidad y c la concentración.
INTRODUCCIÓN
19
Medida por transmisión
La absorción de la radiación NIR sigue la ley de Lambert-Beer por lo que las medidas por
transmisión pueden ser utilizadas con finalidad cuantitativa. La absorbancia puede ser
definida:
c b I
I log
T
1 log A 0 (3)
siendo T la transmisión, I0 la intensidad de radiación incidente, I la intensidad de la
radiación transmitida, la absortividad molar, b el camino óptico y c la concentración.
No obstante, de manera análoga a las regiones del visible y el MIR, se pueden producir
desviaciones del comportamiento de la ley, debido a cambio en los enlaces por puentes de
hidrógeno, formación de complejos, u otros procesos químicos.
Medida por transflectancia
La muestra, generalmente líquida o semi-líquida, se coloca en una cubeta junto con una
superficie reflectante por una de las caras. El haz de radiación incidente entra por la cara
transparente de la cubeta, atraviesa la muestra y se refleja en la otra cara de la cubeta. Así
retorna de nuevo atravesando la muestra y la radicación es captada por el detector.
Por la naturaleza de las muestras que se han registrado en el trabajo de esta tesis (sólidos
opacos), las medidas realizadas tanto en NIR clásico como en NIR de imagen han sido
realizadas por reflectancia.
1.1.3 INSTRUMENTACIÓN
Debido a la baja intensidad de las bandas NIR, el nivel de exigencia de los
espectrofotómetros NIR, en términos de nivel de ruido permisible y estabilidad
INTRODUCCIÓN
20
instrumental, debe ser mayor que en otros instrumentos, sobre todo si se pretende aplicar
al análisis cuantitativo. Ésta es una de las causas de la tardía aparición de los primeros
espectrofotómetros NIR, qué empezaron a comercializarse sólo cuando los avances
tecnológicos permitieron obtener niveles adecuados de sensibilidad, reproducibilidad y
ruido.
El esquema básico de un instrumento NIR no difiere de cualquier espectrofotómetro. Sus
componentes básicos son: fuente de radiación, sistema de selección de longitud de onda,
compartimento de muestra y detector.
Fuente de radiación
La fuente de radiación más utilizada es la lámpara halógena de filamento de tungsteno con
ventana de cuarzo, capaz de proporcionar un espectro continuo en la región de 320-
2500nm. Otras fuentes de radiación que pueden utilizarse son los denominados LEDs
(Light Emiting Diodes) [20-21], que dependiendo de su composición pueden llegar a
emitir hasta los 1600 nm. Los instrumentos que incorporan este último sistema de fuente
de radiación no requieren un sistema de selección de longitudes de onda.
Sistemas de selección de longitudes de onda
A excepción de los instrumentos basados en LED's como fuente de radiación, es necesario
un sistema que descomponga el haz de luz policromática en longitudes de onda discretas,
proporcionando un ancho de banda estrecho y una elevada intensidaden todo el intervalo
de longitudes de onda. Los dispositivos de selección de longitudes de onda se pueden
clasificar en dos tipos: dispersivos y no dispersivos.
Los sistemas dispersivos se basan principalmente en la aplicación de monocromadores.
Los monocromadores son dispositivos que descomponen la luz policromática que
[20] A.S. Bonanno, P.R. Griffiths. Discrimination of organic solvents using an infrared-emitting diode-based analyzer. Part I: Feasibility. Appl. Spetrosc. 49 (1995) 1590-1597.
[21] United States Patent. Patent Number 4.286.327 (1981)
INTRODUCCIÓN
21
proviene de la fuente de radiación en longitudes de onda discretas. La radiación entra en
forma de haz estrecho y un elemento dispersante, que puede ser un prisma o una red de
difracción, la separan en las distintas longitudes de onda. Los más utilizados actualmente
son los que incorporan una red de difracción, ya que son más baratos, proporcionan mejor
separación de longitudes de onda y dispersan linealmente la radiación [22].
El conjunto de sistemas no dispersivos es más amplio debido a su mayor utilización
actualmente. Dispone de equipos con filtros adicionales, con filtros optoacústicos (AOTF)
e instrumentos de transformada de Fourier (FT), ambos con características bastante
diferentes entre sí. La selección de longitudes de onda mediante filtros se realiza
interponiendo materiales específicos entre la muestra y la fuente de radiación,
permitiendo el paso de longitudes de onda selectivas.
Compartimiento de la muestra
El compartimiento de muestra es la parte del espectrofotómetro que más variaciones
presenta en función de la aplicación. La espectroscopia NIR tiene una gran versatilidad y
adaptabilidad para el análisis de muestras de diversa naturaleza, ya sean sólidas, líquidas
o gaseosas, debido a la existencia de múltiples módulos de medida adaptados a cada tipo
de muestra. Los 3 tipos de medida ya se mostraron en la figura 1.2 donde ya se puede
observar las diferentes disposiciones en función del tipo de muestra.
Detector
Los detectores empleados en espectroscopia NIR son construidos con materiales
semiconductores como InGaAs, InAs, InSb, PbS o Si. El material más utilizado en la
región 1100 – 2500 nm es el PbS, mientras que en la región más próxima al visible
(780 – 1100 nm) se emplea generalmente el silicio. Los detectores de InGaAs son buenas
[22 ] D.A. Skoog. Principles of Instrumental Analysis. Ed. Brooks Cole (1997).
INTRODUCCIÓN
22
alternativas a los detectores de PbS ya que ofrecen mayor respuesta, pero con el
inconveniente de que la temperatura de trabajo óptima es de -40ºC [23].
1.1.4 APLICACIONES DE LA ESPECTROSCOPIA NIR
El campo agroalimentario centra una gran cantidad de las aplicaciones de la
espectroscopia NIR y abarcando desde la determinación de parámetros (proteína,
humedad, azúcar, almidón etc... ) de distintos cereales [24], la identificación de
transgénicos [25], control de calidad de carne [26] a la monitorización del control de
calidad de bebidas [27] entre otras.
Pero la espectroscopia NIR ha sido aplicada a ámbitos tan diferentes del agroalimentario y
dispares el de la industria química [28] y petroquímica [29], aplicaciones médicas [30], e
incluso biotecnológicas [31] entre otras.
Un ámbito en el que la espectroscopía NIR ha tomado gran importancia es el
farmacéutico. Prueba de ello es el elevado número de aplicaciones desarrolladas tanto
[23] E. Stark and K. Luchter. Diversity in NIR instrumentation. Proceedings of the 11th International Conference on Near Infrared spectroscopy. NIR Publications (2004) 13.
[24] Z. Schmilovitch, A. Hoffman, H. Egozi, R. Ben-Zvi, Z. Bernstein, V. Alchanatis. Maturity determination of fresh dates by near Infrared Spectrometry. J Sci Food Agric. 79 (1999) 86–90.
[25] A. Alishahi, H. Farahmand,N. Prieto,D. Cozzolino. Identification of transgenic foods using NIR spectroscopy. Spectrochimica Acta, Part A: Molecular and Biomolecular Spectroscopy. 75A (2010) 1-7.
[26] N. Prieto,R. Roehe,P. Lavin,G. BattenS. Andres. Application of near infrared reflectance spectroscopy to predict meat and meat products quality. Meat Science. 83 (2009) 175-186.
[27] Y. Huang, Haibo, X. Haiyan, Y.Y. Huirong. Near infrared spectroscopy for on/in-line monitoring of quality in foods and beverages. Journal of Food Engineering. 87 (2008) 303-313.
[28] A.M Brearley. Applications of near-infrared spectroscopy (NIR) in the chemical industry. Ed. K. Bakeev.Process Analytical Technology (2005) 392-423.
[29] B. Buchanan,. Recent advances in the use of near-IR spectroscopy in the petrochemical industry. Practical Spectroscopy Handbook of Near-Infrared Analysis. 3rd Edition. 35 (2008) 521-527.
[30] Y. Ozaki,H. ShinzawaK. Maruo,Y.P. Du.S. Kasemsumran. In vivo nondestructive measurement of blood glucose by near-infrared diffuse-reflectance spectroscopy. Ed Tuchin, Valery Viktorovich. Handbook of Optical Sensing of Glucose in Biological Fluids and Tissues (2009) 205-236.
[31] A.E. Cervera, N. Petersen,A.E. Lantz,A. Larsen,K.V. Gernaey. Application of near-infrared spectroscopy for monitoring and control of cell culture and fermentation. Biotechnology Progress. 25 (2009) 1561-1581.
INTRODUCCIÓN
23
para el control de producto final como para controlar el producto en las distintas etapas
del proceso.
En la bibliografía se encuentran aplicaciones relacionadas con los parámetros químicos de
la muestra analizada como, cuantificación de como el active principal ingredient (API) de
un preparado farmacéutico [32], determinación de API en comprimidos [33],
determinación de humedad [34], análisis de la uniformidad de contenido [35], análisis de
la homogeneidad de mezclas farmacéuticas [36], identificación del API y excipientes [37],
etc…
También hay aplicaciones de espectroscopía relacionadas con los parámetros físicos de la
muestra analizada como densidad del producto [38], tamaño de partícula de un
granulado [38], transformación polimórfica [39], dureza del comprimido [40], test de
disolución de un comprimido [41], etc…
[32] M. Blanco, M. Alcalà.. Simultaneous quantitation of five active principles in a pharmaceutical preparation: Development and validation of a near infrared spectroscopic method. Eur J Pharm Sci. 27 (2006) 280–286.
[33] J. Colón, C. Peroza, W. Caraballo, C. Conde, T. Li, K.R. Morris, R.J. Romañach.. On line non-destructive determination of drug content in moving tablets using near infrared spectroscopy. Proc Anal Tech. 2 (2005) 8–15.
[34] A. Gupta,G.E. Peck,R.W. Miller,K. Morris. Journal of Pharmaceutical Sciences. 94 (2005)1589-1597.
[35] J.L. Ramirez,M.K. Bellamy,R.J. Romanach. A novel method for analyzing thick tablets by near infrared spectroscopy. AAPS PharmSciTech. 2 (2001).
[36] I. Storme-Paris,I. Clarot,S. Esposito,J.C. Chaumeil,A. Nicolas,F. Brion, A. Rieutord,P. Chaminade. European Journal of Pharmaceutics and Biopharmaceutics. 72(2009) 189-198.
[37] M. Blanco, M.A. Romero. Near-infrared libraries in the pharmaceutical industry: a solution for identity confirmation. Analyst. 126 (2001) 2212-2217.
[38] M.Alcala,M. Blanco,M. Bautista,J.M. Gonzalez. On-line monitoring of a granulation process by NIR spectroscopy. Journal of Pharmaceutical Sciences. 99 (2009) 336-345.
[39] H.G. Britain Polymorphishm in Pharmaceutical Solids. Ed by H.G. Britain. Marcel Dekker Inc. (1999).
[40] M. Otsuka,I. Yamane. Prediction of tablet properties based on near infrared spectra of raw mixed powders by chemometrics: Scale-up factor of blending and tableting processes. Journal of Pharmaceutical Sciences. 98 (2009) 4296-4305.
[41] M. Blanco,M. Alcala,J.M. Gonzalez,E. Torras,. Determination of dissolution profiles in intact pharmaceutical tablets by NIR spectroscopy. PAT--The Journal of Process Analytical Technology. 3 (2006) 25-29.
INTRODUCCIÓN
24
1.2 ESPECTROSCOPIA NIR IMAGEN
1.2.1 INTRODUCCIÓN A LA ESPECTROSCOPIA DE IMAGEN
Una imagen puede ser definida como la representación gráfica de un objeto real. En
función del número y tipo de canales utilizados para obtener una imagen pueden
obtenerse imágenes en escala de grises, imágenes RGB, imágenes hiperespectrales, etc.
como se muestra en la figura 1.3 . Una imagen química puede ser definida como la
representación de una imagen de la que se obtiene información química, como es el caso
de la técnica de NIR imagen (NIR-CI).
La fracción más pequeña de la imagen que contiene información se denomina píxel, y su
tamaño depende de la resolución de la cámara y de la forma de registro de las imágenes.
La espectroscopia NIR-CI, combina la espectroscopia convencional con el tratamiento
digital de la imagen. La información espectral y espacial se registran simultáneamente
proporcionando un espectro NIR por cada píxel de la imagen de la muestra. El resultado
consiste en un conjunto de datos tridimensional (M, N, λ), que se denomina cubo de datos
hiperespectral (figura 1.3). Los ejes M y N representan la información espacial, mientras
que el eje λ se corresponde con el eje de la longitud de onda (medida espectral).
INTRODUCCIÓN
25
Figura 1.3. Representación de diferentes clases de obtención de imágenes: escala de grises, RGB y
hiperespectral.
El uso de imágenes químicas es un nuevo enfoque analítico ya que no solamente permite
la identificación cuantitativa sino que permite una identificación espacial de las especies
químicas en una muestra.
En términos muy sencillos se puede considerar como un mapa de un producto químico.
Mediante la combinación de espectroscopia infrarroja tradicional con las propiedades de
imágenes microscópicas y macroscópicas.
Una sola medición rápida permite a los analistas obtener información espacial y espectral
con gran facilidad sin estudios previos. La posibilidad de registrar un espectro en un
amplio intervalo de longitudes de onda para cada píxel de la imagen de una muestra está
enfocada al desarrollo de nuevas metodologías más robustas y fiables para extraer la
información más relevante de los datos obtenidos.
Es sobradamente conocido, que la distribución espacial de los componentes en materiales
complejos influye fuertemente en las propiedades físicas y químicas, siendo de gran
INTRODUCCIÓN
26
importancia en la mayoría de procesos farmacéuticos donde uno de los objetivos
principales es conseguir una correcta distribución de todos los analitos en los lotes de
producción. Las técnicas de Imagen Química han encontrado muchos usos en la industria
farmacéutica, las ciencias de polímeros, ciencia de materiales, medicina forense, patología,
clínica y diagnóstico, así como la calidad industrial y control del proceso.
La utilización de las técnicas de NIR Imagen Química como metodología de trabajo en
análisis farmacéutico esta en expansión, ya que esta técnica permite la adquisición de
información espectral y espacial de una muestra en un período corto de tiempo; una sola
imagen contiene miles de espectros con lo que supera ampliamente la capacidad del NIR
convencional. Esta capacidad de adquisición de datos, unida a la amplia variedad de
herramientas para el tratamiento de las imágenes obtenidas, es la base del gran potencial
de la técnica [42].
1.2.2 TIPOS DE CÁMARA
Figura 1.4. Las tres formas de registro de imágenes hiperespectrales: a)Imagen de registro por
puntos, b) Imagen de registro por líneas, c) Imagen de registro por plano.
Una cámara espectroscópica diseñada para obtener imágenes hiperespectrales está
formada por los dispositivos necesarios para obtener la información espectral y espacial
de la muestra. La información espacial se puede obtener utilizando tres configuraciones
[42] A. de Juan, R. Tauler, R. Dyson, C. Marcolli, M. Rault, M. Maeder. Spectroscopic imaging and
chemometrics: a powerful combination for global and local sample analysis. Trends in Analytical Chemistry, 23 (2004) 70-79.
INTRODUCCIÓN
27
distintas: registro por puntos (scan point), registro por líneas (line scan) y registro por
plano (focal plane scan).
Imagen de registro por puntos
La configuración de la cámara de registro por puntos es la que se muestra en la figura 1.4.
Con esta disposición se puede obtener un espectro de una pequeña región de muestra. La
muestra debe ser posicionada nuevamente, a través de un sistema mecánico-electrónico,
para obtener un nuevo espectro. Del desplazamiento sistemático de la muestra en dos
dimensiones se obtiene una imagen hiperespectral. Este sistema permite obtener
espectros muy estables en alta resolución. Sin embargo, el desplazamiento de la muestra,
que debe ser muy preciso para asegurar la repetitividad de la medida, hace que el tiempo
de adquisición de imagen sea realmente alto (del orden de horas o incluso días).
Imagen de registro por líneas
Esta configuración, mostrada en la figura 1.4, se denomina de registro por líneas (line scan
o push broom en inglés) y utiliza un detector de dos dimensiones perpendicular al plano
de la superficie escaneada. La muestra es iluminada por una estrecha línea de radiación o
bien la radiación pasa por un hueco del tamaño de línea de camino a los detectores. Las
imágenes hiperespectrales se generan al mover la muestra en la dirección del plano de la
muestra perpendicular a la línea de detectores. El tiempo de adquisición de imagen se
reduce de forma significativa, ya que la velocidad viene limitada únicamente por la
capacidad de lectura de la cámara. Existen instrumentos comerciales disponibles con
frecuencias de imagen superiores a los 90 Hz y de 320 x 256 píxeles por imagen. Estos
valores hacen que se pueda obtener imágenes, en función del número de longitudes de
onda escaneadas, en cuestión de minutos o incluso segundos.
INTRODUCCIÓN
28
Imagen de registro por plano
La configuración del registro por planos o imágenes implica el posicionamiento del
detector en un plano paralelo a la superficie de la muestra. Se obtiene una imagen para
cada longitud de onda y se forma la imagen hiperespectral por la combinación de todas
ellas a lo largo de la zona del espectro elegida. El tiempo de adquisición de imagen es
relativamente corto, entre 1 y 5 minutos. Los problemas más importantes de esta
configuración se derivan del hecho de que la muestra debe ser iluminada completamente
durante el tiempo de adquisición, provocando su calentamiento, hecho que limita sus
aplicaciones en proceso biológicos y en muestras termosensibles. Además, en función de
las propiedades de los sólidos escaneados, este hecho puede producir problemas de
resolución lateral. Los instrumentos comerciales disponibles permiten obtener imágenes
de 256x320 píxeles a resoluciones ópticas que alcanzan hasta los 10 µm por píxel, aunque
normalmente se trabaja con resoluciones del orden de 30-100 µm.
1.2.3 APLICACIONES DE LA ESPECTROSCOPIA NIR DE IMAGEN
Las técnicas de imagen hiperespectral tienen como objetivo no solo cubrir aspectos que el
NIR convencional no podía abordar, sino también mejorar y también desarrollar nuevas
aplicaciones que amplíen el conocimiento de las muestras. Prueba de ello son las diferentes
aplicaciones que abarcan campos tan dispares como la industria alimentaria [43], medicina
forense [44], patrimonio cultural [45], etc. proporcionando información de interés en todos
los casos.
[43] E.N. Lewis,J. Dubois,L.H. Kidder. NIR imaging and its applications to agricultural and food engineering. Eds: Y. Ozaki,W.F. McClure, A. Christy. Wiley-Interscience (2006) Chapter 4.3.
[44] C. Petibois, G. Deleris. Chemical mapping of tumor progression by FT-IR imaging : towards molecular histopathology. Trends in Biotechnology. 24 (2006) 455-462.
[45] G. Verhoeven,. Imaging the invisible using modified digital still cameras for straightforward and low-cost archaeological near-infrared photography. Journal of Archaeological Science. 35 (2008) 3087–3100.
INTRODUCCIÓN
29
Pero es en aplicaciones en la industria farmacéutica donde focalizaremos las posibilidades
de las técnicas de imagen hiperespectral.
La imagen hiperespectral, ha sido aplicada con éxito en la producción de distintos
productos farmacéuticos. La evaluación de la calidad del producto [46], análisis de
comprimidos “high-throughput” [47], medidas de espesor de recubrimiento de un
comprimido [48], información sobre la composición de un fármaco [49], homogeneidad
de mezclas [50] y comprimidos [51], y la identificación de fármacos falsificados [52], son
algunos ejemplos de aplicaciones de la espectroscopia NIR de imagen en este campo.
[46] B.J. Westenberger, C.D. Ellison, A.S. Fussner, S. Jenney, R.E. Kolinski, T.G. Lipe, R.C. Lyon, T.W. Moore, L.K. Revelle, A.P. Smith, J.A. Spencer, K.D. Story, D.Y. Toler, A.M. Wokovich, L.F.Buhse. Quality assessment of internet pharmaceutical products using traditional and non-traditional analytical techniques. Int. J. Pharm. 306 (2005) 56–70.
[47] E. Lee, W.X. Huang, P. Chen, E.N. Lewis, R.V. Vivilecchia, Highthroughput analysis of pharmaceutical tablet content uniformity by near-infrared chemical imaging. Spectroscopy 21 (2006) 24–32.
[48] E.N. Lewis, L.H. Kidder, E. Lee. NIR Chemical Imaging - Near-Infrared Spectroscopy on Steroids. NIR News 16 (2005) 2.
[49] S. Sặsĭc. An in-depth analysis of Raman and near-infrared chemical images of common pharmaceutical tablets. Appl. Spectrosc. 61 (2007) 239–250.
[50] N. Jovanovic,, A. Gerich,A. Bouchard,W. Jiskoot. Near-infrared imaging for studying homogeneity of protein–sugar mixtures. Pharmaceutical Research. 23 (2006) 2002–2013.
[51] R.C. Lyon, D.S. Lester, E.N. Lewis, E. Lee, L.X. Yu, E.H. Jefferson, A.S. Hussain. Near-infrared spectral imaging for quality assurance of pharmaceutical products: analysis of tablets to assess powder blend homogeneity. AAPS Pharm Sci. Tech. 3 (2002) 17.
[52] M.B. Lopes, J. ClaudeWolff J.M. Bioucas-Dias, M.A.T. Figueiredo. Determination of the composition of counterfeit Heptodin tablets by near infrared chemical imaging and classical least squares estimation. Analytica Chimica Acta. 641 (2009) 46–51.
INTRODUCCIÓN
30
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
31
2. HERRAMIENTAS
PARA EL ANÁLISIS DE
DATOS.
QUIMIOMETRÍA
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
32
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
33
2. HERRAMIENTAS PARA EL ANÁLISIS DE DATOS.
QUIMIOMETRÍA
El aumento progresivo en complejidad de la instrumentación analítica permite obtener
cada vez un mayor volumen de datos. La conversión de estos datos en información útil
requiere el uso de herramientas matemáticas y estadísticas, que han dado lugar a una
disciplina denominada Quimiometría [53, 54]. La Quimiometría fue definida en 1975 [55]
como el conjunto de métodosutilizados para extraer información química útil de un
conjunto de datos originales.Massart et al. [31] dan una definición más completa y precisa
de este término: “La Quimiometría es la parte de la química que se sirve de las
matemáticas, estadística y lógica formal para diseñar o seleccionar procedimientos
experimentales óptimos, proporcionar información química relevante a partir del análisis
de señales analíticas y, finalmente, adquirir conocimiento de los sistemas químicos”.La
complejidad de la señal NIR hace imprescindible la utilización de técnicas quimiométricas
que nos permitan interpretar, entender y modelar grandes conjuntos de datos. Este
apartado presenta la base teórica de las herramientas quimiométricas utilizadas en la
presente tesis. En un primer lugar, se introduce el proceso de desarrollo de modelos de
calibración cuantitativos. Posteriormente, se comentan los pretratamientos espectrales y
de técnicas de modelado utilizadas. Finalmente, se describe el cálculo de límites de
detección para la evaluación de modelos de calibración PLS.
[53] D.L. Massart, B.G.M. Vandegiste, L.M.C. Buydens, S. De Jong, P.J. Lewi and J.Smeyers. Handbook of chemometrics and qualimetrics. Elsevier. Amsterdam. (1997).
[54] K.R. Beebe, R.J. Pell and M.B. Seasholtz. Chemometrics. A practical guide, John Wiley & sons. New York. (1998).
[55] B.R. Kowalski. Chemometrics: views and propositions. Journal of Chemical Information and Computer Sciences. 15 (1975) 201-203.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
34
Tabla 2.1 Características principales de las herramientas y pretratamientos quimiométricos
utilizadas en la presente memoria.
HERRAMIENTA OBJETIVOS NECESIDAD
CALIBRADO BENEFICIOS DESVENTAJAS
PCA
Selección de
muestras.
Modelado y
control de
procesos.
NO
Información directa.
Muy útil en
selección de
muestras, previa
calibración.
Solo información cualitativa.
Difícil interpretación.
MCR-ALS
Identificación.
Determinación
cuantitativa
NO (pero sí es
conveniente
información previa)
Obtención de
información
cualitativa y
cuantitativa de
forma sencilla.
Ambigüedades.
Selectividad.
PLS-DA
Identificación.
Determinación
cuantitativa
NO
Método directo de
cuantificación.
Requiere espectros puros.
PLS Determinación
cuantitativa SI
Modelos de
cuantificación
robustos
Obtener calibrado robusto.
Método de referencia
KENNARD
&
STONE
Selección de
muestras para
un conjunto de
calibración.
Selección de
muestras, previa
calibración de
forma rápida.
No viene incorporado en el
software empleado.
PIECEWISE DIRECT
STANDARDISATION
Transformación
de espectros
para realizar una
transferencia de
calibración.
SI Transformación
rápida.
La transformación a veces no es lo
suficientemente buena para poder
transferir la calibración.
COEFICIENTES
CORRELACIÓN
Identificación.
Determinación
cuantitativa.
SI Cálculo sencillo
Requiere espectros puros.
Alta correlación espectral en la
región NIR. Requiere muestras
perfectamente homogéneas para
realizar un modelo cuantitativo.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
35
La Quimiometría ha sido utilizada en esta memoria para desarrollar modelos empíricos y
aplicarlos para el análisis de muestras obtenidas en procesos de la industria química y
farmacéutica [56,57]. Existen numerosos textos y publicaciones que contienen
información extensa sobre la teoría y práctica de la Quimiometría en la industria
farmacéutica. Por ello en esta memoria únicamente se han recogido aquellos puntos más
significativos que han sido utilizados para el desarrollo de los métodos propuestos. En la
tabla 2.1 se muestra una breve descripción las herramientas utilizadas, en la presente
[56] C.E. Miller. Chemometrics in Process Analytical Chemistry. In. Ed. K. Bakeev .Process Analytical Technology. Blackwell publishing, Oxford, (2005) pp 226-227.
[57] E.W. Ciurczak, J.K. Drennen. Pharmaceutical and Medical Applications of Near-lnfrared Spectroscopy. Eds. E.W. Ciurczak, J.K. Drennen. Marcel Dekker. New York. (2001).
PRETRATAMIENTO OBJETIVOS BENEFICIOS DESVENTAJAS
STANDARD NORMAL
VARIATE
Corrige efectos de
scattering provocados
por diferencias físicas
entre muestras
Aplicado en la
mayoría de
software comercial
DERIVADAS DE
SAVITZKY-GOLAY
La 1ª derivada elimina
desplazamientos de
línea base constantes, la
2ª derivada elimina
desplazamientos que
varían linealmente con
la longitud de onda
Aplicado en la
mayoría de
software comercial
Exalta el ruido del espectro.
Es necesario optimizar el
tamaño de ventana
SUAVIZADO DE
SAVITZKY-GOLAY
Reducen
matemáticamente el
ruido aleatorio e
incrementan la relación
señal/ruido
Aplicado en la
mayoría de
software comercial
Puede eliminar información
relevante. Es necesario
optimizar el tamaño de
ventana
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
36
Tesis. A partir del tipo de información que puede ser extraída de muestras farmacéuticas
se han clasificado las herramientas.
Todas estas herramientas descritas en los siguientes apartados pueden ser aplicadas a las
técnicas de Imagen, previo desdoblamiento del cubo hiperespectral en una matriz
bidimensional.
2.1 HERRAMIENTAS QUIMIOMÉTRICAS USADAS PARA LA
EXTRACCIÓN DE INFORMACIÓN CUALITATIVA
2.1.1 ANÁLISIS EN COMPONENTES PRINCIPALES (PCA)
Uno de los métodos de reducción de variables más utilizado es el Análisis en Componentes
Principales (PCA, Principal Component Analysis) que permite, entre otros objetivos,
reducir la correlación espectral y englobar las muestras analizadas en función de la
variabilidad que contienen [58].
Consideremos la matriz de datos espectroscópicos X, donde cada una de las I filas
corresponde al espectro de una muestra, y cada columna es la absorbancia a la longitud de
onda J. El objetivo del PCA es explicar la misma información original de la matriz X en un
número inferior de ejes o dimensiones, que corresponden a las variables de la matriz de
datos. Estos nuevos ejes se llaman componentes principales. Su característica principal es
que el primero recoge la máxima variabilidad espectral del conjunto de muestras, el
segundo recoge una variabilidad inferior al primero y es ortogonal a él, y así
sucesivamente. El número de componentes principales se ha de seleccionar de forma que
[58] D.L. Massart, B.G.M Vandeginste, L.M.C. Buydens, S.P. De Jong, J. Lewi,S. Smeyers-Verbeke.Eds. B.G.M Vandeginste and S.C Rutan. Handbook of Chemometrics and Qualimetrics: Part A,Elsevier (1997) pp. 1-20.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
37
contengan información relativa a las muestras y no contengan información relativa al
ruido.
La matriz X se descompone en el producto de dos matrices, una de scores T y otra de
loadings P, quedando una matriz de residuales E, con la información no recogida
por T y P:
tX = TP + E (4)
T son las coordenadas de cada punto respecto a los nuevos ejes (componentes principales)
y P son los cosenos de los ángulos entre los nuevos ejes y los ejes originales. El conjunto de
datos X, descrito inicialmente por variables correlacionadas, queda ahora definido por un
nuevo conjunto de variables no correlacionadas entre sí en un sistema de ejes ortogonales.
La interpretación de los resultados obtenidos con el PCA para una clasificación, se lleva a
cabo a partir de una representación de los scores de las muestras de un PC frente a los
scores de otro(s) PC. Si existe una relación entre las muestras, en el gráfico de los scores,
los puntos aparecerán agrupados; mientras que si las muestras no se asemejan entre si, los
puntos aparecerán dispersos entre si. Esta característica permite realizar una selección de
muestras que sean representativas del conjunto global de muestras y que posteriormente
sean utilizadas en calibraciones. Además del estudio de datos, y la observación de
diferencias entre muestras, el análisis en componentes principales puede ser utilizado
para filtrar el ruido en matrices de datos espectroscópicos, reconstruyendo la matriz con
los A PC’s que recogen las principales fuentes de variación, excluyendo los PC’s poco
significativos, que típicamente tienen una relación señal/ruido baja.
2.1.2 COEFICIENTE DE CORRELACIÓN (CC)
La medida de la semejanza entre dos vectores o conjuntos de datos se define como el
producto de las desviaciones de dos conjuntos de sus valores esperados, esto es la
covarianza de n pares de puntos (xi,yi) que se expresa como:
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
38
n
i
ii
n
yyxxCov
1 1
))((
(5)
Donde x es la media de valores xi e y es la media de valores yi. Un valor positivo indica
que valores altos de x están asociados con valores altos de y y cuando el valor de x
aumenta también lo hace el de y. Un valor negativo indica que valores altos de x están
asociados con valores bajos de y; cuando el valor de x aumenta el de y disminuye.
Debido a que x e y pueden tener distintas unidades y distinta dispersión, el valor de la
covarianza nos da una indicación pobre de la asociación entre las variables y no es un buen
parámetro para comparar situaciones diversas, por lo que se suele utilizar el coeficiente de
correlación.
El coeficiente de correlación es un índice estadístico que mide el grado de relación entre
dos variables cuantitativas y se define como la relación entre la covarianza y las
desviaciones estándar de cada una de las variables.
yx SS
yxCovr
),(
(6)
Cuando x e y representan las absorbancias frente a la longitud de onda (espectros) de dos
compuestos, el valor de r es una medida de la semejanza entre ellos; se puede escribir de
forma abreviada como:
22 )()(
))((
yyxx
yyxx
r
o bien
22 yx
yxr
(7)
Donde xλ e yλ son los valores de absorbancia de los espectros que se comparan a la
longitud de onda λ y x e y son los valores promedio de x e y, respectivamente.
El coeficiente de correlación puede tener valores en el rango de 1 a -1. No existe relación
entre las variables cuando el coeficiente es de 0, aunque no significa que sean totalmente
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
39
independientes la una de la otra, ya que ambas variables podrían estar relacionadas con
otra función matemática [59].
A pesar de ser un parámetro de aplicación para describir el grado de semejanza de dos
conjuntos de datos y de tener usos como a herramienta discriminante de clasificación en
bibliotecas espectrales [60], el coeficiente de correlación se utilizado entre otras cosas, en
estudios de homogeneidad [61], en la diferenciación de formas polimórficas [62]. Una de
las aplicaciones más interesantes del CC es la de two dimension correlation spectroscopy
[63] que permite exaltar las pequeñas diferencias que experimentan los espectros
sometidos a una perturbación experimental.
2.2 HERRAMIENTAS QUIMIOMÉTRICAS USADAS PARA LA
EXTRACCIÓN DE INFORMACIÓN CUANTITATIVA
La información espectroscópica puede correlacionarse con magnitudes físicas o químicas,
obteniéndose ecuaciones o modelos de calibración. El fundamento de cualquier
calibración es establecer una relación entre la señal instrumental y la propiedad a
determinar, y posteriormente predecir esta propiedad a partir de la señal medida en una
muestra desconocida. Es posible utilizar calibraciones univariables cuando la señal es
selectiva a la propiedad estudiada.
[59] A.G. Asuero, A. Sayago, A.G. Gonzalez. The Correlation Coefficient: An Overview Crit Rev Anal Chem 36 (2006) 41–59.
[60] S.H. Frasson Scafi, C. Pasquini C . Identification of counterfeit drugs using near-infrared spectroscopy Analyst. 126 (2001) 2218–2224.
[61] J.J. Moes, M.M. Ruijken, E. Gout, H.W. Frijlink,M.I. Ugwoke. Application of process analytical technology in tablet process development using NIR spectroscopy: Blend uniformity, content uniformity and coating thickness measurements. Int J Pharm. 357 (2008) 108–118.
[62] A.D. Patel, P.E. Luner, M.S. Kemper. Low-level determination of polymorph composition in physical mixtures by near-infrared reflectance spectroscopy. J Pharm Sci. 90 (2001) 360–370.
[63] Y. Peng, P. Wu. A two dimensional infrared correlation spectroscopic study on the structure changes of PVDF during the melting process. Polymer. 45 (2004) 5295–5299.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
40
Sin embargo la Espectroscopia NIR proporciona un gran número de variables respuesta
para cada muestra, variables que en general no pueden ser asignadas a un solo analito.
Esto ha propiciado el desarrollo de métodos de calibración capaces de relacionar múltiples
variables con la propiedad a determinar. Estos métodos son conocidos como métodos de
calibración multivariantes. Las características principales de estos métodos son:
Trabajan con un gran número de medidas de cada muestra, normalmente con el
espectro completo.
Son necesarios los valores de la propiedad a determinar para cada muestra.
Es posible determinar de forma independiente cada una de las propiedades que se
desea cuantificar.
2.2.1 CALIBRACIÓN UNIVARIANTE MEDIANTE COEFICIENTES DE
CORRELACIÓN (CC)
Los espectros de dos compuestos semejantes presentarán coeficiente de correlación
próximo a 1 y cuanto más diferentes sean menor será el valor de CC; la aplicación de este
concepto a mezclas de dos o más compuestos nos da la idea de que cuanto mayor sea el
contenido de un compuesto en la mezcla mayor será el CC del espectro de la mezcla con el
del compuesto puro; así, el CC aumenta a medida que aumenta la proporción del
compuesto en la mezcla. La relación matemática que puede existir entre el CC de una
mezcla con respecto al componente puro y la concentración del mismo, puede expresarse
tal y como se muestra en la ecuación (8), como lineal siempre y cuando se trabaje en un
intervalo estrecho de concentraciones.
r= K(A-A’) Ca+ K’ (8)
donde K y K’ son dos constantes que contienen términos relacionados con la absorbancia
del analito y el promedio de las concentraciones de las muestras usadas en la calibración.
A y A’ son los coeficientes de proporcionalidad absorbancia/concentración para el analito
y la matriz respectivamente.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
41
Esta ecuación constituye la base de un método para determinar la concentración, pues
permite realizar una calibración lineal univariable entre los CC de un conjunto de
espectros NIR de una serie de muestras y uno de sus componentes y la concentración del
mismo. Para aplicar este modelo es necesario disponer del espectro del compuesto puro.
2.2.2 CALIBRACIONES MULTIVARIANTES
Regresión lineal múltiple (MLR)
La regresión lineal múltiple es expresada en notación matricial como:
Y = XB+ E (9)
Las dimensiones de las matrices hacen referencia a m el número de muestras, p el
número de propiedades analíticas estudiadas o variables dependientes y n el número de
canales, longitudes de onda o variables independientes. Desde un punto de vista formal,
MLR es la generalización del problema de mínimos cuadrados univariantes o regresión
lineal simple (n=1 ; p=1) a un estado multivariable en el cual p≥1, n>1. Al aplicar MLR a
datos espectroscópicos, Y es la matriz de datos de referencia de la propiedad analítica que
se quiere modelar, X es la matriz de datos espectrales, B es la matriz de parámetros de
regresión estimados, m es el número de muestras, p es igual al número de longitudes de
onda utilizado. La solución de mínimos cuadrados a la ecuación (9) viene dada por la
expresión (10):
B=(XTX)-1XTY (10)
MLR proporciona los mejores parámetros lineales insesgados (BLUE). Sin embargo, este
método tiene dos importantes restricciones:
El número de muestras debe ser superior al número de canales o longitudes de
onda empleado.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
42
La información espectral no debe estar correlacionada ya que la matriz XTX sería
singular y su inversa inestable. Matemáticamente, decimos que el problema está
mal condicionado (ill-conditioned).
Al trabajar con espectroscopia NIR nos encontramos con estás dos restricciones,
usualmente el número de muestras es inferior al número de longitudes de onda. Además,
el espectro NIR está altamente correlacionado ya que la absorción debido a un enlace se
manifiesta de forma repetida a lo largo del espectro NIR en forma de bandas de
combinación y sobretonos.
Regresión en componentes principales (PCR)
PCR es una técnica de calibración multivariante que consta de dos pasos. El primero de
ellos consiste en un Análisis de Componentes Principales (PCA) sobre la matriz de datos X
[64,65,66]. Este análisis genera un conjunto de vectores ortogonales no correlacionados
(scores o componentes principales (PCs)). La nueva
matriz de datos centrados puede escribirse:
X = TPt + E (11)
Donde T es la matriz de los scores de los A componentes principales más dominantes, Pt
la correspondiente matriz de loadings y e la matriz de residuos que representa el ruido o
la información no relevante.
El segundo paso consiste en una Regresión Lineal Múltiple (MLR) [67] entrelas nuevas
variables obtenidas y el parámetro de referencia Y que se desea modelar.
Y = Tb+ e (12)
donde T es la matriz de los scores, b es la matriz de los coeficientes y e los residuos.
[64] J.E. Jackson. A user's guide to principal components. Ed. John Wiley. New York. (1991).
[65] E.R. Malinowski. Factor analysis in chemistry. 2nd. Ed. John Wiley New York. (1991).
[66] S. Wold, K. Esbensen, P. Geladi. Principal Component Analysis. Chemom.Intell. Lab. Syst. 2 (1987) 37-52.
[67] D.L. Massart,B.G.M. Vandeginste,S.N. Deming,Y. Michotte,L. Kaufman. Data Handling in Science and Technology, volume 2. Chemometrics: a textbook. ElsevierScience Publishers. Amsterdam, The Netherlands. (1988).
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
43
El análisis de componentes principales maximiza la varianza explicada del sistema, sin
embargo, no maximiza necesariamente la calidad de los resultados de predicción del
parámetro modelado para muestras desconocidas.
Regresión parcial por mínimos cuadrados (PLS)
La regresión por mínimos cuadrados parciales (PLS) es una técnica de calibración
multivariable inversa, lo que hace posible calibrar únicamente el componente deseado sin
necesidad de conocer el resto de fuentes de variación.
PLS fue desarrollado entre 1975 y 1982 por Herman Wold y colaboradores [68] y desde
entonces, este modelo ha sido ampliamente estudiado, aplicado, contrastado y divulgado
[69, 70, 71, 72, 73]. Éste basa en que la información contenida en las variables medidas se
puede concentrar en un número menor de variables sin pérdida de información relevante,
de forma similar al PCA, haciendo máxima la matriz de varianza-covarianza. La regresión
se realiza sobre las nuevas variables, eliminando así los problemas de colinealidad que
puedan tener los datos originales.
Para el PLS, se dispone de una matriz de datos espectrales X y una matriz Y que contiene
los datos de la propiedad a determinar. La regresión PLS se basa en un cálculo de
reducción de variables, donde las matrices X (espectral) e Y (analito) se descomponen
simultáneamente según:
X = TPT +E (13)
Y = UQT +F (14)
[68] H. Wold. Soft Modeling. The Basic Design and Some Extensions. in Systems Under Indirect Observation. Eds. K.G. Jöreskog, H. Wold.Amsterdam. (1982).
[69] P. Geladi. Notes on the history and nature of partial least squares (PLS) modelling. J. Chemom. 2 (1988) 231-246.
[70] A. Höskuldsson. PLS regression methods. J. Chemom. 2 (1988) 211-228.
[71] S. De Jong. SIMPLS: an alternative approach to partial least squares regression. Chemom. Intell. Lab. Syst. 18 (1993) 251-263.
[72] A. Phatak,S. De Jong. The geometry of partial least squares. J. Chemom. 11 (1997) 311-338.
[73] A.J. Burnham,J.F. MacGregor,R. Viveros. A statistical framework for multivariate latent variable regression methods based on maximum likelihood. J. Chemom. 13 (1999) 49-65.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
44
Donde las matrices T y U son, respectivamente, las matrices de scores de los bloques X e
Y. Las matrices PT y QT son las matrices de loadings de los bloques X e Y, y E y F son las
matrices de residuales del bloque X y del bloque Y respectivamente.
En PLS, al igual que en PCA, se han de seleccionar el número de factores adecuado al
sistema, recogiendo información cuantitativa pero sin recoger ruido o información
espectral relativa a otros parámetros no relacionados con la calibración.
La descomposición de las dos matrices no se hace por separado, sino de forma simultánea.
La principal característica de esta descomposición es que busca la máxima correlación
entre los espectros y la propiedad a determinar. Esta descomposición implica perdida de
ortogonalidad entre los factores pero mejora la capacidad predictiva del modelo de
calibración.
Una vez se ha establecido el modelo de calibración correcto, es posible predecir el
resultado para una nueva muestra o para un conjunto de muestras externo a la
calibración. La correcta predicción de las nuevas muestras dependerá de la buena
capacidad predictiva del modelo de calibración.
2.3 OTROS ALGORITMOS
2.3.1 ALGORITMO DE KENNARD & STONE
Kennard y Stone propusieron un método secuencial que debe cubrir la región
experimental de manera uniforme que es lo que se pretende al utilizar un diseño de
experimentos [74]. El procedimiento consiste en seleccionar como siguiente muestra
(objeto candidato) aquel que se encuentra a mayor distancia de los objetos previamente
seleccionados (objetos de calibración). La distancia utilizada normalmente es la distancia
Euclidea aunque es también posible, y probablemente es mejor, utilizar la distancia de
[74] R.W. Kennard,L.A. Stone. Computer aided design of experiments. Technometrics. 11(1969) 137-148.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
45
Mahalanobis. En un primer momento, se seleccionan los dos objetos que se encuentran a
mayor distancia dentro del espacio experimental. De todos los puntos candidatos, se
selecciona aquel que esté más alejado de los dos primeros previamente seleccionados y se
añade al conjunto de las muestras de calibración. Para ello, se determina la distancia entre
cada punto candidato i0 y cada punto i que ha sido ya seleccionado
y se determina cuál es la menor distancia (min i (d i,i0 )) .
De entre estos valores se selecciona aquel para el que la distancia sea máxima
dseleccionado = maxi0(min i (d i,i0 )) (15)
En ausencia de fuertes irregularidades en el factor espacio, el procedimiento comienza con
la selección del conjunto de puntos próximos a aquellos seleccionados mediante el método
D-optimal, i.e., en los límites del conjunto de datos (más el punto central). Entonces se
procede a rellenar el espacio de calibración. Kennard y Stone denominaron a su
procedimiento “algoritmo de trazado uniforme”; proporciona una distribución plana de
datos que, como se explicó antes, es la más adecuada para el modelo de regresión.
2.3.2 PIECEWISE DIRECT STANDARDISATION (PDS)
El método PDS [75] relaciona de forma multivariante las respuestas de las muestras del
subconjunto de estandarización. La técnica considera que existen correlaciones entre los
valores de la respuesta por grupos de variables. Así, las respuestas en la variable i de las
muestras en las primeras condiciones, r1i, se relacionan con una ventana de respuestas,
centrada en la variable i, para las mismas muestras pero en las segundas
condiciones.r1i=XTi fi +f0i (16)
[75] Y. Wang, D. J. Veltkamp,B.R. Kowalski. Multivariate instrument standardization. Anal. Chem. 63 (1991) 2750.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
46
Donde fi son los coeficientes de corrección y f0i el término independiente o corrección
aditiva de fondo (additive background correction, ABC) [76] y se obtienen por una
regresión multivariante PCR o PLS. Para una regresión multivariante (J variables), se
obtendrán J vectores fi y J valores foi, que se pueden agrupar en la matriz F:
F= diag (f 1, f 2,... , f i, , f J ) (17)
f0T=(f 01, f 02,... , f 0i, , f 0J ) (18)
Las respuestas en las nuevas condiciones, rT2,un se estandarizan según:
(rT2,un)std= rT
2,unF+ f0T (19)
y el vector de respuestas estandarizado, (rT2,un)std , se utiliza en el modelo para obtener las
predicciones finales.
Esta técnica consigue corregir cambios más complejos que otras más simples, como la
corrección de la pendiente y el sesgo, aunque tiene la desventaja del mayor número de
parámetros que se deben establecer: el tamaño de la ventana, el número de factores que
intervienen en los modelos locales (ventanas) o el número demuestras de estandarización
a utilizar. Si estos parámetros se escogen incorrectamente se pueden producir errores en
la transferencia, o artefactos [77], producidos por una selección de muestras poco
representativas o por una incorrecta selección del número óptimo de factores en los
modelos locales. Tanto en la técnica de transferencia PDS, como en la corrección de la
pendiente y el sesgo, hay que seleccionar un subconjunto de muestras para realizar la
transferencia. Un método de asegurar la representatividad de las muestras seleccionadas
[76] Z. Wang, T. Dean, B. R. Kowalski. Additive Background Correction in Multivariate Instrument Standardization. Anal. Chem. 67 (1995) 2379.
[77] O,de Noord. Multivariate calibration standardization. Chemom Intell Lab Syst 25 (1994) 85.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
47
es utilizar un algoritmo de selección de muestras como el de Kenard-Stone [74], que
selecciona secuencialmente las muestras de forma que se extiendan
uniformente en el espacio experimental.
2.4 MODELADO Y CONTROL
El proceso de desarrollo y evaluación de un modelo quimiométrico, ya sea destinado al
análisis cualitativo o cuantitativo, consta de una serie de etapas básicas. De modo general,
estas etapas tienen una seria de características comunes. A continuación se describen más
ampliamente cada una de ellas [78].
2.4.1 SELECCIÓN DEL CONJUNTO DE CALIBRACIÓN
El primer paso es disponer de un número de muestras suficiente para la creación y
validación del modelo. Las muestras utilizadas para el desarrollo de un modelo de
calibración deben ser representativas de la variabilidad que pueda darse durante el
proceso, y también entre procesos. Así, las muestras, además de cubrir todo el intervalo de
la propiedad a determinar, han de incorporar la variabilidad debida a otras variables del
proceso, como puede ser el origen de la materia prima o la temperatura de reacción, entre
otros. Herramientas útiles para la selección demuestras son el análisis en componentes
principales (PCA) y el algoritmo de Kennard & Stone.
[78] M. Blanco, M. Alcala. Use of Near-Infrared Spectroscopy for Off-line Measurements in the Pharmaceutical Industry. Ed. K. Bakeev. Process Analytical Technology. Blackwell publishing. Oxford (2005) pp 362-391.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
48
2.4.2 MÉTODOS DE REFERENCIA
El desarrollo de modelos cuantitativos requiere el conocimiento previo de las variables que
van a ser determinadas. Para ello se utilizan los métodos de referencia que deben
proporcionar valores precisos y exactos, ya que de ello dependerá la calidad del modelo a
desarrollar. En el apartado de metodología se describen los métodos de referencia
utilizados en la presente memoria.
2.4.3 OBTENCIÓN DE LA SEÑAL ANALÍTICA
Registro de la información analítica primaria que se va a utilizar en la construcción del
modelo de calibración, siendo en nuestro caso el espectro NIR.
2.4.4 PRETRATAMIENTOS ESPECTRALES
En los datos espectroscópicos pueden aparecer contribuciones no deseadas (debido al
proceso de registro, a la naturaleza de la muestra o al ruido instrumental), que causan no
linealidades u otros efectos que pueden afectar negativamente al desarrollo del modelo de
calibración. Los pretratamientos espectrales tienen como objetivo, entre otros, minimizar
las contribuciones espectrales no deseadas, simplificando los modelos y mejorando los
resultados.La selección del pretratamiento espectral adecuado suele realizarse a posteriori
teniendo en cuenta un estudio estadístico de los resultados obtenidos encada caso.
Hacerlo a priori puede resultar erróneo ya que su selección no sólo depende del tipo de
muestra o del modo de registro espectral, sino también de contribuciones desconocidas.
A continuación se presentan los pretratamientos más habituales utilizados en este trabajo.
Suavizado de espectros (Smoothing Average): Los métodos de suavizado son
utilizados para reducir matemáticamente el ruido aleatorio e incrementar la
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
49
relación señal/ruido [79]. Estos métodos utilizan una ventana de puntos para
determinar un valor central, desplazando la ventana a lo largo de todo el espectro.
Sin embargo, el incorrecto uso del tamaño de ventana podría eliminar información
relevante, por lo que es necesario optimizar el tamaño de ventana.
El más utilizado en la presente memoria es el de Savitzky-Golay [80].
SNV (Standard Normal Variate) [81]: corrige efectos de scattering provocados
por diferencias físicas entre muestras. El método se aplica individualmente a cada
espectro, y se obtiene un espectro de absorbancia media y desviación estándar. La
ecuación para el cálculo del SNV es:
jSNVj
Abs AbsAbs
S
(20)
donde Absj es la absorbancia original a la longitud de onda j, Abs es la
absorbancia media del espectro y S es la desviación estándar.
Derivadas: Es uno de los pretratamientos más utilizados en espectroscopia NIR
por su capacidad de solventar los problemas característicos de esta técnica: el
solapamiento de bandas y los desplazamientos de línea base. La primera derivada
elimina desplazamientos de línea base constantes, la segunda derivada elimina
desplazamientos que varían linealmente con la longitud de onda. El método de
derivación más utilizado es el de Savitzky-Golay [84]. Las derivadas por Savitzky-
Golay incorporan un suavizado previo, por lo que el tamaño de ventana es un
[79] K.R. Beebe, R.J. Pell, M.B. Seasholtz. Chemometrics. A practical guide,. Ed.John
Wiley & sons. New York (1998).
[80] A. Savitzky, M.J.E. Golay. Smoothing and differentiation of data by simplified least
squares procedures. Anal. Chem. 36 (1964) 1627-1639.
[81] R.J. Barnes, M.S. Dhanoa, S.J. Lister. Standard Normal Variate Transformation and De-trending of Near-Infrared Diffuse Reflectance Spectra. Appl. Spectrosc. 113 (1989) 1849.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
50
parámetro crítico, si es pequeño la derivada tendrá un elevado ruido y si es grande
la información espectral resultará demasiado suavizada [83].
2.4.5 CONSTRUCCIÓN DEL MODELO DE CALIBRACIÓN
Una vez, pretratados los datos y seleccionada la herramienta quimiométrica idónea para
modelar los datos, se construye el modelo de calibración evaluando distintos parámetros
implicados en el cálculo: intervalo espectral, pretratamiento espectral, muestras
anómalas, número de componentes o factores, errores de calibración, entre otros. Una vez
obtenido el modelo, su capacidad predictiva es evaluada mediante un segundo grupo de
muestras, de las que se conoce la propiedad a determinar, pero que no han sido utilizadas
en la etapa de construcción del modelo. Si los resultados no son satisfactorios, el modelo
ha de ser recalculado.
Una vez construido y validado, el modelo de calibración puede ser aplicado para la
determinación de la propiedad en nuevas muestras.
2.4.6 EVALUACIÓN DE RESULTADOS
Tanto si se emplea PCR, PLS, como modelos lineales usando coeficientes de correlación,
es necesario algún sistema que, a parte de saber si una calibración proporciona una
capacidad predictiva apropiada, permita evaluar la conveniencia de utilizar más o menos
componentes principales en una determinada calibración.
En los modelos de calibración multivariante, la determinación del número de
componentes se llevó a cabo utilizando como criterios de decisión el análisis del aumento
de la varianza explicada al añadir un nuevo componente al modelo y a través de la
comparación de la representación gráfica del RMSE, error cuadrático medio (Root Mean
Square Error), (18) frente al número de componentes tanto para calibración RMSEC,
como para validación RMSEP. El RMSEC disminuye paulatinamente al aumentar el
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
51
número de componentes, en cambio, el RMSEP presenta un mínimo o bien una
disminución relativa significativamente menor a partir del número óptimo de
componentes, siendo m el número de muestras, REFy los valores de referencia e ˆ
PLSy los
valores predichos por el modelo PLS. El RMSE puede ser considerado como el error medio
obtenido en el proceso de modelado y está expresado en las mismas unidades que los
datos de referencia.
m
2
PLS REFi=1
(y -y )
RMSE=m
ˆ
(18)
Otros estadísticos básicos, además del RMSE, utilizados para determinar la bondad
del modelo y su habilidad predictiva fueron: los obtenidos a través del análisis de
residuales (estadístico-t), el coeficiente de determinación entre los valores de referencia y
los predichos por el modelo (R2) y el RSE, error estándar relativo (Relative Standard
Error) (19), calculado tanto para calibración RSEC, como para validación externa RSEP.
m2
PLS REFi=1
m
REFi=1
2
(y -y )
RSE(%)= x100
(y )
ˆ
ˆ
(19)
El RSE es un estadístico menos optimista, o más realista, que el RMSE para
determinar la bondad de un modelo ya que en su determinación se ha tenido en cuenta el
ámbito de aplicación del modelo, al dividir el bias por los valores de referencia.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
52
2.5 HERRAMIENTAS PARA EL ANÁLISIS DE IMAGEN
Una de las principales características de las imágenes hyperespectrales es la gran cantidad
de información recogida de una muestra. En NIR Imagen, por ejemplo, un espectro NIR
se puede medir en un amplio rango de longitud de onda en cada píxel de la superficie. Esta
información se estructura en forma de un cubo de datos tridimensional X (M x N x λ)
(figura 2.4), donde M y N representan los ejes espaciales y el eje λ corresponde al patrón
espectral. Atendiendo a la estructura de tridimensional de los datos X obtenidos, puede
ser definida como cubo tridimensional (3-way array)[82], pero también es común para
referirse a este tipo de datos como imagen hiperespectral [41]. Esas estructuras de datos
pueden estar compuestas por miles de espectros. Por lo que hace evidente que esta
cantidad de información espectral, normalmente muy correlacionados entre sí, necesite de
los tratamientos matemáticos de gran alcance para extraer la información conveniente de
los datos primarios.
Pero previamente a la aplicación de cualquier pretratamiento o algoritmo para extraer la
información, es necesario desdoblar la matriz de datos (unfolding) pasando de un cubo de
datos a una matriz de 2 dimensiones ya que ni los pretratamientos ni los distintos
algoritmos pueden ser aplicados directamente a matrices tridimensionales. Como ya se ha
comentado anteriormente, cuando se registran imágenes se obtiene un cubo
tridimensional X (M × N × λ). Cuando se realiza el desdoblamiento (unfolding) se obtiene
una matriz X con dimensiones (MN × λ) (Figura 2.1). Esta etapa es crucial para la
posterior aplicación de algoritmos bidimensionales como Coeficiente de Correlación, PCA,
CLS, PLS, PLS-DA o MCR.
[82] J.B. MacQueen. Some Methods for Classification and Analysis of Multivariate Observations. University of California Press. Berkeley USA. (1967).
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
53
Figura 2.1 Representación del desdoblamiento del cubo de datos tridimensional
2.5.1 CLASSICAL LEAST SQUARES (CLS)
La regresión Clásica de mínimos cuadrados es un método de cuantificación ampliamente
conocido que supone que cada medición es la suma ponderada de señales linealmente
independientes [83].
CLS es un método directo que requiere un total conocimiento de todos los componentes
de las muestras, en el caso de la Espectroscopia NIR, los espectros de todos los
componentes, de las muestras de calibración, y funciona correctamente en sistemas muy
sencillos.[84]. El modelo CLS asume que el espectro de cada muestra es la combinación
lineal de los espectros de los componentes puros, ponderado por su concentración. En
esencia, la matriz X se descompone como sigue:
X=PST (20)
donde P es la concentración de la matriz para cada componente puro y S corresponde a
los espectros. El verdadero interés en CLS se basa en calcular por método directo la
[83] K.L.A. Chan, N. Elkhider, S.G. Kazarian, Chem. Eng. Res. Des. 83(2005) 1303.
[84] Martens, H. and Næs, T. (1991) Multivariate Calibration; Wiley; New York.
3D Array Bidimensional Matrix
UNFOLDING
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
54
concentración de nuevas muestras a partir de los espectros puros de los componentes. De
esta forma, P se puede calcular fácilmente como sigue:
P = XS+ (21)
donde S+ corresponde a la pseudo-inversa de la matriz S:
S+ = ST(SST)-1 (22)
A pesar de la facilidad de cálculo de esta concentración de la matriz, el CLS tiene dos
principales inconvenientes: la señal puede verse afectada por variaciones no sistemáticas
que influyen en el patrón espectral, y que no siempre se dispone de los espectros puros de
todos los componentes. En el caso de muestras naturales (por ejemplo agroalimentarias)
no puede utilizarse este método, ni tampoco en muestras farmacéuticas de las que no se
disponga y se conozca la totalidad de sus espectros puros.
2.5.2 MULTIVARIATE CURVE RESOLUTION–ALTERNATING LEAST
SQUARES (MCR-ALS)
La resolución multivariante de curvas es una de las técnicas quimiométricas de más
reciente aplicación en NIR-CI. Su desarrollo teórico se ha producido a lo largo de la
década de los 70, y no ha sido hasta finales de los 90, cuando se ha aplicado en diferentes
campos de la química analítica [85, 86].
Hasta finales de los 90, MCR-ALS estaba considerada como una técnica cualitativa donde
el interés se centraba en obtener información espectral de los compuestos de las muestras
estudiadas. Actualmente, MCR-ALS empieza a considerarse como una técnica con
capacidad para obtener información cuantitativa del sistema estudiado, siendo interesante
respecto a otras técnicas quimiométricas, anteriormente comentadas, porque es capaz de
[85] R.Tauler, A.Smilde, B.R.Kowalski. Selectivity, Local Rank, Three-Way Data Analysis and Ambiguity in Multivariate Curve Resolution. Journal of Chemometrics. 9 (1995) 31–58
[86] R.Tauler, B.R.Kowalski, S.Flemming. Multivariate Curve resolution Applied to Spectral Data from Multiple Runs of an Industrial Process. Analytical Chemistry.65 (1993) 2040–2047.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
55
resolver cualitativa y cuantitativamente sistemas químicos con un mínimo de información
externa.
La resolución multivariante de curvas asume que los datos experimentales siguen un
modelo lineal que de forma matricial, se representa como [87]:
D = CS +E (23)
Donde D corresponde a la matriz espectral, C es la matriz calculada correspondiente a las
concentraciones de los analitos involucrados en la matriz de espectros inicial, S
corresponde a la matriz de espectros recalculada de los analitos y finalmente E
corresponde a una matriz de residuales y representa toda la información no explicada por
las matrices C y S y que está presente en la matriz D.
Gráficamente, la ecuación 23 se puede representar como:
Figura 2.2. Representación gráfica de MCR aplicado en una imagen hiperespectral desdoblada.
Donde MxN es el número de píxeles que posee la imagen desdoblada.
[87] R. Tauler. Anàlisi de mescles mitjançant resolució multivariant de corbes. Institut d’estudis catalans. (1997).
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
56
El objetivo de los métodos multivariantes de resolución de curvas es resolver el sistema
representado en la ecuación 23 utilizando solo la matriz D, es decir, obtener información
cualitativa y cuantitativa solo a partir de datos espectroscópicos.
La matriz de datos D se descompone mediante la metodología de Mínimos Cuadrados
Alternados (ALS). La solución de la descomposición no es única ya que se pueden obtener
una gran número de combinaciones de C y S, que multiplicadas entre sí permitan obtener
la misma matriz D.
Estas ambigüedades pueden ser corregidas mediante la aplicación restricciones en el
cálculo, para evitar soluciones ilógicas experimentalmente aunque lógicas
matemáticamente, como pueden ser concentraciones negativas o espectros negativos (lo
cual dependerá del sistema de registro o de los pretratamientos utilizados). También
existen problemas de ambigüedad en las soluciones de la ecuación 23, que aumentan aún
más el número de soluciones al sistema:
Ambigüedad rotacional: ocurre cuando no existe selectividad y cuando hay dos o
más componentes con una elevada correlación. El espectro calculado para
cualquiera de ellos será una combinación lineal desconocida de los verdaderos
espectros. Teniendo en cuenta que la absorción en el infrarrojo próximo está
formada por bandas anchas y solapadas, donde prácticamente no existen regiones
de absorción selectivas, la ambigüedad rotacional es uno de los problemas más
importantes en la resolución de estos sistemas.
Ambigüedad de intensidad: Esto significa que los espectros y los perfiles de
concentración calculados pueden estar multiplicados por cualquier número. No es
un problema serio en análisis cualitativo pero sí en análisis cuantitativo. En ambos
casos de ambigüedades es necesaria aportar información adicional a la matriz D
para resolver esta ambigüedad.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
57
Restricciones aplicadas durante el proceso de iteración
Restricción de no negatividad: las concentraciones de las especies químicas
siempre han de ser positivas o cero. Los espectros generalmente son positivos,
excepto si se han utilizado pretratamientos espectrales como las derivadas o el
SNV. Esta restricción se suele aplicar forzando a los valores negativos a ser cero
para continuar con el proceso de iteración.
Restricción de unimodalidad: esta restricción es aplicable a perfiles espectrales o
de concentración que solo posean un máximo. En primer lugar se encuentra el
valor máximo, y los valores a un lado y otro del máximo han de disminuir de forma
monótona.
Closure: aplicable en sistemas químicos cerrados de forma que la suma de
concentraciones de todas las especies químicas en cada punto de la reacción es
constante.
Convergencia: el proceso de iteración se para cuando se cumple el criterio de
convergencia establecido o cuando se alcanza un número de iteraciones máximo.
Versión aumentada de MCR-ALS
Cuando una matriz espectral no puede ser correctamente descompuesta debido a
deficiencias espectrales, una de las opciones puede ser aportar información directamente a
la matriz espectral [88]. Si se disponen las matrices una encima de la otra, con las
columnas en común, se obtiene una matriz D aumentada:
[88] A. de Juan, R. Tauler. MCR from 2000: progress in concepts and applications Crit. Rev. Anal. Chem. 36 (2006) 163.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
58
Figura 2.3. Representación gráfica de la versión aumentada de MCR.
La matriz C calculada corresponde a los perfiles de concentración de las especies
presentes en las submatrices de D, es decir, el sistema no fuerza a que los perfiles de
concentración sean iguales, una misma especie puede tener diferentes perfiles espectrales
en cada matriz Ci.
No ocurre lo mismo para la matriz S. Los espectros calculados para cada especie han de
ser iguales para las diferentes matrices.
El tratamiento conjunto de matrices aporta ventajas en el cálculo de MCR-ALS:
El número de soluciones de la ecuación 23 disminuye.
Se puede resolver la ambigüedad de intensidad utilizando varias matrices con
diferentes condiciones iniciales de concentración en un cálculo conjunto.
MCR-ALS en imagen hiperespectral
Para datos de imagen hiperespectral, previamente a la aplicación del algoritmo se ha
realizado un desdoblado del cubo de datos espectrales, obteniéndose una matriz de
dimensiones MNxλ tal y como se muestra en la figura 2.2, una vez se han obtenido los
perfiles de concentración de cada componente C1, C2, C3… Cn (vectores de dimensión
MNx1 ). Estos vectores realizando un refold se transforman en mapas de concentración
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
59
para cada componente de dimensiones MxN. Estos mapas de concentración permiten ver
la distribución del componente estudiado en la imagen hiperespectral teniendo
aplicaciones entre otros campos en la industria farmacéutica, tanto para asegurar la
calidad de los productos intermedios como para asegurar la calidad del producto final, en
la elaboración de un fármaco.
2.5.3 ISYS-PLS1
Isys-PLS1 es un método que aparentemente es parecido a Partial Least Squares
Discriminant Analysis (PLS-DA), un método usado en NIR clásico, como método de
clasificación, y consiste en la creación de un modelo PLS donde la variable de respuesta es
una variable categórica, que expresa la clase perteneciente de la observación realizada.
Como consecuencia, todas las variables medidas juegan el mismo papel con respecto a la
asignación de clase. El modelo PLS describe el conjunto de variables observadas y predice
su respuesta asignando a cada observación una categoría.
Algunos estudios de NIR-CI en aplicaciones farmacéuticas aplican un método PLS
alternativo para cuantificar muestras, que utiliza solamente los espectros puros de los
componentes como datos de calibración [89, 90, 91]. Este algoritmo se usa en el software
Isys 5.0 de Malvern y viene denominado como PLS1, en otras publicaciones se le ha
denominado como, PLS, PLS-CLassification, PLS-Class, PLS-DA etc.
Este modelo Isys-PLS1 define una matriz de espectros de los componentes puros y una
matriz de respuestas '1' y '0' que indican la pertenencia o no, respectivamente, a la clase de
[89] S.Chevallier, D. Bertrand, A. Kohler, P. Courcoux. Application of PLS-DA in multivariate image analysis. J. Chemometrics. 20 (2006) 221–229.
[90] L.J. Makein,L.H. Kidder,E.N. Lewis,M. Valleri. Non-Destructive Evaluation of Manufacturing Process Changes using Near Infrared Chemical Imaging. NIR News. 19 (2008) 11-15.
[91] T. Puchert,D. Lochmann,J.C. Menezes,G. Reich. Near-infrared chemical imaging (NIR-CI) for counterfeit drug identification--a four-stage concept with a novel approach of data processing. Journal of Pharmaceutical and Biomedical Analysis. 51 (2010) 138–145.
HERRAMIENTAS PARA EL ANÁLISIS DE DATOS. QUIMIOMETRÍA
60
cada componente puro. El algoritmo aplicado a los espectros que componen una imagen
proporciona un mapa de concentraciones de cada uno de los componentes modelados de
la muestra, que junto a sus histogramas constituyen herramientas muy útiles para el
conocimiento de la distribución de cada componente.
OBJETIVO DE LA TESIS
61
3. OBJETIVO DE LA
TESIS
OBJETIVO DE LA TESIS
62
OBJETIVO DE LA TESIS
63
3. OBJETIVO DE LA TESIS
La industria química y farmacéutica tiene por objetivo proporcionar productos con
unas condiciones de un nivel de calidad que satisfagan al usuario y cumplan las
normativas establecidas para estos parámetros. Para asegurar la calidad de un producto
final en la industria química y farmacéutica, se usan una gran variedad de métodos
analíticos, que en determinados casos pueden destruir la muestra a analizar o bien
necesitar un pretratamiento de ésta para realizar el análisis, implicando lentitud y
costes económicos en el análisis.
Por lo tanto el desarrollo de metodologías de análisis rápidas, sencillas y fiables es una
de las demandas actuales de la industria química para mejorar la eficiencia de los
procesos de producción.
La espectroscopia en el infrarrojo cercano (NIR) y para determinadas aplicaciones la
espectroscopia de imagen en el infrarrojo cercano (NIR-CI), al ser técnicas rápidas, no
invasivas, sin preparación de muestra y de coste de análisis muy reducido, reúnen las
características que las hacen adecuadas para satisfacer estas demandas.
Es por ello que estas técnicas fueron seleccionadas para el estudio de distintos
productos industriales y farmacéuticos.
El objetivo de esta tesis es desarrollar nuevas metodologías para la industria química y
farmacéutica, utilizando la espectroscopía NIR y NIR-Chemical Imaging en tándem con
las técnicas quimiométricas.
Este objetivo general se puede describir en los siguientes apartados:
1. Desarrollo de modelos de calibración multivariables basados en las medidas
espectroscópicas. Los modelos desarrollados han de ser robustos y con adecuada
capacidad predictiva para poder ser utilizados en el control del proceso industrial.
Capacidad de clonar dos o más equipos NIR mediante una transformación de
OBJETIVO DE LA TESIS
64
espectros, para de esta forma usar los mismos modelos de calibración en los distintos
equipos.
2. Desarrollo de un único modelo de calibración que sea lo suficientemente robusto
para permitir la correcta predicción del contenido de API de un preparado
farmacéutico en todas y cada una de las etapas de su proceso productivo hasta alcanzar
el producto final.
3. La extracción de toda la información relevante contenida en las imágenes
hiperespectrales obtenidas, para determinación de API, excipientes y grosor de
recubrimiento, así como de su distribución en comprimidos comerciales.
4. Establecer la uniformidad de contenido de API de un lote de comprimidos
comerciales con una sola imagen hiperespectral.
OBJECTIVES
65
3. OBJECTIVES
The chemical and pharmaceutical industry aim to provide products with a level of
quality that meets the user conditions and accomplish the desired for those quality
parameters.
To assure the quality of a final product in the chemical and pharmaceutical industry, a
large variety of analytic methods have been used. Those analytic methods, in certain
cases need a pre-treatment of the sample and can destroy the analyzed sample,
involving a slow and expensive analysis.
Therefore the development of fast, simple and reliable analysis methodologies is one of
the current demands of the chemical industry to improve the efficiency of production
processes.
Near infrared (NIR) and near infrared chemical imaging spectroscopy (NIR-CI) for
certain applications, are fast, non invasive, with no preparation of the sample and low
analysis cost techniques, meeting features that make them appropriate to meet these
demands.
For those reasons, those techniques were selected for the study of various industrial
and pharmaceutical products.
The main objective of this thesis is the development of new methodologies for the
chemical and pharmaceutical industries, using NIR and NIR-Chemical Imagine
spectroscopy combined with chemometric techniques.
This general objective may be described in the following sections:
1. The development of multivariate calibration models based on the spectroscopic
measurements. The developed models must be robust and with the appropriate
predictive capacity to be used in the industrial process control. The ability to clone two
OBJECTIVES
66
or more NIR instruments by using a transformation of spectra, by in this way to use
the same calibration models in the different instruments.
production plant instruments located next to the reactor to do an in situ analysis.
2. Development of an unique calibration model that allows the correct prediction of the
API content of a pharmaceutical preparation in all stages of its production process to
final product.
3. The extraction of all the information contained in the obtained hyperspectral images,
for the determination of API, excipients and coating thickness, as well as their
distribution in commercial tablets.
4. Determine the content uniformity of API from a 10 commercial tablets batch with the
acquisition of an unique hyperspectral image.
METODOLOGÍA EXPERIMENTAL
67
4. METODOLOGÍA
EXPERIMENTAL
METODOLOGÍA EXPERIMENTAL
68
METODOLOGÍA EXPERIMENTAL
69
4. METODOLOGÍA
A continuación se describen las características más relevantes de la metodología
utilizada en el desarrollo de los métodos propuestos, esta descripción comprende los
procesos aplicados en la obtención de las muestras de los procesos en estudio, la
metodología experimental que describe los métodos de preparación de muestras y sus
principales características, además de la metodología instrumental empleada:
características de los instrumentos, forma de registro de los espectros y/o imágenes y
finalmente el tratamiento de los datos espectroscópicos que nos conduce a los
resultados analíticos de interés.
4.1. PROCESOS DE FABRICACIÓN
4.1.1 RESINA DE POLIÉSTER
El proceso de fabricación de la resina consta de tres etapas: en la primera etapa la
mezcla de neopentilglicol y etilenglicol y ácido tereftálico, junto con un catalizador y un
antioxidante (ver tabla 4.1) se calienta hasta 240ºC en atmósfera de nitrógeno a una
presión de 4 atm hasta la fusión de las materias primas e inicio de la condensación y se
mantiene el tiempo necesario para que los índices alcancen los valores deseados. Este
inicio de la esterificación es más difícil y lento y necesita una mayor temperatura de
reacción.
En una segunda etapa se reduce la temperatura hasta 210ºC y se ajustan las cantidades
de ácido tereftálico y neopentilglicol si los valores de IA i IOH neto no están entre el
intervalo deseado y se añaden el resto de ácidos (ác. isoftálico, ác. adípico y/o anhídrido
trimetílico).
METODOLOGÍA EXPERIMENTAL
70
En la tercera etapa del proceso se ajustan las cantidades de ácido tereftálico y
neopentilglicol de la misma forma que en la etapa 2 y se realizan posteriormente
distintas rampas de vacío, manteniéndose la misma temperatura de la segunda etapa,
para eliminar el agua formada en la reacción y alcanzar los índices deseados para el
producto final.
Tabla 4.1. Principales materias primas usadas para la obtención de resinas de poliéster.
4.1.2 ENANTYUM COMPRIMIDOS
El producto final está constituido por un comprimido lacado que contiene 135 mg/g de
dexketoprofeno trometamol (equivalente a 93.3 mg/g de dexketoprofeno), celulosa
microcristalina PH101 (500 mg/g) como excipiente mayoritario y otros tres en menor
proporción: almidón de maíz, carboximetilalmidón y diestearato de glicerol (estos dos
últimos se añaden al producto granulado).
Reactivo Fórmula Propiedad Contenido
(%)
Ácido tereftálico
Propiedades mecánicas 65-90
Ácido isoftálico
Resistencia a exteriores 10-25
Diácidos
Ácido adípico
Flexibilidad, alta reactividad en el final de cadena
polimérica
1-10
Neopentilglicol
Resistencia a exteriores 80-100
Etilenglicol
Flexibilidad 0-20
Dioles
Dietilenglicol
Flexibilidad 0-20
METODOLOGÍA EXPERIMENTAL
71
El proceso de fabricación del preparado se realiza en dos etapas que consisten en una
granulación húmeda de la mezcla de API y de los excipientes mayoritarios, celulosa
microcristalina PH101 y almidón de maíz, y a continuación una posterior adición al
producto granulado de los excipientes restantes; la mezcla final se homogeneiza, se
comprime para obtener las tabletas y finalmente se recubren los comprimidos con una
fina película de laca (compuesta por laca OPADRY (85 %) y propilenglicol (15%)
diluido en agua desionizada. Los comprimidos tienen forma cilíndrica y un peso medio
de 270 mg. Durante el proceso de fabricación se han extraído muestras que se han
utilizado tanto para preparar el modelo de calibración como para establecer su
capacidad predictiva. Además se han preparado muestras en el laboratorio para
ampliar el rango de concentraciones de las muestras que constituirán el conjunto de
calibración.
4.2 METODOLOGÍA EXPERIMENTAL
A continuación se detalla la preparación de las muestras usadas en la presente memoria.
4.2.1 RESINA POLIÉSTER
Se ha utilizado un conjunto de 105 muestras de resina de poliéster, pertenecientes a
cada una de las 3 etapas de fabricación. La composición de las muestras depende de la
etapa y del momento en que han sido extraídas.
Cada muestra se ha molturado durante aproximadamente 30 segundos en un molinillo
eléctrico y se ha introducido en una capsula de vidrio y se ha procedido al registro del
espectro.
METODOLOGÍA EXPERIMENTAL
72
4.2.2 ENANTYUM COMPRIMIDOS
Las muestras de Enantyum comprimidos de subdividen en dos conjuntos el de las
muestras de calibración y el de muestras de predicción.
Muestras de calibración
Las muestras que constituyen el conjunto de calibración son muestras procedentes de
la etapa de granulación. Estas muestras presentan un estrecho rango de
concentraciones de API por lo que algunas fueron dopadas con el objetivo de ampliar
este rango hasta un intervalo de ± 20% del valor nominal (93 mg/g), con API (muestras
sobredosificadas) y con placebo (muestras subdosificadas) .
Muestras de predicción
El conjunto de predicción está constituido por muestras de las diferentes etapas del
proceso de fabricación: muestras granuladas pertenecientes a lotes que no se han
incluido en la calibración, comprimidos sin recubrimiento (cores) y comprimidos
recubiertos (coated tablets). Además, se incluyeron en el set de predicción comprimidos
recubiertos molturados hasta un tamaño de partícula similar al de las muestras
granuladas.
Todos los componentes y las muestras del preparado han sido proporcionados por los
Laboratorios Menarini, S.A. (Badalona, Spain).
4.2.3 COMPRIMIDOS COMERCIALES DE ÁCIDO ACETILSALICÍLICO
Las muestras utilizadas en estos estudios son comprimidos comerciales de ácido
acetilsalicílico, adquiridos en la farmacia. La concentración de ácido acetilsalicílico
(ASA) de todos los comprimidos ha sido calculada dividiendo el contenido nominal por
el peso promedio de cada comprimido. Las concentraciones nominales de los
METODOLOGÍA EXPERIMENTAL
73
comprimidos usados en los estudios cubren un amplio rango que va del 82% al 12% en
contenido de ASA.
4.2.4 COMPRIMIDOS EN FASE EXPERIMENTAL
Por razones de confidencialidad no se nombran ni API ni excipientes que componen
estos comprimidos ya que es un fármaco que se encuentra en fase experimental.
Se han usado tres tipos diferentes de muestras: (a) núcleos (cores, comprimidos sin
recubrimiento), (b) comprimidos recubiertos con distintos grosores de capa y (c)
comprimidos procedentes del proceso de producción. Los comprimidos recubiertos
(grupo b) incluyen muestras con grosores de recubrimiento entre el 50% y el 300%
respecto del grosor de recubrimiento nominal del proceso de producción (100%).
Todos los núcleos tienen la misma composición en API y excipientes, con valores
nominales de concentración del 35% de principio activo (API) y 65% de la suma de
excipientes, de los cuáles: 40% de excipiente #1, 20% de excipiente #2, 2% de
excipiente #3, 1.5% de excipiente #4 y 1.5% de excipiente #5. El API y los 2 excipientes
mayoritarios representan un 95% del total del comprimido. En el caso de los
comprimidos recubiertos, hay que tener en cuenta que el aumento de peso de la laca
implica una disminución de la concentración de API y excipientes. Los porcentajes de
los diferentes componentes disminuyen ligeramente a medida que aumenta el grosor
del recubrimiento y su variación para los componentes mayoritarios se recoge en la
tabla 4.2.
METODOLOGÍA EXPERIMENTAL
74
Tabla 4.2. Composición (en %) de API excipientes de los comprimidos en función del grosor
del recubrimiento.
Composición (% w/w) de las muestras usadas (%)
Grosor de recubrimiento(%)
Núcleo 50% 100% 200% 300%
API 35.0 34.4 33.9 33.0 32.0
E #1 40.0 39.3 38.8 37.7 36.6
E #2 20.0 19.7 19.4 18.8 18.3
E #3 2.0 2.0 1.9 1.9 1.8
E #4 1.5 1.5 1.5 1.4 1.4
E #5 1.5 1.5 1.5 1.4 1.4
Los grupos de muestras a y b se han utilizado para la determinación de la
concentración de los distintos componentes (API y excipientes) de los comprimidos.
Las muestras del grupo b se han utilizado como conjuntos de calibración y validación
de los modelos PLS para la determinación del recubrimiento que, posteriormente, se ha
aplicado a las muestras de producción (grupo c).
4.3 METODOLOGÍA INSTRUMENTAL
A continuación se detallan la instrumentación empleada para el desarrollo de esta
memoria, así como el software necesario para adquirir los espectros y las imágenes.
Además de los distintos equipos utilizados, también se describe el registro de las
muestras empleadas y los métodos de referencia aplicados en la realización de los
estudios de esta memoria.
METODOLOGÍA EXPERIMENTAL
75
4.3.1 INSTUMENTACIÓN EMPLEADA
Perkin Elmer Spectrum ONE NTS
El espectrofotómetro Perkin-Elmer Spectrum One NTS (Norwalk, CT), es un equipo de
transformada de Fourier y trabaja en un rango espectral de 10000-4000 cm-1, con una
resolución espectral máxima de 2 cm-1.Las muestras se han registrado con un accesorio
que es un modulo de reflectancia NIR (NIRA). Este accesorio que mide por reflectancia
consiste de una esfera integradora a temperatura estabilizada y detector de arseniuro
de Indio y Galio (InGaAs). Como se muestra en la figura 4.1, la muestra se coloca en
un vial encima del instrumento, se ilumina la muestra por debajo con una lámpara de
tungsteno y el equipo registra el espectro.
El Previo a la adquisición de cada muestra el equipo realiza un blanco con una placa
cerámica interna.
La adquisición de datos con el equipo Perkin-Elmer se controla mediante el software
Spectrum V.3.02.01.
Figura 4.1. Imagen del Espectrofotómetro con el módulo de NIRA.
METODOLOGÍA EXPERIMENTAL
76
Bruker Multi Purpose Analyzer (MPA)
El espectrofotómetro de la marca Bruker, modelo MPA (Bruker Optics (Ettlingen,
Germany and The Woodlands, USA ), funciona con transformada de fourier y esta
equipado con un detector de arseniuro de Indio y Galio (InGaAs).
Trabaja sobre un rango espectral de 12500-3750 cm-1, con una resolución espectral
máxima de 2 cm-1.
Las muestras, líquidas y sólidas, se han registrado por transmisión en un
compartimento termostatizado. Para el registro de espectros se coloca en el
compartimiento de transmisión, un vial con la muestra ya molturada de forma que el
haz de luz producido por la lámpara de tungsteno pasa por la muestra y se lleva al
detector mediante el uso de espejos. El equipo realiza un blanco previo a la adquisición
de la muestra con una placa cerámica interna.
El Bruker MPA se controla con el software OPUS v. 6.0 de Bruker Optics (Ettlingen,
Germany and The Woodlands, USA ).
Figura 4.2. Imagen del Espectrofotómetro con los diferentes accesorios para medir distintos
tipos de muestra
METODOLOGÍA EXPERIMENTAL
77
NIR FOSS 6500
El espectrofotómetro NIR Foss 6500, es un equipo dispersivo, que registra los
espectros mediante un barrido de longitudes de onda (cada espectro es el promedio de
32 barridos), utiliza como fuente de luz una lámpara halógena de filamento de
tungsteno. El monocromador está constituido por una red de difracción cóncava que al
girar permite enfocar cada longitud de onda en la rendija del instrumento; el sistema
permite un registro rápido del espectro (menos de 1 seg) con un intervalo espectral de 2
nm. El detector es de PbS y permite el registro de espectros en el rango de 1100-
2500nm.
Los espectros han sido registrados con un módulo RCA (Rapid Content Analyzer) que
permite registrarlos en modo reflectancia y por transflectancia.
Como se puede observar en la figura 4.3 a) el RCA consiste de una caja metálica dentro
de la cual hay la ventana del instrumento donde se coloca la muestra. Una vez
depositada la muestra, se puede ajustar el iris para controlar la apertura de la ventana. La
ventana (figura 4.3 b) ) consta de una parte central por donde pasa el haz de luz hacia
muestra, la luz reflectada llega a los 6 detectores que están dispuestos alrededor del
haz de luz formando un ángulo de 45º respecto el haz de luz. Las muestras en polvo o
granuladas se han registrado por triplicado en modo reflectancia en una cubeta de
cuarzo o cristal como soporte de la muestra. Antes de cada medida el sólido se removió
con una espátula dentro de la cubeta.
El espectro de comprimidos fue obtenido mediante el registro directo sobre la ventana
del instrumento en modo reflectancia.
Previamente al registro de las muestras se registra un blanco constituido por una placa
de cerámica.
La adquisición de datos con el equipo NIR FOSS 6500, se controla mediante el
software VISION v2.51 (FOSS NIRSystems, Silver Spring, USA). Permite el registro de
los espectros así como su visualización, aplicando los pretratamientos espectrales más
habituales.
METODOLOGÍA EXPERIMENTAL
78
Figura 4.3. a) Imagen del Espectrofotómetro y accesorio RCA. b) Ventana del equipo. 6
detectores y haz de luz de radiación NIR.
Cámara hiperespectral NIR Roda 25
La cámara hiperespectral NIR “Think Spectrally Roda-25” (Think Spectrally, Valencia,
Spain) es un prototipo diseñado por la empresa Think Spectrally (Valencia, España) en
colaboración con el grupo de quimiometría de la Universidad Autónoma de Barcelona.
Este instrumento es un Focal Plane Array (FPA) provisto de un detector de Mercurio
Cadmio Telurio (MCT) que permite registrar imágenes en un rango espectral de 1200-
2400 nm con resolución espectral de 7 nm. Dependiendo del estudio realizado se ha
configurado la cámara para que el tamaño de cada píxel sea aproximadamente de entre
60x60 µm, y 2oox2oo μm obteniendo un área de imagen aproximada de 32.0 x 25.6
mm para la primera resolución espacial y de 65.0 x 50.0 mm para la segunda.
Este instrumento mide en modo de reflectancia difusa de espectro continuo con un
tiempo total aproximado de 2 minutos por imagen. La iluminación de la muestra es un
parámetro relevante en la obtención de imágenes de calidad. Por ello, 4 lámparas
halógenas están colocadas enfocando a la muestra con una orientación de unos 45 º
(figura 4.4).
Previo al registro de una o un conjunto de muestras es necesaria una calibración del
instrumento, con el registro y modelado de las imágenes hiperespectrales de seis
METODOLOGÍA EXPERIMENTAL
79
standards AP-0200 NIR de 99, 80, 40, 20, 10 y 0,2 % de reflectancia FOSS (Silver
Springs, MD).
Una vez registradas cada una de las imágenes de las muestras, la imagen es
transformada, mediante el uso del calibrado del instrumento, a valores de Absorbancia,
además de corregir las imágenes de posibles interferencias en la iluminación.
El calibrado se deberá repetir cada vez que se cambien las condiciones de la cámara.
La adquisición de imágenes con el equipo NIR Roda 25, se controla mediante el
software TS-Capture (Think Spectrally, Valencia). La calibración de las imágenes así
como su visualización global como de espectros en píxeles puntuales, se realiza con la
graphic user interface de plataforma Matlab TS-GUI.
Figura 4.4. Cámara hyperespectral RODA NIR 25
METODOLOGÍA EXPERIMENTAL
80
Cámara hiperespectral Malvern SyNIRgi
Para la adquisición de las imágenes se ha utilizado la cámara hiperespectral SyNIRgyTM
Chemical Imaging System de Malvern (Malvern Instruments, Malvern, UK), este
instrumento es un Focal Plane Array (FPA) equipado con un detector de tipo InSb de
320x256 píxeles.
Las muestras se colocan en la pletina, se iluminan con las lámparas halógenas situadas
alrededor en un ángulo apropiado (figura 4.5) y se ajusta la distancia del objetivo según
el tamaño del objeto. En las condiciones seleccionadas, las imágenes tienen una
resolución de 40μm (cada píxel tiene un área de 40 x 40 µm). El tiempo de adquisición
de una imagen de reflectancia, cubriendo un rango de longitudes de onda comprendido
entre 1200-2400nm, se realiza en unos 3 minutos. Previamente a la adquisición de la
muestra (S), el software requiere el registro de las imágenes del background (B) (placa
cerámica de referencia del 99% de reflectancia) y de la Dark reference (D) (espejo). Una
vez adquirida la muestra (S), los datos obtenidos se usan para transformar los espectros
en modo de reflectancia (R), aplicando la siguiente ecuación: R=(S−D)/(B−D). Este
cálculo se ha aplicado a todos los píxeles de cada una de las imágenes registradas. La
imagen es transformada posteriormente a unidades de absorbancia.
La adquisición de imágenes con el equipo NIR Roda 25, se controla mediante el
software Pixys® 1.1 software (Malvern Instruments, Malvern, UK).
METODOLOGÍA EXPERIMENTAL
81
Figura 4.5. Cámara hyperespectral Malvern SyNIRgi
4.3.2 ADQUISICION DE LOS ESPECTROS DE LAS MUESTRAS
A continuación se describe la adquisición de los espectros de cada tipo de muestras
usadas para la presente tesis así como el software utilizado en esta memoria para la
adquisición de los espectros e imágenes NIR.
Resina de poliéster
Cada muestra se ha molturado durante aproximadamente 30 segundos en un molinillo
eléctrico y se ha introducido en una capsula de cristal y ha procedido al registro del
espectro .
El registro de los espectros se ha realizado por reflectancia con una resolución de 2 cm−1
en el rango de números de onda de 4000 hasta 10000 cm−1 y cada espectro es el
promedio de 60 barridos en el equipo Perkin-Elmer y 30 barridos en el equipo Bruker.
Se obtienen tres espectros de cada muestra, revolviendo entre medidas, y el espectro
promedio de los tres replicados se usa en todos los estudios posteriores.
METODOLOGÍA EXPERIMENTAL
82
Se registra el espectro en capsulas de cuarzo y con las opciones interleaved (realiza
automáticamente la diferencia entre espectro registrado y el espectro de la referencia) y
spinner (donde se va rotando la capsula de medida sobre el haz de luz al mismo tiempo
que se registran los espectros que es útil para minimizar efectos en el espectro de
muestras no homogéneas) en el equipo Perkin-Elmer. Con el equipo Bruker se
registran las muestras con la opción Straylight Correction activada (realiza
automáticamente la diferencia entre espectro registrado y el espectro de la referencia).
Enantyum comprimidos
Los espectros NIR fueron registrados en un espectrofotómetro FOSS NIRSystems
Modelo 6500 (Siver Springs, MD) equipado con un modulo RCA (Rapid Content
Analyzer) y controlado con el software Vision 2.51, programa diseñado para el control
del espectrofotómetro NIR FOSS. Permite el registro de los espectros así como su
visualización, aplicando los pretratamientos espectrales más habituales. Su entorno
permite diseñar rutinas de análisis sencillas para el análisis tanto cualitativo como
cuantitativo.
Cada espectro es el resultado de 32 scans en el rango espectral 1100-2498 nm, con una
resolución espectral 2 nm; se utilizó una placa cerámica para registrar el espectro de
referencia previo al registro de los espectros.
El registro de los espectros de las muestras granuladas (producción y sub/sobre
dosificadas) se ha realizado colocando alícuotas de las muestras en una cubeta de
cuarzo y se registra su espectro de reflectancia por triplicado; la muestra fue removida
entre los sucesivos registros espectrales. El espectro promedio, calculado a partir de los
tres replicados de cada muestra, fue utilizado en los estudios siguientes.
Los comprimidos de producción, no lacados y lacados, se registraron por ambas caras,
colocando directamente el comprimido sobre la ventana de cuarzo del módulo de
registro; el espectro utilizado en los tratamientos posteriores es el espectro promedio
de ambas caras.
METODOLOGÍA EXPERIMENTAL
83
Comprimidos comerciales de Aspirina.
A continuación se detalla la forma en que se han registrado las imágenes de los
comprimidos comerciales en el caso que querer registrar un comprimido individual o
bien 10 comprimidos a la vez.
Registro de comprimidos individuales
El registro de la imagen de los comprimidos individuales se ha realizando colocando el
comprimido en el soporte de las muestras y enfocando el objetivo para obtener una
adecuada resolución espacial. En estas condiciones de trabajo el tamaño de cada píxel
es de aproximadamente 100 x 100 μm2, siendo la totalidad de la imagen de un tamaño
de 48.0 x 38.4 mm2. Las imágenes se registraron en un rango espectral de 1200-2100
nm. con una resolución de 7 nm. Se utilizaron tres ajustes de la imagen diferentes en
función del tamaño de los comprimidos: 15 x 15 (tamaño grande), 8 x 8 (tamaño
mediano) y 5 x 5 mm2 (tamaño pequeño).
El registro de la imagen de los componentes puros: acido acetil salicílico y celulosa
microcristalina (excipiente mayoritario en las 4 formulaciones) se ha realizado
colocando la muestra en polvo en una cubeta circular de vidrio de unos 3.8 cm de
diámetro y presionando la superficie con un disco de metal para obtener una superficie
plana.
Registro de 10 comprimidos
Para registrar los 10 comprimidos en una sola imagen (disposición mostrada en las
figuras 4 y 5) se ha alejado la pletina donde se coloca la muestra del objetivo de la
cámara, y se realiza un nuevo enfoque de éste para obtener la mejor resolución óptica
en las imágenes tomadas. Después de los cambios se obtiene una imagen de una
resolución espacial de 200x200 μm2 y una imagen de tamaño total de 65x50 mm2.
Al alejar las muestras para ampliar el campo, cambia el ángulo de iluminación de las
METODOLOGÍA EXPERIMENTAL
84
lámparas y la potencia lumínica sobre la muestra, por lo que ha sido necesario
recalibrar nuevamente la cámara.
Comprimidos en fase experimental
Se han registrado 6 imágenes de cada núcleo: 4 de cada una de las caras exteriores (A-
D) y 2 de las caras interiores (E-F) obtenidas por partición de los comprimidos tal como
se muestra en la figura 4.6a. En el caso de las muestras de producción se han registrado
sólo las 4 caras exteriores de los comprimidos, denominadas de la misma forma que en
los núcleos (A-D). Para la determinación del grosor del recubrimiento (comprimidos
del grupo b) se han registrado 2 imágenes de cada comprimido, pertenecientes a dos
caras exteriores opuestas. En este último caso, cada imagen incluye 2 caras homólogas
de 2 comprimidos de iguales características (mismo grosor de lacado), tal como se
muestra en la figura 4.6b. Estas imágenes no han sido consideradas en su totalidad,
sino que sólo se han tenido en cuenta porciones rectangulares interiores de cada
comprimido con el fin de evitar las distorsiones producidas por la luz en los bordes de
los comprimidos de la imagen.
A
D
C
B
A
C
F
E
a) b)
A A
BB
Comprimido 1 Comprimido 2
Figura 4.6. Esquema de las diferentes caras de análisis de un comprimido: a) núcleos y
comprimidos lacados estándar; b) comprimidos con distintos porcentajes de recubrimiento con
las áreas seleccionadas para la determinación marcadas en gris.
METODOLOGÍA EXPERIMENTAL
85
Las imágenes de los compuestos puros se han obtenido colocando la cantidad suficiente
de los mismos en una cubeta de vidrio, comprimiendo ligeramente su superficie y
adquiriendo la imagen a continuación.
4.3.3 METODOS DE REFERENCIA
En los trabajos que se presentan en esta tesis, se han utilizado varios métodos de
referencia para el análisis cuantitativo de API y la determinación de otros parámetros
químicos, como índice de ácido y de hidroxilo para hacer seguimiento de las muestras
de resina.
Las muestras de laboratorio se han preparado por pesada de los diferentes
componentes antes de su mezclado, por ello no se requiere la aplicación de un método
de referencia.
Las muestras en polvo o granuladas sub y sobre dosificadas (muestras dopadas del
proceso de fabricación de enantyum comprimidos) se han preparado añadiendo
cantidades pesadas de API y excipientes a una cantidad conocida de muestra; por
cálculo se establece el valor de referencia de API para estas muestras.
La concentración de API en los comprimidos de acido acetilsalicílico ha sido calculada
dividiendo el contenido nominal por el peso de cada comprimido.
Índice de ácido de las resinas
El índice de acido de una resina poliéster se define como el numero de miligramos de
hidróxido potásico necesarios para neutralizar 1 gramo de muestra. Se determina
aplicando la norma ASTMD-465-01 [92], basado en la valoración de los grupos
carboxílicos libres con una base estándar.
[92] Annual Book of ASTM Standards, Section 06.03, American Society for Testing and Materials, Philadelphia, (2005)
METODOLOGÍA EXPERIMENTAL
86
El método se basa en una valoración ácido-base que utiliza hidróxido de potasio como
agente valorante. La muestra se disuelve enetanol : xileno 1:1 y se valora con KOH 0.1
M, detectando el punto final con fenolftaleína. El índice de ácido
(en mg KOH/g muestra) se calcula según la fórmula:
W
xVxMIA
1.56 (25)
Donde:
V: volumen de KOH gastados en la valoración en ml.
M: concentración de la solución de KOH en M.
W: peso de muestra en g.
56.1: factor de conversión mol KOH/ g KOH.
Índice de hidroxilo de las resinas
El índice de hidroxilo de una resina poliéster se define como el número de miligramos
de hidróxido potásico necesarios para neutralizar el acido acético formado durante la
acetilación de 1 gramo de muestra. Se determina siguiendo la norma ASTM D-1957-86
[92].
El método se basa en la acetilación de los grupos hidroxilo con una cantidad conocida, y
en exceso, de anhídrido acético en piridina, utilizando 4-dimetilaminopiridina (DMAP)
como catalizador:
R-OH + (CH3CO)2O R-OOC-CH3 + CH3COOH (26)
El anhídrido acético en exceso que no ha reaccionado se hidroliza:
(CH3CO)2O + H2O 2 CH3COOH (27)
El ácido acético formado por ambas reacciones se determina por valoración con KOH.
El IOH se calcula teniendo en cuenta el volumen de KOH gastado para neutralizar los
METODOLOGÍA EXPERIMENTAL
87
moles de acético generados por las reacciones (26) y (27) para la muestra, y el volumen
de KOH necesario para neutralizar los moles de acético que se generan en un blanco
(solo reacción de hidrólisis). La diferencia entre ambos volúmenes es una medida de la
concentración de grupos OH en la muestra, ya que a mayor concentración de grupos
OH, menor será la cantidad de anhídrido a hidrolizar.
Debido a que en la valoración con KOH para la muestra se determina tanto el ácido
acético como cualquier otro ácido que pueda contener la muestra, es necesario
determinar también el IA y tenerlo en cuenta en el cálculo del IOH (25).
El índice de hidroxilo (en mg KOH/g muestra) se determina según la fórmula:
IAW
xMVVxIOH
)(1.56 21 (28)
Donde:
V1: volumen de KOH gastados en el blanco en ml.
V2: volumen de KOH gastados en la muestra en ml.
M: concentración de la disolución de KOH en M.
W: peso de la muestra en gramos.
IA: índice de ácido.
56,1: factor de conversión mol KOH/g KOH.
No obstante el parámetro que será útil i del cual se hará la cuantificación, no es el
índice de hidroxilo definido anteriormente, sino el índice de hidroxilo neto. El índice de
hidroxilo neto es un parámetro indicativo de los grupos hidroxilo que hay en exceso. Se
calcula tal y como se indica en la ecuación 29, haciendo la diferencia entre el índice de
hidroxilo y el índice de ácido.
IOHnet= IOH-IA (29)
METODOLOGÍA EXPERIMENTAL
88
Espectroscopía UV-Visible
El contenido de API (Dexketoprofeno) en el producto Enantyum Comprimidos fue
determinado a partir de 0.25 g de muestra triturada añadidos a 90 mL de agua Milli-Q.
Se aplican ultrasonidos a la solución durante 15 minutos a 37 ºC. Una alícuota de 2 mL
es diluida a 5 mL de una solución Metanol/Agua 3:1 de la cual se registra el espectro
UV-Vis. El contenido de API se calcula mediante una regresión lineal múltiple (MLR)
en la región 210-400 nm.
4.4 TRATAMIENTO DE DATOS
Una vez registrados los datos ya sea con un equipo NIR o tomando una imagen
hiperespectral, primeramente es necesario aplicar un pretratamiento quimiométrico a
los datos con el objeto de eliminar contribuciones no deseadas en los espectros;
posteriormente se aplica la herramienta quimiométrica idónea para modelar los datos y
extraer la información deseada en función de nuestras necesidades. A continuación se
describe el software utilizado en esta memoria para tratar los datos una vez éstos han
sido adquiridos con el software de cada equipo.
The Unscrambler 9.5 (CAMO Process S.A., Trondheim, Norway)
Es el software quimiométrico más utilizado en nuestro grupo y permite trabajar con
conjuntos de datos multivariantes con la posibilidad de utilizar pretratamientos de los
datos aplicando SNV (Standard Normal Variate), Mean Centering, correcciones de
línea base y derivadas (usando el algoritmo de Savitzky-Golay). Además permite aplicar
algunas de las herramientas quimiométricas más habituales para la reducción de
variables y análisis de clasificación no supervisado (PCA) y también para el modelado
necesario en el análisis cuantitativo (PLS ).
METODOLOGÍA EXPERIMENTAL
89
OPUS 6.0 (Bruker Optics, Ettlingen, Germany)
Como anteriormente se ha comentado este software es el encargado de controlar el
equipo Bruker MPA y que además de la adquisición de los espectros, permite utilizar
pretratamientos de los datos aplicando SNV (Standard Normal Variate), correcciones
de línea base y derivadas (usando el algoritmo de Savitzky-Golay), etc... Permite aplicar
algunas de las herramientas quimiométricas de clasificación, como clusters, redes
neuronales y herramientas quimiométricas para el análisis cuantitativo (PLS ). Opus
dispone de otras herramientas quimiométricas para tratar los espectros, en el trabajo
presentado Opus 6.0 se ha utilizado para transferir los espectros usando el algoritmo
de Kowalski and Yang (University of Washington) Piecewise Direct Standardisation
(PDS) [74] descrito en la introducción de esta tesis.
Microsoft Excel( Microsoft, Redmond, Washington, USA)
Microsoft Excel, es una aplicación para manejar hojas de cálculo. Este programa es
desarrollado y distribuido por Microsoft, y es utilizado normalmente en tareas
financieras y contables. Se ha aplicado en esta memoria para el cálculo del coeficiente
de correlación entre espectros y realización de gráficas y tablas.
MATLAB V7.0 (The Mathworks, Massachusets, USA)
Permite trabajar con datos multivariantes. A través de diferentes rutinas creadas por
autores se han utilizado: PLS Toolbox 4.5 (Eigenvector Research, WA, USA) para la
aplicación de los algoritmos de PCA y CLS; ALS 2004 de Roma Tauler para la
aplicación de MCR-ALS.
Isys 5.0 (Malvern Instruments, Worcestershire, UK)
Este software es el encargado de controlar el equipo Malvern
SyNIRgi y que además de la adquisición de los espectros, permite utilizar
METODOLOGÍA EXPERIMENTAL
90
pretratamientos de los datos aplicando SNV (Standard Normal Variate), derivadas
(usando el algoritmo de Savitzky-Golay), etc...
Este software permite hacer múltiples tratamientos de la imagen, como eliminar
fondos, píxeles en los que el espectro no se ha registrado correctamente, estudio de
distribuciones, PCA para datos cualitativos de la imagen, Isys-PLS1 para realizar
cuantificaciones en la imagen entre otras funciones.
En el trabajo presentado Isys 5.0 se ha utilizado para eliminar el fondo, y usar el
algoritmo Isys-PLS1 con las imágenes.
4.5 CONSTRUCCIÓN DE LOS MODELOS DE
CALIBRACIÓN
A continuación se realiza una breve descripción de como se han elaborado los
diferentes modelos utilizados en la tesis.
PLS
Para construir los diferentes modelos PLS, se ha seguido siempre el mismo protocolo
de actuación: en primer lugar se elige un conjunto de calibración adecuado, se optimiza
el pretratamiento espectral y finalmente se optimiza el rango espectral y número de
factores que mejor capacidad predictiva dan al modelo.
Modelos de calibración univariante
Para construir un modelo de calibración univariante mediante coeficientes de
correlación lo suficientemente robusto como para predecir muestras de distinta
naturaleza física, es necesario elegir un conjunto de muestras calibración
perfectamente homogéneas, seleccionar y optimizar el pretratamiento y rango espectral
METODOLOGÍA EXPERIMENTAL
91
de forma que el rango de valores de correlación de la recta de calibrado sea lo más
amplia posible para minimizar los errores de interpolación.
MCR-ALS
La utilización del método MCR se realizó aplicando las restricciones naturales, no
negatividad de concentraciones y closure, y fue necesario introducir espectros del API
y excipiente mayoritario y en determinados casos otros excipientes minoritarios como
estimaciones iniciales para facilitar la iteración. Para una buena cuantificación de las
imágenes es necesario optimizar los pretratamientos.
Isys-PLS1
La utilización del algoritmo PLS1 incluido en el software Isys 5.0, requiere la previa
creación de una biblioteca espectral con uno o más espectros de cada componente que
se quiere cuantificar en la imagen. Para ello se registran imágenes de los componentes
puros y se selecciona un área de la imagen para introducirla en la biblioteca. Una vez
construida la biblioteca se optimizan el threshold y número de factores con los que se
obtenga una mejor capacidad predictiva.
METODOLOGÍA EXPERIMENTAL
92
RESULTADOS Y DISCUSIÓN
93
5. RESULTADOS Y
DISCUSIÓN
RESULTADOS Y DISCUSIÓN
94
RESULTADOS Y DISCUSIÓN
95
5. RESULTADOS Y DISCUSIÓN
Se presentan de manera resumida y crítica los resultados más relevantes obtenidos en
los estudios realizados en la presente Tesis. Los resultados se presentan organizados en
función del tipo de muestra analizada. Se han clasificado en: 1) estudios realizados
utilizando la espectroscopia NIR convencional que han conducido a la determinación
de parámetros de control de un proceso de fabricación de resinas de poliéster y a la
determinación de API a lo largo de las etapas de producción de un fármaco. 2) estudio
mediante NIR-CI de muestras farmacéuticas.
5.1 ESTUDIOS CON ESPECTROSCOPIA NIR
CONVENCIONAL
A continuación se presentan los estudios realizados con NIR convencional que
consisten en la preparación de los modelos para determinación de los parámetros de
interés analítico
5.1.1 DETERMINACION DE PARÁMETROS DE CONTROL DE UN
PROCESO DE FABRICACION DE RESINAS POLIÉSTER
La producción de las resinas poliéster se realiza en tres etapas a lo largo de las cuales
tiene lugar la condensación entre poliácido y poliol (esterificación), corrección de
composición y finalmente el acabado de la resina que debe tener unas características
tanto físicas como químicas determinadas. En la figura 5.1 se muestran espectros de la
misma resina en cada una de las etapas de proceso de producción. Estos espectros
muestran una gran semejanza entre si, lo que indica que el transcurso de la reacción, a
RESULTADOS Y DISCUSIÓN
96
pesar de la reducción de los valores de los índices de ácido y de hidroxilo durante el
proceso, causan solamente pequeños cambios espectrales.
Figura 5.1. Espectros NIR de muestras de distintas etapas del proceso productivo.
Para la construcción de los distintos modelos se han usado únicamente muestras
procedentes del proceso que fueron registradas con el equipo Perkin-Elmer. En la
figura 5.2 se muestra un gráfico de dispersión de scores de un análisis en componentes
principales (PCA) de espectros de resinas correspondientes a las tres etapas; se
observan claras diferencias entre los espectros de las tres etapas, lo que indica la
evolución del sistema con el tiempo. Estas diferencias nos llevaron a construir un
modelo para cada uno de los parámetros de control (Índice de Ácido e Índice de
Hidroxilo) y para cada una de las etapas del proceso.
RESULTADOS Y DISCUSIÓN
97
Figura 5.2. Gráfico de dispersión de scores obtenido de un PCA de los espectros en primera
derivada en el rango de 4000-10000 cm-1 en las tres etapas de producción.
En la figura 5.2 se observa que los scores de las muestras de la 2ª etapa son próximos a
los de las muestras de la 3ª etapa, por ello se estudia la construcción de un único
modelo para muestras de ambas etapas tanto para índice de ácido como el de hidroxilo.
Para obtener un modelo de calibración con adecuada capacidad predictiva es necesario
que el conjunto de calibración incluya todas las fuentes de variabilidad del conjunto de
muestras que se quieren determinar; para seleccionar las muestras que cumplan esta
condición se ha aplicado el algoritmo de Kennard-Stone a los conjuntos de muestras
disponibles para cada una de las etapas. La figura 5.3 muestra un grafico de dispersión
de scores (PC1 vs. PC2) de un análisis en componentes principales (PCA) de las
muestras disponibles pertenecientes a la primera etapa del proceso y se observa que la
selección realizada por aplicación de este algoritmo recoge la variabilidad espectral de
las muestras seleccionadas para la calibración.
RESULTADOS Y DISCUSIÓN
98
Figura 5.3. Gráfico de dispersión de scores obtenido de un PCA de los espectros en primera
derivada en el rango de 4000-10000 cm-1 en la primera etapa de producción.
Se comprueba que las muestras seleccionadas por el algoritmo cubren todo el rango de
IA o IOH; cuando no es así, se amplia el número de muestras que el algoritmo
Kennard-Stone debe seleccionar hasta que el numero de muestras cubra completa y
uniformemente el rango de valores de los índices. El conjunto de muestras no
seleccionadas por el algoritmo Kennard-Stone constituirán el conjunto de validación
que se utilizará para comprobar la capacidad predictiva del modelo construido.
En el estudio para obtener el mejor modelo se han ensayado distintos rangos
espectrales y distintos pretratamientos espectrales (SNV y primera derivada). La
selección del rango espectral del modelo se ha realizado con la ayuda del criterio de
RESULTADOS Y DISCUSIÓN
99
Jack-Knifing [93] que proporciona una indicación de las longitudes de onda que tienen
una mayor influencia en el modelo.
La aplicación del criterio conduce a la selección de los rangos recogidos en la tabla 5.1 y
que coinciden con las bandas más significativas de los espectros de las resinas. En los
modelos de calibración las muestras que presentaban elevados valores de residuales o
desviaciones importantes de la población han sido consideradas muestras anómalas
(outlier) y se han eliminado del modelo.
Se han desarrollado modelos para determinar los valores de índice de ácido e índice de
hidroxilo para cada etapa, excepto para índice de hidroxilo de muestras de 2ª y 3ª
etapas para las que se ha construido un solo modelo. La tabla 5.1 muestra los
parámetros significativos de cada modelo y así como los errores de calibración y de
predicción; puede verse que 4 ó 5 factores PLS son suficientes para la construcción de
modelos de adecuada capacidad predictiva para ambos parámetros como lo
demuestran los valores de RSEP que no superan el 3.5 % en ninguno de los modelos
construidos.
Tabla 5.1. Características de los modelos de calibración para el control de valores de índice de
ácido e hidroxilo.
Parámetro Etapa Pretratamiento espectral
Rango espectral
(cm-1)
Factores PLS
Varianza Y explicada
%
RSEC%
RSEP%
1 1ª Derivada
6550-5316 5206-4970 4926-4578 4418-4000
4 98.27 1.52 2.58
2 1ª Derivada 7000-4000 5 98.4 0.69 1.48
IA
3 SNV 8200-5000 4 95.8 0.35 1.27
1 1ª Derivada
7182-6870 6106-5302 5224-4566 4418-4158
4 98.18 2.82 2.39 IOH neto
2+3 1ª Derivada 7118-5448 5132-4000
5 96.3 1.61 3.41
[93] H. Martens, M. Martens. Modified Jack-knife estimation of parameter uncertainty in bilinear modelling by partial least squares regression (PLSR). Food Qual Prefer. 11 (2000) 5– 16.
RESULTADOS Y DISCUSIÓN
100
La semejanza entre las muestras de la 2ª y 3ª etapas ha permitido construir un único
modelo para el índice de hidroxilo que es simple (5 factores) y con buena capacidad
predictiva; en cambio no se obtienen resultados satisfactorios para el índice de ácido y
se ha preferido construir modelos separados para las dos etapas que son más simples y
adecuados que uno único.
Tabla 5.2. Figuras de mérito de los modelos de calibración para las muestras de calibración y
predicción.
Parámetro Etapa Conjunto de muestras
Nº de muestras
Rango del parámetro (mg KOH/g)
Pendiente Ordenada en el origen
R2
Calibración 19 13.6 - 22.0 0.98±0.07 0.30±1.17 0.99 1
Predicción 23 14.9 - 19.3 0.95±0.13 0.64±3.83 0.95
Calibración 22 42.3 - 56.6 0.98±0.06 0.80±2.95 0.99 2
Predicción 28 46.9 - 53.6 0.93±0.17 3.75±8.47 0.91
Calibración 16 33.1 - 35.5 0.96±0.11 1.44±3.98 0.96
IA
3 Predicción 6 34.9 - 35.4 - - -
Calibración 46 16.1 - 36.0 0.98±0.04 0.47±1.07 0.98 1
Predicción 27 19.4 - 34.4 1.02±0.06 -0.83±1.73 0.98
Calibración 49 (-19.2) - (-39.0) 0.96±0.05 1.08±1.61 0.96 IOH neta
2+3 Predicción 40 (-21.2) - (-33.3) 1.07±0.13 1.57±3.84 0.85
Nota: ± Intervalo de confianza para el nivel de significancia (p = 0.05).
La tabla 5.2 recoge los parámetros estadísticos más relevantes de los modelos tanto de
calibración como de predicción. Los valores de pendiente y ordenada en el origen con
sus correspondientes intervalos de confianza de las rectas de regresión obtenidas de
valor NIR v.s. valor de referencia, comprenden el 1 y el 0 respectivamente para todos
los modelos construidos. Estas características, junto con los valores de los coeficientes
de determinación para las rectas de los conjuntos de calibración tanto para índice de
ácido como de hidroxilo, que son cercanos a 1 (entre 0.99-0.96), demuestran la buena
calidad de los modelos obtenidos. Asimismo, los coeficientes de determinación para las
muestras de validación se alejan más de 1 que los coeficientes de determinación de las
de calibración, pero no obstante son correctos (0.96-0.85). El reducido número de
muestras disponibles para verificar la capacidad predictiva del modelo del índice de
RESULTADOS Y DISCUSIÓN
101
ácido de la 3ª etapa unido al estrecho rango de IA que cubre hace inadecuado este
criterio de calidad de las predicciones y este se evalúa mediante un ensayo t de las
diferencias. La tabla 5.3, muestra los tests-t (con un nivel de significación del 95%) de
los residuales de calibración y predicción que demuestran que para los cinco modelos
PLS no había diferencias significativas entre los resultados obtenidos por NIR y los
valores de referencia.
Tabla 5.3 Test t de residuales (p = 0.05) para las muestras de calibración y predicción.
Parámetro Etapa Conjunto de muestras
Nº de muestras Promedio S.D. texp tcrit
Calibración 19 0.00 0.31 0.00 2.08 1
Predicción 23 -0.51 0.38 0.28 2.07
Calibración 22 0.00 0.36 0.00 2.08 2
Predicción 28 0.16 0.66 0.05 2.05
Calibración 16 0.00 0.12 0.00 2.13
IA
3 Predicción 6 -0.27 0.39 0.29 2.57
Calibración 46 0.00 0.75 0.00 2.01 1
Predicción 27 -0.27 0.59 0.08 2.05
Calibración 49 0.00 0.64 0.00 2.01 IOH neto
2+3 Predicción 40 0.28 0.98 0.05 2.02
Transferencia de espectros/modelos
Los modelos se han construido con espectros registrados con el equipo Perkin-Elmer y
posteriormente a la construcción de los modelos se adquirió, un equipo NIR Bruker
MPA, que presenta características similares a las del equipo Perkin-Elmer. Las ligeras
diferencias entre los espectros de las muestras registradas en ambos equipos impiden
utilizar los modelos creados en el nuevo instrumento. Los espectros registrados con el
equipo Bruker presentan un desplazamiento del valor de absorbancia y un espaciado
distinto entre valores de número de onda.
Con el objeto de no tener que rehacer todos los modelos se utiliza una transformación
de espectros, Piecewise Direct Standardisation, desde una aplicación contenida en el
software OPUS de Bruker, en que los espectros del equipo Perkin-Elmer (equipo
RESULTADOS Y DISCUSIÓN
102
maestro) se transforman en espectros equivalentes a los registrados por el equipo
Bruker (equipo esclavo).
Para ello es necesario registrar un cierto número de muestras con ambos equipos. Las
muestras que se utilizaran para la transformación de los espectros han sido
seleccionadas con el algoritmo de Kennard y Stone.
Se ha considerado que 20 muestras es un número adecuado para realizar una correcta
transformación de espectros. En la figura 5.4 se muestra un espectro registrado con el
equipo Perkin-Elmer, un espectro Perkin Elmer transferido y un espectro registrado
con el equipo Bruker; puede observarse que los espectros Perkin-Elmer transferidos
presentan una gran similitud con los de Bruker.
Figura 5.4. Espectros NIR registrados en los instrumentos Perkin-Elmer, Bruker instruments,
y un espectro transferido.
En la tabla 5.4 se muestran los valores de correlación entre espectros Perkin
transferidos, espectros registrados con el equipo Perkin-Elmer y espectros registrados
con el equipo Bruker de unas pocas muestras representativas del proceso que
RESULTADOS Y DISCUSIÓN
103
corroborarán el grado de semejanza entre espectros. Las correlaciones entre los
espectros Perkin-Elmer los Bruker inferiores, alrededor de 0.91-0.92, lo que muestra
una poca semejanza entre los espectros de las mismas muestras registrados con ambos
equipos.
Tabla 5.4. Tabla de coeficientes de correlación entre espectros en absorbancia Perkin Elmer
transferidos, espectros registrados con el equipo Perkin-Elmer y espectros registrados con el
equipo Bruker.
Número de muestra 1 2 3 4 5 6 7
Correlación Perkin-Elmer vs.
Bruker 0.9165 0.9114 0.9124 0.9148 0.9107 0.9100 0.9080
Correlación Perkin-Elmer transferidos
vs. Bruker 0.9998 1.0000 1.0000 0.9991 1.0000 0.9999 0.9997
Correlación Perkin-Elmer originales vs.
transferidos 0.9165 0.9110 0.9124 0.9126 0.9101 0.9138 0.9080
Se observan unos coeficientes de correlación prácticamente iguales a 1 para espectros
Perkin-Elmer transferidos y Bruker, lo que confirma lo observado en la figura 5.4, una
gran similitud entre los espectros transferidos con el algoritmo PDS y los registrados
con el equipo Bruker.
Una vez creado el conjunto de transferencia con el algoritmo PDS, este se aplica para
transferir tanto a los espectros Perkin-Elmer que se utilizaran para construir el modelo
de calibración como a los espectros que se utilizaran para la validación del modelo.
Para la construcción de los nuevos modelos se utilizan las mismas condiciones de los
modelos originales, tanto pretratamientos espectrales y rango de números de onda
como el número de factores, y el nuevo modelo construido se aplica para predecir, tanto
los espectros transferidos del conjunto de validación del modelo original como
RESULTADOS Y DISCUSIÓN
104
espectros registrados con el equipo Bruker, para ver la calidad de los modelos después
de la transferencia de espectros.
En la tabla 5.5 se muestran los valores de error (RSEC y RSEP para índice de ácido e
índice de hidroxilo) de los modelos originales (construidos con espectros Perkin-Elmer)
y los modelos construidos con espectros transferidos. Se muestran también los valores
de RSEP de un conjunto de muestras independiente registrado con el equipo Bruker
(equipo esclavo) calculados con los modelos creados con espectros Perkin-Elmer
transferidos.
Tabla 5.5. Comparativa entre los modelos construidos con espectros originales de la Etapa 1 y
los obtenidos con espectros transferidos.
Parámetro Modelo con espectros Perkin-Elmer originales
Modelo con espectros Perkin-Elmer transferidos
Varianza explicada Y %
RSEC% RSEP% Varianza explicada Y %
RSEC% RSEP% RSEP% Muestras Bruker
IA 98.27 2.82 2.39 92.32 3.20 3.12 4.33 (n=53)
IOH net 98.18 2.82 2.39 97.78 3.11 4.08 4.37 (n=88)
Se observa que tanto para IA como para IOH los errores de predicción en los modelos
creados con espectros Perkin-Elmer transferidos, son ligeramente más elevados que en
los modelos originales para IA, y en torno a 1.5% más elevados para IOH.
La varianza que explican los modelos construidos con espectros Perkin-Elmer
transferidos, es inferior a la explicada por los modelos originales (97.34% vs. 92.32%)
para IA y sólo ligeramente inferior (98.18% vs. 97.78%) para IOH.
El valor de RSEP para las muestras Bruker es ligeramente superior que para muestras
Perkin-Elmer transferidas (3.82% vs. 4.33%) para IA y (3.82% vs. 4.33%) para IA. Sin
RESULTADOS Y DISCUSIÓN
105
embargo, los resultados de la aplicación del nuevo modelo están dentro de la
especificación aceptada para los mismos.
Con el objeto de intentar mejorar la predicción de nuevas muestras, se han construido
nuevos modelos con los espectros transferidos, utilizando las mismas muestras que en
los modelos originales y ensayando distintos rangos y pretratamientos espectrales
(SNV y primera derivada). Con ellos se predecirá tanto los espectros transferidos del
conjunto de validación del modelo original, como espectros registrados con el equipo
Bruker.
La tabla 5.6 resume las características de cada modelo y muestra los errores de
calibración y de predicción de los modelos. La mejoría obtenida respecto a los modelos
obtenidos con los espectros transferidos, reproduciendo las condiciones del modelo
original, no es muy significativa (en el mejor de los casos, para IA esta no llega al 1%),
sin embargo el modelo del índice de hidroxilo es más simple (3 factores frente a 4 que
tenía el modelo original).
Tabla 5.6. Características de los modelos de calibración realizados con espectros Perkin-Elmer
transferidos de las resinas de la etapa 1 para mejorar los modelos originales .
Parámetro Pretratamiento espectral
Rango espectral (cm-1)
Factores PLS
Varianza Y explicada %
RSEC%
RSEP%
RSEP% Muestras Bruker
IA 1ª Derivada
6550-5316 5206-4970 4926-4578 4418-4204
4 97.24 1.92 2.74 3.27
IOH net 1ª Derivada 5352-4600 3 98.55 2.75 3.98 4.10
La tabla 5.7 muestra las figuras de mérito de los modelos transferidos que demuestran
la no existencia de errores sistemáticos en las nuevas predicciones: los valores de
pendiente y ordenada al origen para tanto de las rectas de calibración como para las de
predicción son próximos a 1 y 0 respectivamente, conteniendo estos dos valores en sus
intervalos de confianza.
RESULTADOS Y DISCUSIÓN
106
Tabla 5.7. Figuras de mérito de la calibración y predicción de los modelos de calibración
realizados con espectros de la etapa 1 Perkin-Elmer transferidos.
Parámetro Conjunto de muestras
Nº de muestras
Rango del parámetro (mg KOH/g)
Pendiente Ordenada al origen
R2
Calibración 19 13.6 - 22.0 0.97±0.08 0.48±1.47 0.97
Predicción 23 14.9 - 19.3 1.05±0.17 -1.08±3.06 0.88 IA Predicción Bruker
53 13.6 - 22.0 0.92±0.09 1.35±1.63 0.88
Calibración 46 16.1 - 36.0 0.98±0.04 0.45±1.07 0.98
Predicción 27 19.4 - 34.4 1.07±0.10 -1.51±2.80 0.95 IOH neto Predicción Bruker
88 16.1 - 36.0 1.08±0.09 -1.17±2.06 0.97
Como se puede observar comparando los valores de RSEP de los modelos para índice
de ácido e hidroxilo (tablas 5.5 y 5.7), la mejora de los modelos respecto a los modelos
con los rangos espectrales y pretratamiento espectral original, pero construido con los
espectros transferidos, no es significativa. Esto corrobora que la confección de modelos
nuevos para la mejora de las predicciones de los modelos originales con espectros
transferidos no es necesaria.
RESULTADOS Y DISCUSIÓN
107
5.1.2 DETERMINACIÓN DE API DE UN FÁRMACO MEDIANTE
CALIBRACIÓN UNIVARIANTE
El objetivo del presente trabajo es explorar la construcción de un modelo de calibración
univariante de aplicabilidad general en muestras farmacéuticas de las diferentes etapas
del proceso de fabricación (comprimidos sin recubrir, comprimidos lacados y mezclas
granuladas), mediante la aplicación del coeficiente de correlación como variable
predictora. El método se basa en el calculo del coeficiente de correlación entre los
espectros de mezclas de tipo sintético, preparadas en el laboratorio por pesada, de
composición conocida de los componentes de la formulación farmacéutica, y el espectro
del API puro; a continuación se calcula la ecuación de regresión por mínimos
cuadrados entre los coeficientes de correlación calculados y la concentración de API.
Para realizar la determinación de una muestra desconocida se calcula el coeficiente de
correlación de su espectro con el del API puro y este valor se interpola en la recta
definida anteriormente.
El cálculo del coeficiente de correlación entre espectros se puede realizar con los
espectros en sus diferentes modos: absorbancia, SNV, derivadas, etc.
En la figura 5.5 se muestran los espectros en absorbancia (a) y en 2ª derivada (b) de
una muestra de granulado y del API.
Para obtener una recta de calibración con adecuada capacidad predictiva es necesario
que el valor del coeficiente de correlación entre las muestras con concentraciones
extremas sea lo más amplio posible ya que un amplio rango de valores de CC nos
permitirá distinguir entre concentraciones semejantes.
Se ensayaron diferentes pretratamientos espectrales y se calcularon los CC entre los
espectros de las muestras de concentraciones extremas y el API.
RESULTADOS Y DISCUSIÓN
108
Figura 5.5. Espectros de muestras de producción (granulada y comprimidos lacados y no
lacados) y el espectro del API en absorbancia (a) y segunda derivada (b)
La tabla 5.8 muestra los intervalos de coeficientes de correlación obtenidos con los
diferentes pretratamientos. La gran semejanza entre los espectros de las muestras y el
API explica el elevado coeficiente de correlación en modo absorbancia (r = 0.920). Sin
embargo, la aplicación de derivadas produce una disminución del valor del CC y un
aumento significativo de las diferencias de CC entre los espectros de las muestras
extremas. Como resultado del estudio se seleccionó el modo de 2ª derivada para
calcular el CC.
RESULTADOS Y DISCUSIÓN
109
Tabla 5.8. Rango de coeficiente de correlación entre la muestra con una mayor y menor
concentración de API.
Pretratamiento Rango de coeficiente de correlación Diferencia
Absorbancia 0.904-0.920 0.016
SNV 0.904-0.920 0.016
1ª Derivada 0.136-0.245 0.109
2ª Derivada 0.228-0.369 0.141
También se ensayo la búsqueda de un intervalo espectral en que aumentará el intervalo
del CC, pero no se encontró ninguno que mejorara los resultados de la utilización del
espectro completo.
En consecuencia se seleccionó el rango completo de longitudes de onda y el modo
espectral de 2ª derivada como los más adecuados tratamientos para construir el
modelo de calibración.
Se prepararon 15 muestras que cubren el rango de concentraciones de API de 73.7–
123.2 mg/g para construir por mínimos cuadrados el modelo de calibración. Este rango
de concentraciones corresponde a ± 20% del valor etiquetado de API en el preparado y
es lo suficientemente amplio para poder realizar la determinación de uniformidad de
contenido (los valores deben estar comprendidos en ± 15% del valor etiquetado) con el
modelo desarrollado.
El espectro NIR de las muestras se ha obtenido registrándolas por triplicado, colocando
una alícuota de la muestra en una cubeta de cuarzo y removiendo la muestra entre
registros sucesivos.
En la tabla 5.9 se dan los parámetros más relevantes del modelo de regresión obtenido:
pendiente y ordenada al origen con sus intervalos de confianza, coeficiente de
determinación, etc.
RESULTADOS Y DISCUSIÓN
110
Tabla 5.9. Figuras de mérito del modelo de calibración.
Dado que disponemos de los espectros triplicados de cada muestra, se ha realizado un
ANOVA de la recta de regresión para comprobar el modelo lineal propuesto; en la tabla
5.9 se dan también los resultados de este análisis que indica que el modelo lineal es
válido.
Se ha estudiado la capacidad predictiva del modelo construido con la predicción de
muestras procedentes de las diferentes etapas del proceso de fabricación: comprimidos
sin recubrir, comprimidos lacados y mezclas granuladas.
Un gráfico de residuales (figura 5.6) muestra valores aceptables y distribuidos
aleatoriamente lo que indica la ausencia de un error sistemático en el mismo.
Modelo de calibración
Pretratamiento 2ª Derivada S-G
Rango espectral (nm) 1110-2490
Rango de concentraciones (mg/g) 73.7–123.2
Muestras de calibración 15
Ecuación (CC vs. concentración) CC=[(360±1)x10-5 x Conc. API] - (356±90) x10-4
RSEC 0.61
SSLOF SS PE SS REG SStotal
2.917E-04 3.778E-04 2.636 2.637
F exp F tab
ANOVA TEST LOF (falta de ajuste)
0.59 2.59
RESULTADOS Y DISCUSIÓN
111
Figura 5.6. Gráfico de residuales absolutos de las muestras de predicción aplicando los
modelos univariable y PLS.
Los espectros de estas muestras son muy semejantes y las diferencias espectrales
debidas al scattering se reducen aún más en los espectros de 2ª derivada; la predicción
de estas muestras con el modelo desarrollado muestra que los resultados no son
significativamente distintos de los valores de referencia.
En la tabla 5.10 se muestran los parámetros de la predicción de este tipo de muestras y
en la figura 5.6 se muestran los residuales de las predicciones frente al valor de
referencia determinado por espectrofotometría UV. Este estudio indica que la calidad
de los resultados es adecuada (valores de RSEP inferiores al 2%) para utilizar el modelo
en el control del proceso de fabricación y que el modelo está exento de error sistemático
(residuales aleatorios), por lo que podemos usarlo para monitorizar el proceso de
producción farmacéutica.
RESULTADOS Y DISCUSIÓN
112
Tabla 5.10. Errores de predicción para distintos tipos de muestras usando los modelos de
calibración univariable y PLS. Test t de diferencias entre predicciones de ambos modelos.
Tipo de muestra
Granulado Comprimidos sin recubrir
Comprimidos lacados
Nº Muestras
8 10 13
Rango de API (mg/g)
79.0 – 110.0 90.7 – 92.9 90.4 – 93.5
C.C. PLS C.C. PLS C.C. PLS RSEP (%) 1.08 1.56 1.91 1.57 1.43 0.91
Test t (n =31)
t tab t exp
2.03 1.98
En un estudio anterior se han desarrollado modelos de calibración PLS para este
mismo preparado y se demostró que eran necesarios modelos distintos para la correcta
predicción de cada tipo de muestra [94].
Las mismas muestras, de los mismos tipos, se predijeron con modelos PLS construidos
previamente para cada tipo de muestra; en la tabla 5.10 se muestran los valores de
RSEP correspondientes a la aplicación de estos modelos y en la figura 5.6 se muestran
los residuales obtenidos en la predicción de las muestras de validación. Los resultados
indican que las predicciones y los residuales obtenidos por aplicación del modelo
univariante no son significativamente distintos de los obtenidos en los modelos
multivariables como lo demuestra un test t realizado a los residuales entre los métodos;
esto indica que el modelo univariable es una alternativa adecuada a los modelos
multivariables en la predicción de muestras del proceso, por lo que se han obtenido
buenos parámetros de predicción con el uso de un único modelo univariante en lugar
de 3 modelos multivariantes.
[94] API Determination by NIRS Across Pharmaceutical Production Process. Blanco M, Bautista M, Alcalà M (2008) AAPS Pharm Sci Technol. Vol. 9, No. 4
RESULTADOS Y DISCUSIÓN
113
5.2 ESTUDIO MEDIANTE NIR-CI DE MUESTRAS
FARMACÉUTICAS
El desarrollo en los últimos años de las técnicas de imagen que son capaces de
proporcionar una mayor información de las muestras, ha llevado a su introducción en
el campo farmacéutico con el objetivo de completar la información que no puede
obtenerse mediante el NIR convencional.
La elevada cantidad de información que proporcionan las imágenes hiperespectrales (1
espectro cada píxel) permite obtener más de 80000 espectros por cada imagen y se
requieren herramientas quimiométricas adecuadas que permitan tratar tal cantidad de
datos para extraer la información relevante.
Los objetivos propuestos en este estudio son la determinación de la concentración de
cada analito en cada píxel que nos permitirá, además de calcular la concentración
media de la muestra, visualizar mediante un mapa de concentraciones la distribución
de los analitos en la muestra .
Para que estas técnicas sean aplicables en un laboratorio de control es fundamental
disponer de algoritmos matemáticos eficientes y rápidos para tratar la enorme cantidad
de datos que aportan y por tanto seleccionar los más adecuados a cada una de las
diferentes situaciones que exige el análisis farmacéutico es imprescindible para su
aplicación en rutina.
En este estudio se han ensayado los algoritmos Isys-PLS1, PLS1, y MCR-ALS.
Para cuantificar mediante PLS1 es necesario disponer de un conjunto de muestras de
calibración de concentración conocida, establecida generalmente por la aplicación de
un método de referencia. Así y todo, no se conoce la concentración de los analitos en
cada píxel de la imagen, por lo que la calibración debería realizarse a partir del valor
promedio de la imagen. Estas limitaciones reducen su aplicabilidad a algunas
situaciones concretas.
RESULTADOS Y DISCUSIÓN
114
Isys-PLS1 y MCR-ALS, en cambio, no requieren datos de concentración previos para
realizar la calibración, ni conocer la concentración en cada píxel. Requieren, sin
embargo, de los espectros puros de los analitos para la construcción de los modelos.
En un primer estudio se realiza la aplicación de MCR-ALS a la resolución de imágenes
hiperespectrales de comprimidos comerciales de ácido acetilsalicílico (ASA).
Posteriormente, se compara este algoritmo con el Isys-PLS1 en su aplicación a la
determinación de API en comprimidos comerciales de ASA. En un último trabajo se
estudia la aplicación de Isys-PLS1 a la cuantificación de API y excipientes en
comprimidos de un preparado farmacéutico en fase de estudio.
5.2.1 APLICACIÓN DEL ALGORITMO MCR-ALS AL ANÁLISIS DE
IMÁGENES DE COMPRIMIDOS COMERCIALES DE ÁCIDO
ACETILSALICÍLICO (ASA)
MCR-ALS es un algoritmo iterativo, que ha sido aplicado con éxito para la
monitorización de reacciones químicas y bioquímicas, en datos medioambientales y
hasta en datos de proteómica.
En el estudio realizado se pretendía demostrar la aplicabilidad de MCR-ALS y su
versión aumentada para obtener información cuantitativa de calidad de imágenes
hiperespectrales de muestras farmacéuticas comerciales.
La composición de las formulaciones de los comprimidos es desconocida, y la única
información que se dispone es la incluida en las cajas de los comprimidos o en la guía
Vademecum. En la tabla 5.11 se muestran los nombres comerciales y las principales
características de cada uno de los comprimidos.
RESULTADOS Y DISCUSIÓN
115
Tabla 5.11. Descripción de los 10 comprimidos comerciales analizados de ASA.
Marca comercial
Cont. nominal de ASA (mg)
Diámetro (mm)
Peso del comprimido
(g)
Concentración calculada (%)
Excipiente mayoritario
A.A.S 100 100 8.2 0.227 44.13 Manitol
A.A.S 500 500 13.4 0.864 57.88 Manitol
Bayer 500 500 12.0 0.609 82.06 MCC
Adiro 100 100 7.2 0.135 73.86 MCC
Adiro 300 300 10.2 0.409 73.28 MCC
Aspirina C* 400 25.8 3.235 12.37 --
Dolmen* 500 24.2 3.399 14.71 --
Aspirine Nicholas
500 12.0 0.624 80.13 MCC
Bioplak 250 250 7.0 0.348 71.84 MCC
Bioplak 125 125 10.0 0.173 72.09 MCC
La celulosa microcristalina (MCC) es el excipiente mayoritario en 6 de los
comprimidos, mientras que el manitol es el excipiente mayoritario en otros 2
comprimidos. Los comprimidos de Dolmen y Aspirina C son comprimidos
efervescentes y contienen acido ascórbico también como principio activo y otros
excipientes como ácido cítrico y carbonato y bicarbonato de sodio anhidros.
En la Figura 5.7, se muestran los espectros de los diferentes comprimidos comerciales
de ASA ensayados en este estudio. Se observan diferencias importantes entre los
espectros como ya puede esperarse por diferente composición; sin embargo, se puede
observar la banda espectral de ASA (alrededor de 1680 nm) en todos los espectros.
RESULTADOS Y DISCUSIÓN
116
Figura 5.7. Espectro promedio de un comprimido de cada marca comercial después de aplicar
SNV.
Nota: Los espectros han sido desplazados para evitar la superposición y observar mejor las
diferencias.
En esta figura se puede observar como los comprimidos de AAS, Adiro, y Bioplak,
presentan espectros muy similares entre sus diferentes dosificaciones, lo que indica una
composición muy semejante de ambas formulaciones, pero existen diferencias
significativas entre los espectros de comprimidos de marcas distintas lo que se explica
por las diferencias en la formulación.
Por otro lado Dolmen y Aspirina C tienen perfiles espectrales muy similares entre ellos,
a pesar que provienen de diferentes fabricantes y a la vez muy distintos del resto;
ambos son comprimidos efervescentes y presentan espectros muy semejantes y a la vez
muy diferentes a los del resto de marcas.
Longitud de onda
Inte
nsid
ad
Longitud de onda
Inte
nsid
ad
RESULTADOS Y DISCUSIÓN
117
El algoritmo MCR, descompone la matriz desdoblada (D) mediante la metodología
iterativa de Mínimos Cuadrados Alternados (ALS), en un producto de dos matrices
perfiles de concentración (C ) y perfiles espectrales de cada componente (S),
permitiendo con el perfil de concentración obtener mapas de concentración de las
imágenes hiperespectrales estudiadas.
Antes de empezar las iteraciones, para facilitar la descomposición se pueden introducir
estimaciones iniciales al algoritmo. El uso de espectros de los componentes puros que
componen la muestra (siempre que se disponga de ellos) como estimaciones iniciales es
una forma de introducir información de la muestra al algoritmo.
El algoritmo finaliza las iteraciones cuando la diferencia entre los valores de falta de
ajuste (% Lack of Fit (%LOF)) de dos iteraciones sucesivas es menor de un valor que
prefijamos previamente (criterio de convergencia que por defecto el software fija a 0.1).
N
nmn
M
m
N
nmn
M
m
x
exLOF
2
2
100%
(30)
Donde 2mne y 2
mnx representan a cada píxel de la imagen el valor de los residuales y del
cubo de datos respectivamente.
Pero la solución obtenida tras la descomposición no única, ya que se pueden obtener
una gran número de combinaciones de C y S, que multiplicadas entre sí permitan
obtener la misma matriz D. Estas ambigüedades, pueden ser corregidas mediante la
aplicación restricciones en el cálculo, para evitar soluciones ilógicas experimentalmente
aunque lógicas matemáticamente. Las restricciones usadas de forma más frecuente en
MCR-ALS son: 1) no negatividad de concentraciones y/o espectros impone que los
espectros de la matriz de datos y/o perfiles de concentración de los componentes
tengan siempre valores positivos; 2) unimodalidad en la que se asume que los espectros
solamente presentan un único máximo; 3) con la restricción de closure se supone que
RESULTADOS Y DISCUSIÓN
118
en cada píxel se debe cumplir un balance de masa de 1, representando la totalidad de la
concentración.
Tanto las restricciones como el funcionamiento del algoritmo están más
detalladamente explicados en el capítulo de quimiometría de esta tesis.
En la aplicación de MCR-ALS a los comprimidos de acido acetilsalicílico, se incluyeron
los espectros puros de los componentes mayoritarios como estimaciones iniciales y se
ha usado la misma metodología cuando se ha aplicado la versión aumentada de MCR-
ALS, donde para mejorar la descomposición de la matriz, se han incluido 10 espectros
de ambos analitos (ASA y excipiente mayoritario) a la matriz de datos desdoblada. Se
aplicaron las restricciones de no negatividad para los perfiles de concentración y de
closure para el principio activo (ASA) y para el excipiente mayoritario (MCC o manitol)
en 8 de los 10 comprimidos y a la formulación completa para Dolmen y Aspirina C.
Se han ensayado varios pretratamientos espectrales para ver el que mejor predecía la
concentración de ASA en los diferentes comprimidos y mejor descomposición del cubo
de datos desdoblado obtenía. La combinación de SNV y smoothing con un tamaño de
ventana de 7 puntos son los pretratamientos que proporcionaron los mejores
resultados.
Para comprobar la correcta descomposición realizada por MCR-ALS, se ha usado el
%LOF y el coeficiente de correlación entre los perfiles espectrales obtenidos con los
espectros de los componentes puros.
A modo de ejemplo, el % LOF del modelo MCR-ALS aplicado a Aspirine Nicholas de
500 mg, ha sido del 2.79%, explicando el 99% de la varianza, siendo parámetros
indicativos de la bondad del modelo calculado.
Si se compara el valor obtenido y el porcentaje de formulación (77.5% para ASA,
mientras que el valor teórico es el 80.1%), se puede considerar la cuantificación de este
comprimido como buena. Sin embargo, el coeficiente de correlación entre el perfil
RESULTADOS Y DISCUSIÓN
119
espectral obtenido para ASA y MMC con el espectro puro es lejano a 1, el valor optimo
(0.76 y 0.51 respectivamente).
Para mejorar la descomposición de la matriz desdoblada, se aplicó la versión
aumentada de MCR-ALS. El aumento se realiza incluyendo información selectiva (10
puros espectros) para cada componente de la imagen. Se aplicaron los mismos
pretratamientos y restricciones que para aplicación de MCR-ALS sin aumento de la
matriz desdoblada.
Los resultados obtenidos con MCR-ALS aumentando la matriz desdoblada mostraron
valores bastante similares de % LOF (3.55) y varianza explicada (99.87%), y
proporcionaron también buenos resultados en el análisis cuantitativo (ver tabla 5.12).
Como puede observarse en la figura 5.8 a y b, los perfiles espectrales que se obtienen
aumentando la matriz desdoblada, tienen un perfil perfectamente coincidente con los
espectros puros de cada compuesto. Esto queda corroborado con el coeficiente de
correlación entre los perfiles espectrales y los espectros puros de ASA y MCC que se
muestran en la tabla 5.12 ya que ambos son cercanos a 1.
En la figura 5.8 c se muestra el mapa de concentración para ASA obtenido a partir de la
matriz desdoblada aumentada, donde se muestra la distribución de ASA en la superficie
del comprimido. A primera vista, viendo el mapa de colores correspondientes al
principio activo (ASA), parece que éste no está bien distribuido en la superficie del
comprimido, sin embargo observando la escala de color de la imagen, ésta muestra un
rango estrecho de entre 0.70 y 0.78. Por lo tanto, el contenido de ASA en cada píxel de
la imagen, es similar, quedando reafirmado en el estrecho histograma del mapa de
concentraciones (figura 5.8 d), que presenta una distribución cercana a una
distribución gaussiana.
RESULTADOS Y DISCUSIÓN
120
Figura 5.8. Resultados para MCR-ALS aumentado de un comprimido comercial (Aspirine
Nicholas 500). a) Perfiles espectrales para ASA; b) Perfiles espectrales para MMC; c) Mapa de
concentración para ASA; d) Histograma de concentraciones de ASA.
Resultados para todos los comprimidos comerciales
Tras el análisis del comprimido de Aspirine Nicholas de 500 mg. se han analizado los 9
comprimidos restantes. En la tabla 5.12 se muestran los resultados de la cuantificación
de ASA mediante MCR-ALS de todos los comprimidos comerciales. La concentración
de ASA en la superficie de los distintos comprimidos, es similar al valor teórico
confirmando la bondad del análisis cuantitativo. Se obtuvieron buenos resultados para
la mayoría de muestras (la correlación espectral entre espectro puro de ASA y el perfil
espectral calculado para ASA en todas las muestras fue cercano a 1, confirmando la
bondad de la aplicación de MCR-ALS aumentado).
Sin embargo, con los comprimidos que contienen Manitol como excipiente mayoritario,
no se obtienen tan buenos resultados en la determinación del contenido de ASA.
RESULTADOS Y DISCUSIÓN
121
Mirando los valores del coeficiente de correlación entre espectro puro y perfil espectral,
se observa que para Manitol estos no son tan cercanos a 1 como para MCC. La causa
de esto podría ser la influencia de otro excipiente con una alta relevancia espectral, éste
proporciona información a la imagen, evitando la correcta descomposición los datos.
Tabla 5.12. Resultados obtenidos para 10 tipos de comprimidos comerciales usando MCR-
ALS.
Comprimido Concentración
nominal (%)
Concentración obtenida con MCR-ALS (%)
Residual (%)
Correlación ASA
Correlación MCC
Correlación Manitol
A.A.S 100 44.13 53.32 9.19 0.984 -- 0.946
A.A.S 500 57.88 54.87 -3.01 0.966 -- 0.926
Bayer 500 82.06 81.57 -0.49 0.988 0.998 --
Adiro 100 73.86 76.47 2.61 0.948 0.994 --
Adiro 300 73.28 70.91 -2.37 0.949 0.977 --
Aspirina C* 12.37 12.95 0.58 0.97 -- --
Dolmen* 14.71 16.44 1.73 0.951 -- --
Aspirine Nicholas
80.13 76.96 -3.17 0.963 0.997 --
Bioplak 250 71.84 71.34 -0.5 0.993 0.997 --
Bioplak 125 72.09 67.84 -4.25 0.986 0.994 --
Por otro lado, se podría esperar que en las muestras, de menor concentración de ASA
(comprimidos efervescentes) presentaran unos peores resultados predictivos. Pero el
uso de todos los espectros puros, tanto en estimaciones iniciales como aumentando la
matriz desdoblada de datos, permitió la obtención de muy buenos resultados.
Al haberse aplicado la restricción de closure y que en estas muestras el principio activo
no es el compuesto espectral más relevante, la descomposición de la imagen podría no
haber sido satisfactoria.
A pesar de utilizar los espectros puros de todos los componentes en el análisis de
Dolmen y Aspirina C, los valores del coeficiente de correlación entre perfil espectral y
espectro puro, no fueron tan buenos, y en algún caso se alejan bastante de 1. Para
Aspirina C los coeficientes de correlación obtenidos fueron 0.97 para ASA, 0.851 para
ácido cítrico, 0.957 de ácido ascórbico y 0.995 para carbonato. Para Dolmen los
RESULTADOS Y DISCUSIÓN
122
coeficientes obtenidos fueron 0.951 para ASA, 0.856 para el ácido ascórbico y 0.823
para carbonato. Sin embargo, a pesar no obtener unos buenos coeficientes de
correlación, la predicción de la concentración de ASA para dichos comprimidos es
buena, con valores cercanos a los nominales.
Los mapas de concentración para ASA de todas las marcas comerciales se muestran en
la figura 5.9. Como se ha descrito anteriormente para Aspirine de Nicholas 500 mg, la
primera impresión de estos mapas, podría ser engañosa, debido a la escala de color de
éstos.
Figura 5.9. Mapas de concentración de ASA obtenidos usando MCR-ALS aumentado.
Para una mejor interpretación de los mapas de concentración, se ha representado el
histograma de cada mapa de concentración de ASA en la figura 5.10. Idealmente, se
esperaría un histograma cuyos valores fueron alrededor de los valores de predicción y
RESULTADOS Y DISCUSIÓN
123
con una variación estrecha, lo que implica que todos los píxeles de la imagen contienen
una cantidad de ASA muy próxima entre ellos.
Figura 5.10. Histogramas de la distribución de ASA en la superficie de los diferentes
comprimidos.
Mirando los histogramas de forma detenida, es posible visualizar los comprimidos con
una mejor distribución de ASA. Los comprimidos con una distribución de ASA más
estrecha son: Aspirina C, Dolmen, Bayer 500 (de acuerdo a la conclusión de la
anterior). Si se comparan a éstas 3 muestras, los histogramas de AAS 100 y 500
presentan la variación de concentración más amplia, a pesar de ello, la distribución de
principio activo, esta cerca de una distribución normal. Para las otras muestras, tanto la
inspección visual de los mapas de concentración como la representación de
histogramas confirman una distribución regular para la ASA en la superficie.
RESULTADOS Y DISCUSIÓN
124
5.2.2 ESTUDIO DE UNIFORMIDAD DE CONTENIDO EN COMPRIMIDOS
COMERCIALES DE ÁCIDO ACETILSALICÍLICO (ASA)
Se ha ampliado el estudio sobre los comprimidos comerciales de aspirina,
determinando el contenido de ASA a través del registro de 10 comprimidos en una
única imagen, para determinar otros parámetros como la homogeneidad de contenido
o el valor medio de lote.
Como ya se ha indicado en el estudio anterior, se desconoce la composición completa de
la formulación de los comprimidos usados, la única información que se ha usado en el
estudio ha sido la obtenida en la guía Vademecum. En dicha guía se indica que el
excipiente mayoritario en los cuatro casos es la celulosa microcristalina.
En la tabla 5.13 se recogen las principales características de cada tipo de comprimidos.
Tabla 5.13. Descripción de los 4 tipos de comprimidos comerciales de ASA analizados.
Marca comercial
Cont. nominal
(mg)
Diámetro (mm)
Peso promedio del comprimido
(g) *
Concentración calculada
(%)*
Excipiente mayoritario
Bayer 500 500 12.0 0.6037 82.82
Adiro 100 100 7.2 0.1368 73.13
Bioplak 250 250 7.0 0.3427 73.02
Bioplak 125 125 10.0 0.1751 71.41
MCC
* 10 comprimidos por marca comercial
A cada una de las diferentes imágenes de los comprimidos se le han aplicado los
algoritmos de calibración MCR-ALS y Isys-PLS1 (indicados en la introducción)
considerando las características de las muestras y la información disponible. Se han
obtenido las imágenes de ASA y MCC en polvo con la misma cámara y estos espectros
se han tomado como estimaciones iniciales en los dos algoritmos de cálculo usados. Se
han ensayados diferentes pretratamientos espectrales, siendo la combinación de SNV y
Savitzky-Golay smoothing con una ventana de 7 puntos es con el que se obtienen los
mejores resultados para ambos algoritmos.
RESULTADOS Y DISCUSIÓN
125
La cuantificación de API se ha realizado de dos formas distintas: Aplicando los
algoritmos cuantitativos a la imagen completa de 10 comprimidos (determinación de
valor medio de lote) o seleccionando la parte de la imagen correspondiente a cada
comprimido individual (estudio de la uniformidad de contenido).
La estructura de las imágenes se muestra en la figura 5.11, con 10 comprimidos
distribuidos espacialmente; la imagen hiperespectral contiene también tanto los
espectros de los comprimidos como el espectro del fondo. Este fondo puede afectar al
cálculo de las concentraciones y por ello se ha procedido a su eliminación. La
eliminación del fondo se realiza con el software Isys 5.0 que deja la imagen lista para la
aplicación de Isys-PLS1. Para la aplicación de MCR-ALS es necesario obtener primero
la matriz desdoblada de la imagen hiperespectral únicamente de los espectros de los
comprimidos, mediante la aplicación de una rutina de Matlab [95].
En los cálculos con el algoritmo MCR-ALS se han aplicado las restricciones de no
negatividad en la concentración y de closure. A pesar de que los comprimidos están
constituidos por diferentes componentes, la restricción de closure ha sido aplicada
considerando únicamente los componentes API (ASA) y el excipiente mayoritario
(MCC). No se ha obtenido un buen ajuste con la matriz desdoblada original por lo que
se ha aumentado con 50 espectros de ambos analitos, ASA y MCC; con ello se ha
obtenido un mejor ajuste y una determinación exacta de los dos componentes.
Para aplicar Isys-PLS1, a las imágenes hiperespectrales, ha creado una librería de
espectros con las imágenes de ASA y MCC puros, seleccionando el área central de cada
una de las imágenes que contiene aproximadamente 100x100 píxeles. Con esta librería
se crea el modelo Isys-PLS1, usando diferente número de factores PLS, entre 4 y 8
factores dependiendo del analito a cuantificar, y posteriormente el modelo construido
se aplica a las imágenes hiperespectrales. Se obtienen mapas de concentración donde la
[95] http://www.models.life.ku.dk/~jose/
RESULTADOS Y DISCUSIÓN
126
intensidad de cada píxel, se determina por el grado de semejanza (escalado de 0 a 1)
entre el espectro de ese píxel y los espectros de referencia. Un valor de 0 significa que el
componente no esta presente y un valor de puntuación de 1 significa que el componente
esta presente al 100 % en dicho píxel. Para las imágenes presentadas, el color rojo
significa una mayor concentración de componente.
Después de aplicar estos algoritmos, se ha calculado el valor medio de 10 comprimidos
de un lote: los valores obtenidos aplicando los dos algoritmos se muestran en la tabla
5.13. Los valores medios calculados con Isys-PLS1 y MCR-ALS dan resultados muy
similares a pesar de que para MCR-ALS son ligeramente más cercanos a los valores
nominales. Sólo los valores calculados para Bioplak 125 muestran discrepancias, pero
éstas no superan el 2%.
Tabla 5.13. Resultados de cuantificación de valor medio de ASA de una imagen de un lote de 10
comprimidos para MCR-ALS y Isys-PLS1.
Comprimidos Concentración nominal (%)
Valor medio de lote con
Isys-PLS1
Valor medio de lote con
MCR-ALS
Bayer 500 82.8 83.6 82.7
Adiro 100 73.1 73.5 73.9
Bioplak 250 73.0 73.8 72.7
Bioplak 125 71.4 73.4 69.4
Una alternativa para determinar la concentración es mediante el análisis individual de
comprimidos cuyas concentraciones han sido calculadas seleccionando y recortando
cada una de los comprimidos y eliminando el fondo. La eliminación del fondo de cada
imagen recortada se ha echo de la misma forma que para el análisis global de 10
comprimidos, que se ha explicado anteriormente.
La aplicación de ambos modelos a comprimidos comerciales de las 4 marcas
comerciales distintas ha proporcionado resultados similares (ver tabla 5.14); no
obstante, los valores de rango de concentración calculados ─y sus respectivas
desviaciones estándar─ son más estrechos con Isys-PLS1 que con MCR-ALS.
RESULTADOS Y DISCUSIÓN
127
Los valores promedio proporcionados por ambos algoritmos están dentro del
intervalo de confianza del valor nominal usado como referencia (± 5%).
El tamaño de los comprimidos es un parámetro importante para el enfoque de los 10
comprimidos en el campo visual de la cámara hiperespectral; tamaños de medida
distintos requieren distancia entre muestra y lentes distintas para obtener una imagen
correctamente enfocada. Esta configuración óptica puede afectar a la intensidad de la
luz incidente en los 10 comprimidos, pudiendo afectar a la calidad de las imágenes y
por consiguiente a su cuantificación.
Distribución de ASA y MCC en los comprimidos
En la figura 5.11 se muestra el mapa de concentración calculado con MCR-ALS para
ASA y MCC juntamente con los histogramas de un comprimido de aspirina Bayer 500,
tomado de la imagen de 10 comprimidos. Se observa una homogénea distribución de
ambos componentes en toda la imagen y no se aprecian en el comprimido zonas con
agregados de API o del excipiente mayoritario. Asimismo, los histogramas, tanto para
ASA como para MCC, muestran una muy estrecha distribución de los valores de
concentración y con un máximo en la distribución próximo al valor medio de
predicción; todos estos datos son indicativos de la homogénea distribución del ASA en
el comprimido.
Sin embargo, la figura muestra deficiencias en la distribución en los bordes de la
imagen, que se atribuyen a la deficiente iluminación de la muestra de 10 comprimidos,
y a su vez son el origen de una imagen hiperespectral deficiente con una mala
resolución en los contornos de los comprimidos cuando se aplican los algoritmos de
cuantificación.
RESULTADOS Y DISCUSIÓN
128
Figura 5.11. Mapas de concentración y histogramas de ASA y MCC para un comprimido de una
imagen de 10 comprimidos.
Este efecto no se observa en las imágenes hiperespectrales de comprimidos
individuales, como muestra en la figura 5.12, obtenidas en mejores condiciones de
resolución e iluminación; este hecho es muy importante en las imágenes de 10
comprimidos grandes (comprimidos de Bayer 500 o Bioplak 250) menos importantes
en comprimidos pequeños(comprimidos de Adiro 100 o Bioplak 125).
Este fenómeno, se elimina mediante la utilización de un instrumento con una mejor
resolución espacial y una iluminación más homogénea del objeto.
Figura 5.12. Mapa de concentración y histograma de ASA para un comprimido registrado
individualmente.
Para Isys-PLS1, se han obtenido mapas de concentración, prácticamente idénticos a los
obtenidos con MCR-ALS, respecto a la distribución espacial de ASA y de MCC en el
50 150 250100 200 300
50
150
250
100
200
Píxeles
Píx
eles
84
80
76
82
78
86
50 150 250100 200 300
50
150
250
100
200
Píxeles
Píx
eles
84
80
76
82
78
86
55 65 7560 70 80 85 90 95
2500
1500
500
2000
1000
3000
Intensidad
Núm
ero
de P
íxel
es
55 65 7560 70 80 85 90 95
2500
1500
500
2000
1000
3000
Intensidad
Núm
ero
de P
íxel
es
50 150 250100 200 300
50
150
250
100
200
Píxeles
Píx
eles
84
80
76
82
78
86
50 150 250100 200 300
50
150
250
100
200
Píxeles
Píx
eles
84
80
76
82
78
86
55 65 7560 70 80 85 90 95
2500
1500
500
2000
1000
3000
Intensidad
Núm
ero
de P
íxel
es
55 65 7560 70 80 85 90 95
2500
1500
500
2000
1000
3000
Intensidad
Núm
ero
de P
íxel
es
RESULTADOS Y DISCUSIÓN
129
comprimido y los histogramas presentan una distribución de valores muy estrecha y
con un máximo cercano al valor medio de predicción.
Uniformidad de contenido
El estudio de homogeneidad de contenido se ha realizado, siguiendo las normas de la
Farmacopea Europea, utilizando la imagen de los 10 comprimidos de cada marca
comercial.
Los resultados obtenidos en la determinación de cada comprimido aplicando MCR-ALS
y Isys-PLS1 de una misma marca se muestran en la tabla 5.14. En dicha tabla se
muestra para Isys PLS1 y MCR-ALS, el valor promedio de ASA de los 10 comprimidos
aplicando el algoritmo de calculo a cada comprimido individualmente, el rango de
valores de concentración calculados para los comprimidos individuales, la desviación
estándar de las concentraciones y el valor del Acceptance Value definido por la
farmacopea europea.
Tabla 5.14. Resultados de MCR-ALS para el test de uniformidad de contenido (10 comprimidos analizados individualmente).
Isys-PLS1 MCR-ALS
Marca comercial
Valor Medio
Rango de
valores
Desv. Estándar
Acceptance value
Valor Medio
Rango de
valores
Desv. Estándar
Acceptance value
Bayer 500 83.3 84.8-82.1 0.8 1.1 82.4 84.0-79.3 1.2 1.5
Adiro 100 73.5 77.1-70.3 2.0 2.6 72.6 75.6-68.1 2.9 5.1
Bioplak 250 73.7 76.1-71.2 1.9 4.7 72.7 77.9-68.7 3.3 2.3
Bioplak 125 72.6 74.9-69.4 2.2 8.8 69.7 74.7-67.2 2.3 13.5
El A.V. límite para n=10 es 15.
La European Pharmacopoeia para uniformidad de contenido, define un Acceptance
Value (AV) computado y comparado con un limite para el rango de aceptación [96]. El
AV se calcula aplicando la ecuación siguiente:
AV=|M − X |+k·s (31)
[96] European Council (Ed.), European Pharmacopeia 6th edition, 2008b. Uniformity of dosage units. Vol 1 (2008) Ch. 2.9.40, pp.327–330.
RESULTADOS Y DISCUSIÓN
130
Donde M es el valor de referencia, X el valor medio de los comprimidos individuales, k
es una constante (k=2.4 para n=10) y s la desviación estándar.
El requisito de uniformidad contenido se cumple si el valor de AV de las 10 primeras
unidades de dosificación tomadas es igual o inferior a 15.
Los resultados obtenidos para 4 marcas se muestran en la tabla 5.14; todos los valores
de AV calculados son inferiores a 15 lo que indica el cumplimiento de los requisitos de
la farmacopea a pesar de que para Bioplak 125 las concentraciones calculadas con
MCR-ALS se obtiene un acceptance value (A.V.) un tanto elevado (13.5) aunque no
supera el valor limite de 15.
A pesar de obtenerse unos resultados ligeramente mejores usando Isys-PLS1, el estudio
realizado no es lo suficientemente amplio como para decir que algoritmo es mejor para
la cuantificación. Con ambos algoritmos, se obtienen unos resultados de similar valor
tanto en los valores de predicción, como en los valores de desviación estándar y de A.V.
Los resultados indican que una sola imagen puede usarse para certificar la
homogeneidad de contenido de un lote.
RESULTADOS Y DISCUSIÓN
131
5.2.3 ESTUDIO CUANTITATIVO Y DE LA DISTRIBUCIÓN DE API,
EXCIPIENTES Y GROSOR DE RECUBRIMIENTO DE COMPRIMIDOS
La experiencia con los comprimidos comerciales de ASA, en los dos estudios anteriores
en el que se ha cuantificado el API, ha sido aplicada a un fármaco en proceso de
desarrollo.
El objetivo de este estudio consiste entonces en establecer un método cuantitativo para
la determinación de los distintos componentes así como su distribución en la superficie
de un comprimido farmacéutico a partir de los datos obtenidos mediante NIR-CI.
Los comprimidos estudiados están compuestos de un API y 5 excipientes, 2 de los
cuales son mayoritarios y el resto minoritarios. Por razones de confidencialidad estos
nombres no serán citados en el estudio.
Este estudio se ha realizado con comprimidos sin lacar comprimidos de producción y
comprimidos lacados de diferente grosor de laca.
En la figura 5.13a se muestran los espectros de los distintos componentes puros (API y
sus 5 excipientes). Se observan diferencias claras entre la mayoría de los espectros de
los distintos componentes puros. Estas diferencias, quedan confirmadas por los valores
de los coeficientes de correlación entre pares de componentes puros mostrados en la
Tabla 5.15.
RESULTADOS Y DISCUSIÓN
132
Figura. 5.13. Espectros NIR medios obtenidos a partir de los espectros de todos los píxeles de
una CI. a) Comparación de los espectros NIR medios de API y los distintos excipientes puros,
desplazados para evitar superposición; b) Comparación de los espectros NIR medios de un
comprimido sin recubrir y un comprimido de producción.
0,00
0,20
0,40
0,60
0,80
1,00
1,20
1200 1400 1600 1800 2000 2200 2400
Longitud de onda (nm.)
Un
idad
es d
e ab
sorb
anci
a
Núcleo
Lacado
-0,10
0,10
0,30
0,50
0,70
0,90
1,10
1200 1400 1600 1800 2000 2200 2400
Longitud de onda (nm.)
Un
idad
es d
e ab
sorb
anci
a
API Excipiente #1
Excipiente #2 Excipiente #3
Excipiente #4 Excipiente #5
a)
b)
0,00
0,20
0,40
0,60
0,80
1,00
1,20
1200 1400 1600 1800 2000 2200 2400
Longitud de onda (nm.)
Un
idad
es d
e ab
sorb
anci
a
Núcleo
Lacado
-0,10
0,10
0,30
0,50
0,70
0,90
1,10
1200 1400 1600 1800 2000 2200 2400
Longitud de onda (nm.)
Un
idad
es d
e ab
sorb
anci
a
API Excipiente #1
Excipiente #2 Excipiente #3
Excipiente #4 Excipiente #5
a)
b)
-0,10
0,10
0,30
0,50
0,70
0,90
1,10
1200 1400 1600 1800 2000 2200 2400
Longitud de onda (nm.)
Un
idad
es d
e ab
sorb
anci
a
API Excipiente #1
Excipiente #2 Excipiente #3
Excipiente #4 Excipiente #5
a)
b)
RESULTADOS Y DISCUSIÓN
133
Tabla 5.15. Coeficientes de correlación entre los espectros NIR medios de los distintos
componentes puros de los comprimidos (API y excipientes). Los espectros NIR medios se han
obtenido a partir de los espectros de todos los píxeles de una imagen del comprimido.
Coeficientes de correlación
API E #1 E #2 E #3 E #4 E #5
API 1.000
E #1 0.810 1.000
E #2 0.621 0.601 1.000
E #3 0.693 0.603 0.849 1.000
E #4 0.640 0.588 0.984 0.903 1.000
E #5 0.823 0.693 0.669 0.847 0.740 1.000
Destaca el elevado coeficiente de correlación entre los espectros de los excipientes #2 y
#4 (0.984) lo cual implicará un mayor esfuerzo en el desarrollo de los modelos de
calibración de estos dos componentes dada su mayor semejanza espectral.
En la figura 5.13b, se comparan los espectros promedio de un área registrados de un
comprimido sin recubrir y un comprimido lacado. Se observa como las diferencias
espectrales son mínimas, ya que la contribución espectral introducida por la capa de
lacado suele ser baja. En este caso, la laca provoca un ligero aumento de la línea base
del espectro medio.
Cuantificación de API y excipientes
Comprimidos sin recubrir
Se han registrado, tal y como se explica en el capítulo de metodología, 6 imágenes de
cada núcleo: 4 de cada una de las caras exteriores (A-D) y 2 de las caras interiores (E-F)
obtenidas por partición de los comprimidos tal como se ha mostrado en la figura 4.6a.
Se ha estudiado la construcción de un modelo para la determinación de la
concentración del principio activo y de los 5 excipientes que componen el comprimido
sin recubrir, y para ello se han ensayado modelos de calibración Isys-PLS1 para cada
RESULTADOS Y DISCUSIÓN
134
uno de los analitos que componen el comprimido sin recubrir. Para la construcción de
los modelos se ha creado una librería con los distintos componentes puros a cuantificar
y, a continuación, se ha aplicado el algoritmo Isys-PLS1. Se han empleado un número
de factores comprendido entre 3 y 8, según el analito a modelar. Los valores de
concentración calculados para cada una de las caras de un comprimido sin recubrir se
observan en la tabla 5.16.
En todas las caras de los comprimidos sin recubrir analizados, la concentración
predicha por el modelo, es muy próxima al valor nominal, tanto para el API y los
excipientes mayoritarios, como para los excipientes minoritarios, mostrando un valor
muy pequeño de desviación estándar en todos los casos, indicativo de la buena
homogeneidad de la mezcla de los componentes. Destaca el hecho que la suma de los
porcentajes de los componentes para cada cara, se aproxima al 100% en todos los casos,
lo cual es un indicativo de la correcta capacidad predictiva de los modelos de
calibración. Sin embargo, se detectan pequeñas diferencias de composición entre las
caras del comprimido para algunos de los componentes: así, la concentración de los dos
componentes mayoritarios (API y excipiente #1) en las caras interiores (E y F) del
comprimido muestran desviaciones respecto a los valores nominales y del resto de las
caras, descenso notable del contenido en API y, en menor grado, del de excipiente #2 y
un aumento del contenido en excipiente #1, que también se refleja en un aumento en el
valor de la desviación estándar. Este comportamiento se repite en los distintos
comprimidos sin recubrir analizados. Este comportamiento se puede explicar por la
mayor rugosidad superficial que presenta la superficie resultante del corte que a su vez
afecta a la calidad de la imagen obtenida y también a su cuantificación.
RESULTADOS Y DISCUSIÓN
135
Tabla 5.16. Concentraciones (en %) de API y excipientes de las diferentes caras de un mismo
comprimido sin recubrir calculadas mediante modelos de calibración Isys-PLS1.
Componentes del comprimido sin recubrir (%)
API E #1 E #2 E #3 E #4 E #5 Suma
Cara A 35.51 38.93 20.15 1.97 1.48 1.47 99.51
Cara B 35.45 39.46 21.12 1.98 1.48 1.51 101.00
Cara C 37.11 38.45 19.69 1.99 1.53 1.53 100.30
Cara D 37.45 40.38 20.14 1.95 1.53 1.51 102.96
Cara E 31.66 44.16 18.62 1.95 1.48 1.51 99.38
Cara F 31.47 43.38 19.31 1.97 1.55 1.53 99.21
Promedio 34.78 40.79 19.84 1.97 1.51 1.51 100.40
Desv. Std 2.62 2.41 0.85 0.02 0.03 0.02 5.95
En la figura 5.14, se pueden observar los mapas de concentración de los distintos
componentes para una de las caras exteriores de un comprimido sin recubrir, obtenidos
con el modelo Isys-PLS1. Como se puede ver, la distribución del excipiente #2 y del API
son muy similares, con áreas de mayor concentración localizadas en las mismas zonas
de la superficie del comprimido. Por el contrario, las áreas de mayor concentración del
excipiente #1 son complementarias a las del API. Esta distribución se explica por que el
API y el excipiente #2 son mezclados en una primera etapa y después se añaden el resto
de excipientes. Por lo que respecta a los excipientes minoritarios, el reparto es uniforme
en toda la imagen. La distribución de API y excipientes, observada para el resto de
caras del mismo comprimido sin recubrir y para otros comprimidos sin recubrir
analizados, no presenta diferencias significativas respecto a la cara descrita
anteriormente y sigue las mismas tendencias que ésta. Este comportamiento se cumple
tanto para las caras externas, como para las internas, como se puede observar en la
tabla 5.16. En la misma figura 5.14 se muestran también los histogramas para cada uno
de los componentes del comprimido sin recubrir.
RESULTADOS Y DISCUSIÓN
136
API (35%) Excipiente #2 (20%)Excipiente #1 (40%)
Excipiente #5 (1.5%)Excipiente #4 (1.5%)Excipiente #3 (2%)
Figura. 5.14. Mapas de concentración de API y excipientes para la cara A (exterior) de un
comprimido sin recubrir, obtenidos mediante modelos de calibración Isys-PLS1, y sus
correspondientes histogramas. Entre paréntesis se indica la concentración nominal de cada
componente.
Para los excipientes minoritarios, la distribución de los histogramas no se aleja de la
normalidad, ya que estos son bastante simétricos y con bases estrechas, lo que reduce la
importancia de las heterogeneidades observadas en los mapas de concentración. En
cambio, los histogramas para los excipientes mayoritarios presentan bases más anchas,
hecho indicativo de la presencia de zonas del comprimido con valores de concentración
alejadas del valor nominal (central). Los histogramas del API y del excipiente #2
presentan una forma muy similar, con colas notables a la izquierda, hecho que implica
abundancia de píxeles con concentraciones inferiores a las nominales; mientras que las
RESULTADOS Y DISCUSIÓN
137
colas en el histograma del excipiente #1 son a la derecha, indicando un número mayor
de píxeles con valores de concentración significativamente superiores a las esperadas. A
pesar de ello, las distribuciones no se alejaban significativamente de la normalidad por
lo que se puede deducir que la distribución de API y excipientes en los comprimidos es
homogénea para todos los componentes.
Comprimidos lacados
Se han registrado los espectros de los comprimidos recubiertos tal y como se explica en
el capítulo de metodología experimental. Se registran comprimidos de distinto grosor
de recubrimiento, tomando 2 imágenes de cada comprimido, pertenecientes a dos caras
exteriores opuestas. Cada imagen incluye 2 caras homólogas de 2 comprimidos de
iguales características (mismo grosor de lacado), tal como se ha mostrado en la figura
4.6b. En el caso de las muestras de producción se han registrado sólo las 4 caras
exteriores de los comprimidos, denominadas de la misma forma que en los
comprimidos sin recubrir (A-D).
La determinación de API y excipientes también se ha realizado en los comprimidos con
distintos grosores de lacado. Para ello se han construido modelos de calibración Isys-
PLS1, con un número de factores que oscila entre 3 y 6 dependiendo del analito a
modelar y del grosor de recubrimiento de la muestra. Los resultados obtenidos para
dos caras, A y B, de un mismo comprimido, pero con distintos espesores de
recubrimiento se muestran en la tabla 5.17. Estos resultados corresponden a la media
de los valores obtenidos para los dos comprimidos de una misma imagen (comprimidos
con igual porcentaje de recubrimiento). En la tabla 5.17 no se han incluido los
resultados de los componentes minoritarios porque presentan desviaciones
importantes respecto a los valores de referencia (para comprimidos lacados de 50% a
300%). Para los tres componentes mayoritarios, los porcentajes calculados son muy
próximos a los valores nominales (tabla 4.2) y, siguiendo la misma tendencia que estos,
disminuyen gradualmente con el aumento del grosor del lacado. Es evidente que las
RESULTADOS Y DISCUSIÓN
138
desviaciones respecto los valores de referencia aumentan notablemente en los
comprimidos con mayor grosor de recubrimiento (200 y 300%) y, sobretodo, en el caso
del excipiente #2, el menos abundante de los tres.
De estos resultados se puede concluir que las desviaciones observadas en los cálculos
de concentración son debidas principalmente al recubrimiento de laca (coating), que
afecta de manera importante a la determinación de la concentración en el caso de
componentes minoritarios y, en menor grado, a la de los componentes mayoritarios.
Tabla 5.17. Concentraciones (en %) de API y los dos excipientes mayoritarios de
comprimidos con diferentes porcentajes de recubrimiento, calculadas mediante
modelos de calibración Isys-PLS1.
Componentes del comprimido (% w/w) Grosor de
laca (%) Cara del
comprimido API E #1 E #2
A 35.25 40.74 20.20 0%
B 35.67 39.46 21.34
A 35.85 40.30 19.67 50%
B 35.31 40.27 20.36
A 34.56 40.80 20.79 100%
B 35.20 40.18 21.64
A 33.15 39.15 17.95 200%
B 32.95 42.40 15.31
A 30.85 38.51 12.65 300%
B 29.65 39.78 14.03
Cuantificación del coating
Determinar el espesor de la capa de laca de recubrimiento, es un parámetro importante
ya que puede afectar a la velocidad de disolución y también a la calidad de los
resultados de cuantificación de los diferentes componentes. Para ello se ha construido
un modelo de calibración PLS1 utilizando el espectro promedio de las caras de cada
RESULTADOS Y DISCUSIÓN
139
comprimido frente al tiempo de recubrimiento. Al recubrimiento nominal se le ha
asignado el valor 100 y los recubrimientos modificados han sido del 50%, 200% y
300% del grosor nominal.
Se han utilizado 10 imágenes de comprimidos lacados con diferentes grosores de
recubrimiento (con dos comprimidos cada una). Se han promediado los espectros de
estas imágenes, dando lugar a un total de 4 espectros por nivel de recubrimiento (2
comprimidos por imagen y 2 caras por comprimido). De los 20 espectros finales, 3 se
han descartado como outliers, 12 han servido para construir el modelo de calibración y
5 para validarlo. A cada espectro promedio del conjunto de calibración se le ha
asignado el valor nominal de concentración de recubrimiento del comprimido: 0, 50,
100, 200 o 300%. Estos porcentajes de recubrimiento han sido determinados por el
aumento de peso de los comprimidos después de ser recubiertos.
Para la construcción del modelo PLS1, se han ensayado distintos pretratamientos
(derivadas de Savitzky-Golay, SNV) y rangos espectrales, con el fin de conseguir el
modelo que mejor se ajusta al conjunto de validación. Los mejores resultados se han
obtenido pretratando los datos con SNV y trabajando con el rango espectral completo,
con un modelo que solamente necesita un factor para explicar el 99.3% de la varianza.
Este modelo PLS1, descrito en la tabla 5.18, es el que se aplica a las muestras de
producción.
RESULTADOS Y DISCUSIÓN
140
Tabla 5.18. Características del modelo PLS1 creado para la cuantificación del recubrimiento de
comprimidos.
Características del modelo PLS1
Número de muestras incluidas en el modelo 12
Rango espectral (nm) 1200-2500
Pretratamiento espectral SNV
Factores 1
Varianza-Y (%) 99.31
Número de muestras usadas para la validación 5
RMSEP 14.04
RSEP (%) 8.32
En la figura 5.15, se muestran los mapas de concentración de recubrimiento para las
imágenes de las cuatro caras exteriores de un mismo comprimido de producción
(comprimido 1), a las que se les ha aplicado el modelo PLS descrito anteriormente.
De la comparación de los cuatro mapas de concentración se puede deducir que la
distribución del material de recubrimiento es bastante homogénea en todas las caras,
aunque se observan puntos dónde la concentración predicha es superior al resto de la
superficie. Este efecto puede ser debido a la presencia de agregados de laca producidos
en el mismo proceso de recubrimiento. En la misma figura 5.15 se muestran también
los histogramas para facilitar el análisis de la distribución de la capa de lacado. A pesar
de presentar bases anchas y con pequeñas colas a ambos lados, en todos los casos, los
gráficos se acercan a la normalidad y mantienen la simetría.
RESULTADOS Y DISCUSIÓN
141
Cara A
Recubrimiento medio = 108.15%
Cara B
Recubrimiento medio = 98.86%
Cara D
Recubrimiento medio = 92.74%
Cara C
Recubrimiento medio = 78.81%
Recubrimiento medio (4 caras) = 94.64%
Figura. 5.15. Mapas de concentración de recubrimiento (%) para las cuatro caras de un
comprimido de producción, con los valores medios obtenidos mediante el modelo de calibración
PLS1 y sus correspondientes histogramas.
RESULTADOS Y DISCUSIÓN
142
Tabla 5.19. Concentraciones (en %) de recubrimiento para las distintas caras de dos
comprimidos (1 y 2) de producción, calculadas mediante modelos de calibración PLS1.
Recubrimiento promedio de laca (%)
Comprimido 1 Comprimido 2
Cara A 108.15 113.84
Cara B 98.86 113.83
Cara C 78.81 107.94
Cara D 92.74 118.73
Promedio 94.64 113.58
Los valores medios de recubrimiento para cada una de las cuatro caras de los
comprimidos de producción 1 y 2, obtenidos mediante el mismo modelo PLS1 descrito
arriba, se muestran en la tabla 5.19. Tanto para el comprimido 1 (mostrado en la figura
5.15), como para el 2 se observan diferencias en el contenido de laca de las diferentes
caras de hasta el 10% respecto el valor teórico, pero realizando el promedio de los
valores de las 4 caras del comprimido, se obtienen valores cercanos a los nominales
para todas las muestras estudiadas.
CONCLUSIONES
143
6. CONCLUSIONES
CONCLUSIONES
144
CONCLUSIONES
145
6. CONCLUSIONES
Se han propuesto nuevas estrategias para el desarrollo de métodos de análisis en la
industria química y farmacéutica, aplicando espectroscopía NIR, NIR-CI y técnicas
quimiométricas multivariables i univariables.
De los estudios realizados se extraen las siguientes conclusiones:
1) Determinación de parámetros de control de un proceso de fabricación de resinas
poliéster
Se demuestra que la espectroscopia NIR es una alternativa a las técnicas
analíticas convencionales para el control industrial de la reacción de
condensación para la producción de resinas de poliéster. Los modelos PLS
desarrollados permiten determinar correctamente los parámetros utilizados en
el control del proceso: índice de ácido y de hidroxilo.
Los modelos de calibración permiten realizar el control de los parámetros
relevantes del proceso, que incluyen desde la carga de materias primas en el
reactor (indicando la conveniencia/necesidad de corregir esta carga añadiendo
ácidos o glicoles), de las primeras etapas del proceso (obteniendo información
fiable de la evolución del mismo) hasta el final del mismo asegurando la calidad
final de la resina.
Se ha demostrado la posibilidad de transferir calibraciones entre instrumentos
utilizando un número reducido de muestras registradas en los dos
instrumentos; los modelos de calibración construidos en uno de ellos se
pueden aplicar, sin una perdida significativa de capacidad predictiva respecto a
los modelos originales, en el otro instrumento con el consiguiente ahorro en
tiempo, esfuerzo y coste.
CONCLUSIONES
146
2) Determinación de la composición a lo largo de las etapas de producción de un
fármaco.
Se propone una nueva metodología de preparación de modelos de calibración
basada en la utilización del coeficiente de correlación (CC) como la variable a
modelar. La metodología propuesta proporciona un modelo de calibración
univariable, lo que supone una importante ventaja frente a los modelos
multivariables en cuanto a simplicidad y facilidad de preparación; sólo es
necesario utilizar una hoja de cálculo para la construcción del modelo.
El coeficiente de correlación, en ausencia de interacciones entre los componentes
de la muestra, no es afectado por propiedades físicas, tales como el tamaño de
partícula o la presión de compactación de los comprimidos, con lo que se
elimina su influencia en los modelos de calibración. Por ello un único modelo es
válido para la predicción de muestras sometidas a diferentes tratamientos
físicos, lo que simplifica la construcción de los modelos ya que no es necesario
usar muestras del mismo tipo que las que se van a predecir en la construcción
de los modelos; esta es una exigencia de los modelos multivariables.
Sin embargo esta metodología presenta algunas limitaciones que limitan la
aplicación universal a cualquier tipo de muestras: requiere disponer del
espectro puro de cada compuesto a determinar -que por lo general no
representa un problema en análisis de productos farmacéuticos-, una alta
concentración de API a fin de garantizar diferencias suficientes en los valores de
CC entre las muestras del rango de concentraciones de API seleccionado y un
espectro del analito tan diferente como sea posible del espectro de la matriz
CONCLUSIONES
147
(placebo). Los modelos son sensibles a pequeñas variaciones en el registro de
los espectros.
La metodología propuesta puede ser de gran utilidad en el campo farmacéutico
ya que algunas de sus restricciones son superables permitiendo con un único
modelo el control de API en diferentes etapas del proceso de producción.
3) Aplicación de las técnicas de imagen hiperespectral (NIR-CI) al análisis de
comprimidos comerciales de ácido acetilsalicílico (ASA) y comprimidos de un fármaco
en proceso de desarrollo.
Se ha demostrado la capacidad de obtener información cualitativa y cuantitativa
de comprimidos comerciales de aspirina mediante técnicas de imagen química
sin necesidad de información química de referencia. Los modelos construidos
con el algoritmo MCR-ALS y su versión aumentada (que aumenta la calidad de
los resultados) permiten el cálculo de la concentración en cada uno de los
pixeles de la imagen y consiguientemente de la concentración media y de la
distribución de API.
La técnica de NIR-CI no altera la muestra, tiene un tiempo de análisis corto y
ofrece unos resultados prometedores; todo ello la convierte de gran importancia
en el inmediato futuro para el control de calidad de los fármacos acabados.
El estudio comparativo de los algoritmos MCR-ALS y Isys-PLS1 demuestra que
ambos proporcionan resultados semejantes (los valores de Isys-PLS1 son
ligeramente mejores que los aportados por MCR-ALS) en cuanto a la calidad de
los resultados en la determinación de API y de los excipientes.
CONCLUSIONES
148
La información obtenida permite obtener imágenes de distribución de los
componentes en los comprimidos individuales y por tanto establecer la
homogeneidad de distribución; el histograma de los valores de las
concentraciones es un indicativo esencial para esta confirmación.
Una imagen única de 10 comprimidos permite, no solo determinar la
concentración de API de cada uno de ellos, sino también determinar la
uniformidad de contenido de un lote de producción siguiendo la normativa de la
European Pharmacopoeia; esto supone una gran ventaja en rapidez y
simplicidad frente a las técnicas convencionales.
Se ha evaluado la capacidad de la técnica del NIR-CI en el estudio y desarrollo
de nuevos fármacos facilitando la determinación de la composición de cada uno
de los componentes, la distribución de los mismos – con y sin recubrimiento-y
también la determinación del grosor y homogeneidad del recubrimiento.
También se ha demostrado la capacidad del algoritmo Isys-PLS1 para obtener
una información cuantitativa de calidad de imágenes hiperespectrales sin
necesidad de una calibración con valores de referencia, de API y todos los
excipientes (mayoritarios y minoritarios) así como establecer la distribución de
éstos.
Los estudios realizados demuestran el gran potencial de la técnica NIR-CI y de
las grandes posibilidades que ofrecen diferentes algoritmos de cálculo para
extraer información analítica de calidad sin necesidad de información analítica
de referencia y de la posibilidad de su aplicación en los ensayos at-line en el
control de procesos de producción en la industria farmacéutica.
CONCLUSIONS
149
6. CONCLUSIONS
New strategies for the development of analysis methods in the chemical and
pharmaceutical industries have been proposed based on conventional NIR
spectroscopy and NIR-CI in combination with univariate and multivariate chemometric
methods for treatment of spectral information.
From all the studies that have been done the following conclusions can be extracted:
1) Determination of parameters for controlling a manufacturing process of polyester
resins
It has been demonstrated that NIR spectroscopy is an alternative to
conventional analytical techniques for the industrial control of the condensation
reaction in the production of polyester resins. The developed PLS models can
effectively quantify the process control parameters: acid and hydroxyl indexes.
Calibration models allow the control of relevant parameters of the
manufacturing process, which include the loading of raw materials into the
reactor (eventually correct acids or glycols concentration), intermediate steps of
the process (obtaining reliable information) and the end (ensuring the final
quality of the resin).
It has been demonstrated the ability to transfer calibration models between
instruments using a small number of samples acquired in the two instruments;
the calibration models calculated for one instrument can be successfully applied
to the other with good predictive ability thereby saving time, effort and cost.
CONCLUSIONS
150
2) Determining the composition along the production steps of a drug.
A new methodology is proposed for the calculation of calibration models based
on the use of the correlation coefficient (CC) as the variable to be modelled. The
proposed methodology provides a univariate calibration model, which
represents a significant advantage over multivariate models in terms of
simplicity and easiness of preparation, being only necessary to use a
spreadsheet for model building.
The correlation coefficient, in the absence of interactions between components
of the sample, is not affected by physical properties such as particle size or
compaction pressure of the tablets, thereby eliminating their influence on the
calibration models. Therefore, one model is valid for the prediction of samples
subjected to different physical processes. It simplifies the construction of the
models because it is not necessary to use samples with the same physical
characteristics for calibration and prediction, which is a requirement of
multivariate models.
However, this methodology presents some limitations which do not allow its
universal application to all types of samples. It requires a) having the pure
spectrum of each compound to be determined (which is usually not a problem
in pharmaceutical analysis), b) high concentration of API to ensure sufficient
differences in the CC values between the samples in the selected range of
concentrations and a spectrum of the analyte as different as possible from the
spectrum of the matrix (placebo). The models are sensitive to small changes in
the spectra registration.
The proposed methodology may be useful in the pharmaceutical field as some of
their restrictions can be overcome, allowing the API monitoring in the different
stages of production with only one model.
CONCLUSIONS
151
3) Application of hyperspectral imaging (NIR-CI) to the analysis of commercial tablets
of acetylsalicylic acid (ASA) and tablet drugs in the development stage.
The capability to obtain qualitative and quantitative information from
commercial tablets of aspirin by chemical imaging techniques has been
demonstrated. The information has been obtained without any chemical
information used as reference. The model built with the MCR-ALS algorithm
and its augmented version (which improves the quality of results) allows the
quantification of API content in each pixel of the image and therefore the
average concentration and distribution of API.
NIR-CI does not destroy the sample, has a short analysis time and offers
promising results; all this makes NIR-CI a technique of great importance in the
immediate future for the quality control of final product.
The comparative study of algorithms of MCR-ALS and Isys-PLS1 shows that
both provide similar results (the calculated values provided by Isys-PLS1 are
slightly better than those provided by MCR-ALS) in terms of the quality of the
results in the determination of API and excipients.
This method allows us to obtain images of the distribution of the components in
individual tablets and, therefore, to establish the uniformity of distribution. The
histogram of the concentration values of each pixel is an essential indicator for
this confirmation.
A single image of 10 tablets can not only determine the concentration of API in
each of them, but also establish the content uniformity of a production batch,
according to the regulations of the European Pharmacopoeia. This is a great
advantage in terms of speed and simplicity compared with the conventional
techniques.
The ability of NIR-CI is evaluated for the study and development of new drugs,
facilitating the determination of each component of the tablet, and its
CONCLUSIONS
152
distribution - with and without coating- and also the determination of coating
thickness and uniformity.
It has also been demonstrated the ability of Isys-PLS1 algorithm to obtain
quantitative information with appropriate quality using hyperspectral images
without calibration reference values of API and all excipients (major and minor)
and to establish their distributions.
Our studies show the great potential of NIR-CI and the great possibilities
offered by different algorithms to extract analytical information without any
chemical information used as reference and the possibility of its application at-
line in the control of production processes in the pharmaceutical industry.
ARTÍCULOS
153
7. ARTÍCULOS
ARTÍCULOS
154
ARTÍCULOS
155
7. ARTÍCULOS
Este capítulo recoge los artículos publicados aceptados por la Comissió de Doctorat
para la presentación de la tesis como compendio de publicaciones.
1) Control production of polyester resins by NIR spectroscopy. M.Blanco,
J.Cruz, M. Armengol. Microchemical Journal 90 (2008) 118–123. Impact factor: 2.505
2)Development of a univariate calibration model for pharmaceutical
analysis based on NIR spectra. M.Blanco, J.Cruz, M. Bautista. Analytical and
bioanalytical chemistry 392 (2008) 1367–1372. Impact factor: 3.328
3)NIR-Chemical Imaging study of acetylsalicylic acid in commercial tablets.
J.Cruz, M. Bautista, J.M Amigo, M.Blanco Talanta 80 (2009) 473–478. Impact factor:
3.290
ARTÍCULOS
156
ARTICULOS
157
7.1)CONTROL PRODUCTION OF
POLYESTER RESINS BY NIR
SPECTROSCOPY
M.Blanco, J.Cruz, M. Armengol
Microchemical Journal 90 (2008) pp. 118–123
ARTICULOS
158
Microchemical Journal 90 (2008) 118–123
Contents lists available at ScienceDirect
Microchemical Journal
j ourna l homepage: www.e lsev ie r.com/ locate /microc
Control production of polyester resins by NIR spectroscopy
M. Blanco a,⁎, J. Cruz a, M. Armengol b
a Departament de Química, Unitat de Química Analítica, Universitat Autònoma de Barcelona, E-08193 Bellaterra, Barcelona, Spainb Powder Coatings Department, Cray Valley Ibérica, S.A. E-08470 Sant Celoni, Barcelona, Spain
⁎ Corresponding author. Tel./fax: +34 93 581 1367.E-mail address: [email protected] (M. Blanco).
0026-265X/$ – see front matter © 2008 Elsevier B.V. Adoi:10.1016/j.microc.2008.04.004
A B S T R A C T
A R T I C L E I N F OArticle history:
The control of the esterifica Received 25 March 2008Accepted 17 April 2008Available online 25 April 2008Keywords:NIR spectroscopyMultivariate calibrationPLSRAcid valueHydroxyl valueModel transfer
tion reaction for production of polyester saturated resins is followed usually bydetermination of the acid value (AV) and hydroxyl value (OHV).These parameters are determined bytitrimetry, but these methods are slow, intensity working and produce waste. In this paper an alternativemethodology is proposed, based in the construction of multivariate models on NIR spectroscopic data anddifferent models are constructed in order to apply to different steps of the production process. The ensuingmethodology provides models of good predictive ability and constitute an advantageous alternative toexisting titrimetric reference methods as regards expeditiousness and environmentally compatible. Themultivariate calibration models established were also used with a different instrument; to this end, thespectra recorded with the original equipment were subjected to Piecewise Direct Standardization (PDS) inorder to make them equivalent to those provided by the new equipment. Also, PLS calibration wasreproduced by using the same samples, spectral treatment, wavenumber range and number of factors as inthe original model, and the AV and OHV results thus obtained were similarly good.
© 2008 Elsevier B.V. All rights reserved.
1. Introduction
Polyester resins are polymers resulting from the condensation ofone or more dicarboxylic acids with one or more dialcohols and thecharacteristics and physical properties of which can be modified byaltering the reactant proportions; this allows a variety of resinsranging from solid to semi-fluid in texture that are insoluble in waterbut soluble in organic solvents to be obtained.
The earliest synthetic resins were obtained in the 1940s and usedas reinforcements for fibreglass in the production of the firstcomposite plastics. Although their market and uses have grownsubstantially since then, synthetic resins continue to be used largely inthis manufacturing in order to obtain layered composites known as“fibreglass-reinforced plastics” (FRPs).The most widely used polyesterresin is polyethylene terephthalate (PET), which is obtained bycondensing terephthalic acid with ethyleneglycol; PET is a thermo-plastic the mechanical and chemical properties of which make itespecially suitable for food and drink packaging.
In addition, polyester resins arewidely used tomanufacture plasticpaint [1] and these resins are used to prepare reticulated powderedpaint for electrostatic coating. The development of this kind of resinshas always been very influenced by the environmental factors,because of the absence of solvents and it is an agreed alternativewith the ecological principles. This type of paintings has had a fastgrowth from their introduction for 35 years due to their fast cured and
ll rights reserved.
the optimal qualities of the formed covering, with very goodmechanical properties, resistance and durability.
The plastic paint polyester resins studied are obtained bycondensation of neopentyl glycol and terephthalic acid, but addition-ally contain minor amounts of other acids and diols intended tofacilitate specific uses. Table 1 lists some of the more usualcomponents of these resins.
The American Society for Testing and Materials (ASTM) [2]recommends using the acid value (AV) and hydroxyl value (OHV) tomonitor esterification reactions. Determining these two parameters(particularly OHV) involves long analysis times that lengthen theproduction cycle and result in increased costs and decreasedproductivity as a result. The production process and the quality ofthe end product can be improved by using rapid, effective analyticaltechniques to ensure appropriate, efficient analytical control of thedifferent steps of the manufacturing process.
A variety of techniques have so far been used for the analysis andcharacterization of resins [3–5] all of which, however, involve labour-intensive, time-consuming analyses. Near infrared spectroscopy (NIR)is a novel, effective alternative in his respect as it allows the spectra foruntreated solid and liquids samples to be expeditiously recorded andaffords the simultaneous determination of physical and chemicalparameters from a single spectrum. In addition, it lends itself readilyto at-line and in-line implementation (with fibre-optic probes in thelatter case), which makes it suitable for process control purposes [6].The nature of NIR spectra, however, requires the use of multivariateregression techniques to construct effective calibration models themost widely employed among which is Partial Least-Squares
Table 1Main raw materials used to obtain the polyester resins
Reagent Formula Property Content(%)
Diacids Terephthalicacid
Mechanicproperties
65–90
Isophthalicacid
OutdoorResistance
10–25
Adipic acid Flexibility,highreactivity inthe end of thechain
1–10
Diols Neopentylglycol
OutdoorResistance
80–100
Ethyleneglycol
Flexibility,low cost
0–20
Diethyleneglycol
Flexibility,low cost
0–20
Table 2Final net hydroxyl and acid values for the polyester resins in each production step
Value Step 1 Step 2 Step 3
IOH net (mg KOH/g) 24 to 26 −28 to −32 −28 to −32IA (mg KOH/g) 13 to 23 45 to 50 33 to 36
Fig. 1. NIR spectra for the samples in the different production steps.
119M. Blanco et al. / Microchemical Journal 90 (2008) 118–123
Regression (PLSR) [7–10]. A number of calibration methods for NIR-based determinations using non-linear models such as non-linear PLS[11] and ANN [12] have to date been reported. In this work, we usedNIR spectroscopy as an alternative to the classical volumetricdetermination methods for the acid value and hydroxyl valueinvolving the construction of calibration models which afford muchmore expeditious and simplicity of the analyses. The models allowboth parameters to be determined in the different steps of the resinproduction process and hence any corrections required to be timelyintroduced.
Transferring the calibration results from the master equipment(viz. that used to construct the calibration models) to any other, slaveequipment, allows substantial time and economic resources to besaved.When a calibrationmodel is applied to spectra registeredwith adifferent instrument, deviations in the results can be produced.
A number of methods exist for transferring models betweeninstruments [13]; the most simple choice, however, is based ontransforming the spectra from the slave instrument as required foradaptation to the characteristics of master instrument. One of themost frequently used algorithms for this purpose is Piecewise DirectStandardization (PDS) [14].
In this work, we constructed PLS calibration models of goodpredictive ability for the at-line determination of the acid value andhydroxyl value in samples withdrawn during the process of polyesterresin manufacturing. Also, we assessed the transferability of themodels between instruments.
2. Experimental
2.1. Resin synthesis
The resin production process involves three steps. In the first,which is the most complicated and slow — and also that requiringthe highest temperatures — the esterification begins and they takepart mainly neopentylglycol and terephthalic acid, a catalyst and ananti-oxidant. Water formed during the esterification is separated bydistillation, until an elevated percentage of the initial acid is reacted. Inthe second step, the temperature is lowered and the concentrations ofterephthalic acid and glycol are re-adjusted if the net acid value orhydroxyl value falls outside the desired range (see Table 2); also, theother reaction ingredients used (viz. isophthalic acid, adipic acid and/or trimellitic anhydride) are added. In the third step, the concentra-tions of terephthalic acid and glycol are re-adjusted as in the previousstep and several successive vacuum ramps are performed at the sametemperature as in the second step in order to remove water formed in
the reaction and obtain the desired acid value and hydroxyl value inthe end product.
2.2. Samples
A total of 105 polyester resin samples from the three productionsteps were extracted and analysed by the ASTM methods. Theircompositionwas found to depend on the particular step and time theywere withdrawn from the process. All were ground in an electric millprior to recording of their NIR spectra.
2.3. Hardware and software
Near infrared reflectance spectra were recorded on two differentinstruments, namely: a Perkin-Elmer Spectrum One NTS modelequipped with a reflectance accessory (NIRA) that was governedwith the software Spectrum v. 3.02.01 and Bruker Multi PurposeAnalyzer that was controlled with Opus v. 6.0 from Bruker Optics(Ettlingen, Germany). Spectral measurements were made at 2 cm−1
intervals over the wavenumber range 4000–10000 cm−1 and eachspectrum was the average of 30 scans.
The software Opus v. 6.0 was used to transfer spectra, using thePDS algorithm of Kowalski and Yang (University of Washington) [11].Multivariate calibration models were constructed with the softwareThe Unscrambler v. 9.2 from CAMO (Trondheim, Norway).
2.4. Reference methods
2.4.1. Acid valueThe acid value (AV) is defined as the number of milligrams of
potassium hydroxide required to neutralize 1 g of sample and isdetermined in accordance with ASTM D-465-01 [2] by titrating thenon-volatile acid fraction of the sample with a standardized alkalinesolution.
2.4.2. Hydroxyl valueThe hydroxyl value (OHV) is defined as the number ofmilligrams of
potassium hydroxide needed to neutralize the acetic acid formed inthe acetylation of 1 g of sample and is determined in accordance with
Fig. 2. Scores plot obtained from a PCA of the first-derivative spectra over the 4000–10000 cm−1 range for resin samples in the three production steps.
120 M. Blanco et al. / Microchemical Journal 90 (2008) 118–123
ASTM D-1957-86 [2]. The recommended method involves acetylatinghydroxyl groups with acetic anhydride in pyridine containing 4-dimethylaminopyridine (DMAP) as catalyst. After the reaction, excessacetic anhydride is hydrolyzed with water and titrated with astandardized alkaline solution. The difference between the volumesof base needed to neutralize the sample and a blank provides thehydroxyl value. The net hydroxyl value is a measure of excess hydroxylgroups and is calculated as the difference between the hydroxyl valueand acid value: OHVnet=OHV−AV.
2.5. Recording of spectra
The spectra recorded with the Perkin-Elmer and Bruker instru-ments were obtained by using powdered samples held in quartz cellsand glass vials, respectively. Each spectrum was the average of 30scans and both instruments were set to apply blank/baselinecorrection. Each sample was used to record three spectra the averageof which was used for subsequent processing.
2.6. Construction of models
The spectral treatments used to construct themodels included firstderivatives as obtained by using the Savitzky–Golay algorithm withsecond-order polynomial fitting and a 21-point window [15], andStandard Normal Variate (SNV) [16].
Calibration models were constructed by using the PLS1 algo-rithm as implemented by cross-validation (leave-one-out method).The optimum number of factors to be included was determinedfrom a plot of explained variance against number of factors. Theinitial model thus obtained was refined by selecting those factorsresulting in the lowest RSEP for the validation set.
Table 3Characteristics of the calibration models for control of acid and hydroxyl values
Parameter Step Spectral pretreatment Spectral range (cm−1)
IA 1 1st derivative 6550–5316, 5206–4970, 4926–4572 1st derivative 7000–40003 SNV 8200–5000
IOH net 1 1st derivative 7182–6870, 6106–5302, 5224–4562+3 1st derivative 7118–5448, 5132–4000
The quality of calibration and validation models is usuallymeasured in terms of a relative standard error, RSE, which isdesignated (RSEC) for calibration and (RSEP) for prediction:
RSE kð Þ ¼ 100
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiPmi¼1
ypred � yref� �2
Pmi¼1
yrefð Þ2
vuuuuuut
where m is the number of samples used, yref the parameter valueprovided by the reference method and ypred that provided by the NIRmethod.
The sample selection method used was the algorithm of Kennardand Stone [17].
3. Results and discussion
The production of polyester resins involves three steps startingwith an esterification reaction that is followed by adjustment of thecomposition of the medium in order to obtain the desired propertiesand by a finishing step. Fig. 1 shows the spectra obtained for a selectedresin sample in the three steps. As can be seen, they are highly similar,which suggests that spectral changes during the process are quitesmall despite the oscillations in AV and OHV.
Only the spectra recorded on the Perkin-Elmer instrument wereused to construct the calibration models. Fig. 2 shows the results of aprincipal component analysis (PCA) for the resins in the threeproduction steps; while spectral differences between steps werevery small (Fig. 1), those between the first three scores in the scatterplot were quite apparent (particularly those between the first step andthe other two). This led us to construct a different model for each stepand control parameter (AV and OHV).
As can be seen from Fig. 2, the scores for the samples in the secondstep were close to those in the third; this led us to consider using asingle model for AV and OHV in both steps.
In order to ensure accurate predictions, the calibration modelshould encompass all possible variability sources for the body ofsamples to be determined; in order to identify the samples meetingthis criterion, we applied the Kennard–Stone algorithm to the samplesets available for each step. Fig. 3 show the scores of the scatter plot(PC1 vs PC2) obtained from a PCA of samples for the first step; as canbe seen, the selected samples encompassed the whole spectralvariability in those used for calibration.
The selected samples were checked to span the whole concentra-tion range. Otherwise, the Kennard–Stone algorithm was used toselect additional samples until this criterion was met. The body ofsamples not selected by the algorithmwas used for validation in orderto assess the predictive ability of the model.
Models were constructed by using various spectral ranges andtreatments (SNV and first derivative). The optimum spectral rangewas identified by using the jack-knifing criterion [18], whichprovides an indication of the particular wavelengths most stronglyinfluencing the performance of a model. Application of the criterionprovided the ranges listed in Table 3, which coincided with thosecontaining the major bands in the spectra for the resins. Thosesamples exhibiting high residuals or substantial deviations from the
PLS factors Y explained variance % RSEC% RSEP%
8, 4418–4000 4 98.27 1.52 2.585 98.40 0.69 1.484 95.80 0.35 1.27
6, 4418–4158 4 98.18 2.82 2.395 96.30 1.61 3.41
Table 4Figures of merit of the models for the calibration and prediction samples
Parameter Step Set samples Number of samples Parameter range(mg KOH/g)
Slope Offset R2
IA 1 Calibration 19 13.6–22.0 0.98±0.07 0.30±1.17 0.99Prediction 23 14.9–19.3 0.95±0.13 0.64±3.83 0.95
2 Calibration 22 42.3–56.6 0.98±0.06 0.80±2.95 0.99Prediction 28 46.9–53.6 0.93±0.17 3.75±8.47 0.91
3 Calibration 16 33.1–35.5 0.96±0.11 1.44±3.98 0.96Prediction 6 34.9–35.4 0.22±0.49 13.26±14.76 0.12
IOH net 1 Calibration 46 16.1–36.0 0.98±0.04 0.47±1.07 0.98Prediction 27 19.4–34.4 1.02±0.06 −0.83±1.73 0.98
2+3 Calibration 49 (−19.2)−(−39.0) 0.96±0.05 1.08±1.61 0.96Prediction 40 (−21.2)–(−33.3) 1.07±0.13 1.57±3.84 0.85
Note: ± Confidence level for means (p=0.05).
121M. Blanco et al. / Microchemical Journal 90 (2008) 118–123
others in the set were deemed outliers and excluded from thecalibration models.
We developedmodels for AV and OHV in each step; by exception, asingle model was constructed for the hydroxyl value in the second andthird step. Table 3 shows the most salient calibration parameters foreach model, as well as the calibration and prediction errors obtained.As can be seen, using 4 and 5 PLS factors sufficed to obtain modelswith adequate predictive ability for both parameters; in fact, theresulting RSEP values were less than 3.5% with all models.
The similarities between the second and third step allowed a singlemodel to be used for OHV in both. The model was simple (only 5 PLSfactors) and exhibited good predictive ability; however, it providedpoor results for AV, which thus required using independent, simplermodels for the two steps.
Table 4 shows the statistical figures of merit of the models asregards calibration and prediction. The slopes and intercepts of theNIR value vs reference value regression lines were close to 1 and 0,respectively, and contained both values in their confidence intervals.This, together with the coefficients of determination of the linesobtained with the calibration models for both AV and OHV (0.96–0.99), testify to their good quality.
The coefficients of determination of the validation lines departedmore markedly from unity than did those of the calibration lines, butwere still acceptable (0.85–0.96). The small number of samplesavailable to assess the predictive ability of the model for AV in thethird step, together with the narrow concentration range theyspanned, made this prediction quality criterion useless and entailedusing a t-test to assess differences. Table 5 shows the calibration andprediction residuals obtained at the 95% significance level. Based onthem, the five PLS models resulted in no significant differencesbetween the NIR results and reference values.
3.1. Transfer of spectra and models
The above-described models were constructed from spectrarecorded on the Perkin-Elmer instrument and, subsequently, fromothers obtained on the Bruker spectrophotometer. Although bothinstruments are similar, they exhibited slight differences between
Table 5Significance test (p=0.05) of residuals for the calibration and prediction samples
Parameter Step Set samples Number of samples Average SD texp tcrit
IA 1 Calibration 19 0.00 0.31 0.00 2.08Prediction 23 −0.51 0.38 0.28 2.07
2 Calibration 22 0.00 0.36 0.00 2.08Prediction 28 0.16 0.66 0.05 2.05
3 Calibration 16 0.00 0.12 0.00 2.13Prediction 6 −0.27 0.39 0.29 2.57
IOH net 1 Calibration 46 0.00 0.75 0.00 2.01Prediction 27 −0.27 0.59 0.08 2.05
2+3 Calibration 49 0.00 0.64 0.00 2.01Prediction 40 0.28 0.98 0.05 2.02
spectra which precluded using the original models with the Brukerspectrophotometer. Thus, the samples analysed with the Brukermodel exhibited a positive shift in absorbance and a disparate distancebetween absorbance values.
In order to avoid the need to reconstruct the models, we usedPiecewise Direct Standardization (PDS) as implemented in thesoftware Opus, from Bruker, to convert the spectra recorded on thePerkin-Elmer equipment (master instrument) into equivalent spectraon the Bruker equipment (slave instrument). The spectra to betransformed were obtained from resins in the first production step.The goodness of the results was found to depend on the appropriate-ness of the samples used in the transference; also, accurate transfer ofspectrawas found to require analysing aminimumnumber of sampleswith both instruments. The specific samples used were selected byapplying the Kennard–Stone algorithm to the calibration set employedto construct the original model for OHV (Fig. 3).
A set of 20 samples was deemed adequate to ensure correcttransformation of the original spectra. Fig. 4 shows a selectedspectrum recorded on the Perkin-Elmer spectrophotometer, onetransferred from this instrument and another recorded on the Brukerspectrophotometer. As can be seen, the transferred spectrumwas verysimilar to the Bruker spectrum (the correlation coefficient betweenthe two was very close to 1); this enabled the use of the originalcalibration models with spectra recorded on the Bruker instrument.
Once the calibration transfer model was established with the PDSalgorithm, it was applied to the Perkin-Elmer spectra used to constructthe original multivariate calibrationmodel and also to those employed
Fig. 3. Scores plot obtained from a PCA of the first-derivative spectra over the 4000–10000 cm−1 range for resin samples in the first production step.
Fig. 4. NIR spectra for a sample as recorded on the Perkin-Elmer and Brukerinstruments, and transferred spectrum obtained from the original spectrum recordedon the former.
122 M. Blanco et al. / Microchemical Journal 90 (2008) 118–123
in its validation. This was done under the same conditions as regardsspectral treatments, wavenumber ranges and number of factors aswith the original model. The new model was used for prediction withboth the transferred spectra for the validation set of the original modeland spectra recorded on the Bruker instrument in order to assess thequality of the models upon transfer of the original spectra.
Table 6 shows the RSEC and RSEP for the acid value and hydroxylvalue as obtained by using the original models constructed fromPerkin-Elmer spectra and those established from transferred spectraand the same parameter values as in the original models. Also, thetable lists RSEP for an independent set of samples analysed with theBruker (slave) equipment and predicted by using the modelsestablished from transferred spectra. As can be seen, the prediction
Table 7Characteristics of the calibration models obtained from spectra for the resins in step 1 reco
Parameter Step Spectral pretreatment Spectral range (cm−1) PLS fact
IA 1 1st Derivative 6550–5316 45206–49704926–45784418–4204
IOH net 1 1st Derivative 5352–4600 3
Table 8Figures of merit of calibration and prediction with the calibration models obtained by usiinstrument
Parameter Step Set samples Number of samples C
IA 1 Calibration 19 1Prediction 23 1Prediction Bruker 53 1
IOH net 1 Calibration 46 1Prediction 27 1Prediction Bruker 88 1
Table 6Comparison of the models obtained from the original spectra and those constructed from t
Step Parameter Model with original Perkin-Elmer spectra
Y explained variance % RSEC% RSEP%
1 IA 98.27 2.82 2.39IOH net 98.18 2.82 2.39
(Samples of the first phase of the condensation process).
errors in AV and OHV obtained with the models based on transferredspectra exceeded those provided by the original models (slightly forAV and by 1.5% for OHV).
The explained variance of the models constructed from transferredspectra was substantially lower than that of the original models for AV(92.32% vs 97.34%) and only slightly lower (97.78% vs 98.18%) for OHV.
The RSEP value for the samples analysed on the Bruker equipmentwas slightly higher than that obtained by using transferred spectrafrom the Perkin-Elmer equipment (viz. 4.33% vs 3.12% for AV and 4.37%vs 4.08% for OHV.
In any case, the results provided by the new models met theaccepted specifications.
We constructed new models intended to improve the resultsobtained by using transferred spectra under the same conditions aswith the original model. To this end, we used the same samples as inthe original models in combination with various spectral ranges andspectral treatments (SNV and first derivative) in order to obtainpredictions with both the transferred spectra for the validation set ofthe original model and others recorded on the Bruker instrument.Table 7 shows the figures of merit of each model, and the calibrationand prediction errors for the models. The improvement obtained withrespect to the models based on transferred spectra under the sameconditions as in the original model was insubstantial — less than 1%for AV at best; however, the OHV model was simpler (three factorsinstead of the four used in the original model).
Table 8 shows the figures of merit of the models based ontransferred spectra. As can be seen, there were no systematic errors inthe new predictions: the slope and intercept of the calibration andprediction lines were all close to 1 and 0, respectively, and containedboth values in their confidence intervals.
4. Conclusions
Near infrared spectroscopy is a simple, rapid alternative to conven-tional analytical techniques for industrial control of the production ofpolyester resins. ThePLSmodelsdeveloped in thisworkallowtheaccurate
rded on the Perkin-Elmer instrument and transferred to the Bruker instrument
ors Y explained variance % RSEC% RSEP% RSEP% Bruker samples
97.24 1.92 2.74 3.27
98.55 2.75 3.98 4.10
ng transformed spectra obtained from those originally recorded on the Perkin-Elmer
oncentration range (mg KOH/g) Slope Offset R2
3.6–22.0 0.97±0.08 0.48±1.47 0.974.9–19.3 1.05±0.17 −1.08±3.06 0.883.6–22.0 0.92±0.09 1.35±1.63 0.886.1–36.0 0.98±0.04 0.45±1.07 0.989.4–34.4 1.07±0.10 −1.51±2.80 0.956.1–36.0 1.08±0.09 −1.17±2.06 0.97
ransferred spectra
Model with transferred Perkin-Elmer spectra
Y explained variance % RSEC% RSEP% RSEP% Bruker samples
92.32 3.20 3.12 4.33 (n=53)97.78 3.11 4.08 4.37 (n=88)
123M. Blanco et al. / Microchemical Journal 90 (2008) 118–123
determination of two key chemical parameters for the resins, namely: theacid value and the hydroxyl value, which are usually employed to controlthe manufacturing process.
The PLS models studied were found to possess a good predictiveability and to result in insignificant differences from reference values.
Therefore, the proposed calibration models can facilitate controlof the amounts of raw materials loaded into the reactor, expose theneed to add more acid or glycols — by reference to a previouslytabulated range of acid values and hydroxyl values — at the earlystages of the process and provide accurate information about itsdevelopment.
The spectral transfer algorithm used allows one to rapidlytransform models based on spectra recorded on a given instrumentfor use on another with no appreciable loss of predictive ability; thiscan save much time and expense.
References
[1] K. Othmer, Encyclopedia of Chemical Technology, 4th ed.Willey, 2001 (CD ROM),(Vol 19).
[2] Annual Book of ASTM Standards, American Society for Testing and Materials,Philadelphia, 2005 (Section 06.03).
[3] T. Kobayashi, M. Nakamura, Y. Uchiya, S. Yoshida, DIC Tech. Rev. 8 (2002) 13–18.[4] O. Laine, P. Vainiotalo, H. Osterholm, H. Jarvinen, Eur. J. Mass Spectrom. 7 (1) (2001)
15–23.[5] S.M. Hunt, M.M. Sheil, P.J. Derrick, Eur. Mass Spectrom. 4 (6) (1998) 475–486.[6] M. Blanco, V. Villaescusa, Talanta 71 (2007) 1333–1338.[7] H. Martens, T. Naes, Multivariate Calibration,Wiley, London,1989 (chapters 2 and 7).[8] D. Kleinbaum, L. Kupper, K. Muller, Applied Regression Analysis and other
Multivariate Methods, 2nd ed.Pws-Kent, Boston, 1988.[9] D.L. Massart, B.G.M. Vandeginste, L.M.C. Buydens, S. De Jong, P.J. Lewi, S. Smeyers-
Verbeke, Handbook of Chemometrics and Qualimetrics: Part B, Elsevier, TheNetherlands, 1998 349 pp.
[10] O.E. De Noord, Chemometr. Intell. Lab. Syst. 25 (1994) 85–97.[11] R.A. Heikkaa, K.T. Immonena, P.O. Minkkinen, E.Y.O. Paateroa, T.O. Salmib, Anal.
Chim. Acta 349 (1997) 287–294.[12] E. Marengo, M. Bobba, E. Robotti, M. Lenti, Anal. Chim. Acta 511 (2004) 313–322.[13] T. Fearn, J. Near Infrared Spectrosc. 9 (4) (2001) 229–244.[14] Y. Wang, D.J. Veltkamp, B.R. Kowalski, Anal. Chem. 63 (1991) 2750–2756.[15] A. Savitzky, M.J.E. Golay, Anal. Chem. 36 (1964) 1627.[16] R.J. Barnes, M.S. Dhanoa, S.J. Lister, Appl. Spectrosc. 113 (1988) 1849.[17] R.W. Kennard, L.A. Stone, Technometrics 11 (1969) 137–148.[18] H. Martens, M. Martens, Food Qual. Prefer. 11 (2000) 5–16.
ARTICULOS
165
7.2) DEVELOPMENT OF A
UNIVARIATE CALIBRATION
MODEL FOR PHARMACEUTICAL
ANALYSIS BASED ON NIR
SPECTRA
M.Blanco, J.Cruz, M. Bautista
Analytical and bioanalytical chemistry 392 (2008).
pp.1367–1372
ARTICULOS
166
ORIGINAL PAPER
Development of a univariate calibration modelfor pharmaceutical analysis based on NIR spectra
M. Blanco & J. Cruz & M. Bautista
Received: 10 July 2008 /Revised: 18 September 2008 /Accepted: 19 September 2008 / Published online: 15 October 2008# Springer-Verlag 2008
Abstract Near-infrared spectroscopy (NIRS) has beenwidely used in the pharmaceutical field because of itsability to provide quality information about drugs in near-real time. In practice, however, the NIRS technique requiresconstruction of multivariate models in order to correctcollinearity and the typically poor selectivity of NIRspectra. In this work, a new methodology for constructingsimple NIR calibration models has been developed, basedon the spectrum for the target analyte (usually the activeprinciple ingredient, API), which is compared with that ofthe sample in order to calculate a correlation coefficient. Tothis end, calibration samples are prepared spanning anadequate concentration range for the API and their spectraare recorded. The model thus obtained by relating thecorrelation coefficient to the sample concentration issubjected to least-squares regression. The API concentra-tion in validation samples is predicted by interpolating theircorrelation coefficients in the straight calibration linepreviously obtained. The proposed method affords quanti-tation of API in pharmaceuticals undergoing physicalchanges during their production process (e.g. granulates,and coated and non-coated tablets). The results obtainedwith the proposed methodology, based on correlationcoefficients, were compared with the predictions of PLS1calibration models, with which a different model is requiredfor each type of sample. Error values lower than 1–2% wereobtained in the analysis of three types of sample using thesame model; these errors are similar to those obtained byapplying three PLS models for granules, and non-coated
and coated samples. Based on the outcome, our methodol-ogy is a straightforward choice for constructing calibrationmodels affording expeditious prediction of new sampleswith varying physical properties. This makes it an effectivealternative to multivariate calibration, which requires use ofa different model for each type of sample, depending on itsphysical presentation.
Keywords NIR spectroscopy . API determination .
Correlation coefficients . PLS calibration
Introduction
Near-infrared spectroscopy (NIRS) is widely used in manyareas in the agrifood [1], petrochemical [2], chemical [3],and pharmaceutical fields [4]. The ability to analyse samplesin a non-destructive, non-invasive manner, in addition to theneed for minor or no sample pretreatment and the expedi-tiousness with which spectral data can be acquired, haveboosted industrial development of NIRS as an advantageousalternative to other instrumental techniques [5].
NIR spectra consist of strongly overlapped, broadabsorption bands and are often highly correlated, whichrequires the use of a powerful chemometric tool to extractrelevant information from them. Chemometrics is so closelyassociated with NIR spectroscopy that this technique wouldnever have progressed to the extent it has without theavailability of effective multivariate techniques for process-ing NIR spectral data. In fact, the joint use of NIRS andsome chemometric algorithms has enabled the developmentof a number of qualitative and quantitative methods ofanalysis. Multivariate calibration methods involving thereduction of variables such as PLS and PCR [6] are amongthe most widely used for processing spectral data and
Anal Bioanal Chem (2008) 392:1367–1372DOI 10.1007/s00216-008-2426-9
M. Blanco (*) : J. Cruz :M. BautistaDepartament de Química, Unitat de Química Analítica,Universitat Autònoma de Barcelona,08193 Bellaterra,Barcelona, Spaine-mail: [email protected]
relating spectroscopic signals (predictor variables) to targetvariables (analyte concentrations, usually). These methods,which share the advantages of least-squares methodology,use inverse, indirect calibration procedures and afford theanalysis of one or more analytes in a mixture without theneed to know all of its components. Also, they use the wholeinformation contained in NIR spectra, which they compressinto a reduced number of variables; this facilitates construc-tion of models, and detection of interferents and outliers.
Identifying specific analytes against a library containingthe spectra for a large number of compounds is possible byusing a correlation coefficient (CC) as discriminatingcriterion; however, discriminating between spectroscopical-ly very similar compounds also requires use of pattern-recognition methods [7]. The ease of calculation ofcorrelation coefficients and the ability to use them withlibraries holding the spectra for large numbers of com-pounds have led to their widespread use. However, exceptfor a chemical imaging study [8], this statistic seems tohave never been used for quantitative purposes in spectro-scopic analysis, even though it provides a measure ofsimilarity between data sets and has been employed inuniformity studies [9] and in distinguishing polymorphs[10]. One of the most interesting uses of correlationcoefficients is two-dimensional correlation spectroscopy[11], which allows the small spectral changes induced by anexperimental perturbation to be magnified.
The spectra for two similar compounds will have a near-unity correlation coefficient; also, the more dissimilar thespectra are, the lower will be their CC [12]. Therefore, thehigher the content of a component in a mixture of two is,the higher will be CC between the spectrum for the mixtureand that for the pure component; in other words, CC willincrease with increasing proportion of the componentconcerned in the mixture. Although no precise mathematicalexpression relating the correlation coefficient between amixture and a pure component to the component concentra-tion exists, one can expect the relationship to be linear over anarrow concentration range; such a range should allow linearunivariate calibration graphs to be constructed by relating theCCs between a set of NIR spectra for a series of samples andone of their components to the concentration of thecomponent in question. Constructing the model, however,will require having the spectrum for the pure component.
The correlation coefficient is a statistic quantifying therelationship between two consecutive variables and isdefined as the ratio of the covariance to standard deviationfor each variable:
CC ¼ Cov x; yð ÞSxSy
ð1Þ
If x and y represent the spectra for two compounds(sample and API, respectively), then CC, which is a mea-
sure of similarity between the two, can be expressed insimplified form as:
CC ¼Pl
xl � xð Þ yl � yð ÞffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiPl
xl � xð Þ2Pl
yl � yð Þ2r
or; alternatively;CC ¼Plxlyl
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiPlx2lPly2l
rð2Þ
Substituting spectroscopic data into this equation andassuming fulfilment of Beer’s law leads to an expressionreflecting direct proportionality between the spectral con-tribution of the analyte (absorbance) to the sample spectrumand its concentration:
CC ¼ K A� A0ð ÞCaþ K 0 ð3ÞWhere K and K′ are two constants, that contain terms
with the absorbance of the analyte and the averagedconcentration of the samples used in calibration, and Aand A′ are the absorbance/concentration proportionalitycoefficients for the analyte and matrix, respectively.Therefore, similarity between the sample and analyte willincrease with increasing spectral contribution of the analyteand hence with increasing correlation coefficient.
In this work, we assessed the usefulness of univariateanalysis in the form of a linear relationship between theabove described correlation coefficient and concentrationfor determining the API content of pharmaceuticalproducts based on NIR spectral data. The correlationcoefficients between the sample and analyte spectra wereused to establish a linear relationship with API concen-tration via least-squares regression. The predictions thusobtained were compared with the results of multivariate(PLS) calibrations.
Experimental
Pharmaceutical preparation
The end-product was a coated tablet containing 93 mg g−1
API (dexketoprofen), PH101 microcrystalline cellulose(500 mg g−1) as major excipient, and three other, minorexcipients (maize starch, carboxymethyl starch, and glyc-erol distearate, the latter two being added to the granulatedproduct).
The preparation is obtained in two steps involving wetgranulation of a mixture of the API, microcrystallinecellulose, and maize starch, and subsequent addition ofthe other excipients to the granulate. The final mixture ishomogenized, pressed into tablets, and coated with a thin
1368 M. Blanco et al.
film of lacquer. The tablets are cylindrical in shape andweigh an average of 270 mg.
Samples
We used samples collected during the pharmaceuticalproduction process in order to both construct the calibrationmodel and assess its predictive ability. In addition, we usedlaboratory-made samples to expand the concentration rangeof the samples in the calibration set.
Calibration samples
The samples included in the calibration set were granulatesto which the remaining excipients were added. Suchsamples spanned a narrow API concentration range, sosome were underdosed by addition of a placebo and someoverdosed by addition of API. In this way, the initialconcentration range was expanded by ±20% around thenominal API content (93 mg g−1).
Prediction samples
The prediction set consisted of samples obtained in the twosteps of the production process, namely: granulates frombatches not included in the calibration set, uncoated tablets(cores), and coated tablets. In addition, the prediction setincluded coated tablets milled to a particle size similar tothat of the granulated samples.
All preparation samples and components were suppliedby Laboratorios Menarini (Badalona, Spain).
Recording of NIR spectra
NIR spectra were recorded on a model 6500 spectropho-tometer from FOSS NIRSystems (Silver Springs, MD,USA) equipped with a Rapid Content Analyzer (RCA)module and controlled via the software Vision v. 2.51. Eachspectrum was the average of 32scans obtained at 2 nmintervals over the wavelength range 1100–2498 nm. Aceramic plate was used to record a reference spectrum priorto each sample spectrum.
Reflectance spectra for granulated (production, under-dosed, and overdosed) samples were obtained in triplicateby placing appropriate aliquots in a quartz cuvette andturning them over between successive recordings. Anaverage spectrum was obtained from each triplicaterecording for use in subsequent calculations.
The spectra for production tablets, cores, and coatedtablets were recorded on both sides of each sample; to thisend, each tablet was placed directly on the quartz windowof the recording module. The average spectrum for the twosides was used in subsequent calculations.
UV reference spectrum
The API content of the production samples was determinedby ultrasonicating ca. 0.25 g powdered sample in 90 mLMilli-Q water at 37°C for 15 min and diluting to 100 mL. A2-mL aliquot of the supernatant was then diluted to 50 mLwith 3:1 MeOH–water and its spectrum was recorded. TheAPI concentration in the solution was calculated byapplying multiple linear regression (MLR) to the 210–400 nm region of the UV spectrum, using the spectrum forpure dexketoprofen in MeOH–water as standard.
The API content of the underdosed and overdosedsamples were calculated by weighing of the API andplacebo, once the API content of the granulated sampleswere known.
NIR data processing and software
Calibration models were constructed by using variousspectral treatments including the standard normal variate(SNV), and the first and second Savitzky–Golay derivativesas obtained with an 11-point spectral window and a second-order polynomial. The calibration graph was constructedfrom the three replicate measurements of each sample. Spec-tral treatment was performed by use of the software Vision.
The goodness of the calibration curve was assessed byanalysis of variance (ANOVA) and also by analysis of theresidual distribution; if the distribution exhibits randomdispersion, then the function will be linear throughout theconcentration range. The goodness of prediction wasassessed in terms of the relative standard error (RSE):
RSE %ð Þ ¼
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiPmi¼1
yi � yi� �2
Pmi¼1
yið Þ2
vuuuuut � 100
Correlation coefficients were calculated and linearregression done by using a Microsoft Excel spreadsheet towhich spectra were transferred from the software Vision.
Results and discussion
The primary purpose of this work was to develop aunivariate calibration model based on the correlationcoefficient as predictor variable and amenable to applica-tion to all types of pharmaceutical samples.
Figure 1a shows the absorbance spectra and Fig. 1b thesecond-derivative spectra for a sample of granulate andAPI. We calculated the correlation coefficient (CC) betweenthe spectra for the calibration set and that for the API, and
Development of a univariate calibration model for pharmaceutical analysis based on NIR spectra 1369
then the least-squares regression statistics for the coeffi-cients and the concentration of each sample in the set.
Obtaining a calibration curve capable of providingacceptable predictions entailed ensuring that the correlationcoefficient between the samples with the extreme concen-trations would be as disparate as possible, since a widerange of CCs would facilitate discrimination betweensimilar concentrations.
We studied various spectral treatments and calculated theCCs between the spectra for the samples with the extremeconcentrations and that for the API. Table 1 shows the CCranges spanned by the results obtained with the differenttreatments. The high similarity between the spectra for thesamples and that for the API resulted in a high CC in theabsorbance mode (r = 0.920). However, derivation ofthe spectra reduced CC values and substantially increasedthe difference between the extreme samples. This led us touse second-derivative spectra to calculate CCs in subse-quent tests.
We also sought to identify a particular spectral regionpotentially affording a wider CC range, but none was foundto improve on the results provided by the whole spectrum.Consequently, we chose to use the entire wavelength rangeand second-derivative spectra in order to construct thecalibration model.
To this end, a total of 15 samples spanning the APIconcentration range 73.7–123.2 mg g−1 were used incombination with least-squares methodology. The contentuniformity values accepted by the pharmacopoeias are in arange of label claim ±15%. The concentration range wasspanned to ±20% the label claim value, to ensure that thecalibration model can predict correctly in the whole rangefor content uniformity determination.
Table 2 shows the statistical figures of merit of theregression curve (slope and intercept, their respectiveconfidence ranges, the coefficient of determination, etc.).
The triplicate spectra for each sample were used toconduct an ANOVA on the regression curve in order tovalidate the proposed model. Table 2 shows the results,which testify to the accuracy of the model.
Having samples from different steps of the productionsample allowed us to check the proposed model on them.We assessed the predictive ability of our model bypredicting samples with both chemical and physicalvariability.
Fig. 1 Spectra of production samples (granulated, and coated andnon-coated tablets) and API in absorbance (a) and second derivative(b) modes
Table 1 Correlation coefficient range between spectra of calibrationsamples and API
Pretreatment Correlation coefficient range Difference
None (absorbance) 0.904–0.920 0.016SNV 0.904–0.920 0.0161st Derivative 0.136–0.245 0.1092nd Derivative 0.228–0.369 0.141
Table 2 Figures of merit of univariate calibration model
Calibration model
Spectral pretreatment 2nd DerivativeSpectral range (nm) 1110–2490Concentration range (mg g−1) 73.7–123.2Calibration samples 15Equation (CC vs. concentration)Slope (360±1) × 10−5
Intercept (356±90) × 10−4
r 0.9991Standard error (Sy/x) 0.0023ANOVA testSSLOF SS PE SS REG SStotal2.917 × 10−4 3.778 × 10−4 2.636 2.637F exp F tab0.59 2.59
1370 M. Blanco et al.
Figure 1 shows the spectra for uncoated tablets (cores)and coated tablets. As can be seen, the absorbance spectrawere very similar and their second derivatives even moreso; therefore, the predictions of the model were notsignificantly different from the reference values. Table 3shows the prediction results and Fig. 2 the residuals of thepredictions as a function of the reference values as determinedby UV spectrophotometry. As can be seen, predictions werequite acceptable (RSEP was always less than 2%); also, the
model was subject to no systematic errors—residuals wererandomly distributed—so it can be effectively used to monitorthe pharmaceutical production process.
PLS calibration models for the same preparation devel-oped elsewhere were found to be applicable to a single typeof sample only [13]. We used such models with the samesamples and sample types employed in the previous testsand obtained the RSEP values listed in Table 3; theresiduals for the validation samples are shown in Fig. 2.Based on the results of a t-test on the residuals betweenmethods, the predictions and residuals of our univariatemodel were not significantly different from those for themultivariate models. This suggests that the proposedunivariate model is an effective, advantageous alternativeto multivariate methodology for this purpose, whichrequires using one model per sample type.
Conclusions
The proposed methodology provides univariate calibrationmodels capable of predicting API contents of samples from
Fig. 2 Plot of residuals of prediction samples applying both univariate and PLS models
Table 3 Prediction errors for different samples using univariate andPLS models and t test for differences between the results obtainedfrom both models
Sample type Granulated Non-coatedtablets
Coatedtablets
Number of samples 8 10 13API range (mg g−1) 79.0–110.0 90.7–92.9 90.4–93.5RSEP (%) C.C. PLS C.C. PLS C.C. PLS
1.08 1.56 1.91 1.57 1.43 0.91Test t (n=31)t tab t exp2.03 1.98
Development of a univariate calibration model for pharmaceutical analysis based on NIR spectra 1371
different steps of pharmaceutical production processes;also, it is computationally simpler than multivariatemethods as all calculations can be done on an Excelspreadsheet rather than requiring complex software for thispurpose. The CC focuses on the chemical variability insamples, reducing to a large extent the influence of physicalproperties such as particle size or conditions such astableting pressure. In addition, a single univariate modelaffords accurate prediction of samples subjected to dispa-rate physical treatments, which facilitates the use of NIRspectroscopy to monitor pharmaceutical manufacturingprocesses. Moreover, the calibration set need not containany samples of the same type as those to be determined,which simplifies its construction. The consequences ofphysical effects on the samples, which are transferred tospectra (e.g. as scattering differences), require that multi-variate models use production samples in order to ensureacceptable predictions subject to no systematic errors.
However, the proposed method has some disadvantagesthat restrict universal application to all types of sample. Thus,it requires the pure spectrum for the target compound—whichis usually no problem in pharmaceutical analysis, a high con-centration of API in order to ensure large enough differencesin CC between the samples in the selected content range,and an analyte spectrum as different as possible from thatfor the matrix (placebo).
Overall, the proposed methodology should be highlyuseful in the pharmaceutical field as some of its restrictionscan be easily overcome and it affords control of thedifferent steps of the production process by using a singlemodel rather than one per sample type.
Acknowledgements The authors are grateful to Spain’s MCyT forfunding this research within the framework of Project CTQ2006–12923.
References
1. Lafargue ME, Feinberg MH, Daudin JJ, Rutledge DN (2003) AnalBioanal Chem 375:496–504
2. Macho S, Larrechi MS (2002) Trends Anal Chem 21:799–8063. Jiang B, Dong Huang Y (2008) J Reinf Plast Comp 26:1625–16364. Blanco M, Bautista M, Alcala M (2008) J Pharm Sci 97:1236–12455. Blanco M, Vilarroya I (2002) Trends Anal Chem 21:240–2506. Martens H, Naes T (1989) Multivariate calibration. Wiley, London7. Frasson Scafi SH, Pasquini C (2001) Analyst 126:2218–22248. Jovanovic N, Gerich A, Bouchard A, Jiskoot W (2006) Pharm Res
23:2002–20139. Moes JJ, Ruijken MM, Gout E, Frijlink HW, Ugwoke MI (2008)
Int J Pharm 357:108–11810. Patel AD, Luner PE, Kemper MS (2001) J Pharm Sci 90:360–37011. Peng Y, Wu P (2004) Polymer 45:5295–529912. Asuero AG, Sayago A, Gonzalez AG (2006) Crit Rev Anal Chem
36:41–5913. Blanco M, Bautista M, Alcalà M (2008) AAPS Pharm Sci
Technol (in press)
1372 M. Blanco et al.
ARTICULOS
173
7.3) NIR-CHEMICAL IMAGING
STUDY OF ACETYLSALICYLIC
ACID IN COMMERCIAL TABLETS
J.Cruz, M. Bautista, J.M Amigo, M.Blanco
Talanta 80 (2009) pp.473–478
ARTICULOS
174
N
Ja
b
a
ARRAA
KNHAAM
1
sastaisss
(md
w
0d
Talanta 80 (2009) 473–478
Contents lists available at ScienceDirect
Talanta
journa l homepage: www.e lsev ier .com/ locate / ta lanta
ir-chemical imaging study of acetylsalicylic acid in commercial tablets
ordi Cruz a, Manel Bautista a, José Manuel Amigo b, Marcel Blanco a,∗
Unidad de Química Analítica, Departamento de Química, Facultad de Ciencias, Universitat Autónoma de Barcelona, 08193 Bellaterra, Barcelona, Espana, SpainDepartment of Food Science, Quality & Technology, University of Copenhagen, Rolighedsvej 30, DK-1958 Frederiksberg-C, Denmark
r t i c l e i n f o
rticle history:eceived 24 March 2009eceived in revised form 30 June 2009ccepted 2 July 2009vailable online 10 July 2009
eywords:IR-CIyperspectral imagingcetylsalicylic acidspirin tabletsCR-ALS
a b s t r a c t
Near Infrared Chemical Imaging (NIR-CI) is demonstrating an increasing interest in pharmaceuticalresearch since it meets the challenging analytical needs of pharmaceutical quality and may serve as aversatile adjunct to conventional NIR spectroscopy in many fields.
The direct analysis of samples by using hyperspectral imaging techniques, which provide a NIR spectrumin each pixel of the image, generates a big amount of information from one sample. Focusing the interest inpharmaceutical research, several chemometric algorithms are demonstrating their usefulness extractingthe relevant information (i.e. quantitative determination of the component in one sample) in tablets withonly one sample and without damaging it.
In this work, a quantitative method to analyze different commercial Acetylsalicylic acid tablets isproposed by using Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) method to thehyperspectral image and without any previous calibration model. For this purpose, a large concentra-tion range of active pharmaceutical ingredient (ASA, Acetylsalicylic acid in this work), between 82% and
12%, was covered depending on the manufacturer. MCR-ALS allowed obtaining a concentration maps foracetylsalicylic acid and therefore, consequent analysis of the ASA distribution in the tablet was developedby using the histograms of the distribution of concentration.Results certified the good distribution of ASA despite the different origins of the tablets. Moreover, theobtained values of concentration showed a very good concordance with the nominal value of ASA. As amatter of fact, the quality of the results demonstrated the useful of encompassing NIR-CI techniques with
tly, th
MCR-ALS and, consequen. Introduction
Once conventional spectroscopy techniques have been demon-trated to be a useful tool in pharmaceutical technology providinghigh number of publications praising this technique [1–4], hyper-
pectral imaging techniques have appeared with the aim not onlyo cover weak points in conventional spectroscopic techniques butlso to extend the knowledge in this field [5–8]. Hyperspectralmaging techniques result especially attractive because of the pos-ibility of providing huge spectral and spatial information of oneample (up to 82,000 spectra per sample) in a short time analy-is.
Among all Imaging techniques, Near Infrared-Chemical ImagingNIR-CI) has been confirmed to be an excellent tool to extract infor-
ation of high quality of the sample surfaces, being applied in veryiverse fields [9–14].
The greatest capacity of NIR-CI technique has drawn attentionithin the pharmaceutical field where robust methods are continu-
∗ Corresponding author.E-mail address: [email protected] (M. Blanco).
039-9140/$ – see front matter © 2009 Elsevier B.V. All rights reserved.oi:10.1016/j.talanta.2009.07.008
e well development on the production of Acetylsalicylic acid tablets.© 2009 Elsevier B.V. All rights reserved.
ously demanded to obtain information of the quality of products inall the stages of the manufacturing process. Concerning this aspect,the final assessment of the quality in the final tablet (i.e. obtainingboth quantitative and information about the spatial distribution ofthe components) is becoming a key-point in where NIR-CI is startingto gain importance [15].
Despite the benefits of NIR-CI in pharmaceutical research, thereexists still a gap between the acquisition of the hyperspectral imageand the treatment of such amount of information. In this sensesome multivariate models have been previously used and tested,as Principal Component Analysis (PCA) [5,16,17], providing valu-able initial information that helps to focus the further quantitativeanalysis.
On the other hand, quantitative analysis of pharmaceuticalsamples using NIR-CI has been performed using techniques as Par-tial Least Squares Regression (PLS) or PLS-Discriminant Analysis(PLS-DA) [18–21]. However, these techniques require a complete
calibration set of samples with the corresponding time consuminguntil the calibration model is performed and adequately tested.Concerning the quantification purposes without needing a pre-vious calibration model, Classical Least Squares (CLS) may bepresented as an alternative, since CLS only requires the pure spectra
474 J. Cruz et al. / Talanta 80 (2009) 473–478
Table 1Description of the 10 commercial ASA tablets analyzed.
Commercial brand Nominal ASA (mg) Diameter (mm) Tablet weight (g) Calculated concentration (%) Main excipient
A.A.S 100 100 82 0.227 44.13 ManitolA.A.S 500 500 134 0.864 57.88 ManitolBayer 500 500 120 0.609 82.06 MCCAdiro 100 100 72 0.135 73.86 MCCAdiro 300 300 102 0.409 73.28 MCCAspirina C* 400 258 3.235 12.37 –Dolmen* 500 242 3.399 14.71 –Aspirine Nicholas 500 120 0.624 80.13 MCCBioplak 250 250 70 0.348 71.84 MCCB 0
M
omctabv
sRvi[tdtc
ttdptaLdb
ioplak 125 125 100
CC = microcrystalline cellulose.* Effervescent tablets.
f all the components of the tablet. This is not a problem in tabletsanufacturing, in where the pure spectra of the components are
ommonly available. Nevertheless, typical phenomena as interac-ion between analytes, illumination noise or moisture contributionsre important drawbacks that may CLS not to be as robust as it cane expected since the pure analytes do not recover the experimentalariation [20].
One alternative that does not require a specific calibrationet of samples has been recently proposed. Multivariate Curveesolution-Alternating Least Squares (MCR-ALS) and its augmentedersion have been successfully applied to extract quantitativenformation of NIR Chemical Images in pharmaceutical samples20,22,23]. This augmented version consists in providing informa-ion to the initial sample, helping the method to solve the inherentrawbacks of the Chemical Imaging measurement. Therefore, thisechnique presents a welcome alternative to quantify differentomponents in tablets without needing a specific calibration model.
The objective of this paper is demonstrating the capability ofhe NIR-CI to extract information of different samples withouthe application of chemical quantitative information studying theistribution of Acetylsalicylic acid in commercial tablets. For thisurpose, commercial tablets of Aspirin from 10 different manufac-
urers and different content of Acetylsalicylic acid were selectednd studied by means of Multivariate Curve resolution-Alternatingeast Squares. The consequent distribution of ASA content in eachifferent commercial tablet surface was also studied and comparedy using histograms.Fig. 1. Scheme of MCR-ALS analysis (a) and augmented M
.173 72.09 MCC
2. Experimental
2.1. Reagents and instrumentation
2.1.1. Samples10 commercial tablets of Aspirin were used in this study and
purchased at the pharmacies. The ASA concentration for all thetablets was obtained by dividing the nominal content by the weightfor each tablet. The nominal concentrations of ASA in the differenttablets covered a wide range of concentration, from 82% to 12%.
The composition of the formulations is unknown and only theinformation, indicated in the brochure accompanying the differentpills each box or in the Vademecum guide [24], has been used inthis study. Table 1 shows the main features of each tablet.
Microcrystalline Celullose (MCC) is the main excipient in 6 of thepreparations; whereas manitol is the main excipient in the other 2tablets. Dolmen and Aspirina C are effervescent tablets and also con-tent ascorbic acid as active component and other known excipientsused in the formulation as citric acid, sodium carbonate and sodiumbicarbonate anhydrous.
2.1.2. Instrumentation
All tablets were measured obtaining a hyperspectral image of thesurface for each sample by using a “Think Spectrally Roda-25” NIRHyperspectral Imaging Spectrophotometer (Think Spectrally, Valen-cia, Spain). This instrument is a Focal Plane array (FPA) and it iscomposed by a Liquid Crystal Tunable Filter (LCTF) monochromator
CR-ALS (b) application to the hyperspectral cube.
J. Cruz et al. / Talanta 80
Fbb
aatp
siaiwtwr
where E (MN × �) corresponds to the experimental error matrix.
F(
ig. 2. Average spectra for each tablet after SNV pretreatment. Note: spectra haveeen shifted up or down in intensity in order to observe significant differencesetween them.
nd a Mercury Cadmium Telluride (MCT) detector which providesspectral range between 1000 and 2400 nm with 7 nm of spec-
ral resolution and a spatial resolution of 100 �m × 100 �m eachixel.
Three different areas of image were used depending on theize of the tablets: 15 × 15, 8 × 8 and 5 × 5 mm2. The total time ofmage acquisition was about 2 min. The lighting to the sample isvery relevant parameter in order to obtain quality images avoid-
ng noise related to a bad illumination. Therefore, 4 halogen lamps◦
ere focused to the sample place with a 45 orientation. Prior tohe registration of the images the calibration of the instrumentas performed by using 6 standards (FOSS AP-0200 NIR) covering
eflectance values from 99% to 0.2%.
ig. 3. Augmented MCR-ALS results for one commercial tablet (Aspirine Nicholas 500). (a)d) histogram of ASA concentrations.
(2009) 473–478 475
2.1.3. SoftwareAll the spectral pretreatments were applied by using home-
made routines programmed in MATLAB code (MATLAB v 7.0, TheMatWorks, Massachussetts) [18] and they are available via web [25].MCR-ALS software from the reference [26] working under MATLABwas used.
2.2. Hyperspectral images pretreatment
When a sample is registered with a Hyperspectral image device athree-dimensional array, X (M × N × �) is obtained being the M andN axis the spatial information and the � axis represents the spectralinformation. The three-dimensional structure of the hyperspectraldata cube requires a previous unfolding step to a bi-dimensionalmatrix, adapting the image for further pretreatments or any othermethod.
Once the images were unfolded several spectral pretreatmentswere applied to avoid the influence of undesirable phenomenacommonly found in NIR measurements. Thus, Standard NormalVariation (SNV), 1st and 2nd Savitzky–Golay Derivatives and alsosmoothing were applied.
2.3. MCR-ALS in imaging data
Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) [17,27] decomposes the unfolded matrix X (MN × �) into theproduct of two matrices, C (MN × A), containing the concentrationprofiles and ST (A × �), containing the spectral profiles for each Acomponent (Fig. 1a) (Eq. (1)):
X = CST + E (1)
The ALS optimization stops when the relative difference in lack offit (%LOF) values between consecutive iterations is below than athreshold value where e is each mnth element of the residual matrixE, and x is each mnth element of the X matrix. The threshold value
Spectral profiles for ASA; (b) spectral profiles for MMC; (c) concentration ASA map;
476 J. Cruz et al. / Talanta 80 (2009) 473–478
Table 2Results obtained for the 10 commercial tablets by using augmented MCR-ALS.
Tablet Nominal concentration (%) Augmented MCR-ALS concentration (%) Difference (%) Correlation ASA Correlation MCC Correlation manitol
A.A.S 100 44.13 53.32 9.19 0.984 – 0.946A.A.S 500 57.88 54.87 −3.01 0.966 – 0.926Bayer 500 82.06 81.57 −0.49 0.988 0.998 –Adiro 100 73.86 76.47 2.61 0.948 0.994 –Adiro 300 73.28 70.91 −2.37 0.949 0.977 –Aspirina C* 12.37 12.95 0.58 0.97 – –Dolmen* 14.71 16.44 1.73 0.951 – –ABB
o(
%
witv
hU
spirine Nicholas 80.13 76.96ioplak 250 71.84 71.34ioplak 125 72.09 67.84
* Effervescent tablets.
f LOF should be selected according to the noise in the spectra (Eq.2)):
LOF = 100 ×√∑M
m
∑Nn e2
mn�∑Mm
∑Nn x2
mn�
(2)
here emn� and xmn� represent each point of the residuals and orig-nal three way array, respectively. A very used criterion is to stop
he iterations when the difference between two consecutive %LOFalues is below 0.1%.Before starting the iterations, initial estimates are required toelp the algorithm to converge to the absolute minimum error.sing the pure spectra of the components (if they are available)
Fig. 4. Concentration maps for ASA obtai
−3.17 0.963 0.997 –−0.5 0.993 0.997 –−4.25 0.986 0.994 –
as initial estimations becomes one of the most attractive ways ofincluding information about the sample. Other constraints can beused to correctly decompose the matrix when chemical images areanalyzed: (1) non-negativity in concentration and/or spectral pro-files, which imposes that concentration profiles of the componentsare supposed to be always positive; and (2) closure, where eachpixel can be supposed to accomplish a constant mass balance of 1,representing the totality of the concentration.
However, the quality of the images, which depends on the spatialand also spectral resolution, could be a disadvantage when MCR-ALS is applied since there could be lack of selectivity in the surfaceof the image. To overcome this problem an alternative has alreadybeen formulated: The augmentation of the original sample with
ned by using Augmented MCR-ALS.
J. Cruz et al. / Talanta 80 (2009) 473–478 477
distri
iaibamht
3
3
tetMdiosf
conwc
Fig. 5. Histograms for the ASA
mages of the pure analytes (Fig. 1b). The original idea consistednalyzing several samples simultaneously by augmenting all themages [17]. In the present work, the augmentation is performedy inserting images of pure components as it is shown in Amigond Ravn [20]. These images of pure components can be easilyeasured in the same way as the commercial tablet. This approach
elps to minimize the problem and offers valuable information tohe algorithm.
. Results and discussion
.1. MCR-ALS and augmented MCR-ALS analysis
Fig. 2 offers a first impression of the main differences betweenablets; these differences are expected since the composition ofach tablet depends on the different excipients; however, the spec-ral band of ASA (around 1680 nm) can be observed in all spectra.
oreover, the tablets AAS, Adiro and Bioplak can be distinguished inepending on the different origins, because they present very sim-
lar spectra between them and can be clearly distinguished fromther formulations. On the other hand, Dolmen and Aspirina C meanpectral profiles are very similar despite the fact that they comerom different manufacturers.
Several pretreatments were tested with the images, and the
ombination of SNV and smoothing average with a window sizef 7 points provided the best results. Prior to apply MCR-ALS,on-negativity of concentration profiles and closure constraintere applied as constraints. Despite the fact that the tablets wereomprised by a different number of components, closure constraint
bution on the surface tablets.
was applied taking into consideration the Active PharmaceuticalIngredient (ASA) and the main excipients for each of the tablet (MCCor Manitol for 8 tablets and the whole formulation for Dolmen andAspirina C). Therefore, the spectral profiles obtained by MCR-ALSwill provide information about the goodness of the decompositionof images. Moreover, ASA and the excipients used in this study pro-vided the highest spectral information and were used to performthe MCR-ALS analysis, while the minor excipients may be relatedwith the residual matrix. The pure spectra of the main componentswere included as initial estimations to start the iterations. The samemethodology has been followed when the augmented version ofMCR-ALS was applied, including 10 spectra for both analytes (ASAand major excipient) to the unfolded matrix in order to improvethe decomposition. To test the MCR-ALS decomposition, %LOF andcorrelation coefficient between pure spectra and obtained spectralprofile were used.
As an example, the %LOF of the MCR-ALS model applied toAspirine Nicholas 500 was 2.79%, explaining 99% of variance, indicat-ing the goodness of the model. Moreover, quantitative results fromthis tablet were accurate compared to the formulation percent-age (77.5% for ASA while theoretical value is 80.1%). Nevertheless,the correlation coefficient between the obtained spectral profile forASA and MMC with the pure spectrum was lower than 1 (0.76 and0.51 respectively).
To overcome this problem, the augmented version of MCR-ALS was applied. The augmentation was developed by includingselective information (10 pure spectra) for each component inthe image. The same pretreatments for the image and restric-tions were applied. The model obtained with Augmented-MCR
4 nta 80
Avtpmct
srctasc
3
bfgfAcMsLnetm
coitt
Aq0a0cv
wdmhbvas
stmrpnoc
[
[
[
[
[[
[
[
[
[
[[[
78 J. Cruz et al. / Tala
LS showed quite similar values for %LOF (3.55) and explainedariance (99.87%), providing also quite good results in the quan-itative analysis. As it can be seen in Fig. 3a and b, the spectralrofiles obtained with the augmented version of MCR-ALS perfectlyatched with the pure spectra of each compound. Correlations
oefficients between these spectra, shown in Table 2, are closedo 1.
The concentration map calculated for ASA using this modelhowed the distribution on the surface of the tablet and someegions with different concentrations of ASA. At first sight, ASAould be thought not to be well distributed in the tablet. However,he colour scale of this image showed a narrow range, between 0.70nd 0.78. Therefore, the ASA content in each pixel was similar ashowed the histogram of the concentration map with a distributionlose to a Gaussian distribution (Fig. 3d).
.2. Results for all the commercial tablets
Table 2 shows the quantitative results for the 10 tablets obtainedy using augmented MCR-ALS. The concentration for ASA in the sur-ace of the tablets was similar to the calculated value confirming theoodness of the quantitative analysis. Good results were obtainedor almost all of the samples (the spectral correlation between pureSA spectrum and the spectral profile for ASA in all samples waslose to 1 confirming the goodness of the application of augmentedCR-ALS). Tablets with Manitol as the main significant excipient
howed not so good results for the determination of ASA content.ooking at their correlation coefficients with Manitol, they wereot so close to 1. It might be caused by the influence of anotherxcipient with a high spectral relevance providing information tohe image, but avoiding the correct decomposition of the data
atrix.On the other hand, samples where the ASA content was lower
ould be waited to show bad predictive results. However, the usef all pure spectra allowed obtaining quite good results. Taking
nto account the fact that closure constraint was applied and inhese samples, ASA is not the most relevant spectral compound,he decomposition of the image could have been less successful.
Despite of using all the compounds in the analysis of Dolmen andspirina C, the correlation coefficients obtained were not of highuality. For Aspirina C the correlation coefficients obtained were.851 for Citric Acid, 0.957 for Ascorbic Acid and 0.995 for Carbon-te whereas for Dolmen the coefficients obtained were 0.856 and.823 for Ascorbic Acid and Carbonate respectively. However, ASAoncentration obtained in both tablets was truly similar with realalues.
All the concentration maps for ASA are depicted in Fig. 4,here different distributions of the ASA were observed. As already
escribed for the Aspirine Nicholas 500, the first impression might beisleading, because of the scale of the colour maps. Therefore, the
istogram for each ASA concentration map was depicted in Fig. 5 foretter interpretation. Ideally, one would expect a histogram whosealues were around the prediction values, and with a narrow vari-tion, implying that the whole surface of the tablet contained theame amount of ASA.
Looking at the histograms of the local concentration it was pos-ible to correctly visualize tablets with best ASA distributions. Thus,he tablets with narrowest ASA distribution were: Aspirine C, Dol-en, Bayer 500 (according to the prior conclusion). Although the
ange for ASA 100 tablet was not as narrow as for the other 3 sam-les, the distribution of concentration values remained close to aormal distribution. For the other samples, the visual inspectionf the concentration maps and the representation of histogramsonfirmed a less regular distribution for the ASA in the surface.
[[[
[
(2009) 473–478
4. Conclusions
Intact commercial tablets were analyzed by NIR-Chemical Imag-ing in order to determine de distribution of ASA and its ASAconcentrations for each tablet using the MCR-ALS decomposition.The quantification results in combination with the spectral profilesobtained provided information about of the 10 commercial tabletsquality.
MCR-ALS decomposition de applied to images to obtain accu-rate information of the surface demonstrated to be an appropriatetool to obtain quantitative information of ASA content on the sur-face of the tablets. In addition, the augmented version of MCR-ALSdemonstrated to be an outstanding methodology to overcome theproblems of MCR-ALS decomposition itself.
The distribution of ASA in the surface and the mean concentra-tion were correctly calculated without needing a calibration modelwith reference values. The quantitative results obtained were ofquality, especially for the tablets whose major ingredient was ASA.
The low time of analysis without altering the sample and thegood results obtained, make the combination of NIR-Imaging andMCR-ALS a very interesting approach in the pharmaceutical fieldfor the quality control assessment of final preparations.
Acknowledgement
The authors are grateful to Spain’s MCyT for funding thisresearch within the framework of Project CTQ2006-12923.
References
[1] J. Luypaert, D.L. Massart, Y.V. Heyden, Talanta 72 (2007) 865.[2] M. Blanco, M. Bautista, M. Alcala, Journal of Pharmaceutical Sciences 97 (2008)
1236.[3] S.S. Sekulic, H.W. Ward, D.R. Brannegan, E.D. Stanley, C.L. Evans, S.T. Sciavolino,
P.A. Hailey, P.K. Aldridge, Analytical Chemistry 68 (1996) 509.[4] O. Berntsson, L.G. Danielsson, B. Lagerholm, S. Folestad, Powder Technology 123
(2002) 185.[5] L. Zhang, M.J. Henson, S.S. Sekulic, Analytica Chimica Acta 545 (2005)
262.[6] F.C. Clarke, M.J. Jamieson, D.A. Clark, S.V. Hammond, R.D. Jee, A.C. Moffat, Ana-
lytical Chemistry 73 (2001) 2213.[7] J. Medendorp, R.A. Lodder, Journal of Chemometrics 19 (2005) 533.[8] F. Clarke, Vibrational Spectroscopy 34 (2004) 25.[9] E.N. Lewis, J. Schoppelrei, E. Lee, Spectroscopy 19 (2004).10] R.C. Lyon, D.S. Lester, E.N. Lewis, E. Lee, L.X. Yu, E.H. Jefferson, A.S. Hussain, AAPS
PharmSciTech 3 (2002) 1.[11] E.N. Lewis, J.D. Carroll, F.M. Clarke, NIR News 12 (2001) 16.12] N. Jovanovic, A. Gerich, A. Bouchard, W. Jiskoot, Pharmaceutical Research 23
(2006) 2002.13] T. Furukawa, H. Sato, H. Shinzawa, I. Noda, S. Ochiai, Analytical Sciences 23
(2007) 871.14] N. Elkhider, K.L.A. Chan, S.G. Kazarian, Journal of Pharmaceutical Sciences 96
(2007) 351.15] E.N. Lewis, L.H. Kidder, E. Lee, Innovations in Pharmaceutical Technology (2006).16] P. Geladi, H. Grahn, Multivariate Image Analysis, John Wiley & Son Ltd., New
York, 1997.17] A. de Juan, R. Tauler, R. Dyson, C. Marcolli, M. Rault, M. Maeder, Trac-Trends in
Analytical Chemistry 23 (2004) 70.18] J.M. Amigo, J. Cruz, M. Bautista, S. Maspoch, J. Coello, M. Blanco, Trac-Trends in
Analytical Chemistry 27 (2008) 696.19] C. Ravn, R. Bro, E. Skibsted, Journal of Pharmaceutical and Biomedical Analysis
48 (2008) 554.20] J.M. Amigo, C. Ravn, European Journal of Pharmaceutical Sciences,
doi:10.1016/j.ejps.2009.01.001 (accepted for publication).21] C. Gendrin, Y. Roggo, C. Collet, Talanta 73 (2007) 733.22] B.O. Budevska, S.T. Sum, T.J. Jones, Applied Spectroscopy 57 (2003) 124.23] K. Awa, T. Okumura, H. Shinzawa, M. Otsuka, Y. Ozaki, Analytica Chimica Acta
619 (2008) 81.
24] http://www.vademecum.es.25] http://www.models.kvl.dk/users/jose manuel amigo/index.htm.26] J. Jaumot, R. Gargallo, A. de Juan, R. Tauler, Chemometrics and Intelligent Labo-ratory Systems 76 (2005) 101.27] A. de Juan, R. Tauler, Critical Reviews in Analytical Chemistry 36 (2006)
163.
ANEXO
181
8. ANEXO
ANEXO
182
ANEXO
183
8. ANEXO
En el anexo se recogen los artículos publicados en fecha posterior a la aceptación
por parte de la Comissió de Doctorat de la presentación de la tesis como compendio
de publicaciones así como artículos pendientes de publicar.
1) Uniformity studies of commercial aspirin tablets by NIR-CI. J. Cruz, M. Blanco.
2) Distribution study of components and film coating in pharmaceutical tablets
by NIR-CI. M. Blanco, A. Palou, J. Cruz, M.Alcalà, J.Tomàs, J. de los Ríos.
3) NIR-CI study of Aspirin commercial tablets. J.Cruz, M. Blanco. Proceedings of
the 14th International Conference on Near infrared spectroscopy (Bangkok, 2009), NIR
Publications. ( pendiente de publicación)
ANEXO
184
ANEXO
185
8.1) UNIFORMITY STUDIES OF
COMMERCIAL ASPIRIN TABLETS
BY NIR-CI
J.Cruz, M.Blanco
ANEXO
186
ANEXO
187
Uniformity studies of commercial aspirin tablets by NIR-CI
J. Cruz, M. Blanco
Unitat de Química Analítica, Facultat de Ciencies, Universitat Autònoma de Barcelona,
08193 Bellaterra, Barcelona, Spain
Abstract
Near Infrared Chemical Imaging (NIR-CI) is arousing increasing interest in pharmaceutical
analysis by virtue of its ability to provide a wealth of information from a single sample.
Among others, NIR-CI has enabled the determination of the quantitative composition and
distribution of acetylsalicylic (ASA) from the analysis of commercial tablets. In this work,
we analysed ASA commercial tablets of four different brands purchased at local chemists.
The nominal ASA concentration for the brands was calculated from the nominal content and
weight of each tablet. The tablets were found to span an ASA concentration range of 71–
82%, and to differ in size and composition between brands.
The API content and its uniformity were determined by applying quantitative algorithms to
to global hyperspectral image and to each one for ten tablets. Multi¬variate Curve
Resolu¬tion–Alternating Least Squares (MCR–ALS) and Isys-PLS1 (commercial Malvern
software named PLS1) were used to quantify each pixel in the images to obtain appropriate
concentration maps. No prior calibration or reference data were needed for quantitation.
Both algorithms provided very similar results that were close to the nominal concentrations
used as references. Application to an image for 10 tablets and an individual tablet
quantita¬tion of the API allowed us to obtain the Accepted Value (AV) as defined by the
European Pharmacopoeia. We conclude all brands were found to meet the specifications.
ANEXO
188
Keywords: NIR-CI; Hyperspectral imaging; Acetylsalicylic acid; Aspirin tablets;
Distribution homogeneity; Content uniformity; MCR–ALS; Isys-PLS1.
1. Introduction
The inception of hyperspectral imaging techniques has facilitated not only addressing some
problems unaffordable by conventional NIR spectroscopy but also developing new
applications to obtain a more comprehensive knowledge about some samples and improving
some existing procedures. The NIR-CI technique has been successfully used in a variety of
fields ranging from the food industry [1] to legal medicine [2] to cultural heritage [3].
The use of NIR-CI as a new operational methodology in pharmaceutical analysis has grown
substantially in recent years and turned the technique become an accurate, robust choice for
pharmaceutical control and the determination of quality-related properties of formulations at
different production stages. The increasing interest aroused by this technique has reflected in
the development of a number of applications including the determination of distribution
homogeneity in tablets [4], mixing homogeneity in powder samples [5], content uniformity
in tablets [6], coating studies [7] and particle size [8], among others.
The ability of NIR-CI to extract quantitative and distribution-related information about
tablet components has turned it into a PAT tool [9] and facilitated quality assurance in the
end-product [10].
A hyperspectral image consists of a three-dimensional data cube where two dimensions are
spatial coordinates (pixels) and the third contains spectral information (wavelengths);
therefore, it provides one spectrum per pixel and hence a vast amount of both spatial and
ANEXO
189
spectral information (usually more than 80.000 spectra per sample) that can be acquired in a
very short time (1–2 min). Such a vast amount of data obviously requires the use of an
efficient chemometric method to extract the physical or chemical information of interest in
each case.
Many of the algorithms used with conventional NIR spectroscopy have also been used to
process 3D data arrays in order to extract qualitative and quantitative information. The
actual usefulness of each algorithm for this purpose depends on the particular problem
addressed and also on the specific information available. Therefore, the optimum algorithm
differs between applications.
The algorithms most frequently used in conventional NIR analysis, PLS and PCR, require
using a set of calibration samples to construct an appropriate prediction model. This sample
preparation is laborious, which constitutes an important limitation for its application.
Nevertheless, some applications for PLS have been described for the API determination in
pharmaceutical samples and components in binary samples (lysozyme and trehalose
mixtures) [11, 12].
Classical Least Squares (CLS) methodology [13] may be an effective, attractive choice here
inasmuch as it requires no calibration set, but only the pure spectra for the sample
components. This, however, may hinder application of NIR-CI when the sample
composition is not accurately known.
Some alternative algorithms requiring no calibration set have proved effective in those cases
where the exact composition of the sample is unknown or the spectrum for some component
is unavailable. Thus, Multivariate Curve Resolution–Alternating Least Squares (MCR–PLS)
methodology [14] and its expanded version have been successfully used to extract
quantitative information from pharmaceutical samples by use of an imaging technique
ANEXO
190
[4,15]. Therefore, MCR–ALS can in theory be an effective tool for quantifying
pharmaceutical components without the need for a calibration model, but simply to use the
spectra for the major components of the product in pure form.
Some authors have used the software Isys 5.0 from Malvern named PLS1 (Isys-PLS1),
which uses the pure spectra for the formulation components as calibration information [16-
18]. This algorithm constructs a spectral matrix for the pure components and a response
matrix consisting of the digits 1 and 0, which are used to indicate membership and non-
membership, respectively, to the class for each pure component (this software act as PLS-
discriminant). Applying the algorithm to the spectra constituting an image provides a
concentration map for each modelled sample component; together with the corresponding
histograms, the concentration maps provide a highly useful tool for establishing the
distribution of each component in the sample.
This article continues an study applied to the resolution of hyperspectral images of
commercial tablets [4], but regarding against other applications, an unique image of 10
tablets has been used. Only the publication of Lee et al [6] undertakes a similar study, but
the purposed quantification method is very simple and its application is restricted to some
particular situations for the determination of API, but it does not make a study on the
distribution of excipients.
This study pretends to compare the analytical quality of the results obtained by the
application of two quantitative algorithms and in its difficulty of application (purposing as a
standard for the treatment of hyperspectral images).
ANEXO
191
The last objective is to define the appropriate method to approach the problem of the
quantitation and distribution studies in pharmaceutical tablets, without previous information
to undertake this study.
The content uniformity tests are used for proving the uniform distribution of the active
content in a production batch. It is performed by measuring the active content of n
individual dosage units.
Additionally the determination of content uniformity, defined by the European
Pharmacopoeia [19], by using a single hyperspectral image of 10 tablets will be studied, as
an alternative to the traditional methods which can be supposed as an important
improvement in the speed and easiness of this test.
2. Materials and methods
2.1. Samples
The samples studied were commercial aspirin tablets of four different brands that were
purchased at local chemists. The acetylsalicylic acid (ASA) concentration in each tablet was
calculated by dividing the nominal content into the average weight of 10 tablets. The
concentrations thus obtained ranged from 71 to 82 wt%. One additional criterion used in
selecting brands for study was tablet size.
The exact composition of each formulation was unknown and the sole information available
in this respect (the nature of the major excipient, which was microcrystalline cellulose in the
four brands) was obtained from the Vademecum [20]. Table 1 summarizes the
characteristics of the studied tablets.
ANEXO
192
Table 1. Features of commercial Aspirin tablets.
Commercial Brand
Nominal ASA (mg)
Diameter (mm)
Mean tablet Weight *(g)
Calculated Concentration (%)
Main Excipient
Bayer 500 500 120 0.6037 82.8
Adiro 100 100 72 0.1368 73.1
Bioplak 250 250 100 0.3427 73.0
Bioplak 125 125 70 0.1751 71.4
MCC
* 10 tablets per commercial brand.
2.2. Instruments
All images were obtained with a Roda-25 focal plane imaging NIR spectrometer from Think
Spectrally (Valencia, Spain), equipped with an MCT 320x256 pixel detector and an LCTF
monochromator spanning the wavelength range 1200–2400 nm with a resolution of 7 nm.
Lighting was provided by four halogen lamps placed around the sample and tilted 45�.
Acquiring a reflectance image spanning the whole wavelength range took about 2 min. The
distance between the camera lens and sample plate was adjusted in accordance with whether
the image to be recorded should contain ten tablets of different size for each brand (see table
1).
2.3. Software
We used the graphical user interface (GUI) software TS_Capture, bundled with the
Hyperspectral TS camera, from Think Spectrally, to control the camera and lighting for the
acquisition of images. The hardware was calibrated by using TS_GUI, a graphical user
interface for MatLab also bundled with the camera.
All spectral treatments were applied by using customized routines developed in MATLAB
code (MATLAB v. 7.0, The MatWorks, Massachussetts) available for download on the
ANEXO
193
Internet [21]. The MCR–ALS software used, which also operates under MATLAB, was
obtained elsewhere [22].
The Isys-PLS1 algorithm was implemented with the software Isys 5.0 from Malvern
Instruments (Malvern, UK).
2.4. Recording of images
The recording of images was preceded by calibration of the instrument with six AP-0200
NIR standards of 99, 80, 40, 20, 10 and 0.2% reflectance from FOSS NIRSystems (Silver
Springs, MD). Images were obtained with 7 nm resolution over the wavelength range 1200–
2100 nm.
Recording the images for 10 tablets at once (Figure 1 ) entailed placing the sample plate at a
greater distance from the camera lens and refocusing it to ensure as high optical resolution
as possible. This allowed a spatial resolution of 200200 μm2 and a total image size of
6550 mm2 to be obtained.
Placing the samples farther from the lens in order to widen the focal field altered the lighting
angle of the lamps and the amount of light impinging on the sample. This required
recalibrating the camera.
The images for pure acetylsalicylic acid and microcrystalline cellulose (the major excipient
in the four formulations) were obtained by placing the powder samples in a cylindrical glass
cell about 3.8 cm in diameter and pressing their surface with a metal disc to obtain a flat
surface.
ANEXO
194
2.5. Processing of hyperspectral images
The hyperspectral image for a sample is a 3D data cube represented by the expression
X = (M x N x λ), where M and N are the spatial dimensions and λ denotes spectral
information. The three-dimensional nature of the image requires its deconvolution into a
two-dimensional matrix in order to facilitate spectral processing or application of a
multivariate model.
The influence of unwanted phenomena frequently affecting NIR spectra was suppressed by
using two different spectral treatments, namely: Standard Normal Variate (SNV), and
Savitzky–Golay smoothing with a 7-point window and fitting to a second-order polynomial.
The treatments were followed by application of the previous chemometric algorithms to the
data matrix.
The theoretical foundation of the Multivariate Curve Resolution–Alternating Least Squares
(MCR–ALS) algorithm and its expanded version, and their application to hyperspectral
images, are widely documented; interested readers can find comprehensive information
about it elsewhere [10, 14, 15]. The unfolded matrix obtained from each image was
expanded with 50 spectra for the API and 50 for microcrystalline cellulose (MCC).
Application of the Isys-PLS1 algorithm to the spectral data, required the prior compilation
of a reference library containing at least one spectrum per target component. The spectra in
the library were used to construct a PLS classification model that was subsequently applied
to the hyperspectral images. The resulting model assigned a classification score ranging
from 0 to 1 to each sample. Application of the Isys-PLS1 model to the image for the tablets
provided a concentration map for each component stored in the library.
ANEXO
195
3. Results and discussion
Each image was processed with the above-described calibration algorithms on the grounds
of the characteristics of the samples and available information. The camera was used to
obtain images for ASA and MCC, and their spectra used as rough estimates for the two
computational algorithms. Spectra were subjected to various treatments, and SNV and
Savitzky–Golay smoothing with a 7-point window found to provide the best results.
Computations with the MCR–ALS algorithm were subjected to concentration non-
negativity and closure restrictions. Although the tablets contained different components, the
closure restriction was applied with provision for the API (ASA) and major excipient
(MCC) alone. Because the original unfolded matrix resulted in poor fitting, it was expanded
with 50 spectra for each analyte (ASA and MCC); this expanded matrix afforded better
fitting and more accurate determination of both components.
The Isys-PLS1 algorithm was used to construct models based on various factors. The
images for pure ASA and MCC were used to compile a library of spectra obtained from a
central zone in each image containing about 100x100 pixels. Such a library was used to
construct Isys-PLS1 models with 4–8 PLS factors depending on the analyte to be quantified
which were subsequently applied to the hyperspectral images. In this way, concentration
maps where the intensity of each pixel was measured by the predicted degree of similarity
(on a scale from 0 to 1) for the spectrum at the pixel in question with respect to the reference
spectra. A similarity of 0 meant that the component was absent, and a value of 1 that the
component was present at a 100% concentration at the pixel concerned. The red color in the
reported images is indicative of an increased concentration of the particular component.
ANEXO
196
The API quantitation has been done by two different ways: by applying the quantitative
algorithm to the complete image of the 10 tablets (mean batch value) or by selecting the part
of the image that corresponds to each individual tablet (study of content uniformity).
The structure of the images is shown in Figure 1, with the 10 tablets spatially distributed;
the hyperspectral image contains apart from the spectra corresponding to each one of the
tablets, the spectra corresponding to the background. These background spectra are a
limitation for the correct calculation of concentrations, the elimination of background
spectra is performed by a routine of Isys 5.0 getting the image ready for the application of
Isys-PLS1. The application of MCR-ALS requires the use of unfolded data matrices, for this
purpose a MatLab routine [22] is applied to the data cube. and the unfolded matrix of
tablets spectra is obtained.
Figure 1. Concentration maps and histograms for ASA and MCC calculate with MCR-ALS.
After these algorithms have been applied, the mean concentration value of 10 tablets of the
batch is obtained; the values obtained by the application of both algorithms are shown in
Table 2. The mean values calculated by Isys batch-PLS1 and MCR-ALS are very similar to
ANEXO
197
each other although the former are more close to the nominal values. Only Bioplak 125
values calculated with MCR-ALS show discrepancies that do not exceed 2%.
Table 2. MCR-ALS and PLS1 results for mean batch ASA concentration
Tablets Nominal concentration (%)
PLS1 Mean Batch Value
MCR-ALS Mean Batch Value
Bayer 500 82.8 83.6 82.7
Adiro 100 73.1 73.5 73.8
Bioplak 250 73.0 73.8 72.7
Bioplak 125 71.4 73.4 69.4
An alternative for determining the concentration, is the individual analysis of each tablet
which concentrations were calculated by cropping the image for each tablet and removing
the background. The elimination of background spectra is performed for each cropped
image from a tablet in the same way that has been explained before for the global analysis of
10 tablets.
Application of both models to commercial tablets of four different brands provided similar
results (see table 3); however, the calculated concentration ranges ─and hence their standard
deviations─ were narrower with PLS than with MCR. The average concentrations provided
by both algorithms were within the confidence interval for the nominal value used as
reference.
The size of the tablets is an important parameter to frame 10 tablets in the visual field of the
hyperspectral camera, the different sizes of tablets require distance changes between the
sample plate to the camera lens to get a correct focused image. These optical configuration
changes also can affect the intensity of incident light on the 10 tablets which can affect the
quality of the images and finally their quantitation.
ANEXO
198
Summarizing, the application of both quantitation algorithms to, both individual and joint,
commercial tablets of four different brands provided similar results.
3.1. ASA and MCC distribution in the tablets
Figure 1 shows the concentration map for and ASA and MCC as calculated with the MCR–
ALS algorithm, as well as the histograms for a Bayer 500 aspirin tablet, obtained from the
image for 10 tablets. As can be seen, both components were evenly distributed throughout
the image and no API or excipient clustering zones were observed. Also, the histograms for
both reveal a very narrow range of concentration values and a maximum close to the
average predicted value. These results suggest that ASA and MCC are uniformly distributed
in the tablets showing an appropriate homogenization of API and main excipient in the
samples. Those observations about homogeneity of distribution can be extended for Adiro
100, Bioplak 250 and Bioplak 125.
However, the figure exposes some deficiencies in distribution at image edges which can be
ascribed to inadequate lighting of the 10 tablet samples; this resulted in a poor hyperspectral
image that hindered proper resolution of tablet edges with the quantitation algorithms. No
similar effect was observed on the hyperspectral images for individual tablets [4], which
were acquired under better lighting and resolution conditions. The effect was especially
marked in the image for the larger tablets (Bayer 500 and Bioplak 250) and less so in that
for the smaller tablets (Adiro 100 and Bioplak 125).
This shortcoming can be avoided by using an instrument with greater spatial resolution and
more uniform lighting of the object.
The concentration maps obtained with Isys-PLS1 were virtually identical with those
provided by MCR–ALS as regards spatial distribution of ASA and MCC in the tablets.
ANEXO
199
Also, the histograms exhibited a very narrow concentration distribution with a maximum
close to the average predicted value.
3.2. Content uniformity
Content uniformity was assessed from the 10 tablet image for each brand, using the
recommendations of the European Pharmacopoeia. Table 3 show the results obtained for
each tablet as obtained by using the two algorithms. The tables list the average nominal
value for the 10 tablets of each brand, the calculated value obtained from the average for the
10 tablets, the standard deviations of the concentrations and the Acceptance Value (AV) as
defined by the European Pharmacopoeia.
Table 3. MCR-ALS and Isys-PLS1 results for content uniformity test
Isys-PLS1 MCR-ALS
Tablets Nominal concentration (%)
Mean Value
Range Values
Std. deviation
Acceptance value
Mean Value
Range Values
Std. deviation
Acceptance value
Bayer 500 82.8 83.3 84.8-82.1 0.9 1.3 82.4 84.0-79.4 1.5 1.9
Adiro 100 73.1 73.5 77.1-70.3 2.0 2.6 72.6 76.5-68.1 2.5 4.4
Bioplak 250 73.0 73.7 76.1-71.2 1.9 4.7 72.7 77.9-68.7 2.7 1.9
Bioplak 125 71.4 72.6 74.9-69.4 1.9 7.6 69.7 74.7-67.2 2.2 12.9
A.V. limit for n=10 is 15
The European Pharmacopoeia recommends assessing content uniformity by computing AV
and comparing it with a previously established limit for the acceptance range [19]. AV is
calculated from the following equation
AV=|M − X |+k•s
ANEXO
200
where M is the reference value, X the average value for individual tablets, k a constant equal
to 2.4 for n = 10 and s the standard deviation. The content uniformity requirement is
assumed to be met if AV for the first dosing units examined is equal to or less than 15.
As can be seen from Table 3, the AV values obtained for the four brands were all below 15,
so the brands can be deemed compliant with the requirements of the European
Pharmacopoeia. Also, the only brand exhibiting a relatively high AV value was Bioplak 125
with the MCR–ALS algorithm; such value (12.9), however, was still below the limit (15).
These results are not conclusive enough to identify the better quantitation algorithm; in fact,
although Isys-PLS1 provided slightly better values, the AV predictions and their standard
deviations were very similar with MCR–ALS. In any case, they confirm that a single image
allows one to certify content homogeneity in a tablet batch.
4. Conclusions
As shown here, NIR-CI affords the analysis of intact tablets by using exclusively
quantitative information about their excipients. The MCR–ALS and Isys-PLS1 algorithms
are effective with a view to extracting quantitative information from images and only
require the spectra for the pure API and major excipient as references.
The procedure used in his work allows one to obtain distribution images for both
components in individual tablets, and hence to assess distribution homogeneity and confirm
it against a concentration histogram. The Isys-PLS1 algorithm provides slightly better
results than the MCR–ALS algorithm in this respect.
A single image for 10 tablets allows one not only to determine the API concentration in
each, but also to assess content uniformity in a production batch as per the
ANEXO
201
recommenda¬tions of the European Pharmacopoeia. This makes the proposed procedure
more simple and expeditious than available alternatives for the same purpose.
In summary, the results of this work further testify to the increasingly prominent role of
chemical imaging techniques as QbD choices and their significance to PAT.
5. Acknowledgements
The authors are grateful to Spain's MICINN for funding this research within the framework
of Project CTQ2009-08312.
6. References
[1] E.N. Lewis, J. Dubois, L.H. Kidder, in Y.Ozaki, W.F. McClure, A. Christy (Eds.), NIR imaging and its applications to agricultural and food engineering, Wiley-Interscience, 2006 Ch. 4.3. [2] C. Petibois, G. Deleris, Trends in Biotechnology. 24 (2006) 455-462. [3] G. Verhoeven, Journal of Archaeological Science. 35 (2008) 3087–3100. [4] J. Cruz, M. Bautista, J.M. Amigo, M. Blanco, Talanta. 80 (2009) 473. [5] J.M. Amigo, J.Cruz, M.Bautista, S.Maspoch, J.Coello, M.Blanco, Trends in Analytical Chemistry. 27 (2008) 696. [6] E. Lee, W.X. Huang, P. Chen, E.N. Lewis, R.V. Vivilecchia, Spectroscopy. 21 (2006) 24-32. [7] C.Cairós, J.M.Amigo, R.Watt, J.Coello, S.Maspoch, Talanta. 79 (2008) 657-664. [8] W. Li, A. Woldu, R. Kelly, J. McCool, R. Bruce, H. Rasmussen, J. Cunningham, D. Winstead, International Journal of Pharmaceutics. 350 (2008) 369–373. [9] E.N. Lewis, L.H. Kidder, E. Lee, Innovations in Pharmaceutical Technology (2006) 17. [10] J.M. Amigo, C. Ravn, European Journal of Pharmaceutical Sciences. 37 (2009) 76–82. [11] N. Jovanovic, A. Gerich, A. Bouchard, W. Jiskoot, Pharm. Res. 23 (2006) 2002–2013. [12] C. Gendrin, Y. Roggo, C. Collet, Talanta. 73 (2007) 733. [13] M. B. Lopes, J. C. Wolff, J. M. Bioucas-Dias, M. A. T. Figueiredo, Analytica Chimica Acta, 641 (2009) 46-51. [14] A. de Juan, R. Tauler, R. Dyson, C. Marcolli, M. Rault, M. Maeder, Trends in Analytical Chemistry. 23 (2004) 70.
ANEXO
202
[15] K. Awa, T. Okumura, H. Shinzawa, M. Otsuka, Y. Ozaki, Analytica Chimica Acta. 619 (2008) 81. [16] L.J. Makein, , L.H. Kidder, E.N. Lewis, M. Valleri, NIR News. 19 (2008) 11-15. [17] T. Puchert, D. Lochmann, J.C. Menezes, G. Reich, Journal of Pharmaceutical and Biomedical Analysis. 51 (2010) 138–145. [18] S. Chevallier, D. Bertrand, A. Kohler, P. Courcoux, J. Chemometrics. 20 (2006) [19] European Council (Ed.), European Pharmacopeia 6 th edition, 2008b. Uniformity of dosage units. Vol 1 (2008) Ch. 2.9.40, pp.327–330. [20] http://www.vademecum.es [21] http://www.models.life.ku.dk/~jose/ [22] J. Jaumot, R. Gargallo, A. de Juan, R.Tauler, Chemometrics and Intelligent Laboratory Systems. 76 (2005) 101.
ANEXO
203
8.2) DISTRIBUTION STUDY OF
COMPONENTS AND FILM
COATING IN PHARMACEUTICAL
TABLETS BY NIR-CI
M. Blanco, A. Palou, J. Cruz, M.Alcalà, J.Tomàs,
J. de los Ríos
ANEXO
204
ANEXO
205
Study of the distribution of drug components and film coatings in pharmaceutical
tablets by NIR-CI
Marcelo Blanco,a Anna Palou,a Jordi Cruz,a Manel Alcalà,a Jaume Tomàs,b Joaquín de los
Ríosb
a Unitat de Química Analítica, Departament de Química, Facultat de Ciències, Universitat
Autònoma de Barcelona, 08193 Bellaterra, Barcelona, Spain
b Esteve Farma, c/ San Martí s/n, 08197 Martorelles, Barcelona, Spain
ABSTRACT
The growing interest of the pharmaceutical industry in Near Infrared-Chemical Imaging
(NIR-CI) is a result of its high usefulness for quality control analyses of drugs throughout
their production process (particularly of its non-destructive nature and expeditious data
acquisition). In this work, we determined the concentration and distribution of the
components of pharmaceutical tablets, in addition to their coating thickness and distribution,
from NIR-CI data. Images were processed to extract the target data and calibration models
constructed by using the Partial Least Squares (PLS) and Isys-PLS1 algorithms. The
component concentrations obtained for uncoated cores were essentially identical with the
nominal values for the pharmaceutical formulation. On the other hand, the predictive ability
of the models used with coated tablets decreased with increasing coating thickness. Based
on the results, the tablet components (API and excipients) are uniformly distributed in the
tablet core and its coating.
Keywords: NIR-CI; Hyperspectral imaging; Component distribution; Tablet coating; Isys-
PLS1; PLS regression.
ANEXO
206
1. Introduction
Near Infrared-Chemical Imaging (NIR-CI) is a technique based on conventional NIR
spectroscopy with the added advantage that it affords recording of a large amount of both
spectral and spatial information in a single image. While the conventional NIR technique
only provides the average spectrum for the surface of each sample, NIR-CI gives one
spectrum per pixel in each acquired image and hence much more information about the
whole sample surface (Gowen et al., 2007). The ease with which such information can be
obtained with NIR-CI has aroused interest in NIR-CI in many fields of study. This is
particularly so with the analysis of pharmaceutical products, which is made especially easy
by NIR-CI by virtue of its ability to acquire a vast amount of information in an expeditious
manner, all without altering the sample. The increasing interest aroused by NIR-CI in the
pharmaceutical field is apparent from the variety of studies based on this technique reported
in recent years. Such studies include the homogeneity of powder samples (Ma et al., 2008),
particle size determinations (Li et al., 2008), product composition (Lopes et al., 2009), the
determination of the concentrations and distribution of components in solid tablets (Cruz et
al., 2009) and content uniformity (Gendrin et al., 2007), among others. Also, the many uses
of NIR-CI in the pharmaceutical industry have been the subject of two interesting reviews
(Gowen et al., 2007; Reich, 2005).
One other important factor influencing the quality of solid pharmaceuticals is their
coating. Lacquer coatings on commercial tablets have been the subject of some study
(Cairós et al., 2009; Maurer et al., 2009), but not so much as pharmaceutical components
despite their significance (Maurer et al., 2008). The coating film applied to a drug tablet is
primarily intended to improve its aesthetics and function. Thus, the coating allows the
unpleasant taste of some APIs to be masked and facilitates swallowing of tablets, in addition
to preserving their integrity and giving them a uniform appearance. Some coatings,
however, are intended to facilitate the controlled or enteric release of the dosage form of a
drug (Hogan, 2004). In any case, the exact function of a coating depends largely on its
ANEXO
207
thickness and distribution on the tablet surface. In fact, too thin or too thick a coating can
alter the effectiveness of a tablet by making the core more vulnerable to external factors or
diminishing the API release rate. Simply measuring the average thickness of the lacquer
film on a tablet is inadequate to ensure that the tablet will meet the specifications; rather,
this requires obtaining more information about the way the coating is distributed throughout
the tablet surface. The capabilities of the NIR-CI technique in this respect make it a suitable
choice for quality control in tablet production processes. However, the vast amount of
information contained in a hyperspectral image requires the use of an effective procedure to
extract it. In fact, hyperspectral data form a three-way cube that must be unfolded and
processed with appropriate two-way multivariate algorithms in order to extract the target
information.
In those cases where some component of a pharmaceutical is unknown or a spectrum
unavailable, algorithms requiring no calibration set are especially useful; such algorithms
include Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) (Zhang,
2005) and its augmented form (Amigo et al., 2008). However, the process involved in
extracting information from chemical images can be slow and cumbersome. One alternative
choice in wide use for the quantitative analysis of CI data is Partial Least Squares (PLS)
(Ravn et al., 2008). This algorithm uses a series of data distributed over a wide enough
range of specific values of the target property to allow the construction of a suitable
calibration model for the samples to be analysed. A faster, easier alternative is provided by
Isys-PLS1 (Makein et al., 2008). With this algorithm, each image is assigned a response
matrix based on the similarity of its spectra with those for the pure components. The choice
of algorithm in each case is dictated by the available and the target information.
The primary purpose of this work was to establish the distribution of components in a
tablet and the thickness and surface distribution of its coating. To this end, individual
calibration models for the components were used to construct their distribution map and a
ANEXO
208
calibration model derived from the NIR-CI hyperspectral image was used to establish the
map for the lacquer film.
2. Material and methods
2.1. Samples
We studied three different types of samples, namely: (a) cores (uncoated tablets), (b) tablets
with a coating of variable thickness and (c) production tablets. The coated tablets (b)
included samples with film thicknesses 50–300% the nominal value for the production
tablets (100%).
All cores had the same API and excipient composition, namely: 35% API and 65%
excipients. The excipient mixture contained 40% of excipient #1, 20% of excipient #2, 2%
of excipient #3, 1.5% of excipient #4 and 1.5% of excipient #5. The API and the two major
excipients in combination accounted for 95% of the tablet content. The presence of the
lacquer in the coated tablets obviously reduced the proportions of API and excipients to a
extent dependent on the coating thickness. Table 1 shows the resulting changes in the major
components.
Table 1.- Composition (% w/w) of API and the two major excipients at different coating levels.
Composition reference values (% w/w)
Coating level (%)
0% 50% 100% 200% 300%
API 35.0 34.4 33.9 33.0 32.0
E #1 40.0 39.3 38.8 37.7 36.6
E #2 20.0 19.7 19.4 18.8 18.3
The samples in groups a and b were used to determine the concentrations of the tablet
components (API and excipients). Those in group b were used as calibration and validation
sets for the PLS models employed to characterize the coating, which were subsequently
applied to the production samples (group c).
ANEXO
209
2.2. Instrumentation
Images were acquired with a SyNIRgyTM Chemical Imaging System hyperspectral camera
from Malvern Instruments (Malvern, UK). The camera was equipped with an InSb detector
with a focal plane array of 320256 pixels and controlled via the software Pixys® 1.1., also
from Malvern. Samples were placed on the plate and lighted with halogen lamps arranged at
appropriate angles around the plate, the lens distance being adjusted according to the object
size. The images obtained under the selected conditions had a resolution of 40 μm (each
pixel covered an area of 40 40 μm). The acquisition time for a reflectance image spanning
the wavelength range 1200–2400 nm was about 3 min. Prior to acquisition of the image for
the sample (S), the camera was used to record one for the background (B, a reference
ceramic plate of 99% reflectance) and another for a dark reference (D, a mirror). The image
for the sample, S, was converted into reflectance data, R, by using the equation R = (S –
D)/(B – D). This calculation was done at every pixel in each image. The data thus obtained
were then converted into absorbance units.
Each core was used to record 6 different images: 4 of each outer side (A–D) and 2 of
the inner sides (E–F) which were establish by breaking the tablets as shown in Figure 1a.
The production samples were used to study the four outer sides only, which were designated
identically with those of the cores (A–D). On the other hand, each tablet in sample group b
was used to record 2 images (one from each of two opposite outer sides); as can be seen in
Figure 1b, each image included two identical sides for 2 tablets of also identical
characteristics (coating thickness). The images were not studied in their entirety, but rather
in selected rectangular areason the inner sides of each tablet in order to avoid image
distortions caused by light impinging on tablet edges.
ANEXO
210
Figure 1.- Schema of the tablet sides analyzed by hyperspectral imaging: a) cores and tablets and b) tablets with higher coating thickness. The selected area for analysis is highlighted with dark grey color.
The images for the pure compounds were obtained by placing an adequate amount of
each in a glass cell and gently pressing its surface prior to recording.
2.3. Data processing
The data in a hyperspectral image are arranged in a three-way data cube X(MNλ) two
dimensions in which (MN) hold spatial information while the third (λ) contains spectral
information.
Prior to application of any spectral treatment or algorithm to extract the required
information, the data cube must be unfolded into a two-dimensional matrix since most
existing treatments and algorithms have been developed for two-way data. The data matrices
thus obtained here from each image were processed with the Standard Normal Variate
(SNV) algorithm, which reduces artifacts arising due to tablet geometry and sample lighting
during the recording of images. All spectral treatments used were applied by using the
software Isys 5.0, from Malvern, with routines developed in MATLAB code (MATLAB v
7.0, The MathWorks, Natick, MA) http://www.models.life.ku.dk/~jose/ .
ANEXO
211
The resulting data matrix was subjected to the PLS1 algorithm in Isys 5.0 in order to
quantify the API and excipients. Application of the Isys-PLS1 model (Puchert et al., 2010)
only required the previous acquisition of the pure spectrum for each component to be
determined. Such a spectrum was used to construct both a library and the Isys-PLS1
classification model. The model was completed by selecting an appropriate thresholds and
number of factors. Using an increased number of factors increased the variance Y explained
by the model, but also the risk of overfitting; a compromise was therefore needed for an
optimal choice. The threshold used, which allows one to adjust the limits for discrimination
between classes, is a function of the similarity between the spectrum for each pure
component to be quantified and those for the other components in addition to the number of
factors previously selected. Application of the resulting model weighted the spectral data in
an image with a factor ranging from 0 to 1 depending on the similarity between the
spectrum for the pure component and the spectral library concerned. The result was
delivered as a concentration map for each component present in the library.
The PLS1 models used to determine the thickness of the tablet coating were
constructed by using the software The Unscrambler v. 9.8 from CAMO (Trondheim,
Norway). The PLS regression algorithm (Ravn et al., 2008) uses a calibration/validation set
of samples spanning the whole range of the target quantity; such samples should be of
identical nature as the prediction samples and have a known value for the property to be
modelled. The PLS1 model thus constructed was validated by cross-validation with jack-
knifing in order to identify the wavelength range most strongly correlated with such a
property. Then, the optimum number of factors was selected under the above-described
criteria.
ANEXO
212
3. Results and discussion
As noted earlier, the aim of this study was to develop a quantitative method for the deter-
mination of tablet components and their distribution in the core and its coating from NIR-CI
data. Figure 2a shows the spectra for the different pure components of the studied pharma-
ceutical (viz. the API and 5 excipients). As can be seen, most of the spectra exhibited
marked differences that are confirmed by the pairwise correlation coefficients shown in
Table 2. The especially high coefficient between the spectra for excipients #2 and #4, 0.984,
required a greater effort in developing calibration models for these two components owing
to their close spectral similarity. Figure 2b compares the average spectra for a selected area
of a core and a coated tablet. As can be seen, spectral differences were minimal as a result of
the usually modest contribution of the coating layer. In our case, the lacquer resulted in a
slightly increased baseline in the average spectrum.
Table 2.- Correlation coeficient between the NIR spectra of the pure components (API and excipients).
Correlation coefficients
API E #1 E #2 E #3 E #4 E #5 API 1.000 E #1 0.810 1.000 E #2 0.621 0.601 1.000 E #3 0.693 0.603 0.849 1.000 E #4 0.640 0.588 0.984 0.903 1.000 E #5 0.823 0.693 0.669 0.847 0.740 1.000
ANEXO
213
Figure 2. Average NIR spectra obtained from all pixels of hyperspectral image. a) NIR spectra of API and excipients; b) Comparison between NIR spectra of a core and a coated tablet. 3.1. Quantitation of the API and excipients
Cores
We constructed a model to determine the concentration of the active principle and five
excipients present in the cores by using a Isys-PLS1 calibration model for each analyte. The
models were constructed by compiling a library containing the spectra for the pure compo-
nents to be quantified and applying the Isys-PLS1 algorithm with a variable number of
factors from 3 to 8 depending on the particular analyte. The concentrations thus obtained for
each core side studied are listed in Table 3.
ANEXO
214
Table 3. API and excipients concentration (% w/w) obteined from different sides of the same core, calculated with the Isys-PLS1 calibration model.
Core components (% w/w)
API E #1 E #2 E #3 E #4 E #5 Sum
Side A 35.51 38.93 20.15 1.97 1.48 1.47 99.51 Side B 35.45 39.46 21.12 1.98 1.48 1.51 101.00 Side C 37.11 38.45 19.69 1.99 1.53 1.53 100.30 Side D 37.45 40.38 20.14 1.95 1.53 1.51 102.96 Side E 31.66 44.16 18.62 1.95 1.48 1.51 99.38 Side F 31.47 43.38 19.31 1.97 1.55 1.53 99.21 Mean 34.78 40.79 19.84 1.97 1.51 1.51 100.40 St. Dev. 2.62 2.41 0.85 0.02 0.03 0.02 5.95
The model-predicted concentrations for each core side were very similar to the
nominal values for the API and the major and minor excipients. The low standard deviations
obtained testify to the high uniformity of the component mixture. Worth special note is the
fact that the combined proportions of the components on each side was close to 100% in all
cases, which suggest that the calibration models used provide accurate predictions.
However, there were slight differences in composition between sides for some components.
Thus, the concentrations of the two major components (API and excipient #1) on the inner
sides (E and F) in the cores departed from both the nominal values and the values for the
other sides; specifically, there was a decreased content in excipient #2 and, especially, the
API, and an increased content in excipient #1 that resulted in an also increased standard
deviation for the inner core sides. This result was observed in all cores and can be ascribed
to the increased roughness of the cut surface, which may influence the appearance of the
acquired images.
Figure 3 shows the concentration maps for the components on one of the outer sides
of a core as obtained with the Isys-PLS1 model. As can be seen, the distributions of
excipient #2 and the API were very similar, with areas of increased concentrations
coinciding with those on the tablet surface. On the other hand, the high-concentration areas
for excipient #1 were complementary with those for the API. This distribution pattern can be
ANEXO
215
ascribed to the fact that the API and excipient #2 are mixed together before the other
components are added. By contrast, the minor excipients were uniformly distributed across
the images. The API and excipient distributions observed on the other sides and cores
exhibited no significant differences from the previous side and exhibited identical patterns.
As can be seen from Table 3, this was so for both the outer and inner sides. Figure 3 shows
the histogram for each core component. The histograms for the minor excipients exhibited
an essentially narrow normal distribution; in fact, they were quite symmetric and sharp,
which reduced the significance of the heterogeneity observed in the concentration maps. On
the other hand, the histograms for the major excipients were much broader, which suggests
the presence of core zones with concentrations departing from the nominal (central) value.
The histograms for the API and excipient #2 were very similarly shaped, with tails on the
left; this is consistent with an abundance of pixels with concentrations below the nominal
value. By contrast, the tails in the histogram for excipient #1 were on the right, which
suggests an abundance of pixels with concentrations significantly exceeding the expected
value. In any case, the distributions were virtually near-normal, so the API and excipients
can be assumed to distribute uniformly in the cores.
ANEXO
216
Figure 3. Concentration distribution maps and histograms for API and excipients for side A of a core calculated by Isys-PLS1 model. In parentesis is showed the nominal concentration (% w/w) of each component.
ANEXO
217
Coated tablets
The API and excipients were also determined in tablets coated with a lacquer film of
variable thickness. To this end, we used Isys-PLS1 models based on an also variable
number of factors (3–6) depending on the particular analyte and coating thickness.
Table 4 shows the results obtained for two sides (A and B) of the same tablet but coated
to a different thickness with a lacquer film. The results are the averages for two tablets
coated with an identical proportion of lacquer and recorded in a single image. The
values for the minor components have been omitted because they exhibited high
deviations (50–30%) from the nominal values. As can be seen, the calculated
proportions for the three major components were very close to their respective nominal
values (Table 1) and, like these, decreased gradually with increasing coating thickness.
Obviously, deviations from the nominal values were especially high in the tablets with
the thickest coatings (200 and 300%); this was particularly so for excipient #2, which
was the least concentrated.
Table 4. Concentrations (% w/w) of API and two major excipients in tablets with different coating thickness, obtained with the Isys-PLS1 calibration model.
Tablet components (% w/w)
Coating level (%)
Tablet side
API E #1 E #2 A 35.25 40.74 20.20
0% B 35.67 39.46 21.34
A 35.85 40.30 19.67
50% B 35.31 40.27 20.36
A 34.56 40.80 20.79
100% B 35.20 40.18 21.64
A 33.15 39.15 17.95
200% B 32.95 42.40 15.31
A 30.85 38.51 12.65
300% B 29.65 39.78 14.03
ANEXO
218
Based on the previous results, the deviations in the calculated concentrations are
mainly the result of the lacquer coating, which affects the determination of the
concentrations of the major components and, especially, the minor ones.
3.2. Quantitation of the thickness of coating
The thickness of the coating is an important variable inasmuch as it can influence the
rate of dissolution of a tablet and also the quality of components quantitation. In this
work, tablet thickness was determined by using a PLS1 model constructed from the
average spectrum for each tablet side as a function of coating time. The nominal coating
time was assigned an arbitrary value of 100% and the modified coating thicknesses one
of 50, 200 or 300%.
A total of 10 images of tablets coated to a variable thickness (two tablets per
image) were used. The resulting spectra were averaged to obtain 4 spectra per thickness
(2 tablets per image and 2 sides per tablet). Three of the 20 spectra thus obtained were
discarded as outliers, 12 were used to construct the calibration set and 5 to validate it.
Each average spectrum in the calibration set was assigned a nominal coating
concentration of 0, 50, 100, 200 or 300%. These coating proportions were determined
from the increase in weight of the tablets upon coating.
The PLS1 model used was constructed by using various spectral treatments
(derivation, Savitzky–Golay, SNV) and ranges in order to ensure optimal fitting to the
validation set. The best results were obtained by processing data with the SNV
algorithm and using the entire spectral range. Under these conditions, a model with a
single factor accounted for 99.3% of the total variance. Such a PLS1 model, which is
described in detail in Table 5, was adopted for application to production samples.
ANEXO
219
Table 5. Figures of merit for the quantification of coating thickness obtained with the PLS1 calibration model.
PLS1 calibration model features
Number of calibration samples included
12
Spectral range (nm) 1200-2500 Spectral pretreatment SNV Factor 1 Y-variance 99.31 Number of validation samples included
5
RMSEP 14.04 RSEP (%) 8.32
Figure 4 shows the concentration maps for the tablet coating on the four outer
sides of a production tablet (table 1), which were processed with the previous PLS
model. A comparison of the four concentration maps reveals that the coating material
was quite uniformly distributed on all sides. There were, however, some points where
the predicted concentration was higher than those on the remainder of the surface. This
may have resulted from the formation of lacquer aggregates during the coating process.
Figure 4 additionally shows the histograms for easier analysis of the coating
distribution. Despite the broad bands and short tails on both sides, the graphs are all
near-normal and symmetric.
ANEXO
220
Figure 4. Concentration maps and histrograms (% w/w) for the four sides of one production tablet.
Table 6 shows the average coating values for each of the four studied sides on
two production tablets calculated with the above-described PLS1 model. Both tablet 1
(Figure 4) and 2 exhibited differences of up to 10% in lacquer content from the nominal
value between sides; however, the average for the four tablet sides was very similar to
the nominal value in all samples.
ANEXO
221
Table 6. Determination of coating thickness (% relative) in two production tablets applying the PLS1 calibration model.
Coating thickness (%) Tablet 1 Tablet 2 Side A 108.15 113.84 Side B 98.86 113.83 Side C 78.81 107.94 Side D 92.74 118.73 Mean (4 sides)
94.64 113.58
4. Conclusions
In this work, we assessed the potential for the NIR-CI technique for determining the
composition of coated and uncoated drug tablets, and the distribution of their
components. We found the Isys-PLS1 algorithm to be effective towards extracting
quality quantitative information from hyperspectral images without the need for
calibration against reference values, and also towards establishing the distribution of
tablet components. Conventional processing of the spectral data contained in an image
allows one to determine the thickness of the coating layer with a view to predicting
some pharmaceutical properties of the tablet. The expeditiousness with which it allows
tablets to be analysed, and the accuracy of its predictions, make the NIR-CI technique a
highly suitable choice for the determination of the quantitative composition of
pharmaceutical tablets, and for assessing uniformity in the distribution of its compo-
nents and surface coating. These advantages testify to the potential of NIR-CI for use in
at-line tests for the control of pharmaceutical production processes.
ACKNOWLEDGEMENTS
The authors are grateful to Spain's MICINN for funding this research within the
framework of Project CTQ2009-08312.
ANEXO
222
REFERENCES
Amigo, J. M., Cruz, J., Bautista, M., Maspoch, S., Coello, J., Blanco, M., 2008. Study of pharmaceutical samples by NIR chemical image and multivariate analysis. Trends in Analytical Chemistry. 27, 696-713. Cairós, C.,Amigo, J.M.,Watt,R., Coello, J., Maspoch, S., 2008. Implementation of enhanced correlation maps in near infrared chemical images: Application in pharmaceutical research. Talanta. 79, 657-664.
Cruz, J., Bautista, M., Amigo, J. M., Blanco, M., 2009. Nir-chemical imaging study of acetylsalicylic acid in commercial tablets. Talanta. 80, 473-478.
Gendrin, C., Roggo, Y., Collet. C., 2007. Content uniformity of pharmaceutical solid dosage forms by near infrared hyperspectral imaging: A feasibility study.Talanta. 73, 733. Gowen, A. A., O’Donnell, C. P., Cullen, P. J., Bell, S. E. J., 2007. Recent applications of Chemical Imaging to pharmaceutical process monitoring and quality control. European Journal of Pharmaceutics and Biopharmaceutics. 69, 10-22. Hogan, J., in: Aulton, M. E., Farmacia la ciencia del diseño de las formas farmacéuticas, Elsevier, Madrid, 2004, pp. 441-448. Li, W., Woldu, A., Kelly,R., McCool, J., Bruce, R., Rasmussen, H., Cunningham, J., Winstead, D., 2008. Measurement of drug agglomerates in powder blending simulation samples by near infrared chemical imaging. International Journal of Pharmaceutics. 350, 369–373.
Lopes M.B., Wolff J.C., Bioucas-Dias J.M., Figueiredo M.A., 2009. Determination of the composition of counterfeit Heptodin tablets by near infrared chemical imaging and classical least squares estimation. Analytica Chimica Acta. 641, 46-51.
Ma, H., Anderson, C. A., 2008. Characterization of Pharmaceutical Powder Blends by NIR Chemical Imaging. Journal of Pharmaceutical Sciences. 97, 3305-20. Makein, L.J., Kidder, L.H., Lewis, E.N., Valleri. M., 2008. Non-Destructive Evaluation of Manufacturing Process Changes using Near Infrared Chemical Imaging. NIR News. 19,7, 11-15. Maurer, L., Leuenberger, H., 2009. Terahertz pulsed imaging and near infrared imaging to monitor the coating process of pharmaceutical tablets. International Journal of Pharmaceutics. 370, 8-16. Puchert, T., Lochmann, D., Menezes, J.C., Reich. G., 2010. Near-infrared chemical imaging (NIR-CI) for counterfeit drug identification--a four-stage concept with a novel approach of data processing. Journal of Pharmaceutical and Biomedical Analysis. 51, 138–145. Ravn, C., Skibsted, E., Bro, R., 2008. Near-infrared chemical Imaging (NIR-CI) on pharmaceutical solid dosage forms—Comparing common calibration approaches. Journal of Pharmaceutical and Biomedical Analysis. 48, 554-561. Reich, G., 2005. Near-infrared spectroscopy and imaging: Basic principles and pharmaceutical applications. Advanced Drug Delivery Reviews. 57, 1109-1143. Zhang, L., Henson, M. J., Sonja, S., 2005. Multivariate data analysis for Raman imaging of a model pharmaceutical tablet. Analytica Chimica Acta. 545, 262-278.
ANEXO
223
8.3) NIR-CI STUDY OF ASPIRIN
COMMERCIAL TABLETS
J.Cruz, M.Blanco. Proceedings of the 14th International
Conference on Near infrared spectroscopy (Bangkok, 2009),
NIR Publications. ( pendiente de publicación)
ANEXO
224
ANEXO
225
NIR-CI study of Aspirin commercial tablets
J.Cruz, M. Blanco,
Unidad de Química Analítica. Departament de Química. Facultat de Ciencies. Universitat Autònoma de
Barcelona. 08193 Bellaterra, Barcelona. Spain.
INTRODUCTION
Near Infrared Chemical Imaging (NIR-CI) is demonstrating an increasing interest in
pharmaceutical field because of its ability to obtain relevant information about
composition and distribution of components from tablets [1]. The analysis of the sample
by NIR-CI provides a single spectrum at each pixel of the image. Each data file contains
a great amount of information. Chemometric algorithms are useful to extract the
relevant information from each image.
Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) has been
successfully applied to extract quantitative information of NIR Images in
pharmaceutical samples[2]. Therefore, this technique presents a alternative to quantify
different components in tablets without needing a specific calibration model (only pure
components spectra are needed).
This work is composed by two different parts. Firstly, MCR-ALS algorithm is proposed
as a quantitative method, to analyse hyperspectral images of different commercial
Aspirin tablets. A large range of API concentration, between 82% and 12%, was
covered for the chosen samples that present different compositions depending on the
manufacturer.
Secondly, content uniformity has been determined by MCR-ALS, from a unique image
of 10 tablets. Tablets from 4 different manufactures were selected.The distribution of
API and the major excipient in the tablet has been evaluated using concentration maps
and pixel histograms.
ANEXO
226
METHODOLOGY
Samples
For the first part of this study 10 different brand of Aspirin commercial tablets were
purchased at pharmacies. The ASA concentration for the tablets was obtained by
dividing the nominal content by the weight of the tablet; the concentration of ASA
cover a range , from 82% to 12% (w/w).
For the second part of this study 4 different tablet brands, has been used (10 tablets per
brand) selected according their diameter. The nominal concentrations of ASA in the
different tablets covered range of concentration from 82% to 71%.
Microcristalline Celullose (MCC) is the main excipient in 6 preparations; whereas
manitol is the main excipient in the other 2. Dolmen and Aspirina C are effervescent
tablets and also content ascorbic acid as active component and other excipients are citric
acid, sodium carbonate and sodium bicarbonate anhydrous. Table 1 shows the main
features of each brand tablets.
Table1. Main features and results obtained for 10 different brands of commercial tablets.
Commercial Brand
Nominal ASA (mg)
Diameter (mm)
Tablet Weight (g)
Nominal concentration (%)
Main Excipient
NIR-CI concentration (%)
A.A.S 100 100 82 0.227 44.1 Manitol 53.3
A.A.S 500 500 134 0.864 57.9 Manitol 54.9
Bayer 500 500 120 0.609 82.1 MCC 81.6
Adiro 100 100 72 0.135 73.9 MCC 76.5
Adiro 300 300 102 0.409 73.3 MCC 70.9
Aspirina C* 400 258 3.235 12.4 -- 12.9
Dolmen* 500 242 3.399 14.7 -- 16.4
Aspirine Nicholas 500 120 0.624 80.1 MCC 77
Bioplak 250 250 70 0.348 71.8 MCC 71.3
Bioplak 125 125 100 0.173 72.1 MCC 67.8
*Effervescent tablets
ANEXO
227
Instrumentation and Software
Hyperspectral images of the tablets were obtained by a “Think Spectrally Roda-25” NIR
Hyperspectral Imaging Spectrophotometer (Think Spectrally, Valencia, Spain). The
dimension image acquires the format of a cube data [256x360x130]( figure 1). The
three-dimensional structure of the hyperspectral data cube requires a previous unfolding
step to a bi-dimensional matrix, adapting the image for further pre-treatments or any
other method.
The spectral pre-treatments were applied by using home-made routines programmed in
MATLAB code (MATLAB v 7.0, The MatWorks, Massachussetts) [3]. Once the images
were unfolded Standard Normal Variation (SNV) and also smoothing were applied.
MCR-ALS software from the reference [4] working under MATLAB was used.
MCR-ALS in Imaging Data
Multivariate Curve Resolution-Alternating Least Squares (MCR-ALS) [4] decomposes
the unfolded matrix X (MN λ) into the product of two matrices, C (MN A),
containing the concentration profiles and ST (A λ), containing the spectral profiles for
each A component (Figure 1a) (Eq. 1):
X = CST + E (1)
where E (MN λ) corresponds to the experimental error matrix.
The ALS optimization stops when the relative difference in lack of fit (%LOF) values
between consecutive iterations is below than a threshold value.
The quality of the images, which depends on the spatial and also spectral resolution,
could be a disadvantage when MCR-ALS is applied since there could be lack of
selectivity in the surface of the image. To overcome this problem an alternative has
already been formulated: the augmentation of the original sample with images of the
pure analytes. A scheme of the unfolding and augmentation is showed in figure 1b.
ANEXO
228
Figure 1. Scheme of MCR-ALS analysis (a) application to the hyperspectral cube.
(b) and Augmented MCR-ALS
RESULTS AND DISCUSSION
Different pre-treatments were tested with the images and the combination of SNV and
smoothing average with a window size of 7 points provided the best results. Prior to
apply MCR-ALS, non-negativity of concentration profiles and closure were applied as
constraints. Despite the fact that the tablets were constituted by a different number of
components, closure constraint was applied. ASA and the excipients used in this study
provided the highest spectral information and were used to perform the MCR-ALS
analysis, while the minor excipients spectral contribution may be related with the
residual matrix. The pure spectra of the main components were included as initial
estimations to start the iterations. Augmented MCR-ALS was applied, adding 10 spectra
for both pure analytes (ASA and major excipient) to the unfolded matrix in order to
improve the decomposition.
A tablet hyperespectral image analysis
Table 1 shows also the quantitative results for the 10 brand of tablets obtained by
applying augmented MCR-ALS. The ASA concentration is similar to calculated values
confirming the goodness of the quantitative analysis. Good results were obtained for
almost all of the samples including in samples with lower values of ASA content.
Tablets with Manitol as the main significant excipient showed worse results for the
determination of ASA content.
Concentration map and histogram of the local concentration for ASA and MCC of
Bayer 500 tablet (figure 2a) allow observing the regular distribution with little
ANEXO
229
heterogeneities for the ASA and the MCC in the surface and remaining close to a
normal distribution in the histogram which is the ideal situation. The same behaviour
can be observed for the other samples (not showed in the figure), except for AAS 100
and AAS 500 which concentration range was not as narrow as for the others.
Figure 2. a) Hyperspectral image of a single tablet: Concentration maps and histograms
for ASA and MCC b) Hyperspectral image 10 tables: Concentration maps and
histograms for ASA and MCC
Ten tablets hyperespectral image analysis (Content uniformity test)
The hyperspectral image of 10 tablets has been crop and the area corresponding to each
tablet has been selected. The background around each tablet has been converted in non a
number data and a masking routine [3] has been applied to unfold the tablet spectra
without including the background. Then MCR-ALS algorithm has been applied to the
unfolded spectra applying the same restrictions indicated in the before. This process has
been done for each image of the 10 tablets and the concentration calculated. The
average values for each tablet brand are showed in table 2.
ANEXO
230
Table 2. Results obtained for content uniformity (10 tablets) of 4 commercial brands.
The low spatial resolution of the hyperspectral camera and the deficient illumination of
the sample of 10 tablets, are the origin of a deficient hyperspectral image (bad
resolution in the tablets’ corners). For this reason in order to avoid bad ASA
determinations, the central pixels of each tablet must be selected.
The results obtained for determination of the ASA in 4 different brands of tablets are
showed in table 2 (these values is the average value for 10 tablets from each brand).
The mean concentration for ASA in the surface of the tablets was similar to the
calculated value confirming the goodness of the content uniformity analysis for the 4
brands.
Results of distribution of API (figure 2b), in 10 tablets per image, can be improved with
an instrument with better spectral/spatial resolution.
The histograms for ASA and MCC show values around the prediction values, and with
a narrow variation, implying that the whole surface of the tablets contained a similar
amount of ASA.
For content uniformity, the European Pharmacopoeia defines an acceptance value (AV)
which is computed and compared with a limit for the acceptance range [5].
AV=|M − X |+k·s (2)
Where M is the reference value, X the mean value of the individual tablets, k is a
constant (k=2.4 for n=10) and s the standard deviation.
The requirement of content uniformity is fulfilled if the AV of the first 10 dosage units
is less than or equal to 15.
The results obtained for 4 brands are showed in table 2; and indicate the fulfilment of
the Pharmacopoeia requirements.
Commercial Brand
Nominal concentration (%)
NIR-CI concentration (%)
Standard deviation
Acceptance value (limit A.V.=15, n=10)
Bayer 500 82.8 82.4 1.5 4.0
Adiro 100 73.1 72.6 2.5 6.5
Bioplak 250 72.9 72.7 2.7 6.7
Bioplak 125 71.4 67.8 2.2 8.7
ANEXO
231
CONCLUSIONS
Intact commercial tablets were analysed by NIR-Chemical Imaging in order to
determine de distribution of ASA and its ASA concentrations for each tablet using the
MCR-ALS decomposition.
MCR-ALS is a powerful tool to quantify using Hyper Spectral Images, obtaining
concentration maps only with the requirement of pure spectra and without needing a
calibration model with reference values. The obtaining of the tablet surface’s
concentration map allows establishing the API and the major excipient homogeneity of
distribution.
A unique hyperspectral image of 10 tablets allows assessing content uniformity
according the Pharmacopoeia rules, saving time of analysis respect conventional
methods.
REFERENCES
[1] A.A. Gowen, C.P. O'Donnell, P.J. Cullen and S.E.J. Bell, European Journal of Pharmaceutics and Biopharmaceutics, 69 (2008) 10. [2] J.M. Amigo, C. Ravn, European Journal of Pharmaceutical Sciences, 37 (2009) 76–82. [3] http://www.models.life.ku.dk/~jose/ (Routine created by Jose Manuel Amigo Rubio ) [4] J. Jaumot, R. Gargallo, A. de Juan, R. Tauler, Chemometrics and Intelligent Laboratory Systems, 76 (2005) 101. [5] B. Bánfai , K. Ganzler, S. Kemény, Journal of Chromatography A, 1156 (2007) 206–212.