Energética 251. Noviembre 2025

épocas, disponibilidad de GPU y estabilidad de ejecución, pudiendo interrumpir proce- sos largos y obligando a repetirlos. El concepto de épocas (=epochs) explica la dificultad: en IA, especialmente en entrena- miento de modelos de machine learning y redes neuronales, una epoch es una pasada completa del modelo por todo el conjunto de datos de entrenamiento; en cada epoch, el modelo ajusta sus parámetros (los “pe- sos”) aprendiendo de los errores cometidos; normalmente se necesitan varias epochs (decenas o cientos) para que el modelo con- verja y alcance un buen rendimiento). Para evitar retrasos acumulados resulta imprescindible diseñar un procedimiento robusto y tolerante a fallos. Otro elemento crítico son los criterios de validación aplicados en la detección de in- cidentes de corrosión, basados tanto en re- ferencias técnicas del fabricante como en la experiencia de especialistas en inspección. Mantener criterios uniformes de evaluación constituye un factor clave para la consisten- cia del análisis. Para agilizar esta validación se ha desa- rrollado una interfaz específica que permite visualizar las imágenes junto con sus etique- tas de incidentes, corregir anotaciones y re- gistrar los cambios en el formato adecuado para integrarlos posteriormente en el reen- trenamiento del modelo. Los resultados de esta fase se ofrecen con imágenes etiquetadas de módulos con inci- dentes caracterizados (corrosión en sus dife- rentes formas y grados de evolución…). Fase 2: Análisis de Snail Trail & Cell Framing En la segunda fase se amplía el análisis a zonas extendidas del módulo, utilizando imágenes de mayor cobertura donde se pue- den identificar fenómenos como Snail Trail, Cell Framing o defectos en Tab Ribbon. Este cambio representa un aumento significativo del alcance respecto a la fase 1. Debido al incremento de tamaño de las imágenes y de la carga computacional asociada, se decide adoptar un enfoque de IA distinto, basado en modelos VLM (Visual Language Models). Los VLM, evolución multimodal de los LLM (Modelos de Lenguaje de gran tamaño), combinan análisis de imagen y capacidad de razonamiento textual. El modelo aplicado se complementa con técnicas RAG (Retrie- val-Augmented Generation) y con un promp- ting refinado que define de forma precisa los incidentes a identificar. Este enfoque no eti- queta la ubicación exacta del defecto, pero sí determina qué imágenes presentan el in- cidente, lo que permiten una categorización suficiente del módulo. En IA, especialmente en modelos de len- guaje (LLM) o modelos visual-lingüísticos (VLM), un prompt es la instrucción o entrada que se le da al modelo para indicarle qué debe hacer. Es, básicamente, el texto (o texto + imagen) que guía la respuesta del sistema. En lo que se refiere al RAG, se trata de una técnica que combina búsqueda de informa- ción con modelos generativos, que busca primero la Recuperación (Retrieval) en una base de datos, documentos o repositorio aquellos textos que son relevantes para la consulta del usuario; y en una segunda fase Generación (Generation), utilizando esa in- formación recuperada para generar una res- puesta más precisa, actualizada y basada en datos verificables. La práctica demuestra que un único prompt no es suficiente para detectar de manera fiable varios tipos de incidente en la misma imagen y de forma simultánea, obli- gando a generar prompts e inferencias sepa- radas, lo que multiplica la carga de trabajo y los tiempos de proceso. A ello se suma la dificultad que supone el gestionar imágenes de gran tamaño (un in- cremento cercano a un factor 10 respecto a la fase 1), lo que provoca interrupciones reiteradas en los entrenamientos debido a sobrecarga de servidor o fallos en las herra- mientas del proveedor. En todo el proceso, es muy importante tener en cuenta y ajustar en todo momento aspectos como: • Tiempos de carga y descarga de imáge- nes • Tiempos de procesamiento • Capacidad computacional requerida • Elección del modelo de IA • Coste de recursos • Definición de la sistemática de inferencia para la detección confiable de imágenes con incidentes (selección y refinado de prompts, elaboración de RAG o valida- ción de resultados). En esta caso de éxito, se analizaron todas las imágenes capturadas de la planta, revi- sadas y clasificadas, asignando “1” a las que presentan incidente y “0” a las que no lo presentan, para cada tipo de defecto defini- do, ofreciéndose evidencias de dichos inci- dentes en el entorno ATOM (web, informes) con objeto de documentar la reclamación para cada módulo que presenta incidente: Número de Serie con imagen de la etiqueta, imágenes etiquetadas con defectos locali- zados en la inspección de Fase 1 e identi- ficación de las imágenes con defectos en Fase 2. Como resultado final, se procesaron más de 50.000 imágenes de la planta y se fina- lizó el análisis en 3 semana de trabajo, con resultados muy satisfactorios para Números de Serie (por encima del 98% de éxito), del 75% en imágenes con Busbar & Tab Ribbon y Snail Trail, y algo menos para imágenes con Cell Framing, en torno al 70%, algo esperable debido a la naturaleza más difusa y comple- ja de este último tipo de defecto. Como con- clusión, se continúa trabajando en aumentar las iteraciones de Fase 1 y Fase 2, así como en refinar los procesos de validación, con objeto de mejorar los modelos y consolidar todo el proceso ◉ Interfaz de validación en entorno ATOM desarrollada para el proyecto. fotovoltaica | grandes plantas 77 ENERGÉTICA XXI · 251 · NOV 25