Cómo manejar archivos de texto enormes en CPI de SAP: Guía completa

Crear

Creado 01/03/2024
Modificado 01/03/2024
359 Vistas

Introducción:

Manejar archivos de texto enormes (que son csv o de longitud fija) es un desafío en CPI (Integración de la Plataforma en la Nube de SAP).

Mayormente, antes de convertirlos a xml requerido para el mapeo, los leemos a través de scripts de groovy y también manipulamos los datos. A menudo esto se hace convirtiéndolos a formato de cadena, lo cual consume mucha memoria.

En esta publicación del blog, mostraré formas alternativas de manejarlos, no solo cómo leer archivos grandes, sino también cómo manipularlos.

Espero que disfrutes la lectura.

Sección Principal:

En CPI (Integración de la Plataforma en la Nube de SAP) a veces nos encontramos con escenarios donde necesitamos procesar un archivo de texto de entrada csv u otro delimitado por caracteres.

A menudo estos archivos son enormes en comparación con cuando recibimos datos en formato xml o json.

Esta fecha que puede ser delimitada por ",", tabulación o "|" o de longitud fija, crea complejidad adicional ya que primero deben ser leídos, ordenados, convertidos a xml (para mapear a alguna estructura de destino) antes de que puedan ser finalmente procesados. Además, a veces tenemos que hacer varias verificaciones en el número de campos para validar si una línea en el archivo vale la pena procesar o no, de antemano, para detener el flujo de datos innecesarios.

Como: Archivo -> input.csv

A,12234,NO,C,20190711,……

A,26579,NO,D,20190701,…….

……………………………………………..

……………………………………………..

Digamos que tenemos que procesar todas las líneas del archivo anterior donde el cuarto campo tiene la bandera establecida en 'D', o indicador de débito.

Entonces, en el ejemplo anterior después de leer el archivo, solo deberíamos mantener las líneas que tengan 'D' como cuarto campo y por lo tanto la línea 1 anterior no debería procesarse más.

Aquí abajo veremos cómo manejar archivos de texto, csv. Especialmente, archivos enormes y cómo procesar cada línea de ellos sin convertir a String lo cual consume más memoria.

*. Leyendo archivos grandes:

Normalmente comenzamos nuestros scripts convirtiendo la carga de entrada en un Objeto de Cadena.

String contenido = message.getBody(String) // esta línea se usa principalmente en scripts.

Pero en caso de archivos grandes, la línea anterior convierte todos los datos a String y los almacena en memoria, lo cual no es para nada una buena práctica. Además, cualquier cambio nuevo en ellos al crear o reemplazar con nuevos Objetos de Cadena ocupa más espacio. Esto también tiene la probabilidad de tener un - Error de Memoria Insuficiente.

La mejor manera es manejarlos como flujo. Hay dos clases que pueden manejar datos de flujo.

a. java.io.Reader -> maneja datos como flujo de caracteres o texto

b. java.io.InputStream -> maneja datos como flujo crudo o binario.

Dependiendo del nivel de control que necesites sobre los datos, o requisito comercial puedes usar uno de ellos. Mayormente la clase Reader es más fácil de usar ya que obtenemos datos como texto/caracter (UTF-16) en lugar de datos binarios crudos (UTF-8).

Leyendo Datos en script groovy de CPI a través de java.io.Reader :

Leyendo Datos en cada campo o nivel de palabra, para cada línea :

*. No es una buena forma de hacer reemplazos en datos en CPI Groovy :

La forma de hacerlo con String -

El mejor enfoque de hacer un reemplazo mientras se lee como Flujo :

*. Leyendo carga como un objeto java.io.InputStream, flujo de objeto:

SAP CPI

Pedro Pascal

Se unió el 07/03/2018

Responder

Facebook

Twitter

Sin respuestas

No hay respuestas para mostrar Se el primero en responder

PARA MÁS INFORMACIÓN
INGRESA TUS DATOS

Nombre completo

Correo electrónico

Curso de interés

Celular

Etiquetas más populares

Ver todo

Preguntas más populares

O que é o sistema R/3 da SAP e qual é a sua diferença em relação a outros sistemas? Explicação simples

Olá a todos Alguém pode explicar o que é o sistema R/3 de forma mais simples? Qual é a diferença entre os sistemas R/3 e os sistemas SAP? E o sistema R/3 é equivalente a um sistema lógi...

01/03/2024 · 5K+ Vistas · 4 Respuestas
Como resolver o erro DBSQL_DUPLICATE_KEY_ERROR ao alterar dados da conta bancária no SAP FK02

Prezados especialistas, Não consigo alterar os dados da conta bancária através do FK02. Recebo o seguinte despejo: Erro em tempo de execução: DBSQL_DUPLICATE_KEY_ERROR Exc...

01/03/2024 · 2K+ Vistas · 3 Respuestas
Cómo modificar un archivo .apk existente: Guía paso a paso

Hoy me gustaría compartir contigo mis descubrimientos sobre cómo se puede modificar un archivo .apk existente. Un archivo .apk representa la aplicación móvil tal como está ins...

01/03/2024 · 27K+ Vistas · 1 Respuestas
Cómo evitar y solucionar java.lang.NullPointerException en Java

Hola a todos, ¿Alguien puede decirme sobre java.lang.NullPointerException? Cuándo recibiremos este tipo de error y cómo solucionarlo. Si obtenemos este error, ¿dónde debemo...

01/03/2024 · 24K+ Vistas · 4 Respuestas
¿Cómo verificar si mi sistema es de 32 bits o 64 bits? Métodos y consejos

Hola expertos, ¿Cómo puedo verificar si mi sistema es de 32 bits o de 64 bits? Si tienen algún documento relacionado con esto, por favor proporcionenlo. Gracias

01/03/2024 · 10K+ Vistas · 4 Respuestas

Aprende en Comunidad

¡Acceso SAP S/4HANA desde $100!

Cómo manejar archivos de texto enormes en CPI de SAP: Guía completa

Sin respuestas

PARA MÁS INFORMACIÓN
INGRESA TUS DATOS

Etiquetas más populares

Preguntas más populares

Partners:

Aprende en Comunidad

¡Acceso SAP S/4HANA desde $100!

Cómo manejar archivos de texto enormes en CPI de SAP: Guía completa

Sin respuestas

PARA MÁS INFORMACIÓNINGRESA TUS DATOS

Etiquetas más populares

Preguntas más populares

Partners:

PARA MÁS INFORMACIÓN
INGRESA TUS DATOS