Copiar texto desde ChatGPT para cualquier trabajo que tengamos entre manos puede ser una idea fantástica. Pero para los más avispados, tenéis que saber que hay caracteres que no vamos a ver de manera normal, o no al menos a simple vista. Son símbolos y códigos invisibles que nos van a delatar a la hora de copiar y pegar un texto hecho con IA.
A estos símbolos que no vemos a simple vista se les llama caracteres Unicode, y de hecho, en una impresión tampoco saldrían. Y créeme, te van a delatar como hayas copiado el texto directamente desde una IA. Pero si quieres salvar tu trabajo, o cualquier proyecto que tengas que entregar, vamos a valernos de una página que sí es capaz de reconocerlos: View Non-Printable Unicode Characters.
Así, en pocos segundos vamos a tener nuestro texto «made in IA» limpio de símbolos que nos puedan delatar. Nada de sospechas y nada de errores en los documentos más importantes. Es más, es muy probable que alguna vez, aunque no hayas visto los símbolos, veas que el texto se comporta de una manera extraña. Pues ya sabes por qué es.
Qué son los caracteres Unicode
Los caracteres conocidos como «caracteres de control Unicode» se usan por grandes modelos de lenguaje, o LLM, como puede ser ChatGPT o Gemini, y su función principal es estructurar el texto internamente. Entre ellos, podemos encontrar el conocido «Separador de Línea», U+2028, o el Separador de Párrafo, U+2029. Dichos elementos son invisibles para la mayoría de editores de texto, pero se pueden detectar mediante programas especializados.
Según el Consorcio Unicode, estos caracteres tienen funciones específicas que afectan a cómo se muestra y procesa el texto. Por ejemplo, los señalados se encargan de controlar el salto de línea o el inicio de un nuevo párrafo. El problema llega cuando estos caracteres invisibles se copian y pegan en editores que pueden ser revisados, lo cual puede causar un error en la estructura. Algo que se debe a que no siempre se reconocen fuera de su entorno original. Es cierto que son fundamentales para la generación de texto por IA, pero es vital que conozcas de su existencia para evitar cualquier problema a la hora de manipular o ver un texto en diferentes plataformas.
Cómo ver y eliminar los caracteres invisibles de un texto hecho por IA
Imaginemos que tienes un trabajo universitario vital que presentar y desconoces este tipo de código. Puedes arruinar tus créditos de un cuatrimestre por no ir con el debido cuidado. Y créeme, no se ven, pero van a modificar toda la estructura y comportamiento del texto. Se pueden manifestar de diferente manera, como un salto de línea extraño, espacios más cortos de lo común o cualquier indicador de un idioma. Nosotros no lo vemos, pero el PC sí es capaz.
Pues para que esto no nos ocurra ni por asomo, vamos a hacer uso de View Non-Printable Unicode Characters. Solo tienes que buscarlo en Google y entrar a la página. Una vez que estés dentro, tan solo tienes que copiar el texto que hayas generado con IA. Y la propia página se encargará de desenmascarar todos esos símbolos que no vemos. Y como muestra, un botón:
Como puedes ver, en el recuadro de abajo se muestran esos caracteres, que puedes reconocer por «CR» o «LF» en nuestro caso. Esto es lo equivalente a nuestras huellas en la escena de un crimen, para que te hagas una idea.
Y para eliminarlo, vamos a necesitar cualquier versión de Microsoft Word que tengamos disponible. Una vez que hayamos abierto el editor de textos de Microsoft, deberemos pegar el texto «virgen» directamente desde el propio ChatGPT. En Word, vamos a poder ver este tipo de caracteres con espacios que serán más reducidos de la cuenta. Es decir, por poner un ejemplo: un espacio normal en tu pantalla puede abarcar 2 o 3 mm, pero este tipo de caracteres ocupará, como máximo, 1 mm. Hablamos de espacios entre palabras.
Cuando hayamos detectado uno de ellos, que vamos a ver a simple vista, solo tenemos que copiarlo e ir a la herramienta «Reemplazar». Se te abrirán dos cuadros de texto: en el de arriba pegar el espacio «defectuoso», y en el de abajo pulsas el botón normal de espacio de tu teclado. Por último, pulsa en reemplazar todo, y el propio Word habrá borrado todo rastro de carácter sospechoso.
| Carácter | Código Unicode | Nombre Técnico | Impacto Común en Documentos |
|---|---|---|---|
| Separador de Línea | U+2028 | Line Separator (LS) | Puede forzar un salto de línea donde no se espera, rompiendo el formato. |
| Separador de Párrafo | U+2029 | Paragraph Separator (PS) | Actúa como un 'Enter' invisible, creando párrafos no deseados. |
| Espacio de Ancho Cero | U+200B | Zero-Width Space (ZWSP) | Usado para indicar posibles puntos de ruptura de línea; puede interferir con funciones de búsqueda. |
| Retorno de Carro | CR | Carriage Return (CR) | Carácter de control heredado que, junto a LF, marca el final de una línea. |
| Salto de Línea | LF | Line Feed (LF) | El carácter estándar en sistemas Unix/macOS para un nuevo renglón. |
¿Es así el texto generado por IA indetectable?
No, ni mucho menos. Estos caracteres son solo una de las muchas pistas que dejan los textos generados por IA. Por ello, aunque los borremos a mano como hemos explicado, o usando otras herramientas diseñadas para ese fin, seguirá habiendo rastros que revelarán que el texto ha sido generado por una IA. Y cualquier herramienta especializada lo detectará.
Por ejemplo, las IAs escriben de una forma muy concreta, con un tono muy neutro, muy «de máquina». Y usan expresiones y una forma de desarrollar texto muy reconocidas. Así pues, por mucho que eliminemos estos caracteres, cualquier detector de IA encontrará estas muestras y sabrá con certeza que el texto ha sido generado por un LLM.
