Convertidor de Homoglifos — Detectar y Limpiar Unicode
La conversión es el mejor esfuerzo: los confusables mapeados y el plegado NFKC son deterministas, pero algunos Unicode legítimos no serán marcados.
Pegar o escribir: los resultados se actualizan a medida que escribe (ligeramente rebotados para entradas largas).
Los caracteres sospechosos en la vista original están subrayados y etiquetados como "sospechosos". además de resaltar el color.
Aún no hay caracteres para analizar. Pegue el texto arriba para ver un desglose de homoglifos y elementos confusos.
Detecta caracteres Unicode visualmente confundibles y conviértelos a ASCII más seguro o Unicode normalizado. Herramienta gratuita en el navegador.
Qué hace este conversor de homoglifos
Un conversor de homoglifos detecta caracteres Unicode que pueden parecerse a letras o dígitos latinos comunes (confundibles) y muestra cómo se normalizaron o reemplazaron. También puede ejecutar Generar homoglifos para crear cadenas deterministas similares a suplantaciones a partir de ASCII simple para realizar pruebas. Este conversor y comprobador de confusión Unicode gratuito se ejecuta completamente en su navegador; utilícelo como herramienta de normalización Unicode, limpiador de texto falso o conversor de caracteres similares para seguridad y moderación.
Cómo utilizar esta herramienta de normalización Unicode
- Pegue o escriba el texto que desea inspeccionar en el área de entrada.
- Elija Conservar Unicode legible, Reserva estricta de ASCII o Generar homoglifos dependiendo de si está limpiando texto pegado o creando muestras de prueba a partir de ASCII.
- Compare el original (con resaltados) y el resultado uno al lado del otro; Revise la tabla de análisis para conocer los puntos de código y los motivos.
- Utilice Copiar texto de salida para copiar el resultado o Borrar para restablecer.
Modos de conversión: Unicode legible vs Unicode a ASCII vs generar
- Preserve Readable Unicode aplica primero el mapa de confundibles incluido y luego la normalización NFKC cuando cambia un carácter. Es posible que la salida aún contenga letras no ASCII que no fueron marcadas.
- El estricto respaldo ASCII utiliza las mismas reglas de detección, pero prefiere los reemplazos ASCII del mapa. Los caracteres que no están en el mapa permanecen como están a menos que NFKC los cambie; este modo es más estricto y mejor para flujos de trabajo de limpieza de texto falso.
- Generar homoglifos recorre su entrada de izquierda a derecha y reemplaza cada letra o dígito ASCII con un único homoglifo determinista del mismo mapa incluido (lo contrario de la limpieza). Los caracteres sin un sustituto elegido permanecen en ASCII.
¿Qué se considera sospechoso aquí?
En los modos de limpieza, un carácter se marca cuando se sabe que se puede confundir con un reemplazo definido o cuando la normalización NFKC lo altera (por ejemplo, dígitos de ancho completo). En el modo de generación, "sospechoso" marca cada posición donde se reemplazó una letra o dígito ASCII. Esta no es una auditoría de seguridad Unicode completa, sólo reglas deterministas.
Casos de uso comunes
- Comprobación de nombres de usuario, dominios o ataques de homoglifos falsificados en cadenas pegadas.
- Revisión de moderación y confianza y seguridad de trucos con caracteres parecidos.
- Depuración de problemas de codificación por parte del desarrollador junto con una vista de detector de homoglifos.
Limitaciones y notas de seguridad
El mapa incluido cubre los similares comunes en cirílico, griego y de ancho completo; no todos los Unicode son confusos. El modo Generar es solo para pruebas autorizadas; no lo utilices para engañar a las personas o eludir las protecciones. Los resultados son deterministas, no puntuaciones de riesgo basadas en ML. Combine siempre con la revisión humana para decisiones de alto riesgo.
Privacidad
Toda la detección y conversión se ejecuta localmente en JavaScript después de que se carga la página. No se envía ningún texto a un servidor para su procesamiento.
Preguntas frecuentes
¿Qué es un homoglifo?
Un homoglifo es un carácter que se parece a otro carácter de una escritura o codificación diferente, como una “а” cirílica que se parece a la “a” latina. Los atacantes los utilizan en dominios, nombres de usuario y mensajes falsificados. Esta herramienta muestra esos caracteres con puntos de código y reemplazos.
¿En qué se diferencia esto de la normalización Unicode?
La normalización Unicode (por ejemplo, NFKC) combina la compatibilidad y las variantes de ancho de forma estándar. Esta herramienta combina NFKC con un pequeño mapa explícito de confundibles para que pueda ver por qué se marcó cada personaje, algo útil más allá de una simple herramienta de normalización Unicode.
¿El modo ASCII estricto cambiará el texto legítimo que no esté en inglés?
El estricto respaldo ASCII reemplaza los caracteres que aparecen en el mapa de confundibles incluido o cambian bajo NFKC. Otras letras que no son ASCII no se modifican. El texto legítimo aún puede cambiar si contiene esos caracteres asignados, así que revise la lista de análisis.
¿Mi texto se envía a un servidor?
No. Una vez cargada la página, la detección y la conversión utilizan únicamente JavaScript. Este conversor de confundibles no sube el texto pegado para analizarlo.
¿Puede detectar todas las suplantaciones?
No. La cobertura es determinista y está basada en mapas, no en aprendizaje automático. Ayuda con trucos comunes con caracteres parecidos, pero no es una auditoría de seguridad completa.
¿Qué hace el modo Generar homoglifos?
Reemplaza las letras y dígitos ASCII en su entrada con elementos deterministas del mismo mapa incluido utilizado para la limpieza, lo que resulta útil para crear cadenas de prueba en entornos autorizados (por ejemplo, control de calidad de moderación). No es para suplantación de identidad ni para eludir protecciones.