Homoglyf- och förväxlingskonverterare

Homoglyfkonverterare — upptäck och rensa Unicode

Konvertering är den bästa ansträngningen: mappade förväxlingsobjekt och NFKC-vikning är deterministiska, men viss legitim Unicode kommer inte att flaggas.

Din text

Klistra in eller skriv — resultaten uppdateras när du skriver (lätt avstudsad för lång inmatning).

0 tecken skannade
0 misstänkta
Bevara läsbar Unicode
Konverteringsläge
Original (misstänkta tecken markerade)

Misstänkta karaktärer i den ursprungliga vyn är understrukna och märkta "susp". förutom att markera färg.

Rensad utgång
Karaktärsanalys

Inga karaktärer att analysera ännu. Klistra in texten ovan för att se en uppdelning av homoglyf och förvirrbara saker.

Upptäck visuellt förvirrande Unicode-tecken och konvertera till säkrare ASCII eller normaliserat Unicode. Gratis i webbläsaren.

Vad den här homoglyfomvandlaren gör

En homoglyfomvandlare upptäcker Unicode-tecken som kan se ut som vanliga latinska bokstäver eller siffror (förväxlingsbara) och visar hur de normaliserades eller ersattes. Du kan också köra Generera homoglyfer för att bygga deterministiska spoofliknande strängar från vanlig ASCII för testning. Denna gratis förvirrbara konverterare och unicode förväxlande kontroll körs helt och hållet i din webbläsare - använd den som ett unicode-normaliseringsverktyg, förfalskningstextrensare eller lookalike-teckenkonverterare för säkerhet och moderering.

Hur man använder detta Unicode-normaliseringsverktyg

  1. Klistra in eller skriv in texten du vill granska i inmatningsområdet.
  2. Välj Bevara läsbar Unicode, Strict ASCII Fallback eller Generera homoglyfer beroende på om du rengör inklistrad text eller bygger testprover från ASCII.
  3. Jämför originalet (med markeringar) och skriv ut sida vid sida; granska analystabellen för kodpunkter och orsaker.
  4. Använd Kopiera utdatatext för att kopiera resultatet, eller Rensa för att återställa.

Konverteringslägen: läsbar Unicode vs unicode till ASCII vs generera

  • Bevara läsbar Unicode tillämpar först den medföljande förvirrbara kartan, sedan NFKC-normalisering när den ändrar ett tecken. Utdata kan fortfarande innehålla icke-ASCII-bokstäver som inte flaggades.
  • Strict ASCII Fallback använder samma detektionsregler men föredrar ASCII-ersättningar från kartan. Tecken som inte finns på kartan förblir som de är om inte NFKC ändrar dem; det här läget är striktare och bättre för att rengöra förfalskningstexter.
  • Generera homoglyfer går din inmatning från vänster till höger och ersätter varje ASCII-bokstav eller siffra med en enda deterministisk homoglyf från samma paketerade karta (omvänd rensning). Karaktärer utan en vald ersättare förblir ASCII.

Det som räknas som misstänkt här

I rensningslägen flaggas ett tecken när det är känt att det kan förväxlas med en definierad ersättning, eller när NFKC-normalisering ändrar det (till exempel siffror i full bredd). I genereringsläge markerar "misstänkt" varje position där en ASCII-bokstav eller -siffra ersattes. Detta är inte en fullständig unicode-säkerhetsrevision – bara deterministiska regler.

Vanliga användningsfall

  • Kontrollera falska användarnamn, domäner eller homoglyfattacker i inklistrade strängar.
  • Måttlighet och förtroende-och-säkerhet granskning av lookalike karaktärstrick.
  • Utvecklarfelsökning av kodningsproblem tillsammans med en homoglyfdetektorvy.

Begränsningar och säkerhetsanvisningar

Den medföljande kartan täcker vanliga kyrilliska, grekiska och fullbreddslookalikes – inte alla Unicode-förväxlande. Genereringsläget är endast för auktoriserad testning; använd den inte för att lura människor eller kringgå skydd. Resultaten är deterministiska, inte ML-baserade riskpoäng. Kombinera alltid med mänsklig granskning för höginsatsbeslut.

Sekretess

All upptäckt och konvertering körs lokalt i JavaScript efter att sidan har lästs in. Ingen text skickas till en server för bearbetning.

Vanliga frågor

Vad är en homoglyf?

En homoglyf är ett tecken som ser ut som ett annat tecken från ett annat manus eller kodning, till exempel ett kyrilliskt "а" som liknar latinskt "a". Angripare använder dem i falska domäner, användarnamn och meddelanden. Detta verktyg visar dessa tecken med kodpunkter och ersättningar.

Hur skiljer sig detta från Unicode-normalisering?

Unicode-normalisering (till exempel NFKC) viker kompatibilitets- och breddvarianter på ett standardsätt. Det här verktyget kombinerar NFKC med en liten explicit förvirrbar karta så att du ser varför varje tecken flaggades – användbart utöver ett vanligt unicode-normaliseringsverktyg.

Kommer strikt ASCII-läge att ändra legitim icke-engelsk text?

Strict ASCII Fallback ersätter tecken som visas i den medföljande förvirrbara kartan eller ändras under NFKC. Andra icke-ASCII-bokstäver lämnas oförändrade. Legitim text kan fortfarande ändras om den innehåller de mappade tecknen, så granska analyslistan.

Skickas min text till en server?

Nej. Efter att sidan har laddats, använder detektering och konvertering endast JavaScript. Denna confusables-konverterare laddar inte upp din inklistrade text för analys.

Kan detta upptäcka varje spoof?

Nej. Täckningen är deterministisk och kartbaserad, inte maskininlärning. Det hjälper till med vanliga lookalike karaktärstrick men är inte en fullständig säkerhetsgranskning.

Vad gör läget Generera homoglyfer?

Den ersätter ASCII-bokstäver och siffror i din inmatning med deterministiska lookalikes från samma paketerade karta som används för rensning – användbar för att bygga teststrängar i auktoriserade miljöer (till exempel moderering QA). Det är inte för identitetsstöld eller förbikoppling av skydd.