A volte modifico il testo inglese che include caratteri Unicode. Per qualche ragione, sul mio PC, Notepad ++ converte caratteri Unicode in ???, quindi corrompendo il testo e perdendo tutti i dati. Sto cercando un modo per modificare questo testo, preservando i caratteri Unicode. Sto usando Consolas come mio Font. Se il carattere non ha tutti quei caratteri, perché dovrei perdere i dati quando copio il testo da Notepad ++ (tramite gli appunti di Windows)?
Se il file è effettivamente codificato in Unicode, Notepad ++ dovrebbe rilevarlo automaticamente. Il font di Consolas funziona bene per me. Puoi provare una di queste due opzioni di menu:
Sono abbastanza sicuro che il primo farà quello che vuoi.
Il problema descritto nella domanda si verifica quando un vuoto/nuovo documento è impostato su "ANSI" e Unicode i personaggi sono incollati in esso.
Non c'è alcun rilevamento automatico quando viene usato con un documento vuoto/nuovo, almeno non nella versione di Notepad ++. L'ho provato. "ANSI" è l'impostazione predefinita in Notepad ++ per un nuovo documento a meno che non sia impostato nel menu Impostazioni -> Preferenze -> scheda Nuovo documento/Apri Salva directory .
Soluzione
La soluzione è impostare la codifica su UTF-8 prima di incollare, menu Format -> Codifica in UTF-8 :
Esempio
Ho copiato del testo in un nuovo documento Notepad ++, russo (русский язык, russkiy yazyk) , da Firefox che mostra la pagina di Wikipedia russo lingua.
Se la codifica è not modificata da "ANSI", questo è il risultato:
Se la codifica è modificata, questo è il risultato:
Come si può vedere nella figura seguente (la parte Cyrillic è evidenziata), Notepad ++ converte effettivamente i caratteri Unicode in ASCII 63 ( hex 3F), punti interrogativi. Questo è il motivo per cui i caratteri Unicode vengono persi (in modalità "ANSI" quando si copia il testo attraverso gli appunti (è non un problema di carattere - l'informazione è persa).
Testato su: Notepad ++ v5.4.5 (UNICODE).
Ci sono buone notizie e cattive notizie.
Buone notizie: Notepad ++ supporta Unicode (almeno da quello che posso raccogliere).
Cattive notizie: Il supporto apparentemente Unicode è solo su Windows XP.
In realtà non ho una macchina Windows davanti a me. Da quello che ricordo, c'è un menu Encoding sotto il menu Formato da qualche parte. La codifica per Unicode è in realtà più comunemente UTF-8.
Ecco una immagine "carina" del supporto Unicode in Notepad ++,
Unicode funziona perfettamente su Windows 7. L'unico problema che si presenta è che è necessario ridigitare i caratteri che sono stati modificati. È successo a me. Sto scrivendo con lettere scandinave così ä -> E4, ö -> F6. È un dolore nel sedere sostituirli tutti, ma ne vale la pena.
Se si codifica una pagina da ANSI -> UTF-8, allora ci saranno alcuni problemi di carattere.
Ti suggerisco di creare prima una nuova pagina in UTF-8 e poi copiare/incollare le tue informazioni. Non ci saranno/non dovrebbero esserci problemi allora.
Questo ha funzionato per me:
Ho cambiato il font in Courier New nel configuratore di stile sul mio PC (Windows 7 con set di caratteri inglese/americano e rumeno per set non Unicode). Funziona con i font Courier New & Tahoma + UTF-8.
Nel menu in alto seleziona Encoding
, quindi scegli Encode in UTF-8
o Encode in UTF-8 Without BOM
, quindi puoi modificare il testo nella codifica Unicode.