it-swarm-eu.dev

Come posso modificare il testo Unicode in Notepad ++?

A volte modifico il testo inglese che include caratteri Unicode. Per qualche ragione, sul mio PC, Notepad ++ converte caratteri Unicode in ???, quindi corrompendo il testo e perdendo tutti i dati. Sto cercando un modo per modificare questo testo, preservando i caratteri Unicode. Sto usando Consolas come mio Font. Se il carattere non ha tutti quei caratteri, perché dovrei perdere i dati quando copio il testo da Notepad ++ (tramite gli appunti di Windows)?

25
Robinicks

Se il file è effettivamente codificato in Unicode, Notepad ++ dovrebbe rilevarlo automaticamente. Il font di Consolas funziona bene per me. Puoi provare una di queste due opzioni di menu:

  • Encoding -> Codifica in UTF-8
  • Encoding -> Converti in UTF-8

Sono abbastanza sicuro che il primo farà quello che vuoi.

14
DisgruntledGoat

Il problema descritto nella domanda si verifica quando un vuoto/nuovo documento è impostato su "ANSI" e Unicode i personaggi sono incollati in esso.

Non c'è alcun rilevamento automatico quando viene usato con un documento vuoto/nuovo, almeno non nella versione di Notepad ++. L'ho provato. "ANSI" è l'impostazione predefinita in Notepad ++ per un nuovo documento a meno che non sia impostato nel menu Impostazioni -> Preferenze -> scheda Nuovo documento/Apri Salva directory .

Soluzione

La soluzione è impostare la codifica su UTF-8 prima di incollare, menu Format -> Codifica in UTF-8 :

Menu command "menu Format/Encode in UTF-8" about to be executed

Esempio

Ho copiato del testo in un nuovo documento Notepad ++, russo (русский язык, russkiy yazyk) , da Firefox che mostra la pagina di Wikipedia russo lingua.

Se la codifica è not modificata da "ANSI", questo è il risultato:

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document without changing the encoding from the default "ANSI".

Se la codifica è modificata, questo è il risultato:

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document after changing the encoding from the default "ANSI" to "UTF-8".

Come si può vedere nella figura seguente (la parte Cyrillic è evidenziata), Notepad ++ converte effettivamente i caratteri Unicode in ASCII 63 ( hex 3F), punti interrogativi. Questo è il motivo per cui i caratteri Unicode vengono persi (in modalità "ANSI" quando si copia il testo attraverso gli appunti (è non un problema di carattere - l'informazione è persa).

Screenshot of a hex view of said document

Testato su: Notepad ++ v5.4.5 (UNICODE).

14
Peter Mortensen

Ci sono buone notizie e cattive notizie.

Buone notizie: Notepad ++ supporta Unicode (almeno da quello che posso raccogliere).

Cattive notizie: Il supporto apparentemente Unicode è solo su Windows XP.

In realtà non ho una macchina Windows davanti a me. Da quello che ricordo, c'è un menu Encoding sotto il menu Formato da qualche parte. La codifica per Unicode è in realtà più comunemente UTF-8.

Ecco una immagine "carina" del supporto Unicode in Notepad ++,

enter image description here

5
Josh Hunt

Unicode funziona perfettamente su Windows 7. L'unico problema che si presenta è che è necessario ridigitare i caratteri che sono stati modificati. È successo a me. Sto scrivendo con lettere scandinave così ä -> E4, ö -> F6. È un dolore nel sedere sostituirli tutti, ma ne vale la pena.

Se si codifica una pagina da ANSI -> UTF-8, allora ci saranno alcuni problemi di carattere.

Ti suggerisco di creare prima una nuova pagina in UTF-8 e poi copiare/incollare le tue informazioni. Non ci saranno/non dovrebbero esserci problemi allora.

3
Sloshed

Questo ha funzionato per me:

Ho cambiato il font in Courier New nel configuratore di stile sul mio PC (Windows 7 con set di caratteri inglese/americano e rumeno per set non Unicode). Funziona con i font Courier New & Tahoma + UTF-8.

1
rapy rapy

Nel menu in alto seleziona Encoding, quindi scegli Encode in UTF-8 o Encode in UTF-8 Without BOM, quindi puoi modificare il testo nella codifica Unicode.

0
Siavash