Cómo solucionar texto corrupto en Ubuntu: Guía completa de configuración regional, fuentes y codificación

目次

1. Introducción

Al usar Ubuntu, es posible que ocasionalmente encuentres caracteres garabateados. Estos problemas pueden aparecer en diversas situaciones, como la salida del terminal, la visualización de nombres de archivos en japonés o la visualización de páginas web en japonés en un navegador. En muchos casos, el texto japonés puede no mostrarse correctamente con la configuración predeterminada, haciendo esencial una configuración adecuada.

Este artículo explica las causas de los caracteres garabateados en Ubuntu y proporciona soluciones concretas para resolverlos. Esta guía está destinada a los siguientes usuarios:

  • Principiantes que están usando Ubuntu sin configurar el soporte para el idioma japonés
  • Usuarios que desean entender la causa raíz de los caracteres garabateados y buscan soluciones fundamentales
  • Usuarios que experimentan texto garabateado en entornos de terminal o GUI y desean saber cómo arreglarlo

Comencemos revisando las causas principales de los caracteres garabateados en Ubuntu.

2. Causas Principales de Caracteres Garabateados

Configuración Incorrecta de Locale

El locale en Ubuntu define la configuración del sistema relacionada con el idioma, el formato de fecha y otros comportamientos regionales. Cuando estas configuraciones son incorrectas, el texto japonés puede no mostrarse correctamente, resultando en caracteres garabateados.

Por ejemplo, si al ejecutar el comando locale se muestran valores como “C” o “POSIX”, el locale del sistema no está configurado correctamente:

$ locale
LANG=C
LC_ALL=

Idealmente, un entorno japonés debería mostrar configuraciones como LANG=ja_JP.UTF-8.

Fuentes Faltantes o No Configuradas

En algunas instalaciones predeterminadas de Ubuntu, las fuentes japonesas pueden no estar disponibles, causando que el texto japonés se muestre como cuadrados vacíos (□) o símbolos ilegibles.

Este problema típicamente ocurre en los siguientes escenarios:

  • Los elementos de menú y botones en aplicaciones GUI aparecen corruptos
  • Al abrir texto japonés en un editor de texto se muestran caracteres garabateados

Codificación de Caracteres No Coincidente

Ubuntu utiliza principalmente la codificación UTF-8. Cuando se abren archivos codificados en Shift_JIS o EUC-JP —comunes en sistemas Windows o UNIX antiguos—, puede ocurrir corrupción de texto.

Problemas típicos incluyen:

  • Los editores de texto muestran símbolos extraños al abrir archivos japoneses
  • La salida del comando cat aparece rota en el terminal

Configuración Incorrecta del Terminal o Editor

Incluso si los archivos están correctamente codificados en UTF-8, una configuración incorrecta del terminal o editor aún puede causar problemas de visualización.

  • La codificación del terminal está configurada en algo diferente a UTF-8
  • Editores como Vim o VSCode no detectan automáticamente la codificación de caracteres
  • Los caracteres japoneses aparecen como “?” o “◇” al visualizarlos mediante less o cat

3. Verificación y Corrección de Configuraciones de Locale

Cómo Verificar las Configuraciones de Locale

Para verificar la configuración actual de locale, ejecuta el comando a continuación:

locale

Salida de ejemplo:

LANG=C
LC_CTYPE="C"
LC_NUMERIC="C"
LC_TIME="C"
LC_COLLATE="C"
LC_MONETARY="C"
LC_MESSAGES="C"
LC_PAPER="C"
LC_NAME="C"
LC_ADDRESS="C"
LC_TELEPHONE="C"
LC_MEASUREMENT="C"
LC_IDENTIFICATION="C"
LC_ALL=

En este caso, LANG=C indica que el soporte japonés no está habilitado. Para una configuración japonesa adecuada, deberías ver valores como:

LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8

Instalación y Configuración del Locale Japonés

1. Verificar y Agregar el Locale Japonés

Para confirmar si el locale japonés está disponible en tu sistema, ejecuta el siguiente comando:

locale -a | grep ja_JP

Salida de ejemplo:

ja_JP.eucJP
ja_JP.utf8

Si ja_JP.utf8 no está listado, debes instalar el paquete de locale japonés.

Instálalo usando los siguientes comandos:

sudo apt update
sudo apt install -y language-pack-ja

Luego habilita el locale:

sudo locale-gen ja_JP.UTF-8
sudo update-locale LANG=ja_JP.UTF-8

2. Aplicar el Locale en Todo el Sistema

Para aplicar el cambio de locale en todo el sistema, ejecuta los siguientes comandos:

export LANG=ja_JP.UTF-8
export LC_ALL=ja_JP.UTF-8

Para hacer que estos cambios sean persistentes, agrégalos a ~/.bashrc o ~/.profile:

echo 'export LANG=ja_JP.UTF-8' >> ~/.bashrc
echo 'export LC_ALL=ja_JP.UTF-8' >> ~/.bashrc
source ~/.bashrc

Si deseas aplicar la configuración a todos los usuarios, edita el siguiente archivo en su lugar:

sudo nano /etc/default/locale

Añade o actualiza las siguientes entradas:

LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8

Para aplicar la configuración, cierra sesión y vuelve a iniciarla, o reinicia el sistema.

4. Instalación y configuración de fuentes japonesas

Por qué son necesarias las fuentes japonesas

En un entorno Ubuntu predeterminado, es posible que las fuentes japonesas no estén instaladas. Sin ellas, el texto japonés aparece como cuadrados vacíos o símbolos ininteligibles.

Puedes confirmar la falta de fuentes en las siguientes situaciones:

  • Las etiquetas de los menús y los botones de la interfaz gráfica muestran caracteres corruptos
  • El texto japonés aparece corrupto al abrirlo en un editor de texto

Fuentes japonesas recomendadas

Las siguientes fuentes japonesas están disponibles para usar en Ubuntu:

Font NameDescription
Noto Sans CJK JPA high-quality Japanese font provided by Google (recommended as default)
Takao FontsThe former default fonts in Ubuntu, available in regular and bold styles
IPA FontsHigh-quality fonts provided by the Information-technology Promotion Agency (IPA)
VL Gothic (VLゴシック)Highly readable, ideal for terminal environments

Cómo instalar fuentes japonesas

1. Noto Sans CJK JP (Predeterminado recomendado)

sudo apt update
sudo apt install -y fonts-noto-cjk

2. Fuentes Takao

sudo apt install -y fonts-takao

3. Fuentes IPA

sudo apt install -y fonts-ipafont

4. VL Gothic (para uso en terminal)

sudo apt install -y fonts-vlgothic

Una vez completada la instalación, reinicia el sistema o actualiza la caché de fuentes:

fc-cache -fv

Cómo configurar fuentes

Configuración de fuentes en aplicaciones GUI

  1. Abre la aplicación “Configuración”
  2. Navega a la sección “Fuentes”
  3. Cambia “Fuente estándar”, “Fuente de documento” y “Fuente monoespaciada” a las fuentes que prefieras
  4. Cierra sesión y vuelve a iniciarla para aplicar los cambios

Configuración de fuentes en el terminal

  1. Abre el terminal
  2. Selecciona “Preferencias” del menú
  3. Abre la configuración del “Perfil” y habilita “Usar fuente personalizada”
  4. Selecciona la fuente que prefieras (p. ej., Noto Sans Mono CJK JP )
  5. Guarda la configuración y reinicia el terminal

Verificar la configuración de fuentes

Para confirmar que las fuentes se han aplicado correctamente, prueba los siguientes pasos:

  1. Verifica las fuentes instaladas usando fc-list
    fc-list | grep "Noto"
    
  1. Verifica la visualización del japonés en el terminal
    echo "こんにちは、Ubuntuの文字化け対策"
    
  1. Confirma la representación del texto japonés en aplicaciones GUI como Firefox o LibreOffice

5. Comprobación y conversión de codificación de caracteres

¿Qué es la codificación de caracteres?

La codificación de caracteres define cómo se representan digitalmente los caracteres. Las codificaciones comunes incluyen:

EncodingCharacteristicsMain Usage
UTF-8Multi-language support; standard in LinuxUbuntu and web development
Shift_JISJapanese-focused; standard in Windows environmentsWindows apps and legacy systems
EUC-JPPreviously used in UNIX-based systemsOlder Linux distributions
ISO-2022-JPUsed in some mail systemsEmail communication

Dado que Ubuntu usa UTF-8 como codificación predeterminada, abrir archivos codificados en otros formatos puede producir texto corrupto.

Cómo comprobar la codificación de caracteres de un archivo

1. Usando el comando file

file -i sample.txt

Ejemplo de salida:

sample.txt: text/plain; charset=iso-8859-1

2. Usando el comando nkf

sudo apt install -y nkf
nkf --guess sample.txt

Ejemplo de salida:

Shift_JIS (CRLF)

Cómo convertir la codificación de caracteres

1. Usando el comando iconv

Ejemplo: Convertir Shift_JIS a UTF-8

iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt

Ejemplo: Convertir EUC-JP a UTF-8

iconv -f EUC-JP -t UTF-8 sample.txt -o sample_utf8.txt

2. Usando el comando nkf

Ejemplo: Convertir Shift_JIS a UTF-8

nkf -w sample.txt > sample_utf8.txt

Ejemplo: Convertir EUC-JP a UTF-8

nkf -w --overwrite sample.txt

Evitar texto corrupto en terminales y editores

1. Mostrar la codificación correcta con less

export LESSCHARSET=utf-8
less sample.txt

2. Abrir archivos con codificación especificada en vim

vim -c "set encoding=utf-8" sample.txt

3. Modificar la codificación de caracteres en gedit o VSCode

  • gedit (editor predeterminado de GNOME)
  1. Abre el archivo usando gedit sample.txt
  2. Al guardar, selecciona UTF-8 en el menú desplegable “Codificación”
  • VSCode (Visual Studio Code)

answer.1. Haga clic en el indicador “Codificación” en la parte inferior de la ventana
2. Seleccione UTF-8 para convertir el archivo

6. Verificación de la Configuración del Terminal y del Editor

Verificar y Ajustar la Configuración del Terminal

1. Verificar la Codificación del Terminal

Para confirmar la configuración regional, ejecute los siguientes comandos:

echo $LANG
echo $LC_ALL

Salida de ejemplo (configuración correcta)

ja_JP.UTF-8
ja_JP.UTF-8

Si la salida muestra C o POSIX, cambie la configuración regional a ja_JP.UTF-8.

2. Configurar las Fuentes del Terminal

GNOME Terminal (terminal predeterminado de Ubuntu)

  1. Abra el terminal
  2. Seleccione “Preferencias”
  3. Abra el “Perfil” y vaya a la pestaña “Texto”
  4. Active “Usar fuente personalizada” y seleccione una de las siguientes:
  • Noto Sans Mono CJK JP
  • VL Gothic
  • Takao Gothic
  1. Guarde la configuración y reinicie el terminal

Configuración de la Codificación del Editor

1. Configuración de la Codificación en Vim

Abra Vim y ejecute los siguientes comandos para comprobar la codificación actual:

:set encoding?
:set fileencoding?

Salida de ejemplo:

encoding=utf-8
fileencoding=utf-8

Si la configuración difiere de utf-8, actualice ~/.vimrc con:

set encoding=utf-8
set fileencodings=utf-8,sjis,euc-jp
set fileformats=unix,dos,mac

2. Configuración de la Codificación en Nano

Para cambiar la codificación predeterminada, añada lo siguiente a ~/.nanorc:

set encoding "utf-8"

3. Configuración de la Codificación en VSCode

  1. Haga clic en el indicador “Codificación” en la esquina inferior derecha
  2. Seleccione “Reabrir con codificación” y elija UTF-8
  3. Si es necesario, seleccione “Guardar con codificación”

Para establecer UTF-8 como predeterminado, añada lo siguiente a settings.json:

"files.encoding": "utf8"

7. Soluciones para Casos Específicos

Prevención de Texto Corrupto en Aplicaciones GUI

1. Los caracteres japoneses se muestran incorrectamente en Firefox o Chrome

Solución:

  1. Instale las fuentes japonesas necesarias
    sudo apt install -y fonts-noto-cjk fonts-ipafont
    
  1. Verifique y actualice la configuración de fuentes del navegador
  • Firefox: wp:list {«ordered»:true} /wp:list

    1. Visite about:preferences
    2. Abra “Fuentes y colores” → “Avanzado”
    3. Establezca tanto las fuentes “Proporcional” como “Monoespaciada” a Noto Sans CJK JP
  • Google Chrome: wp:list {«ordered»:true} /wp:list

    1. Acceda a chrome://settings/fonts
    2. Cambie la “Fuente estándar” y la “Fuente de ancho fijo” a Noto Sans CJK JP

2. Texto Corrupto en LibreOffice

Solución:

  1. Instale fuentes japonesas como fonts-noto-cjk o fonts-ipafont
  2. Cambie la configuración de fuentes de LibreOffice
  • Vaya a “Herramientas” → “Opciones” → “LibreOffice” → “Fuentes”
  • Establezca la fuente predeterminada a Noto Sans CJK JP

Prevención de Texto Corrupto en Entornos CUI

1. La sesión SSH muestra caracteres corruptos

Solución:

  1. Verifique la configuración regional en el servidor remoto
    locale
    
  1. Si no está configurado a ja_JP.UTF-8, ejecute los siguientes comandos:
    sudo apt install -y language-pack-ja
    sudo locale-gen ja_JP.UTF-8
    sudo update-locale LANG=ja_JP.UTF-8
    

Prevención de Texto Corrupto en Aplicaciones Específicas

1. WSL (Subsistema de Windows para Linux) muestra texto japonés corrupto

Solución:

  1. Configure WSL para usar ja_JP.UTF-8
    echo 'export LANG=ja_JP.UTF-8' >> ~/.bashrc
    echo 'export LC_ALL=ja_JP.UTF-8' >> ~/.bashrc
    source ~/.bashrc
    
  1. Establezca la fuente de Windows Terminal a Noto Sans Mono CJK JP

2. Texto japonés corrupto dentro de contenedores Docker

Solución:

  1. Ingrese al contenedor y verifique la configuración regional
    docker exec -it container_name bash
    locale
    
  1. Añada la configuración regional japonesa si falta
    apt update && apt install -y locales
    locale-gen ja_JP.UTF-8
    export LANG=ja_JP.UTF-8
    export LC_ALL=ja_JP.UTF-8
    

8. Preguntas Frecuentes (FAQ)

P1. Configuré la configuración regional correctamente, pero el texto sigue apareciendo corrupto.

R: Verifique nuevamente la configuración regional:

locale

Si LANG=ja_JP.UTF-8 no está configurado, vuelva a configurarlo usando:

.«` sudo update-locale LANG=ja_JP.UTF-8 sudo locale-gen ja_JP.UTF-8 sudo dpkg-reconfigure locales

### **Q2. Sólo ciertos archivos muestran texto corrupto.**



**R:** Los archivos pueden tener diferentes codificaciones de caracteres. Verifique la codificación:

file -i sample.txt

Si el archivo no es UTF-8, conviértalo:

iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt

O, usando `nkf`:

nkf -w –overwrite sample.txt

### **Q3. No puedo ingresar caracteres japoneses en la terminal.**



**R:** Asegúrese de que un método de entrada japonés (Fcitx o IBus) esté instalado.

sudo apt update sudo apt install -y fcitx-mozc im-config -n fcitx

### **Q4. El texto japonés aparece corrupto en WSL.**



**R:** Configure la localidad en WSL:

echo ‘export LANG=ja_JP.UTF-8’ >> ~/.bashrc echo ‘export LC_ALL=ja_JP.UTF-8’ >> ~/.bashrc source ~/.bashrc

### **Q5. El texto japonés aparece corrupto dentro de un contenedor Docker.**



**R:** Si la localidad es `C.UTF-8`, el texto japonés no se mostrará correctamente.

apt update && apt install -y locales locale-gen ja_JP.UTF-8 export LANG=ja_JP.UTF-8 export LC_ALL=ja_JP.UTF-8

### **Q6. Los menús y diálogos de la GUI muestran texto japonés corrupto.**



**R:** Instale fuentes y cambie la configuración de fuentes:

sudo apt install -y fonts-noto-cjk fonts-ipafont

## 9. Resumen



Este artículo ofrece una explicación detallada de las causas y soluciones para los **problemas de texto corrupto en Ubuntu**. Los caracteres corruptos suelen aparecer debido a configuraciones de localidad incorrectas, fuentes faltantes, codificaciones de caracteres incompatibles o configuraciones erróneas del terminal/editor. Sin embargo, con los ajustes adecuados, estos problemas pueden resolverse eficazmente.



### **1. Principales causas del texto corrupto**



* **Configuración de localidad incorrecta** : Si la localidad del sistema está establecida en `C` o `POSIX`, el texto japonés no se puede mostrar correctamente
* **Fuentes no instaladas** : Sin fuentes japonesas, las aplicaciones GUI y los terminales no pueden renderizar correctamente los caracteres japoneses
* **Desajuste de codificación** : Abrir archivos guardados en diferentes codificaciones (p. ej., Shift\_JIS) puede causar corrupción
* **Configuraciones incorrectas del terminal/editor** : Si la codificación no está establecida en UTF-8, el texto japonés puede no mostrarse correctamente



### **2. Soluciones para prevenir el texto corrupto**


ItemSolution
Locale configurationCheck with locale and run update-locale LANG=ja_JP.UTF-8
Font installationsudo apt install -y fonts-noto-cjk fonts-ipafont
Check file encodingUse file -i or nkf --guess
Convert encodingiconv -f SHIFT_JIS -t UTF-8 filename -o newfile
Terminal configurationSet LESSCHARSET=utf-8 and change fonts to Noto Sans Mono CJK JP
Fix GUI garbled textSet fonts to Noto Sans CJK JP and use gnome-tweaks if needed
Fix WSL garbled textSet ja_JP.UTF-8 and configure fonts
Fix Docker garbled textRun locale-gen ja_JP.UTF-8 and configure locale in Dockerfile
### **3. Recomendaciones adicionales** * **Mantenga su sistema actualizado** : Los paquetes obsoletos pueden causar problemas en el entorno japonés

sudo apt update && sudo apt upgrade -y «`

  • Persistir configuraciones : Añada la configuración de localidad a ~/.bashrc o ~/.profile para aplicarla automáticamente al iniciar sesión
  • Respaldar archivos de configuración : Antes de editar archivos como /etc/default/locale, haga una copia de seguridad

Conclusión

El problema de texto corrupto en Ubuntu puede resolverse configurando correctamente los cuatro componentes clave: localidad, fuentes, codificación de caracteres y configuraciones del terminal/editor. Siguiendo los métodos presentados en esta guía, podrá eliminar casi todos los problemas de texto corrupto en los entornos de Ubuntu, ya sea en sesiones de terminal, aplicaciones GUI, WSL o contenedores Docker.

年収訴求