Inicio > software > UTF-16 vs. UTF-8

UTF-16 vs. UTF-8

En UTF-16 cada letra o carácter se define con 2 Bytes, en UTF-8 con 1 Byte. Esto es algo a tener en cuenta en RealBasic y en Java. Estoy evaluando una contabilidad en un iMac Power PC que funciona con java. Bien, pues un archivo de texto de TextEdit como texto simple (.txt), no como RTF no es una balsa de salvación en cuanto a pensar que un .txt es algo simple, algo monocolor, no lo es, también tiene “apellidos”. En este sentido el programa TextWrangler es una ayuda eficaz porque permite cambiar la codificación a UTF-8, que en este caso, es lo que necesito. Otro caso de este mismo tema es respecto a RealBasic, imagina que tenemos un txt con formato desconocido (y resulta que es UTF-16), RealBasic lo interpretará como UTF-8, y al leerlo Byte a Byte, no por parejas, pues el resultado es “basura”.

Categories: software Tags: ,
  1. L00PeR
    Lunes, 8 de marzo de 2010 a las 13:41 | #1

    Es un “problema común” porque  Java trabajapor defecto en UTF16 y otros lenguajes en 8 bit, ASCII o UTF8 -que podríamos decir que es lo mismo-.
    Como no puedes forzar al programa en Java a convertir a Byte (tiene métodos para ello) échale un vistazo a las herramientas que tienes para convertir en Real Basic: http://www.realsoftware.com/listarchives/realbasic-nug/2003-07/msg03048.html

  1. Sin trackbacks aún.