uni2ascii

Link: http://billposer.org/Software/uni2ascii.html

Sisällysluettelo

  1. Kuvaus
  2. Dokumentointi
  3. aiheeseen Liittyvät Ohjelmat
  4. Tiedot
  5. Suosio
  6. Ympäristö
  7. muutosloki
  8. Tiekartan
  9. Bugs

Polish käännös tämän sivun

Kuvaus

hänen paketti tarjoaa muuntaminen molempiin suuntiin välillä UTF-8, Unicode ja enemmän kuin kolmekymmentä 7-bit ASCII vastineet, mukaan lukien RFC 2396 URI-muodossa ja RFC 2045 Lainasi Tulostettavassa muodossa, esityksiä käytetään HTML, SGML, XML, OOXML, Unicode-standardia, Rich Text Format, POSIX portable charmaps, POSIX locale tekniset tiedot, ja Apache lokitiedostot, ja pakenee käyttää, mukaan lukien Unicode-Ada, C, Common Lisp, Java, Pascal, Perl -, Postscript -, Python -, Järjestelmä, ja Tcl.

Tällainen ASCII vastineet ovat hyödyllisiä, kun mukaan lukien Unicode-ohjelma lähde, kun virheenkorjaus, ja kun kirjoitat tekstiä web-ohjelmia, jotka voivat käsitellä Unicode-merkistöä, mutta eivät ole 8-bit turvassa. Esimerkiksi MovableType, blogin ohjelmisto, lyhentää viestit heti, kun se havaitsee tavun kanssa korkea-bitti on asetettu. Kuitenkin, jos Unicode on tullut muodossa HTML-numeerinen merkki yhteisöt,Irtainta Tyyppi ei typistää postitse.

Se tarjoaa myös tapoja muuntaa ei-ASCII-merkkiä vastaavan ASCII-merkkiä, esim. strippaus tarkkeet.

Esimerkiksi, tässä on Kiinalainen <->säännöllinen lauseke Unicode:

正規表達式

ja tässä on HTML-heksadesimaali-numeerinen merkki, viite lähtö uni2ascii:

&#x6B63;&#x898F;&#x8868;&#x9054;&#x5F0F;

Paketti koostuu kahdesta ohjelmasta: uni2ascii ja ascii2uni.

Tässä on lista ASCII-esityksiä Unicode tiedossa minulle viitteitä niiden käyttöä.

Unicode pakenee käsitellä ovat:

  • HTML-heksadesimaali-numeerinen merkki viittauksia (esim. &#x00E9;)
  • HTML desimaalin numeerinen merkki viittauksia (esim. &#0233;)
  • HTML-merkki yhteisöt (esim &eacute;)
  • SGML heksadesimaali-numeerinen merkki viittauksia (esim. \#x00E9;)
  • SGML desimaalin numeerinen merkki viittauksia (esim. \#0233;)
  • \u-pakeni heksadesimaaliluku, jota käytetään Python-ja Java (esim. \u00E9)
  • \u-pakeni heksadesimaali sisällä BMP, \U-pakenee kuin BMP, (esim. \u00E9 mutta \U00010024) käytetty Tcl ja Järjestelmä.
  • \u-pakeni desimaalin tarkkuudella (esim. \u0233) käyttää Rich Text Format
  • U+-pakeni heksadesimaali (esim. U+00E9) kuin Unicode-standardi
  • U-pakeni heksadesimaali (esim. U00E9)
  • u-pakeni heksadesimaali (esim. u00E9)
  • U-pakeni heksadesimaali sisällä kulma suluissa (esim. <U00E9>), sellaisena kuin sitä käytetään POSIX locale tekniset tiedot
  • \x-pakeni heksadesimaali (esim. \x00E9) käytetty Tcl numeroita toisin kuin merkkiä
  • \x-pakeni heksadesimaali henkselit (esim. \x{00E9}) käyttää Perl
  • heksadesimaali sisällä lainausmerkkien kanssa etuliite X (esim. X’00E9′)
  • RFC 2396 URI-muodossa (esim. %C3%A9)
  • RFC 2045 Noteeratut Tulostettava (=-pakeni heksadesimaali UTF-8) esim. =C3=A9
  • \-pakeni oktaali UTF-8 (esim. \303\251)
  • Heksadesimaali UTF-8, jossa jokaisen tavun suljettu kulma suluissa (esim. <C3><A9 – >)
  • Standardi heksadesimaali (esim. 0x00E9)
  • Raaka heksadesimaali (esim. 00E9)
  • Common Lisp heksadesimaalimuodossa (esimerkiksi #x00E9)
  • Perl-v-alkuinen desimaalimuodossa (esim. v233)
  • Heksadesimaali numerot edeltää “$” (esim. $00E9).
  • Heksadesimaali numerot edeltää “16#” (esimerkiksi 16#00E9) kuin Postscript-tiedostoon.
  • Heksadesimaali numerot edeltää “#16r” (esim. #16r00E9) kuten Common Lisp.
  • Heksadesimaali numerot edeltää “16#” ja sen jälkeen “#” (esimerkiksi 16#00E9#) kuin ADA.
  • OOXML heksadesimaali numerot edeltää “_x” ja sen jälkeen “_”. (esim. _x00E9_)
  • Heksadesimaali numerot edeltää “%u” (esim. %u00E9)

Microsoft-tyyli HTML-merkki yhteisöt ja numeerinen merkki viittauksia ilman lopullista puolipiste muunnetaan varoitus viestin.

Paketti voidaan käyttää myös muuntaa yhdenlaista ASCII edustus toiseen kulkee Unicode. Esimerkiksi putki:

ascii2uni -U | uni2ascii -J

muuntaa alkaen \u-pakenee (esim. \u00e9) RFC2396 URI-muodossa (esim. %C3%A9).

ascii2uni -S | uni2ascii -D

muuntaa HTML-heksadesimaali-numeerinen merkki viittauksia desimaalin numeerinen merkki viittauksia.

ascii2uni -S | uni2ascii -a S -Q

muuntaa HTML-heksadesimaali-numeerinen merkki viittauksia HTML-merkki yhteisöihin, joissa vastaava merkki yhteisöjä on olemassa, ja

ascii2uni -M | uni2ascii -S

muuntaa SGML-heksadesimaali-numeerinen merkki yhteisöistä, HTML.

uni2ascii voi myös korvata ei-ASCII-merkit, joissa on arvioitu ASCII vastineet. Esimerkiksi, se voi korvata tyylillisiä variantteja (esim. rohkea-face) kanssa heidän tavallinen kollegansa, tai merkit, joissa on aksentti niiden painottomia vastineet.

Documentation

uni2ascii ja ascii2uni on varustettu standardi Unix manuaalinen sivut:

Molemmat ohjelmat myös antaa yksityiskohtainen yhteenveto niiden command line vaihtoehtoja vastauksena -s command line vaihtoehto.

aiheeseen Liittyvät Ohjelmat

Jos sinun täytyy muuntaa UTF-8 Unicode ja muut koodaukset, saatat löytää enca, iconv, recode ja uniconv hyödyllisiä. Jos sinun täytyy muuntaa tekstimuodossa esityksiä numerot ja koneen esityksiä, saatat löytää ohjelmia ascii2binary ja binary2ascii hyödyllistä. Jos haluat tietää enemmän siitä, mitä on Unicode-tiedosto (esim. jos et tiedä, kirjallisesti järjestelmä, ei ole tarpeen fontti, sitä mieltä, että Unicode voi olla huonosti muodostettu, tai täytyy tarkastella yksityiskohtia edustus, kuten koostumus) voit löytää Unicode Utilities suite ohjelmia hyödyllisiä.

Tiedot

Kieli C [basic ohjelmat], Tcl/Tk [GUI]
Ympäristö POSIX
Käyttöoikeus GNU General Public License, version 3
Nykyinen versio 4.18
Viimeksi muutettu 2011-05-15
Nimi Bill Poser

Suosio

 

Tiedosto Koko (Tavua) MD5-Summa
uni2ascii-4.18.tar.bz2 127,125 a1b1df74cccd1fa997bad79c8c4ced68
uni2ascii-4.18.tar.gz 160,182 096cf1b70a55c4796b136ff1a126a940
uni2ascii-4.18.zip 174,602 3842bcc366ca5b2d98c63c289cc550a2

Jos haluat olla ajan tasalla uusista julkaisuista, tilata uni2ascii Freshmeat.

Paketteja

Arch Linux
uni2ascii
Debian
Debian-paketin (stable)
Debian-paketti (testaus)
Debian-paketti (epävakaa)
FreeBSD
Freshport
Mac OS X
Macports.
Mac OS X
Saatana.
OpenPackage
OpenPackage
Redhat/Fedora
Rpm erilaisia arkkitehtuurit ovat saatavilla. täällä.
Redhat/Fedora
lähde RPM ja binary RPM i386-arkkitehtuurissa on saatavilla täällä.
SUSE Linux
RPM
Ubuntu
Ubuntu

Ympäristö

uni2ascii ja ascii2uni on koottu ja testattu alle FreeBSD, GNU/Linux, Mac OS X ja Dos. Ne pitäisi kääntää ja ajaa ilman muutoksia POSIX-yhteensopiva ympäristö.

muutosloki

4.18 – 2011-05-15

  • Kiinteä vika uni2ascii jossa tietyissä tapauksissa subsitution määrä oli liian korkea, e, Debian bug #626268.
  • Paikka käsitellä tilannetta, NetBSD, joka puuttuu getline.
  • Selvensi semantiikka puhdas vaihtoehto muuntaa merkkiä ascii-alue muu kuin välilyönti ja rivinvaihto. Kiinteä vika, joka tätä ei ole toteutettu oikein UTF8 tyypit.

4.17 – 2011-02-16

  • Lisätty uni2ascii seuraavat muunnokset lähimpään ascii-vastaava: U+2022 luoti ‘o’, ‘ U+00B7 lähi-dot aikana, U+0085 seuraava rivi, rivinvaihto, U+2028 oikosulkuerottimella rivinvaihto.

4.16 – 2010-12-12

  • K – muodossa toimii jälleen ascii2uni.
  • Lisätty U+2033 DOUBLE PRIME merkit muunnetaan heidän lähin ascii vastaa alla käyttämällä e – muodossa uni2ascii.

4.15 – 2010-08-29

  • Nimeksi endian.h u2a_endian.s poistaa ristiriidassa ulkoisen endian.s.
  • Poistettu kopio GNU getline alkaen ascii2uni.c, koska se on standardin kirjasto kuten POSIX2008.

Full Muutos Loki

Tiekartan

  • joissakin tapauksissa on epäselvyyksiä jäsentämiseen haluamasi jouset pois ympäröivä materiaali. Tapauksesta riippuen, joko nämä on ratkaistava tai ongelmallinen tapauksissa dokumentoitu.

Bugs

ascii2uni sisältää bugi, joka vaikuttaa epäpuhdas tila muunnokset standardi hex (-X vaihtoehto). Versio 3.9.2 korjaa vian tuloa sisällä BMP, että on, sillä hex-arvo on pienempi kuin tai yhtä suuri kuin 0xFFFF. Yleisempi korjata on odotettavissa.a

Leave a Reply

Your email address will not be published. Required fields are marked *