TölvurUpplýsingatækni

Kóðun "Unicode": eðli erfðaskrá staðall

Sérhver Internet notandi í tilraun til að setja upp einn eða annan af hlutverki sínu að minnsta kosti einu sinni sá á skjánum skrifað með latneskum stöfum orðið "Unicode." Hvað er það, verður þú að læra með því að lesa þessa grein.

skýring

Kóðun "Unicode" - stafatöflu staðall. Það var lagt af Unicode Inc. non-gróði organization árið 1991. Staðallinn er hannaður til að koma saman stærsta mögulega fjölda af mismunandi gerðir af stöfum í skjali. Page, sem var stofnað á grundvelli hennar, getur innihaldið bókstafi og stafi úr mismunandi tungumálum (frá rússneska kóresku) og stærðfræði merki. Í þessu tilfelli, allar persónurnar í stafasett eru birtar án vandræða.

Ástæður fyrir stofnun

Einu sinni, löngu áður en útliti einu kerfi "Unicode" kóðun er valið byggist á óskum höfundar skjalsins. Af þessum sökum, oft að lesa skjal, það var nauðsynlegt að nota mismunandi töflur. Stundum er nauðsynlegt að gera nokkrum sinnum, sem stórlega flækir líf meðaltal notandi. Eins og þegar getið er, sem lausn á þessu vandamáli árið 1991 var boðið að Unicode Inc a non-gróði organization til að bjóða upp á nýja tegund af stafagerð. Það var hannað til að sameina gamaldags og ýmsar staðla. "Unicode" - kóðun sem ozvolila ná óhugsandi á þeim tíma: að búa til tól sem styður a gríðarstór tala af stöfum. Niðurstaðan umfram miklar væntingar - það voru skjöl samtímis innihalda bæði ensku og rússnesku texta, latínu og stærðfræði tjáning.

En stofnun sameinað erfðaskrá undan því að þurfa að leysa ýmis vandamál sem upp hafa komið vegna þess að mikið úrval af stöðlum þegar núverandi á þeim tíma. Algengustu þeirra:

  • Elvish skrifa, eða "bull";
  • takmarkanir á stafasett;
  • Vandamálið umbreyta codings;
  • letur tvíverknað.

Lítil söguleg excursus

Ímyndaðu þér að garðinum 80.. Tölva vélbúnaður er ekki svo algengt og hefur form öðruvísi í dag. Þó að hvert OS er einstök og hreinsaður sérstökum þörfum hvers áhugamaður er. Þörf fyrir að skiptast á upplýsingum er breytt í viðbótar rework allt. Að reyna að lesa skjal búin með annað stýrikerfi, oft birtir undarlega sett af stöfum, og leikurinn byrjar með kóðun. Það þýðir ekki alltaf að gera það fljótt, og stundum þarf skjalið er hægt að opna í sex mánuði, og jafnvel síðar. Fólk sem oft skiptast á upplýsingum, búa til fyrir sig viðskipti töflu. Og síðan vinna á þeim gefur áhugaverð smáatriði: þörfina á að búa þau í tvær áttir, "frá mínum í þinn" fram og til baka. Gera banal Inversion computing vél getur ekki, að því í hægri dálki uppruna, og vinstri - niðurstaðan, en ekki öfugt. Ef þú sérð þörf á að nota einhverjar sérstakar persónur í skjalinu, þurftu þeir að vera bætt fyrst, og þá annað, og til að útskýra fyrir maka hvað hann þarf að gera til að þessum persónum verða ekki "bull". Og við skulum ekki gleyma því að fyrir hvern kóðun þurfti að þróa eða innleiða eigin letur þeirra, sem leiddi til stofnunar fjölda afrit í OS.

Ímyndaðu þér frekar að letur á síðu, þú vilja sjá 10 stykki af sömu Times New Roman með litlum huga: að UTF-8, UTF-16, ANSI, UCS-2. Nú þú skilja að þróun alhliða staðla var mikilvægt?

"stofnendum höfundum"

Uppruna sköpun Unicode að finna 1987 þegar Dzho Bekker frá Xerox, ásamt Lee Collins og Mark Davis frá Apple hóf rannsóknir á sviði hagnýtum sköpun alhliða stafasett. Í ágúst 1988, Dzho Bekker birti drög að tillögu um stofnun 16-bita multi-tungumála alþjóðlega erfðaskrá kerfi.

Nokkrum mánuðum síðar var Unicode vinnuhópur stækkað til að fela Ken Whistler og Mike Kernegana frá RLG, Glenn Rayt af Sun Microsystems og nokkrum öðrum sérfræðingum, sem gerir að ljúka vinnu á forkeppni myndun sameiginlegs erfðaskrá staðall.

almenn lýsing

Í Unicode byggt á hugmyndinni um tákn. Undir þessa skilgreiningu er átt við abstrakt fyrirbæri sem er til staðar í ákveðnu formi skrifa og innleystur í gegnum kennt (þeirra "andlitsmyndum"). Hver persóna er gefin í "Unicode" einstakt kóða tilheyra tiltekinni einingu staðli. Td kennt B er einnig á ensku og rússnesku stafrófum, en það svarar til Unicode 2 mismunandi stafi. Þau eru háð því að viðskipti við lágstafir, t. E., Hvert sem lýsir helstu gagnagrunn, að setja af eignum og fullt nafn.

Hagur af Unicode

Frá öðrum samtímamenn Encoding "Unicode" Það er gríðarlega birgðir af merki fyrir "dulkóðun" stafi. Sú staðreynd að forverar hans höfðu 8 bita, sem er studd af 28 stöfum, en ný hönnun var þegar 216 stafir, það var risastór skref fram á við. Þetta gerði umrita næstum öllum núverandi og sameiginleg stafróf.

Með tilkomu "Unicode" ekki lengur þörf á að nota viðskipti töflu: í einum staðli það tapast bara þörf fyrir þá. Á sama hátt, þeir hafa sökkt í gleymskunnar dái, og "gibberish" - einn staðall gerði þá ómögulegt, auk útiloka þörfina á að skapa afrit leturgerðir.

þróun Unicode

Auðvitað, framfarir er ekki til staðar, og síðan fyrsta kynning hefur liðið 25 ár. Hins vegar, stafasett "Unicode" stubbornly heldur stöðu sína í heiminum. Á margan hátt hefur þetta verið gert mögulegt að þakka þeirri staðreynd að það hefur orðið auðvelt að hrinda í framkvæmd og hefur breiðst út, að vera viðurkennd verktaki af sér (greitt) og opinn hugbúnaður.

Við ættum ekki að trúa því að í dag sjáum sama númer "Unicode" sem aldarfjórðungi síðan. Á því augnabliki, það var komi útgáfu 5.h.h, og fjöldi dulmáli tákn hefur aukist til 231. Á möguleika á að nota meiri framlegð merki neitaði að halda enn stuðning Unicode-16 (kóðun, þar sem hámarksfjárhæð takmörkuðum fjölda þeirra 216). Frá upphafi og allt til útgáfu 2.0.0 "The Unicode Standard" hefur fjölgað stafi sem það fylgir nánast í 2 sinnum. tækifæri og áframhaldandi vöxtur á næstu árum. Fyrir útgáfu 4.0.0 þegar það er þörf á að auka staðalinn sjálft, og það var gert. Þess vegna, "Unicode" hefur fundið formið sem við þekkjum hana í dag.

Hvað annað er í Unicode?

Auk þess að mikill, stöðugt uppfærð með fjölda stafa, "Unicode" -Encoding texta upplýsingar er annar gagnlegur eiginleiki. Þetta er svokölluð eðlileg. Frekar en að fletta í gegnum allt skjalið staf eftir staf, og skipta táknin bréfaskipti borð, nota einn af núverandi eðlileg reiknirit. Hvað er það?

Í stað þess að sóa auðlindir tölvunnar með reglulegu stöðva af sama eðli, sem getur verið svipuð í mismunandi stafrófum, með sérstaka reiknirit. Það gerir þér kleift að gera svipaðar táknum dálk útlit borð og gilda þegar til þeirra, ekki aftur og aftur til að athuga allar gögn.

Slík reiknirit eru þróaðar og framkvæmdar fjórir. Hver viðskipti eigi sér stað með því að strangt ákveðinn meginreglu, mismunandi frá öðrum, svo að kalla einn af þeim er ekki duglegur mögulegt. Hver hönnuð fyrir sérstakar þarfir, var fellt og notað með góðum árangri.

birtingarstaðalinn

Á 25 ára sögu þess kóðun "Unicode" Ég hef fengið líklega útbreiddasta í heiminum. Samkvæmt þessum staðli eru stilltir eins áætlana og vefsíðum. Breidd umsókn gæti bent til þess Unicode nú nota meira en 60% af auðlindum Internet.

Nú, þú veist, þegar "Unicode" staðall birtist. Hvað er það, þú veist líka og vera fær um að meta fyllilega merkingu uppfinningarinnar, gert af hópi sérfræðinga Unicode Inc. Meira en 25 árum síðan.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 is.birmiss.com. Theme powered by WordPress.