EBCDIC

Udvidet Binary Coded Decimal Interchange Code er en 8-bit tegnsæt, der anvendes primært på IBM mainframe og IBM midrange computer operativsystemer.

EBCDIC nedstammer fra den anvendte kode med hulkort og de tilsvarende seks bit binær kodet decimal kode, der bruges med de fleste af IBMs computerudstyr i slutningen af ​​1950'erne og begyndelsen af ​​1960'erne.

Det er også ansat på forskellige ikke-IBM-platforme som Fujitsu-Siemens BS2000 / OSD, OS-IV, MSP, MSP-EX, HP MPE / iX, og Unisys VS / 9 og MCP.

Historie

EBCDIC blev udtænkt i 1963 og 1964 af IBM og blev annonceret med udgivelsen af ​​IBM System / 360 linje af mainframe computere. Det er en 8-bit tegnkodning, i modsætning til, og udviklet uafhængigt af den 7-bit ASCII-kodning ordningen. Det blev oprettet for at udvide den eksisterende binær-kodet decimal udveksling kode, eller BCDIC, som i sig selv blev udtænkt som et effektivt middel til koder de to zone og nummer slag på hulkort i 6 bits.

Mens IBM var en høvding fortaler for ASCII standardiseringsudvalg, de ikke har tid til at forberede ASCII periferiudstyr til at sende med sin System / 360 computere, så virksomheden afregnes på EBCDIC. System / 360 blev vildt vellykket, og sammen med kloner som RCA Spectra 70, ICL System 4, og Fujitsu FACOM, således det gjorde EBCDIC.

Alle IBM-mainframe og midrange periferiudstyr og operativsystemer bruger EBCDIC som deres iboende kodning, men AIX kører på RS / 6000 og dets efterkommere, herunder IBM Power Systems, Linux kører på zSeries, og operativsystemer kører på IBM PC og dens efterkommere bruge ASCII. Software og mange hardware periferiudstyr kan oversætte til og fra kodninger, og moderne mainframes omfatter processor instruktioner, på hardware-niveau, for at fremskynde oversættelse mellem tegnsæt.

EBCDIC har ingen teknisk fordel i forhold til nogle ASCII-baserede tegnkodninger, såsom ISO-8859-serien, bortset fra inddragelsen af ​​"¢" karakter; imidlertid ASCII-baserede Unicode gør omfatte cent karakter. Mens EBCDIC, som ASCII, har en bit udstyre store eller små bogstaver, i modsætning til ASCII den EBCDIC alfabet er ikke-tilgrænsende, sammenflettet med tildelte karakterer, som måske eller måske ikke er i brug. Dataportabilitet hindres af mangel på mange symboler der almindeligvis anvendes i programmering og i netværk kommunikation, og af forskellige, inkompatible oversættelser for EBCDIC tegn, som ikke indgår i 7-bit ASCII. Den sortering sekvens af øvre case alfabetiske tegn er højere end små bogstaver og talværdier er højere stadig det stik modsatte af ASCII. Som med enkelt-byte udvidet ASCII tegnsæt, EBCDIC codepages er sprogafhængige uden nomenklatur eller intern mekanisme til at betegne ikke- "standard" brug.

Hvor der ønskes sande støtte til flersprogede tekst, er behov for et system, der understøtter langt flere tegn. Generelt dette gøres med en vis form for Unicode support. Der er en EBCDIC Unicode Transformation Format kaldet UTF-EBCDIC forslag Unicode Consortium, men det er ikke beregnet til at blive anvendt i åbne miljøer interchange, og selv om EBCDIC-baserede systemer, er det næsten aldrig brugt. IBM mainframes understøtter UTF-16, men de understøtter ikke UTF, EBCDIC indbygget.

Arabisk EBCDIC versioner er typisk i venstre-til-højre præsentation rækkefølge som vist af ældre mainframes og line printere i stedet for i den rigtige-til-venstre logisk rækkefølge, der anvendes af senere kodninger såsom Unicode.

Codepage layout

Nedenstående tabel er baseret på CCSID 500, en af ​​de kode siden varianter af EBCDIC; Det viser kun de basale EBCDIC tegn. Tegn 00-3F og FF er kontroller, 40 er plads, 41 er ikke-break plads, E1 er numerisk plads, og CA er blød bindestreg. Tegn vises med deres tilsvarende Unicode koder. Invariant alfanumeriske, tegnsætning, og kontrol tegn er fælles for alle EBCDIC kode sider er vist med fed skrift. Tildelte koder er typisk fyldt med internationale eller regionsspecifikke tegn i de forskellige EBCDIC kode side varianter.

I hver tabel cellen under, den første række er en forkortelse for et kontrolkode eller selve tegnet; den anden række er Unicode-koden; og den tredje række er decimal værdi EBCDIC kode.

Kritik og humor

Open source-software fortaler og hacker Eric S. Raymond skriver i sin Jargon File, at EBCDIC var næsten universelt afskyede ved tidlige hackere og programmører på grund af sine mange forskellige versioner, hvoraf ingen lignede de andre versioner, og at IBM produceret den i direkte konkurrence med den allerede etablerede ASCII.

Den Jargon File 4.4.7 giver følgende definition:

En anden populær klage er, at EBCDIC alfabetiske tegn følger en hulkort kodning konvention snarere end en lineær bestilling som ASCII. En konsekvens af dette er, at forøge tegnet koden for "I" ikke giver koden for "J", og ligeledes er der en kløft mellem koderne for "R" og "S".

Disse uoverensstemmelser var også kilden til mange vittigheder. En sådan joke gik:

Henvisninger til den EBCDIC tegnsæt er lavet i det klassiske Infocom eventyrspil serien Zork. I "maskinrum" i Zork II, er der en samling af gamle computere og andre maskiner af uvis formål. Det følgende er en beskrivelse af lokalet, med EBCDIC bruges til at antyde et uforståeligt sprog:

Desuden findes en tilsvarende beskrivelse i "Vedligeholdelse Room" i Zork:

  0   0
Forrige artikel Ernesto Schiaparelli
Næste artikel Else Ury

Kommentarer - 0

Ingen kommentar

Tilføj en kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tegn tilbage: 3000
captcha