ASCII

De Wikipedia, le encyclopedia libere
Saltar a: navigation, cercar
ASCII

ASCII (American Standard Code for Information Interchange) es un collection de characteres e un codification de characteres basate super le alphabeto roman secundo le uso del anglese moderne. Illo es usate per computatores e altere equipamentos de communication pro representar texto e per apparatos de controlo que opera con texto.

Como altere codices, ASCII specifica un correspondentia inter numeros integre que pote esser representate digitalmente e le symbolos de un lingua scripte, permittente que apparatos digital communica inter se e processa e immagazina information de natura textual. Le codification de characteres ASCII (o un extension compatibile; vide infra) es usate in quasi tote computatores commun, specialmente in computatores personal e stationes de travalio. Le denomination MIME preferite pro iste codification es "US-ASCII".

ASCII es un codice de septe bits, lo que significa que illo usa numeros integre representabile con septe digitos binari (un gamma de 0 a 127 in decimal) pro representar information. Mesmo in le epocha del introduction del ASCII, le majoritate del computatores operava con bytes de octo bits como le minor unitate de information; le octave bit communmente era usate pro controlo de errores in lineas de communication o altere functiones in apparatos specific.

ASCII non specifica ulle maniera de representar informatoin super le structura o apparentia de un fragmento de texto. Isto require le uso de un linguage de marcation.

ASCII esseva publicate como un standard in 1963 per le American Standards Association (ASA), que posteriormente deveniva ANSI. Il habeva multe variationes de ASCII, mais su forma actual e plus disseminate es ANSI X3.4-1967, equalmente standardisate como ECMA-6, ISO/IEC 664:1991 International Reference Version, e ITU-T Recommendation T.50 (09/92). ASCII es considerate generalmente como le standard de software le plus successose jammais promulgate.

Characteres de controlo ASCII[modificar | modificar fonte]

Le prime trenta-duo codices (numeros 0—31 in decimal) de ASCII es reservate pro characteres de controlo que pote non representar information in se, mais es usate pro controlar apparatos (como impressores) que utilisa ASCII. Per exemplo, le character 10 representa le function "Line Feed" ("avantiamento de linea", que face le impressor avantiar le papiro), e le character 27 representa le clave "Escape" trovate in le angulo superior sinistre de clavieros commun.

Le codice 127 (tote le septe bits accendite) es un altere character special cognite como "Delete". Ben que su function es similar a illo de altere characteres de controlo, illo esseva placiate in su position a fin que illo poterea esser usate pro cancellar un section de banda perforate, un medio de immagazinage popular in le passato, per perforar tote su foramines.

Binario Decimal Hex Abbreviation Representation
imprimibile
Nomine / Significato
0000 0000 0 00 NUL Null character
0000 0001 1 01 SOH Start of Header
0000 0010 2 02 STX Start of Text
0000 0011 3 03 ETX End of Text
0000 0100 4 04 EOT End of Transmission
0000 0101 5 05 ENQ Enquiry
0000 0110 6 06 ACK Acknowledgment
0000 0111 7 07 BEL Bell
0000 1000 8 08 BS Backspace
0000 1001 9 09 HT Horizontal Tab
0000 1010 10 0A LF Line Feed
0000 1011 11 0B VT Vertical Tab
0000 1100 12 0C FF Form Feed
0000 1101 13 0D CR Carriage Return
0000 1110 14 0E SO Shift Out
0000 1111 15 0F SI Shift In
0001 0000 16 10 DLE Data Link Escape
0001 0001 17 11 DC1 XON Device Control 1
0001 0010 18 12 DC2 Device Control 2
0001 0011 19 13 DC3 XOFF Device Control 3
0001 0100 20 14 DC4 Device Control 4
0001 0101 21 15 NAK Negative Acknowledgement
0001 0110 22 16 SYN Synchronous Idle
0001 0111 23 17 ETB End of Trans. Block
0001 1000 24 18 CAN Cancel
0001 1001 25 19 EM End of Medium
0001 1010 26 1A SUB Substitute
0001 1011 27 1B ESC Escape
0001 1100 28 1C FS File Separator
0001 1101 29 1D GS Group Separator
0001 1110 30 1E RS Record Separator
0001 1111 31 1F US Unit Separator
0111 1111 127 7F DEL Delete

In le tabella supra, le quinte columna contine characteres graphic que es reservate pro representar le position de codices de controlo in un fluxo de datos; tu agente de usator HTML pote requirer le installation de fontes additional a fin de exhibir los.

Softwares utilitari e systemas de operation ha varie conventiones pro representar le fin de un linea de texto. Le majoritate usa o LF o CR individualmente, o CR sequite per LF. Quando un SO immagazina texto in un file usante ASCII o un codification compatibile de 8 bits, iste characteres es representate per lor bytes 0A, 0D, o 0D sequite per 0A, respectivemente. In EBCDIC, le codice "Next Line" (NEL) al byte 15 (hex) es le typic character de fin de linea. ASCII non del toto codifica NEL, le byte 15 in illo es NAK. Le tabella sequente demonstra le variationes in le conventiones de fin de linea inter differente SOs:

Systema de Operation Character(es)
AIX NEL
CP/M and MP/M CR LF
Cygwin LF o CR LF*
Mac OS usque a 9.x CR
Mac OS X LF
Windows CR LF
MS-DOS CR LF
OS/390 NEL
Unix, Xenix LF
VMS
Ha multe formatos de file de texto.
Le formato predefinite es "Variable
Length Record".
Le formato es specificate per
le campo "Record format"
del registro del file in le directorio.
Variable Length Record,
CR LF,
CR,
LF,
Fixed Length Record,
etc.
X Window System** LF

* Depende de como illo era installate. ** Mesmo in execution super Microsoft Windows.

Characteres imprimibile ASCII[modificar | modificar fonte]

Le codice 32 es le character de spatio, denotante le spatio inter parolas, que es producite per le grande barra de spatio de un claviero. Le codices de 33 a 126 es appellate characteres imprimite, que representa litteras, digitos, signos de punctuation e alcun symbolos miscellanee.

Binario Decimal Hex Graphico
0010 0000 32 20 (spatio in blanco)
0010 0001 33 21 !
0010 0010 34 22 "
0010 0011 35 23 #
0010 0100 36 24 $
0010 0101 37 25 %
0010 0110 38 26 &
0010 0111 39 27 '
0010 1000 40 28 (
0010 1001 41 29 )
0010 1010 42 2A *
0010 1011 43 2B +
0010 1100 44 2C ,
0010 1101 45 2D -
0010 1110 46 2E .
0010 1111 47 2F /
0011 0000 48 30 0
0011 0001 49 31 1
0011 0010 50 32 2
0011 0011 51 33 3
0011 0100 52 34 4
0011 0101 53 35 5
0011 0110 54 36 6
0011 0111 55 37 7
0011 1000 56 38 8
0011 1001 57 39 9
0011 1010 58 3A :
0011 1011 59 3B ;
0011 1100 60 3C <
0011 1101 61 3D =
0011 1110 62 3E >
0011 1111 63 3F ?
Binario Decimal Hex Graphico
0100 0000 64 40 @
0100 0001 65 41 A
0100 0010 66 42 B
0100 0011 67 43 C
0100 0100 68 44 D
0100 0101 69 45 E
0100 0110 70 46 F
0100 0111 71 47 G
0100 1000 72 48 H
0100 1001 73 49 I
0100 1010 74 4A J
0100 1011 75 4B K
0100 1100 76 4C L
0100 1101 77 4D M
0100 1110 78 4E N
0100 1111 79 4F O
0101 0000 80 50 P
0101 0001 81 51 Q
0101 0010 82 52 R
0101 0011 83 53 S
0101 0100 84 54 T
0101 0101 85 55 U
0101 0110 86 56 V
0101 0111 87 57 W
0101 1000 88 58 X
0101 1001 89 59 Y
0101 1010 90 5A Z
0101 1011 91 5B [
0101 1100 92 5C \
0101 1101 93 5D ]
0101 1110 94 5E ^
0101 1111 95 5F _
Binario Decimal Hex Graphico
0110 0000 96 60 `
0110 0001 97 61 a
0110 0010 98 62 b
0110 0011 99 63 c
0110 0100 100 64 d
0110 0101 101 65 e
0110 0110 102 66 f
0110 0111 103 67 g
0110 1000 104 68 h
0110 1001 105 69 i
0110 1010 106 6A j
0110 1011 107 6B k
0110 1100 108 6C l
0110 1101 109 6D m
0110 1110 110 6E n
0110 1111 111 6F o
0111 0000 112 70 p
0111 0001 113 71 q
0111 0010 114 72 r
0111 0011 115 73 s
0111 0100 116 74 t
0111 0101 117 75 u
0111 0110 118 76 v
0111 0111 119 77 w
0111 1000 120 78 x
0111 1001 121 79 y
0111 1010 122 7A z
0111 1011 123 7B {
0111 1100 124 7C |
0111 1101 125 7D }
0111 1110 126 7E ~

Nota que le characteres majuscule pote esser convertite in minuscule per le addition de 32 a lor valores ASCII; in binario, isto pote esser obtenite simplemente per definir le sexte bit minus significante como 1.

Variantes de ASCII[modificar | modificar fonte]

Le dissemination international del informatica ha provocate le apparition de multe variationes e extensiones del collection de characteres ASCII, viste que ASCII non include litteras accentuate e altere symbolos necessari pro scriber le majoritate del linguas que usa alphabetos de base roman. Le standard international ISO 646 (1972) esseva le prime tentativa de remediar iste problema, ben que illo infortunatemente creava simultaneemente problemas de compatibilitate. ISO 646 esseva ancora un collection de characteres de septe bits, e viste que il non habeva codices additional disponibile, alcunes esseva reassignate in variantes pro linguas specific. Per exemplo, le codice ASCII 93 (le parenthese quadrate dextere "]") es usate in le variante german ISO 646-DE pro le littera majuscule U con dierese (Ü), e in le variante danese ISO 646-DK pro le littera majuscule A con anello (Å).

Meliorationes technologic apportava manieras de representar exteriormente le information previemente codificate in le octave bit de cata byte, liberante iste bit pro componer 128 codices de character additional pro nove assignationes. Standards de octo bits tal como ISO 8859 possibilitava le representation de un gamma plus large de linguas, mais le incompatibilitates e limitationes persisteva. ISO 8859-1 e le original ASCII de 7 bits es le plus commun codificationes de characteres in uso hodie, ben que Unicode (con un collection de characteres multo plus grande) rapidemente deveni standard in multe locos. Iste codices plus recente es retrocompatibilitate, isto es, le prime 127 positiones de cata codice es identic al ASCII, e le prime 256 positiones de Unicode es identic al ISO 8859-1.

Le parola anglese "ASCIIbetical" describe le ordination de datos in le ordine de ASCII in vice del ordine alphabetic genuine (que require un computation ingeniose, e varia secundo le lingua in question).

Vide etiam[modificar | modificar fonte]

Ligamines externe[modificar | modificar fonte]