1120ビットの最大使用量のGSMショートメッセージにテキストとデータをエンコードするための3つの異なるオプションがあります。
- 7ビット、160文字
- 基準によると GSM 03.38 、ugs。 GSM-Alphabet 。限られた文字を表示するのに十分なSMSテキストメッセージの場合。テキストには、メッセージあたり最大160文字(7ビット/文字×160文字= 1,120ビット)を含めることができます。それぞれ7ビットは記号として解釈され、原則として表示可能な文字のストックが128に制限されます。これらの128文字は、基底の7ビットベースで定義されています [初め] 。供給を表示可能な文字に拡張できるいくつかのメカニズムがあります [2] :
- エスケープ:エスケープサイン(ESC、0x1B)は、標準シンボル拡張機能を使用して次の文字を表示します。
- シングルシフトで脱出:の要素を通して ユーザーデータヘッダー メッセージは、標識の標準標識の代わりに、代替の文字セット拡張機能を選択できます。
- ロックシフト:別の要素があります ユーザーデータヘッダー ベースサインセットの代わりに、代替の文字セットを選択できます。
- 8ビット、140文字
- ロゴ、画像メッセージ、着信音などのデータニュース(バイナリコンテンツ)の場合。 8ビットメッセージには、最大140文字(8ビット/文字×140文字= 1,120ビット)を含めることができます。
- 16ビット、70文字
- Unicode UCS2、d。 H. BMP( 基本的な多言語プレーン )限られたUTF-16。直接サポートされていないライティングシステムには、ユニコードメッセージが必要です。 B.アラビア語、ヘブライ語、キリル語、ラテン語の他の特殊文字。ユニコードメッセージは70文字に制限されています(16ビット/文字×70文字= 1,120ビット)。
7ビットメッセージの文字セット拡張テーブルは、通常、これらのテーブルを持たず、したがって基本テーブルの記号を表すエンドデバイスが可能な限り類似して作成されるように設計されています。 B.「E」の代わりに。
トルコ語、スペイン語、ポルトガル語、ベンガル語、グジャラート語、ヒンディー語、カンナダ語、マラヤーラム語、オリヤ、パンジャブ語、タミル語、テルグ語、ウルドゥー語のシングルシフトの兆候があります。
トルコ語、ポルトガル語、ベンガル語、グジャラート語、ヒンディー語、カンナダ語、マラヤーラム語、オリヤ、パンジャブ語、タミル語、テルグ語、ウルドゥー語のロックシフトの標識があります。
シングルシフトとロックシフトのメカニズムを組み合わせることができます。
例:
- 16ビット:0x0637アラビア語の看板tah: “ط”
- 7ビット:0x65は「e」になります
- エスケープ付き7ビット:0x1bに続いて0x65が続き、1つのユーロサイン「€」
- シングルシフトで7ビット:「türkisch」を設定する場合、0x1bに続いて0x53 an sでセディル「ş」
- ロックシフトで7ビット:「türkish」を設定すると、0x1cはセディル「ş」でSになります
ベースサイン
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
@ |
d |
sp⁴ |
0 |
¡ |
p |
¿ |
p |
0x01 |
£ |
_ |
! |
初め |
a |
Q |
a |
Q |
0x02 |
$ |
ファイ |
「 |
2 |
b |
r |
b |
r |
0x03 |
¥ |
c |
# |
3 |
c |
s |
c |
s |
0x04 |
と |
l |
¤ |
4 |
d |
t |
d |
t |
0x05 |
そうです |
おお |
% |
5 |
と |
の |
そうです |
の |
0x06 |
バズ |
pi |
& |
6 |
f |
の |
f |
の |
0x07 |
私 |
φ |
‘ |
7 |
g |
の |
g |
の |
0x08 |
ò |
a |
( |
8 |
h |
バツ |
h |
バツ |
0x09 |
何 |
th |
)) |
9 |
私 |
と |
私 |
と |
0x0a |
LF¹ |
バツ |
* |
: |
j |
と |
j |
と |
0x0b |
Ø |
asc³ |
+ |
; |
k |
ä |
k |
ä |
0x0c |
Ø |
これまで |
、 |
< |
l |
彼 |
l |
彼 |
0x0d |
cr² |
これまで |
– |
= |
m |
ñ |
m |
ñ |
0x0e |
に |
ß |
。 |
> |
n |
ü |
n |
ü |
0x0f |
に |
と |
/ |
? |
o |
§ |
o |
に |
¹はラインフィードです(LF、ラインフィード) ²はワゴンリターンです(CR、キャリッジリターン) ³はエスケープサインです(ESC) ⁴はスペースです(SP、スペース)
|
標識の標準標識
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
|
|
|
|
| |
|
|
|
0x01 |
|
|
|
|
|
|
|
|
0x02 |
|
|
|
|
|
|
|
|
0x03 |
|
|
|
|
|
|
|
|
0x04 |
|
^ |
|
|
|
|
|
|
0x05 |
|
|
|
|
|
|
€€ |
|
0x06 |
|
|
|
|
|
|
|
|
0x07 |
|
|
|
|
|
|
|
|
0x08 |
|
|
{ |
|
|
|
|
|
0x09 |
|
|
} |
|
|
|
|
|
0x0a |
ff¹ |
|
|
|
|
|
|
|
0x0b |
|
SS2² |
|
|
|
|
|
|
0x0c |
|
|
|
[ |
|
|
|
|
0x0d |
|
|
|
〜 |
|
|
|
|
0x0e |
|
|
|
] |
|
|
|
|
0x0f |
|
|
|
|
|
|
|
|
¹はページブレイクです(FF、フォームフィードまたはページブレイク) ²は、将来の拡張機能のために予約されている別のシングルシフトエスケープサインです
|
ロックシフトキャラクターテーブルトルコ語
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
@ |
d |
⁴ |
0 |
私 |
p |
何 |
p |
0x01 |
£ |
_ |
! |
初め |
a |
Q |
a |
Q |
0x02 |
$ |
ファイ |
「 |
2 |
b |
r |
b |
r |
0x03 |
¥ |
c |
# |
3 |
c |
s |
c |
s |
0x04 |
€€ |
l |
¤ |
4 |
d |
t |
d |
t |
0x05 |
そうです |
おお |
% |
5 |
と |
の |
そうです |
の |
0x06 |
バズ |
pi |
& |
6 |
f |
の |
f |
の |
0x07 |
私 |
φ |
‘ |
7 |
g |
の |
g |
の |
0x08 |
ò |
a |
( |
8 |
h |
バツ |
h |
バツ |
0x09 |
何 |
th |
)) |
9 |
私 |
と |
私 |
と |
0x0a |
¹ |
バツ |
* |
: |
j |
と |
j |
と |
0x0b |
わかります |
³ |
+ |
; |
k |
ä |
k |
ä |
0x0c |
わかります |
s |
、 |
< |
l |
彼 |
l |
彼 |
0x0d |
² |
s |
– |
= |
m |
ñ |
m |
ñ |
0x0e |
に |
ß |
。 |
> |
n |
ü |
n |
ü |
0x0f |
に |
と |
/ |
? |
o |
§ |
o |
に |
¹はラインフィードです(LF、ラインフィード) ²はワゴンリターンです(CR、キャリッジリターン) ³はESCです ⁴はスペースです
|
シングルシフトキャラクターテーブルトルコ語
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
|
|
|
|
| |
|
|
|
0x01 |
|
|
|
|
|
|
|
|
0x02 |
|
|
|
|
|
|
|
|
0x03 |
|
|
|
|
|
s |
何 |
s |
0x04 |
|
^ |
|
|
|
|
|
|
0x05 |
|
|
|
|
|
|
€€ |
|
0x06 |
|
|
|
|
|
|
|
|
0x07 |
|
|
|
|
わかります |
|
わかります |
|
0x08 |
|
|
{ |
|
|
|
|
|
0x09 |
|
|
} |
|
私 |
|
私 |
|
0x0a |
¹ |
|
|
|
|
|
|
|
0x0b |
|
² |
|
|
|
|
|
|
0x0c |
|
|
|
[ |
|
|
|
|
0x0d |
³ |
|
|
〜 |
|
|
|
|
0x0e |
|
|
|
] |
|
|
|
|
0x0f |
|
|
|
|
|
|
|
|
¹はページブレイク(ページブレイク)です ²はESCです ³はコントロールサインです。この時点で、言語固有の文字をエンコードする必要はありません。
|
ロックシフトキャラクターテーブルポルトガル語
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
@ |
* |
⁴ |
0 |
の |
p |
〜 |
p |
0x01 |
£ |
_ |
! |
初め |
a |
Q |
a |
Q |
0x02 |
$ |
ª |
「 |
2 |
b |
r |
b |
r |
0x03 |
¥ |
何 |
# |
3 |
c |
s |
c |
s |
0x04 |
おい |
で |
º |
4 |
d |
t |
d |
t |
0x05 |
そうです |
∞ |
% |
5 |
と |
の |
そうです |
の |
0x06 |
ú |
^ |
& |
6 |
f |
の |
f |
の |
0x07 |
の |
|
‘ |
7 |
g |
の |
g |
の |
0x08 |
おお |
€€ |
( |
8 |
h |
バツ |
h |
バツ |
0x09 |
何 |
おお |
)) |
9 |
私 |
と |
私 |
と |
0x0a |
¹ |
| |
* |
: |
j |
と |
j |
と |
0x0b |
傘 |
³ |
+ |
; |
k |
私 |
k |
私 |
0x0c |
傘 |
â |
、 |
< |
l |
彼 |
l |
彼 |
0x0d |
² |
â |
– |
= |
m |
ú |
m |
“ |
0x0e |
の上 |
おい |
。 |
> |
n |
ü |
n |
ü |
0x0f |
の上 |
と |
/ |
? |
o |
§ |
o |
に |
¹はラインフィードです(LF、ラインフィード) ²はワゴンリターンです(CR、キャリッジリターン) ³はESCです ⁴はスペースです
|
シングルシフトキャラクターテーブルポルトガル語
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
|
|
|
|
| |
|
|
|
0x01 |
|
|
|
|
で |
|
â |
|
0x02 |
|
ファイ |
|
|
|
|
|
|
0x03 |
|
c |
|
|
|
|
|
|
0x04 |
|
^ |
|
|
|
|
|
|
0x05 |
おい |
おお |
|
|
|
ú |
€€ |
ú |
0x06 |
|
pi |
|
|
|
|
|
|
0x07 |
|
φ |
|
|
|
|
|
|
0x08 |
|
a |
{ |
|
|
|
|
|
0x09 |
何 |
th |
} |
|
の |
|
の |
|
0x0a |
¹ |
|
|
|
|
|
|
|
0x0b |
傘 |
² |
|
|
|
私 |
|
私 |
0x0c |
傘 |
|
|
[ |
|
彼 |
|
彼 |
0x0d |
³ |
|
|
〜 |
|
|
|
|
0x0e |
の上 |
|
|
] |
|
|
|
|
0x0f |
の上 |
おい |
|
|
おお |
|
おお |
â |
¹はページブレイク(ページブレイク)です ²はESCです ³はコントロールサインです。この時点で、言語固有の文字をエンコードする必要はありません。
|
シフトキャラクターテーブルヒンディー語のロック
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
ँ |
aye |
⁴ |
0 |
b |
when |
OM |
p |
0x01 |
ं |
a |
! |
初め |
b |
ि |
a |
Q |
0x02 |
ः |
o |
t |
2 |
私 |
ी |
b |
r |
0x03 |
a |
O! |
雷 |
3 |
y |
ु |
c |
s |
0x04 |
来て |
o |
d |
4 |
と |
ू |
d |
t |
0x05 |
農業 |
k |
二 |
5 |
r |
ृ |
そうです |
の |
0x06 |
e |
b |
n |
6 |
l |
ॄ |
f |
の |
0x07 |
u |
g |
生きている |
7 |
刺します |
ॅ |
g |
の |
0x08 |
彼 |
d |
)) |
8 |
4 |
ॆ |
h |
バツ |
0x09 |
行 |
4 |
( |
9 |
と |
े |
私 |
と |
0x0a |
¹ |
fと |
徹底的です |
: |
市 |
ै |
j |
と |
0x0b |
L. |
³ |
|
; |
縮む |
ॉ |
k |
‘esamesAssAmsAssAmsAssAmsAssAmsAmsAms … ame |
0x0c |
4 |
は |
、 |
私 |
s |
ॊ |
l |
ॻ |
0x0d |
² |
h |
din |
音楽スケールの5番目のメモ |
おい |
ो |
m |
ॼ |
0x0e |
e |
jhoom |
。 |
f |
़ |
ौ |
n |
ॾ |
0x0f |
a |
j |
いいえ |
? |
ऽ |
u |
o |
ॿ |
¹はラインフィードです(LF、ラインフィード) ²はワゴンリターンです(CR、キャリッジリターン) ³はESCです ⁴はスペースです
|
単一シフトキャラクターテーブルヒンディー語
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
@ |
< |
४ |
z |
| |
p |
|
|
0x01 |
£ |
= |
५ |
d |
a |
Q |
|
|
0x02 |
$ |
> |
६ |
2つと-a -half |
b |
r |
|
|
0x03 |
¥ |
¡ |
७ |
fu |
c |
s |
|
|
0x04 |
¿ |
^ |
८ |
y |
d |
t |
|
|
0x05 |
「 |
¡ |
९ |
r |
と |
の |
€€ |
|
0x06 |
¤ |
_ |
॑ |
ॡ |
f |
の |
|
|
0x07 |
% |
# |
॒ |
ॢ |
g |
の |
|
|
0x08 |
& |
* |
{ |
ॣ |
h |
バツ |
|
|
0x09 |
‘ |
。 |
} |
。 |
私 |
と |
|
|
0x0a |
¹ |
。 |
॓ |
ॱ |
j |
と |
|
|
0x0b |
* |
³ |
॔ |
|
k |
|
|
|
0x0c |
+ |
० |
Q |
[ |
l |
|
|
|
0x0d |
² |
१ |
バク |
〜 |
m |
|
|
|
0x0e |
– |
२ |
g |
] |
n |
|
|
|
0x0f |
/ |
३ |
|
|
o |
|
|
|
¹はページブレイク(ページブレイク)です ²はESCです ³はコントロールサインです。この時点で、言語固有の文字をエンコードする必要はありません。
|
ロックシフトキャラクターテーブルベンガリ
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
ঁ |
3 |
⁴ |
0 |
B b |
া |
r |
p |
0x01 |
ং |
|
! |
初め |
v |
ি |
a |
Q |
0x02 |
ঃ |
|
つま先 |
2 |
s |
ী |
b |
r |
0x03 |
非 |
o |
絶頂 |
3 |
y A |
ু |
c |
s |
0x04 |
a |
1 |
d |
4 |
r |
ূ |
d |
t |
0x05 |
e |
a、a |
b |
5 |
|
ৃ |
そうです |
の |
0x06 |
イード |
b |
o |
6 |
好き |
ৄ |
f |
の |
0x07 |
おお |
csc。c |
t。 |
7 |
|
|
g |
の |
0x08 |
1 |
c |
)) |
8 |
|
|
h |
バツ |
0x09 |
1 |
e |
( |
9 |
|
ে |
私 |
と |
0x0a |
¹ |
f |
t |
: |
s |
ৈ |
j |
と |
0x0b |
ঌ |
³ |
s |
; |
s |
|
k |
ৗ |
0x0c |
|
g |
、 |
|
s |
|
l |
r |
0x0d |
² |
h |
ほこり |
p |
h |
ো |
m |
t |
0x0e |
|
ぴくぴく動く |
。 |
F. F. |
় |
ৌ |
n |
r |
0x0f |
これ |
j |
いいえ |
? |
1 |
্ |
o |
うわーすごい |
¹はラインフィードです(LF、ラインフィード) ²はワゴンリターンです(CR、キャリッジリターン) ³はESCです ⁴はスペースです
|
シングルシフトキャラクターテーブルベンガリ
|
0x00 |
0x10 |
0x20 |
0x30 |
0x40 |
0x50 |
0x60 |
0x70 |
0x00 |
@ |
< |
৬ |
৶ |
|
p |
|
|
0x01 |
£ |
= |
৭ |
。 |
a |
Q |
|
|
0x02 |
$ |
> |
৮ |
৸ |
b |
r |
|
|
0x03 |
¥ |
¡ |
৯ |
৹ |
c |
s |
|
|
0x04 |
¿ |
^ |
よ |
৺ |
d |
t |
|
|
0x05 |
「 |
¡ |
1 |
|
と |
の |
€€ |
|
0x06 |
¤ |
_ |
ৡ |
|
f |
の |
|
|
0x07 |
% |
# |
ৢ |
|
g |
の |
|
|
0x08 |
& |
* |
{ |
|
h |
バツ |
|
|
0x09 |
‘ |
০ |
} |
|
私 |
と |
|
|
0x0a |
¹ |
১ |
ৣ |
|
j |
と |
|
|
0x0b |
* |
² |
৲ |
|
k |
|
|
|
0x0c |
+ |
২ |
৳ |
[ |
l |
|
|
|
0x0d |
³ |
৩ |
৴ |
〜 |
m |
|
|
|
0x0e |
– |
৪ |
৵ |
] |
n |
|
|
|
0x0f |
/ |
৫ |
|
|
o |
|
|
|
¹はページブレイク(ページブレイク)です ²はESCです ³はコントロールサインです。この時点で、言語固有の文字をエンコードする必要はありません。
|
- ↑ UnicodeへのGSM 03.38文字のマッピング。 (txt; 9 kb)10。2009年11月、 2009年11月18日にアクセス (英語)。
- ↑ 3GPP TS 23.038:アルファベットと言語固有の情報。リリース9.0.0。 (zip/doc; 174 kb)28。2009年9月、 2009年11月16日にアクセス (英語)。
Recent Comments