GSM 03.38-ウィキペディア

before-content-x4

1120ビットの最大使用量のGSMショートメッセージにテキストとデータをエンコードするための3つの異なるオプションがあります。

7ビット、160文字
基準によると GSM 03.38 、ugs。 GSM-Alphabet 。限られた文字を表示するのに十分なSMSテキストメッセージの場合。テキストには、メッセージあたり最大160文字(7ビット/文字×160文字= 1,120ビット)を含めることができます。それぞれ7ビットは記号として解釈され、原則として表示可能な文字のストックが128に制限されます。これらの128文字は、基底の7ビットベースで定義されています [初め] 。供給を表示可能な文字に拡張できるいくつかのメカニズムがあります [2]

  • エスケープ:エスケープサイン(ESC、0x1B)は、標準シンボル拡張機能を使用して次の文字を表示します。
  • シングルシフトで脱出:の要素を通して ユーザーデータヘッダー メッセージは、標識の標準標識の代わりに、代替の文字セット拡張機能を選択できます。
  • ロックシフト:別の要素があります ユーザーデータヘッダー ベースサインセットの代わりに、代替の文字セットを選択できます。
8ビット、140文字
ロゴ、画像メッセージ、着信音などのデータニュース(バイナリコンテンツ)の場合。 8ビットメッセージには、最大140文字(8ビット/文字×140文字= 1,120ビット)を含めることができます。
16ビット、70文字
Unicode UCS2、d。 H. BMP( 基本的な多言語プレーン )限られたUTF-16。直接サポートされていないライティングシステムには、ユニコードメッセージが必要です。 B.アラビア語、ヘブライ語、キリル語、ラテン語の他の特殊文字。ユニコードメッセージは70文字に制限されています(16ビット/文字×70文字= 1,120ビット)。
after-content-x4

7ビットメッセージの文字セット拡張テーブルは、通常、これらのテーブルを持たず、したがって基本テーブルの記号を表すエンドデバイスが可能な限り類似して作成されるように設計されています。 B.「E」の代わりに。

トルコ語、スペイン語、ポルトガル語、ベンガル語、グジャラート語、ヒンディー語、カンナダ語、マラヤーラム語、オリヤ、パンジャブ語、タミル語、テルグ語、ウルドゥー語のシングルシフトの兆候があります。

トルコ語、ポルトガル語、ベンガル語、グジャラート語、ヒンディー語、カンナダ語、マラヤーラム語、オリヤ、パンジャブ語、タミル語、テルグ語、ウルドゥー語のロックシフトの標識があります。

シングルシフトとロックシフトのメカニズムを組み合わせることができます。

例:

  • 16ビット:0x0637アラビア語の看板tah: “ط”
  • 7ビット:0x65は「e」になります
  • エスケープ付き7ビット:0x1bに続いて0x65が続き、1つのユーロサイン「€」
  • シングルシフトで7ビット:「türkisch」を設定する場合、0x1bに続いて0x53 an sでセディル「ş」
  • ロックシフトで7ビット:「türkish」を設定すると、0x1cはセディル「ş」でSになります
ベースサイン
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 @ d sp⁴ 0 ¡ p ¿ p
0x01 £ _ 初め a Q a Q
0x02 $ ファイ 2 b r b r
0x03 ¥ c 3 c s c s
0x04 l ¤ 4 d t d t
0x05 そうです おお 5 そうです
0x06 バズ pi 6 f f
0x07 φ 7 g g
0x08 ò a 8 h バツ h バツ
0x09 th )) 9
0x0a LF¹ バツ * j j
0x0b Ø asc³ + ; k ä k ä
0x0c Ø これまで < l l
0x0d cr² これまで = m ñ m ñ
0x0e ß > n ü n ü
0x0f / o § o

¹はラインフィードです(LF、ラインフィード)
²はワゴンリターンです(CR、キャリッジリターン)
³はエスケープサインです(ESC)
⁴はスペースです(SP、スペース)

after-content-x4
標識の標準標識
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 |
0x01
0x02
0x03
0x04 ^
0x05 €€
0x06
0x07
0x08 {
0x09 }
0x0a ff¹
0x0b SS2²
0x0c [
0x0d
0x0e ]
0x0f

¹はページブレイクです(FF、フォームフィードまたはページブレイク)
²は、将来の拡張機能のために予約されている別のシングルシフトエスケープサインです

ロックシフトキャラクターテーブルトルコ語
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 @ d 0 p p
0x01 £ _ 初め a Q a Q
0x02 $ ファイ 2 b r b r
0x03 ¥ c 3 c s c s
0x04 €€ l ¤ 4 d t d t
0x05 そうです おお 5 そうです
0x06 バズ pi 6 f f
0x07 φ 7 g g
0x08 ò a 8 h バツ h バツ
0x09 th )) 9
0x0a ¹ バツ * j j
0x0b わかります ³ + ; k ä k ä
0x0c わかります s < l l
0x0d ² s = m ñ m ñ
0x0e ß > n ü n ü
0x0f / o § o

¹はラインフィードです(LF、ラインフィード)
²はワゴンリターンです(CR、キャリッジリターン)
³はESCです
⁴はスペースです

シングルシフトキャラクターテーブルトルコ語
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 |
0x01
0x02
0x03 s s
0x04 ^
0x05 €€
0x06
0x07 わかります わかります
0x08 {
0x09 }
0x0a ¹
0x0b ²
0x0c [
0x0d ³
0x0e ]
0x0f

¹はページブレイク(ページブレイク)です
²はESCです
³はコントロールサインです。この時点で、言語固有の文字をエンコードする必要はありません。

ロックシフトキャラクターテーブルポルトガル語
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 @ * 0 p p
0x01 £ _ 初め a Q a Q
0x02 $ ª 2 b r b r
0x03 ¥ 3 c s c s
0x04 おい º 4 d t d t
0x05 そうです 5 そうです
0x06 ú ^ 6 f f
0x07 7 g g
0x08 おお €€ 8 h バツ h バツ
0x09 おお )) 9
0x0a ¹ | * j j
0x0b ³ + ; k k
0x0c â < l l
0x0d ² â = m ú m
0x0e の上 おい > n ü n ü
0x0f の上 / o § o

¹はラインフィードです(LF、ラインフィード)
²はワゴンリターンです(CR、キャリッジリターン)
³はESCです
⁴はスペースです

シングルシフトキャラクターテーブルポルトガル語
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 |
0x01 â
0x02 ファイ
0x03 c
0x04 ^
0x05 おい おお ú €€ ú
0x06 pi
0x07 φ
0x08 a {
0x09 th }
0x0a ¹
0x0b ²
0x0c [
0x0d ³
0x0e の上 ]
0x0f の上 おい おお おお â

¹はページブレイク(ページブレイク)です
²はESCです
³はコントロールサインです。この時点で、言語固有の文字をエンコードする必要はありません。

シフトキャラクターテーブルヒンディー語のロック
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 aye 0 b when OM p
0x01 a 初め b ि a Q
0x02 o t 2 b r
0x03 a O! 3 y c s
0x04 来て o d 4 d t
0x05 農業 k 5 r そうです
0x06 e b n 6 l f
0x07 u g 生きている 7 刺します g
0x08 d )) 8 4 h バツ
0x09 4 9
0x0a ¹ fと 徹底的です j
0x0b L. ³ ; 縮む k ‘esamesAssAmsAssAmsAssAmsAssAmsAmsAms … ame
0x0c 4 s l
0x0d ² h din 音楽スケールの5番目のメモ おい m
0x0e e jhoom f n
0x0f a j いいえ u o ॿ

¹はラインフィードです(LF、ラインフィード)
²はワゴンリターンです(CR、キャリッジリターン)
³はESCです
⁴はスペースです

単一シフトキャラクターテーブルヒンディー語
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 @ < z | p
0x01 £ = d a Q
0x02 $ > 2つと-a -half b r
0x03 ¥ ¡ fu c s
0x04 ¿ ^ y d t
0x05 ¡ r €€
0x06 ¤ _ f
0x07 g
0x08 * { h バツ
0x09 }
0x0a ¹ j
0x0b * ³ k
0x0c + Q [ l
0x0d ² バク m
0x0e g ] n
0x0f / o

¹はページブレイク(ページブレイク)です
²はESCです
³はコントロールサインです。この時点で、言語固有の文字をエンコードする必要はありません。

ロックシフトキャラクターテーブルベンガリ
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 3 0 B b r p
0x01 初め v ি a Q
0x02 つま先 2 s b r
0x03 o 絶頂 3 y A c s
0x04 a 1 d 4 r d t
0x05 e a、a b 5 そうです
0x06 イード b o 6 好き f
0x07 おお csc。c t。 7 g
0x08 1 c )) 8 h バツ
0x09 1 e 9
0x0a ¹ f t s j
0x0b ³ s ; s k
0x0c g s l r
0x0d ² h ほこり p h m t
0x0e ぴくぴく動く F. F. n r
0x0f これ j いいえ 1 o うわーすごい

¹はラインフィードです(LF、ラインフィード)
²はワゴンリターンです(CR、キャリッジリターン)
³はESCです
⁴はスペースです

シングルシフトキャラクターテーブルベンガリ
0x00 0x10 0x20 0x30 0x40 0x50 0x60 0x70
0x00 @ < p
0x01 £ = a Q
0x02 $ > b r
0x03 ¥ ¡ c s
0x04 ¿ ^ d t
0x05 ¡ 1 €€
0x06 ¤ _ f
0x07 g
0x08 * { h バツ
0x09 }
0x0a ¹ j
0x0b * ² k
0x0c + [ l
0x0d ³ m
0x0e ] n
0x0f / o

¹はページブレイク(ページブレイク)です
²はESCです
³はコントロールサインです。この時点で、言語固有の文字をエンコードする必要はありません。

  1. UnicodeへのGSM 03.38文字のマッピング。 (txt; 9 kb)10。2009年11月、 2009年11月18日にアクセス (英語)。
  2. 3GPP TS 23.038:アルファベットと言語固有の情報。リリース9.0.0。 (zip/doc; 174 kb)28。2009年9月、 2009年11月16日にアクセス (英語)。

after-content-x4