アルファベットのソート-Wikipedia
アルファベット順のソート 文字の順序に応じて、弦チェーンがアルファベットに配置されている弦チェーンに応じたソートです。従来のソートもそうです 初期のアルファベットのソート 個々の文字の順序が書面で決定されるために説明されています。
一般的に認識されている順序は通常、アルファベットの文字に使用されますが、特殊文字、発言標識、スペース、大規模、小規模な文章など、特別な特徴の並べ替えにはさまざまなルールと基準があります。
(初期)アルファベット順のソートで最初に来る2つの指定された文字列を決定するために、最初の記号から始まる文字列チェーンが比較されます。 2つのストライキが異なる最初の描画位置は、順序を決定します。文字列は、その文字がアルファベットのこの位置の前にあります。例えば、 ” そうです 講義「前」 f erlig」( そうです 前 f )と「運転 r 「ドライビングの前で広告」 s Tuhl“( r 前 s )。 1つの文字チェーンが他のキャラクターチェーンよりも短く、もう1つの文字チェーンが他のチェーンの始まりである場合、このルールは使用できません。通常、より短い文字列が最初にソートされます。たとえば、「自転車」は「自転車チェーン」の前にあります。
句読点、特殊文字、大小の説明を扱うためのさまざまなルールがあります。言語ごとにルールをソートするルールの並べ替えを参照してください。
アルファベット順のソートは、辞書編集順序の数学的概念のテンプレートです。逆に、アルファベット順のソート自体は辞書編集の順序であり、アルファベット内の文字の順序が基礎となる線形順序です。
Marcus Verrius flaccus(*紀元前10時頃)は、アルファベット順にラテン語の辞書を注文した最初の人物でした。 10世紀後半のスーダは、アルファベット順に配置されたビザンチン百科事典です。 物事の財産の本 13世紀のBartholomaeus Anglicusもアルファベット順に配置されており、多くの場合、百科事典の先駆者と見なされています。特定のシーケンスでキャラクターを配置するという原則は、3000年以上前のものです。 Ugariticスクリプトとアルファベットの一般的な歴史を参照してください。
ドイツ語 [ 編集 | ソーステキストを編集します ]
さらなる文字のルールを並べ替える [ 編集 | ソーステキストを編集します ]
ドイツのアルファベットは、現代のラテン語のアルファベットをウムラウト、Ö、ü、および文字で補完します。これらの追加の文字は、4つの種でソートできます。
- Umlautポイントを無視します。 ごみ どうやって マル ソート。
- ダブルレターがUmlautのように話されているとき、土地の手紙、二重の手紙、Umlautの取り扱い。 マル どうやって ミューエル また ごみ ソート。 決闘 一方、間に dud と 成功 。
- Umlautの解散。 ごみ どうやって ミューエル 前 型 ソート。
- 独立した手紙としての分離。
- 土地状の背後にある分類。 ごみ 間に立っています mu pu と コイン 。後で続きます マイルギー 。
- アルファベットの終わりに分類。 ごみ 後ろに立ってください 神話 。
ドイツ語を話す国では、他のすべての(外国語)ディアチックな兆候については、均一に除外されています。また、すべてのアクセント、ティルド、マクロン: そうです と そうです 、 何 と c 、 ñ と n 、 c と c 、 あなたの と o は同じ。
ドイツ [ 編集 | ソーステキストを編集します ]
エリア | 対応 |
タイトル | キャラクターの結果の順序 |
あなたへ | パート1:準備に関する一般規則(ABCルール) パート2:名前のアルファベット順の順序のアセンブリルール |
最新版 | パート1:2005-08 パート2:1996-05 |
分類 | 01.140.20 |
エリア | 対応 |
タイトル | 書誌規制 |
最新版 | 1994年8月 |
分類 | 01.140.20 |
ドイツの標準 5007-1から 「キャラクターのシーケンスの順序(ABCルール)」というタイトルでソートを説明します。
5007から バリアント1(たとえばレキシコンで使用される単語に使用されています;セクション6.1.1.4.1)
- ä と a は同じ
- 彼 と o は同じ
- ü と の は同じ
- ß と ss は同じ
5007から バリアント2(たとえば電話帳の名前のリストの特別な並べ替え、セクション6.1.1.4.2)
- ä と しかし は同じ
- 彼 と あなたは は同じ
- ü と ue は同じ
- ß と ss は同じ
これは、適切な名前で異なるスペルが可能であることを考慮していますが、レキシコンまたは辞書の用語は正確に1つのスペルの下でのみ入力できます。対照的に、今誰かが今誰かが モーラー また メラー 呼ばれています。これは、何よりもドイツ語の個人、機関、地名に適用されます。
個人名は、以下の方法でドイツ(例:電話帳)で頻繁に分類されます。
- 最初に、エントリは姓でソートされ、「教授」、「博士」、「von」、「vor」、「am」、 “などの名前添加物などの学位を取得します。添加物という名前は、「von der lippe」などのいくつかの単語で構成できることに注意する必要があります。
- 同一の姓の場合、アルファベット順に既存の名前添加剤に従ってソートされます。これにより、名前添加剤のない個人名が常に最初にリストされます。
- 名前添加物も(または利用できない)場合、最後のものはファーストネームに基づいてアルファベット順にソートされます。
このタイプのソートは、書誌順序ルールDIN 31638で規制されています。
オーストリア [ 編集 | ソーステキストを編集します ]
オーストリアの並べ替え (電話帳用)
- ä のフォロー a (したがって、後にしか来ません ))
- 彼 のフォロー o
- ü のフォロー の
- ß のフォロー ss
- セント のフォロー セント
印刷されたオーストリアの電話帳にはさまざまな種類があります。ローカルディレクトリでは、Umlautsとßは、独自の文字と同様に、アルファベットの最後に並べ替えられています。情報ページとイエローページの後 5007から バリアント1ソート。オーストリアの並べ替えは、名前のリストに使用されています。
ライブラリで続きます sch 多くの場合 s 、だから後だけ s 。
ドイツ語の例の例 [ 編集 | ソーステキストを編集します ]
あなたの5007は1でした (辞書) |
あなたの5007は2でした (電話帳) |
オーストリア ソート |
---|---|---|
… ゲーベル ゲーテ ゴールドマン ゲーテ ゲッツ … |
… ゲーベル ゲーテ ゲーテ ゲッツ ゴールドマン … |
… ゲーテ ゴールドマン ゲーベル ゲーテ ゲッツ … |
の2つのスペル ゲーテ バリアント2に直接隣接しており、名によってのみ互いに区別されます。ヨハン・ヴォルフガング・フォン・ゲーテは、彼の生涯に両方のバリアントを使用しました。家族は以前に呼ばれていました ゲーテ 。今日の統一されたスペルは、彼の死後四半世紀以上にわたってゲルマニストによって紹介されました。
デンマーク語とノルウェー語 [ 編集 | ソーステキストを編集します ]
- これまで 後に来ます と
- Ø 後に来ます これまで
- に 後に来ます Ø
- ä と これまで は同じ
- 彼 と Ø は同じ
- ü と と は同じ
- デンマーク人にいた の と の 1980年まで、外国の言葉や名前についても同じです(例:ワグナーによるヴェルディなど)。 1980年から来ています の 後 の 。
- aa と に は同じ。ノルウェー語では、この規則は非スカンディナビアの名前には適用されません。これは、ドイツのアーチェンの都市がノルウェー百科事典の第1巻であることを意味しますが、ノルウェー語の言語研究者であるイヴァル・アーセンは最後の巻です。デンマーク語では、このルールはすべての単語または名前に適用されます。 aa 母音と呼ばれますが、2つの敏lableを持つ単語用ではありません aa (どうやって 残業 )。
フィンランド語とスウェーデン語 [ 編集 | ソーステキストを編集します ]
- に 後に来ます と
- ä 後に来ます に
- 彼 後に来ます ä
- ü と と は同じ
- の と の 2006年まで外国語や名前(ワグナーの後のヴェルディなど)に等しい。 2006年から来ています の 後 の 。
アイスランド語 [ 編集 | ソーステキストを編集します ]
- ð 後に来ます d
- th 後に来ます と
- これまで 後に来ます th
- 彼 後に来ます これまで
- 急性離散は常にそれぞれの基本的な兆候に従います
- 並べ替えaltisland文字:ǫ́はeに等しい、ǽ/ę́/ǿ/ – æ、ǫ/Øに等しい [初め]
エストニア語 [ 編集 | ソーステキストを編集します ]
- と 後に来ます s
- と 後に来ます と
- * 後に来ます と
- 彼 後に来ます の
- ä 後に来ます 彼
- 彼 後に来ます ä
- ü 後に来ます 彼
- の と の 2006年まで外国語や名前(ワグナーの後のヴェルディなど)に等しい。 の 後に来ます の 2006年以来。
アルバニア語 [ 編集 | ソーステキストを編集します ]
アルバニアのアルファベットは(if の カウントされていません)36文字、その一部はgigraphです。
- 何 後に来ます c
- DH 後に来ます d
- e 後に来ます そうです
- GJ 後に来ます g
- ll 後に来ます l
- ニュージャージー州 後に来ます n
- RR 後に来ます r
- sh 後に来ます s
- th 後に来ます t
- xh 後に来ます バツ
- Zh 後に来ます と
他の言語 [ 編集 | ソーステキストを編集します ]
他の言語では、アルファベット順の並べ替えも言語依存の追加のルールの対象となります。これは、追加の文字または特別なルールに原因を持っています。したがって、伝統的にスペイン語には手紙があります ch 、これは通常、1994年までの場所よりも他の場所でアルファベット順でした c コンピューターアルゴリズムが提示したものは、ソートのための問題。後 n 続きます ñ 。さまざまなキャラクターを使用し、フォントでの順序を使用する日本語や中国語などの言語でのアルファベット順のソートは、そこでのソートの順序に対応していません。たとえば、中国語では、ピンイン相当(コンピューターシステムで)またはシステムに従ってソートが一般的であり、基本的なシンボルと時計回りの方向(辞書)のストロークの数に基づいています。
コンピューターシステムは、システム全体またはアプリケーション固有の標準コード(ASCIIおよびそのバリエーションまたは追加、今日の頻繁に頻繁にeBCDIC、より多くのユニコード)を使用して、保存された文字チェーンをコード化し、このコードの登録値に従って、最も簡単な値に従って最も簡単なケースでサイン(数字、スペース、文、特殊文字を含む)をアレンジしました。ただし、多くのプログラムは、ユーザーが文化的に期待する従来のソートを適用しています。個々のコーディングまたはパラメーター化を通じて、ソート順に影響を与える機会があります。使用される可能性のあるアルゴリズムは、Unicode照合アルゴリズムです。ソートのタイプは、SO -Called Collationを指定することによって与えられます(から 英語 照合 「並べ替えシーケンス」 )データベースシステムなどのオペレーティングシステムの構成とアプリケーション用。 [2]
ソートをサポートします 単語が背面から正面に読まれるアルファベットのある並べ替えです。辞退する辞書を作成するとき、ソートはこのようにソートされます。 reimexikaでも使用できます。
- ↑ アルファベットおよびアルファベット順 。 2011年考古学研究所。
- ↑ コンピューターでのSwhababetization http://www.rostra.dk/alphabet/alpha_dt.htm
Recent Comments