音響音声学 – ウィキペディア

https://upload.wikimedia.org/wikipedia/commons/transcoded/0/02/Klanganalyse_der_Vokalformanten_der_deutschen_Sprache.webm/Klanganalyse_der_Vokalformanten_der_deutschen_Sprache.webm.480p.vp9.webm
音とスペクトルの分析は、強度が向上した周波数範囲としてのボーカルフォルマントを示しています。

音響音声 は、人間の言語音の音響を扱う音声学のサブエリアです。音響音声は、スピーカーによってリスナーに転送されるように、言語音の説明を振動として扱います。したがって、音響音声の検査領域は、スピーカーによる明確化後、リスナーの耳による信号記録の前にあります。 [初め]

音声は物理的な観点からの音で構成されているため、言語音の説明のための音響音声は、音響から生じる周波数や振幅などの物理的なサイズに戻ることができます。音響音声学は、観光客などの技術的なデバイスを使用して、視覚的に言語の音を提示します。言語音の重要な視覚表現は、時間の経過とともに音波の周波数と振幅を表すオシログラムです。音声学で一般的なスペクトル分析であるSonagramsは、とりわけ、母音を強度の増加の周波数範囲として識別するために役立ちます。

音声学の始まりは2000年以上前のものですが、音響音声は比較的若いサブ分野です。現代の自然科学の台頭により、音響音声学の前提条件は、音響と数学の結果と方法を使用する科学的分野としてのみ作成されました。本質的な以前の貢献は、例えばB.数学者のレオンハルト・オイラーが18世紀の終わりに向かって母音の音響特性をより正確に説明しようとした振動理論。 [2]

トーマス・アルバ・エジソンの蓄音機などの技術的なデバイスが利用可能になった19世紀に、言語音の音響特性の研究のためのブレークスルーが起こりました。蓄音機では、言語の音を含むサウンドを記録して再現できます。ジャン・ピエール・ルーセロットは、科学目的のための音声録音の先駆者の一人であり、科学的な規律として音声学の創設者の一人として指名されることができます。 Ludimar Hermannは、1889年と1890年に数学的原則の助けを借りて、投票と健全な曲線を分析することもできました。この用語は、周波数範囲における音響エネルギーの濃度であるヘルマンにとっても形成されています。 Bは母音の説明に不可欠です。 [3]

20世紀からの1940年代からの電気音響の発展により、Sonagrafなどの音響音声学の技術装置が利用可能で、音を視覚的に表示および分析することができます。 [4] コンピューターの出現により、オシログラフやソナグラフなどの音響音声学の古典的なデバイスに加えて、デジタル信号処理のツールが前面に出ました。言語技術では、自動音声認識と言語統合が決定的な進歩を遂げました。パーソナルコンピューターやPraatなどのフリーソフトウェアが利用可能であるため、音声分析を実行する方がはるかに簡単で安価になりました。 [5]

音響の基本 [ 編集 | ソーステキストを編集します ]

音響音声学の基本は、物理学、音響学の領域から来ています。物理学の観点から見ると、言語の音は、母音(喉、口腔、鼻の部屋)の上で喉頭からハイキングし、最後にスピーカーから耳の耳に伝えた音波です。音波は、音響のエージェントを使用して測定および記述できます。

音波は、20°Cの温度で空気中に広がる圧力と密度の変動であり、音速は毎秒343メートルです。これらの最小限の空気圧の変動は、人間の耳に対して聞こえます。音波は、周波数や振幅などの物理サイズで説明できます。周波数は1秒あたりの音波の振動数であり、音のピッチは実際には音の周波数と同一視されます。振幅は、音の強度(音の圧力、体積)を反映しています。 [6]

言語の音は、特別なタイプの音の振動、つまり音に属します。音とは対照的に、音は周期的な音の振動であるため、シノイドの振動を呼び出します。純粋なトーン(音楽など)とは対照的に、言語の音は音の振動を構成します。 [7] これらの複合振動は、個々のシノイド振動に分解できます。このような分解により、個々の部分振動の振幅が決定されます。これはあなたが一連の音を取得する方法であり、これに使用される手順は周波数分析またはフーリエ分析と呼ばれます(フランスの数学者Jean Baptiste Joseph Forier後)。 [8]

話し言葉の音響 [ 編集 | ソーステキストを編集します ]

言語音を作成するとき、音響音声学の2つのフェーズの間に区別が行われます。

  • 生の音の作成:生の音は、肺からの空気が流れて喉頭を通って声門と声の折り畳みを流れ、口と鼻をさらに流れるときの空気の乱流によって引き起こされます。声の音(母音と声の子音)では、空気の流れの乱流、つまり空気圧の変動が発生します。振動するボーカルが循環的に開閉して閉じます。ここでは、音声トーンの生産についても語っています。無球状の子音では、乱流は、空気の流れが声門から口と鼻の出力に向かう途中で通過しなければならない狭い領域から生じます。 B.声門または(ほぼ)閉じた唇を通して。この生成された生の音は、ノイズとも呼ばれます。
  • 生の音の変調:生の音は、顎、舌、唇などの関節器官の位置に応じて、喉と鼻の部屋で変調されます。 [9] [十]

ささやくと、母音でさえ、出力が押し込まれた空気の流れのノイズのスペクトルを調整することによってのみ形成されますが、声帯は役割を果たしません。

言語の健全な生産の説明に関連して、ソースフィルターモデルは音響音声学の重要なモデルです。ソースフィルター理論またはソースフィルターモデルは、ボーカルアーティキュレーションのモデリングです。母音の音がどのように作成されるかを簡素化した方法で再現します。モデルは、ボーカルフォールドなどの生の音のソースから始まります。生の音は、GlottisとLipsの間の領域を通り抜けて変更されています。ベースパイプは、生の音のフィルターとして機能します。 [11] ソースフィルター理論は、Gunnar Fantの作品に戻ります。 [12番目] 母音の音響特性と声道の形状との関係を示すモデルを開発しました。

ソースフィルター理論は、音響言語分析と言語統合の両方の基本です。ソースフィルター理論によれば、母音は、最初に未踏のスペクトルエンベロープ曲線を備えたサウンドスペクトルを生成し、多くのバンドパスフィルターでこのサウンドスペクトルを送信することにより、合成によって簡単に作成できます。 [13]

言語信号の視覚的表現 [ 編集 | ソーステキストを編集します ]

音響音声は、視覚的に言語シグナルを視覚的に提示するさまざまな方法を開発しました。その背後には、言語音の音響特性を記録して説明できるという目標があります。これらには、時間の経過とともに周波数と振幅を提示するためのオシログラフの使用、およびサウンドスペクトログラム(またはソナグラム)を作成するためのソナグラフの使用が含まれます。 [14]

視覚表現の方法 [ 編集 | ソーステキストを編集します ]

話し言葉のオシログラム(上)、スペクトログラム(中)および音声転写(下) ウィキペディア 言語分析のためにPraatソフトウェアを使用します。

音響音声学は、言語声明の音響を視覚化するためにさまざまな方法を使用します。表現の重要な形式は、タイムラインに沿ったグラフとしての音の振動を表すオシログラムです。オシログラムは、音の実際の振動プロセスを反映しています。つまり、音波伝達中の空気粒子の振動を測定します。 [15] オシログラムでは、音波の周波数と振幅を読むことができます。

オシログラムから、とりわけ、言語声明の音節構造と音声メロディーの兆候があります。 [16] また、トーン、サウンド、ノイズ、ノイズ、バングの間のオシログラムで区別することもできます。ただし、多くの場合、純粋な音の振動を表現したいだけでなく、などの異なる母音の区別などのさらに詳細な分析も行います。 [⁠a⁠] [⁠e⁠] それはオシログラムではほとんど異なりません。 [17]

この場合、他の方法が使用されます。たとえば、音の振動の音響情報は、フーリエ変換などの数学的方法を使用して、スペクトログラム(Sonagram)に変換できます。ソナグラムでは、言語の声明の音波の周波数と振幅と時間を同時に見ることができます。 Sonagramでは、X軸の時間経過(左から右)が表示され、Y軸の周波数(下から上まで)が表示されます。音波の振幅は、さまざまな灰色のステーションによって示されます。領域が暗いほど振幅が大きくなります。 [18] [19]

時間がスペクトログラムで良いか周波数がよく溶解するかのいずれかに応じて、異なるスペクトログラムのタイプについて話します。狭帯域のスペクトログラムは、狭帯域スペクトログラムではっきりと認識できますが、ブロードバンドスペクトログラム中に時間はよく溶解します。スペクトログラムは、音響音声学における重要な表現形式の1つです。ただし、時間と周波数の両方が十分に解決される分析もしたいので、ウェーブレット、ガボールスペクトル、聴覚スペクトルなど、言語信号のさらなる表現が追加されています。 [20]

フォーマント [ 編集 | ソーステキストを編集します ]

音響音声学の重要な概念は、Sonagramsで提示できる形式です。フォルマントは、人間の声の共鳴スペクトルに生じます。人間の関節空間の応答特性により、特定の周波数範囲は他の周波数範囲に関連して強化されます。フォーマントは、相対的な補強が最も高い周波数範囲です。フォルマントは、Sonagramでは、最も高い程度の黒ずみを持つ水平周波数帯域として見ることができます。 Sonagramでは、フォルマントはボーカルサウンドのグラフィック表現です。 [21]

フォーマントを使用して母音の音響特性を説明できます。母音の特性については、フォルマンツf 初め およびf 2 責任者、小さな部分にもf 3 およびf 4 。フォルマントに従って、次の周波数と共鳴室を簡素化しました。 [22]

フォルマント 周波数スペクトル
(男性)
割り当てられた共鳴室
F0 0 0 0 80– 0 200 Hz 音声(喉頭)
F1 0 0 220– 0 780 Hz
F2 0 1200〜2000 Hz lippenraum
F3 0 2200〜3000 Hz
F4 0 3350–4150 Hz 冠状室

個々の音における言語信号のセグメンテーション [ 編集 | ソーステキストを編集します ]

音響音声学の重要な知識は、記録された言語信号が視覚的に行われることです。 B.はソナグラムに表示され、個々の明確に区別できる言語の音を調べることはできません。そのため、Sonagramでさまざまなアコースティックセグメントを見ることができますが、これらは騒々しいステートメントの転写から得られる大きなセグメントに明確に割り当てることはできません。彼の紹介で、Bernd Pompino Marschallは、アメリカの言語学者Charles Hockettを引用しています。彼は、言語が欠如を通して変わったであろう一連のイースターエッグのように聞こえると言われていたでしょう。 [23]

ただし、言語ステートメントのさまざまな視覚プレゼンテーションオプション(オシログラム、ブロードバンド、狭いバンドソナウム)を組み合わせると、音響言語信号を光学的に表示し続けることができます。

  • 明確な垂直方向のラインパターンによってブロードバンドでは、声のあるセクションを認識できますが、無声セクションは不規則に構造化されています。
  • 声のないセクションの周波数の状況は、不規則に構造化された黒ずみによって認識されます。
  • ブロードバンドソナグラムでは、正式な周波数は、母音を記述する黒くなった靭帯として見つけることができます。
  • 摩擦音のようです [⁠s⁠] また [⁠f⁠] 不規則に構造化された黒化としての位置のために認識可能です。 [24]

実際の音、特に母音の間の遷移は、遷移、フォーマントシフト、または形式の曲がり角です( 英語 フォーマント移行 ) 専用。 [25] [26]

  • ファビアンブロス: 音響音声の基本的な特徴。 の: ヘリコン。学際的なオンラインジャーナル。 いいえ。 1、2010、pp。89–104( オンライン ; PDF; 1.3 MB)。
  • ピーター・レイドフォーグ: 音響音声の要素。 2. auflage。シカゴ大学出版局、シカゴ1996、ISBN 0-226-46764-3
  • Bernd Pompino Marshal: 音声学の紹介 。 3.エディション。 De Gruyter、Berlin 2009、ISBN 3-11-022480-1。
  • ヨアヒムM.H. Neppert: 音響音声の要素。 第4版。ハンブルク1999、ISBN 3-87548-154-2。
  • ヘニングリーツ: 関節および音響音声学。 Science Verlag、Trier 2003、ISBN 3-88476-617-1。
  1. ファビアンブロス: 音響音声の基本的な特徴。 の: ヘリコン。学際的なオンラインジャーナル。 いいえ。 1、2010、p。89。( オンライン ; PDF; 1.3 MB)
  2. Bernd Pompino Marshal: 音声学の紹介 。 3.エディション。 Walter de Gruyter、ベルリン/ニューヨーク2009、ISBN 978-3-11-022480-1、 S. 5–6
  3. Giulio Panconcelli-Calzia: 音声学の歴史図。音声学のソースアトラス 。ベンジャミンズ、アムステルダム/フィラデルフィア1994、ISBN 90-272-0957-X、 S. 60
  4. Bernd Pompino Marshal: 音声学の紹介 。 3.エディション。 Walter de Gruyter、ベルリン/ニューヨーク2009、ISBN 978-3-11-022480-1、 S. 8
  5. Bernd Pompino Marshal: 音声学の紹介 。 3.エディション。 Walter de Gruyter、ベルリン/ニューヨーク2009、ISBN 978-3-11-022480-1、 S. 132–133
  6. Horst Flhrh、Horst M.Mübut: 音声学の基本的な用語 。 In:Horst M.Müller(ed。): 言語学のワークブック 。第2版​​。 FerdinandSchöningh、Paderborn 2009、ISBN 978-3-8252-2169-0、p。64。
  7. Bernd Pompino Marshal: 音声学の紹介 。 3.エディション。 Walter de Gruyter、ベルリン/ニューヨーク2009、ISBN 978-3-11-022480-1、 S. 87–91
  8. ファビアンブロス: 音響音声の基本的な特徴。 の: ヘリコン。学際的なオンラインジャーナル。 いいえ。 1、2010、pp。94–95。 ( オンライン ; PDF; 1.3 MB)
  9. Bernd Pompino Marshal: 音声学の紹介 。 3.エディション。 Walter de Gruyter、ベルリン/ニューヨーク2009、ISBN 978-3-11-022480-1、pp。99-102。
  10. Horst Flhrh、Horst M.Mübut: 音声学の基本的な用語 。 In:Horst M.Müller(ed。): 言語学のワークブック 。第2版​​。 FerdinandSchöningh、Paderborn 2009、ISBN 978-3-8252-2169-0、pp。67–68。
  11. Bernd Pompino Marshal: 音声学の紹介 。 3.エディション。 Walter de Gruyter、ベルリン/ニューヨーク2009、ISBN 978-3-11-022480-1、pp。102-106。
  12. Horst Flhrh、Horst M.Mübut: 音声学の基本的な用語 。 In:Horst M.Müller(ed。): 言語学のワークブック 。第2版​​。 FerdinandSchöningh、Paderborn 2009、ISBN 978-3-8252-2169-0、p。68。
  13. ヨアヒムM.H. Neppert: 音響音声の要素。 第4版。ハンブルク1999、ISBN 3-87548-154-2、p。139。
  14. Horst Flhrh、Horst M.Mübut: 音声学の基本的な用語 。 In:Horst M.Müller(ed。): 言語学のワークブック 。第2版​​。 FerdinandSchöningh、Paderborn 2009、ISBN 978-3-8252-2169-0、pp。68–69。
  15. ヨアヒムM.H. Neppert: 音響音声の要素。 第4版。ハンブルク1999、ISBN 3-87548-154-2、p。98。
  16. Horst Flhrh、Horst M.Mübut: 音声学の基本的な用語 。 In:Horst M.Müller(ed。): 言語学のワークブック 。第2版​​。 FerdinandSchöningh、Paderborn 2009、ISBN 978-3-8252-2169-0、p。68。
  17. ヘニングリーツ: 関節および音響音声学。 Scientific Verlag、Trier 2003、ISBN 3-88476-617-1、p。52。
  18. ヘニング・リーッツ、アラード・ジョンマン: 音声学。転写、生産、音響、および知覚 。 Wiley-Blackwell、Oxford 2009、ISBN 978-0-631-2326-1、 S. 155–156 (英語)。
  19. ヘニングリーツ: 関節および音響音声学。 Scientific Verlag、Trier 2003、ISBN 3-88476-617-1、p。78。
  20. ヘニングリーツ: 関節および音響音声学。 Science Verlag、Trier 2003、ISBN 3-88476-617-1、pp。78–83。
  21. Bernd Pompino Marshal: 音声学の紹介 。第3版、デグリター、ベルリン2009、ISBN 3-11-022480-1、p。108。
  22. クリスチャン・リーマン: 言語はi:母音に聞こえます 。 2020年10月18日、2021年5月16日アクセス。
  23. Bernd Pompino Marshal: 音声学の紹介 。第3版、De Gruyter、Berlin 2009、ISBN 3-11-022480-1、p。118。
  24. Bernd Pompino Marshal: 音声学の紹介 。第3版、De Gruyter、Berlin 2009、ISBN 3-11-022480-1、pp。129–130。
  25. ヘニングリーツ: 関節および音響音声学。 Science Verlag、Trier 2003、ISBN 3-88476-617-1、pp。140–141。
  26. Horst Flhrh、Horst M.Mübut: 音声学の基本的な用語 。 In:Horst M.Müller(ed。): 言語学のワークブック 。第2版​​。 FerdinandSchöningh、Paderborn 2009、ISBN 978-3-8252-2169-0、p。69。