音声認識システムとその動作操作

問題を排除するために楽器を試してください





ザ・ 音声認識システム ディクテーションを受信して​​理解する、または音声による指示を理解するためのデバイスまたはプログラムの能力です。このシステムをコンピュータで使用する場合、 アナログ信号はADCを使用してデジタルに変換する必要があります 。コンピュータでは、信号をデコードするために、デジタルデータベース、音節、単語と音節の語彙が必要です。音声の形式はハードドライブに保存され、プログラムの実行時にメモリにロードされます。保存されたフォームは、アナログ-デジタルコンバーターのo / pに対してコンピューターによってチェックされます。すべてのタイプの音声認識システムが正確な出力を生成するわけではありません。犬が吠える、子供の叫び声、大きな外音が誤ったi / pを生成する可能性があるためです。

このような声は、静かな部屋で音声認識システムを使用することによってのみ認識できます。ここにあるような音を出す単語にも問題があります。この問題を克服するために、このシステムは、パーソナルコンピュータで利用可能なより高速なプロセッサとRAMを必要とします。ただし、これらのシステムは市場で入手可能であり、音声認識システムの業界リーダーはDragonシステムとIBMです。




音声認識セキュリティシステム

音声認識セキュリティシステム

音声認識セキュリティシステム

このプロジェクトの主なコンセプトは、音声認識を設計することです セキュリティシステム 。このプロジェクトは主に、許可された人から話された音声パスワードを識別するためのセキュリティ目的で使用され、パスワードが正しい場合にシステムが開きます。このシステムはによって制御されます PICマイクロコントローラー アセンブリ言語またはC言語でプログラムできます。



音声認識システムの分類

音声認識システムは、Isolated VRS、Continuous VRS、Speaker Dependent VRS、Speaker IndependentVRSの4種類に分類されます。

音声認識システムの分類

音声認識システムの分類

  • 孤立したVRSには、話し言葉の短いパスが必要です
  • 継続的なVRSは、話し言葉の短いパスを必要としません
  • スピーカー依存VRSは、1人のスピーカーからの音声のみを識別します
  • スピーカーに依存しないVRSは、誰かのスピーチを識別します。

音声認識セキュリティシステムのハードウェア設計

この音声認識セキュリティシステムプロジェクトは、マイク回路、マイクロコントローラー、 LCDディスプレイ この音声認識セキュリティシステムプロジェクトの設計は非常に簡単です。マイク回路は、PICマイクロコントローラーのアナログ-デジタル回路に接続されています。デジタル化された単語は、デジタルフィルターを通過します。フクロウのプロセスはマイクロコントローラーで実行されます。プロセスが完了すると、LCDディスプレイがマイクロコントローラーに接続され、話し言葉が組み込みのパスワードと一致するかどうかが表示されます。

音声認識モジュール

音声認識モジュール

マイクまたはマイク

マイクは、マイクまたはマイクと呼ばれることもありますが、 センサーまたはトランスデューサー これは、音を電気信号に変換するために使用されます。マイクの用途は、主にテープレコーダー、ラジオ、テレビの放送、電話です。コンデンサーマイクとも呼ばれるコンデンサーマイクでは、ダイアフラムがコンデンサーの一方の端子として機能し、2つの端子間の距離で振動が変化します。トランスデューサーからオーディオo / pを抽出するには、DCバイアスマイクとHFまたはRFコンデンサーマイクとして知られる2つの方法があります。


マイクロコントローラーユニット

MCUはチップ上のコンピュータであり、低消費電力、自給自足、高度な統合を備えています。マイクロコントローラは通常、コードストレージ用のROM、データI / Oインターフェイスおよび周辺機器を保存するためのR / Wメモリなどの追加要素を統合します。このMCUは消費電力が少なく、通常、ボタンを押してウェイクアップしたり、何かをやり直したりするときなど、別の周辺イベントを待っている間スリープする機能があります。

PIC 18F8720

PIC 18F8720

マイクロコントローラーは、リモートコントロール、自動車エンジン制御システム、電動工具、事務機器、おもちゃ、電化製品などの自動制御デバイスや製品でよく使用されます。マイクロコントローラは、他のI / Oデバイス、マイクロプロセッサ、メモリと比較してコスト、サイズ、および消費電力を削減することにより、多くのプロセスを電子的に制御することを安価にします。

シングルボードコンピューター-Atmega32

ATmega321644は、ATmega32やAtmelATmega644などのAtmelファミリーに基づくシングルボードを備えた小型コンピューターです。 AVRプロセッサ 。このボードは、Holger Bu、Ulrich Radig、Thomas Schererの協力を得て設計され、インターネットを介してコーヒーマシンをリモートで制御することを最初の目的としていました。

シングルボードコンピューター-Atmega32

シングルボードコンピューター-Atmega32

このシングルボードコンピューターは、最大2048バイトのRAMをサポートします。特別に設計された組み込みOSが含まれています。 ECB-ATmega321644およびECB-AT91とかなり関連していますが、個別の機能があります。最低限のエネルギー消費量が100mA未満の範囲で動作します。それはまだウェブカメラ、ウェブベースのリモートコントロールを監視するためのウェブサーバーとして使用されています。ただし、電力が少なく、Webサーバーの容量が少なく、主にデバイスは低強度の使用を目的としています。

LCDディスプレイ

液晶ディスプレイ(LCD)はフラットで薄いディスプレイで、リフレクターの前に配置されたモノクロピクセルで構成されています。バッテリーで動く電子機器でよく使われます。少量の電力が含まれているためです。このプロジェクトで使用されるLCDディスプレイは、標準のASCII文字セットのアルファベット、記号、および数字を表示する英数字タイプです。このタイプのディスプレイは、低解像度のグラフィックも表示します。

LCDディスプレイ

LCDディスプレイ

ソフトウェア開発

Multisim 2001

Multisim 2001ツールはシステムの設計に使用され、大量のデータベース、回路図入力、シミュレーション、VHDL設計、FPGAICPLDの合成、RF機能、後処理などを提供します。このツールは、すべての設計に単一の使いやすいグラフィカルインターフェイスを提供します。高度な機能を提供しますが、設計は本番環境から取得する必要があります。これは、プログラムがPCBレイアウト、プログラマブルロジック、回路図キャプチャ、およびシミュレーションを統合しているためです。

Multisim 2001

Multisim 2001

  • 使用されているソフトウェアツールに入力する設計を含む、すべての回路設計プロセスをサポートします
  • 回路の動作を検証します。これは、シミュレーションと分析を使用して行われます。
  • 回路の動作が期待を満たしている場合は、回路設計を変更します。

たとえば、それがに配置される場合 プリント回路基板 、次のステップは、PCBレイアウトプログラム(Electronics WorkbenchのUltiboard製品)を使用することです。 PLD(プログラマブルロジックデバイス)またはCPLDに配置する場合、または FPGAの次のステップ ElectronicsWorkbenchから入手できる合成ツールを使用することです。

これはすべてについてです 音声認識システム そしてその働き。この概念をよりよく理解していただければ幸いです。さらに、このトピックに関する質問や 音声認識モジュール 、下のコメントセクションにコメントしてフィードバックをお寄せください。ここにあなたへの質問があります、音声認識システムのアプリケーションは何ですか。

写真クレジット: