広告を閉じる

Apple の Machine Learning Journal ブログについて 出版された 新しい記事では、音声認識と HomePod スピーカーでの Siri の使用についていくつかの興味深い点を概説しています。これは主に、非常に大音量の音楽再生、高レベルの周囲騒音、またはスピーカーからユーザーが遠く離れているなど、操作が困難な状況でも、HomePod がユーザーの音声コマンドをどのようにキャプチャできるかに関するものです。

その性質と焦点により、HomePod スピーカーはさまざまな条件で動作できる必要があります。ベッドの横のベッドサイドテーブルに置くユーザーもいれば、リビングルームの隅に「片付ける」ユーザーもいますし、大音量で流れているテレビの下にスピーカーを置くユーザーもいます。本当に多くのシナリオと可能性があり、Apple のエンジニアは、HomePod がほぼすべての状況で「聞こえる」テクノロジーを設計する際に、それらすべてを考慮する必要がありました。

HomePod は、あまり好ましくない環境でも音声コマンドを登録できるようにするために、音声信号を受信して​​処理するための非常に複雑なシステムを備えています。入力信号を分析するプロセスは、いくつかのレベルと、HomePod が必要なものだけを受信できるように受信音声信号を十分にフィルタリングして分析できる自己学習アルゴリズムに基づいて動作するメカニズムで構成されています。

したがって、個々のレベルの処理により、たとえば、HomePod 自体の製造により受信信号に現れるエコーが受信音から除去されます。家庭環境では大きすぎる騒音は他の人が対処します - スイッチが入っています 電子レンジ、掃除機、または再生中のテレビなど。そして最後の項目は、部屋のレイアウトとユーザーが個々のコマンドを発音する位置によって引き起こされるエコーに関するものです。

Apple は元の記事で前述のことについてかなり詳しく説明しています。開発中、HomePod は、エンジニアがスピーカーが使用される可能な限り多くのシナリオをシミュレートできるように、さまざまな条件や状況でテストされました。さらに、マルチチャンネルサウンド処理システムは比較的強力な A8 プロセッサーを担当しており、常にスイッチがオンになっており、常に「リッスン」してコマンドを待機しています。比較的複雑な計算と比較的まともな計算能力のおかげで、HomePod はほぼすべての状況で動作できます。残念ながら、アシスタントの Siri が最大の競合他社に年々遅れをとっているため、ハイエンドのハードウェアが比較的不完全なソフトウェアによって足を引っ張られているのは残念なことです(これまでに聞いたことのあるところではありますが…)。

ホームポッドFB
.