「私は謙虚な個人アシスタントです。」 2011 年 4 月にタウンホールと呼ばれる Apple の講堂で仮想音声アシスタント Siri が発した最初の言葉の XNUMX つ。 Siri は iPhone XNUMXS で導入されましたが、最初は大きな話題になりました。 Siri には最初から個性があり、まるで本物の人間のように話しました。彼女と冗談を言ったり、会話をしたり、会議のスケジュールを設定したり、レストランのテーブルを予約したりするための個人アシスタントとして彼女を使用することもできます。しかし、過去XNUMX年間、競争は確かに休むことがなく、場合によってはAppleのアシスタントを完全に追い越すことさえありました。
歴史への旅
2010 年まで、Siri は頭脳と個人的な意見を備えたスタンドアロンの iPhone アプリでした。 Siri は、軍将校の任務遂行を支援するソフトウェアを作成するという SRI (スタンフォード研究所) 主導の 2003 年のプロジェクトに由来します。リード エンジニアの XNUMX 人であるアダム チェイアー氏は、このテクノロジーが、特にスマートフォンと組み合わせることで、より多くの人々に届く可能性があると考えました。そのため、彼は Motorola の元マネージャーで SRI のビジネス連絡責任者の地位に就いた Dag Kittlaus と提携関係を結びました。
人工知能のアイデアがスタートアップに形を変えました。 2008 年の初めに、彼らはなんとか 8,5 万ドルの資金を確保し、質問や要求の背後にある意図を迅速に理解し、最も自然なアクションで応答する包括的なシステムを構築することができました。 Siri という名前は社内投票に基づいて選ばれました。この言葉にはいくつかの層の意味がありました。ノルウェー語では「あなたを勝利に導く美しい女性」、スワヒリ語では「秘密」を意味します。 Siri も逆に Iris であり、Iris は Siri の前任者の名前でした。
[su_youtube url=”https://youtu.be/agzItTz35QQ” width=”640″]
書面による回答のみ
この新興企業が約200億ドルでAppleに買収されるまで、Siriはまったく話すことができなかった。ユーザーは音声またはテキストで質問できますが、Siri は書面でのみ応答します。開発者は、情報が画面上に表示され、Siri が話す前に人々がそれを読むことができると想定していました。
しかし、Siri が Apple の研究所に到着するとすぐに、複数の言語で話す能力など、他のいくつかの要素が追加されました。残念ながら、Siri は 5 年経ってもチェコ語を話すことができません。 Apple はまた、音声アシスタントが 1 つのアプリケーションに組み込まれるのではなく、iOS の一部となったとき、すぐに Siri をシステム全体にさらに統合しました。同時に、Apple はその運営を転換しました。書面で質問することはもはや不可能になりましたが、Siri 自身はテキストでの回答に加えて音声で回答できるようになりました。
労働
Siri の導入は物議を醸しましたが、すぐにいくつかの失望が起こりました。 Siri は音声を認識するのに大きな問題を抱えていました。データセンターの過負荷も問題でした。ユーザーが話すと、その質問は Apple の巨大なデータセンターに送信され、そこで処理されて答えが送り返され、その後 Siri がそれを話します。したがって、仮想アシスタントは主に外出先で学習するため、Apple のサーバーは膨大な量のデータを処理する必要がありました。その結果、頻繁に機能停止が発生し、最悪の場合、意味のない間違った回答が返されることもありました。
Siri はすぐにさまざまなコメディアンの標的となり、Apple はこうした最初の挫折を挽回するために多大な労力を費やす必要がありました。当然のことながら、ユーザーが主に失望したのはカリフォルニアの企業であり、同社が非常に重視していた新しく導入された新機能の完璧な機能を保証できなかったのです。だからこそ、クパチーノでは何百人もの人々が 1 日 24 時間ほぼ継続的に Siri に取り組んでいました。サーバーが強化され、バグが修正されました。
しかし、誕生の苦しみにもかかわらず、Apple にとって、Siri を最終的に稼働させ、まさにこの分野に参入しようとしていた競争相手に確実に有利なスタートを切ることができたのは重要でした。
Googleの優位性
現在、Apple は AI 列車に乗っているか、すべてのカードを隠しているかのどちらかであるようです。競合他社を見てみると、この業界を牽引しているのは現在主に Google、Amazon、Microsoft などの企業であることは明らかです。サーバーによると CB Insights 過去 5 年間で、人工知能に特化した 30 社以上の新興企業が、上記の企業のうちの 1 社に吸収されました。そのほとんどは Google に買収され、最近同社のポートフォリオに小規模な専門会社 9 社が追加されました。
[su_youtube url=”https://youtu.be/sDx-Ncucheo” width=”640″]
Appleなどとは異なり、GoogleのAIには名前がなく、単にGoogleアシスタントと呼ばれています。現在モバイルデバイスでのみ利用できるスマートヘルパーです。 最新の Pixel スマートフォンでは。新しいバージョンの機能を簡素化したバージョンにもあります。 コミュニケーションアプリAllo、Googleは成功したiMessageを攻撃しようとしています。
アシスタントは、これまで Android で利用できた音声アシスタントである Google Now の次の開発段階です。しかし、新しいアシスタントと比較して、彼は双方向の会話を行うことができませんでした。一方、そのおかげで、彼は数週間前にチェコ語で Google Now を学びました。 Siri の追加言語に関する憶測は絶えずありますが、音声処理にさまざまな複雑なアルゴリズムを使用する、より高度なアシスタントの場合は、おそらく近い将来にはこのようなことは見られないでしょう。
Google CEO の Sundar Pichai 氏によると、過去 10 年間で携帯電話はますます優れた時代を迎えました。 「それどころか、今後10年はパーソナルアシスタントと人工知能の時代になるだろう」とピチャイ氏は確信している。 Google のアシスタントは、マウンテン ビューの会社が提供するすべてのサービスに接続されているため、今日のスマート アシスタントに期待されるすべての機能を提供します。あなたの一日がどうなるか、何が待っているか、天気はどうなるか、仕事に行くまでにどれくらい時間がかかるかがわかります。たとえば、午前中は最新ニュースの概要を説明します。
Google のアシスタントは、すべての写真を認識して検索することもできます。もちろん、ユーザーが与える頻度やコマンドに基づいて常に学習し、改善しています。 Googleは12月に、プラットフォーム全体をサードパーティに公開することも計画しており、これによりアシスタントの利用がさらに拡大するはずだ。
Googleは最近、人間の音声を生成できるニューラルネットワーク会社DeepMindも買収した。その結果、人間の発話に近い、最大 50% よりリアルな音声が得られます。もちろん、Siri の声は決して悪いものではないと主張することもできますが、それでも、ロボット特有の人工的な声に聞こえます。
スピーカーホーム
マウンテンビューの同社は、前述のGoogleアシスタントも搭載したホームスマートスピーカーも提供している。 Google Home は上端が面取りされた小さな円筒形で、デバイスはその上で通信ステータスを色で示します。下部には大型スピーカーとマイクが隠されており、コミュニケーションが可能です。必要なのは、部屋のどこにでも設置できる Google Home を呼び出して (「OK、Google」というメッセージでアシスタントを起動)、コマンドを入力するだけです。
スマート スピーカーに電話と同じことを尋ねたり、音楽を再生したり、天気予報や交通状況を調べたり、スマート ホームを制御したりすることができます。もちろん、Google Home のアシスタントも常に学習し、ユーザーに適応し、Pixel の兄弟(後に他のスマートフォンでも)と通信しています。ホームを Chromecast に接続すると、メディア センターにも接続されます。
ただし、Google Home は数か月前に導入されましたが、新しいものではありません。これにより、Googleは主に同様のスマートスピーカーを最初に開発した競合他社のAmazonに対抗することになる。最大のテクノロジー企業が、音声で制御されるスマートホーム(だけではありません)の分野に大きな可能性と将来性を見込んでいることは明らかです。
Amazonはもはや単なる倉庫ではありません
Amazonはもはやあらゆる種類の商品を保管する単なる「倉庫」ではありません。近年では自社製品の開発にも力を入れている。 Fireスマートフォンは大失敗だったかもしれないが、Kindle電子書籍リーダーはよく売れており、Amazonは最近スマートスピーカーEchoで大きな利益を上げている。 Alexaと呼ばれる音声アシスタントもあり、すべてがGoogle Homeと同様の原理で動作します。ただし、Amazon は以前に Echo を導入しました。
Echo は背の高い黒いチューブの形をしており、その中にいくつかのスピーカーが隠されており、文字通り全方向に再生されるため、音楽を再生するだけでも十分に使用できます。 Amazon のスマート デバイスも、「Alexa」と言うと音声コマンドに応答し、Home とほぼ同じことができます。 Echo は市場に出てから長いため、現在はより優れたヘルパーとして評価されていますが、Google ができるだけ早く競合他社に追いつきたいと考えていることが予想されます。
[su_youtube url=”https://youtu.be/KkOCeAtKHIc” width=”640″]
しかし、Google に対しては、Amazon も、現在第 49 世代となっている Echo にさらに小型の Dot モデルを導入したという点で優位に立っています。これは Echo を縮小したもので、価格も大幅に安くなりました。アマゾンは、小型スピーカーのユーザーが他の部屋に広げるためにさらに購入するだろうと予想している。したがって、Alexa はどこにいても、あらゆるアクションに利用できます。 Dot はわずか 1 ドル (230 クラウン) で購入できるので、とてもお得です。今のところ、Echo と同様に、一部の市場でのみ利用可能ですが、Amazon が徐々に他の国にもサービスを拡大することが期待できます。
Amazon EchoやGoogle Homeのようなものは現在Appleのメニューから欠落している。今年は9月に 発見された憶測、iPhoneメーカーがEchoの競争に取り組んでいることは明らかですが、公式には何も知られていません。 Siriを搭載した新しいApple TVはこの機能を部分的に置き換えることができ、例えばスマートホームを制御するように設定することもできるが、EchoやHomeほど便利ではない。 Apple がスマートホーム (リビングルームだけでなく) をめぐる戦いに参加したいのであれば、スマートホームが「あらゆる場所」に存在する必要がある。しかし、彼にはまだ方法がありません。
サムスンが攻撃しようとしている
さらに、サムスンは取り残されたくないと考えており、仮想アシスタントの分野への参入も計画している。 Siri、Alexa、Google Assistant への答えは、Viv Labs が開発した独自の音声アシスタントになるはずです。前述のSiri共同開発者アダム・チェイアー氏と新しく開発された人工知能によって10月に設立された 売られた ただのサムスン。多くの人によると、Viv のテクノロジーは Siri よりもさらに賢く、より高性能であると考えられているため、韓国企業がそれをどのように使用するかを見るのは非常に興味深いでしょう。
この音声アシスタントはBixbyと呼ばれるはずで、サムスンはすでに次期Galaxy S8携帯電話にそれを導入する予定だ。仮想アシスタント専用の特別なボタンを搭載することもできると言われています。さらに、サムスンは今後、同社が販売する時計や家電製品への展開も計画しており、徐々に家庭での存在感が急速に拡大する可能性がある。それ以外の場合、Bixby は会話に基づいてあらゆる種類のタスクを実行する競争相手として機能することが期待されます。
Cortana はあなたのアクティビティを常に監視します
音声アシスタントの戦いについて語るなら、マイクロソフトについても言及する必要があります。彼の音声アシスタントは Cortana と呼ばれ、Windows 10 ではモバイル デバイスと PC の両方で見つけることができます。 Cortana は、少なくともチェコ語で応答できるという点で Siri よりも優れています。さらに、Cortana はサードパーティにもオープンであり、さまざまな人気のある Microsoft サービスに接続されています。 Cortana はユーザーのアクティビティを常に監視しているため、可能な限り最良の結果を提示できます。
一方で、後から市場に登場したため、Siri に対しては約 2 年の遅れがあります。今年 Mac に Siri が登場した後、コンピュータ上の両方のアシスタントが同様のサービスを提供するようになりましたが、将来的には両社が仮想アシスタントをどのように改善し、どこまで実現できるかにかかっています。
Apple と拡張現実
言及された技術的利点と他のいくつかの技術の中で、もう1つの興味深い分野、現在非常に流行している仮想現実について言及する必要があります。市場には、仮想現実をシミュレートするさまざまな精巧な製品やメガネが徐々に氾濫しており、すべてはまだ始まったばかりにもかかわらず、マイクロソフトやフェイスブックを筆頭とする大企業はすでに仮想現実に多額の投資を行っています。
MicrosoftはHololensスマートグラスを開発しており、Facebookは4年前に人気のOculus Riftを買収した。 Google は最近、シンプルな Cardboard に続いて独自の Daydream View VR ソリューションを発表しました。ソニーもこの戦いに加わり、最新の PlayStation XNUMX Pro ゲーム コンソールを備えた独自の VR ヘッドセットも展示しました。仮想現実はさまざまな分野で使用できますが、ここでは誰もがそれを適切に把握する方法をまだ模索中です。
[su_youtube url=”https://youtu.be/nCONu-Majig” width=”640″]
そしてここにもAppleの気配はない。カリフォルニアの仮想現実の巨人は、大幅に寝坊したか、その意図をうまく隠しているかのどちらかです。これは彼にとって何も新しいことではなく、驚くべきことではありませんが、当分の間、同様の製品しか研究室にない場合、問題は市場投入が遅すぎるかどうかです。仮想現実と音声アシスタントでは、競合他社が現在多額の資金を投資し、ユーザーや開発者などから貴重なフィードバックを収集しています。
しかし、この初期段階で Apple が仮想現実にそこまで興味を持っているかどうかという疑問は依然として残っている。エグゼクティブディレクターのティム・クック氏は、最近ポケモンGO現象によって拡張された、いわゆる拡張現実の方が興味深いと感じているとすでに何度か述べている。しかし、AppleがAR(拡張現実)にどのように関わっていくべきかはまだ全く明らかになっていない。拡張現実が次期iPhoneの重要な部分になるのではないかという憶測があり、ここ数日ではAppleがARやVRと連携するスマートグラスをテストしているという話も再び出ている。
いずれにせよ、Apple は今のところ頑なに沈黙を保っており、競合する列車はとっくに駅を出発している。今のところ、Amazonは家庭におけるアシスタントの役割で主導権を握っており、Googleは文字通りあらゆる面で活動を開始しており、Samsungがどのような道を歩むかを見るのは非常に興味深いでしょう。一方、マイクロソフトは仮想現実を信じており、アップルは、少なくともこの観点からは、自社がまだまったく持っていないあらゆる製品に即座に対応すべきである。 Siri を改善するだけでは間違いなく依然として必要ですが、今後数年間は十分ではありません...
言っておきますが、私はこの記事を全部読んだわけではなく、ざっと読んだだけです
理由は明らかです。私は 10 年以上 AI のプロとして働いていますが、これは非常に表面的で素人っぽく、素朴な記事なので、もしあなたが私の子供だったら、私はあなたを平手打ちしますが、私は人生で子供を平手打ちしたことはありません
もし、あなたが全く知らないこと (またはこの記事で示したような表面的な考え) についてすでに書いている場合は、神の愛とこの Web サイトの訪問者全員の幸福のために、その記事を公開しないでください。そしてそれをローカルドライブに置いておきます。ありがとう
挨拶
kk
それで、どうですか?あなたの視点に興味があります。
公開情報から(つまり、Apple は間違いなく AI である程度の進歩を遂げているが、それについて誰にも話していないという著者の主張を受け入れます。AI を開発し、新しいものを発明する企業は科学的研究を発表しているため、これは異例です。.. はい、多少のタイムラグはありますが、彼らは を公開しており、当時 Apple はそのようなことをしていませんでした)
したがって、公的に入手可能な情報のみから評価できる場合。 Google と Microsoft にとって、Google アシスタントと Cortana は、AI 研究の周辺的な側面です。 Apple にとって、SIRI は AI 研究のすべてです。これら 3 社 (さらに IBM、Amazon、Baidu などを追加することもできます) は比類のないものです。 Apple AI 研究と比較すると、まったく違います。
特に記事内の現実と一致しないマーケティングのくだらないところが嫌いです。例>
""Siri には最初から個性があり、まるで本物の人間のように話しました。彼女と冗談を言ったり、会話したりすることもできたでしょう...」 < もちろん、Siri には人格がありません。すべてのジョークやナンセンスは、他の PC ゲームと同様にあらかじめ用意されています (通常、それは明らかなので言及しません)皆さんにお伝えしますが、ここではこれは AI であり、理論的には人格を持つことができるため、siri がその例ではないことは当然のことと考えてください) 「質問やリクエストの背後にある意図をすぐに理解し、次のように応答する複雑なシステム」最も自然な動作"" < ナンセンス、Siri は音声をテキストに翻訳し、テキストから人々が何に興味を持っているかを理解しようとします (キーワードを抽出することで)。そのためのスクリプトとデータベースがあれば、応答もします。それは間違いなく、最も自然な行動に反応せず、ユーザーの心を区別しません(結局のところ、人は誰かが何かを尋ねても、なぜそれを尋ねるのかさえわからないことがよくあります)人間の音声を生成します。 "" < 最近のことではなく、IT 業界では 2 年ほど前です。そして、ディープマインドがニューラルネットワークを扱っていると言うのは、グーグルが情報学を扱っていると言っているようなものです。はい、グーグルが農協を買収したわけではないことは明らかです。ニューロノベ サイトは、ディープマインドが深層学習のアルゴリズムを作成するサイトです。その用途は普遍的であり、特に認識および生成される音声の改善だけでなく、写真認識なども含まれます (より複雑なタスクのためのニューラル ネットワークの単純な最適化)。品物の。近年では自社商品の開発にも力を入れている。 「」<ここ10年くらいかな?それは、Apple が近年 iPod だけを作っているわけではないと言っているようなものです。アマゾンは倉庫ではありませんし、今も倉庫ではありません。IT 企業であり、現代の IBM と呼ぶ人もいます。アマゾンがかつて「倉庫」だったと言うのは、顔面を平手打ちするものだ(著者自身がそう言うべきだ)
しかし、なぜそんなに強く叩く必要があるのか、私にはまだ理解できません。誰かが記事を書いてくれると嬉しいです。少なくともこのサーバーでは。ディスカッションとは、自分自身を表現し、自分の経験を追加することです。著者の賢さは、あなたのコメントから重要な教訓を得て、私たちの経験と彼自身の経験を豊かにすることに成功したという事実にあるはずです。しかし、あなたの態度は非常に傲慢で騒々しいので、ここであなたが話したい興味深い内容はほとんど聞こえません。そのようなアプローチでは、人々は原則としてあなたを無視し始めると思います。私はしばらくの間あなたの投稿をフォローしていますが、そこには建設的なものよりも傲慢さ、表面性、相互侮辱が依然として多く見られますが、それは間違いなくあなたの心の奥底にあります。よく考えて貢献を始めてください。侮辱したり攻撃的になるのはやめてください。
「お尻を叩くべきだ」という言葉を聞いたことはありませんか?
それは、誰かがやってはいけない愚かなことをしているという事実を強調するものです
そして著者は部分的に教育的なウェブサイトで虚偽を広める
そして、私は興味深いコンテンツを誰かに売りたいわけではありません。私はその記事のどこが間違っているのかという質問に答えただけです(間違っている点はたくさんあります。それらは例です)。
すると隣人は「ドアの外に出て自分をたたきなさい。自分を救わないでください。自分のためにやっているのです。」と言います。
だから次回は建設的に、平手打ちなしで、大丈夫だろう。炎なしで。
それで彼はそうしました。
私は冗談をほとんど含まないように努めます、そして著者が私が理解していることだけを書こうとすることを望みます
特にそれがあなたの生計の分野であるため、あなたの意見と専門家の見解に心から感謝します。いずれにせよ、私はトマーシュの意見に同意します(4番目の投稿を参照)。どんな犠牲を払ってでも自分のエゴを全面的に見せたり、自分の人に否定的な光を当てるだけの父親のような態度を誇示したりする必要はありません。私はあなたの意見を(炎上せずに)受け止め、同意します。一方、ジャーナリズムの原則は、すべての専門家になることではなく、短期間で意見を形成し、可能な限り多くの利用可能な(外国の)情報源を研究し、それに基づいて意味のある文章を編集することです。それは反応を引き起こし、議論を引き起こすでしょう。私はあえて言うか、少なくともそうしようとしていますが、私は Apple そのものについての専門家です。この記事は、コンテストへのオリエンテーションとソースの研究という形で、私にとって大きな挑戦を意味しました。
とにかく、意見をありがとう、それを心に留めておきます。または、必要に応じて、自分で簡単に何かを書くこともできます。合意後は、何らかの出版物に同意することも確実に可能です...それが Apple と関係がある場合:-)
これは悪くありませんでした。この問題に関する完全な記事はどうでしょうか?多くの人がそれを歓迎するだろう。
特に興味のあることはありますか?
AIについてもう少し深く興味があれば教科書を読んでみてはいかがでしょうか?
人工知能: ラッセルとノーヴィグによる最新のアプローチ (入手可能な最新バージョンを選択するのが最善です)
AI の基本的な入門書 (IT 企業での就職は保証されますが)、使用すべきではないものもありますが、誰もが AI をやっているならこの本を知っていると期待しており、そのような前提を置くと、最後の作品を書く、つまり、さらに進むためには、この本を知る必要があります
これを読めば、AI トピックに関するほぼすべての専門書や研究を手に取り、それが何であるかを知ることができるようになります。
Kk = ココット?
主よ、そのような父親が自分の子供だったら、私は本当に恥ずかしいと思います。建設的なことは何も書かず、ただ感情的に吐くだけの父親がいる。 Petr Stejskal が書いているように、あなたの意見をここに送るか、編集局に直接送ってください、お父さん。近いうちに読んで比較してみます。
残念ながら、投稿を間違って分類してしまいました、kk。見つけてくれればいいのですが、もしかしたら見つけられないかもしれません、多分冗談でしょう :-)
興味深い記事をありがとう。特に気に入ったのは、現在市場に出ているものの概要です。添付されたビデオリンクも素晴らしかったです。
興味深い記事ですが、この警告を考慮しますか? http://www.dsl.sk/article.php?article=19084
Appleが眠っているのは人工知能の分野だけではない。
Apple はすでに「WiFi 製品」を大量に販売しているため、何かを企んでいる可能性があります。したがって、Googleが導入したものと同様のものが提供されることが期待できますが、価格は5倍で、できることは半分になりますが、それは素晴らしいことですが、たとえばaTV4に代わるものではないと予想します。
kk の場合:
そうですね、あなたの投稿によると、あなたはここで言われているような「AI 専門家」ではありません。あるいは、Apple を荒らしたり憎んだりする抑えがたい欲求が勝ったのかもしれません。
結局のところ、私のコメントは、バルセロナで開催された NIPS 2016 の Apple に関するニュースによっても裏付けられました。専門家として、あなたはこの定例カンファレンスに参加するか、少なくともそれに従うことは間違いありません :-)
親愛なる編集者、人間はすべてを知ることはできません。しかし、Apple と AI に関する公開リソースはたくさんあり (AI は専門分野を包括しすぎていますが)、実際の状況を知るのはそれほど困難ではありません。