なぜユーザーはSiriに間違いを教えることができないのか?

なぜユーザーはSiriに間違いを教えることができないのか?

Appleの契約業者がSiriとの会話の一部を盗聴しているという最近の騒動(「Apple、Siriの「応答評価」盗聴を停止」2019年8月2日記事参照)を受けて、なぜ私たちユーザーがこのタスクを実行できないのかと疑問に思わずにはいられませんでした。もし皆さんが私と同じような人なら、Siriがミスをしたり予期せぬ動作をしたりした時に、既に話しかけているはずです。

Appleは請負業者が具体的に何をしていたかを明らかにしていないが、Appleの独占説明を支持したTechCrunchのMatthew Panzarino氏は「グレーディング」のプロセスを次のように説明した。

これは、個人の名前やIDに関連付けられていない音声の断片を収集し、請負業者にそれを聞かせて、Siriが正確にそれを認識しているかどうか、そしてSiriが誤って呼び出された可能性があるかどうかを判断します。

彼の説明は、Appleの有名な広告「1984」と、灰色の作業員たちが延々と列をなす姿を思い起こさせる。ただし、彼らは皆ヘッドフォンを着け、Siriの音声を聞きながら、それぞれ「正解」「不正解」「誤用」の3つのボタンのいずれかを押している。まるでディストピア的なイメージで、実際の仕事が魂を吸い取られるようなものではないことを願うばかりだ。

私が思い描いている光景が現実と重なるかどうかは別として、Siriの精度向上のためにAppleが必要とするフィードバックを私たちユーザーが提供できない理由はないと思います。これが私の提案です。

まずはオプトイン

他のことはともかく、Apple は、初期設定時に Siri フィードバックを有効にするかどうかをユーザーに尋ね、設定 > Siri と検索のトグルスイッチを使用して、この提案された Siri フィードバック プログラムをオプトインにする必要があります。

意図しない呼び出しによって、ユーザーが公開するつもりのなかった発言が録音されてしまう可能性があることを考えると、これは当然の礼儀と言えるでしょう。Appleはすでに、現在の人間による採点プログラムをオプトイン方式にすることを発表しています。

Siriショートカットまたはボタンによるフィードバック

Siriフィードバックスイッチを有効にすると、「よくできました」「それは違います」「呼び出していません」というデフォルトのフレーズを含む3つのSiriショートカットが作成されます。設定画面には使用方法も表示されるはずです。Siriへの応答後、音声または画面付きデバイスの場合はボタンでSiriにフィードバックを送信できます。

左:Siriショートカットの提案のモックアップ 右:フィードバックボタンのモックアップ
左:Siriショートカット案のモックアップ。右:フィードバックボタン案のモックアップ。

他の Siri ショートカットと同様に、このフレーズは好きなように自由に変更できます。おそらく、うっかり呼び出したフレーズが多くの人に「黙れ!」と聞こえてしまうでしょうし、「それは間違っている」の代わりにもっと多彩な言い方があるでしょう。

当然のことながら、Siriとの特定のやり取りについてフィードバックを返すことは必須ではないので、「よくできました」という応答はあまり使われないかもしれません。結局のところ、Siriがきちんと機能しているのであれば、褒める理由はほとんどありません。犬を訓練しているわけではないのですから。Siriが難しい質問に対して的確な返答をして私を驚かせた時のために、このようなフィードバックは取っておこうと思います。

間違った返答や意図しないトリガーに対する他の2つの修正の方が、はるかに一般的に使われるのではないかと思います。Siriが私の指示を誤解すると、ついつい叱ってしまう自分がいますし、Siriが何の理由もなく口を挟むと本当にイライラします。ええ、認めます。私も「呼び出してませんよ」を「黙って!」に変えてしまう人の一人でしょう。

さらに、Siriの間違いを修正する際には、Siriは間違いを謝罪するべきです。「申し訳ありません」と一言言うだけで、ユーザーのイライラを大幅に軽減できるでしょう。

理想的には、AppleはSiriを強化し、Siriが応答後もフィードバックや追加の質問を聞き続けられるようにすることで、「Hey Siri」やボタン操作といったフィードバックフレーズを事前に入力する必要がなくなるでしょう。Google Homeは既に「会話を続ける」機能でこの機能を実現しており、応答後8秒間聞き続けます。また、AmazonのAlexaは「フォローアップモード」で応答後5秒間聞き続けます。

Apple がユーザーからの報告を額面通りに受け取るだけで必要な結果が得られるのか、それとも報告の一定割合を人間に送って追加の検証を行う必要があるのか​​はわかりません。

その口調は私に向けないで

ここまで説明してきたことは、主に機械的なものであり、Appleとユーザーの双方の能力の範囲内です。もしAppleがそのような機能を追加してくれたら、私は喜んで明日からSiriの修正に取り組みます。

しかし、Appleの誇るエンジニアたちがさらに一歩進んで、声のトーンや感情状態を認識できるようになることを期待しています。機械学習アルゴリズムに、ユーザーの普段の声のトーンや音量と、唐突に大声で話している時とを区別させるように学習させることができるはずです。Siriが会話を遮ったり、一見簡単なコマンドに思えるものを完全に無視したりすると、多くの人がイライラして声を荒げてしまうでしょう。

「Hey Siri、ビートルズの曲をかけて。」

「違う。アン・ピーブルズじゃない!ビートルズだ!」

このような認識機能があれば、そしてSiriのフィードバックスイッチが有効になっていると仮定すれば、Appleはユーザーからの追加操作なしに、Siriが何か間違ったことをしたという信号を検知できるでしょう。ユーザーのイライラの原因がSiriの行動ではなく、猫が死んだネズミを持ち込んだことにある可能性もあるため、精度は間違いなく低くなりますが、それでも何もないよりはましでしょう。

より少ないコストでより多くのフィードバック

マシュー・パンザリーノ氏は、Appleのグレーディングプログラムが評価したのはSiriの1日のリクエストの1%未満に過ぎない可能性が高いと述べた。2015年、AppleはSiriが1週間あたり10億件のリクエストを処理していたと発表しており、これは1日あたり1億4300万件に相当する。この数字は2015年以降間違いなく急増しているが、現状をそのまま受け入れることにする。

Appleは、1日あたり100万件のリクエストを処理するために、一体何人の人員を雇用する必要があるのでしょうか。これは「1%未満」の範囲の概数です。仮に1分間に平均3件のリクエストを処理でき、それを1日8時間続けられると仮定すると、Appleは少なくとも700人の従業員を必要とします。つまり、Appleが実際に処理しているリクエスト数が「1%未満」という数字が示唆するよりもはるかに少ないのでない限り、Siriの精度向上のために数千人規模の人員を雇用している可能性が高いと言えるでしょう。

それらの人々を何百万人ものSiriユーザーに置き換えれば、Appleははるかに多くの、より正確なフィードバックを得ることができ、莫大な費用を節約できるはずです。それに、これは人間ではなくコンピューターが行うべき仕事です。その仕事はあなたの脳を食い尽くすでしょう。

あなたはどうですか?Siriにフィードバックを送るオプションがあったら、登録してみますか?コメント欄で教えてください。

Idfte
Contributing writer at Idfte. Passionate about sharing knowledge and keeping readers informed.