NuanceはMacの音声認識技術を放棄した。Appleがその穴を埋めるだろうか?

NuanceはMacの音声認識技術を放棄した。Appleがその穴を埋めるだろうか?

車椅子に乗ったクリストファー・リーブの写真

マイク・リンによるクリストファー・リーブの写真

2018年10月、NuanceはMac版Dragon Professional Individualのサポートを終了し、米国ではアクティベーションから90日間、その他の地域では180日間のみサポートすると発表しました。この継続的な音声テキスト変換ソフトウェアは、音声認識のゴールドスタンダードと広く考えられており、Nuanceは引き続きWindows版Dragon Home、Dragon Professional Individual、そして様々な専門分野向けソリューションの開発・販売を行っています。

この動きは、Mac への音声入力に Dragon に依存していた医師、弁護士、法執行機関などの専門ユーザーにとっては打撃となるが、最も大きな影響を受けるのは、音声だけで Mac を制御できるユーザーたちだ。

Appleの内蔵アクセシビリティソリューションはどうでしょうか?macOSは音声入力をサポートしていますが、私の経験ではiOSの音声入力機能ほど優れておらず、ましてやDragon Professional Individualほど優れているとは言えません。Dictation Commandsを使えばMacをある程度音声で制御することも可能ですが、これもDragon Professional Individualほど強力ではありません。

アクセシビリティのディクテーション画面のスクリーンショット

TidBITS読者のTodd Scheresky氏は、四肢麻痺のため両腕が使えないため、仕事でDragon Professional Individualを頼りにしているソフトウェアエンジニアです。彼は、macOSの音声認識をDragon Professional Individualの現実的な代替手段にするために、Appleが改善すべき点をいくつか提案しています。

  • ユーザーによるカスタム単語の追加サポート:あらゆる職業には独自の専門用語や業界用語があり、Windows版Dragonには法律、医療、法執行機関向けのバージョンが存在する理由の一つです。シェレスキー氏はAppleにそのようなカスタム語彙の提供を求めているわけではありませんが、業務を遂行するために語彙にカスタム単語を追加できる必要があります。
  • 話者依存の連続音声認識のサポート: macOSの音声認識は現在、話者非依存であり、つまり誰にとってもかなりうまく機能します。しかし、Scheresky氏は、話者依存にすることでユーザーの修正から学習し、認識精度を向上させる必要があると考えています。また、Appleの音声認識は連続的ではなく、数分間しか動作せず、その後は停止し、再起動が必要になります。
  • カーソル位置とマウスボタンイベントのサポート: Scheresky氏はmacOSのDictation Commandsが非常に優れており、テキストカーソルの位置調整を適切にサポートしていると認めていますが、macOSにはNuanceのMouseGridのような機能はありません。MouseGridは、画面を3×3のグリッドに分割し、グリッド座標に合わせてズームインした後、別の3×3のグリッドを表示してズームを継続できます。また、Appleには、マウスポインタの移動やクリックを行うNuanceのマウスコマンドのような機能はありません。

シェレスキー氏がmacOSの制限についてAppleのアクセシビリティチームに苦情を申し立てたところ、チームはスイッチコントロール機能を提案しました。この機能は、スイッチをクリックすることでポインターを(他の操作と共に)移動できるものです。シェレスキー氏はこの点について動画で説明しています。

残念ながら、スイッチコントロールを使えば、シェレスキー氏は吸って吐くスイッチやヘッドスイッチを使ってMacを操作できますが、音声操作よりもはるかに遅く、文字通り首が痛くなります。マウスポインタの位置調整には、より優れた代替手段がいくつかあります。

  • 専用ソフトウェア。iTracker と呼ばれる 35 ドルのアプリの形をとります。
  • Keyboard Maestro と Automator を使用した既製のハック。
  • 高価なヘッドマウントポインティングデバイスですが、SmartNavは600ドル、HeadMouse NanoとTrackerProはどちらも約1000ドルです。また、現在のmacOSバージョンとのインターフェースがどの程度優れているかは不明です。

いずれにせよ、AppleがScheresky氏の提案通りにmacOSの音声認識機能を強化すれば、macOSの利便性は飛躍的に向上し、身体に障害を持つユーザーもMacを、そして生活をより自由にコントロールできるようになるでしょう。Scheresky氏は、もし協力したいとお考えなら、以下の内容を記載した機能リクエストのフィードバックをAppleに送信することを提案しています(コピー&ペーストしていただいて構いません)。

Nuance社がMac向けDragon Professional Individualの販売を中止したため、障がいのあるユーザーにとってMacの利用が困難になっています。macOSの音声認識機能を強化し、ユーザーが追加したカスタム単語、ユーザーの修正を学習して精度を向上させる話者依存の連続音声認識、カーソル位置やマウスボタンイベントに対応させてください。

ご検討ありがとうございます!

macOSフィードバック画面のスクリーンショット

AppleがmacOSのアクセシビリティ機能を、Dragon Professional Individual for Macの代替となるレベルまで引き上げるよう奨励してくださり、ありがとうございます。こうした改善は、Macの使用に身体的な困難を抱える方だけでなく、ディクテーションが仕事上不可欠な方にも役立つでしょう。

Idfte
Contributing writer at Idfte. Passionate about sharing knowledge and keeping readers informed.