新品互換用パソコン バッテリー、ACアダプタ、ご安心購入!

ノートpcバッテリーの専門店

容量 電圧 製品一覧

スペシャル

音声によるプログラミングの世界。雇用におけるバリアフリーを実現する力

スマートフォンによる音声入力は、現在では広く普及している。話しかけることでWeb検索をしたり、天気を確認したりできる。大人だけでなく子供でも、Youtube で動画を探して手軽に再生できる。長文の入力も可能で、本を執筆する人が音声入力を使うこともある。

スマートフォンだけではない。スマートスピーカーを家に置いている人は、ハンズフリーで日常生活のサポートを得られる。パソコンにも音声認識エンジンは搭載されており、マイクがあれば文字や文章の入力、パソコンの操作を実現できる。

コンピューターとの対話は、キーボードによる文字ベースのものから大きく進化している。マウスによるウィンドウやボタンなどを利用するものになり、スマートフォンやタブレット端末によるタッチベースのものが登場し、音声によるものが急速に広まっている。

このように現代では、音声を使ってコンピューターの力を利用できる。この音声によるコンピューター操作は、プログラミングの世界でも用いられている。今回は、音声入力によるプログラミングの世界と、関連する話題について触れる。

◆音声入力によるプログラミングの世界

音声入力自体は、それほど新しい技術ではない。たとえば、Windows95 が出た1995年に Microsoft は、音声認識や音声合成をおこなう SAPI(Speech Application Programming Interface)のバージョン1をリリースしている。同 API は、1998年まで毎年2、3、4とバージョンアップを続け、2000年には大幅に改良した SAPI5 がリリースされている。

電気的な音声の研究は、AT&Tのベル研究所で1936年から始まっている。電子的に人間の音声を合成する Voder は、1939年に万国博覧会で紹介された(YouTube)。1952年に同研究所は、話者の数字を認識できる Audrey を開発している(BBC Future)。

音声認識の製品で有名な DragonSystems は、1982年に設立された(Nuance)。同社は買収を経て、現在は Nuance Communications に統合されている。Nuance Communications は、Siri の技術基盤を作ったところで、今年の4月12日に Microsoft に197億ドル(約2兆1600億円)で買収された(CNET Japan)。

音声認識や音声合成自体は、無料で利用できるもの、有料のものと、各社が出しており、プログラマーのあいだでも存在が認知されている。おそらく、そうした技術が広く一般に知られたのは、スマートフォンの登場以降だろう。

音声認識の歴史は上記のように古く、音声認識を利用してプログラムを入力する試みは当然存在する。Caster、Aenea、Talonなどを例として挙げる。Talon では、音声だけでなく視線によるマウスカーソルの操作もできる。

こうした試みの中で、最近話題になったものには、Serenadeがある。Serenade は、自然な発話から AI で入力候補を表示してくれる。特殊なキーワードを覚えなくてよいので、初めて触れる人に優しい作りになっている。

多くのプログラマーは、キーボードにより高速に文字を入力できる。また、コードエディタの入力支援機能を使うことができる。彼らの入力速度は、発話を上回るために、音声コーディングを積極的に採用する理由は今のところない。

しかし、病気や事故によって、キーボードの利用に問題が生じたとき、音声入力によるプログラミングは大いに役に立つ。先に示した Serenade は、共同創設者の Matt Wiethoff 氏が、2019年に反復性ストレイン損傷(腱鞘炎などが含まれる症状)と診断された時に生まれた(IEEE Spectrum)。

現在、問題なくキーボードを利用している人も、いつ使えなくなるか分からない。そうした時に、異なる選択肢があることは重要だ。

音声を利用したプログラミングは、職業選択の幅を広げてくれる。音声入力だけでなく、音声読み上げを利用したプログラミングも、視覚に問題を抱える人たちの職業選択の幅を広げてきた。

◆音声読み上げによるプログラミングの世界

『視覚障害者雇用マニュアル 事務的職業とコンピュータプログラマー雇用のすすめ』という文書がある。

この文書によるとアメリカでは1965年の段階で、シンシナティ大学のスターリング博士が、視覚障害者のプログラマーなどへの就業の可能性を提唱している。日本でも、ライトハウスが1972年に、また、1980年には職リハセンターが視覚障害者のプログラマーの職業訓練を開始している(国立職業リハビリテーションセンター)。

実際に全盲でプログラマーとして活躍されている方もメディアに登場しており、近年ではセキュリティ企業であるラックの外谷渉氏が有名だ(@IT、セキュリティ対策のラック)。

外谷渉氏は、子供時代から自身でプログラムを書いていた方なので、職業支援の情報と並べて挙げる方ではないだろう。しかし、視覚に障害がありプログラムを書いて活躍されている例として挙げることにした。

職業支援だけでなくプログラミング教育においても、視覚障害者向けの試みはなされている(視覚障害者もプログラミングで科学へジャンプ)。企業でも視覚障害者へのプログラミング学習支援はおこなわれており、Microsoft は、Code Jumper というフィジカルベースのプログラミング言語を開発している。Code Jumper は、装置をコードで繋いでいくことで、プログラミングができるというものだ(CNET Japan、Code Jumper)。

◆開かれたプログラミングの世界

人間は様々な理由で、病気や怪我に見舞われる。そうしたことに遭遇しなくても加齢によって身体機能が減退する。

毎日パソコンの画面をにらんでいる筆者は、年を経るごとに画面の文字を徐々に大きくしている。老眼により、小さい文字をずっと見ていると目が痛くなってくるからだ。いつか音声入力や読み上げの方が楽なタイミングが来るかもしれない。

多様な選択肢と技術的支援があることは、より多くの人が社会に自由に参加するために望ましい。

昔、小説の読み上げ確認をするプログラムを書いて公開したら、視覚障害があるという方からメールが届いた。また、Webのニュースを自動で連続して読み上げるソフトを作って公開した時も、同じようにメールが届いた。そうした経験を経て分かったことがある。誰かの便利は、別の誰かの便利に繋がる。

情報技術は、様々なハードルを下げて、新しい世界を開いてくれる。音声認識や音声読み上げは、プログラミングのための確かなツールの一つだと私は考えている。


2021-04-22 01:06:28



お問い合わせ