今年の秋に正式配信予定の次期iOS 15では、「写真」アプリの新機能の一つとして「個人の認識の向上」が予告されています。それは写真の整理に役立つばかりか、Spotlightを使って有名人や連絡先に登録された人について検索したり、画像の中の人物を音声で説明するVoiceOverなどアクセシビリティ機能にも深く関わることです。
アップルが新たに公開した機械学習に関するブログのなかで、その「個人認識の向上」が具体的に何を意味しているのかが詳しく解説されています。
アップルによるとオンデバイス、つまりクラウドを使わずiPhone内部で処理する機械学習の改善により、人物認識が大幅に向上したとのことです。その実例としては極端なポーズを取っていたり、アクセサリーを身につけている人、あるいは顔が隠れてまったく見えない人も検出できるようになったことが挙げられています。
これを実現するために、アップルは顔と上半身を組み合わせて、顔が見えない人でも誰かを特定しているとのことです。この新機能により、従来は不可能だった状況で人を識別することが可能となり、写真体験を向上させると述べられています。具体的な使い道には言及されていませんが、人物を認識して(近年では物体やペットも認識できますが)背景をぼかすポートレートモードにも貢献するのかもしれません。
今回の公式ブログ記事「プライベートオンデバイス機械学習を通じて写真内の人物を認識する」では、アップルがどのように機械学習を活用して、ユーザーのプライバシーを守りながら人物を識別しているのかを専門的かつ詳細に説明されています。そちらに興味がある方は、一読することをお勧めします。
元GoogleのAI開発トップのジョン・ジャナンドレア氏が機械学習・人工知能担当上級副社長に昇格した当時は話題となりましたが、SiriなどアップルのオンデバイスAI技術は着実に進化している模様です。