新品互換用パソコン バッテリー、ACアダプタ、ご安心購入!
ノートpcバッテリーの専門店



人気の検索: ADP-18TB | TPC-BA50| FR463

容量 電圧 製品一覧

スペシャル

「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目

日本の古典籍や古文書で用いられている「くずし字」を現代日本語の文字に変換する作業を「翻刻」と呼びます。多くの現代日本人はくずし字を読むことができないので、変換は誰にでもできるものではありません。そこで注目が集まっているのが、機械学習を利用して翻刻する試みです。モントリオール大学の博士課程で機械学習の研究を行うアレックス・ラム氏が、くずし字の活字化を取り巻く事情をまとめています。

How Machine Learning Can Help Unlock the World of Ancient Japan

https://thegradient.pub/machine-learning-ancient-japan/

過去の人々が残した膨大な書物や文書は、歴史や文化を考える上で非常に重要な資料となります。しかし、言語や記法は時間と共に変化していくものであり、古い文書の多くは一部の専門家以外には理解できない状態になっています。たとえば古代メソポタミア周辺で文字を記すために用いられた粘土板には、主に楔形文字によって文字が刻まれていますが、これを解読できるのは特別な訓練を受けた一部の研究者だけです。

これと同様のことが、日本のくずし字においても起こっているとラム氏は指摘。くずし字はおおむね9世紀から明治ごろまで使用されてきましたが、現代の教育課程には含まれず、日本人の圧倒的多数はくずし字を読めません。その一方で、くずし字によって記された書物の量は膨大であり、手紙や個人の日記まで含めると、実に10億ページを超える文章が存在すると推定されています。

くずし字を理解できる人がほとんどいないため、くずし字で記された膨大な情報を読み解くには非常に長い時間と多くの資金が必要となります。日本文化におけるくずし字の重要性を考えると、くずし字を認識するためにコンピューターを利用することは重要だとのこと。