スマートフォンやSNS、ビッグデータに人工知能など、現代社会にはさまざまなデジタル技術が溢れています。そのデジタル技術の根幹を支えるものの1つが、「特異値分解」です。N×Mの行列AをUΣVTという3つの行列に分解する線形代数学の手法で、様々な科学において与えられたデータから重要な特徴を抽出するのに利用されます。
あまりなじみがないかもしれませんが、じつは身近なところで活躍しています。たとえば、買い物で使用するポイントカード。商品の購入時にカードをとおして購入者の性別や世代を取得し、購入内容、その日の天気や気温などのデータとともに蓄積します。このデータを特異値分解することで、「この年代の人はこういう商品を購入している」、「この地域の店舗ではこれがよく売れている」などの特徴を抽出できるのです。
そのほかに、画像処理からDNAの解析まで、特徴を調べるのであれば何にでも使えるのが特異値分解です。昨今発展がめざましい機械学習では、たくさんのデータを学習するためにデータを学習しやすい形式に変換する必要があります。ここでも、データの重要な部分を抽出するのに特異値分解が活用されています。
おもしろいのは、特異値分解をめぐって数学とコンピュータとでずれが生じること。じつは特異値分解の数学的な解法そのままでは、コンピュータで解くことができません。コンピュータには有効桁数があり、それ以下を切り捨ててしまうので、計算回数が多い数学的な解法では計算を重ねるうちに誤差が広がってしまうのです。私はこの誤差を考慮した「シフト戦略」という手法の研究に取り組み、世界水準からしても高精度の計算ができる新たな特異値分解法を提案しました。
特異値分解はかなり数学色の強い研究ですが、機械学習に関する具体的な技術も研究しています。その1つが、奈良女子大学の学生とともに取り組んだデータ拡張(Data Augmentation)に関する研究です。機械学習には大量のデータが必要ですが、それだけのデータを集めるのは難しい場合も多い。そこで必要なのがデータ拡張です。
たとえば画像データを学習させたい場合、既存の画像を回転したり拡大?縮小したりして変形することで、新しいデータを水増しするのです。限られたデータからでもこの方法でデータ数とパターンを増やすことで、機械学習の精度を高めることが可能になります。
現在の機械学習の主流であるディープラーニングでは、データの数さえ確保できれば、データを増やす方法は回転でも拡大?縮小でも関係ないとされていました。しかし、私たちの研究では学習したい内容に即した処理方法を選択してデータ拡張することで、学習効率がよくなることを明らかにしました。[??関連論文]
ほかにも遺伝的アルゴリズムという手法を用いて、時間内に観光地を巡るためのベストな旅行プランを設計したり、限られたスペースにできる限り荷物を詰め込む配置を考えたりする「最適化」の研究にも取り組んでいます。
いまや生成AIを含め、多くのデジタル技術が身近な存在になっています。こうした技術はこんごもますます発展するでしょう。ただ、基礎的な理論研究者の立場からすると、世の中に広まっている理解と技術の実態とのあいだにはまだまだ距離を感じています。
とくに危惧しているのは、機械学習を過信することです。学習すればするほど賢くなると思っている人もいますが、必ずしもそうではありません。
たとえば機械翻訳は、精度が落ちたと感じることがあります。機械翻訳にはユーザが利用した情報を学習するものがあるのですが、利用者が増えたことで、それぞれのユーザの自己流の翻訳方法まで学習してしまう機会が増えたからと考えられます。当初は疑いの目で見る人も多かったのが、普及に伴って無条件に信頼する人が増えていないかと懸念しています。
一方で、基礎研究としては優れた成果であっても、専門家以外にはその価値が伝わりづらく、具体的な技術に活用されないものもたくさんあります。私自身は理論的な関心から研究しているので「それでもいい」と割り切る気持ちもあるのですが、社会の役に立つのはもちろん嬉しいこと。「この問題を解決する方法がないか」と探している人にとって、選択肢の一つになるような研究をつづけたいと考えています。
最近は機械学習に関心のある学生が多くて、「機械学習で何かしてみたい」という相談が増えています。そんなときは「具体的にはどんなことをしたいの?」と尋ね、学生が挑戦してみたいことに必要な道筋を示すようにしています。 アプリをつくる学生も増えています。たとえば、Youtubeに投稿する動画用のサムネイル画像を自動で作成するアプリや、ウォーキング中の心拍を計測して、その心拍にマッチした音楽を選曲して流すアプリに取り組んでいます。サムネイル画像を作成するアプリでは、動画を音声認識し、その内容を要約して動画の内容を紹介するテキストを生成する部分に、機械学習を活用しています。
情報科学領域では、オープンアクセスになっている学会誌は少ないのが現状です。一方で研究の展開がはやい領域なので、新しい論文はどんどんでてきます。「この人がこんな新しい技術について論文を発表していたよ」と教えてもらっても、気になる論文すべてを購読するには費用的な負担が大きい。オープンアクセス化が進めば、とてもたすかりますね。
オープンアクセスで読める論文:
●「ぼけ画像の認識率を向上させるData Augmentation」
石川 史織, 千代延 未帆, 飯田 紗也香, 高田 雅美
研究報告数理モデル化と問題解決(MPS) 2023-MPS-144(15) 1-4 2023年7月