2025年9月13日土曜日

対称性と機械学習

 本書の核は、「対称性」という見えない秩序を道具として用い、少ないデータでも安定して汎化できる学習系を設計することにあります。対象を回したり動かしたりしても本質が変わらない性質を不変性、変えた分だけ出力も対応して変わる性質を同変性と呼びます。これらを数式で保証するために、群作用・表現、連続変換を扱うリー群/リー代数、幾何を一括に扱えるクリフォード代数を導入します。重要なのは、不要な差異はまとめ上げつつ(軌道・商空間の発想)、姿勢や位相など“意味のある変換情報”は消さずに保持することです。実装面では、畳み込みや群畳み込み、アフィン同変ネットワークによって「入力を動かせば特徴も同じ規則で動く」ふるまいを仕込み、指数写像・リー微分で無限に連続する変換を安定的に扱います。完全な対称性は現実には稀ですから、モデル側に好み(帰納バイアス)を入れつつ、足りない部分はデータ拡張で補う二段構えをとります。保存則や力学系の直観と結びつけることで、何を守り、何を捨てるかの判断基準も明確になります。

付記として、データサイエンスや実務での使いどころを挙げます。画像・医用・衛星では回転や並進への同変性を持つ層で少量データでも頑健さが増し、検出や姿勢推定は「完全不変ではなく同変」を選ぶことで情報の取りこぼしを防げます。分子・材料・ロボティクスの3Dデータでは E(3) 同変モデルが座標系に依らない学習を可能にし、力やエネルギーのような保存量の一貫性も高まります。時系列では時間シフトに対する不変性、季節性に対する周期同変性を設計に織り込み、異常検知や需要予測の外れ耐性を向上できます。表形式や集合データでは順序に依らない置換不変・同変アーキテクチャ(Set系)が前処理の恣意性を減らします。運用手順としては、まず業務上“変えても本質が変わらない操作”を言語化し、どれをモデルに内蔵し、どれを拡張で賄うかを切り分けます。次に、同変誤差や不変テストで挙動を定量評価し、必要に応じて対称性促進の正則化を追加します。最後に、想定外の分布変化に備え、対称群を過大にしない(最小限の群を選ぶ)こと、計算効率を保つ分解・近似を用いることが実務上の鍵になります。こうした手順により、精度だけでなく再現性・保守性・説明可能性まで一段引き上げることができます。https://amzn.to/4n1B35F