ストリーミングの推薦は①メタデータ供給→②候補生成→③ランキングの三段。まず DDEX/ISRC/ISWC 等の正確な取り込みが土台。候補生成は Two-Tower でユーザー&楽曲を埋め込み化し、ANN(HNSW 等)で高速に近傍探索。ランキングでは音響特徴・行動ログ・文脈(セッション/デバイス)を学習し、関連性と多様性・新規性のバランスを最適化。評価はCTRだけでなく長期満足・カバレッジ・偏りの少なさも見るのが実務的です。冷スタートはメタデータ補完と類似嗜好の伝播で緩和。公平性(地域・ジェンダー等)の監視や、A/Bで短期指標偏重を避ける設計も重要です。説明可能性の確保も課題。継続学習も鍵。
まず押さえるべき一次情報(実装寄り)
-
Spotify の2段階推薦(候補生成→ランキング):公式エンジニアリングブログが全体像を明示。Spotify Engineering
-
ベクトル検索の実装選択:Annoy(旧来)→ Voyager(HNSW系) への移行背景と利点。GitHubSpotify Engineering
-
Two-Tower/bi-encoder 系の候補生成(オーディオブック/ポッドキャストだが手法は音楽にも共通)。Spotify Research
-
メタデータ標準 DDEX(ERN、ISRC/ISWC/UPC、地域差などの流通ボトルネック)。DDEXDDEX Knowledge Base
-
**「属性ベース」 vs **「行動ベース」の源流:Pandora の Music Genome Project(人手タグ付け×音楽学的特徴)。PandoraWikipedia
“掘ると勝てる”技術テーマ案(ニッチ寄り)
-
メタデータ欠損が推薦に与える損失の実証:DDEX/識別子の欠落・不整合→誤分類→露出低下の因果。DDEXDDEX Knowledge Base
-
Annoy vs HNSW/Voyager:近似最近傍探索の設計比較(遅延・精度・更新頻度・言語バインディング)。Spotify EngineeringGitHub
-
Two-Tower + 追加文脈(セッション・デバイス・軽量弱シグナル統合)の実装パターン。Spotify Research
-
公平性と多様性:長尾・新規アーティスト露出の制御、ジェンダー・地域バイアスの測定。Music Tomorrow
-
2段階推薦の評価設計:カバレッジ/ノベルティ/セロンガ(長期満足)と A/B の罠(短期指標過剰)。※設計論は上の一次資料の枠内で整理可。Spotify Engineering
-
API 変遷の影響:Spotify Web API の変更(2024-11発表)と音響特徴量周りの現状確認・代替。Spotify for Developers
参考データセット/API(検証素材)
-
Million Playlist Dataset(MPD):プレイリスト継続課題の定番データ。Spotify EngineeringSpotify Research
-
Music Streaming Sessions Dataset(MSSD):セッション/行動ログでの順次推薦研究に有用。arXiv
-
Spotify Web API(メタデータ/分析):エンドポイントは変更点に留意。Spotify for Developers+1
既存ガイドの立ち位置(ご提示の2サイト)
-
Music Tomorrow:RSO(Recommender System Optimization)という枠で、テクニカル/オン・オフプラットフォーム信号の整理が良質。実装に近いが、内部モデルの数式や ANN 設計までは踏み込まない。Music Tomorrow+1
-
Soundcharts:メタデータ実務とアーティスト向け運用が中心。技術アーキテクチャの深掘りは限定的。Soundcharts+1
記事・動画タイトル案(技術寄りだが一般にも届く言い換え)
-
「Spotifyは“2段階”で曲を見つける:候補生成×ランキングの設計図」Spotify Engineering
-
「AnnoyからVoyagerへ:音楽推薦を速くした“近傍探索”の進化」Spotify Engineering
-
「メタデータの穴が露出を削る:DDEX/ISRC/ISWCの実務チェックリスト」DDEXDDEX Knowledge Base
-
「Two-Tower はなぜ強いか:セッション文脈と弱シグナルを束ねる最新手法」Spotify Research
-
「フェア&ダイバーシティを定量化する:長尾露出とバイアス評価の基礎」Music Tomorrow
SEO キーワード束(JP/EN ミックスで拾いに行く)
-
「Spotify 推薦 アルゴリズム 2段階 / candidate generation / ranking」Spotify Engineering
-
「Annoy / HNSW / Voyager 近似最近傍 ベクトル検索 音楽レコメンド」Spotify Engineering
-
「DDEX ERN ISRC ISWC メタデータ 取り込み エラー 影響」DDEXDDEX Knowledge Base
-
「Two-Tower recommender / session-based recommendation / playlist continuation」Spotify Research+1
-
「推薦 公平性 バイアス 多様性 音楽」Music Tomorrow
まとめ
-
一次資料(Spotify Eng/Research、DDEX、学術データセット)を軸に、「メタデータ供給網の品質 → 候補生成(Two-Tower + ANN)→ ランキング → 公平性・評価」という実装の縦断で書けば、既存の運用系ガイドとの差別化がはっきり出せます。Spotify Engineering+1DDEXDDEX Knowledge BaseMusic Tomorrow